jjzjj

ordinalize

全部标签

python - UnicodeDecodeError : 'ascii' codec can't decode byte 0xc3 in position 23: ordinal not in range(128)

当我尝试连接它时,当字段包含“ñ”或“´”时,我会收到UnicodeDecodeError。如果包含“ñ”或“´”的字段是最后一个,我不会出错。#...nombre=fabricanombre=nombre.encode("utf-8")+'-'+sector.encode("utf-8")nombre=nombre.encode("utf-8")+'-'+unidad.encode("utf-8")#...returnnombre有什么想法吗?非常感谢! 最佳答案 您正在编码为UTF-8,然后重新-编码为UTF-8。Python只

python - UnicodeEncodeError : 'ascii' codec can't encode character u'\u2013' in position 3 2: ordinal not in range(128)

我正在使用xlrd解析XSL文件。大多数事情都运行良好。我有一本字典,其中键是字符串,值是字符串列表。所有的键和值都是Unicode。我可以使用str()方法打印大部分键和值。但是有些值有Unicode字符\u2013我得到了上述错误。我怀疑这种情况正在发生,因为这是嵌入在Unicode中的Unicode,Python解释器无法对其进行解码。那么我该如何摆脱这个错误呢? 最佳答案 你也可以打印Unicode对象,你不需要在它周围做str()。假设你真的想要一个str:当您执行str(u'\u2013')时,您正在尝试将Unicode

python - UnicodeDecodeError : 'ascii' codec can't decode byte 0xd1 in position 2: ordinal not in range(128)

我正在尝试处理一个非常大的数据集,其中包含一些非标准字符。根据工作规范,我需要使用unicode,但我很困惑。(而且很可能做错了。)我使用以下方法打开CSV:15ncesReader=csv.reader(open('geocoded_output.csv','rb'),delimiter='\t',quotechar='"')然后,我尝试使用以下代码对其进行编码:name=school_name.encode('utf-8'),street=row[9].encode('utf-8'),city=row[10].encode('utf-8'),state=row[11].encode

python - UnicodeDecodeError : 'ascii' codec can't decode byte 0xe2 in position 13: ordinal not in range(128)

我正在使用NLTK对我的文本文件执行kmeans聚类,其中每一行都被视为一个文档。例如,我的文本文件是这样的:belongfingerdeathpunchhastymikehastywallsjerichojägermeisterrulesrulesbandsfollowperformingjägermeisterstageapproach现在我要运行的演示代码是这样的:importsysimportnumpyfromnltk.clusterimportKMeansClusterer,GAAClusterer,euclidean_distanceimportnltk.corpusfro