jjzjj

Encoding

全部标签

python - 将数据写入 xml 文件时出现 UnicodeEncodeError

我的目标是编写一个XML文件,其中包含少量标签,其值使用区域语言。我正在使用Python来执行此操作并使用IDLE(PythonGUI)进行编程。当我尝试在xmls文件中写入单词时,出现以下错误:UnicodeEncodeError:'ascii'codeccan'tencodecharactersinposition0-4:ordinalnotinrange(128)目前,我没有使用任何xml编写器库;相反,我打开一个文件“test.xml”并将数据写入其中。该行遇到此错误:f.write(数据)如果我用print语句替换上面的write语句,那么它会在Pythonshell上正确打

html - HTML 中的低星号

您可以在此处看到许多星号(*)类型:http://www.eki.ee/letter/chardata.cgi?search=asterisk即使是现在,我们仍然可以看到其中一些字符,例如带有代码的字符:“204E”,也称为“低星号”,不会在HTML中呈现(至少在使用Chrome时是这样)。你可以在这里看到角色:⁎->⁎但是其他类似的类型也可以工作:✢->✢✣->✣✤->✤当然,在所有可能的类型中,我的输入数据的作者选择了⁎来处理。这让我觉得它应该有点笼统,因为我看到了在整个HTML文档中使用一个小图像而不是这个字符的解决方案。不用说,我一点也不喜欢这种方法。有没有办法在HTML中完成

xml - 为什么外籍人士拒绝破折号字符无效?

在我的XML输入文件中,我有以下行:50\%和75\%之间的字符不是连字符而是endash.当我在Python中使用expat解析此XML文件时:postFixesDoc=minidom.parse('postFixes.xml')我收到以下错误:ExpatError:notwell-formed(invalidtoken):line35,column99其中35是我在上面从XML输入文件中引用的行,99是破折号之前%的列。如果我用–替换破折号,那么错误就会消失,一切正常。所以我有一个解决方法。但我不明白为什么会这样。我读到的关于这个问题的内容——例如Python’sminidom,x

xml - 如何强制将 XML 编码为 UTF-8?

我正在尝试通过以下方式在我正在构建的xml中强制执行编码:XmlWriterSettingsxmlSetting=newXmlWriterSettings();XmlWriterxmlWriter;Strres;xmlSetting.encoding('UTF-8');xmlWriter=XmlWriter::newXml(xmlSetting);xmlWriter.writeStartDocument();xmlWriter.writeStartElement('root');xmlWriter.writeEndElement();xmlWriter.writeEndDocument

java - SAX 解析器在 ñ 上中断

我通过扩展默认处理程序在Java中实现了一个SAX解析器。XML的内容中有一个ñ。当它击中这个角色时,它就会破裂。我在字符方法中打印出char数组,它只是以ñ之前的字符结尾。解析器似乎在此之后停止,因为即使还有更多内容,也没有调用其他方法。即永远不会再次调用endElement方法。有没有人以前遇到过这个问题或对如何处理它有任何建议? 最佳答案 文件的编码是什么?确保文件的编码声明与其匹配。您的解析器可能默认为ascii或ISO-8859-1。您可以像这样设置编码UTF-8将覆盖该字符,只需确保这是文件实际所在的内容即可。

php - 用 PHP 去除 RSS 提要

我有这个功能:functionvalidate($data){$newData=str_replace(" ","",$newData);$newData=utf8_encode(htmlentities(strip_tags($data)));return$newData;}$rssfeed.='';它从中提取的我的MySQL表使用utf8-general_ci编码。但是,我的XML提要中仍然有 。有什么想法吗? 最佳答案 您以错误的顺序使用变量,因此您忽略了str_replace的结果。$newData=str_rep

xml - URL 在 XML 中被视为无效

当我尝试验证此XML时,出现错误:http://example.org/?a=1&b=2验证器说:“对实体“b”的引用必须以';'结尾分隔符。”引用字符串中的第二个等号(=)。为什么会这样?URL是否应该以某种方式编码? 最佳答案 &在XML中是不允许的,因为它启动了一个实体序列(通常是对字符的命名引用,例如é对于é)。实体序列以&开头并以;结尾,它们之间包含实体的名称。插入&,写这个实体序列:&.还有几个字符需要写成实体:一个双引号"(")当它在XML属性内时,尖括号,>(<,>),因为

java - 处理 UTF-8 编码

我们有一个在Weblogic服务器上运行的Java应用程序,它从JMS或MQ队列中获取XML消息并将其写入另一个JMS队列。应用程序不会以任何方式修改XML内容。我们使用BEA的XMLObject来读取消息并将消息写入队列。XML消息包含UTF-8编码类型声明。当XML包含超出正常ASCII范围的字符(例如£符号)时,我们会遇到问题。当从队列中读取消息时,我们可以看到£符号是完整的,但是一旦我们将其写入目标队列,£符号就会丢失并被£代替。我检查了操作系统级别设置(区域设置),一切似乎都很好。我还应该检查什么以确保不会发生这种情况? 最佳答案

xml - £ 变成 £ 为什么? XML ISO 编码问题?

通过由PHP和SimpleDOM.php组合而成的Web表单很高兴地将内容保存到我的XML文件中我需要保存有英文定价的商品,所以我需要英文英镑符号。然而,当我这样做时,会发生两件事:它以£的形式返回保存的价格如果我在没有任何其他更改的情况下再次保存它,SimpleDom解析器然后barfs,它会删除XML文件中除英磅符号之外的任何其他内容。我的XML文件中的第一行看起来像在XML文件中,£被另存为&Acirc;&pound;据我所知,iso-8859-1中应该有£符号,所以非常困惑为什么要加入这个Acirc....我在另一个帖子上看到有人说尝试使用8859-15,但这没

php - 从 PHP 以 UTF-8 编码

我不太擅长编码,但我什至对这里的基础知识都感到失望。我正在尝试创建一个被识别为UTF-8的文件header("Content-Type:text/plain;charset=utf-8");header("Content-disposition:attachment;filename=test.txt");echo"test";exit();也试过header("Content-Type:text/plain;charset=utf-8");header("Content-disposition:attachment;filename=test.txt");echoutf8_encod