jjzjj

escaping

全部标签

python - 使用 Python 转义 _xHHHH_ XML 转义序列

我正在使用Python2.x[不可协商]读取XML文档[由其他人创建],这些文档允许许多元素的内容包含通过使用_xHHHH_约定例如ASCIIBELakaU+0007由7个字符序列u"_x0007_"表示。允许在文档中表示任何旧字符的功能和转义方式都是不可协商的。我正在使用cElementTree或lxml[semi-negotiable]解析文档。这是我尽可能有效地对解析器输出进行转义的最佳尝试:importredefunescape(s,subber=re.compile(r'_x[0-9A-Fa-f]{4,4}_').sub,repl=lambdamobj:unichr(int(

html - 在 XML+XSL(也称为双重解析)中评估 < >

我刚刚使用导出应用程序将我的整个LiveJournal-Blog导出到一个XML文件。这样做的原因是将其全部存档并为子孙后代保存。我想为它制作一个简单的布局文件,这样我就可以阅读帖子并怀旧了。它看起来像任何常规XML文件:1Date/timeSubjectLineTheactualpost0currentmoodcurrentmoodcomma,separated,tags2433DateSubjectLineTheactualcommentCommenterCommenter@email到目前为止,一切都很好。当我尝试为其创建xsl文件时出现问题。xml文件中的标签不仅包含文本,还包

c# - 处理特殊字符时出错

我正在创建一个原子XML数据包作为REST服务请求的一部分。但是,当XML中其中一个标记的值包含注册商标的符号时,就会出现问题。XML正在通过WebRequest作为“PUT”发送。当问题字符在XML中时,完整的XML包不会到达服务器。数据包被截断,我在服务器上看到错误“开始标记中出现意外的EOF”。我确实在服务器上注意到请求的第一部分(在被截断之前)包含问题字符“®”。我希望只看到“®”。我认为我只需要担心XML中的这些字符:双引号:"单引号:'小于:大于>&符号:&如何转义或处理我的字符串,以便我可以毫无问题地发送任何字符? 最佳答案

xml - DTD 解析 : Parameter entity reference name including another parameter entity reference - is it well formed?

我正在编写一个DTD解析器,我有点不确定如何扩展参数实体。例如,这个DTD摘录是否有效?'>%gh;更具体地说,我很想知道实体gh是否会正确扩展。在我看来%ef;应该首先扩展到“c”,然后是新形成的PE引用%abcd;应该扩展到%xx;等等。我见过的大多数解析器都将%ab识别为PE引用并失败,因为该PE未定义。但是我在要求解析器以这种方式工作的标准中绝对没有发现任何引用。我找到的唯一引用是IncludedinLiteral而不是IncludedasPE其中声明替换文本必须用一个前导和一个后跟0x20来放大-但不是文字。有什么指点吗?谢谢。 最佳答案

java - 使用 JAXB 解码 XML 而无需转义字符

想象以下情况:我们从一些外部工具收到一个xml文件。最近在这个xml中,节点名称或它们的richcontent标签中可能有一些转义字符,如以下示例(简单):IamaNoteforNodeää!在使用JAXB解码文件后,那些转义字符将被取消转义。不幸的是,我需要他们保持原样,意思是逃脱。有什么方法可以避免在解码时对这些字符进行转义?在研究过程中,我发现了很多关于编码xml文件的问题,但这些问题都没有帮助我:Question1Question2是否有可能使用JAXB实现这个目标,或者我们是否必须考虑更改为不同的xml读取器API?先谢谢你,伊梅内

ruby-on-rails - Rails 4,将 "\n"替换为 "&#10;",用于 excel 中的 XML 电子表格

我正在编写一个将某些数据导出到特定格式的Excel文档中的应用程序。我正在使用此文档(http://msdn.microsoft.com/en-us/library/aa140066(v=office.10).aspx#odc_xmlss_x:pagesetup)构建XML电子表格文件到目前为止一切正常。但是为了让它工作,我不得不在几个字段中使用“.html_safe”,这在这种情况下很危险,因为一些导出的字段包含用户输入的数据。基本上,要在excel单元格中换行,您可以使用""而不是通常的\n我目前在我的erb中使用它:(为清晰起见,于2014年8月8日编辑)但是有没有更好的方法来做

html - 我如何取消转义 HTML,然后用 XSLT 转换它?

我是XSLT的新手,我有一个大型XML文档,我正试图将其转换为ICML(AdobeInDesign使用的XML变体)。我正在使用的源文档的相关部分看起来像这样:<p>ThistextincludesescapedHTMLentities.</p>XML本身没问题,但它包含的HTML被转义了。这是我需要的最终产品的粗略示例:ThistextincludesescapedHTMLentities.我可以改造至没问题,但逃脱的实体难倒了我。我似乎无法删除标签。一些重要的考虑因素:源文档的HTML部分由对HTML的熟悉程度各不相同的各种人编写,而且格式并不总是正确的。取

PHP 简单 XML 元素 : How to add dynamic child with ampersand escaping

我正在使用以下代码将动态子节点添加到xml节点");$rowXML=$recordXML->addChild('row');foreach($arrayas$column=>$column_value){$rowXML->addChild($column,$column_value);}此代码给出“未终止的实体引用”警告!当任何$column_value中有符号&时,我知道&可以转义如果我们如下分配子内容$rowXML->column_name="text&content";//givestext&content//withoutanywarning现在如何使用这种方法添加带符

html - 如何使用 Nokogiri::XML::Builder 将非转义符号添加到 HTML

我想使用Nokogiri中的XML生成器向HTML添加项目符号“•”之类的内容,但所有内容都被转义了。如何防止它被转义?我希望结果是:•而不是:&#8226;我只是这样做:xml.span{xml.text"•\"}我错过了什么? 最佳答案 如果你定义classNokogiri::XML::Builderdefentity(code)doc=Nokogiri::XML("&##{code};")insert(doc.root.children.first)endend然后这个builder=Nokog

xml - XSL 转换和特殊 XML 实体转义

我有一个用XSL转换的XML文件。有些元素必须更改,有些元素必须保持原样-特别是带有实体”、&、’的文本,、>应该保留原样,在我的例子中,"和>已更改相应地"和'。测试XML:"&'<>转换文件:结果:"&'<>期望的结果:"&'<>我有两个问题:为什么其中一些实体进行了转换,而另一些则没有?我怎样才能得到想要的结果? 最佳答案 原因是,,>和&始终必须在XML中进行转义。它们在XML中具有特殊含义,因此如果它们是数据的一部分(而不是