jjzjj

xml - XML DTD 中的 PCDATA 与 CDATA

在XMLDTD中——当定义一个元素时,我们使用#PCDATA表示这个元素可以包含任何可解析的文本。在定义一个属性时,我们用CDATA表示它的值可以是任何字符数据。XML中使用的CDATA是不被XML解析器解析的东西(多字符转义序列)。一致地,当我们使用CDATA来定义属性时;解析器不应该解析它。但是,确实如此!那么,为什么不能用PCDATA代替CDATA来定义属性呢?更新-一直保持这种方式以与SGML向后兼容。SGML中这种命名背后的原因是什么? 最佳答案 当用于属性的声明值时,CDATA指的是属性的实际值(字符数据),而不是解析它

c# - 如何在 C# 中使用 XmlDocument 停止空 XML 元素自关闭?

在我被人们说XML解析器不应该关心元素是空的还是自闭的之前,我有一个原因不允许自闭的XML元素。原因是我实际上使用的是SGML而不是XML,而且我使用的SGMLDTD非常严格,不允许这样做。我有几千个SGML文件,我需要在这些文件上运行XSLT。因此,为了应用XSLT,我不得不暂时将SGML转换为XML。然后我编写了一个将它们转换回SGML的方法(本质上只是用SGML声明替换XML声明并写回任何其他实体声明,例如图形实体)。我的问题是,在转换回SGML之后,当我在SGML编辑器中打开文件时,文件无法解析,因为空元素已自行关闭。有人知道我在使用XmlDocument时如何阻止这种情况发生

xml - emacs:HideShow 是否适用于 xml 模式(sgml 模式)?

我在cc模式缓冲区中使用hideshow.el来折叠我不查看的文件部分。如果能够在XML文档中做到这一点就好了。我使用emacs22.2.1和内置的sgml-mode进行xml编辑。我还没有得到hideshow来处理XML。我的意思是,我打开了次要模式,但击键没有效果。哦,除了,我确实得到了一个XML注释来折叠。但是没有元素。有人成功过吗?建议?编辑:我敢打赌,如果我向hs-special-modes-alist添加一个sgml-mode元素,它会起作用。我需要一个用于启动block的正则表达式。有没有人这样做过?我还没有转到nxml模式。我是不是该?它是“折叠”还是隐藏?

xml - 是否有理由使用 SGML 而不是 XML?

据我了解,XML是SGML的一个子集,旨在简化它并鼓励更广泛的使用。我想大多数有用的特性都被引入了XML,但是SGML中是否有任何强大到足以激励使用它而不是XML的特性(并接受复杂性的开销)? 最佳答案 如果您手动编辑SGML,SGML的一个优点是您可以用各种方式缩写标签。您究竟可以做什么取决于您正在使用的DTD的SGML声明。例如,在DocBook中,您可以编写类似foo的内容。在HTML中,您可以省略结束标签,这就是为什么您可以在不关闭标签的情况下编写foo...bar的原因。或者您可以完全省略标签,这就是为什么在HTML中是可

xml - SGML 和 XML 有什么区别?

关闭。这个问题需要更多focused.它目前不接受答案。想改进这个问题吗?更新问题,使其只关注一个问题editingthispost.关闭6年前。ImprovethisquestionGoogle的所有结果都很糟糕。

php - 如何在 PHP 中解析 OFX(版本 1.0.2)文件?

我有一个OFX从Citibank下载的文件,这个文件有一个定义在http://www.ofx.net/DownloadPage/Files/ofx102spec.zip的DTD(文件OFXBANK.DTD),OFX文件似乎是SGML有效的。我正在尝试DomDocumentPHP5.4.13,但我收到几个警告并且文件未被解析。我的代码是:$file="source/ACCT_013.OFX";$dtd="source/ofx102spec/OFXBANK.DTD";$doc=newDomDocument();$doc->loadHTMLFile($file);$doc->schemaVa

python - 在 Python 3 中使用 Open Arbitrary 标签解析 SGML

我正在尝试解析一个文件,例如:http://www.sec.gov/Archives/edgar/data/1409896/000118143112051484/0001181431-12-051484.hdr.sgml我正在使用Python3,但一直无法找到使用现有库的解决方案来解析带有开放标记的SGML文件。SGML允许隐式闭合标签。当尝试使用LXML、XML或漂亮的汤解析示例文件时,我最终会在文件末尾而不是在行尾关闭隐式关闭标签。例如:AwesomeCorp24-7101PARSNIPLN31337这最终被解释为:AwesomeCorp24-7101PARSNIPLN31337但

html - HTML空白规则的定义?

我正在寻找这个定义来使我的HTML渲染器更好地符合。目前它正在猜测要保留哪个空白,要折叠哪个以及要抛出什么。SGML标准很难找到,而HTML标准似乎没有以我的需要所需的深度来处理主题。目前,我的渲染器将HTML解析为一棵树,然后进行递归布局传递以定位所有元素及其内容。我正在尝试在解析阶段抛出一些空白,即在某些情况下不只发出空白文本block。哪种情况适用于大多数情况,但有相当少的边缘情况越来越难以处理。(我也在研究HTML控件的编辑器子类,布局时间解决方案被证明在编辑器中有点问题,因此我致力于让它们进入解析阶段。布局信息不是在回流时间之前可用,回流时间是您编辑文档后的一段时间。)用连杆

html - HTML空白规则的定义?

我正在寻找这个定义来使我的HTML渲染器更好地符合。目前它正在猜测要保留哪个空白,要折叠哪个以及要抛出什么。SGML标准很难找到,而HTML标准似乎没有以我的需要所需的深度来处理主题。目前,我的渲染器将HTML解析为一棵树,然后进行递归布局传递以定位所有元素及其内容。我正在尝试在解析阶段抛出一些空白,即在某些情况下不只发出空白文本block。哪种情况适用于大多数情况,但有相当少的边缘情况越来越难以处理。(我也在研究HTML控件的编辑器子类,布局时间解决方案被证明在编辑器中有点问题,因此我致力于让它们进入解析阶段。布局信息不是在回流时间之前可用,回流时间是您编辑文档后的一段时间。)用连杆

html - HTML 是上下文无关语言吗?

阅读somerelatedquestions让我思考HTML的理论本质。我在这里不是在谈论类似XHTML的代码。我说的是像这种疯狂的标记,它是完全有效的HTML(!)鉴于SGML在此处注入(inject)的巨大复杂性,HTML是一种上下文无关语言吗?无论如何,它是一种正式语言吗?用语法?HTML5呢?我是正式语言概念的新手,所以请多多包涵。是的,我已经阅读了维基百科文章;) 最佳答案 ContextFree是语言理论中的一个概念,对解析器实现具有重要意义。上下文无关语言可以用上下文无关文法来描述,其中所有规则在箭头左侧都有一个非终结