jjzjj

python - 如何使用lxml查找元素属性

假设我有以下xml:PG...要获取上面元素的文本,我正在执行以下操作:fromlxmlimportentreef=open('/Users/David/Desktop/metadata.xml')metadata_contents=f.read()node=etree.fromstring(metadata_contents)rating=node.xpath('//t:rating/text()',namespaces={'t':'http://example/namespace'})>>>rating['PG']我如何获得值“au-oflc”? 最佳答

Python lxml 更改标签层次结构?

我在使用lxml时遇到了一个小问题。我正在将XML文档转换为HTML文档。原始XML看起来像这样(它看起来像HTML,但它在XML文档中):Localization-Eiffeltower?ParisorVegasBayestheoremp(A|B)当我这样做时(项目是上面的字符串)lxml.html.tostring(lxml.html.fromstring(item))我明白了:Localization-Eiffeltower?ParisorVegasBayestheoremp(A|B)我对没有任何问题,但“贝叶斯定理”段落不再嵌套在外部段落中这一事实是一个问题。有人知道为什么lx

python - 在 python 中使用 lxml iterparse 解析大型 .bz2 文件 (40 GB)。未压缩文件不会出现的错误

我正在尝试解析以bz2格式压缩的OpenStreetMap的planet.osm。因为已经41G了,不想解压完全。所以我想出了如何使用bz2和lxml解析planet.osm文件的部分,使用以下代码fromlxmlimportetreeasetfrombz2importBZ2Filepath="where/my/fileis.osm.bz2"withBZ2File(path)asxml_file:parser=et.iterparse(xml_file,events=('end',))forevents,eleminparser:ifelem.tag=="tag":continueif

xml - 用python解析xml(查找带有特定文本的标签)

我的任务是处理一个xml文件,以查找特定元素并将它们导出到一个csv文件中。我在处理相同标签中的一些信息时遇到了特别的麻烦:textvalue每个名称标签都包含不同的值,我只需要其中的一些..我尝试使用以下代码遍历文件:try:descr=member.find('.//name').textifdescr=='description':plugin.append(descr)exceptAttributeError:descr='Unknown'plugin.append(descr)但它只返回'Unknown'我的整个代码是这样的(未完成):importxml.etree.Elem

python - dateTime 提示 XSD 验证中的空白 (lxml)

我正在尝试使用XSD验证文档,而lxml提示dateTime值中的空白(尽管它应该折叠它)。我不确定这是否是一个错误的行为,或者我是否只是在XSD中指定了错误的地方。花了一个小时尝试对此进行调试,希望其他人之前经历过类似的行为。======================================================================ERROR[0.076s]:test_exports(disqus.importer.tests.tests.SchemaValidation)----------------------------------------

python - 使用 lxml 有效地计算非常大的 XML 文档中的元素

我有一个非常大(1.8GB)的XML文档。我想简单地找到带有标签的元素数量.我已经做到了:context=etree.iterparse('./test.xml',tag='Product')num_elems=0forevent,elemincontext:num_elems+=1printnum_elems它有效,但是有没有更快的方法呢? 最佳答案 因为这有效,我认为内存使用不是问题(iterparse将在内存中构建整个文件的树,除非您在迭代时修剪它要素)。在那种情况下,省去在Python中迭代和计数的麻烦,让LXML/libx

python - 当输入开始标记时,lxml 的解析器目标不会立即触发 'start' 回调

我试图使用lxml的parsertargetinterface逐步将XML解析为“自定义”树,我遇到了以下问题:如果您实例化解析器并立即将根元素的开始标记提供给它,则目标的“开始”回调不会触发,直到任何其他事件发生(例如传入数据、结束标记、另一个开始标记等)。这似乎不会发生在任何其他(嵌套)元素上。演示:classEchoTarget(object):defstart(self,tag,attrib):print("start%s%s"%(tag,attrib))defend(self,tag):print("end%s"%tag)defdata(self,data):print("d

python - lxml:通过XSLT将XML转换为HTML并获取HtmlElements

我有一个XML文件形式的数据。我还获得了一个XSLT来将XML转换为HTML。我可以使用lxml来执行转换,但是,我想在转换后更改一些HTML标记。如何将这个新的etree转换为HtmlElements,以便我可以专门使用某些方法,如.cssselect()等。 最佳答案 >>>importlxml.etree>>>importlxml.html>>>>>>xmlstring='''\......link1link2...'''>>>root=lxml.etree.fromstring(xmlstring)>>>root.cssse

python lxml 3.3.5 - 加载代码时出错 - "ValueError: lxml.etree._Element has the wrong size, try recompiling"

我通过pip安装了lxml3.3.5。现在我在运行一些Django测试时遇到了问题:Traceback(mostrecentcalllast):File"manage.py",line10,inexecute_from_command_line(sys.argv)File"/home/vagrant/venv/local/lib/python2.7/site-packages/django/core/management/__init__.py",line399,inexecute_from_command_lineutility.execute()File"/home/vagrant

python - 我可以用 lxml 创建这个 XML 文件吗?

我正在尝试生成一个看起来完全像这样的xml:video16FloatLittleEndian210804ABGR1up1920它是VFX节点工作流程脚本集合的一部分,并且此文件是“读取媒体”节点的一部分。我整整一周都在研究许多不同的东西,但找不到与此相近的东西。我选择lxml作为pretty-print。我能够生成一堆其他更简单(对我而言)的xml文件,但是对于这个文件,我得说……我迷路了。至此彻底失败!请问有人可以解释一下吗?我的问题:-lxml适合这个吗?-如果不是,什么是更好的选择?(我确实在寻找ElementTree示例,但没有运气!)-如果是,我从哪里开始?有人可以分享一段代