jjzjj

xml - 可变嵌套 XML 数据的报告位置

coder 2024-07-02 原文

我正在尝试解析一个 XML 文件以找到一个特定的值。这是 XML:

<?xml version="1.0"?>
<dump>
 <folder id="A0">
  <folder id="A1">
   <setting id="setting0">
    <sequence id="sequence0">
     <group name="info">
      <variable name="foo" value="15"/>
     </group>
    </sequence>
   </setting>
  </folder>
 </folder>
</dump>

Data::Dumper 产生

$VAR1 = {
          'folder' => {
                      'id' => 'A0',
                      'folder' => {
                                  'setting' => {
                                               'sequence' => {
                                                             'group' => {
                                                                        'variable' => {
                                                                                      'value' => '15',
                                                                                      'name' => 'foo'
                                                                                    },
                                                                        'name' => 'info'
                                                                      },
                                                             'id' => 'sequence0'
                                                           },
                                               'id' => 'setting0'
                                             },
                                  'id' => 'A1'
                                }
                    }
        };

我的目标是生成一份报告,内容如下:“foo 在 A0/A1/setting0/sequence0 处的值为 15”。注意我想使用 id s 引用指向 foo 位置的“面包屑”路径.

目前我在这个示例 XML 中访问值“15”

use strict;
use warnings;
use XML::Simple;

my $xml = new XML::Simple;
my $data = $xml -> XMLin('test1.xml');
print $data -> {folder}{folder}{setting}{sequence}{group}{variable}{value};

(但是,如果有多个 <variable> ,这将不起作用,并且会有......但这不是我的主要挑战......)

问题是 XML 将包含不可预测的嵌套 <folder> s,我不知道如何找到 <variable>name="foo" 一起存在,因为我不知道它有多深。 foo 的多个实例会发生,但每个 sequence 只发生一个.

最后一个小问题是我只能访问 XML::Simple 和 XML::Parser!没有 SAX/Twig/LibXML 等。XML 数据文件的大小可能高达 100MB。

所有这一切现在听起来相当复杂,所以我将重申我的目标:遍历 XML 以查找 <variable> 的任何位置。与 name="foo" 一起存在并报告其value和在树中的位置。感谢您对此的任何帮助。


编辑:使用下面的 mirod 方法,这是有效的:

use strict;
use warnings;
use Twig;

my $twig = new XML::Twig( 
                twig_handlers =>
                   { 'variable[@name="foo"]' => \&variable,
                     group => sub { $_->purge; }  }
                        );
$twig->parsefile( "test.xml");

sub variable
  { my( $t, $var)= @_;
    my $location= join '/', grep { $_ } map { $_->id } reverse $var->ancestors;
    print $var->att( 'name'), " has value ", $var->att( 'value'), " at $location\n";
  }

最佳答案

有什么原因不能安装 XML::Twig 吗?它是一个纯 Perl 模块(依赖于您已安装的 XML::Parser),因此您始终可以从分发版中复制文件 Twig.pm 作为 myTwig.pm 在你的代码目录中,use myTwig; 瞧瞧。

那么代码就很简单了:

#!/usr/bin/perl

use myTwig;


XML::Twig->new( twig_handlers => { 'variable[@name="foo"]' => \&variable,
                                   # next line if you need to reduce memory footprint
                                   group => sub { $_->purge; }, 
                                 }
         ->parse( \*DATA); # replace with parsefile( 'my.xml') for the real data

sub variable
  { my( $t, $var)= @_;
    my $location= join '/', grep { $_ } map { $_->id } reverse $var->ancestors;
    print $var->att( 'name'), " has value ", $var->att( 'value'), " at $location\n";
  }

__DATA__
<?xml version="1.0"?>
<dump>
 <folder id="A0">
  <folder id="A1">
   <setting id="setting0">
    <sequence id="sequence0">
     <group name="info">
      <variable name="foo" value="15"/>
     </group>
    </sequence>
   </setting>
  </folder>
 </folder>
</dump>

关于xml - 可变嵌套 XML 数据的报告位置,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/11362461/

有关xml - 可变嵌套 XML 数据的报告位置的更多相关文章

  1. ruby-on-rails - Rails 编辑表单不显示嵌套项 - 2

    我得到了一个包含嵌套链接的表单。编辑时链接字段为空的问题。这是我的表格:Editingkategori{:action=>'update',:id=>@konkurrancer.id})do|f|%>'Trackingurl',:style=>'width:500;'%>'Editkonkurrence'%>|我的konkurrencer模型:has_one:link我的链接模型:classLink我的konkurrancer编辑操作:defedit@konkurrancer=Konkurrancer.find(params[:id])@konkurrancer.link_attrib

  2. ruby - 解析 RDFa、微数据等的最佳方式是什么,使用统一的模式/词汇(例如 schema.org)存储和显示信息 - 2

    我主要使用Ruby来执行此操作,但到目前为止我的攻击计划如下:使用gemsrdf、rdf-rdfa和rdf-microdata或mida来解析给定任何URI的数据。我认为最好映射到像schema.org这样的统一模式,例如使用这个yaml文件,它试图描述数据词汇表和opengraph到schema.org之间的转换:#SchemaXtoschema.orgconversion#data-vocabularyDV:name:namestreet-address:streetAddressregion:addressRegionlocality:addressLocalityphoto:i

  3. ruby - 将散列转换为嵌套散列 - 2

    这道题是thisquestion的逆题.给定一个散列,每个键都有一个数组,例如{[:a,:b,:c]=>1,[:a,:b,:d]=>2,[:a,:e]=>3,[:f]=>4,}将其转换为嵌套哈希的最佳方法是什么{:a=>{:b=>{:c=>1,:d=>2},:e=>3,},:f=>4,} 最佳答案 这是一个迭代的解决方案,递归的解决方案留给读者作为练习:defconvert(h={})ret={}h.eachdo|k,v|node=retk[0..-2].each{|x|node[x]||={};node=node[x]}node[

  4. ruby-on-rails - 如何从 format.xml 中删除 <hash></hash> - 2

    我有一个对象has_many应呈现为xml的子对象。这不是问题。我的问题是我创建了一个Hash包含此数据,就像解析器需要它一样。但是rails自动将整个文件包含在.........我需要摆脱type="array"和我该如何处理?我没有在文档中找到任何内容。 最佳答案 我遇到了同样的问题;这是我的XML:我在用这个:entries.to_xml将散列数据转换为XML,但这会将条目的数据包装到中所以我修改了:entries.to_xml(root:"Contacts")但这仍然将转换后的XML包装在“联系人”中,将我的XML代码修改为

  5. ruby - Ruby 有 `Pair` 数据类型吗? - 2

    有时我需要处理键/值数据。我不喜欢使用数组,因为它们在大小上没有限制(很容易不小心添加超过2个项目,而且您最终需要稍后验证大小)。此外,0和1的索引变成了魔数(MagicNumber),并且在传达含义方面做得很差(“当我说0时,我的意思是head...”)。散列也不合适,因为可能会不小心添加额外的条目。我写了下面的类来解决这个问题:classPairattr_accessor:head,:taildefinitialize(h,t)@head,@tail=h,tendend它工作得很好并且解决了问题,但我很想知道:Ruby标准库是否已经带有这样一个类? 最佳

  6. Ruby——嵌套类和子类是一回事吗? - 2

    下面例子中的Nested和Child有什么区别?是否只是同一事物的不同语法?classParentclassNested...endendclassChild 最佳答案 不,它们是不同的。嵌套:Computer之外的“Processor”类只能作为Computer::Processor访问。嵌套为内部类(namespace)提供上下文。对于ruby​​解释器Computer和Computer::Processor只是两个独立的类。classComputerclassProcessor#Tocreateanobjectforthisc

  7. ruby - 模块嵌套代码风格偏好 - 2

    我的假设是moduleAmoduleBendend和moduleA::Bend是一样的。我能够从thisblog找到解决方案,thisSOthread和andthisSOthread.为什么以及什么时候应该更喜欢紧凑语法A::B而不是另一个,因为它显然有一个缺点?我有一种直觉,它可能与性能有关,因为在更多命名空间中查找常量需要更多计算。但是我无法通过对普通类进行基准测试来验证这一点。 最佳答案 这两种写作方法经常被混淆。首先要说的是,据我所知,没有可衡量的性能差异。(在下面的书面示例中不断查找)最明显的区别,可能也是最著名的,是你的

  8. ruby-on-rails - 使用回形针的嵌套形式 - 2

    我有一个名为posts的模型,它有很多附件。附件模型使用回形针。我制作了一个用于创建附件的独立模型,效果很好,这是此处说明的View(https://github.com/thoughtbot/paperclip):@attachment,:html=>{:multipart=>true}do|form|%>posts中的嵌套表单如下所示:prohibitedthispostfrombeingsaved:@attachment,:html=>{:multipart=>true}do|at_form|%>附件记录已创建,但它是空的。文件未上传。同时,帖子已成功创建...有什么想法吗?

  9. ruby-on-rails - Rails 3,嵌套资源,没有路由匹配 [PUT] - 2

    我真的为这个而疯狂。我一直在搜索答案并尝试我找到的所有内容,包括相关问题和stackoverflow上的答案,但仍然无法正常工作。我正在使用嵌套资源,但无法使表单正常工作。我总是遇到错误,例如没有路线匹配[PUT]"/galleries/1/photos"表格在这里:/galleries/1/photos/1/edit路线.rbresources:galleriesdoresources:photosendresources:galleriesresources:photos照片Controller.rbdefnew@gallery=Gallery.find(params[:galle

  10. ruby - 我如何添加二进制数据来遏制 POST - 2

    我正在尝试使用Curbgem执行以下POST以解析云curl-XPOST\-H"X-Parse-Application-Id:PARSE_APP_ID"\-H"X-Parse-REST-API-Key:PARSE_API_KEY"\-H"Content-Type:image/jpeg"\--data-binary'@myPicture.jpg'\https://api.parse.com/1/files/pic.jpg用这个:curl=Curl::Easy.new("https://api.parse.com/1/files/lion.jpg")curl.multipart_form_

随机推荐