我正在尝试解析一个 XML 文件以找到一个特定的值。这是 XML:
<?xml version="1.0"?>
<dump>
<folder id="A0">
<folder id="A1">
<setting id="setting0">
<sequence id="sequence0">
<group name="info">
<variable name="foo" value="15"/>
</group>
</sequence>
</setting>
</folder>
</folder>
</dump>
Data::Dumper 产生
$VAR1 = {
'folder' => {
'id' => 'A0',
'folder' => {
'setting' => {
'sequence' => {
'group' => {
'variable' => {
'value' => '15',
'name' => 'foo'
},
'name' => 'info'
},
'id' => 'sequence0'
},
'id' => 'setting0'
},
'id' => 'A1'
}
}
};
我的目标是生成一份报告,内容如下:“foo 在 A0/A1/setting0/sequence0 处的值为 15”。注意我想使用 id s 引用指向 foo 位置的“面包屑”路径.
目前我在这个示例 XML 中访问值“15”
use strict;
use warnings;
use XML::Simple;
my $xml = new XML::Simple;
my $data = $xml -> XMLin('test1.xml');
print $data -> {folder}{folder}{setting}{sequence}{group}{variable}{value};
(但是,如果有多个 <variable> ,这将不起作用,并且会有......但这不是我的主要挑战......)
问题是 XML 将包含不可预测的嵌套 <folder> s,我不知道如何找到 <variable>与 name="foo" 一起存在,因为我不知道它有多深。
foo 的多个实例会发生,但每个 sequence 只发生一个.
最后一个小问题是我只能访问 XML::Simple 和 XML::Parser!没有 SAX/Twig/LibXML 等。XML 数据文件的大小可能高达 100MB。
所有这一切现在听起来相当复杂,所以我将重申我的目标:遍历 XML 以查找 <variable> 的任何位置。与 name="foo" 一起存在并报告其value和在树中的位置。感谢您对此的任何帮助。
use strict;
use warnings;
use Twig;
my $twig = new XML::Twig(
twig_handlers =>
{ 'variable[@name="foo"]' => \&variable,
group => sub { $_->purge; } }
);
$twig->parsefile( "test.xml");
sub variable
{ my( $t, $var)= @_;
my $location= join '/', grep { $_ } map { $_->id } reverse $var->ancestors;
print $var->att( 'name'), " has value ", $var->att( 'value'), " at $location\n";
}
最佳答案
有什么原因不能安装 XML::Twig 吗?它是一个纯 Perl 模块(依赖于您已安装的 XML::Parser),因此您始终可以从分发版中复制文件 Twig.pm 作为 myTwig.pm 在你的代码目录中,use myTwig; 瞧瞧。
那么代码就很简单了:
#!/usr/bin/perl
use myTwig;
XML::Twig->new( twig_handlers => { 'variable[@name="foo"]' => \&variable,
# next line if you need to reduce memory footprint
group => sub { $_->purge; },
}
->parse( \*DATA); # replace with parsefile( 'my.xml') for the real data
sub variable
{ my( $t, $var)= @_;
my $location= join '/', grep { $_ } map { $_->id } reverse $var->ancestors;
print $var->att( 'name'), " has value ", $var->att( 'value'), " at $location\n";
}
__DATA__
<?xml version="1.0"?>
<dump>
<folder id="A0">
<folder id="A1">
<setting id="setting0">
<sequence id="sequence0">
<group name="info">
<variable name="foo" value="15"/>
</group>
</sequence>
</setting>
</folder>
</folder>
</dump>
关于xml - 可变嵌套 XML 数据的报告位置,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/11362461/
我得到了一个包含嵌套链接的表单。编辑时链接字段为空的问题。这是我的表格:Editingkategori{:action=>'update',:id=>@konkurrancer.id})do|f|%>'Trackingurl',:style=>'width:500;'%>'Editkonkurrence'%>|我的konkurrencer模型:has_one:link我的链接模型:classLink我的konkurrancer编辑操作:defedit@konkurrancer=Konkurrancer.find(params[:id])@konkurrancer.link_attrib
我主要使用Ruby来执行此操作,但到目前为止我的攻击计划如下:使用gemsrdf、rdf-rdfa和rdf-microdata或mida来解析给定任何URI的数据。我认为最好映射到像schema.org这样的统一模式,例如使用这个yaml文件,它试图描述数据词汇表和opengraph到schema.org之间的转换:#SchemaXtoschema.orgconversion#data-vocabularyDV:name:namestreet-address:streetAddressregion:addressRegionlocality:addressLocalityphoto:i
这道题是thisquestion的逆题.给定一个散列,每个键都有一个数组,例如{[:a,:b,:c]=>1,[:a,:b,:d]=>2,[:a,:e]=>3,[:f]=>4,}将其转换为嵌套哈希的最佳方法是什么{:a=>{:b=>{:c=>1,:d=>2},:e=>3,},:f=>4,} 最佳答案 这是一个迭代的解决方案,递归的解决方案留给读者作为练习:defconvert(h={})ret={}h.eachdo|k,v|node=retk[0..-2].each{|x|node[x]||={};node=node[x]}node[
我有一个对象has_many应呈现为xml的子对象。这不是问题。我的问题是我创建了一个Hash包含此数据,就像解析器需要它一样。但是rails自动将整个文件包含在.........我需要摆脱type="array"和我该如何处理?我没有在文档中找到任何内容。 最佳答案 我遇到了同样的问题;这是我的XML:我在用这个:entries.to_xml将散列数据转换为XML,但这会将条目的数据包装到中所以我修改了:entries.to_xml(root:"Contacts")但这仍然将转换后的XML包装在“联系人”中,将我的XML代码修改为
有时我需要处理键/值数据。我不喜欢使用数组,因为它们在大小上没有限制(很容易不小心添加超过2个项目,而且您最终需要稍后验证大小)。此外,0和1的索引变成了魔数(MagicNumber),并且在传达含义方面做得很差(“当我说0时,我的意思是head...”)。散列也不合适,因为可能会不小心添加额外的条目。我写了下面的类来解决这个问题:classPairattr_accessor:head,:taildefinitialize(h,t)@head,@tail=h,tendend它工作得很好并且解决了问题,但我很想知道:Ruby标准库是否已经带有这样一个类? 最佳
下面例子中的Nested和Child有什么区别?是否只是同一事物的不同语法?classParentclassNested...endendclassChild 最佳答案 不,它们是不同的。嵌套:Computer之外的“Processor”类只能作为Computer::Processor访问。嵌套为内部类(namespace)提供上下文。对于ruby解释器Computer和Computer::Processor只是两个独立的类。classComputerclassProcessor#Tocreateanobjectforthisc
我的假设是moduleAmoduleBendend和moduleA::Bend是一样的。我能够从thisblog找到解决方案,thisSOthread和andthisSOthread.为什么以及什么时候应该更喜欢紧凑语法A::B而不是另一个,因为它显然有一个缺点?我有一种直觉,它可能与性能有关,因为在更多命名空间中查找常量需要更多计算。但是我无法通过对普通类进行基准测试来验证这一点。 最佳答案 这两种写作方法经常被混淆。首先要说的是,据我所知,没有可衡量的性能差异。(在下面的书面示例中不断查找)最明显的区别,可能也是最著名的,是你的
我有一个名为posts的模型,它有很多附件。附件模型使用回形针。我制作了一个用于创建附件的独立模型,效果很好,这是此处说明的View(https://github.com/thoughtbot/paperclip):@attachment,:html=>{:multipart=>true}do|form|%>posts中的嵌套表单如下所示:prohibitedthispostfrombeingsaved:@attachment,:html=>{:multipart=>true}do|at_form|%>附件记录已创建,但它是空的。文件未上传。同时,帖子已成功创建...有什么想法吗?
我真的为这个而疯狂。我一直在搜索答案并尝试我找到的所有内容,包括相关问题和stackoverflow上的答案,但仍然无法正常工作。我正在使用嵌套资源,但无法使表单正常工作。我总是遇到错误,例如没有路线匹配[PUT]"/galleries/1/photos"表格在这里:/galleries/1/photos/1/edit路线.rbresources:galleriesdoresources:photosendresources:galleriesresources:photos照片Controller.rbdefnew@gallery=Gallery.find(params[:galle
我正在尝试使用Curbgem执行以下POST以解析云curl-XPOST\-H"X-Parse-Application-Id:PARSE_APP_ID"\-H"X-Parse-REST-API-Key:PARSE_API_KEY"\-H"Content-Type:image/jpeg"\--data-binary'@myPicture.jpg'\https://api.parse.com/1/files/pic.jpg用这个:curl=Curl::Easy.new("https://api.parse.com/1/files/lion.jpg")curl.multipart_form_