php - SimpleXMLElement、xpath 和子元素

coder 2024-04-05 原文

我正在访问 YouTube 上的 gData Api。我将使用 this xml供引用。

我在子 SimpleXMLElement 对象上使用 xpath，但 xpath 不只搜索子元素及其子元素，它似乎仍在从根向下搜索。

我有以下代码:

<?php

date_default_timezone_set('Australia/Sydney');
$url = "http://gdata.youtube.com/feeds/api/playlists/58FD3A7244B64B99?prettyprint=true&alt=atom&v2=1&fields=title,subtitle,logo,entry%28link%5B@rel=%27alternate%27%5D,id,title,content,author,yt:statistics%29";

$curl = curl_init();
curl_setopt($curl, CURLOPT_URL, $url);
curl_setopt($curl, CURLOPT_RETURNTRANSFER, true );
$rawResponse = curl_exec($curl);

$xmlData = simplexml_load_string($rawResponse);
$xmlData->registerXPathNamespace('yt', 'http://gdata.youtube.com/schemas/2007');

foreach($xmlData->entry as $entry) {
    var_dump($entry->asXml());
    myFunction($entry); die();
}

function myFunction(SimpleXMLElement $xml)
{
    var_dump($xml->xpath("//yt:statistics"));
}

而不是预期的:

string(666) "<entry>
                <id>http://gdata.youtube.com/feeds/api/playlists/58FD3A7244B64B99/PLlwIr0olq0UxVV_ouqclCE0xRZvs2Lytl</id>
                <title type="text">Zero Punctuation on The Escapist</title>
                <content type="text">Zero Punctuation picks apart the games so you don't have to. View new episodes every Wednesday only
at http://www.escapistmagazine.com</content>
                <link rel="alternate" type="text/html" href="http://www.youtube.com/watch?v=7EpzwuZOvKY&amp;feature=youtube_gdata"/>
                <author>
                        <name>theescapistmagazine</name>
                        <uri>http://gdata.youtube.com/feeds/api/users/theescapistmagazine</uri>
                </author>
                <yt:statistics favoriteCount="256" viewCount="188598"/>
        </entry>"
object(SimpleXMLElement)#5 (1) {
  ["@attributes"]=>
  array(2) {
    ["favoriteCount"]=>
    string(3) "256"
    ["viewCount"]=>
    string(6) "188598"
  }
}

我得到:

string(666) "<entry>
                <id>http://gdata.youtube.com/feeds/api/playlists/58FD3A7244B64B99/PLlwIr0olq0UxVV_ouqclCE0xRZvs2Lytl</id>
                <title type="text">Zero Punctuation on The Escapist</title>
                <content type="text">Zero Punctuation picks apart the games so you don't have to. View new episodes every Wednesday only
at http://www.escapistmagazine.com</content>
                <link rel="alternate" type="text/html" href="http://www.youtube.com/watch?v=7EpzwuZOvKY&amp;feature=youtube_gdata"/>
                <author>
                        <name>theescapistmagazine</name>
                        <uri>http://gdata.youtube.com/feeds/api/users/theescapistmagazine</uri>
                </author>
                <yt:statistics favoriteCount="256" viewCount="188598"/>
        </entry>"
array(25) {
  [0]=>
  object(SimpleXMLElement)#5 (1) {
    ["@attributes"]=>
    array(2) {
      ["favoriteCount"]=>
      string(3) "256"
      ["viewCount"]=>
      string(6) "188598"
    }
  }
  [1]=>
  object(SimpleXMLElement)#6 (1) {
    ["@attributes"]=>
    array(2) {
      ["favoriteCount"]=>
      string(4) "4787"
      ["viewCount"]=>
      string(7) "1276435"
    }
  }
  [2]=>
  object(SimpleXMLElement)#7 (1) {
    ["@attributes"]=>
    array(2) {
      ["favoriteCount"]=>
      string(4) "7628"
      ["viewCount"]=>
      string(7) "1702845"
...

那么，即使我正在处理根元素的子元素，为什么 xpath 仍在搜索父元素？更重要的是，我如何才能只搜索子元素？

最佳答案

您必须在表达式备份时从表达式中删除 //，然后将表达式应用于整个文档。您正在寻找的是一个单斜杠 /，它从给定文档片段的根开始。

这应该可以解决问题。 :)

编辑:完全省略斜杠也应该可以解决问题。

关于php - SimpleXMLElement、xpath 和子元素，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/9661479/

SimpleXMLElement xpath 34 gt lt php xml simplexml gdata

有关php - SimpleXMLElement、xpath 和子元素的更多相关文章

ruby - 如何使用 Nokogiri 的 xpath 和 at_xpath 方法 - 2
我正在学习如何使用Nokogiri，根据这段代码我遇到了一些问题:require'rubygems'require'mechanize'post_agent=WWW::Mechanize.newpost_page=post_agent.get('http://www.vbulletin.org/forum/showthread.php?t=230708')puts"\nabsolutepathwithtbodygivesnil"putspost_page.parser.xpath('/html/body/div/div/div/div/div/table/tbody/tr/td/div
ruby-on-rails - Nokogiri:使用 XPath 搜索 <div> - 2
我使用Nokogiri(Rubygem)css搜索寻找某些在我的html里面。看起来Nokogiri的css搜索不喜欢正则表达式。我想切换到Nokogiri的xpath搜索，因为这似乎支持搜索字符串中的正则表达式。如何在xpath搜索中实现下面提到的(伪)css搜索？require'rubygems'require'nokogiri'value=Nokogiri::HTML.parse(ABBlaCD3"HTML_END#my_blockisgivenmy_bl="1"#my_eqcorrespondstothisregexmy_eq="\/[0-9]+\/"#FIXMEThefoll
ruby-on-rails - capybara ::ElementNotFound:无法找到 xpath "/html" - 2
我正在学习http://ruby.railstutorial.org/chapters/static-pages上的RubyonRails教程并遇到以下错误StaticPagesHomepageshouldhavethecontent'SampleApp'Failure/Error:page.shouldhave_content('SampleApp')Capybara::ElementNotFound:Unabletofindxpath"/html"#(eval):2:in`text'#./spec/requests/static_pages_spec.rb:7:in`(root)'
ruby - 如何从 nokogiri 对象获取标识符(例如 xpath)？ - 2
遍历nokogiri并使用xpath选择元素相当容易。我需要这个反之亦然，意思是:我需要例如在nokogiri节点上调用.to_xpath以获取元素的完整xpath以将其存储在记录中。有人知道这样做的方法吗？最佳答案我能想到的最简单的方法是:Nokogiri::CSS.xpath_fornode.css_path编辑:您也可以尝试使用path方法。关于ruby-如何从nokogiri对象获取标识符(例如xpath)？，我们在StackOverflow上找到一个类似的问题：
ruby-on-rails - 这个 C 和 PHP 程序员如何学习 Ruby 和 Rails？ - 2
按照目前的情况，这个问题不适合我们的问答形式。我们希望答案得到事实、引用或专业知识的支持，但这个问题可能会引发辩论、争论、投票或扩展讨论。如果您觉得这个问题可以改进并可能重新打开，visitthehelpcenter指导。关闭9年前。我来自C、php和bash背景，很容易学习，因为它们都有相同的C结构，我可以将其与我已经知道的联系起来。然后2年前我学了Python并且学得很好，Python对我来说比Ruby更容易学。然后从去年开始，我一直在尝试学习Ruby，然后是Rails，我承认，直到现在我还是学不会，讽刺的是那些打着简单易学的烙印，但是对于我这样一个老练的程序员来说，我只是无法将它
ruby-on-rails - 如何使用 JSON 的 Nokogiri 中的 XPath 从 eBay 和亚马逊抓取图像 - 2
我正在尝试使用Nokogiri和XPath从网站上抓取图像，但到目前为止收效甚微。对于其HTML具有img和src的典型网站，我可以使用:tmp2=Nokogiri::HTML(open(site_url))tmp2.xpath("//img/@src").eachdo|src|...dowhateverend但是，某些网站(如Amazon和eBay)仅使用JavaScript触发特定图像。如果我查看代码，我可以看到数组中的数据。例如，来自Amazon:P.when('jQuery','cf').execute(function($,cf){P.load.js('http://z-ec
ruby - 如何使用Nokogiri和XPath获取具有多个属性的节点 - 2
我正在尝试使用Nokogiri来解析带有一些相当古怪的标记的HTML文件。具体来说，我正在尝试获取同时定义了id、多个类和样式的div。标记看起来像这样:titleListofstuff我正在尝试获取里面的问题.我可以毫无问题地获得具有单个id属性的div，但我想不出一种方法让Nokogiri获取具有和两个id类的div。所以这些工作正常:content=@doc.xpath("//div[id='foo']")content=@doc.css('div#foo')但是这些不返回任何东西:content=@doc.xpath("//div[id='bar']")content=@doc
ruby-on-rails - XPath 或 CSS 解析速度更快(对于 HTML 文件上的 Nokogiri)？ - 2
我想知道NokogiriXPath或CSS解析是否可以更快地处理HTML文件。速度有何不同？最佳答案 Nokogiri没有XPath或CSS解析。它将XML/HTML解析为单个DOM，然后您可以使用CSS或XPath语法进行查询。CSS选择器在要求libxml2执行查询之前在内部转换为XPath。因此(对于完全相同的选择器)XPath版本会快一点点，因为CSS不需要先转换成XPath。但是，您的问题没有通用答案；这取决于您选择的是什么，以及您的XPath是什么样的。很有可能，您不会编写与Nokogiri创建的相同的XPath。例如
ruby-on-rails - Rails 还是 Sinatra？ PHP程序员入门学习哪个好？ - 2
按照目前的情况，这个问题不适合我们的问答形式。我们希望答案得到事实、引用或专业知识的支持，但这个问题可能会引发辩论、争论、投票或扩展讨论。如果您觉得这个问题可以改进并可能重新打开，visitthehelpcenter指导。关闭10年前。我使用PHP的时间太长了，对它感到厌倦了。我也想学习一门新语言。我一直在使用Ruby并且喜欢它。我必须在Rails和Sinatra之间做出选择，那么您会推荐哪一个？Sinatra真的不能用来构建复杂的应用程序，它只能用于简单的应用程序吗？
ruby-on-rails - Nokogiri 和 XPath 中未定义的命名空间前缀 - 2
我正在尝试解析YoutubeGdata以查看是否存在具有给定ID的视频。但是没有普通的标签，而是带有命名空间。在链接上http://gdata.youtube.com/feeds/api/videos?q=KgfdlZuVz7I有标签:1有命名空间openSearch:xmlns:openSearch='http://a9.com/-/spec/opensearchrss/1.0/'但我不知道如何在Nokogiri和Ruby中处理它。部分代码如下:xmlfeed=Nokogiri::HTML(open("http://gdata.youtube.com/feeds/api/videos

php - SimpleXMLElement、xpath 和子元素

有关php - SimpleXMLElement、xpath 和子元素的更多相关文章

随机推荐