我无法将RXML包用于我想到的特定应用程序。考虑以下示例文档。我有兴趣在第一个a节点内获取b中的信息。但是我的问题(应用程序)的性质是,我首先需要识别文档中的所有a节点,然后对该节点集进行子集化以获取第一个a节点,然后获取b节点。第一步很简单:doctext1text2"parsedstep1[[1]]text1[[2]]text2attr(,"class")[1]"XMLNodeSet"这会产生预期的结果。我的应用程序的下一步是从第一个a节点中提取b节点。如果我在step1[[1]]上使用getNodeSet,我会从step1节点集中的两个节点获取b节点。step2text1[[2]
我正在尝试使用R的XML库从网站中提取一些信息。我已经下载了一个网页。然后,我使用Xpath表达式从页面中提取一些相关元素。通常这会产生大约50个相关元素。然后我想将这些相关项(XMLNodeSet)保存为XML文档(这样我就可以在XML编辑器中分析结果)。但是。之前,我可以保存XMLNodeSet,我需要在使用XML::saveXML()函数之前将它们转换为格式良好的xml文档。有没有人知道如何使用R的XML包来做到这一点。以下是一段代码:download.file("https://www.holidayhouses.co.nz/Browse/List.aspx?page=37",
我正在尝试使用R中XML包中的xpathApply函数从html文件中提取某些数据。但是,当我在html文档的一些父节点上使用xpathApply后,生成的对象的类变成了XMLNodeSet,我无法在此类对象上进一步使用xpathApply,因为出现此错误消息:“ErrorinUseMethod("xpathApply"):没有适用于“xpathApply”的适用方法应用于“XMLNodeSet”类的对象”这是我试图复制我的问题的R脚本(这个例子只是一个简单的表格,我知道我可以使用readHTMLtable函数,但我需要使用更多低级函数来工作,因为我的实际html更复杂比这个简单的表格