jjzjj

xmlEventParse

全部标签

xml - 使用 R 的 xmlEventParse 存储 XML 节点值以进行过滤输出

我有一个巨大的xml文件(260mb),其中包含大量信息,如下所示:例子:大约有40个不同的FrameSet节点,每个节点都有不同的GameSection="..."和Object="...".我很想提取的信息节点变成list对象,但我无法加载整个xml文件,因为它太大了。有什么办法,我可以使用xmlEventParse函数过滤特定的GameSection和特定的Object并从相应的中获取所有信息元素? 最佳答案 可能是“内部”表示没有那么大xml=xmlTreeParse("file.xml",useInternalNodes=

R:巨大(> 20GB)文件的xmlEventParse期间的内存管理

基于上一个问题(seehere),我试图通过xmlEventParse读取许多大型xml文件,同时保存节点变化数据。使用此示例xml:https://www.nlm.nih.gov/databases/dtd/medsamp2015.xml.下面的代码使用xpathSapply来提取必要的值和一系列if语句,以将唯一值(PMID)与记录中的每个非唯一值(LastName)匹配的方式组合这些值-对于其中可能没有姓氏。目标是在此过程中编写一系列小型csv(此处,在每1000个姓氏之后)以最大限度地减少内存使用量。当在全尺寸数据集上运行时,代码成功地批量输出文件,但是内存中仍然存储着一些东西