jjzjj

locationFacility

全部标签

javascript - 如何使用 R 从国家文件馆 (archives.gov) 中抓取目录系列中的所有文件

我正在寻找一种编程方式来使用R抓取archive.gov上数据文件系列的所有可用文件。archives.gov似乎使用javascript。我的目标是捕获每个可用文件的URL以及文件名。家庭抵押贷款披露法案数据文件系列有153entries在浏览器中,我可以单击“导出”按钮并获得具有以下结构的csv文件:first_exported_record然后在这153个条目的每一个后面,都有文件单元页面,其中包含多个可供下载的文件。例如,第一个导出的记录指向:https://catalog.archives.gov/id/18491490但是这两个页面似乎都是javascript,所以我不确定