xml - 自动填写 I-9 PDF XFA 表格

coder 2024-06-30 原文

早上好。我希望有人可以帮助我解决这个问题。去年，我使用 iTextSharp 设置了一个 VB.NET 程序，用户可以在其中输入信息以填写 I9，该信息将填写 PDF 并打印。对于新的 I9，我遇到了未知的困难。

首先，代码不会出错。我只是得到了一个糟糕的结果，因为我得到的不是填写的表格，而是一个 PDF，上面写着“您要加载的文档需要 Adobe Reader 8 或更高版本。您可能没有安装 Adobe Reader ...”等等。所以，我确保我拥有最新的 Reader 版本，再次尝试并得到相同的结果。

考虑到字段名称结构可能发生了变化，我尝试像第一次那样读取格式/字段。 (下面的代码)。但是，现在它告诉我没有要读取的字段 (AcroFields.Fields.Count = 0)。

Private Sub ListFieldNames(pdfTemplate As String)
    Dim pdfTemplate As String = "c:\Temp\PDF\fw4.pdf"
    Dim pdfReader As PdfReader = New PdfReader(pdfTemplate)
    Dim de As KeyValuePair(Of String, iTextSharp.text.pdf.AcroFields.Item)

    For Each de In pdfReader.AcroFields.Fields
        Console.WriteLine(de.Key.ToString())
    Next
End Sub

因此，我开始进行一些搜索，并找到了他们可以切换到的另一种 PDF 结构的引用； XFA。老实说，我还没有找到任何令人满意的文档/样本，但我确实找到了一些代码，看起来应该可以读取 XFA PDF 的结构。 (下面的代码)。我在这里尝试了两种不同的方法。第一个本质上表明 xfaFields 中没有 xmlNode。第二个确实找到了一个名为“数据”的节点(这是它找到的唯一一个)但没有找到任何子节点。

Private Sub ReadXfa(pdfTemplate As String)
    pdfReader.unethicalreading = True
    Dim readerPDF As New PdfReader(pdfTemplate)

    Dim xfaFields = readerPDF.AcroFields.Xfa.DatasetsSom.Name2Node

    For Each xmlNode In xfaFields
        Console.WriteLine(xmlNode.Value.Name + ":" + xmlNode.Value.InnerText)
    Next
    'Example of how to get a field value
    '   Dim lastName = xfaFields.First(Function(a) a.Value.Name = "textFieldLastNameGlobal").Value.InnerText


    Dim reader As New PdfReader(pdfTemplate)
    Dim xfa As New XfaForm(reader)
    Dim node As XmlNode = xfa.DatasetsNode()
    Dim list As XmlNodeList = node.ChildNodes()
    For i As Integer = 0 To list.Count - 1
        Console.WriteLine(list.Item(i).LocalName())
        If "data".Equals(list.Item(i).LocalName()) Then
            node = list.Item(i)
            Exit For
        End If
    Next
    list = node.ChildNodes()
    For i As Integer = 0 To list.Count - 1
        Console.WriteLine(list.Item(i).LocalName())
    Next
    reader.Close()
End Sub

https://www.uscis.gov/system/files_force/files/form/i-9.pdf?download=1

上面的链接转到政府提供的 i9 PDF。

所以...我想我有多个问题。最简单的是是否有人完成了这个过程/他们是否可以帮助我。除此之外，如果有人能为我指出正确的方向，说明如何从这个新的 PDF 文件中读取/写入，那将是惊人的。坦率地说，我什至不确定如何确定他们使用的是什么“类型”的表单 - AcroField、XFA 还是其他？

非常感谢您的时间/帮助!

最佳答案

首先，抱歉我不再做vb.net了，但是你应该可以转换后面的代码。

您自己已经发现新表单是 XFA。有一种简单的非编程方式可以查看表单字段和数据。您注意到您升级了 Adobe Reader 的版本，所以我猜您正在使用 Reader DC。从菜单选项:

Edit => Form Options => Export Data...

将表单导出到您可以检查的 XML 文件。 XML 文件提示您需要相应的 XML 文档来填写表单，这与使用 AcroForm 完成的方式完全不同。

这里有一些简单的代码可以帮助您入门。首先是读取空白 XML 文档并更新它的方法:

public string FillXml(Dictionary<string, string> fields)
{
    // XML_INFILE => physical path to XML file exported from I-9
    XDocument xDoc = XDocument.Load(XML_INFILE);
    foreach (var kvp in fields)
    {
        // handle multiple elements in I-9 form
        var elements = xDoc.XPathSelectElements(
            string.Format("//{0}", kvp.Key)
        );
        if (elements.Count() > 0)
        {
            foreach (var e in elements) { e.Value = kvp.Value; }
        }
    }

    return xDoc.ToString();
}

现在我们有了创建有效 XML 的方法，用一些示例数据填充表单字段:

var fields = new Dictionary<string, string>()
{
    { "textFieldLastNameGlobal", "Doe" },
    { "textFieldFirstNameGlobal", "Jane" }
};
var filledXml = FillXml(fields);

using (var ms = new MemoryStream())
{
    // PDF_READER => I-9 PdfReader instance
    using (PDF_READER)
    {
        // I-9 has password security
        PdfReader.unethicalreading = true;
        // maintain usage rights on output file
        using (var stamper = new PdfStamper(PDF_READER, ms, '\0', true))
        {
            XmlDocument doc = new XmlDocument();
            doc.LoadXml(filledXml);
            stamper.AcroFields.Xfa.FillXfaForm(doc.DocumentElement);
        }
    }
    File.WriteAllBytes(OUTFILE, ms.ToArray());
}

要回答您的最后一个问题，即如何确定表单“类型”，请像这样使用 PdfReader 实例:

PDF_READER.AcroFields.Xfa.XfaPresent

true 表示 XFA，false 表示 AcroForm。

关于xml - 自动填写 I-9 PDF XFA 表格，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/41510154/

有关xml - 自动填写 I-9 PDF XFA 表格的更多相关文章

ruby-on-rails - 使用 Ruby on Rails 进行自动化测试 - 最佳实践 - 2
很好奇，就使用rubyonrails自动化单元测试而言，你们正在做什么？您是否创建了一个脚本来在cron中运行rake作业并将结果邮寄给您？git中的预提交Hook？只是手动调用？我完全理解测试，但想知道在错误发生之前捕获错误的最佳实践是什么。让我们理所当然地认为测试本身是完美无缺的，并且可以正常工作。下一步是什么以确保他们在正确的时间将可能有害的结果传达给您？最佳答案不确定您到底想听什么，但是有几个级别的自动代码库控制:在处理某项功能时，您可以使用类似autotest的内容获得关于哪些有效，哪些无效的即时反馈。要确保您的提
ruby-on-rails - 如何从 format.xml 中删除 <hash></hash> - 2
我有一个对象has_many应呈现为xml的子对象。这不是问题。我的问题是我创建了一个Hash包含此数据，就像解析器需要它一样。但是rails自动将整个文件包含在.........我需要摆脱type="array"和我该如何处理？我没有在文档中找到任何内容。最佳答案我遇到了同样的问题；这是我的XML:我在用这个:entries.to_xml将散列数据转换为XML，但这会将条目的数据包装到中所以我修改了:entries.to_xml(root:"Contacts")但这仍然将转换后的XML包装在“联系人”中，将我的XML代码修改为
ruby - RuntimeError(自动加载常量 Apps 多线程时检测到循环依赖 - 2
我收到这个错误:RuntimeError(自动加载常量Apps时检测到循环依赖当我使用多线程时。下面是我的代码。为什么会这样？我尝试多线程的原因是因为我正在编写一个HTML抓取应用程序。对Nokogiri::HTML(open())的调用是一个同步阻塞调用，需要1秒才能返回，我有100,000多个页面要访问，所以我试图运行多个线程来解决这个问题。有更好的方法吗？classToolsController0)app.website=array.join(',')putsapp.websiteelseapp.website="NONE"endapp.saveapps=Apps.order("
ruby-on-rails - Prawn - 表格单元格内的链接 - 2
我正在尝试用Prawn生成PDF。在我的PDF模板中，我有带单元格的表格。在其中一个单元格中，我有一个电子邮件地址:cell_email=pdf.make_cell(:content=>booking.user_email,:border_width=>0)我想让电子邮件链接到“mailto”链接。我知道我可以这样链接:pdf.formatted_text([{:text=>booking.user_email,:link=>"mailto:#{booking.user_email}"}])但是将这两行组合起来(将格式化文本作为内容)不起作用:cell_email=pdf.make_c
ruby-on-rails - 从应用程序中自定义文件夹内的命名空间自动加载 - 2
我们目前正在为ROR3.2开发自定义cms引擎。在这个过程中，我们希望成为我们的rails应用程序中的一等公民的几个类类型起源，这意味着它们应该驻留在应用程序的app文件夹下，它是插件。目前我们有以下类型:数据源数据类型查看我在app文件夹下创建了多个目录来保存这些:应用/数据源应用/数据类型应用/View更多类型将随之而来，我有点担心应用程序文件夹被这么多目录污染。因此，我想将它们移动到一个子目录/模块中，该子目录/模块包含cms定义的所有类型。所有类都应位于MyCms命名空间内，目录布局应如下所示:应用程序/my_cms/data_source应用程序/my_cms/data_ty
ruby - 如何使用 Ruby 将 CSV 文件读入 HTML 表格？ - 2
我正在尝试将一个简单的CSV文件读入HTML表格以在浏览器中显示，但我遇到了麻烦。这就是我正在尝试的:Controller:defshow@csv=CSV.open("file.csv",:headers=>true)end查看:输出:NameStartDateEndDateQuantityPostalCode基本上我只获取标题，而不会读取和呈现CSV正文。最佳答案这最终成为最终解决方案:Controller:defshow#OpenaCSVfile,andthenreaditintoaCSV::Tableobjectforda
ruby-on-rails - 有没有一种工具可以在编码时自动保存对文件的增量更改？ - 2
我最喜欢的Google文档功能之一是它会在我工作时不断自动保存我的文档版本。这意味着即使我在进行关键更改之前忘记在某个点进行保存，也很有可能会自动创建一个保存点。至少，我可以将文档恢复到错误更改之前的状态，并从该点继续工作。对于在MacOS(或UNIX)上运行的Ruby编码器，是否有具有等效功能的工具？例如，一个工具会每隔几分钟自动将Gitcheckin我的本地存储库以获取我正在处理的文件。也许我有点偏执，但这点小保险可以让我在日常工作中安心。最佳答案虚拟机有些人可能讨厌我对此的回应，但我在编码时经常使用VIM，它具有自动保存功
ruby - 如何使用 Nokogiri 解析纯 HTML 表格？ - 2
我想用Nokogiri解析HTML页面。页面的一部分有一个表，它没有使用任何特定的ID。是否可以提取如下内容:Today,3,455,34Today,1,1300,3664Today,10,100000,3444,Yesterday,3454,5656,3Yesterday,3545,1000,10Yesterday,3411,36223,15来自这个HTML:TodayYesterdayQntySizeLengthLengthSizeQnty345534345456563113003664354510001010100000344434113622315
ruby-on-rails - prawnto 显示新页面时不会中断的表格 - 2
我有可变数量的表格和可变数量的行，我想让它们一个接一个地显示，但如果表格不适合当前页面，请将其放在下一页，然后继续。我已将表格放入事务中，以便我可以回滚然后打印它(如果高度适合当前页面)，但我如何获得表格高度？我现在有这段代码pdf.transactiondopdf.table@data,:font_size=>12,:border_style=>:grid,:horizontal_padding=>10,:vertical_padding=>3,:border_width=>2,:position=>:left,:row_colors=>["FFFFFF","DDDDDD"]pdf.
ruby - 在 ruby 中使用自动创建插入数组 - 2
我想知道是否可以通过自动创建数组来插入数组，如果数组不存在的话，就像在PHP中一样:$toto[]='titi';如果尚未定义$toto，它将创建数组并将“titi”压入。如果已经存在，它只会推送。在Ruby中我必须这样做:toto||=[]toto.push('titi')可以一行完成吗？因为如果我有一个循环，它会测试“||=”，除了第一次:Person.all.eachdo|person|toto||=[]#with1billionofperson,thislineisuseless999999999times...toto.push(person.name)你有更好的解决方案吗？

xml - 自动填写 I-9 PDF XFA 表格

有关xml - 自动填写 I-9 PDF XFA 表格的更多相关文章

随机推荐