我正在尝试使用PDFBox将PDF文档转换为.png文件。我关注了thisanswer了解需要哪些依赖项并给我一个起点。当我尝试遍历页面并创建BufferedImage时,我收到了一个NoClassDefFoundError错误。它正在寻找org/apache/fontbox/FontBoxFont,但通过一些广泛的谷歌搜索,我没有找到关于FontBoxFont的信息。这是一个需要包含的单独的jar吗?是什么导致了这个错误?项目中包含以下.jar:pdfbox-2.0.2.jarlevigo-jbig2-imageio-1.6.5.jarpdfbox-tools-2.0.2.jarja
是否可以使用Java从PDF文件中提取图像并将它们导出到特定文件夹而不丢失其原始创建和修改日期?我试图通过使用IText和PDFBox来实现这个目标,但没有成功。欢迎任何想法或示例。 最佳答案 图像不包含元数据,存储为需要组合成图像的原始数据。我在https://blog.idrsolutions.com/2010/04/understanding-the-pdf-file-format-how-are-images-stored/写了2篇博文解释图像数据如何存储在PDF文件中。和https://blog.idrsolutions.
我正在尝试将org.apache.pdfbox.pdmodel.PDDocument类和icafe库(https://github.com/dragon66/icafe/)表示的PDF转换为具有第4组压缩和300dpi的多页tiff。示例代码适用于288dpi,但奇怪的是不适用于300dpi,导出的tiff仍然只是白色。有人知道这里的问题是什么吗?我在示例中使用的示例pdf位于此处:http://www.bergophil.ch/a.pdfimportjava.awt.image.BufferedImage;importjava.io.FileOutputStream;importja
情况:在PDFBox中,PDRectangle对象的默认原点(0,0)似乎是页面的左下角。例如,以下代码在页面的左下角为您提供一个正方形,每边长100个单位。PDRectanglerectangle=newPDRectangle(0,0,100,100);问题:是否可以将原点更改为左上角,例如,上面的代码将在页面的左上角为您提供相同的正方形?我问的原因:我正在使用PDFTextStripper来获取文本的坐标(通过使用提取的TextPosition对象的getX()和getY()方法)。从TextPosition对象检索的坐标似乎在左上角有一个原点(0,0)。我希望我的PDRectan
我正在尝试使用此方法修改pdf(第一个代码块-使用PDFStreamParser并遍历PDFOperator,然后在需要时更新COSString):http://www.coderanch.com/t/556009/open-source/PdfBox-Replace-String-double-pdf我遇到了一些UTF-8字符(变音符号)的问题:当我打印要更新的文本时,它显示为“Societ??iiNa?ionale”(其中“?”是一个代码,例如0002或0004)。有趣的是:当我编写更新后的pdf文件时,字符显示正确(即使我无法检测并替换它们)如果我尝试使用PDFTextStrip
我使用PDFBOX版本2将两个PDF文件合并为一个。第一个有字体:nametypeencodingembsubuniobjectID---------------------------------------------------------------------------------------XXMGEM+Arial-BoldMTTrueTypeWinAnsiyesyesyes150XXMGEM+ArialMTTrueTypeWinAnsiyesyesyes190XXMGEM+ArialMTCIDTrueTypeIdentity-Hyesyesyes270XXMGEM+Ar
我想在PDFBOX中创建一个按钮,即验证或重置按钮,它将调用PDF中嵌入的javascript的某些功能。如何在PDFBOX中创建这样的按钮?我已经尝试使用PDPushButton片段跟踪代码,但它现在可以正常工作。在这里,当我单击按钮区域时,会显示刻度符号并在每次单击时切换。边框也没有显示。相反,我想显示带有标签和边框的普通按钮。我正在使用pdfbox版本1.8.10。PDDocumentdoc=newPDDocument();PDPagepage=newPDPage();doc.addPage(page);PDAcroFormacroForm=newPDAcroForm(doc);
我制作了一个pdf表格,我正在尝试使用pdfBox填写表格并打印文档。我让它非常适合1页打印作业,但我不得不尝试修改多页。基本上它是一个顶部有基本信息和内容列表的表格。好吧,如果内容大于表格的空间,我必须将其制作成多页文档。我最终得到了一个带有漂亮页面的文档,然后所有剩余页面都是空白模板。我做错了什么?PDDocumentfinalDoc=newPDDocument();Filetemplate=newFile("path/to/template.pdf");//DeclarebasicinfotobeputoneverypageStringname="JohnSmith";Strin
Pdfbox与1.8.xx合并文档,就像mergePdf.mergeDocuments()它工作正常。现在pdfbox版本2.0.0包含一些参数,如org.apache.pdfbox.multipdf.PDFMergerUtility.mergeDocuments(MemoryUsageSettingarg0)什么是MemoryUsageSetting如何与mergeDocuments一起使用。我读作Mergethelistofsourcedocuments,savingtheresultinthedestinationfile.请提供一些相当于2.0版的代码.0publicvoidc
我正在尝试使用pdfbox从pdf中提取包含所有信息的文本。我得到了我想要的所有信息,除了颜色。我尝试了不同的方法来获取字体颜色(包括GettingTextColourwithPDFBox)。但没有工作。现在我从pdfBox的PageDrawer类复制了代码。但是RGB值也不正确。protectedvoidprocessTextPosition(TextPositiontext){Compositecom;Colorcol;switch(this.getGraphicsState().getTextState().getRenderingMode()){casePDTextState.