ITEXT插件方法
/**
* @param pdf PDF文件路径
* @param txt 输出文本文件路径
* @throws IOException
*/
public void parsePdf(String pdf, String txt) throws IOException {
PdfReader reader = new PdfReader(pdf);
PrintWriter out = new PrintWriter(new FileOutputStream(txt));
Rectangle rect = new Rectangle(70, 80, 490, 580);
RenderFilter filter = new RegionTextRenderFilter(rect);
TextExtractionStrategy strategy;
for (int i = 1; i <= reader.getNumberOfPages(); i++) {
strategy = new FilteredTextRenderListener(new (), filter);
out.println(PdfTextExtractor.getTextFromPage(reader, i, strategy));
}
out.flush();
out.close();
reader.close();
}
PDFBOX插件方法PDDocument document = PDDocument.load( args[0] );
if( document.isEncrypted() )
{
document.decrypt( "" );
}
PDFTextStripperByArea stripper = new PDFTextStripperByArea();
stripper.setSortByPosition( true );
Rectangle rect = new Rectangle( 10, 280, 275, 60 );
stripper.addRegion( "class1", rect );
List allPages = document.getDocumentCatalog().getAllPages();
PDPage firstPage = (PDPage)allPages.get( 0 );
stripper.extractRegions( firstPage );
System.out.println( "Text in the area:" + rect );
System.out.println( stripper.getTextForRegion( "class1" ) );
㈡ java 如何在pdf模板文档中间添加表格
为什么要采用替换的方法呢?
读取后经过处理,重新新建一个pdf,把内容写到新的pdf里面就行了,用这些jar可以实现了
我的意思是,你有pdf模板,然后用java读取模板的内容,然后按你的要求对读取的内容进行处理(这里的处理是根据你自己的需求而定,如:从数据库读取数据,然后填充到从模板读取到的表格中),再把处理完后的内容重新写到一个新建的pdf中
㈢ java 有哪些免费报表工具啊,可以报表打印。
推荐润乾报表,润乾报表今年有推出免费版,可以从润乾报表官网下载试用
润乾报表设计页面是类似excel的,而且内置了很多常用函数,更便于绘制报表。而且提供了三种打印方式:applet、pdf、flash供用户选择使用,批量打印方面支持applet和pdf两种打印方式。
㈣ java,如何从pdf中提取想要的信息
都是用工具提取PDF文件页面的,PDF提取页面!
可能大家不清楚什么情况下可以处理此操作,因为接触过的很多资料都是PDF格式,有时自己证件扫描也会存进PDF文件,但其中某些页的内容自己想分离出来,存进一个新的PDF中就要进行页面的提取处理。