ITEXT插件方法
/**
* @param pdf PDF文件路徑
* @param txt 輸出文本文件路徑
* @throws IOException
*/
public void parsePdf(String pdf, String txt) throws IOException {
PdfReader reader = new PdfReader(pdf);
PrintWriter out = new PrintWriter(new FileOutputStream(txt));
Rectangle rect = new Rectangle(70, 80, 490, 580);
RenderFilter filter = new RegionTextRenderFilter(rect);
TextExtractionStrategy strategy;
for (int i = 1; i <= reader.getNumberOfPages(); i++) {
strategy = new FilteredTextRenderListener(new (), filter);
out.println(PdfTextExtractor.getTextFromPage(reader, i, strategy));
}
out.flush();
out.close();
reader.close();
}
PDFBOX插件方法PDDocument document = PDDocument.load( args[0] );
if( document.isEncrypted() )
{
document.decrypt( "" );
}
PDFTextStripperByArea stripper = new PDFTextStripperByArea();
stripper.setSortByPosition( true );
Rectangle rect = new Rectangle( 10, 280, 275, 60 );
stripper.addRegion( "class1", rect );
List allPages = document.getDocumentCatalog().getAllPages();
PDPage firstPage = (PDPage)allPages.get( 0 );
stripper.extractRegions( firstPage );
System.out.println( "Text in the area:" + rect );
System.out.println( stripper.getTextForRegion( "class1" ) );
㈡ java 如何在pdf模板文檔中間添加表格
為什麼要採用替換的方法呢?
讀取後經過處理,重新新建一個pdf,把內容寫到新的pdf裡面就行了,用這些jar可以實現了
我的意思是,你有pdf模板,然後用java讀取模板的內容,然後按你的要求對讀取的內容進行處理(這里的處理是根據你自己的需求而定,如:從資料庫讀取數據,然後填充到從模板讀取到的表格中),再把處理完後的內容重新寫到一個新建的pdf中
㈢ java 有哪些免費報表工具啊,可以報表列印。
推薦潤乾報表,潤乾報表今年有推出免費版,可以從潤乾報表官網下載試用
潤乾報表設計頁面是類似excel的,而且內置了很多常用函數,更便於繪制報表。而且提供了三種列印方式:applet、pdf、flash供用戶選擇使用,批量列印方面支持applet和pdf兩種列印方式。
㈣ java,如何從pdf中提取想要的信息
都是用工具提取PDF文件頁面的,PDF提取頁面!
可能大家不清楚什麼情況下可以處理此操作,因為接觸過的很多資料都是PDF格式,有時自己證件掃描也會存進PDF文件,但其中某些頁的內容自己想分離出來,存進一個新的PDF中就要進行頁面的提取處理。