itext等等,可以方便轉換的了
~
~
~
~
『貳』 java 讀取pdf, word, excel, ppt文檔的內容,下了POI包,但是不知道怎麼用,剛學java,求告訴一下怎麼辦
讀取pdf需要下載pdfbox:
http://pdfbox.apache.org/
新建一個Project,然後把POI的src導入到該工程。
【How to create an Eclipse Project 】你可以參考:
http://mail-archives.apache.org/mod_mbox/poi-dev/201204.mbox/%3cCAPt+24QbEryNixQFuPhEsKx16oHcn_h5xEa0x9uMSEVYLe-fPw@mail.gmail.com%3e
『叄』 java中怎麼利用poi和itext生成pdf文檔
生成PDF文檔代碼如下:
packagepoi.itext;
importjava.io.FileOutputStream;
importjava.io.IOException;
importjava.awt.Color;
importcom.lowagie.text.*;
importcom.lowagie.text.pdf.*;
importcom.lowagie.text.pdf.BaseFont;
/**
*創建Pdf文檔
*@authorAdministrator
*
*/
publicclassHelloPdf
{
publicstaticvoidmain(String[]args)throwsException
{
BaseFontbfChinese=BaseFont.createFont("STSong-Light","UniGB-UCS2-H",BaseFont.NOT_EMBEDDED);
FontFontChinese=newFont(bfChinese,12,Font.NORMAL);
//第一步,創建document對象
RectanglerectPageSize=newRectangle(PageSize.A4);
//下面代碼設置頁面橫置
//rectPageSize=rectPageSize.rotate();
//創建document對象並指定邊距
Documentdoc=newDocument(rectPageSize,50,50,50,50);
Documentdocument=newDocument();
try
{
//第二步,將Document實例和文件輸出流用PdfWriter類綁定在一起
//從而完成向Document寫,即寫入PDF文檔
PdfWriter.getInstance(document,newFileOutputStream("src/poi/itext/HelloWorld.pdf"));
//第3步,打開文檔
document.open();
//第3步,向文檔添加文字.文檔由段組成
document.add(newParagraph("HelloWorld"));
Paragraphpar=newParagraph("世界你好",FontChinese);
document.add(par);
PdfPTabletable=newPdfPTable(3);
for(inti=0;i<12;i++)
{
if(i==0)
{
PdfPCellcell=newPdfPCell();
cell.setColspan(3);
cell.setBackgroundColor(newColor(180,180,180));
cell.addElement(newParagraph("表格頭",FontChinese));
table.addCell(cell);
}
else
{
PdfPCellcell=newPdfPCell();
cell.addElement(newParagraph("表格內容",FontChinese));
table.addCell(cell);
}
}
document.add(table);
}
catch(DocumentExceptionde)
{
System.err.println(de.getMessage());
}
catch(IOExceptionioe)
{
System.err.println(ioe.getMessage());
}
//關閉document
document.close();
System.out.println("生成HelloPdf成功!");
}
}
希望對你有幫助。
『肆』 用JAVA能把Word和PDF文檔的表格內容和格式識別出來嗎
java的poi插件可以讀取word文件。
『伍』 如何利用Java操作Word,Excel,PDF文檔
office類的文檔可以參考appache的poi,java一般都使用這個包來操作office文檔。office文檔與office文檔的轉化參考openoffice的UNO對象,功能相當強大,可惜的是openoffice沒有64位的,2016這種office格式的文檔支持不行。想要直接操作pdf,上adobe的網上找去,我有個icepdf可以把pdf轉圖片,這個包我記得也可以操作pdf文檔,包括生成pdf,修改pdf內容等等。
『陸』 如何用純java代碼實現word轉pdf
幾種方案:
方法一:用apache pio 讀取doc文件,然後轉成html文件用Jsoup格式化html文件,最後用itext將html文件轉成pdf。
方法2:使用jdoctopdf來實現,這是一個封裝好的包,可以把doc轉換成pdf,html,xml等格式,調用很方便
地址:
需要注意中文字體的寫入問題。
方法3:使用jodconverter來調用openOffice的服務來轉換,openOffice有個各個平台的版本,所以這種方法跟方法1一樣都是跨平台的。
jodconverter的下載地址:
首先要安裝openOffice,下載地址:
安裝完後要啟動openOffice的服務,具體啟動方法請自行google
方法4:效果最好的一種方法,但是需要window環境,而且速度是最慢的需要安裝msofficeWord以及SaveAsPDFandXPS.exe(word的一個插件,用來把word轉化為pdf)
Office版本是2007,因為SaveAsPDFandXPS是微軟為office2007及以上版本開發的插件
SaveAsPDFandXPS下載地址:
jacob 包下載地址:
『柒』 java web利用poi實現word轉換成pdf
建議你是用acrobat 或者abbyy 這個 兩款軟體進行轉換編輯
Adobe公司推出的PDF格式是一種全新的電子文檔格式。藉助 Acrobat ,您幾乎可以用攜帶型文檔格
adobe-acrobat-x
式 (Portable Document Format,簡稱 PDF) 出版所有的文檔。 PDF 格式的文檔能如實保留原來的面貌和內態掘容,以及字體和圖像。這類文檔可通過電子郵件發送,也可將它們存儲在WWW 、企業內部網、文件系統或CD-ROM上,來供其他用戶在 Microsoft Windows , Mac OS和 LINUX 等平台上進行查看。由於該格式使用Adobe公司開發的PostScript頁面描述語言,使得頁面中的文字和圖形的質量得到質的飛躍。無論您是使用PDF文檔進行網上閱讀,還是列印、印刷出版,Adobe Acrobat都能給你最好效果。
ABBYY 是一家俄羅斯軟體公司,在文檔識別,數據捕獲和語言技術的開發中居皮拍世界領先地位。其獲獎產品 FineReader OCR 軟體可以把靜態燃閉羨紙文件和 PDF 文件轉換成可管理的電子數據,可以大大節省您的時間和精力。