導航:首頁 > 文檔加密 > objectcpdf

objectcpdf

發布時間:2023-02-23 04:47:02

『壹』 我在java中用jacob把word文檔轉化成pdf文件出來了問題

1、到官網下載Jacob,2、將壓縮解壓後,Jacob.jar添加到Libraries中(先復制到項目目錄中,右鍵單擊jar包選擇BuildPath—>AddtoBuildPath);3、將Jacob.dll放至當前項目所用到的「jre\bin」下面(比如Eclipse正在用的Jre路徑是C:\Java\jdk1.7

『貳』 python如何檢測是不是需要旋轉pdf

是的,1.導入PyPDF2模塊之後使用open()方法打開pdf文件並且調用Reader方法直接將這個pdf文件之中的所有頁面都給讀取出來,讀取出來之後返回的是一個可迭代對象。然後使用getPage()方法獲取其中的某一個頁面,代碼如下所示:

import PyPDF2
reader = PyPDF2.PdfFileReader(open('a.pdf','rb'))
page = reader.getPage(0)
2.以上代碼之中的page所返回的就是pdf文件第一頁,使用它去調用rotateClockwise()方法就能夠將其90度旋轉,示例如下:

page.rotateClockwise(180)
這個方法一次只能夠對一個頁面進行修改操作,並且參數必須為90度及其倍數。也就是只能選擇90、180、270、360這四個度數,而且選擇是順時針選擇的,旋轉之後的頁面會自動調整格式。

3.頁面旋轉完畢之後還需要實例化出來一個文件寫入對象,然後使用這個對象將修改旋轉後的頁面添加到原pdf文件之中。再打開一個新的pdf文件用來保存,然後使用write()方法將頁面寫入之後將其關閉掉就好了,代碼示例如下:

output = PyPDF2.PdfFileWriter()
outputStream = open ("b.pdf","wb")
output.write(outputStream)
outputStream.close()

『叄』 pdfobject 如何載入不是本地的路徑的文件

為了回答你的問題 我真的花了不少時間,

如下的url1是我從網上找的一個pdf地址 ,結果不行,

url2是我自己上傳到我自己的伺服器上的一個pdf地址,是可以的;

我得出的結論應該是url的問題,建議你下載到本地先

<!doctypehtml>
<htmllang="en">

<head>
<metacharset="UTF-8">
<title>TEST</title>
<style>
.pdfobject-container{
height:500px;
}

.pdfobject{
border:1pxsolid#666;
}
</style>
<scriptsrc="js/jquery.js"></script>
<scripttype="text/javascript"src="js/pdfobject.min.js"></script>
<script>
$(function(){
varurl2="

varurl1="
,60.166.22.30&ssig=8NwYmRvYkL&Expires=1470043735&KID=sae,l30zoo1wmz&fn=%E5%B0%91%E6%9C%89%E4%BA%BA%E8%B5%B0%E7%9A%84%E8%B7%AFI%20%E5%AE%8C%E6%95%B4%E6%89%AB%E6%8F%8F%E7%89%88.pdf&skiprd=2&se_ip_debug=60.166.22.30&corp=2&from=124";
PDFObject.embed(url2,"#example1");


});
</script>
</head>
</body>
<divid="example1"></div>

<body>

</html>

『肆』 如何將pdf格式文件轉換成word格式文件

1.Office組件把PDF轉成Word:
可以利用Office 2003中的Microsoft Office Document Imaging組件來實現PDF轉WORD文檔,也就是說利用WORD來完成該任務。方法如下:

用Adobe Reader打開想轉換的PDF文件,接下來選擇「文件→列印」菜單,在打開的「列印」窗口中將「列印機」欄中的名稱設置為「Microsoft Office Document Image Writer」,確認後將該PDF文件輸出為MDI格式的虛擬列印文件。

注:如果沒有找到「Microsoft Office Document Image Writer」項,使用Office 2003安裝光碟中的「添加/刪除組件」更新安裝該組件,選中「Office 工具 Microsoft DRAW轉換器」。

然後,運行「Microsoft Office Document Imaging」,並利用它來打開剛才保存的MDI文件,選擇「工具→將文本發送到Word」菜單,在彈出的窗口中選中「在輸出時保持圖片版式不變」,確認後系統會提示「必須在執行此操作前重新運行OCR。這可能需要一些時間」,不管它,確認即可。

注:對PDF轉DOC的識別率不是特別完美,轉換後會丟失原來的排版格式,所以轉換後還需要手工對其進行排版和校對工作。

以上僅在word2003中可用,其他版本沒有Microsoft Office Document Image Writer。

2.利用第三方工具軟體:
ScanSoft PDF Converter For Microsoft Word
下載地址:
http://www.mydown.com/soft/245/245551.html

3.ASP.Net實現將Word轉換PDF格式:
一:必備工具

安裝必須的工具MS VS.Net2003,MS Office2003,Adobe Acrobat 7.0 Professional,postscript.exe,gs811w32.exe

MS VS.Net2003的安裝不說明

MS Office2003的安裝不說明

Adobe Acrobat 7.0 Professional安裝說明

運行setup.exe文件,出現輸入序列號,就運行注冊機,用滑鼠在第一行刷下就可以看見序列號,復制粘貼到Adobe Acrobat 7.0 Professional安裝程序對話框,安裝到最後出現注冊時,點擊PHONE...將安裝程序中顯示的第二行序列號(第一行是剛才注冊機生成的序列號)復制粘貼到注冊機的第二行,點擊右邊的按鈕,再用滑鼠刷第三行授權號就出來了,將其復制粘貼到安裝程序的最後一行,完成安裝注冊!

postscript.exe默認安裝就可以了,它是一個PDF轉換時所需要的腳本

gs811w32.exe默認安裝就可以,它其實是個PDF虛擬列印機的驅動

二:配置虛擬列印機

進入Windows的控制面板,進入列印機,點擊"添加列印機"圖標.在安裝對話框上"按一步",出現選擇列印機時,在製造商一欄中選擇"Generic",在列印機一欄中,選擇"MS Publisher Color Printer",然後一路按下一步,知道安裝結束.

三:開始寫第一個程序(腳本程序)

為什麼要使用腳本程序進行轉換呢,其實實際測試過程中,使用PDF Distiller的對象引用到C#後,轉換成功,但整個PDF Distiller對象不能釋放,第二次再轉換時,就發生了錯誤,故此處使用腳本程序實現轉換.這樣我們只要在C#的程序中調用腳本程序就可以實現WORD到PDF的轉換。

宿主腳本文件名:ConvertDoc2PDF.js

腳本文件內容:

var files = WScript.Arguments;
var fso = new ActiveXObject("Scripting.FileSystemObject");
var word = new ActiveXObject("Word.Application");
var PDF = new ActiveXObject("PDFDistiller.PDFDistiller.1");
word.ActivePrinter = "MS Publisher Color Printer";

//files(0) 為WORD文檔文件名
//files(1) 為,轉換後需要保存的路徑
//調用fso.GetBaseName(files(0))後,為無路徑,無擴展名,的文件名
//files.length為文件參數的個數,使用循環可以支持多個WORD文檔的轉換

var docfile = files(0);
var psfile = files(1) + fso.GetBaseName(files(0)) + ".ps";
var pdffile = files(1) + fso.GetBaseName(files(0)) + ".pdf";
var logfile = files(1) + fso.GetBaseName(files(0)) + ".log";

try{
var doc = word.Documents.Open(docfile);
//WORD文件轉成PS文件;
word.PrintOut(false, false, 0, psfile);
doc.Close(0);

//PS文件轉成PDF文件;
PDF.FileToPDF(psfile,pdffile,"");

fso.GetFile(psfile).Delete();//刪除PS腳本文件
fso.GetFile(logfile).Delete();//刪除轉換的日誌文件

word.Quit();
WScript.Echo("isuccess");//成功
WScript.Quit(0);
}
catch(x)
{
word.Quit();
WScript.Echo("isfail");//失敗
WScript.Quit(0);
}

然後測試該腳本程序

啟動MS-DOS,輸入如下命令:

c:\>cscript //nologo c:\ConvertDoc2PDF.js c:\test.doc c:\

說明:

運行成功後將看到test.pdf文檔了

c:\test.doc參數對應的是腳本程序中的files(0)

c:\參數對應的是腳本程序中的files(1)

你可以安照該腳本改寫成,支持多個參數,使用FOR循環,一次轉換多個WORD文檔,此處沒有使用多個文件轉換功能,是考慮到,該段腳本放在C#的線程中執行,這樣一來也可以轉換多個WORD文檔.

四:使用C#調用ConvertDoc2PDF.js腳本

新建一個C#的WINDOWS應用程序,添加一個按鈕button1

添加一個函數,函數名StartConvertPDF

public void StartConvertPDF()
{
Process proc = new Process();
proc.StartInfo.FileName = "cmd.exe";
proc.StartInfo.WorkingDirectory = @"c:\";
proc.StartInfo.CreateNoWindow = true;
proc.StartInfo.UseShellExecute = false;
proc.StartInfo.RedirectStandardInput = true; //輸入重定向

proc.Start();
proc.StandardInput.WriteLine(@"cscript //nologo c:\ConvertDoc2PDF.js c:\test.doc c:\");
proc.StandardInput.WriteLine("exit");
proc.WaitForExit();
}

然後在按鈕的CLICK事件中添加調用線程的代碼

private void button1_Click(object sender, System.EventArgs e)
{
//定義線程序
Thread thConvert = new Thread(new ThreadStart(StartConvertData));
thConvert.Start();
}

注意:在測試上面的C#程序時,必須添加如下命名空間

using System.Diagnostics;
using System.Threading;

五:健壯的C#調用代碼(實際考慮,可放在B/S系統中)

完成第4步的C#測試後,細心的讀者,可能看到一點問題,那就是如何得到腳本運行後輸出的結果,如何給線程中調用的StartConvertData方法傳遞參數

1:傳遞參數,此話說來也可用一篇教程告訴大家線程中方法如何來傳遞參數,現在就講一個方案,此種方案很多,我採用一個類,初始化這個類,然後調用該類的方法作為線程執行的方法

2:得到腳本的輸出結果,使用Process對象的輸出重定向,就是說改變輸出方向,使腳本不輸出到控制台(MS-DOS窗口),而是重定向輸出到C#程序中,並採用線程的非同步回調方法,顯示腳本運行結果。

添加一個新類,類名為ToPdf

using System;
using System.Diagnostics;
using System.ComponentModel;
using System.Windows.Forms;
using System.Data;

namespace Doc2Pdf
{
public class ToPdf
{
private string strWord = "";//此處的WORD文件不含路徑
private string sPath = "";
public string sExecResult = "";
public bool bSuccess = false;

public ToPdf(string sParamWord,string sParamPath)
{
strWord = sParamWord;
sPath = sParamPath;
}

public void StartConvertPDF()
{
Process proc = new Process();
proc.StartInfo.FileName = "cmd.exe";
proc.StartInfo.WorkingDirectory = sPath;
proc.StartInfo.CreateNoWindow = true;
proc.StartInfo.UseShellExecute = false;
proc.StartInfo.RedirectStandardInput = true;//標准輸入重定向
proc.StartInfo.RedirectStandardOutput = true;//標准輸出重定向

proc.Start();
proc.StandardInput.WriteLine("cscript //nologo "+sPath+"ConvertDoc2PDF.js "+sPath+strWord+ " "+sPath);
proc.StandardInput.WriteLine("exit");
sExecResult = proc.StandardOutput.ReadToEnd();//返回腳本執行的結果
proc.WaitForExit();
proc.Close();

}

public void EndConvertPDF(System.IAsyncResult ar)//ar參數必須寫,是線程執行完成後的回調函數
{
if(sExecResult.IndexOf("isuccess")!=-1)bSuccess=true;
else if(sExecResult.IndexOf("isfail")!=-1)bSuccess=false;
//如果放在B/S系統,你可以在此處寫資料庫,是成功還是失敗,並用一個WEBService程序不斷檢查資料庫,此WEBService程序不放在該回調用函數中
//如果放在C/S系統,回調函數可以不放在類中,以便在窗體程序中調用結果
}
}
}

改寫原來的button1_Click事件中的代碼

private void button1_Click(object sender, System.EventArgs e)
{
ToPdf my2Pdf = new ToPdf("test.doc","c:\\");
ThreadStart thStartConvert = new ThreadStart(my2Pdf.StartConvertPDF); //開始非同步調用線程
thStartConvert.BeginInvoke(new AsyncCallback(my2Pdf.EndConvertPDF),null);//設置非同步線程的回調函數

//如果需要轉換多個WORD,你可以用循環
//如果是B/S系統,可以將本段代碼放在ASPX中,並結合客戶端的無刷新顯示數據的技術,不斷訪問WEBService程序,以確定PDF是否轉換成功或失敗
}

六:編寫更加健壯的C#調用代碼(實際考慮,可放在WINDOWS的服務程序中)

實際使用時,由於轉化PDF時CPU的佔用率很高,考慮只在同一時間轉換一篇WORD文檔,放棄非同步線程的回調函數的使用,考慮一個WINDOWS的服務程序。

寫一個函數CheckData2Convert(),不斷的檢查沒有轉換的WORD文檔,並使用循環調用ToPdf類中執行轉換方法StartConvertPDF

//以下給出,泛代碼,用戶按照自己的需求,填寫完整即可
//bool bStart為全局變數,控制循環的進入與退出
//例:18:30開始檢查並轉換,那麼18:30時,bStart=true;並啟動轉換線程
//6:30停止轉換線程,bStart=fasle;

private void CheckData2Convert()
{
//檢查指定目錄下的沒有轉換的WORD文檔,你同樣可以檢查資料庫中記錄的沒有轉換的WORD文檔
string sPath = System.Threading.Thread.GetDomain().BaseDirectory; //當前的路徑
while(bStart)
{
int iFileCount = CheckWord(); //CheckWord為一個方法,檢查當前沒有轉換的WORD文檔,返回沒有轉換的文件數,該方法的代碼由讀者自己編寫
for(int i=0;i<iFileCount;i++)
{
string sWord = GetWordFileName(i) //GetWordFileName為一個方法,返回一個不帶路徑的WORD文件名,該方法的代碼由讀者自己編寫
//ToPdf類中的StartConvertPDF()方法使用的是不帶路徑的WORD文件名
ToPdf my2Pdf = new ToPdf(sWord ,sPath);
my2Pdf.StartConvertPDF();

if(my2Pdf.sExecResult.IndexOf("isuccess")!=-1)
{
//成功,寫日誌,或回寫資料庫
}
else if(my2Pdf.sExecResult.IndexOf("isfail")!=-1)
{
//失敗,寫日誌,或回寫資料庫
}

}

if(!bStart)break;
Thread.Sleep(1000);
}
}

然後在服務的開始事件中,啟動線程

protected override void OnStart(string[] args)
{
//可以使用一個開始定時器,檢查是否到開始時間,時間一到,就開始執行線程,此處的開始執行線程可以放在開始定時事件中
//可以使用一個結束定時器,檢查是否到結束時間,時間一到,就結束線程,結束線程的代碼可以放在結束定時事件中
//注意:應該使用組件中的定時器,而不是Windows的FORMS中的定時器
//該定時器的類名為System.Timers.Timer,千萬別搞錯,不然執行不會正常的
bStart = true;
Thread thConvert = new Thread(new ThreadStart(StartConvertData));
thConvert.Start();
}

然後在服務的結束事件中,設置停止線程的標識bStart= false

protected override void OnStop()
{
bStart = false;
//為何次處不停止線程呢,因為考慮到,現在線程正在轉換WORD文檔,但沒有結束,所以只設置停止標識,轉換完成後,線程也執行結束了.
}

『伍』 用c#如何提取pdf里的表格

添加spire.pdf.dll為引用,使用下面的代碼即可提取pdf中所有表格數據到txt文檔:

  1. using System.IO;

  2. using System.Text;

  3. using Spire.Pdf;

  4. using Spire.Pdf.Utilities;


  5. namespace ExtractPdfTable

  6. {

  7. class Program

  8. {

  9. static void Main(string[] args)

  10. {

  11. //Create a PdfDocument object

  12. PdfDocument doc = new PdfDocument();

  13. //Load the sample PDF file

  14. doc.LoadFromFile(@"C:.pdf");

  15. //Create a StringBuilder object

  16. StringBuilder builder = new StringBuilder();

  17. //Initialize an instance of PdfTableExtractor class

  18. PdfTableExtractor extractor = new PdfTableExtractor(doc);

  19. //Declare a PdfTable array

  20. PdfTable[] tableList = null;

  21. int tableNum = 1;

  22. //Loop through the pages

  23. for (int pageIndex = 0; pageIndex < doc.Pages.Count; pageIndex++)

  24. {

  25. //Extract tables from a specific page

  26. tableList = extractor.ExtractTable(pageIndex);

  27. //Determine if the table list is null

  28. if (tableList != null && tableList.Length > 0)

  29. {

  30. //Loop through the table in the list

  31. foreach (PdfTable table in tableList)

  32. {

  33. builder.Append("Table " + tableNum);

  34. builder.Append(" ");

  35. //Get row number and column number of a certain table

  36. int row = table.GetRowCount();

  37. int column = table.GetColumnCount();

  38. //Loop though the row and colunm

  39. for (int i = 0; i < row; i++)

  40. {

  41. for (int j = 0; j < column; j++)

  42. {

  43. //Get text from the specific cell

  44. string text = table.GetText(i, j);

  45. //Add text to the string builder

  46. builder.Append(text + " ");

  47. }

  48. builder.Append(" ");

  49. }

  50. builder.Append(" ");

  51. tableNum += 1;

  52. }

  53. }

  54. }

  55. //Write to a .txt file

  56. File.WriteAllText("Table.txt", builder.ToString());

  57. }

  58. }

  59. }

閱讀全文

與objectcpdf相關的資料

熱點內容
android公網ip 瀏覽:611
要塞1地圖放哪個文件夾 瀏覽:848
凡科建站怎麼弄伺服器 瀏覽:939
蘋果手機怎麼設置app播放 瀏覽:202
下載網站源碼用什麼瀏覽器 瀏覽:241
六線譜pdf 瀏覽:156
linuxmysqlsock 瀏覽:239
人教版數學pdf下載 瀏覽:460
文檔安全加密系統 瀏覽:491
數控銑床編程簡單數字 瀏覽:788
編程電纜如何重啟 瀏覽:121
myqq命令行發消息 瀏覽:365
日產逍客怎麼使用app升窗 瀏覽:503
安卓系統怎麼快速刪除微信內容 瀏覽:653
csharppython 瀏覽:409
程序員脖子按摩儀 瀏覽:562
小米桌面文件夾亂碼怎麼回事 瀏覽:858
點歌台app怎麼連接 瀏覽:318
大學電腦編程學什麼好 瀏覽:348
上哪裡取消應用加密 瀏覽:172