① pdf文件在轉化成WORD文檔的時候,結果為亂碼,如何解決
pdf轉換出亂碼的根本原因是文件的內碼丟失了,需要用龍谷的 pdf內碼校正 進行校正後就可以正常拷貝復制和另存成word或txt而沒有亂碼了。
② 有些pdf無法選中文字進行處理,該怎麼解決
pdf文件中的文字可以是內碼方式嵌入字型檔,這種方式能復制下來文字。還有一種雙層pdf,顯示的是點陣,但另外有內碼層,仍然能從屏幕上復制文字,連書法作品都能實現這種雙層。除了這兩種,其他方式的文字就都不能復制文字了。
能放大顯示文字不出鋸齒的pdf文件,有兩種情況不能復制文字。一種是非標准內碼,復制過程能實現,但貼出來全是亂碼。還有一種就是曲線化文字,所有文字都變成了矢量圖,根本就不能按文字進行選擇。矢量圖的這種用ai打開是看得最明顯的。
你遇到的情況,最大可能就是這種曲線化的文字。
③ PDF如何分類
不十分了解你所說的「分類」是從什麼角度分類。
就PDF文件中的文字來說,我所知道的大致有這么幾種類型:
文字內碼類。這裡麵包括字型檔嵌入型和依賴本地字型檔型、標准內碼型和非標准內碼型。還有一種雙層PDF,一般很少見到,就是以圖形顯示,但仍然能從屏幕上掃下來圖形文字的內碼。多用於書法作品。
曲線文字類。從非雙層的文字內碼類PDF文件轉換而成,所有文字成為矢量圖,從屏幕上不能復制文字。
點陣文字類。文字以點陣圖方式顯示。這樣的PDF的特徵就是文字不能任意放大,放大到一定程度就會出現明顯的「鋸齒」,而且也不能從屏幕上復制文字。而上面兩類PDF中只有雙層型的PDF是不能任意放大的。