PDF操作类库 iText
iText是一个非常着名的能够快速产生PDF文件的Java类库。支持文本,表格,图形的操作,可以方便的跟 Servlet 进行结合。
Java的PDF处理类库 PDFBox
PDFBox是Java实现的PDF文档协作类库,提供PDF文档的创建、处理以及文档内容提取功能,也包含了一些命令行实用工具。 主要特性包括: 从PDF提取文本 合并PDF文档 PDF 文档加密与解密 与Lucene搜索引擎的集成 填充PDF/XFDF表单数据 从文本文件创建PDF文档
Android PDF 阅读器
Android PDF Viewer 是Android平台下的PDF阅读器。更多Android PDF 阅读器信息
纯Java的PDF阅读器 PDF Renderer
PDF Renderer 是一个开源的纯 Java 的 PDF 文档渲染和阅读器,使用 Java2D 技术。PDF Renderer 将 PDF 渲染到 Swing 面板,也可绘制到其他 Graphics2D 的实现(可方便生成各种格式的图片)。需要注意的是 PDF Renderer 并不能帮你生成 PDF 文档。
② Android 平台最好用的 PDF 阅读器是什么
mantano,功能强大,加载稳定速度也快,切边、朗读、查词、重排、配色都很强大。对大文件支持良好,还有完善的书签管理。云功能和在线书库没用过,不好评价。至少本地文件体验没的说。有点不足之处就是对部分中文文字版的pdf不能显示,还有就是添加批注是对单个页面编辑后保存,不够便捷。
补充推荐多看阅读文本重排的标杆,国产佳品,最适宜的中文阅读器;foxit(福昕)阅读器批注便捷,文件支持好,页面刷新快。其他比如说RepliGo,Adobe什么的见仁见智吧,需求不大的直接办公套件比如WPS也就够了。
③ C#如何读取pdf文本
NuGet包管理器 ->程序包管理器控制台 ->输入Install-Package Spire.PDF然后按回车安装dll
然后使用下面代码读取PDF文本
using System;
using System.IO;
using System.Text;
using Spire.Pdf;
namespace ExtractText_PDF
{
class Program
{
static void Main(string[] args)
{
//实例化PdfDocument类对象,并加载PDF文档
PdfDocument doc = new PdfDocument();
doc.LoadFromFile("sample.pdf");
//实例化一个StringBuilder 对象
StringBuilder content = new StringBuilder();
//遍历文档所有PDF页面,提取文本
foreach (PdfPageBase page in doc.Pages)
{
content.Append(page.ExtractText());
}
//将提取到的文本写为.txt格式并保存到本地路径
String fileName = "获取文本.txt";
File.WriteAllText(fileName, content.ToString());
}
}
}
④ C# 濡备綍璇诲彇鍜屾樉绀篜DF锛
璇诲彇鏄剧ずPDF闇瑕佸熷姪PDF搴掳纴锲藉唴Spire.PDF鍙浠ヨ诲彇PDF鍐呭癸纴鍖呮嫭鏂囨湰锛屽浘鐗囦互鍙婅〃镙硷纴浣犲彲浠ラ氲繃NuGet鎼灭储瀹夎
璇诲彇鏂囨湰鍐呭癸细
using Spire.Pdf;
using Spire.Pdf.Texts;
using System.IO;
using System.Text;
namespace ExtractText
{
internal class Program
{
static void Main(string[] args)
{
//鍒涘缓涓涓 PdfDocument 瀵硅薄
PdfDocument doc = new PdfDocument();
//锷犺浇PDF鏂囦欢
doc.LoadFromFile("AI鏁板瓧浜.pdf");
StringBuilder sb = new StringBuilder();
foreach (PdfPageBase page in doc.Pages)
{
//鍒涘缓涓涓狿dfTextExtractot 瀵硅薄
PdfTextExtractor textExtractor = new PdfTextExtractor(page);
//鍒涘缓涓涓 PdfTextExtractOptions 瀵硅薄
PdfTextExtractOptions extractOptions = new PdfTextExtractOptions();
//灏 isExtractAllText 璁剧疆涓篓rue
extractOptions.IsExtractAllText = true;
//浠庨〉闱涓鎻愬彇鏂囨湰
sb.AppendLine(textExtractor.ExtractText(extractOptions));
}
//灏嗘彁鍙栫殑鏂囨湰鍐椤叆 TXT 鏂囦欢
File.WriteAllText("鎻愬彇鎸囧畾椤甸溃鏂囨湰.txt", sb.ToString());
}
}
}
璇诲彇琛ㄦ牸鍐呭癸细
using Spire.Pdf;
using Spire.Pdf.Utilities;
using System.IO;
using System.Text;
namespace ExtractTable{
class Program
{
static void Main(string[] args)
{
//瀹炰緥鍖朠dfDocument绫荤殑瀵硅薄
PdfDocument pdf = new PdfDocument();
//锷犺浇PDF鏂囨。
pdf.LoadFromFile("sample.pdf");
//鍒涘缓StringBuilder绫荤殑瀵硅薄
StringBuilder builder = new StringBuilder();
//瀹炰緥鍖朠dfTableExtractor绫荤殑瀵硅薄
PdfTableExtractor extractor = new PdfTableExtractor(pdf);
//澹版槑PdfTable绫荤殑琛ㄦ牸鏁扮粍
PdfTable[] tableLists;
//阆嶅巻PDF椤甸溃
for (int pageIndex = 0; pageIndex < pdf.Pages.Count; pageIndex++)
{
//浠庨〉闱㈡彁鍙栬〃镙
tableLists = extractor.ExtractTable(pageIndex);
//鍒ゆ柇琛ㄦ牸鍒楄〃鏄钖︿负绌
if (tableLists != null && tableLists.Length > 0)
{
//阆嶅巻琛ㄦ牸
foreach (PdfTable table in tableLists)
{
//銮峰彇琛ㄦ牸涓镄勮屽拰鍒楁暟
int row = table.GetRowCount();
int column = table.GetColumnCount();
//阆嶅巻琛ㄦ牸琛屽拰鍒
for (int i = 0; i < row; i++)
{
for (int j = 0; j < column; j++)
{
//銮峰彇琛屽拰鍒椾腑镄勬枃链
string text = table.GetText(i, j);
//鍐椤叆鏂囨湰鍒癝tringBuilder瀹瑰櫒
builder.Append(text + " ");
}
builder.Append("
");
}
}
}
}
//淇濆瓨鎻愬彇镄勮〃镙煎唴瀹逛负.txt鏂囨。
File.WriteAllText("ExtractedTable.txt", builder.ToString());
}
}
}
⑤ 在手机上如何阅读PDF文件!
我们都知道PDF文件比较特殊,使用起来需要借助向对应的工具,想要在手机上对PDF文件进行阅读,需要下载PDF阅读器才能对它进行浏览,但是一般的PDF阅读器并不一定能支持,因为我们都知道,下载手机用户是苹果和安卓系统的用户比较居多,所以我们在操作起来还是需要将PDF阅读器专业化,小编在这里向大家介绍一款比较还用的PDF阅读器进行讲解一下!
以上就是手机版还是电脑版的PDF阅读器,看完的小伙伴们可以去试一试!
⑥ 怎么样用pdflib库读取pdf文件内的内容
你的意思是PDF文档的渲染是不是? C + + poppler的库(这是基于xpdf的)的PDF渲染库,可用于显示PDF文档。您搜索就行了。
⑦ 如何样用pdflib库读取pdf文件内的内容
PDFlib TET(文本内容提取工具包)是一款可以从任意PDF文档格式中可靠地提取文本信息的软件。它不仅可以作为一种库/控件,还可以一种命令行工具