Ⅰ java解析pdf文件,求大神提供代码,请注意是java语言的
给你提供一个参考例子,你可以在这个例子上试试,修改修改。也是解析PDF的。
importjava.io.File;
importjava.io.FileOutputStream;
importjava.io.OutputStreamWriter;
importjava.io.Writer;
importjava.net.MalformedURLException;
importjava.net.URL;
importorg.apache.pdfbox.pdmodel.PDDocument;
importorg.apache.pdfbox.util.PDFTextStripper;
publicclassPdfReader{
publicvoidreadFdf(Stringfile)throwsException{
//是否排序
booleansort=false;
//pdf文件名
StringpdfFile=file;
//输入文本文件名称
StringtextFile=null;
//编码方式
Stringencoding="UTF-8";
//开始提取页数
intstartPage=1;
//结束提取页数
intendPage=Integer.MAX_VALUE;
//文件输入流,生成文本文件
Writeroutput=null;
//内存中存储的PDFDocument
PDDocumentdocument=null;
try{
try{
//首先当作一个URL来装载文件,如果得到异常再从本地文件系统//去装载文件
URLurl=newURL(pdfFile);
//注意参数已不是以前版本中的URL.而是File。
document=PDDocument.load(pdfFile);
//获取PDF的文件名
StringfileName=url.getFile();
//以原来PDF的名称来命名新产生的txt文件
if(fileName.length()>4){
FileoutputFile=newFile(fileName.substring(0,fileName
.length()-4)
+".txt");
textFile=outputFile.getName();
}
}catch(MalformedURLExceptione){
//如果作为URL装载得到异常则从文件系统装载
//注意参数已不是以前版本中的URL.而是File。
document=PDDocument.load(pdfFile);
if(pdfFile.length()>4){
textFile=pdfFile.substring(0,pdfFile.length()-4)
+".txt";
}
}
//文件输入流,写入文件倒textFile
output=newOutputStreamWriter(newFileOutputStream(textFile),
encoding);
//PDFTextStripper来提取文本
PDFTextStripperstripper=null;
stripper=newPDFTextStripper();
//设置是否排序
stripper.setSortByPosition(sort);
//设置起始页
stripper.setStartPage(startPage);
//设置结束页
stripper.setEndPage(endPage);
//调用PDFTextStripper的writeText提取并输出文本
stripper.writeText(document,output);
}finally{
if(output!=null){
//关闭输出流
output.close();
}
if(document!=null){
//关闭PDFDocument
document.close();
}
}
}
/**
*@paramargs
*/
publicstaticvoidmain(String[]args){
//TODOAuto-generatedmethodstub
PdfReaderpdfReader=newPdfReader();
try{
//取得E盘下的SpringGuide.pdf的内容
pdfReader.readFdf("d:\b.pdf");
}catch(Exceptione){
e.printStackTrace();
}
}
}
Ⅱ 利用java实现doc转换pdf
在日常工作中,Word凭借其广泛的应用和强大的功能,成为了不可或缺的文本编辑工具。然而,文件格式在不同软件或操作系统间的传输时,易出现格式不一致的问题,这无疑给用户带来了困扰。为了确保文件格式的稳定性,越来越多的人倾向于将Word文档转换为PDF格式。
对于单个Word文件转PDF,操作相对简单;然而,如果需要处理大量文件,如1000个Word文档,这个过程可能会变得繁琐,甚至触发用户的挫败感。此时,通过编程手段自动化转换就显得尤为重要。考虑到Apache poi和docx4j组件在文档处理上的优势,我决定采用docx4j来实现批量转换。
首先,我通过Maven下载了docx4j所需的依赖包,然后开始编写代码。尽管在转换过程中遇到一些小错误,但PDF文件的生成并未受影响,内容完整。只需添加一个for循环遍历所有文档,就能完成转换。然而,我注意到结果PDF数量少了一个,进一步检查发现,问题出在其中10个文档,它们是未加密的DOC格式,docx4j并不支持这类文件。
总结来说,虽然通过docx4j基本实现了批量转换,但在处理某些特定类型的Word文档时,遇到了兼容性问题。我正在探索可能的解决方案,或者寻找其他工具来解决这个问题,以确保所有文档都能顺利转换为PDF。如果你也遇到类似问题,或许可以共享一下你的经验和解决方法。
Ⅲ Java操作pdf表格数据
用Java简单的读取pdf文件中的数据:
第一步:下载PDFBox-0.7.2.jar。提供一个下载地址: http://pdfhome.hope.com.cn/Resource.aspx?CID=63844604-5253-4ae1-b023-258c9e324061&RID=20cd8f94-1cee-40b6-a3df-0ef024f8e0d2解压后,把lib文件下的PDFBox-0.7.2.jar,PDFBox-0.7.2-log4j.jar放到你classpath路径下。(我把源码以及jar包都放到下面的附件里,方面你的使用。)
第二步:写个简单的读取pdf文件的程序。(PdfReader.java)
import java.io.File;
import java.io.FileOutputStream;
import java.io.OutputStreamWriter;
import java.io.Writer;
import java.net.MalformedURLException;
import java.net.URL;
import org.pdfbox.pdmodel.PDDocument;
import org.pdfbox.util.PDFTextStripper;
public class PdfReader {
public void readFdf(String file) throws Exception {
// 是否排序
boolean sort = false;
// pdf文件名
String pdfFile = file;
// 输入文本文件名称
String textFile = null;
// 编码方式
String encoding = "UTF-8";
// 开始提取页数
int startPage = 1;
// 结束提取页数
int endPage = Integer.MAX_VALUE;
// 文件输入流,生成文本文件
Writer output = null;
// 内存中存储的PDF Document
PDDocument document = null;
try {
try {
// 首先当作一个URL来装载文件,如果得到异常再从本地文件系统//去装载文件
URL url = new URL(pdfFile);
//注意参数已不是以前版本中的URL.而是File。
document = PDDocument.load(pdfFile);
// 获取PDF的文件名
String fileName = url.getFile();
// 以原来PDF的名称来命名新产生的txt文件
if (fileName.length() > 4) {
File outputFile = new File(fileName.substring(0, fileName
.length() - 4)
+ ".txt");
textFile = outputFile.getName();
}
} catch (MalformedURLException e) {
// 如果作为URL装载得到异常则从文件系统装载
//注意参数已不是以前版本中的URL.而是File。
document = PDDocument.load(pdfFile);
if (pdfFile.length() > 4) {
textFile = pdfFile.substring(0, pdfFile.length() - 4)
+ ".txt";
}
}
// 文件输入流,写入文件倒textFile
output = new OutputStreamWriter(new FileOutputStream(textFile),
encoding);
// PDFTextStripper来提取文本
PDFTextStripper stripper = null;
stripper = new PDFTextStripper();
// 设置是否排序
stripper.setSortByPosition(sort);
// 设置起始页
stripper.setStartPage(startPage);
// 设置结束页
stripper.setEndPage(endPage);
// 调用PDFTextStripper的writeText提取并输出文本
stripper.writeText(document, output);
} finally {
if (output != null) {
// 关闭输出流
output.close();
}
if (document != null) {
// 关闭PDF Document
document.close();
}
}
}
/**
* @param args
*/
public static void main(String[] args) {
// TODO Auto-generated method stub
PdfReader pdfReader = new PdfReader();
try {
// 取得E盘下的SpringGuide.pdf的内容
pdfReader.readFdf("E:\\SpringGuide.pdf");
} catch (Exception e) {
e.printStackTrace();
}
}
}
这样就简单的完成了从pdf中读取数据了。在你的pdf文件所在的目录下生成一个同名的txt文件。
Ⅳ 《java从入门到精通》(第四版) pdf 谁能给传一个
Ⅳ 跪求!java编程思想第五版 pdf (高清的 不要扫描版
很多想学JAVA的小伙伴的一个问题就是我该如何入门?是啊,面对这样的问题我们该如何去做呢,这是摆在很多小伙伴面前的问题。我根据自己多年的编程经验为大家分享自己的看法。
1.看到过好多个这样的提问,其实我一般真的不那么容易分享自己的这点心得的,这是第一次回答这样的“推荐书籍”方面的问题。
我买编程方面的书籍,有一个非常清晰、坚决的原则——电子工业出版社的!
对于JAVA,建议你看如下的书:
首先,《21天学通JAVA》;
然后,《30天学通JAVA项目案例开发》(这本书的内容都是实例的,非常棒的实例!适合初学者的同时,又有实际应用性!)
以上的书籍,是基于你只想学J2SE的。
我还建议你主要攻J2EE方面的知识(在中国,J2SE要高手才能找到工作,而J2SE,只是菜鸟都很可能找到工作),至于J2EE方面的书籍:
首先,《21天学通JAVAWEB开发》
然后,《30天学通JAVAWEB项目开发》
以上都是本人确切的经验来的,绝对没有介绍错
2.我联合互联网上的一群大牛,组建了一个编程的免费学习群,你只需要来我们这个群里听就行,开头的的第一部分是:四二六.,位于中间的第二部分是:396,处于最后一部分的是:284。 这里有免费的学习资源,每天直播课程,不需要你付出什么,只需要有一颗学习的心就可以了。 不是想要学习的就不要加了。
3、动手去写去练
当然只看是很难学会的。我们需要搭建IDE环境来多练习才能完全掌握这些语法。编程学习没有捷径可走,只有入门快慢之分。要学会编程只有coding、coding最后还是coding。
送给那些懦弱的人们
A : 我是护士,我的专业就是护理。我做不了excel、做不了ppt、我学不会ps,好难,我不会写文章。
我: 我学习那么好,写字那么漂亮,编程也不错,ps也挺好、我还能打篮球、我会兵乓求、我会羽毛球、我会足球、我会设计、我会英文。(有的都是高二退学之后自己加强学习的,读书只给了我 算数、识字这些基本的的能力),我特么是神吗?
A : 人人都跟你一样?不是谁都能用很短的时间学很多的东西。
我 :我大概是神吧!你能少看一点 《爸爸去哪儿》、《额滴歌神啊》、《奔跑吧兄弟》吗,今天出了《爸爸去哪》,明天来个《女儿去哪》、《爷爷去哪儿》,你看得完?你能不能看点有用的东西?例如有点启发、让人学到东西的影片或者书?
A:委屈的瘪瘪嘴,那好,我要学习,给我买一本书吧,推荐一下。
我:书到了,学习 吧,一个月后我要看你的成绩。我来考考你
A:好难啊,我好困,我要看一会儿电视.....(然而没然后了....)
其实,这位A同学,极度的懦弱,并不是她不上进,只是那么的懦弱,那么的沉迷于垃圾节目、垃圾书籍,喜欢看不伦不类,不三不四的东西。不明白自己应该要什么,自己怎么做才能得到,认为自己的能力那么的差,做不到
B:大神,我要学node了,推荐一下node的书籍呗
我:恩,入门看一下《node于express开发》吧,然后看看node官网。还有一些博客什么的。当然了,你完全按照那本书,也能做出一些的东西了。最重要的是,要自己动手,去做东西,然后发现问题,解决问题。提升自己。
B:大神,除了那本书,还有别的书吗?
我:书很多,但书不在于多,而是,你能否理解了,并且能运用了?你看完了吗?
B:我感觉很难做,node好难。
我:做做项目,搜搜Google、看看github。
而今,我不知道这位同学水平到底到了什么水平,我想,应该不会太好,最终原因,我想是因为没有深入的去折腾,没有去写代码,没去发现自己的问题
其实,我们的潜力很大,我们能学的更好。我们能掌握的更多,但是许多人都做不到坚持、做不到深入。不肯思考,不肯的动手,是阻碍我们进步的最大原因。
后记:
人,应该要明确自己的目标,拥有理想。
人,重要的不是你站在哪里,而是你往哪个方向前进。
无论何时,不管你已经得到了多少,拥有了多少。都不是堕落的理由。
对于不肯上进,没意志力的人来说,等于是,你想死,任何人都救不了你!
感谢自己,感谢自己没有继续读大学。感谢自己在读书时代已经养成了独立思考,喜欢折腾的习惯。
Ⅵ 求一本书的pdf电子版,《Java开发入门及项目实战》,明日科技编着的
请下载附件吧,文件已给你上传,希望对你的研究有所帮助,文件较大,耐心下载,还望采纳答案
java学习路线图——Java开发入门及项目实战.pdf 明日科技编着 清华大学出版社 电子版下载
《Java开发入门及项目实战》清华大学出版社.pdf
说明:本书系统全面地介绍了使用Java语言进行编程的各种技术,从初学者的角度出发,科学合理地设计全书内容,是学习Java编程技术的完美教程。全书共分3篇18章,第1篇为入门篇,主要包括Java语言概述、Eclipse开发工具、Java语言基础、流程控制、数组、面向对象入门、面向对象进阶、字符串与包装类等内容;第2篇为提高篇,主要包括Java集合类框架、常用数学工具类、优雅地错误处理、输入/输出、枚举类型与泛型、Swing入门、多线程、网络通信、数据库操作等内容;第3篇为应用篇,介绍企业人事管理系统项目开发的全过程。
Ⅶ 跪求《Java面向对象程序设计》耿祥义 编(清华大学出版社) 电子书 ,【pdf】,【word】都行
免费下载地址:
http://ishare.iask.sina.com.cn/search.php?key=Java%C3%E6%CF%F2%B6%D4%CF%F3%B3%CC%D0%F2%C9%E8%BC%C6&from=index&format=
Ⅷ java创建pdf文件写入不进去
通常需要用到用于读、写、编辑PDF文件的库,你可以参考下面采用spire.pdf.jar来创建PDF的步骤及方法:
首先需要引入jar包。具体的引入方法可以自行网络搜索。
创建PdfDocument类的对象,并通过PdfDocument.getPages().add()方法添加页码。
定义标题文字。
创建PdfSolidBrush画刷、PdfTrueTypeFont字体、PdfStringFormat字符串、Rectangle2D等对象,用于指定字符串绘制效果、字体、格式、绘制区域等。
通过PdfPageBase.getCanvas().drawString(body, font2, brush2, rect, format2)方法将内容绘制到PDF页面。
下面附上详细的代码demo示例:
import com.spire.pdf.*;
import com.spire.pdf.graphics.*;
import java.awt.*;
import java.awt.geom.*;
import java.io.*;
public class CreatePdfDocumentInJava {
public static void main(String[] args) throws FileNotFoundException, IOException {
//创建PdfDocument对象
PdfDocument doc = new PdfDocument();
//添加一页
PdfPageBase page = doc.getPages().add();
//标题文字
String title = "Java基础语法";
//创建单色画刷对象
PdfSolidBrush brush1 = new PdfSolidBrush(new PdfRGBColor(Color.BLUE));
PdfSolidBrush brush2 = new PdfSolidBrush(new PdfRGBColor(Color.BLACK));
//创建TrueType字体对象
PdfTrueTypeFont font1 = new PdfTrueTypeFont(new Font("宋体", Font.PLAIN, 14), true);
PdfTrueTypeFont font2 = new PdfTrueTypeFont(new Font("宋体", Font.PLAIN, 10), true);
//创建PdfStringFormat对象
PdfStringFormat format1 = new PdfStringFormat();
format1.setAlignment(PdfTextAlignment.Center);//设置文字居中
//使用drawString方法绘制标题文字
page.getCanvas().drawString(title, font1, brush1, new Point2D.Float((float) page.getActualBounds(true).getWidth() / 2, 0), format1);
//从txt文件读取内容到字符串
String body = readFileToString("C:\Users\Administrator\Desktop\bodyText.txt");
//创建PdfStringFormat对象
PdfStringFormat format2 = new PdfStringFormat();
format2.setParagraphIndent(20);//设置段首缩进
//创建Rectangle2D对象
Rectangle2D.Float rect = new Rectangle2D.Float(0, 30, (float) page.getActualBounds(true).getWidth(), (float) page.getActualBounds(true).getHeight());
//使用drawString方法在矩形区域绘制主体文字
page.getCanvas().drawString(body, font2, brush2, rect, format2);
//保存到PDF文档
doc.saveToFile("ouput.pdf");
}
//自定义方法读取txt文件内容到字符串
private static String readFileToString(String filepath) throws FileNotFoundException, IOException {
StringBuilder sb = new StringBuilder();
String s = "";
BufferedReader br = new BufferedReader(new FileReader(filepath));
while ((s = br.readLine()) != null) {
sb.append(s + "
");
}
br.close();
String str = sb.toString();
return str;
}
}
Ⅸ 求JAVA编程思想第四版文字版的pdf(不要扫描版的)
Java编程思想第四版文字版pdf网络云链接:https://pan..com/s/1jKFxejr0JvQpFcIYaokFcw
Ⅹ 求 java核心技术第八版卷一高清PDF+源码