① java 有关word,excel,pdf转换成html 有几种方式
java将Word/Excel/PDF文件转换成HTML整理
项目开发过程中,需求涉及到了各种文档转换为HTML或者网页易显示格式,现在将实现方式整理如下:
一、使用Jacob转换Word,Excel为HTML
“JACOB一个Java-COM中间件.通过这个组件你可以在Java应用程序中调用COM组件和Win32 libraries。”
首先下载Jacob包,JDK1.5以上需要使用Jacob1.9版本(JDK1.6尚未测试),与先前的Jacob1.7差别不大
1、将压缩包解压后,Jacob.jar添加到Libraries中;
2、将Jacob.dll放至“WINDOWS\SYSTEM32”下面。
需要注意的是:
【使用IDE启动Web服务器时,系统读取不到Jacob.dll,例如用MyEclipse启动Tomcat,就需要将dll文件到MyEclipse安装目录的“jre\bin”下面。
一般系统没有加载到Jacob.dll文件时,报错信息为:“java.lang.UnsatisfiedLinkError: no jacob in java.library.path”】
新建类:
1public class JacobUtil
2{
3 public static final int WORD_HTML = 8;
4
5 public static final int WORD_TXT = 7;
6
7 public static final int EXCEL_HTML = 44;
8
9 /** *//**
10 * WORD转HTML
11 * @param docfile WORD文件全路径
12 * @param htmlfile 转换后HTML存放路径
13 */
14 public static void wordToHtml(String docfile, String htmlfile)
15 {
16 ActiveXComponent app = new ActiveXComponent("Word.Application"); // 启动word
17 try
18 {
19 app.setProperty("Visible", new Variant(false));
20 Dispatch docs = app.getProperty("Documents").toDispatch();
21 Dispatch doc = Dispatch.invoke(
22 docs,
23 "Open",
24 Dispatch.Method,
25 new Object[] { docfile, new Variant(false),
26 new Variant(true) }, new int[1]).toDispatch();
27 Dispatch.invoke(doc, "SaveAs", Dispatch.Method, new Object[] {
28 htmlfile, new Variant(WORD_HTML) }, new int[1]);
29 Variant f = new Variant(false);
30 Dispatch.call(doc, "Close", f);
31 }
32 catch (Exception e)
33 {
34 e.printStackTrace();
35 }
36 finally
37 {
38 app.invoke("Quit", new Variant[] {});
39 }
40 }
41
42 /** *//**
43 * EXCEL转HTML
44 * @param xlsfile EXCEL文件全路径
45 * @param htmlfile 转换后HTML存放路径
46 */
47 public static void excelToHtml(String xlsfile, String htmlfile)
48 {
49 ActiveXComponent app = new ActiveXComponent("Excel.Application"); // 启动word
50 try
51 {
52 app.setProperty("Visible", new Variant(false));
53 Dispatch excels = app.getProperty("Workbooks").toDispatch();
54 Dispatch excel = Dispatch.invoke(
55 excels,
56 "Open",
57 Dispatch.Method,
58 new Object[] { xlsfile, new Variant(false),
59 new Variant(true) }, new int[1]).toDispatch();
60 Dispatch.invoke(excel, "SaveAs", Dispatch.Method, new Object[] {
61 htmlfile, new Variant(EXCEL_HTML) }, new int[1]);
62 Variant f = new Variant(false);
63 Dispatch.call(excel, "Close", f);
64 }
65 catch (Exception e)
66 {
67 e.printStackTrace();
68 }
69 finally
70 {
71 app.invoke("Quit", new Variant[] {});
72 }
73 }
74
75}
76
当时我在找转换控件时,发现网易也转载了一偏关于Jacob使用帮助,但其中出现了比较严重的错误:String htmlfile = "C:\\AA";
只指定到了文件夹一级,正确写法是String htmlfile = "C:\\AA\\xxx.html";
到此WORD/EXCEL转换HTML就已经差不多了,相信大家应该很清楚了:)
二、使用XPDF将PDF转换为HTML
1、下载xpdf最新版本,地址:http://www.foolabs.com/xpdf/download.html
我下载的是xpdf-3.02pl2-win32.zip
2、下载中文支持包
我下载的是xpdf-chinese-simplified.tar.gz
3、下载pdftohtml支持包
地址:http://sourceforge.net/projects/pdftohtml/
我下载的是:pdftohtml-0.39-win32.tar.gz
4、解压调试
1) 先将xpdf-3.02pl2-win32.zip解压,解压后的内容可根据需要进行删减,如果只需要转换为txt格式,其他的exe文件可以删除,只保留pdftotext.exe,以此类推;
2) 然后将xpdf-chinese-simplified.tar.gz解压到刚才xpdf-3.02pl2-win32.zip的解压目录;
3) 将pdftohtml-0.39-win32.tar.gz解压,pdftohtml.exe解压到xpdf-3.02pl2-win32.zip的解压目录;
4) 目录结构:
+---[X:\xpdf]
|-------各种转换用到的exe文件
|
|-------xpdfrc
|
+------[X:\xpdf\xpdf-chinese-simplified]
|
|
+-------很多转换时需要用到的字符文件
xpdfrc:此文件是用来声明转换字符集对应路径的文件
5) 修改xpdfrc文件(文件原名为sample-xpdfrc)
修改文件内容为:
Txt代码
#----- begin Chinese Simplified support package
cidToUnicode Adobe-GB1 xpdf-chinese-simplified\Adobe-GB1.cidToUnicode
unicodeMap ISO-2022-CN xpdf-chinese-simplified\ISO-2022-CN.unicodeMap
unicodeMap EUC-CN xpdf-chinese-simplified\EUC-CN.unicodeMap
unicodeMap GBK xpdf-chinese-simplified\GBK.unicodeMap
cMapDir Adobe-GB1 xpdf-chinese-simplified\CMap
toUnicodeDir xpdf-chinese-simplified\CMap
fontDir C:\WINDOWS\Fonts
displayCIDFontTT Adobe-GB1 C:\WINDOWS\Fonts\simhei.ttf
#----- end Chinese Simplified support package
6) 创建bat文件pdftohtml.bat(放置的路径不能包含空格)
内容为:
Txt代码
@echo off
set folderPath=%1
set filePath=%2
cd /d %folderPath%
pdftohtml -enc GBK %filePath%
exit
7) 创建类
JAVA代码
public class ConvertPdf
{
private static String INPUT_PATH;
private static String PROJECT_PATH;
public static void convertToHtml(String file, String project)
{
INPUT_PATH = file;
PROJECT_PATH = project;
if(checkContentType()==0)
{
toHtml();
}
}
private static int checkContentType()
{
String type = INPUT_PATH.substring(INPUT_PATH.lastIndexOf(".") + 1, INPUT_PATH.length())
.toLowerCase();
if (type.equals("pdf"))
return 0;
else
return 9;
}
private static void toHtml()
{
if(new File(INPUT_PATH).isFile())
{
try
{
String cmd = "cmd /c start X:\\pdftohtml.bat \"" + PROJECT_PATH + "\" \"" + INPUT_PATH + "\"";
Runtime.getRuntime().exec(cmd);
}
catch (IOException e)
{
e.printStackTrace();
}
}
}
}
② 《精通Spring2.xJavaWeb开发》pdf下载在线阅读,求百度网盘云资源
《精通Spring2.xJavaWeb开发》电子书网盘下载免费在线阅读
链接:
书名:精通Spring2.xJavaWeb开发
出版年份:2008-9
页数:371
内容介绍:
《精通Spring 2.x Java Web开发》按照从易到难、由浅入深、循序渐进的顺序介绍Spring,并使用大量的实例使读者更加深刻地理解所学习的知识,更好地进行开发实践。《精通Spring 2.x Java Web开发》深刻地揭示了Spring的技术内幕,对IOC、DI、AOP、事务管理等根基性的技术进行了深度的讲解。读者阅读《精通Spring 2.x Java Web开发》后,不但可以熟练使用Spring的各项功能,而且还能够对书中的实例举一反三。
③ java 生成pdf 怎么设置下划线
xunjiePDF编辑器工具-----选择“自定义工具栏”,选择想要显示的工具,然后可以拖动到菜单栏下方,方面以后或多次使用。
1、文字版PDF:清晰度比较高,文件小,可以单独选择复制每个文字,也可以选中具体的文字和段落,比较方便。
注释----选下划线类型,比如波浪线、下划直线、文本标注,选中想要划下划线的那些文字。
在下划线条区域,鼠标变成“黑三角",右键---属性,可以改变颜色,但好像不能改粗细,也不能保持默认。本人也纳闷。
2、扫描版PDF:网上这类文件居多,清晰度有好有坏,文件比较大,就是通过扫描上来的图片,不能选中,需要专门的文字识别软件,识别并导出文字word。
注释------绘图------在想要的文本下,画线条、椭圆等图形,在线条区域,右键---属性------可以改变颜色、粗细。 也可以进行文本标注
④ 各位大佬们,求《30天学通JAVA项目案例开发》pdf版
《30天学通JavaWeb项目案例开发》PDF下载 下载地址:密码:id7x 图书简介: Java是目前最流行、发展最快的编程语言之一,由于其开放,跨平台的特点,吸引了众多的开发人员与软件公司。同时在众多软件公司及有志之士的共同努力下,出现了许多优秀的开源框架,为Java语言在企业级开发领域注入了新的血液。 本书结合具体的项目案例向读者介绍了JavaEE开发的整个流程,本书共介绍了10个项目案例,涵盖了目前几个比较流行的开源框架,如Struts、Spring、Hibernate、JSF,同时还有用于分布式企业级开发的EJB技术,在项目的开发过程中,笔者还多次使用到了Ajax技术,以增强用户体验。在每一个项目案例的介绍中,笔者都是按照实际的开发步骤进行的,一个模块一个模块地进行介绍。对每一个项目的代码都进行了详细的介绍,对核心代码还进行了详细的代码注释,尽量让读者读懂代码中的每一行,每一个细节。 本书不仅仅是向读者介绍几个案例,更是为了让读者熟悉这些开源框架的使用,其中也包含了笔者很多的开发技巧与开发经验,因此对于JavaEE初学者及具有一定开发基础的编程人员,都是一本不错的参考书。
⑤ 《全端Web开发使用JavaScript与Java》pdf下载在线阅读,求百度网盘云资源
《全端Web开发》([美] Casimir Saternos)电子书网盘下载免费在线阅读
链接:https://pan..com/s/1Ux0B8FESzrScpjVWJMTazg
书名:全端Web开发
作者:[美] Casimir Saternos
译者:王群锋
豆瓣评分:6.5
出版社:人民邮电出版社
出版年份:2015-7
页数:220
内容简介:
JavaScript和Java这两大生态系统之间如何协同,成为所有Web开发人员共同面临的问题。本书应运而生,全面又简练地为读者展示了最新的C/S应用开发范式。本书以Java和JavaScript这两种最流行的服务器与客户端开发环境为例,全面讲解了最新的C/S应用开发范式。作者不仅讲解了很多实用的C/S开发架构,还通过各种实例进一步强化了读者的认知。
作者简介:
Casimir Staternos
是Synchronoss Technologies公司软件架构师,有十余年软件开发经验。曾在Java Magazine和Oracle Technology Network上发表过技术文章,可在Pluralsight(www.pluralsight.com)上观看他录制的Peepcode播客视频。他目前主要使用Java、Ruby等技术从事Web应用开发。
⑥ 用webservice接收pdf文件的二进制字符串,在java项目中如何把二进制字符串转换成pdf
JasperReports, 你可以上网查一下这个技术。我们现在做的项目就是应用这个技术的。用iReport生成一个.jasper模板文件,然后用java代码读取这个文件并向其中set值(读取jasper文件的方法你应该知道吧,就是利用java的io,比如用File:File reportFile = new File(reportFilePath);),然后再用jasperreporst封装好的方法(比如JasperExportManager.exportReportToPdfStream这个方法,当然,你需要先导入对应的jar包)生成最终生成的pdf文件中就含有java代码set进去的值了。由于正在做的项目包含这个技术,所以就给你讲讲,不明白的地方可以一起讨论。
⑦ JavaWEB2.0项目开发与实战和pdf书与视频谁有
JavaWeb2.0架构开发与项目实战(配光盘1张)
《JavaWeb2.0架构开发与项目实战》充满激情地介绍了各种Java主流开发技术以及这些技术的应用整合并在实践项目中如何利用这些技术开发大型Web项目。站在开发实践的角度,详细介绍了如何综合运用Struts2.1、Hibemate3、Spring2.5、EJB3、JSF、A4J、DWR/Dojo、等众多最眩的技术开发大型电子商务系统。涵盖Struts2.1最新的注解(Annotation)配置方式和Hibernate3.2的最新注解(Annotation)配置方式,并且将EJB3与Hibernate3.2的最新注解结合起来应用,这在国内外的同类图书中尚属首次。在《JavaWeb2.0架构开发与项目实战》中,通过两个极具实战价值的Web2.0项目(包括核磨李飞机零部件电子商务交易平台、网上定餐电子商务系统)直观而生动地展示了Java平台上与Ajax相关的各种技术的综合改迟运用,涉及Struts2.1、Hibernate3、Spring2、DWR、Doj0、A4J、JSF、EJB3、JMS等,每个项目都完整地讲解了从规划、设计到实现的全过程。《JavaWeb2.0架构开发与项目实战》还附赠42.个小时作者亲自录制的全程多媒体教学课程DVD,为读者快速有效地掌握《JavaWeb2.0架构开发与项目实战》内容提供了最佳捷径。
《JavaWeb2.0架构开发与项目实战》适合广大Java爱好者及程序开发人员,尤其适合那些希望尽快掌握JavaWeb2.0项目开发的人员阅读参考。
开发专家的企业级项目开发体验,基础应用+Ajax/Web2.0应用+SSH架构+JavaEE+项目实战。
42小时多媒体视频讲解,提供可移植使用的大型范例全部源代码
技术要点:
3个主流Ajax(A4J、Dojo、DWR)开源框架的应用详解;3个主流JavaWeb(SSH)开源框架的应用详解;主流JavaEE(EJB3、JMS、JSE)框架技术与应用详解;最新Struts2.1对Ajax及注解支持的整合开发;EJB3与Hibernate3.3的最新注解整合应用;全程实录两个源于实践的大型电子商务系统的开发。
基础应用篇介绍Java应用运行及开发环境的安装与配置、系统开发的版本控制AVN、系统文档设计系统WIKI-Confluence、BUG追踪系统JIRA、XML编程以及报表工具JasperReports的应用。
Ajax/Web2.0应用篇详细介绍游岩JavaScript的高级应用、AjaxL与Web2.0应用架构、A4J框架、DWR框架、Dojo框架。
SSH架构篇详细介绍Struts2.1框架、Struts2.1注解及应用整合、Sprin92框架、Hibernate3框架、SSH架构应用整合。
JavaEE篇详细介绍JavaEE架构技术、EJB3技术、JMS技术、实体Bean技术、JSF框架技术。
项目实战篇通过两个极具实战价值的大型电子商务系统直观而生动地展示了Java平台上与Ajax相关的各种技术的综合运用。
案例一:
通过完整的在线网上定餐系统讲解如何利用EJB3A4JJSF1.2技术开发Web2.0系统。
案例二:
通过一个电子商务交易平台讲解如何利用基于构架开发Web2.0电子商务系统。
源于实践,精于开发。
⑧ java怎么输出pdf格式的文件
java导出pdf需要用到iText库,iText是着名的开放源码的站点sourceforge一个项目,是用于生成PDF文档的一个java类库。通过iText不仅可以生成PDF或rtf
的文档,而且可以将XML、Html文件转化为PDF文件。
iText的安装非常方便,下载iText.jar文件后,只需要在系统的CLASSPATH中加入iText.jar的路径,在程序中就可以使用
iText类库了。
代码如下:
public class createPdf {
//自己做的一个简单例子,中间有图片之类的
//先建立Document对象:相对应的 这个版本的jar引入的是com.lowagie.text.Document
Document document = new Document(PageSize.A4, 36.0F, 36.0F, 36.0F, 36.0F);
public void getPDFdemo() throws DocumentException, IOException{
//这个导出用的是 iTextAsian.jar 和iText-2.1.3.jar 属于比较老的方法。 具体下在地址见:
//首先
//字体的定义:这里用的是自带的jar里面的字体
BaseFont bfChinese = BaseFont.createFont("STSong-Light", "UniGB-UCS2-H", false);
// 当然你也可以用你电脑里面带的字体库
//BaseFont bfChinese = BaseFont.createFont("C:/WINDOWS/Fonts/SIMSUN.TTC,1",BaseFont.IDENTITY_H, BaseFont.EMBEDDED);
//定义字体 注意在最新的包里面 颜色是封装的
Font fontChinese8 = new Font(bfChinese, 10.0F, 0, new Color(59, 54, 54));
//生成pdf的第一个步骤:
//保存本地指定路径
saveLocal();
document.open();
ByteArrayOutputStream ba = new ByteArrayOutputStream();
// PdfWriter writer = PdfWriter.getInstance(document, ba);
document.open();
//获取此编译的文件路径
String path = this.getClass().getClassLoader().getResource("").getPath();
//获取根路径
String filePath = path.substring(1, path.length()-15);
//获取图片路径 找到你需要往pdf上生成的图片
//这里根据自己的获取的路径写 只要找到图片位置就可以
String picPath = filePath +"\\WebContent" +"\\images\\";
//往PDF中添加段落
Paragraph pHeader = new Paragraph();
pHeader.add(new Paragraph(" 你要生成文字写这里", new Font(bfChinese, 8.0F, 1)));
//pHeader.add(new Paragraph("文字", 字体 可以自己写 也可以用fontChinese8 之前定义好的 );
document.add(pHeader);//在文档中加入你写的内容
//获取图片
Image img2 = Image.getInstance(picPath +"ccf-stamp-new.png");
//定义图片在文档中显示的绝对位置
img2.scaleAbsolute(137.0F, 140.0F);
img2.setAbsolutePosition(330.0F, 37.0F);
//将图片添加到文档中
document.add(img2);
//关闭文档
document.close();
/*//设置文档保存的文件名
response.setHeader("Content-
disposition", "attachment;filename=\""+ new String(("CCF会员资格确认
函.pdf").getBytes("GBK"),"ISO-8859-1") + "\"");
//设置类型
response.setContentType("application/pdf");
response.setContentLength(ba.size());
ServletOutputStream out = response.getOutputStream();
ba.writeTo(out);
out.flush();*/
}
public static void main(String[]args) throws DocumentException, IOException{
createPdf pdf= new createPdf();
pdf.getPDFdemo();
}
//指定一个文件进行保存 这里吧文件保存到D盘的text.pdf
public void saveLocal() throws IOException, DocumentException{
//直接生成PDF 制定生成到D盘test.pdf
File file = new File("D:\\text2.pdf");
file.createNewFile();
PdfWriter.getInstance(document, new FileOutputStream(file));
}
}