javahtml转化pdf_怎样用Java把html转为pdf

1. java使用什么工具可以把html页面转换成pdf文件，要支持中文的。

用这个jar 包 iText-5.0.6.jar
.........................................................................................

import com.itextpdf.text.Document;
import com.itextpdf.text.Font;
import com.itextpdf.text.Paragraph;
import com.itextpdf.text.pdf.BaseFont;
import com.itextpdf.text.pdf.PdfWriter;

public class PaperManager {

public static void buildPaper(IDao , OutputStream outputstream,
long paperid) {
Document document = new Document();

try {
PdfWriter.getInstance(document, outputstream);
document.open();
/** 开始添加内容 * */
BaseFont bfChinese = BaseFont.createFont("STSong-Light",
"UniGB-UCS2-H", BaseFont.NOT_EMBEDDED);
Font font1 = new Font(bfChinese, 16, Font.BOLD);
Font font2 = new Font(bfChinese, 14, Font.BOLD);
Font font3 = new Font(bfChinese, 12, Font.NORMAL);

Paragraph par = new Paragraph(“fdfd”, font1);
document.add(par);
par = new Paragraph(“中文”, font2);

} catch (Exception e) {
throw new RuntimeException(e);
} finally {
document.close();
}

}

}

2. Spring Boot - 将 html 页面转化为 pdf 文件

废话不多说，先看效果图。

本示例重要功能点：

技术栈：

进入 http://start.spring.io 创建 Spring Boot 项目，Spring Boot 版本为 2.7.0，选择如下依赖：

访问 http://localhost:9090/view 查看 html 页面效果。访问 http://localhost:9090/downloadPdf 下载 pdf 文件。

3. 如何将html页面转成pdf

1安装Adobe Acrobat后会默认在IE浏览器中添加PDF工具栏。
该工具可以方便的将网页转化成PDF文档，或者添加入已有的PDF文档，Adobe PDF Explorer工具栏则可以在IE的收藏夹界面内管理window内的HTML文档与PDF文档的转化。

2、安装单独的pdf虚拟打印机（pdffactory、ultra pdf等），通过网页的打印功能转换。

3使用客户端软件HTML2PDF_Pilot。
HTML2PDF_Pilot的截面如上图，很简洁。
如果只是要完成最简单的工作只需如箭头所示，点击上方的添加按钮添加HTML文档然后点击转换，稍等既可以完成一个HTML文档的转化工作。
两种方法的比较
灵活性：
PDF工具栏的方式相比客户端的方式要灵活许多。
在使用的过程中发现HTML2PDF_Pilot不能通过URL(网址)直接转化PDF文档，而工具栏只需在浏览的过程随意使用。
功能：在功能的环节上，客户端方式的HTML2PDF_Pilot就明显要比PDF工具栏要强大许多
工具栏只提供了最基本的保存和添加入已有文档的功能，而HTML2PDF_Pilot则提供了更为丰富的选项。
另外，如果需要批量转化网页文件的话，工具栏的方式也无法提供对应的功能。
其实还是有很多可以选择的方式，比如把网页转化为WORD的文件格式然后通过WPS软件来转化文档等，只要能灵活运用，html文件转PDF是非常简单的事情。

4. java将html文件转成pdf

核心代码如下
package com.hmkcode;
import java.io.FileNotFoundException;
import java.io.FileOutputStream;
import java.io.IOException;
import com.itextpdf.html2pdf.HtmlConverter;

public class App {
public static final String HTML = "<h1>Hello</h1>"
+ "<p>This was created using iText</p>"
+ "<a href='hmkcode.com'>hmkcode.com</a>";

public static void main( String[] args ) throws FileNotFoundException, IOException
{
HtmlConverter.convertToPdf(HTML, new FileOutputStream("string-to-pdf.pdf"));

System.out.println( "PDF Created!" );
}
}

5. java把html转成pdf文件

renderer.createPDF( os );捕捉下异常，看是不是跳走廊，在close之前调用os.flush()试试。

String docPath = session.getAttribute("docpath").toString();//获取文件HTML文件路径
String inputFile = docPath+"html"; //定义输入文件全名
String url = new File(inputFile).toURI().toURL().toString();
String outputFile =docPath + "pdf"; //定义输出文件全名
OutputStream os = new FileOutputStream(outputFile);
ITextRenderer renderer = new ITextRenderer(); 实例化一个ITextRenderer
renderer.setDocument(url);
ITextFontResolver fontResolver = renderer.getFontResolver();
ontResolver.addFont("C:/Windows/fonts/simsun.ttc",BaseFont.IDENTITY_H,BaseFont.NOT_EMBEDDED); //设置字体
// 解决图片的相对路径问题
renderer.getSharedContext().setBaseURL("file:/" + application.getRealPath("UserFiles/Image") + "/");
renderer.layout();
renderer.createPDF(os);
os.close();

6. 怎样用Java把html转为pdf

java中利用第三方jar包iText 5.4.2就可以实现html转为pdf。

比如有如下index.html文件：

<!DOCTYPE html PUBLIC "-//W3C//DTD HTML 4.01 Transitional//EN" "http://www.w3.org/TR/html4/loose.dtd">

<html>

<head>

</head>

<body>

<p>

<span class="itext">itext</span> 5.4.2 <span class="description"> converting HTML to PDF</span>

</p>

<table>

<tr>

<th class="label">Title</th>

<td>iText - Java HTML to PDF</td>

</tr>

<tr>

<td>http://hmkcode.com/itext-html-to-pdf-using-java</td>

</tr>

</table>

</body>

</html>

样式文件：

h1 {

color:#ccc;

}

table tr td{

text-align:center;

border:1px solid gray;

padding:4px;

}

table tr th{

background-color:#84C7FD;

color:#fff;

width:100px;

}

.itext{

color:#84C7FD;

font-weight:bold;

}

.description{

color:gray;

}

后台转换的接口：

package com.hmkcode;

import java.io.FileInputStream;

import java.io.FileOutputStream;

import java.io.IOException;

import com.itextpdf.text.Document;

import com.itextpdf.text.DocumentException;

import com.itextpdf.text.pdf.PdfWriter;

import com.itextpdf.tool.xml.XMLWorkerHelper;

public class App

{

public static void main( String[] args )throws DocumentException, IOException

{

// step 1

Document document =new Document();

// step 2

PdfWriter writer = PdfWriter.getInstance(document,new FileOutputStream("pdf.pdf"));

// step 3

document.open();

// step 4

XMLWorkerHelper.getInstance().parseXHtml(writer, document,

new FileInputStream("index.html"));

//step 5

document.close();

System.out.println("PDF Created!" );

}

转换结果：

7. java中html怎么转换为可编辑pdf文件

Java代码

//step1
Documentdocument=newDocument();
//step2
PdfWriterwriter=PdfWriter.getInstance(document,newFileOutputStream("pdf.pdf"));
//step3
document.open();
//step4
XMLWorkerHelper.getInstance().parseXHtml(writer,document,
newFileInputStream("index.html"));
//step5
document.close();

System.out.println("PDFCreated!");

Maven构建对应的版本

Xml代码

<dependency>
<groupId>com.itextpdf</groupId>
<artifactId>itextpdf</artifactId>
<version>5.4.2</version>
</dependency>
<dependency>
<groupId>com.itextpdf.tool</groupId>
<artifactId>xmlworker</artifactId>
<version>5.4.1</version>
</dependency>

8. java怎么把HTML界面做成pdf格式打印

public boolean convertHtmlToPdf(String inputFile, String outputFile)
throws Exception {

OutputStream os = new FileOutputStream(outputFile);
ITextRenderer renderer = new ITextRenderer();
String url = new File(inputFile).toURI().toURL().toString();

renderer.setDocument(url);

// 解决中文支持问题
ITextFontResolver fontResolver = renderer.getFontResolver();
fontResolver.addFont("C:/Windows/Fonts/SIMSUN.TTC", BaseFont.IDENTITY_H, BaseFont.NOT_EMBEDDED);
//解决图片的相对路径问题
renderer.getSharedContext().setBaseURL("file:/D:/");
renderer.layout();
renderer.createPDF(os);

os.flush();
os.close();
return true;
}

上面这段代码是这样的，输入一个HTML地址URL = inputFile，输入一个要输出的地址，就可以在输出的PDF地址中生成这个PDF。

9. java中html字符串如何完美转换成pdf文件

1、首先导入itext的jar包，
然后直接上代码
private static void versionsone(String htmlCode, String pdfPath){
Document document = new Document();
try{
StyleSheet st = new StyleSheet();
st.loadTagStyle("body", "leading", "16,0");
PdfWriter.getInstance(document, new FileOutputStream(pdfPath));
document.open();
BaseFont bfChinese = BaseFont.createFont("STSong-Light", "UniGB-UCS2-H", BaseFont.NOT_EMBEDDED);
Font FontChinese = new Font(bfChinese, 12, Font.NORMAL);
ArrayList<ArrayList> p = HTMLWorker.parseToList(dome_2(htmlCode), st);
for(int k=0;k<p.size();k++){
for(int m=0;m<p.get(k).size();m++){
Paragraph pCode = new Paragraph(p.get(k).get(m).toString(),FontChinese);
document.add(pCode);
}
}
}catch(Exception e){
e.printStackTrace();
}finally{
document.close();
}
}

private static Reader dome_2(String htmlCode){
if(htmlCode != null && !htmlCode.trim().equals("")){
try{
InputStream tInputStringStream = new ByteArrayInputStream(htmlCode.getBytes());
InputStreamReader isr = new InputStreamReader(tInputStringStream,"utf-8");
BufferedReader reader = new BufferedReader(isr);
return reader;
}catch(Exception e){
e.printStackTrace();
}

}
return null;
}
其实此处和别人的最大的不一样的是，
ArrayList<ArrayList> p = HTMLWorker.parseToList(dome_2(htmlCode), st);

其实刚刚开始我在网上找来的代码中是这样写的“ArrayList p = HTMLWorker.parseToList(dome_2(htmlCode), st);”
但后来我通过debug发现，ArrayList 里面装的还是一个集合，然后集合中放得才是真正不含html标签的字符串。对于普通得文章，一般html标签一般都是<p></p>
占大多数。所以我直接用了两层for循环直接从里面取得我们想要的字符串。然后直接“Paragraph pCode = new Paragraph(p.get(k).get(m).toString(),FontChinese);”document.add(pCode);这样就能解决中文问题了

10. 《html转pdf-----wkhtmltopdf踩坑总结》

最近公司给了个任务，差不多的流程就是接受json数据，然后最后生成图片。我想的办法是根据json数据生成html然后转成pdf。使用的语言是python。然后具体来说使用的工具就是使用python名为pdfkit的库去调用基于webkit的wkhtmltopdf。

目前来说html转pdf最主流的程序就是wkhtmltopdf，但是坑还是挺多的而且网上资源不是很丰富，所以写一篇踩坑总结。

##1. 无法读取本地文件

显示在html上好好的本地图片，到了pdf上就读取不出来，但是来源于网络（给一个url）的图片却能完美读出来。

后来发现，原来在上一个版本0.12.5是可以读取的，到了0.12.6不能读取了是因为其中的一个参数--enable-local-file-access变为了非默认。在python中改这个参数的方法是

然后再在后续调用wkhtmltopdf中加载这个option（我一开始想的是把value改成True，结果一直报错，吐了）

##2. 无法解析latex格式的公式

在html使用了MathJax提供的js去解析latex格式的数学公式，在html界面可以完美显示，但是到了pdf中就解析不了，然后我以为是没有添加'enable-javascript'的问题。结果加上之后还是不行。然后我发现又有一个参数叫做'no-stop-slow-scripts'的参数，可以等到js运行完毕之后再进行pdf的转化。结果还是不行。

然后我就在想会不会js在运行的时候出了什么问题，加上了'debug-javascripts'的参数。果然发现在调用MathJax提供的链接的时候发现这个链接已经过期了（我也不知道为啥过期了在html界面还能完美展示。。。），把js里的链接换成了

https://cdnjs.cloudflare.com/ajax/libs/mathjax/2.7.2/MathJax.js?config=TeX-AMS-MML_HTMLorMML

完美解决

##3. 部分css失效

css3中的flex全部失效，所以大家得换一下！

当时遇到了一个讲的很好的博客，给大家分享一下，然后再放一个官方文档的链接

博客：https://www.jianshu.com/p/4d65857ffe5e

官方文档：https://wkhtmltopdf.org/usage/wkhtmltopdf.txt

导航:首页 > 文档加密 > javahtml转化pdf

javahtml转化pdf

与javahtml转化pdf相关的资料