导航:首页 > 编程语言 > php处理pdf

php处理pdf

发布时间:2022-09-11 04:41:50

⑴ 如何从php程序读取pdf文档中的文本信息

PHP程序pdf格式文件函数库

本函数库共有65个函数

PDF是Adobe所发展的可携式文件格式,它的文件可以在网络上传输、浏览,甚至使用印表机印出,或使用其它输出装置输出,都可以保存原来的文字及图片的编排。详细的信息可以参考 Adobe 的网站。参考其中有关 PDF 或 Acrobat 的部份。

在 UNIX 系统中,可以使用 Thomas Merz 开发的 PDF 函数库。将它编译安装完成后,再编译 PHP 程序方可供 PHP 使用 pdflib。编译时可能要 JPEG library 及 TIFF library。

除了用这个函数库可以建立 PDF 文件外,FastIO 公司发展的产品 ClibPDF 也可以处理 PDF 文件。

以下为处理 PDF 文件的范例,本例对 test.pdf 加工后等待用户读取。

<?php

$fp = fopen("test.pdf", "w");

$pdf = PDF_open($fp);

pdf_set_info_author($pdf, "Uwe Steinmann");

PDF_set_info_title($pdf, "Test for PHP wrapper of PDFlib 2.0");

PDF_set_info_author($pdf, "Name of Author");

pdf_set_info_creator($pdf, "See Author");

pdf_set_info_subject($pdf, "Testing");

PDF_begin_page($pdf, 595, 842);

PDF_add_outline($pdf, "Page 1");

pdf_set_font($pdf, "Times-Roman", 30, 4);

pdf_set_text_rendering($pdf, 1);

PDF_show_xy($pdf, "Times Roman outlined", 50, 750);

pdf_moveto($pdf, 50, 740);

pdf_lineto($pdf, 330, 740);

pdf_stroke($pdf);

PDF_end_page($pdf);

PDF_close($pdf);

fclose($fp);

echo "<A HREF=getpdf.php3>finished</A>";

?>

上例中的 gettest.php3 可能像下面的样子

<?php

$fp = fopen("test.pdf", "r");

header("Content-type: application/pdf");

fpassthru($fp);

fclose($fp);

?>

PDF_get_info: 返回文件信息。

PDF_set_info_creator: 配置建档者字符串。

PDF_set_info_title: 配置文件标题。

PDF_set_info_subject: 配置文件主题。

PDF_set_info_keywords: 配置文件的关键字。

PDF_set_info_author: 配置文件作者。

PDF_open: 建立新的 PDF 档。

PDF_close: 关闭 PDF 档。

PDF_begin_page: 启始 PDF 文件页面。

PDF_end_page: 关闭 PDF 文件页面。

PDF_show: 输出字符串到 PDF 文件。

PDF_show_xy: 输出字符串到指定坐标。

PDF_set_font: 配置使用的字型及大小。

PDF_set_leading: 配置行距。

PDF_set_text_rendering: 配置文字表现方式。

PDF_set_horiz_scaling: 配置文字水平间距。

PDF_set_text_rise: 配置文字高度。

PDF_set_text_matrix: 配置文字矩阵。

PDF_set_text_pos: 配置文字位置。

PDF_set_char_spacing: 配置字符间距。

PDF_set_word_spacing: 配置字间距。

PDF_continue_text: 输出文字。

PDF_stringwidth: 计算字符串的宽度。

PDF_save: 储存环境变量。

PDF_restore: 还原环境变量。

PDF_translate: 移动原点。

PDF_scale: 缩放类。

PDF_rotate: 旋转类。

PDF_setflat: 配置平滑值。

PDF_setlinejoin: 配置连接参数。

PDF_setlinecap: 配置 linecap 参数。

PDF_setmiterlimit: 配置斜边界限。

PDF_setlinewidth: 配置线宽。

PDF_setdash: 配置虚线样式。

PDF_moveto: 配置处理的坐标点。

PDF_curveto: 绘贝氏曲线。

PDF_lineto: 绘直线。

PDF_circle: 绘圆。

PDF_arc: 绘弧。

PDF_rect: 绘长方形。

PDF_closepath: 形成封闭的向量形状。

PDF_stroke: 沿向量绘线。

PDF_closepath_stroke: 形成封闭的向量形状并沿向量绘线。

PDF_fill: 填满目前的向量。

PDF_fill_stroke: 填满目前的向量并沿向量绘线。

PDF_closepath_fill_stroke: 形成封闭的向量形状沿向量绘线并填满。

PDF_endpath: 关闭目前向量。

PDF_clip: 组合所有向量。

PDF_setgray_fill: 指定填入的颜色为灰阶。

PDF_setgray_stroke: 指定绘图的颜色为灰阶。

PDF_setgray: 指定绘图的颜色为灰阶并填入。

PDF_setrgbcolor_fill: 指定填入的颜色为彩色。

PDF_setrgbcolor_stroke: 指定绘图的颜色为彩色。

PDF_setrgbcolor: 指定绘图的颜色为彩色并填入。

PDF_add_outline: 目前页面加入书签。

PDF_set_transition: 配置页的转换。

PDF_set_ration: 配置二页的切换时间。

PDF_open_gif: 打开 GIF 图档。

PDF_open_memory_image: 打开内存图档。

PDF_open_jpeg: 打开 JPEG 图档。

PDF_close_image: 关闭图档。

PDF_place_image: 放置图片到 PDF 档指定位置。

PDF_put_image: 放置图片到 PDF 档。

PDF_execute_image: 放置 PDF 档中图片到指定位置。

PDF_add_annotation: 加入注释。

⑵ 我想用PHP读取PDF文件的内容,尤其是现在很多的扫描后转为PDF的文件,请问怎么读

你可以从网上找一些为PHP语言编写的 pdf 扩展库,数量不少,比如:


PHP的PDF解析库 PdfParser


PdfParser 是一个标准的 PHP 库提供个用于从 PDF 文件中抽取数据的工具。它加载 PDF 文件并解析文件中对象、头和元数据,可抽取其中的文本信息,支持压缩的 PDF、MAC OS 罗马字符集编码、8进制和16进制编码。兼容 PSR-0 和 PSR-1。


示例代码:

$document=SmalotPdfParserDocument::parseFile('document.pdf');
$pages=$document->getPages();
$text=$pages[1]->getText();


PHP官方里也有一个对PDF支持的库 :PDFlib, 你可以根据自己的需要和喜好来使用。

⑶ 如何使用php修改pdf中的内容,并且保证格式不乱

诶,最终是找到一个不太令人满意的办法,客户端上传pdf改为docx,然后通过phpword中模板替换变量的方法去替换,最后在服务器端用libreoffice对docx进行PDF的转换,这样勉强能达到效果。感觉上php还是不太适合做这样的事情,如果要排版完全不乱,提交的docx文档必须是通过libreoffic编写的。还有就是微软的office是厉害,亲自试了一下,无论是libreoffice还是wps编写的docx,都能排版完好的转换为pdf。
到后盾人上去看看.你要的答案很多.都是一线教师亲自录制的.内容比较多

⑷ PHP生成PDF,用什么类库好

FPDF
FPDF
这个PHP
Class允许你采用纯PHP(更确切地说就是不需要使用PDFlib)来生成PDF文件。它所具有的特点包括:可选择的unit大小,页面格式和页边
距;页眉和页脚管理;自动分页;自动换行与文本自动对齐;支持JPEG与PNG图片格式;支持着色和文件超链接;支持TrueType,Type1与
encoding;支持页面压缩。
HTML2PDF
HTML2PDF能够把一个HTML文本转换成一个打印机友好的PDF文件。这个PHP脚本构建在FPDF
PHP脚本之上。
TCPDF
TCPDF是一个用于快速生成PDF文件的PHP5函数包。TCPDF基于FPDF进行扩展和改进。支持UTF-8,Unicode,HTML和
XHTML。
html2ps
html2ps
能够把带有图片,复杂表格(包含rowspan/colspan)
,layer/div和css样式的HTML转换成Postscript与PDF。
html2ps对CSS2.1支持非常好,并且很好地兼容不正确的HMTL。它甚至能够转换几乎是采用CSS设计的网站如msn.com。
HTML_ToPDF
HTML_ToPDF能够把任何HTML文档转换成在任何平台和打印机下界面格式都一样的PDF文档。它包括支持图片转换,使用样式表来定制PDF
文件和错误处理。
cPdfWriter
cPdfWriter是一个能够输出PDF文档的PHP5
class。基于TCPDF,FPDF和其它相关脚本。
dompdf
dompdf是一个HTML到PDF的转换工具。它的核心是一个遵循大部份CSS2.1样式的Rendering引擎。dompdf采用样式驱动,
它能够下载并读取外部样式,整个样式标签和单个HTML元素的样式属性。它同样支持目当大部份HTML属性。

⑸ 如何使用PHP创建和修改PDF文档

示例一:使用PHP生成一个简单的PDF文档

以下为引用的内容:
require_once('../config/lang/eng.php');
require_once('../tcpdf.php');

// create new PDF document
$pdf = new TCPDF(PDF_PAGE_ORIENTATION, PDF_UNIT, PDF_PAGE_FORMAT, true, 'UTF-8', false);

// set document information
$pdf->SetCreator(PDF_CREATOR);
$pdf->SetAuthor('Nicola Asuni');
$pdf->SetTitle('TCPDF Example 002');
$pdf->SetSubject('TCPDF Tutorial');
$pdf->SetKeywords('TCPDF, PDF, example, test, guide');

// remove default header/footer
$pdf->setPrintHeader(false);
$pdf->setPrintFooter(false);

// set default monospaced font
$pdf->SetDefaultMonospacedFont(PDF_FONT_MONOSPACED);

//set margins
$pdf->SetMargins(PDF_MARGIN_LEFT, PDF_MARGIN_TOP, PDF_MARGIN_RIGHT);

//set auto page breaks
$pdf->SetAutoPageBreak(TRUE, PDF_MARGIN_BOTTOM);

//set image scale factor
$pdf->setImageScale(PDF_IMAGE_SCALE_RATIO);

//set some language-dependent strings
$pdf->setLanguageArray($l);

// ---------------------------------------------------------

// set font
$pdf->SetFont('times', 'BI', 20);

⑹ 能用php对pdf文件进行解析吗

$fp=fopen("./static/pdf/pdf/Report.pdf","r");
header("Content-type:application/pdf");
fpassthru($fp);
fclose($fp);

这样可以直接看,不知道符不符合你的要求。

⑺ php处理PDF的扩展库如何使用

首先引入pdf扩展
然后下面这些方法 组合着用,就跟拼页面一样就可以啦,差什么放什么?不知道的结合下扩展文档或者试一下,不难的!
pdf->SetFont();
pdf->Cell();
pdf->writeHTML();
pdf->Image( 'foot.png');
pdf->AddPage();
pdf->output();
......

借花献佛

⑻ 如何使用php修改pdf中的内容,并且保证格式不乱

客户端上传pdf改为docx,然后通过phpword中模板替换变量的方法去替换,最后在服务器端用libreoffice对docx进行PDF的转换,这样勉强能达到效果,具体的内容你可以参考一下这篇文章http://www.php.cn/php-weizijiaocheng-103721.html对你应该会有帮助

⑼ php生成pdf 下载 同步还是异步

同步
首先需要安装wkhtmltopdf这个软件 需要执行shell_exec函数的php文件和安装的wkhtmltopdf.exe可执行文件在同一目录下,不然php找不到这个执行文件

shell_exec("wkhtmltopdf.exe --page-size A4 --outline 网页地址 pdf文件名");
--page-size 以A4纸的尺寸显示pdf内容
--outline 显示目录(网页中h1,h2来定)
网页地址 需要转成pdf的网页地址
pdf文件名 生成pdf的文件名,可以使用绝对路径

阅读全文

与php处理pdf相关的资料

热点内容
压缩因子定义 浏览:968
cd命令进不了c盘怎么办 浏览:214
药业公司招程序员吗 浏览:974
毛选pdf 浏览:659
linuxexecl函数 浏览:727
程序员异地恋结果 浏览:374
剖切的命令 浏览:229
干什么可以赚钱开我的世界服务器 浏览:290
php备案号 浏览:990
php视频水印 浏览:167
怎么追程序员的女生 浏览:487
空调外压缩机电容 浏览:79
怎么将安卓变成win 浏览:459
手机文件管理在哪儿新建文件夹 浏览:724
加密ts视频怎么合并 浏览:775
php如何写app接口 浏览:804
宇宙的琴弦pdf 浏览:396
js项目提成计算器程序员 浏览:944
pdf光子 浏览:834
自拍软件文件夹名称大全 浏览:328