楼下说的Delphi+那两个工具包应该是用来创建PDF文件。
楼主说的功能可以通过在pdf中加入Script来实现,比如附件的这个PDF文件,其中就有按钮结合Script用来动态的显示日历。
使用Adobe Acrobat可以给PDF添加Script,Adobe的官网有详细的说明。或者看下面这个网站的教程也行。
java">https://www.pdfscripting.com/
加进去的Script进行一般的文本编辑肯定是没问题,具体能不能连接数据库,就得仔细看看Adobe官网的解释了。
Ⅱ PDF解析模块-PDFMiner开发手册[翻译]
转 https://blog.csdn.net/robolinux/article/details/43318229
原文地址: http://euske.github.io/pdfminer/programming.html
软件版本:pdfminer-20140328
翻译:robolinux
时间:20150110
PDF格式不是规范格式. 尽管它被叫做"PDF文档", 但并不像word或者html文档。PDF的表现更像一张图片。PDF更像是在一张纸的各个准确的位置上把内容都摆放出来。大部分情况下,没有逻辑结构,比如句子或段落,并且不能自适应页面大小的调整。PDFMiner尝试通过猜测它们的布局来重建它们的结构,但是不保证一定能工作。我知道这样很难看,但是,PDF确实不够规范。
更多关于PDF内部结构的技术详情,请见《如何手工提取PDF内容》。
http://www.youtube.com/watch?v=k34wRxaxA_c http://www.youtube.com/watch?v=_A1M4OdNsiQ http://www.youtube.com/watch?v=sfV_7cWPgZE
由于PDF文件有如此大和复杂的结构,完整解析PDF文件很费时费力。好吧,大多数PDF工作中,很多模块是不需要加进来的。因此 PDFMiner 采用了一个懒惰分析的策略,就是只分析所需要的部分。解析时候,至少需要2个核心类,PDFParser 和 PDFDocument。这两个模块配合其他模块来使用。
PDFParser 从文件中获取数据
PDFDocument 存储文档数据结构到内存中
PDFPageInterpreter 解析page内容
PDFDevice 把解析到的内容转化为你需要的东西
PDFResourceManager存储共享资源,例如字体或图片
下图显示了PDFMiner中各个类之间的关系。
下面是解析pdf的一个典型方法:
布局分析把pdf文档中每一页返回为一个 LTPage 对象. 该对象包含该页面中的子对象,格式化为树形结构。
下图显示了这些对象之间的关系。
LTPage
代表一个完整的页面。可以包含子对象,例如LTTextBox,LTFigure,LTImage,LTRect,LTCurve和LTLine.
LTTextBox
它包含 LTTextLine 对象的列表
代表一组被包含在矩形区域中的文本
需要注意的是,该box是根据几何学分析得到的,并不一定准确地表现为该文本的逻辑范围
get_text()方法可以返回文本内容
LTTextLine
包含一个LTChar对象的列表,表现为单行文本
字符表现为一行或一列,取决于文本书写方式
get_text()方法返回文本内容
LTChar / LTAnno
代表一个在文本中的真实的字母,作为一个unicode字符串
LTChar 对象有真实的分隔符
LTAnno 对象没有,是虚拟分隔符,按照两个字符之间的关系,布局分析器插入虚拟分隔符
LTFigure
代表一个被PDF Form对象使用的区域
pdf form适用于目前的图表(present figures)或者页面中植入的另一个pdf文档图片。LTFigure对象可以递归
LTImage
代表一个图形对象。可以是JPEG或者其他格式,但PDFMiner目前没有花太多精力在图形对象上。
LTLine
代表一根直线。用来分割文本或图表(figures)。
LTRect
代表一个矩形。
用来框住别的图片或者图表。
LTCurve
代表一个贝塞尔曲线。
也可以从下面URL获得更多完整的示例。
http://denis.papathanasiou.org/?p=343
获得目录
PDF文档没有目录时会报:
raise PDFNoOutlines
pdfminer.pdfdocument.PDFNoOutlines
一些pdf文档使用页号作为目录指向,另外的文档则使用页号和页面中的物理位置。由于pdf文档没有逻辑结构,并且不支持从外部指向页内对象,所以没有办法准确告知这些目录指向文本的哪一部分。
你可以扩展PDFPageinterpreter类和PDFDevice类以便进行不同的加工,或者获得其他信息。
Ⅲ 《深入浅出MySQL数据库开发优化与管理维护第3版》pdf下载在线阅读全文,求百度网盘云资源
《深入浅出MySQL数据库开发优化与管理维护第3版》网络网盘pdf最新全集下载:
链接:https://pan..com/s/1AxoktD-VngFdL1vsIBS_mw
Ⅳ pdf格式,最先由哪个公司开发的
PDF格式是由Adobe公司提出的,目前的版本为1.7。并已申请成为ISO32000国际标准。
PDF全称Portable Document Format,是一种电子文件格式。这种文件格式与操作系统平台无关,也就是说,PDF文件不管是在Windows,Unix还是在苹果公司的Mac OS操作系统中都是通用的。这一特点使它成为在Internet上进行电子文档发行和数字化信息传播的理想文档格式。越来越多的电子图书、产品说明、公司文告、网络资料、电子邮件开始使用PDF格式文件。PDF格式文件目前已成为数字化信息事实上的一个工业标准。
Adobe公司设计PDF文件格式的目的是为了支持跨平台上的,多媒体集成的信息出版和发布,尤其是提供对网络信息发布的支持。为了达到此目的, PDF具有许多其他电子文档格式无法相比的优点。PDF文件格式可以将文字、字型、格式、颜色及独立于设备和分辨率的图形图像等封装在一个文件中。该格式文件还可以包含超文本链接、声音和动态影像等电子信息,支持特长文件,集成度和安全可靠性都较高。
PDF文件使用了工业标准的压缩算法,通常比PostScript文件小,易于传输与储存。它还是页独立的,一个PDF文件包含一个或多个“页”,可以单独处理各页,特别适合多处理器系统的工作。此外,一个PDF文件还包含文件中所使用的PDF格式版本,以及文件中一些重要结构的定位信息。正是由于 PDF文件的种种优点,它逐渐成为出版业中的新宠。
对普通读者而言,用PDF制作的电子书具有纸版书的质感和阅读效果,可以“逼真地”展现原书的原貌,而显示大小可任意调节,给读者提供了个性化的阅读方式。由于PDF文件可以不依赖操作系统的语言和字体及显示设备,阅读起来很方便。这些优点使读者能很快适应电子阅读与网上阅读,无疑有利于计算机与网络在日常生活中的普及。Adobe公司以PDF文件技术为核心,提供了一整套电子和网络出版解决方案,其中包括用于生成和阅读PDF文件的商业软件Acrobat和用于编辑制作PDF文件的Illustrator等。 Adobe还提供了用于阅读和打印亚洲文字,即中日韩文字所需的字型包。
Ⅳ 为什么有人开发PDF格式和CAJ格式
PDF格式和CAJ格式的优缺点不同,导致他们的使用者不同。
1、PDF的优点:
PDF支持特长文件,集成度和安全可靠性都较高;
PDF使用了工业标准的压缩算法,易于传输与储存;
用PDF制作的电子书具有纸版书的质感和阅读效果;
PDF可不依赖操作系统的语言和字体及显示设备。
2、PDF的缺点:难于编辑,格式太多变。
3、CAJ的优点:
打印效果可以达到与原版显示一致的程度。
4、CAJ的缺点:
需要用特定阅读器打开,使用不方便。
5、实际操作中中文字体的支持不同:
知网下载的pdf,用AdobeAcrobat打开后,字体是黑粗体,看不到重点,期刊文章本来是粗细分明、错落有致的,转成电子版caj文件后都消失了。
有的比如引号、冒号字符,总户排序混乱。用chrome打开这pdf后,黑粗体都变成了宋体,用SumatraPDF打开后,黑粗体都变成了仿宋,其实pdf文件就不存储字体信息,用AdobeAcrobat的编辑功能查看后,字体被回退到了AdobeStdHeitiRegular。
但是,粗黑体的 pdf,用 CAJViewer 打开时,有粗体有细体,有仿宋有楷体,都规规矩矩的,用了 pdf 的规范,却不遵守规范中字体的要求,从而使 cajviewer 才能正确地显示字体。
Ⅵ Java开发 Pdf 问题
推荐你目前最好的java做pdf的包 iText
http://www.itextpdf.com/
上面有详细的例子,至于你说的当数据中包含中文标点符号而产生的问题,这个我不清楚,还没用iText做过中文文档,你去尝试一下iText吧,可能你的问题能够迎刃而解。如果对iText感兴趣,我这还有书 iText in Action (Second Edition),英文pdf版,你要的话我也可以传给你。
Ⅶ 请人开发一款PDF阅读器需要多大的费用
据我所知,PDF软件方面做得比较好的公司有adobe和福昕,福昕到现在做了将近11年,但是跟adobe的兼容方面还是有一些小的问题,主要因为PDF格式标准有很多,并且adobe官方也在不断有一些新的东西加进来。所以你要做个非常简单的东西的话可以找福昕定制一个(前提是不跟他们的东西竞争),如果要自己请团队来做PDF阅读器,应该花不了太多钱,几十万应该能打住,想做的很好非常不容易。