导航:首页 > 文档加密 > pdf发展前景

pdf发展前景

发布时间:2023-12-10 03:11:23

⑴ 双层pdf在地质资料数字化中的应用

郭慧锦 贾国锋 马飞飞 张茜

(全国地质资料馆)

摘要 本文在描述双层PDF及OCR技术特点及应用前景基础上,探讨了地质资料数字化图文数据双层PDF转换的意义;提出了转换方法的选择,并详细介绍了OCR数字加工系统,以及提高识别率的方法;最后提出了双层PDF在地质资料馆建设中的意义。

关键词 双层PDF OCR识别率

当前,地质资料馆藏机构都在加紧开展数字化工作。截至2013年底,全国已有20多个省级资料馆完成馆藏资料的数字化工作,全国地质资料馆的成果地质资料数字化工作也接近尾声,所形成的海量数据已成为地质资料信息社会化服务重要数据资源。此类数字化数据是静态的,有利于阅览使用,但无法进行全文检索,也不利于进一步分析处理。因此,在现有数据的基础上,开展OCR识别,使之转化成双PDF文件,实现静态向动态的转变,建立全文数据库,完成对地质资料的全文信息的检索,成为地质资料馆藏机构推进资料数字化工作。

1 关于双层 PDF与OCR技术

双层PDF是在扫描数据的基础上通过OCR识别生成的可检索的PDF文件,即上层是原始图像,下层是识别结果,且位置上下一一对应。双层PDF文件不仅可以100%保留原始版面效果,而且支持选择、复制、检索等功能,这样的PDF文件最后可以存储在光盘、硬盘或磁盘阵列中,并通过建立索引数据库进行科学的管理。

OCR(Optical Character Recognition),即光学字符识别,是指电子设备(如扫描仪或数码相机)检查纸上打印的字符,通过检测暗、亮的模式确定其形状,然后用字符识别方法将形状翻译成计算机文字的过程。即对文本资料进行扫描,然后对图像文件进行分析处理,获取文字及版面信息的过程。随着计算机网络飞速发展,信息电子化已经成为一个时代必然趋势。文字作为信息中最重要、最集中的载体,其电子化进程显得尤为重要。而OCR技术则是文字电子化过程中最重要的环节,它改变了传统的纸介质资料输入的概念。通过OCR技术,用户可以将通过摄像机、扫描仪等光学输入方式得到的报刊、书籍、文稿、表格等印刷品的图像信息转化为可以供计算机识别和处理的文本信息。因此,与传统的手工录入方式相比,OCR技术大大提高了人们进行资料存储、检索、加工的效率。

2 应用现状

PDF正在世界各国政府、金融财务、法律、工程技术、医疗等诸多部门获得广泛的应用,并已成为政府、学术部门等单位标准的现代化公文格式规范,所以PDF电子格式文档将是未来档案部门收藏的主体。而双层PDF的出现有效解决了识别成本和阅读利用的矛盾,是一种较有潜力的资源格式。国外的OCR技术应用相对成熟,包括IBM、Motorola、HP和Microsoft等世界性大公司都陆续展开了这方面的研究,在他们的产品中绑定了OCR技术。

如今,OCR技术在我国的应用也极为广泛。信息检索技术研究,即双层PDF检索技术研究,中国“863”计划在2008年以前已经开始对中文OCR、自动分词、自动摘要、自动搜索、自动定位进行了统一测试评测。在此基础上,国内逐步建立了以数字图书馆、数字档案馆、数字报刊、数字校园网等一系列数字化为基础的实施案例,例如新闻出版总署、外联部、共青团中央等机关文献全文数据库;《中国青年》75年、《新华文摘》20年等期刊全文数据库。国家图书馆早在1999年就成立了“国家图书馆文献数字化中心”,对各类馆藏文献进行数字化加工和OCR识别,在此基础上形成书目型书库、题录型数据库和全文型数据库三大类,逐渐成为我国网上信息资源的中心枢纽。

随着我国信息化建设全面普及,OCR技术的应用前景更加广阔,数字图书馆、数字档案馆、数字资料馆等概念的提出也使OCR在纸质档案数字化过程中越来越发挥其独特的作用,不仅节省了人力物力,更使档案信息资源的利用价值达到最大化,能够更好地服务于民。

3 数字化数据双层PDF转换的意义

3.1 是地质资料信息化建设的重要内容

随着社会信息化程度的提高,人们对信息资源的依赖程度也越来越高,对高效率的档案资源管理、检索利用的需求也越来越迫切。数字化是信息化建设的重要内容,而信息化建设的核心是资源建设。资源建设包括三大任务:一是馆藏纸质资料的扫描数字化与目录数据库建设;二是电子文件的归档与管理;三是全文数据库和全文检索体系建设。根据各资料馆数字化工作进展,考虑到用户的利用需求,若要得到真正文本形态的电子信息,使资料数字化工作更加有效,更加彻底,最大限度拓宽用户利用面,就需要应用OCR技术进行扫描栅格文件的双层PDF转换,进而开展地质资料全文数据库建设和全文检索工作。

3.2 是地质资料实现全文检索与全文数据库建设的前提

实践证明,基于双层PDF文档的全文检索,有效地提高了查询利用效率。它通过对档案数据库的数据和双层PDF文档的Text层建立索引,查询时可以不访问数据库,有效减轻数据库和系统的压力。至少可以支持1000万级的数据,毫秒级的查询时间,每秒上千人的并发访问,从而实现大容量、高速度的目标,并且可以适应Linux和Windows平台,支持多种数据库接口。它具备通用搜索引擎的构架和功能,可以对用户的输入进行分词,可以进行多关键字搜索、关键词组合搜索,用户友好;同时能够根据客户的需求进行用户的数据挖掘,提高档案全文检索系统的价值。

3.3 是现代化数据中心标准化建设的前提

建设现代化的数据中心首先要实现电子文件存储结构标准化,即建立一个通用性强、应用广泛的电子文件信息存储和交换格式。基于PDF格式已经作为电子文件管理中电子文件长期保存格式的最新标准在国际上全面实施,且具有兼容性、原始记录性强,安全控制策略完善等优点,是电子文件长期保存的最佳选择。所以进行馆藏数字化数据PDF转换势在必行。

4 双层PDF转换方法

4.1 目前常见的双层PDF转换方法

目前国内双层PDF的转换技术已经相对成熟,从现有技术条件下来看,大体可分为以下3种:

4.1.1 软件转换

由目前市场上较流行的 Adobe Acrobat、ABBYY FineReader12(中英文识别)、Readiris Corporate 12(英文识别率高)、Foxit Phantom 5(可以单独显示文本层)、清华文通TH-OCR XP8(识别率较高)、汉王文本王5800(版面识别较好,纯中文识别率高)、尚书七号OCR等转换程序,可以经OCR识别处理后直接生成双层PDF文件,速度快,效率高。但识别率和纸质资料原件(如印刷方式、清晰度、纸张质量等)及操作人员技术水平成正比。如果纸质原件质量好,识别率相对就高;质量差,识别率就相对较低。

4.1.2 流程加工

根据相关技术要求,对图像进行全新的OCR识别流程加工处理,重新生成PDF文件,具有文字正确率高、文字定位准确等特点。这种方式相当于全流程化制作双层PDF文件,工作量大,耗时长,费用高。

4.1.3 识别重构

重新生成PDF文件,实现版面字体、字号、颜色的恢复和重构。文字正确率高,页面清晰,但和原版图差异较大,主要在图书方面应用较多。

4.2 地质资料双层PDF转换

全国馆于2011年开始在扫描数字化基础上开展双层PDF的转换试验工作,主要运用第一种方法进行软件转换,即经过软件自动OCR处理后直接形成双层PDF文件。由于地质资料不同于普通的文书档案,纸张样式和印刷方式多样,手写和老旧资料多,地层、数学等特殊符号多等特点,给OCR自动识别带来了困难,单一的软件识别并不能满足全文检索90%以上识别率的要求。

在转换试验基础上我们得到以下结论:

1)地质资料本身多种多样,实际的识别率主要受印刷质量、形成年代等因素影响,老旧资料、纸质质量差的资料识别率普遍较低;受执笔人书写习惯及书写清晰度的影响,手写文档的识别准确率一般在30%以下;油印文档识别准确率一般在50%以下;打印、铅印和胶印文档识别率较高,一般能达90%以上。无论在哪种类型的文档中,标点的识别率都很低,地层和数学符号及其他特殊符号的识别率几乎为零。

2)目前识别技术无法达到100%识别,必须根据实际需求对照纸质档案对初次识别结果进行人工校对才能满足全文检索需求。

3)地质资料扫描文件数量多、容量大,转换速度受计算机反应速度影响,大批量转换和识别需选择高配置计算机,且批量转换和人工识别耗时长,耗人工多,需专项经费支持开展工作。

4.3 OCR数字加工系统的引入与功能简介

经过对目前国内双层PDF转换方法的对比,结合地质资料情况复杂的特点,以及数据测试结果研究,建议地质资料的双层PDF转换主要采用软件识别和流程加工相结合的方法,即采用OCR数字加工系统,可以保证高效率、高质量地完成双层PDF转换。该系统主要包含以下几个主要流程:

图1 OCR数字加工系统示意图

1)图像处理。为提高识别率,对图像进行“消蓝去污”的处理,去掉图像上影响识别率的噪音,如麻点、下划线等,由图像质量控制程序自动监测图像处理质量。

2)版面分析。自动进行版面理解并定位,判别划框区域是横排文本区、竖排文本区、表格区还是图像区,并对不同属性的区域以不同颜色的线框标识出来。自动版面分析在后台运行,操作人员可在前台进行确认,必要时对自动版面分析结果加入手工干预。

3)识别。把文字图像转化为计算机文字内码,可以识别印刷体和手写体中文(包括简体字和繁体字)、中英文混排文字、表格,识别出来的文字内码可以是GB码、BIG5码、GBK码或者Unicode码。识别过程在后台运行。

4)纵向校对。具有很强的查错纠错能力,是将一个或若干个图像中识别成同一个字的文字图像列在一起显示,并以突出颜色标出可疑字,便于操作员发现错误和修改。

5)横向校对。是传统的人工校对方法,操作员直接对比识别结果文本和图像,以发现识别错误文字。系统自动调出文字对应的图像,进行比对。同时,以醒目的颜色标出识别可信度不离的文字。

6)版面还原。将识别并修改好的文本还原成跟扫描文稿版面的布局一样、可以供计算机阅读和查询检索的RTF、PDF、HTML、SGML/XML格式的数字文档。

7)数据入库。版面还原数字文档的保存。

4.4 提立OCR识别率的方法

利用OCR数字加工系统生成的双层PDF,文本层差错率最低可到万分之一,可呈现原版底纹和色彩风貌,可进行全文检索和复制引用,且检索信息可准确定位到字符,便于快速查找目标信息。为了减轻横向校对即人工校对工作量,提高工作效率,就要从根本上提高识别率。经过试验,以下几个方法可以提高栅格文件OCR识别率。

1)图像色彩设定。虽然灰度或彩色模式可以最大限度还原纸质资料原貌,是我们扫描数字化的首选,但是这两种色彩模式会增大影响识别率的背景噪音。若仅做文字识别及一般黑白插图选取,建议可将扫描程序的图像色彩设定设置为黑白,增大识别率。不过最终图像色彩的设定还要按照各类具体工作的规范要求来设置。

2)分辨率设置。我们都知道扫描分辨率设置越低,扫描速度越快,但同时也导致图像质量差,其文字识别准确率低。反之分辨率高,扫描速度慢,但文字识别准确率高。但这又不是绝对的,因为分辨率设置得太高后,纸张上的微小瑕疵也可能被认作标点符号或汉字等,文字识别准确率反而会有所降低。经反复测试,分辨率设为300dpi,是扫描速度及文字识别准确率的最佳平衡点。

3)图像处理。这里图像处理是指扫描输出图像前的倾斜校正和去污等。倾斜校正是为了调整文字方向使之正向,这样才能对OCR识别有所帮助。

双层PDF转换完成以后,在此基础上可以实现资料管理系统与PDF文件的挂接,对资料数据内容及其元数据等相关信息建立联系并形成数据包;然后通过调用全文数据库原数据创建索引文件,最后实现全文检索。通过全文数据库及全文检索的实现,得到高查全率和查准率,大幅度提高地质资料的利用价值,促进地质资料编研工作,为地质资料信息聚合的研究和深层次服务奠定了基础。

参考文献

[1]许呈辰.档案数字化过程中OCR技术的应用[J].档案管理,2011(1).

[2]徐永芳.OCR技术在档案数字化过程中的应用[J].艺术科技,2011(2).

[3]张旋.OCR技术研究进展及前瞻[J].科学技术,2010(4).

[4]郭金光.双层PDF技术及在档案数字化中的应用[J].新观察,2013(1).

[5]刘家真.文件保存格式与PDF文档[J].档案学研究,2002(2).

⑵ 《走向21世纪中国经济的现状、问题和前景》pdf下载在线阅读,求百度网盘云资源

《走向21世纪》(帕金斯)电子书网盘下载免费在线阅读

资源链接:

链接:https://pan..com/s/1zWB7f74g9MLY77CbzfjJPQ

密码:1aeh

书名:走向21世纪

作者:帕金斯

译者:陈志标

出版社:江苏人民出版社

出版年份:1992

页数:296

内容简介:

走向21世纪的中国经济将面临哪些重要的问题,其前景如何?应该如何理解中国的经济体制?改革和发展对中国经济的运行带来了哪些深刻变化?本书收入美、澳、新加坡等国学者的论述,内容涉及中国经济发展与改革的各个方面,并探讨了市场化和发展战略、计划体制及城市化道路选择等问题,为我们开阔视野,提供了多方位的借鉴。

⑶ 电子签名行业有哪些企业,发展前景怎么样

原标题:2018年电子签名行业发展现状与市场竞争格局分析 头部企业将占据更多份额

市场规模持续快速增长

电子签名是指数据电文中以电子形式所含、所附用于识别签名人身份并表明签名人认可其中内容的数据。通俗点说,电子签名就是通过密码技术对电子文档的电子形式的签名,并非是书面签名的数字图像化。

近些年,我国电子商务和电子政务迅猛发展,由此带来的网络认证和安全问题显得日渐突出。由于缺乏统一的网上安全认证体系,解决网上交易出现的纠纷时,法律工作者调查取证、明辨是非显得异常困难。

电子签名的出现就是为解决电子商务和电子政务发展过程中的法律障碍,即电子文件的签字盖章问题。2004年8月,《中华人民共和国电子签名法》通过并于次年4月1日起施行,该法首次赋予电子签名与文本签名同等的法律效力,明确了电子认证服务的市场准入制度,为网上信息传递和电子交易的安全提供了法律保障。



更多数据参考前瞻产业研究院发布的《中国电子认证服务业市场需求预测与投资战略规划分析报告》。

⑷ 电子书市场的发展历程是怎么样的

从竹简到丝帛,从线装到装订,历次阅读革命始终没有脱离书籍的本质。在互联网时代,电子书将阅读从纸张转向了屏幕,由此带来的变革大有颠覆传统阅读之势。

用户眼中的电子书

与2003年相比,2005年您购买图书的数量?

您是否会以纸书价格的60%购买保真电子书?

您会选择购买哪种电子书阅读器(单选)?

拥有专用阅读器后,您买纸书多还是电子书多?

您购买保真电子书的最主要原因(多选)?

如果您需要某本书,会从哪些渠道获取(多选)?

有哪类图书,您会更想阅读电子书,而非纸书?

拥有阅读器后,您喜欢怎样购买电子书(单选)?

在互联网时代,电子书、去网上书店买书、通过数字图书馆借书、手机上看书等新兴事物已经为人们的阅读打开了更多便捷之门。网上书店、电子书等新服务的出现给读者带来了怎样的影响?传统书店与网上书店到底有什么不同之处?读者阅读和购买行为又有怎样的偏好和趋向?

在《中国计算机报》联合方正电子展开的“2006互联网时代读者阅读情况调查”中,这些问题有了明确答案。此次调查随机选择2005年在传统书店和网上购买一本书以上的读者(14岁以上)进行问卷调查。从回收的4140份有效问卷显示结果来看,不难得出这样几个重要结论。

解读一:读者未来会购买更多图书

数据调查显示,与2003年相比,有44%的读者在2005年购买了更多图书,有33%读者的购买数量保持不变。绝大多数读者购买图书会保持不变或者增长,这样的规模对所有出版商来说都是一个利好消息。这里调查的图书购买,既包括传统纸质图书,也包括电子出版物。

解读二:从互联网获取图书的读者过半数

读者获取图书的首要渠道还是去图书馆借书,还有31%的读者选择购买图书。在买书的时候有32%选择了到网络书店去买纸质的图书。其中,有个重要数据是网站读书频道的阅读图书数据增长22%,这也是读书消费模式的改变,现在有越来越多的读者选择网上在线浏览。同时上网络书店买纸书、网上购买和借阅保真电子书、网络下载免费图书等形式也得到读者认可。目前,互联网已经成为六成读者获取图书的渠道。

解读三:读者真正购买的是书的内容

调查数据显示,可以在电脑上阅读、复制和粘贴成为读者购买电子书的主要原因,这个结论说明了其实书的形态不再是最重要的,读者愿意去看和复制,是因为书的内容有价值,读者真正购买的是书的内容。数据再次印证了消费者未来选择电子书是一个必然趋势,同时也可以看到工具书和休闲期刊占有最大比例。

解读四:专业阅读器对读者买书有促进作用

在专用阅读器的购买对象方面,有38%的读者倾向于购买经济型阅读器。同时,也有近三成读者拒绝购买专用阅读器,这对未来出版电子图书如何选择格式或出版印刷跨平台的兼容模式提出了新挑战。

而拥有专用阅读器后,有44%的读者选择到网上搜索各电子书网站进行下载,这预示着未来电子出版和网站合作将成为重要命题;倾向于到定点网站上下载的会员比例也接近三分之一。而在按张打印的调查中,有78%的读者都不需要,打印成本较高可能是导致这一状况的主要原因。

电子纸:未来的阅读会这样

为什么人们还是习惯于白纸黑字的纸质阅读?主要是因为纸质媒体在环境光下阅读,实现了高亮度,同时反差也大,实现了高分辨率,并且还能实现180度的视角。而且,纸张还有手持时可弯曲、文字不会很快消失等优点。所以很多人都有这样的经历,对于一些篇幅较长的文件要打印出来阅读。

人们的习惯也意味着数字出版面临的一大挑战,就是需要有一个拥有纸质阅读一样舒适效果的阅读器,然而液晶显示屏却是不能代替纸读物的。从阅读舒适度来看,电脑屏幕与纸张相比实在是差别很大:液晶屏需要用背景灯,长时间阅读容易让眼睛感觉疲劳;而电子书阅读器通常使用反射型液晶屏,反差程度低,亮度上感觉不够好。

电子纸就是解决以上矛盾的一种选择,这种利用电子装置显示,而且具有像纸张一样的高可视性的“电子纸张”能够尽可能模拟传统纸质的功能和阅读体验。与传统纸张相比,电子纸最大的特点就是内容不固定,它是可以随意存取、反复使用的。在电子纸上反复写入信息有两种方式,一种是手写输入,另一种是通过网络下载刷新内容。它比PDA更轻便,可随意折叠;比笔记本电脑更便携,操作也更简单。只要带一张电子纸,无论在什么地方,都能像电脑上网那样,通过网络下载、查阅大量信息。而且因为电子纸显示几乎和真的纸张一样清晰稳定,也不会造成眼睛疲劳。

目前正在开发的电子纸张可单色显示静态图像,其目标就是为了取代纸张显示。电子纸背景的纯白度和文字的清晰度非常高,对比度有的甚至超过了报纸。在易用性方面,电子纸也已经多少能够弯曲了。为了迎合人们的阅读习惯,电子纸甚至已经可以做得和真的纸张有差不多的薄厚和外观。它具有超薄、像印刷物一样的质感、关闭电源后仍保持显示状态的记忆特性,而且由于属于不需背照灯的反射方式,因此不需要一直通电,也能将内容显示得清清楚楚。

试想这样一款新型电子纸阅读器,不足半毫米厚,还能轻轻弯曲,平时可藏在手机内,要阅读时拉出即可。而且它更大的优势在于数字媒体容量大、便于检索,这样的使用前景是很诱人的。

目前实现电子纸的技术还采用电泳显示,分别带正电和负电的白色颗粒和黑色颗粒在透明液体中运动,通过不同电压决定浮到表面的是白色或黑色颗粒。当环境光照射时,所有环境光都会被散射或反射回来。通过加大电压,呈现墨水的感觉。这是简单的黑白显示器,能实现甚至超过传统纸字的高分辨率,而且分辨率不是由材料本身决定的,是由后面驱动板决定的。

现在的电子纸技术正在从黑白走向彩色,实现可弯曲化,并使电子纸具备交互性。未来我们不仅可以看到随身携带的电子报纸,可折叠的电子书、电子速记本等都将出现在我们的身边。

黑白电子纸目前已经实现了产业化,并且拥有传统纸媒体的特征。2004年,飞利浦进行了驱动器的集成、系统等工作,并把相应成果在2004年推向市场。

目前的发展趋势主要是电子阅读的需求日益增长。人们获取信息的需求以及要求增强了。电子纸阅读器将会给人们生活带来很大影响:阅读材料随时在身边,及时收到最新报刊,像纸一样舒适的阅读,不需要带很重的书包,下载方便……而且除了阅读以外,还可以支持手写。

电子纸技术的应用也会带来很多社会影响,首先是降低纸张使用,减少树木使用量;其次是发行运输费用将大幅减少;第三,电子纸的放大功能也使它更适合老年人和残疾人阅读。

可以想象,数字化生活将会因为电子纸的普及翻开崭新一页。

让电子纸更接近纸张

为了避免电子显示方式的缺陷,也为了迎合人的阅读习惯,电子纸必须具备三个条件:首先是文字便于阅读,要让人觉得是在纯白的纸上阅读,纯白度越高背景越白文字就越清楚;其次是能够实现关闭电源继续显示,因为真正阅读的时候,可能会需要一个页面保持一定的显示时间;第三是显示器的超轻薄和可折叠,使之接近于纸张。

要实现这些条件,科学家们认为,应该朝三个方向努力。一是实现现有显示器的超轻薄和可折叠;二是使用打印机和提高纸张打印技术,例如目前正在研究在纸张上涂上特殊的液体,从而使之成为能够多次改写的纸张;三是提高能够复制发光画面信息的复制技术。

Apabi:未来的出版会这样

本是“传统出版+网络技术”产生了图书网络出版,但二者却并非是简单叠加。网络技术对传统出版的改造正在进行。作为产业链条上游环节的网络出版技术服务商,能提供的技术先进程度如何,直接决定其他环节的竞争力强弱。

2000年前后,随着计算机与互联网技术在各领域的广泛应用,读者对于网络阅读以及从网上检索图书信息的需求日益显着。同时,图书馆也开始有计划地建设数字图书馆,利用电子资源为读者提供服务。这一系列变化促动了出版社与IT技术提供商合作开展网络出版,中国的电子书产业开始萌生。

在随后一年多里,方正依据国际OEB标准,成功研发了方正Apabi网络出版整体解决方案。目前,方正Apabi已成为领先的电子书传播平台之一。这都建立在方正Apabi两项核心技术基础之上:CEB(版式文件)技术和DRM(数字版权保护)技术。

CEB(版式文件)处理技术能够将各种格式的文件原版原式地转化成统一格式,在转换中真实地保持了原有文件中文字、图表、公式、色彩等版式和信息,实现高保真的显示效果。CEB格式数据量小,利于传输。CEB技术完全符合OEB标准。数字版权保护技术以一定的计算方法,实现对数字内容的保护,防止数字内容的非授权复制,最终用户必须得到授权后才能使用数字内容。方正Apabi DRM对电子书、电子报纸、电子杂志、电子文档等数字内容进行保护,实现数字内容的可控二次传播,使数字内容使用过程可控、可跟踪。

与此同时,出版社在向互联网时代的内容服务提供商转型的过程中,也在寻求与IT技术厂商合作,拓展网络出版。如高等教育出版社、机械工业出版社、清华大学出版社等。

方正Apabi因为拥有电子书出版传播技术及平台,最终成为这些出版“大腕”的合作伙伴。方正通过协议形式获得出版社的书面授权,并取得作者授权,保证了方正推出的每本Apabi电子书的“正版”。

作为网络时代的智能知识库的数字图书馆,目前已经得到普遍应用。方正与出版社推出的电子书成为这些数字图书馆的重要数字资源。目前,北京大学图书馆、清华大学图书馆等全国520多家高校图书馆,首都图书馆、上海市图书馆等全国80%以上的省级图书馆及清华附中等1100多家中小学都在应用Apabi电子书或建成方正Apabi数字图书馆。

方正Apabi五大产品系列

1.方正Apabi制作出版软件

方正阿帕比制作出版软件,包括两个部分,即阿帕比转换软件和阿帕比编辑软件。前者是数据转换工具,可以把用于印刷的电子文档,转换为可阅读的电子书文件CEB。后者可以对CEB文件建立目录连接,还可以制作eBook的元数据信息。

2.方正Apabi安全发行软件

经过阿帕比制作出版软件生成的CEB文件,可以提交到该软件,自动对提交的CEB文件进行加密,保护电子书的版权,并管理相应元数据。

3.方正Apabi交易处理软件

该软件为网上书店提供eBook交易平台,网上书店可以通过该软件得到eBook下载许可证,并发给读者。

4.方正Apabi数字图书系统

图书馆可以从出版社或发行者批量或单独购买具有版权保护的eBook;读者通过数字图书馆进行eBook的借、还书。

5.方正Apabi阅读软件

可以阅读CEB、XEB、PDF、HTML、TXT和OEB等文件,实现了读者购买的电子书与机器硬件的信息绑定。

互联网:传统书店的新商机

网络无处不在,其中蕴含着巨大商机,图书批发和零售业也面临着新发展。传统图书销售业该如何利用好互联网呢?我认为,就是要快速发展电子商务,借助网络优势来扩大销售,抢占新市场。

图书零售要电子商务化

开拓网上交易,正成为一股不可阻挡的潮流,人们也正在逐步地接受这种网络营销的模式。图书电子商务网站的发展也是一种必然趋势。图书是最易实现电子商务的商品,作为图书零售领域的电子商务网站,更是集易于推广、易于被公众所认知、货品流转快、资金易回笼等特点于一身,图书的网络营销发展前景非常看好。

然而在目前图书类网站中,传统书店所占的份额可以说极其微小。非传统书店的网站却占据网上图书销售的大部分。在传统书业里,各大书店也都在积极地筹建和运作自己的网上书店。但作为传统书店,虽然对图书经营非常熟悉,但在电子商务运作方面经验不多,技术水平有限,很难有大的作为。

面对巨大商机,传统书店的电子商务网站发展取决于两方面因素,一是时间,二是投入。作为传统书店,最大的优势就是有实体店面、品种齐全、供货渠道通畅以及物流配送体系的快速高效。而一些非传统书店由于没有实体依托,在信誉、备货上存在着一定瓶颈,这正是给传统书店的未来留下了发展机遇。

提高知名度 创造新商机

利用互联网,传统书店可以做很多事情。比如公布书店信息,塑造企业形象,提高公司的知名度;发布营销活动、店面布局、地址、电话及路线;增进与读者沟通互动,及时展开各种调查回馈;展示新品,引导读者购买等。

以中关村图书大厦为例,网站开通两年时间,流量也迅速攀升。目前日页面访问量为4万次,独立IP访问量近1万个。统计结果显示,上网购买的群体大多为白领和文化人士以及学生,这部分人群有上网习惯和购买力。

在充分利用网络资源的基础上,去年中关村图书大厦与北大方正电子合作,将店面导购的功能和在线阅读引入网站,这样不仅丰富了网站内容,同时将店内图书利用方正网络展示给读者。使读者足不出户就能查阅图书,并有效引导读者来店购买。

传统书店充分利用互联网资源,准确把握商业机会,吸引更多网民到店购书,迎回更多读者是传统书店立命的关键。

(中关村图书大厦总经理孟凡洪)

电子书漫谈

狭义电子书指的是手持阅读设备,现在广义上把数字化的纸书称为ebook。

电子书给人们带来很多新的体验:首先是电子书可以提供详细的索引和全文检索功能,可以让读者快速、准确、轻松地找到所需部分;其次,电子书不仅保持纸书的原版原式,同时还可以附带音频、视频等多媒体内容,增加更多体验,提高学习效果;第三,每本电子书所占的存储空间很小,约为4M左右,一张DVD光盘就可以储存近千本图书,不仅节约了图书馆空间,而且方便用户携带;第四,电子书内容不易遭到破坏,有利于资料的永久保存。

数字图书馆引发阅读高潮

我们重视数字图书馆的发展,除了因为它代表先进技术之外,更重要的是它可以有针对地弥补所需。

回顾清华大学附属中学的图书馆,从过去的一间图书室发展到现在有多间独立馆舍。个人感觉最明显的特点可以概括为一多、二老、三少。一多是指我们的旧书多;二老是指我们的人员知识结构老化,以及设备、馆舍和电子设备比较老化;三少是指馆舍少、资金少、人员数量少,多数馆都是3~5人。而信息部门资金少则是遗留问题了,图书馆基本上是只有投入、没有产出的部门。虽然这种情况目前经过各种评估已经得到一定改善,但并非一朝一夕能见效的,我们认为数字图书馆对我们改变现状有一定帮助。

首先是电子图书的价格比较低,从资金上可以弥补图书馆资金缺少的缺陷。其次是方正数字图书馆多数采用的是中图法的分类,我们的工作人员就不用再重复工作,只要把购买拷贝就完成了,非常方便。再有就是拷贝的电子书占用的是虚拟空间,不用占用馆舍的实际空间。任何一个图书馆也不能做到24小时开馆,可是数字图书馆建成了,学生连接网络就可以使用我们的图书馆,这样就利用数字图书馆摆脱了时间和地域的限制。

就清华附中来说,去年开通了数字图书馆,正式使用到现在有半年时间。我们在开通后发布了消息,指导学生使用。现在我们的热门书的比例大概占到了3%到4%,当时购买的是18000种,我们的副本是1本,预约次数是79人次、续借人数是74人次,这个在热门书里占到了10%。我们的登陆在线浏览的人次是4518次,下载是680多次,导航次数是11000多次,而这还只是在网上发布通知,没有大规模宣传。在使用中,我们发现这样一种现象,每隔一两个月在网上发布一次消息,每次发布都会引起一次使用小高潮,学生和家长就会前来咨询。

我们下一步的打算是,与方正一起对老师和学生分别进行培训,教师培训还没有开始,学生已经进行了一次小范围的培训。在每个班级我们都选出一名图书委员,负责图书馆和学生之间的沟通,这一次我们就利用这个图书委员对数字图书的推广工作进行了一下带动,学生对使用数字图书馆热情很高。我们同时也取得了学校其他部门的支持,比如我们同方正合作制作了应用短片,学校电教会不定期播放来加深学生印象。对于中小学来说,数字图书馆将来会是很有前途的一项工作。

电子书发展的四大趋势

趋势一:纸质书和电子书将多元并存

今天更多的电子书是在PC机、笔记本电脑上阅读,而接下来移动电子书和手持设备将会迅速发展;随着技术成熟,同时生产成本降低,有图像甚至有动画的多媒体电子书也将日渐流行。而按需印刷则和按页打印仍然有着旺盛生命力,尤其是一些学术类书籍。

对于阅读器来说,2006年是在中国发展的一个重要转折点,在中国将至少有4款阅读器步入实用,以解决屏幕阅读不适的问题。这些阅读器的共同特点是显示阅读质量接近纸质,外观精美,同时价格段涵盖了从1000元到6000元,能满足不同层次的用户需求。

趋势二:图书馆和大众市场互为促进

通过图书馆市场,培育了大量熟悉电子书的读者。图书馆的最终读者是大众,不管是学生、老师,还是政府官员都是大众,这样一来大众市场对电子书的了解增加,一定会逐渐启动。反过来大众读者对电子书的强劲需求,又会成为图书馆建设电子书的动力,图书馆和大众市场将互为促进。

趋势三:出版社推进网络出版

成立专职机构推进网络出版机制的出版社日渐增多。据统计,基本形成网络出版机制的出版社在2003年是6家,2005年为45家,预计2006年会达到80家,2007年将达到180家。

在推进机制建设中,有三个核心要素:专职部门或人员负责;制订年度出版计划,包括数量、出版时间、预期收益;与社内考核机制挂钩。在这三项当中,专职的部门和人员负责是核心要素。

趋势四:e纸一体化

“e书亦书”,这是书业定位于内容服务提供商的自然结论。在具体产品开发和经营中,电子书和纸书如果一体化运作会产生新的商机。针对“e纸一体化”的趋势,以电子书和互联网为技术的“图书营销联盟”日前宣告成立。联盟定位就是由北大方正Apabi与全国知名出版社、书店和网站共同打造立体化的图书信息网络,旨在帮助读者在任何时间和地点方便地获取图书。

电子书这样读

电子书阅读的终端设备很多,比如图中的笔记本电脑、PDA、智能手机等等。

PC和笔记本电脑的优势在于存储容量大和内容更新方便。但弱势也显而易见,它不具备良好的便携性,用户很难实时阅读。

PDA和智能手机也可以在辅助办公之余阅读电子书,软件下载也比较丰富,如鼎鼎大名的 iSilo for Pocket PC、eReader等等。只是因为尺寸受限,阅读也只能偶尔为之。

掌上游戏机PSP和性能强大的超便携电脑则因其超大屏幕尺寸和不错的电池续航能力,也成为了阅读电子书的一项选择。

手持阅读器则是在专攻电子书阅读的终端设备,它凸现了许多纸质图书没有的优点,能够搜索,可以下载、更换图书内容;还使得电子书脱离电脑,真正成为能随身携带、自由移动的“书”。

⑸ 简述印刷的演变和发展趋势

印刷科技发展趋势

资料来源:《中华印刷科技学会会讯》第65期 主讲者:陈政雄

--------------------------------------------------------------------------------

数位、资讯与智慧,彻底改变了印刷传播及生产方式,我们不仅要在本位上求更快、更好及更有效率的生产,如何融入其他传播媒体,将文字图形与影像资讯做更广泛应用,在多元媒体领域创造更多价值,使精致印刷资讯档,成为业务和传播作业的重要一环。印刷媒材可能缩减但绝不会消失,因为人类对视觉感官永远有需求,印刷技术插足高科技生产,今天也绝非到顶点,未来将有更多地方会应用到,只是我们如何去面对、因应而已。然而,在今年参展的厂商基本资料试着以XML、PostScript File结合Database的概念,单一输入资讯档(One input)并以多元化输出(Many output)为应用。

一、自动设计与更顺畅生产流程

电脑硬体和软体快速进步,显现在记忆容量和计算速度已有十倍、百倍成长,重覆性动作只要记下程序和变化量数,电脑便能模拟人的指令创作,如去背、加阴影、换底图,只要有样张及动作过程,电脑软体人工智能便能因应操作,不必每次都要人工一再操作,既快捷又省人工,而且没有个人技术高低差别。电脑在语言输入、OCR字节辨识上,将会到达人类智能程度,只要人看懂的就可输入,大幅降低输入的负担。影像撷取设备从数位相机、手机到扫描机、录影机,来源更方便多元,智慧型翻译,将使世界村的知识及资讯交流更频繁、更无障碍,增加了印刷及传播机会。PDF、XML等跨平台、跨媒体的档案格式发展下,对传播流程使用及自动生产助益很大。使用排程式自动化生产,一定会达到省力化,有时更达无人化生产地步。

二、网路应用使印刷传播方式和技术改变

由于网路频宽改善、加上档案压缩技术进步,档案格式的限制减少,更快速方便的企业内部网路传讯及外部网际网路应用下,目前承作小档的网路合版印刷,将变成无远弗届的远距打样和远距分散印刷。应用网路科技大幅改变印刷市场和生态,将来出版社仓库只要一点点,只有服务器出版物档案及贩售机制为主,利用锁码科技由指定印刷单位依需印刷及打印,或在各自客户打印完了后档案自动隐去,在这个时候,印刷业将只承制页面档案及管理这些资讯,印刷及打印是当地使用或远方传档小量输出的工作。业务人员不用带型录在世界展场跑,只要在当地打印,使用者付买书的权利金,回家自己输出或委由专门店打印装订。

三、单一资讯档多元化输出应用

输入来源有键盘、语音、数位板、数位相机、扫描器及电脑创作的文字、图形(Computer Graphic)、影像及语音资讯,整合成分辨率高可做大尺寸画面的印刷用档案,所以,除了印刷品及大海报之外,其他网页、CD电子媒体都可以继续使用这些页面档案,但这些电子档的细致性,往往不如印刷媒体,因此印刷业须体认,自己是页面资讯原创者、管理者地位,才有较大生存空间。

四、平版印刷的变革

平印是最广泛应用的版式,正在处于走下坡的状态,但基于效率、品质和成本,平印仍是在包装、出版及商业印刷短、中、长版主要版式。CTP广泛应用,使在成本和工程上有利,DI机上制版,跨越印前、印刷甚至加工阶段。未来在奈米科技下,免用水一般PS版的单流体印刷,使平印品质成本更有竞争力,印刷浓度、色相的改善,使简单的设备技术便能把平印应用自如,达到以前未有品质水准。CIP4将使印刷准备时间减少、印刷色彩再现更准确。在包装和铁皮印刷方面,有一种超压缩气垫橡皮布,可印1.5mm厚瓦楞纸,而不再需裱纸应用。套对已使用数位追踪控制,未来的供水和供墨自动侦测回馈补偿,将使平印机品质有更逻辑化演绎控制。

数位控制伺服马达广泛使用后,包括平印机的构造和控制将更简便,伺服马达不只在印刷单元或单一 筒驱动上取代曲柄、凸轮做应变弹性往复动作,更符合速度及印刷变化,在印刷机设计、制造及使用更简单,而检查维修更方便。若印压减轻,印刷机结构将更轻薄短小。印刷机将追求更快的工作更换速度,而非印刷机绝对速度,除非是大型轮转印报机、或商用轮转机才有必要。

平印机的连线加工将更重要,能大幅提高生产附加值,包括原有上光、消光、全面使用陶瓷微穴辊供液,取代辊筒间隙及压力的调量式,另外应环保要求,可脱墨回收的上光方式和能溶解分散的纸张回收才能符合标准。使用薄板型轧刀在平印机上做模切加工,是很有附加价值的加工。流水号、条码、喷墨连线等可变印纹加工,打破平印固定印版的框架。菊四开小型机仍有强固小量多样市场价值,尤其CTP的小尺寸高速制版、聚酯版基材低价位,显现这类机器的灵活性。

五、凹版和柔版的消长

由于环保诉求,薄膜或合成皮等材料必须改用水性墨印刷,所以凹版的电子雕刻及成熟溶剂型油墨,也要改用腐蚀型较平浅的墨穴比较有利,因此,电子凹版 筒成像,以腐蚀凹陷才可能因应水性墨的印刷。柔版对水性墨的适应力较高,但印墨仍必须改善才能生产好的印刷品质,加上, CDI直接印版成像树脂版或雷射烧灼成像,使柔版在工程缩短及成本降低下,可能逐步取代凹版在薄膜及合成材料印刷地位。在商标、表格及精致瓦楞纸印刷方面,仍有发展空间,像银行、信用卡、劳健保通知,都会有印刷彩色广告页,因此平印和柔印将有不同程度替代性。柔版对小量多样在成本及弹性较佳,“无轴化”不论在凹版及柔版都是重要方向,尤其窄幅柔版有十种以上连线上光、裱膜、模切、网印及其他加工可能性,像刮刮乐彩券的多种加工,应用更宽。但凹版在宽幅两公尺以上超大型、超高速杂志、文化及大量塑胶印刷较占优势,如美国R.R.多纳利公司就仍将大型化杂志印刷定位在凹版印刷,主要是其在薄纸印刷高浓度、高光泽及高品质再现上,连商用轮转平印也赶不上。

六、网印精度和使用广度增加

网版在彩色印刷已可使用175线技术,网点再现及浓度更胜平印,所以应用在很多个性化手机、电子用品,十分讨好。另一方面,套印精度在5μ以下的电子产品如电路板、LCD-TFT数位相机零件等,也考验网版印刷机的重复精度和再现印纹准确性。大型海报、旗帜印刷方面,国外采用多色机中间连结UV紫外线干燥系统,使工作一气呵成,大幅提升生产能力,但除大量海报及薄板印刷之外,小批量海报多使用巨型喷墨打印,将100张以下的市场取代,主要是工程短不用制版及上机,而且可用平台式喷墨在凹凸厚材料上,和网版印刷一竞短长。网印机的自动化生产体系,是最急迫需求,因为电子厂高效率的要求是网印机厂研发重点。网版制版使用喷墨直接成像,仍未取代底片制版方式。

七、可变印纹打印 是发展最快部份

色粉、喷墨及电子印墨,是无版可变印纹打印三种主要方式。色粉为海德堡、全录、HP、EPSON、Xeikon、IBM、Nipson、Oce'等公司所使用,每小时6000 张A4打印能力、1200dpi的精细输出,可以全面或局部改变印纹,设置成本上可随需要有很大的伸缩性,未来会在更低廉更快速上努力,以便争取较大数量的打印工作,而且印纹光泽性、厚度也和平版相似,很难用肉眼分辨平印或色粉打印,但在前置档案处理作业上有待加强,且尺寸最大只有500×700mm,对用惯菊全平印的人仍然需要更大尺寸。将来色粉打印的印墨会更精细及色泽浓度会更改善。

电子印墨有Indigo及ToyoInk Elcosy两种方式,Indigo在速度上达到每小时8000份A4打印能力,另一方面可以用淡色辅助的网点法打印,加裱膜上光达到相片品质。卷装式Omnuis商标打印方式,做各种变化内容、连续号码及颜色变化号码防伪功能,将来在尺寸(尤其宽幅)增大,若达28寸(720mm)就可打印菊全印件以因应短版需求,不过目前仍困在速度慢、成本高的高价市场,无法普及。ToyoInk Elcosy打印是电磁作用(使水性印墨凝结附着)打印方式,机宽达600mm,速度每分达350英尺(105公尺),成本可以较低、材料适应力很强,研发至今5、6年仍未商用化。

喷墨打印是相当成熟实用技术,不论热泡沫及压电方式都不分轩轾,大小尺寸从相片到超大海报,甚至高速全喷墨表格打印生产,微针点已达4800dpi解析力,大海报也有360dpi可近看的解析力,使用UV干燥的喷墨打印,在耐光性、耐候性及附着力三方面都很优秀,是大海报,不吸墨表面及厚重石板、钢板、木板等材质的重要打印方式。

在宽幅1公尺上下的打印机,印刷业使用做打样工作已十分普及,未来在海报生产、大型婚纱相片打印都有市场,尤其专辑印刷后页画档、大尺寸打印布展,仍有相当大市场空间。Scitex的高速打印头在电脑报表纸印刷后的可变资讯打印方面,已有十分成熟市场。而印刷机形成高速打印彩色全变化内容印件,宽幅在22寸(550mm)、速度达到每分钟150公尺,有360dpi解析,未来一定更精致而且速度更加提升。在过去十年,喷墨头的能力已有一千倍以上进展,未来使用半导体制程喷墨头一定是更大尺寸及精致化,这是可以预期。

使用相位可重复变化显现的电子纸、电子印墨,有一天可以成为书本方式,每次重复载入不同资讯而没有废纸产生,就如教室中那块白板可由不同老师写上不同资讯。它的小粒子内成份,因感应不同的极性,而形成显色或消色效果,只要一次重新整合就成一张“白纸”,在环保上十分具有意义,印刷界就成了页面资讯提供者。在商品、库房、告示板可使用这样的标纸,随时改变价格或内容,不用重写十分方便。

八、安全及防伪印刷

由于印刷设备和技术全面提升,传统四色彩印商标、包装及说明书已没有防伪效果,必须用六色、七色高传真彩印才会有所不同,另外,使用雷射全息黏标或烫金,也有它一定效果,但魔道消长,不久可能又要找更精细干涉波防伪图案才可。凹版印刷成本高,也有它一定防伪效果,所以色泽浓、精细雕刻纹路,在高科技下有深一层防伪功效。压纹、浮水印技术虽然古老,也是有效方法,像邮票齿孔由每一个模具达数百万元所冲制,想模仿也不容易。总之,在成本不用加太高、仿制的人又不易模仿下,最重要的是不用工具一般人用眼光就能分辨才是防伪重点,但出来新技术方法,在使用一段时间之内就会被模仿,这是时时要更新的防伪重点。

九、印刷市场变化及因应

印刷业由原来生产制造业变为资讯传播、包装应用及工业应用加值产业,如何因应社会、市场和加值链破坏,市场往往由盛极而衰,利润从有变无,如果固守原有范围势必血本无归。二十年前出生率和现在相比只剩一半不到,教科书产业因就学儿童大幅降低,加上政府采取开放却紧控价格的鸡肋效应,原本丰厚市场也只剩少数几家在苦撑。

如何在新的市场找到有利基的生产项目,如做别人做不到的设计、加工、立体印刷、变化体等仍有发展空间,UV紫外线在塑胶板上的印刷,有些外销工作一年就有一百多万美金业务,类似LCD-TFT彩色滤镜印刷、更大厚度瓦楞纸直接平版彩色印刷,免印墨干涉波影像再现等,在市场的价值稀有和精致化,所以要多方找寻,甚至开发新技术在市场上应用。因为利基市场时时在变化和更新,所以要能克服技术难关,做好服务工作,并掌握自身“核心技能”提升及应用,更重要的,在关键时刻要导入新设备及技术,以在市场上取得先机,才是创造利润永续发展要件。

阅读全文

与pdf发展前景相关的资料

热点内容
周转材料核算法 浏览:354
学nodejs还是php好 浏览:275
电信营业厅app怎么买q币 浏览:917
linux退出登陆 浏览:534
python查找相似图片的代码 浏览:334
赵丽pdf 浏览:659
如何苹果手机app不要自动更新 浏览:977
pythonflask路线教程 浏览:256
程序员职业有哪些好处 浏览:711
大都会软件app如何扫码 浏览:436
单片机0x38 浏览:756
程序员浪漫工作 浏览:329
php几分钟前 浏览:308
项目编译及运行 浏览:894
程序员的基本功 浏览:524
遗传算法排班 浏览:291
如何加密金融安全网 浏览:32
家里的wifi太卡了怎么样自己加密 浏览:235
华为链路聚合命令 浏览:427
apache自动运行php 浏览:521