1. 信息安全安全前沿技术有哪些
研究方向的特色
多媒体信息安全——数字水印技术。
我们对用于图像认证的脆弱水印技术与版权保护的稳健水印技术进行了深入的研究。在脆弱水印技术方面,我们研究了基于领域象素模型的脆弱水印方法。首次探索了邻域像素的线性加权和模型、灰色系统模型以及神经网络模型,根据所建的模型来嵌入和提取水印,并通过比较原始水印与提取的水印进行认证。由于像素之间的关系在高质量的图像处理算子作用下具有相对的稳定性,因而这些方法能够接受这些算子对图像的影响;另一方面,由于模型捆绑了像素之间的关系,因而这些方法对内容篡改具有很强的敏感性。特别地,由于认证过程需要用到与图像内容相关的模型参数而使得这些方法可以抵抗伪认证攻击。在稳健水印技术方面,我们首次研究用多小波变换来设计稳健水印算法。与传统的单小波一样,多小波分解给出了图像的一种分层的多尺度表示,但不同是,在多小波分解的同一尺度且同一方向上存在四个子图,而且多小波还同时具有正交、对称和紧支撑等性质。根据多小波的这些特点,我们提出的水印方法优于传统的单小波域水印方法。另外,我们还探索了基于多小波的自适应嵌入水印策略、基于混沌映射和遗传算法的适应嵌入水印策略和基于神经网络的自适应提取水印策略等。在这一领域,我们获得了广东省自然科学基金项目“数字水印及其在电子商务中的应用”的资助,在《计算机学报》等权威刊物上发表论文多篇。
电子商务安全——网络隐私保护技术。
网络隐私保护是集技术、法律、道德等多种因素为一体的综合性、富有挑战性的问题。目前,人们研发出了针对传统网站的P3P隐私保护技术,而基于网格服务的隐私保护技术的研究几乎是空白。我们提出解决这一问题的有效方法是极大化技术对隐私信息的控制作用,并为从法律上解决隐私争议提供有力的技术证据。一个有效的隐私保护系统是:隐私信息的收集需要与本人协商、隐私信息的使用需要得到社会的监督、隐私信息的侵权需要得到法律的制裁。基于这些原则,考虑网格服务环境,我们主要研究了以下内容:(1)建立一个有效的基于网格服务的隐私保护模型,引入信誉概念,研究相应的隐私保护方法与技术。(2)引入协商机制,研究针对个性化网格服务的隐私保护方法与技术。(3)引入合同机制,研究针对临时性网格服务的隐私保护方法与技术。(4)引入本体理论,研究基于语义网格服务的隐私保护与技术。在这一领域,我们获得了广东省教育厅自然科学基金项目“基于网格服务的隐私保护技术研究”的资助,已有论文被《计算机科学》、《计算机应用研究》等刊物录用。
金融信息与网络安全。
在金融领域的计算机犯罪屡屡发生,保障金融信息安全至关重要。在这一方面,我们的主要研究成果有:中国人民银行总行课题“网络会计信息系统安全研究”、广东省课题“广东网络银行风险及其防范”等,“我国银行计算机安全问题与对策研究”获中国人民银行武汉分行课题二等奖。在核心期刊上发表的代表性论文有:“银行内联网安全分析与风险防范对策”,“电子钱夹模型及应用系统研究”、“网络信息安全问题与防护策略研究”等。
2 学术地位
近5年来,我们在《计算机学报》、《计算机辅助设计与图形学学报》、《Lecture Notes in Computer Science》等权威期刊和国际会议上发表论文60余篇,有6篇论文被SCI、EI收录,以及被《电子学报》、《软件学报》的作者引用。我们已获得省、教育厅等多项自然科学基金课题的支持,并建成了广东省重点实验室“电子商务应用技术实验室”。另外,由于我们在学科专业上取得了一定成绩,本专业已经被评为广东省“名牌专业”。学术带头人张军教授为广东省“千百十”人才。
3 作用和意义
信息安全关乎国家的政治、经济和文化等各个方面,与其他领域不同的是,信息安全必须依靠我国自己的力量来解决,引进国外产品或照搬国外先进技术来解决安全问题无异于引狼入室。为此,我们积极跟踪相关领域发展动态,开展了深入细致的研究工作,所取得的研究成果将在保障国家政治、经济、文化安全以及促进信息产业健康发展等方面有着重要的意义。
2. 中央民族大学信息与计算科学专业有哪些就业前景
信息与计算科学专业
培养目标
本专业学生主要学习信息与计算科学的理论和基本方法,接受计算机和数学软件、数学建模、优化与统计分析等方面的基本训练。毕业生应掌握数学分析、代数、几何及其应用的基本理论、基本方法;了解信息与计算科学的理论前沿、应用前景和最新发展动态;熟练使用计算机(包括常用语言、工具及专用软件),具有基本的算法分析、算法设计和较强的编程能力,能运用所学的理论、方法和技能解决应用领域中的实际问题;熟练掌握一门外语;掌握信息与计算科学资料的查询、文献检索及运用现代信息技术来撰写论文,参加学术交流。
培养特色
信息与计算科学专业本专业建有数学实验室、信息安全实验室、数学建模创新基地,拥有计算机等设备150台套,能充分满足本科及研究生教学及科研需要。有两个培养方向:信息科学方向,课程主要以信息技术为核心,包括信息论与编码、信息安全、数字信号处理、模式识别等;计算科学方向,课程主要以计算技术为核心,包括计算方法、数值分析、数学模拟方法、最优化方法、并行计算、数学软件等。在课程设置上,强调两个基础:一是以数学分析、高等代数和空间解析几何为代表的数学主干基础课,增强学生的数学修养,为学生后续课程的学习打下坚实的数学基础;二是计算机知识和技能、优化与数据分析等课程,包括数据结构、程序设计基础、面向对象分析与设计、数据库、操作系统、计算机网络、运筹学、数据分析、软件工程等,培养学生的计算机基础知识和实际应用技能。
就业及深造前景
本专业培养的毕业生具有良好的数学基础和数学思维能力,掌握信息与计算科学的基本理论、方法和技能,接受过科学研究训练和解决实际问题的实践,能解决科研、工程建设部门、商业公司、金融证券、软件行业、网络电信等诸多领域实际工作中遇到的科学计算和信息处理等问题。毕业生能在科技、教育、经济与金融等部门从事研究、教学、应用开发和管理工作,成绩优秀的学生可继续攻读硕士学位。本专业就业前景明朗,近几年超过30%的学生考取了研究生继续深造,其它学生多数留在北京等大城市就业和发展。
该专业为理科专业,学制4年,修满学分后授予理学学士学位。该专业2018年计划招收本科生2个普通班(约80人)、1个民族班(约18人),共计计划招生人数约98人。
3. 时至今日,深度学习领域有哪些值得追踪的前沿研究
列举几个广泛应用深度学习的领域。也是目前最值得追踪的前沿研究领域。
一、语音识别
深度学习的发展使语音识别有了很大幅度的效果提升,类似于在计算机视觉中处理图像数据一样,深度学习中将声音转化为特征向量,然后对这些数字信息进行处理输入到网络中进行训练,得到一个可以进行语音识别的模型。
二、自然语言处理
深度学习由于其非线性的复杂结构,将低维稠密且连续的向量表示为不同粒度的语言单元,例如词、短语、句子和文章,让计算机可以理解通过网络模型参与编织的语言,进而使得人类和计算机进行沟通。此外深度学习领域中研究人员使用循环、卷积、递归等神经网络模型对不同的语言单元向量进行组合,获得更大语言单元的表示。
三、文字识别
众所周知,深度学习可以用来识别照片中的文字。一旦识别了,文字就会被转成文本,并且被翻译,然后图片就会根据翻译的文本重新创建。这就是我们通常所说的即时视觉翻译。
四、自动机器翻译
我们都知道,谷歌支持100种语言的即时翻译,速度之快宛如魔法。谷歌翻译的背后,就是机器学习。在过去的几年时间里,谷歌已经完全将深度学习嵌入进了谷歌翻译中。事实上,这些对语言翻译知之甚少的深度学习研究人员正提出相对简单的机器学习解决方案,来打败世界上最好的专家语言翻译系统。文本翻译可以在没有序列预处理的情况下进行,它允许算法学习文字与指向语言之间的关系。
五、自动驾驶汽车
谷歌利用深度学习算法使自动驾驶汽车领域达到了一个全新的水平。现在谷歌已经不再使用老的手动编码算法,而是编写程序系统,使其可以通过不同传感器提供的数据来自行学习。对于大多数感知型任务和多数低端控制型任务,深度学习现在是最好的方法。
如果你对深度学习感兴趣,想成为人工智能领域的高级人才,可以了解一下优就业深度学习精品课程。课程由中公教育与中科院自动化研究所专家联合推出,真实企业级项目实操,项目循序渐进,以实操贯穿理论,避免纸上谈兵,涵盖行业75%技术要点,落地领域广泛。
4. 当前前沿科学或技术有哪些方面
当前前沿科学或技术有:反隐身技术、基因技术、脑科学、生命科学、谷歌支持的“延长人类寿命计划”、空气屏幕、直接投影到视网膜、透明手机、VR技术,纳米材料等技术、
反隐身技术,是研究如何使隐身措施的效果降低甚至失效的技术。隐身技术实质上就是尽量降低飞机的雷达、红外、激光、电视、目视及声学特性,使敌方各种探测设备很难发现、探测和跟踪,降低敌方的精确制导武器的作战效果,从而提高飞机的生存能力。
雷达隐身是首先发展和使用的隐身技术,因此反雷达隐身也是当前重点发展的反隐身技术。现代战场上的侦察探测系统主要是雷达、红外、电子、可见光、声波等探测系统,因此武器的隐身技术除了传统的雷达隐身和红外隐身外,还有光学隐身、等离子体隐身等。
前沿科技热点:
1、量子信息处理
量子信息处理,其基本思想是以原子、电子、光子层次微观世界的粒子的存在状态及相互作用规律来编码和处理信息,借助量子叠加和量子纠缠等独特物理现象,以经典理论无法实现的方式获取、传输和处理信息。量子信息处理技术主要包括量子计算和量子通信。
量子计算包含处理器、编码和软件算法等关键技术。近年来,这些技术发展较快,但仍面临量子比特数量少、相干时间短、出错率高等诸多挑战,目前处于技术研究和原理样机研制验证的关键阶段,超过经典计算的性能优势尚未得到充分证明。
量子通信与现有通信技术不同,可以实现量子态信息的传输,主要分量子隐形传态(Quantum Teleportation,QT)和量子密钥分发(Quantum Key Distribution,QKD)两类。
基于QT的量子通信和量子互联网仍将是未来量子信息技术领域的前沿研究特点。QKD从理论协议到器件系统初步成熟,目前已进入产业化应用的初级阶段。
2、第三代半导体
国际上一般将禁带宽度(Eg)大于或等于2.3电子伏特(eV)的半导体材料称为第三代半导体。常见的第三代半导体材料包括碳化硅(SiC)、氮化镓(GaN)、金刚石、氧化锌、氮化铝等。
第三代半导体材料具有高禁带宽度、高热导率、高击穿场强、高饱和电子漂移速率和高键合能等特点,其器件具有高频、大功率、低损耗、耐高压、耐高温、抗辐射能力强等优势。
关键技术点包括:大尺寸、低缺陷衬底、外延制备技术;硅基GaN外延技术;高质量SiC厚外延技术;高可靠封装技术。
技术发展的竞争态势表现为:产业链(衬底、外延片、器件、模组、下游应用等)各环节主要由美欧日主导;全球SiC市场由美国、欧洲、日本等垄断;GaN市场由日本厂商主导,住友电工、三菱化学及住友化学3家企业占据超过85%的市场份额。
第三代半导体材料的应用前景十分广阔,主要应用领域包括半导体照明、电力电子器件、激光器和探测器以及水制氢、生物传感器等。
3、增强分析
增强分析是将人工智能技术赋能商业智能,具体而言,是将机器学习技术和自然语言处理技术应用在BI领域的数据与分析中。增强分析增强了人类智力和情境感知,改变了数据管理、分析和商业智能的方法,改变了数据科学的面貌和机器学习/人工智能模型的开发利用。
与传统的人工数据挖掘相比,增强分析采用一系列的算法和集成学习技术,向用户解释可执行的结果,降低了丢失重要数据结论的风险。
高德纳咨询公司预测,未来2~5年,增强分析将成为BI市场的主导趋势。采用了增强分析技术生成的机器学习模型正在被越来越多地植入企业的应用程序中,帮助人力资源、金融、销售、市场、售后服务、采购和资产管理部门的员工进行商业决策与执行。
4、人工智能芯片
人工智能芯片通常是指针对人工智能算法做了特殊加速设计的芯片。人工智能芯片按技术架构分为图像处理单元(GPU)、半定制化的现场可编程逻辑门阵列(FPGA)、全定制化专用集成电路(ASIC)、神经拟态芯片;按功能分为训练环节芯片、推断环节芯片;按应用场景分为服务器端(云端)、移动端(终端)。
目前,GPU已经发展到较为成熟的阶段。谷歌、脸书、微软、推特和网络等公司都在使用GPU分析图片、视频和音频文件,以改进搜索和图像标签等应用功能。很多汽车厂商也在使用GPU发展无人驾驶。
虽然人工智能芯片技术发展较快,但是其在现阶段还处于产业化早期。各企业之间的水平有差距,但基本还处于同一起跑线,只有那些技术有重大突破、能够先一步产业化的企业才能引领行业的发展。
5. 计算机研究、开发、发展的方向和前沿
CPU(Computer Process Unit)方面的发展:谈论计算机人们不能不提到CPU芯片,这是计算机的核心。芯片工艺发展很快,从线宽和集成度可见一斑,线宽从0.25μm、0.18μm、0.13μm到90nm,甚至25nm,芯片工艺已从微米级发展到纳米级;从集成度看:IBM公司最近公布了Power5芯片,采用铜基,绝缘硅,集成微型晶体管达2.8 亿个;Intel公司公布的Penttium4芯片集成微型晶体管达1.8亿个,同时宣称目前已研发了可集成10亿个微型晶体管的芯片,并向集成15亿个的目标前进。由于集成电路规模越来越大,复杂性越来越高,混合信号和射频处理更加复杂,使得芯片设计更为复杂,对光刻、掩膜、封装和测试都提出了更高的要求,对半导体材料要求更为苛刻。因此,CPU方面的发展可以说是龙争虎斗,不可衡量的方向,而且是高科技的集成应用,它引领着计算机硬件发展的前沿。
操作系统方面的方向:操作系统是计算机的大脑,操作系统涉及到计算机效能的发挥应用要求的实现和数据的安全和保护。目前的主流操作系统是Windows、UNIX、Linux三足鼎立,而且Windows在桌面系统上占有绝对优势,形成了垄断地位;UNIX是经过长期使用在高性能计算,工作站CAD设计且安全性能好的操作系统;Linux是一种类UNIX的操作系统,它是自由软件,可免费下载,今后加以开发、扩充性能可形成标准化的操作系统。现在是Windows、UNIX的市场份额越来越小,Linux的市场份额正在不断增加,而且在工作站(设计)和高密度计算、集群等方面使用Linux占有很大的比例,这是因为:Linux经过改进可支持16个CPU,各种计算均能解决(多于16个CPU的计算极少);由于Linux是自由软件,原代码开放,免费下载,成本很低,大家都喜欢使用;因此,谁能够否认操作系统不是一个光明的发展方向呢?
环保的方向:现在大家天天都要面对计算机,因此计算机的“环保”的问题引起了人们的注意。环保计算机主要采取如下措施,采用低辐射的显示器,减少功耗(节电),降低噪音采用低噪音风机,其中最关键的是降低铅的使用量,制造无铅计算机。计算机用铅的地方主要有:显示器:1台显示器差不多要用1kg的铅,改为液晶显示器,用铅量可大大降低,几乎为零;焊 接:电子器件的焊接所使用的焊条中含有铅,应改用无铅焊条。这项工艺正在试验之中,无铅焊条焊接温度要提高,这就涉及主板上的电子器件的耐热程度要提高,提高后对器件的寿命、性能可能带来变化,因此要采取一定的预防措施;计算机连接电缆的塑料护套:塑料护套中含有铅,无铅使塑料容易老化,开裂和变脆,改用无铅塑料护套,要采取措施来解决这些问题。如今人民的生活水平不断提高,环保观念逐步普遍,所以对那些低危害的电子产品特别的热衷。因此,这个方向也是一个不错的发展方向。
除此之外,我还在网上搜集了一些目前计算机的主要研究、开发、发展的方向与前沿。
1、computing theory:一般的研究计算性和计算复杂性,自动机理论,以及涉及各个子方向的抽象数学模型的研究。
2、AI:一个理论性很强需要很多数学的领域。
3、computer architecture:只要研究电脑的原理、构成、相关器件以及用这些器件搭建各种平台等。
4、system software:这是一个发展了很久的产业,也是大家比较不熟悉的行业。
5、Database:也就是数据库,数据库是数据管理的高级阶段,它是由文件管理系统发展起来的,包括了函数等的研究。
6、networking;计算机网络,这是相当有开发前途的方向。
7、software engineering:软件,是计算机的灵魂,所以,软件工程对计算机来说,是很重要的。
8、security:网络安全技术及其协议。
9、conmputer graphics:计算机图形。
当然,除此之外,还有很多很有前景的发展领域在等待着人们去研究和开发。随着科学技术的发展,计算机会向着人性化、智能化的方向发展,而它的作用领域也将会越来越广泛。不久的将来,它将会渗透到人类生活的各个方面。
6. 求 信息论与编码 学习心得
学习信息论与编码感想
多媒体信息是未来人类获取信息最主要的载体,因此它已成为目前世界上技术开发和研究的热点。视频信息作为多媒体信息中最被关注、数据量最大的一员,现在也正面临着一场其意义不亚于从模拟到数字的技术进步革新:从传统的矩形DCT变换编码到根据视频内容、划分对象、分别变换编码的新的编码方法。
一、传统的编码方式
传统的视频编码是以视频信号的数字量为编码对象的,与视频信息的内容无关,无论是M-JPEG、MPEG-1还是MPEG-2,都是以DCT矩形变换块为变换编码单元,对DCT块内图像的亮度和色度进行特征取样,提取像素;采用帧间编码、运动估测技术,在参考帧帧内DCT编码的基础上,对DCT块内图像的像素特征进行差值预测编码。基于矩形DCT编码的视频编码在设计思想上只考虑到对信号数据进行处理的需要(比如小的比特率以利于传输、高的比特率以保证质量),但未考虑视频信息--图像内容本身的含义和重要性,以及视频信息应用者的主观需求(比如部分内容的提取功能)。另外,这种基?quot;块"的压缩算法在低码率时容易产生"方块效应"和"抽帧",大大缩小了视频信息的应用领域。
小波变换是一种新的变换编码方法,它与DCT变换相比,考虑到了视频信号对不同应用环境的自适应性(不同的清晰度与比特率),可以将基础图像层与增强图像层分离编码传输,用户可根据实际情况选择是否打开增强图像层。但无论用户选择是或否,被传送的视频信息却都是一样的。
二、 基于内容对象的编码
1、 VO与VOP概念的引入
传统的视频编码方式是将整个视频信号作为一个内容单体来处理,其本身不可再分割,而这与人类对视觉信息的判别法则,也就是大脑对视神经导入的视觉信号的处理方法是完全不同的。这就决定了我们不可能将一个视频信息完整的从视频信号中提取出来,比如:将加有台标和字幕的视频恢复成无台标、字幕的视频。解决问题的惟一途径就是在编码时就将不同的视频信息载体--视频对象VO(Video Objects)区分开,独立编码传送,将图像序列中的每一帧,看成是由不同的VO加上活动的背景所组成。VO可以是人或物,也可以是计算机生成的2D或3D图形。VO具有音频属性,其属性赋值可能?quot;有"或者是"无"。但音频的具体内容数据是独立于视频编码、传输的。VO概念的引入,更加符合人脑对视觉信息的处理方式,并使视频信号的处理方式从数字化进展到智能化。提高了视频信号的交互性和灵活性,使得更广泛的视频应用和更多的内容交互功能成为可能。
现代图像编码理论指出,人眼捕获图像信息的本质是"轮廓-纹理",即人眼感兴趣的是VO的一些表面特性,如形状、运动、纹理等。VO的表面往往是不规则的、千变万化的,但可将其视为一定视角下,n个形状规则的、具有一定纹理的剖面的组合的连续运动,这些剖面的组合称为视频对象面VOP(Video Object Profile)。VOP描述了VO在一定视角条件下的表面特性。VOP的编码主要由两部分组成:一个是形状编码,另一个是纹理和运动信息编码。VOP纹理编码和运动的预测、补偿在原理上同MPEG-2基本一致,而形状编码技术则是首次应用在图像编码领域。
2、新的编码技术
合成VO的独立编码 在以前,2D或3D动画被看作是视频的一部分,并一概以视频的方法来处理。实际上,根据合成VO的合成机理和特性,大部分合成VO都可以用通用的有关图形文本的多种表达方式来描述。非复杂性合成VO将被视为一种独立于视频的数据类型来编码,并定义了其描述框架、通用的数据流结构和灵活的接口。而复杂性合成VO和自然VO的编码方法,将采用以下的编码方法。
基于矩形窗口的VOP分割 考虑到与现有标准的兼容,目前已得到应用的VO编码技术,比如MPEG4,仍采用了基于矩形窗口的内容分割法。编码时,首先利用像素特征统计,将每一个VOP都限定在一个矩形窗口内,称之为VOP窗口(VOP Window),取窗的原则为:长、宽均为16像素的整数倍(便于对现有标准的兼容和将来的扩展),同时保证VOP窗口中非VOP的宏块数目最少。目前标准中的视频帧可认为是一个无VOP的特例,在编码过程中将形状编码模块屏蔽掉就可以了。在一个VOP窗口内,VOP剖面的形状也是采用8×8像素的矩形形状。针对不同的VOP,可以根据不同的应用场合和运动、变化的特点,采用固定的或可变的VOP帧频(即VOP刷新频率)。
矩形窗口分割法并不能体现VOP的具体形状信息。为了确认采用矩形窗口分割法的VOP的形状信息,就引入了形状编码技术。形状编码其实并不是什么新技术,它在计算机图形学、计算机视觉领域早有应用。而目前的视频编码标准中的位图技术其实就是形状编码的简单特例。位图采用矩阵的形式来表示二值(0或1)的形状信息,具有较高的编码效率和较低的运算复杂度。VOP的形状信息有两类:边缘信息和灰度信息。边缘信息用0、1来表示VOP的形状,0表示非VOP区域,1表示VOP区域。对于包含一定透明度的VOP区域,可以用灰度信息(取值0~255之间)来表示透明程度,其中0表示完全透明,255表示完全不透明。对于模糊边缘部分,可将其视为灰度信息从周围已知VOP区域的灰度值向0值的过渡区域,采用内插法确定其形状信息。
基于小波变换的VOP分割 基于矩形窗口的VOP分割依旧存在"块效应"问题,而基于小波变换的VOP分割则可以很好的解决这个问题,而且由于这种分割方法的本身就包含了VOP的形状信息,所以无需另对形状信息进行判别与编码。基于小波变换的VOP分割方法是目前最为活跃的视频编码课题研究领域,各种算法不断的被发表,但基本上可以划分为两类方法:
1、利用图像灰度特征分割:不同的图像具有不同的灰度分布,利用小波变换,将图像变换到小波域,产生各层、各子带图像。小波变换后,大部分的能量是集中在低频子带图像上,即大面积的平均灰度区域信息主要在低频子带图像中体现。根据信息论的原理,确定多个灰度阈值,可以将具有不同灰度的VOP从低频子带图像中分离。同时再利用高频子带图像以及模糊数学模型,确定每一个VOP的边缘信息。利用图像灰度特征分割的小波变换,是沿扫描方向的单方向变换。
2、利用图像纹理特征分割:纹理是一种局部特征反复出现的结果,它体现了图像的局部频域信息。对于一幅数字图像,进行多方向的小波变换是可行的,比如对一帧画面进行垂直方向或对角线方向的小波变换。经过多种小波变换后可得到不同方向的各子带图像,它们各自蕴涵着不同纹理的局部频谱信息和纹理走向等信息。对具有相同频谱特征的图像局部进行聚类分析,并根据纹理频谱和纹理走向确定该聚类的纹理边缘。根据信息论原理和运动估测,将运动矢量具有相关性的聚类二次归类于不同的对象(即VOP),并影射成不同灰度显示。多级小波变换的结果最多可线性的影射成0~255灰度级显示。进行小波变换的方向越多,各方向的夹角越小,图像分割也就越准确,但计算量也随之迅速膨胀。根据局域纹理中心频率的变化自适应地选择小波变换的级数(几个方向的变换)和方向,有助于在图像分割的准确性和计算量之间达到平衡。正如本文前面所述,人眼捕获图像信息的本质?quot;轮廓-纹理",故基于多方向小波变换的提取图像特征、分割纹理图像的方法符合人眼视觉生理的特点,是纹理图像分析的重要发展方向。
无论是哪一种方法,当得到不同VOP的不同灰度表示之后,通过类似于键技术的多通道处理,即可得到多个原始的彩色VOP。目前实验表明,基于小波变换的图像分割在边界上仍有些模糊,但总体效果还是相当满意的,达到了分割纹理图像的目的。
VOP运动信息编码和运动补偿 人眼在观看图像时,会自动跟踪人所感兴趣的VOP。即人看的不是时间轴上的信息,而是VOP的运动轨迹---光流轴上的信息。光流轴是VOP上的一点在活动图像上的运动轨迹,它在不同的帧中位于不同的空间位置,其意义在于:VOP自身的各种变化都将映射于光流轴上的一点。光流轴信息的独立编码将带来诸多好处:(1)在编码时,对于刚性VOP,由于它在运动中不会发生形状和纹理上的变化,故该VOP只需要完成一次采样、编码,而后就只需发出几个运动矢量指明它的光流轴即可;对于非刚性VOP,只需在发生变化时才需要重新采样、编码,这就使得不同的VOP采用不同的VOP帧频成为可能,将编码的数据率最低限度的降低。(2)VOP在运动中的各种变化都将"留迹"于光流轴,当在进行运动补偿时,比如不同制式之间的转换或者慢动作的制作,就可以根据光流轴映射信息,采用内插法得出时间轴上某一确定点的VOP状态,达到无损转换的目的。(3)在时间轴上,简单的将一个图像序列的两路信号叠加,随即噪波和图像的活动部分都得不到增强;若在光流轴上进行信号叠加,活动图像的降噪问题就得到了简单解决。
VOP的运动估测是指:分析两个或更多帧上的VOP,确定光流轴,以判断下一帧中VOP可能出现的位置。VOP的运动补偿是指:根据VOP光流轴的取向和光流轴上VOP自身变化得映射信息,矫正VOP在时间轴上的运动矢量。运动预测和运动补偿技术可以去除图像信息中的时间冗余成分,VOP的运动信息编码可视为从像素向任意形状的VOP的延伸。
纹理编码 在已得到实际应用的MPEG-4中,VOP的纹理编码基本上仍采用基于8×8像素块的DCT方法,有3种模式:帧内编码模式(I-VOP)、帧间预测编码模式(P-VOP)和帧间双向预测编码模式(B-VOP)。编码时,对于完全位于VOP内的像素块,则采用经典的DCT方法;对于完全位于VOP之外的像素块则不进行编码;对于部分在VOP内,部分在VOP外的像素块则首先采用图像填充技术来获取VOP之外的像素值,之后再进行DCT编码。
依据视觉特性的纹理编码目前仍处于理论研究阶段,其目标是:建立常见纹理局部特征符号集,定义描述纹理分布、走向的多媒体语言。以人脸为例:人脸定义参数(FDP)描述了特定人脸纹理形状模型与通用人脸模型之间的差别,通过接收到的各种FDP,能把通用的人脸模型变换成由其形状和纹理确定的特定人脸。人脸动画参数(FAP)描述了特定的人脸表情与中性表情的变化关系,通过接收到的各种FAP能生成人脸的各种表情以及与声音同步的嘴唇活动等。这样的合成编码不仅可极大地提高编码效率(可获得1kbps的超低码率),而且为制作新的人脸等对象提供了方便。
分级编码 多媒体的应用场合具有不同的信道带宽、处理能力、显示能力及用户需求,要求在解码端支持时域、空间及质量的上伸缩性,即分级编码。分级编码可以通过视频对象层VOL(Video Object Layer)的数据结构来实现。每一种分级编码都至少有2层VOL,低层称为基本层,高层称为增强层。空间伸缩性可通过增强层强化基本层的空间分辨率来实现,因此在对增强层中的VOP进行解码之前,必须先对基本层中相应的VOP进行解码。同样对于时域伸缩性,可通过增强层来增加视频序列中某个VO(特别是运动的VO)的帧率,使其与其余区域相比更为平滑。
三、 新的技术标准--MPEG 4
首次采用VO编码技术的视频编码标准是由MPEG 4。MPEG 4于1999年年初正式成为国际标准(标准号为ISO/IEC 14496),在1999年12月的后继版本中增加了可变形、半透明视频对象及其工具的先进功能,它进一步提高了编码效率,并与第一版反向兼容。
1、MPEG 4标准的构成
1) DMIF(The Dellivery Multimedia Integration Framework):多媒体传送整体框架协议。MPEG-4标准将众多的多媒体应用集成于一个完整的框架内,旨在为多媒体通信及应用环境提供灵活的算法及工具,用于实现音视频数据的有效编码及更为灵活的存取。它解决了多领域中多媒体应用个性化交互操作的问题。
2) 解码器:定义了MPEG-4系统特殊的解码模式(SDM),要求特殊的缓冲区和实时模式。
3) 音频编码:支持自然声音和合成声音,支持音频的对象特征。
4) 视频编码:支持自然和合成的视觉对象,合成的视觉对象包括2D、3D动画和人面部表情动画等。
5) 场景描述BIFS(Binary Format for Scene description):关于一组VO的时空结构关系的参数信息,主要描述了各VO在一具体背景下的相互关系与同步等问题,以及VO及其背景的知识产权保护等问题。BIFS与VO对象特征信息的编码、传输是相对独立的。场景描述信息编码及其的独立传输是实现用户端编辑操作的关键:在解码之后和场景合成之前,用户可以通过对BIFS参数的重新设置来对VO 进行多种编辑操作,如增减、缩放、平移,甚至一些特技效果。
下面的表格反映了MPEG体系的部分技术指标。MPEG-4是高比率有损压缩(比如将一个9 GB的DVD视频压缩拷贝到只有700MB空间的CD-ROM上),其图像质量始终无法与MPEG-2相比。当MPEG-4与MPEG-2的码率输出相同时,其质量仍稍逊于MPEG-2。同时,MPEG 4对硬件的要求也较高。事实上,我们注意到MPEG-4在保证令人满意的图像质量的情况下,更注重较低的数据率和灵活的交互功能。
2、MPEG 4编码器
MPEG 4编码简化原理图如图一。
对于输入视频序列,通过分析确认n个视觉目的对象为编码对象,将其认定为n个VO(n=1,2,3…),对每一个VO编码后形成这个VO的VOP数据流。VOP的编码包括对运动(采用运动预测方法)及形状、纹理(采用变换编码方法)的编码。由于VOP具有任意形状,因此要求编码方案可以处理形状(Shape)和透明(Transparency)信息,这就是与只能处理矩形帧序列的现有视频编码标准的根本区别。在MPEG-4中,矩形帧被认为是VOP的一个特例,这时编码系统不用处理形状信息,退化为类似于MPEG-1、MPEG-2的传统编码系统,同时也实现了与现有标准的兼容。除去VO的其余图像部分--背景,仍采用传统的矩形DCT变换编码;VO场景描述信息(VO自身信息,如VO对象的知识产权、和VO间的位置、逻辑关系等)也要进行编码,最后和VOP流、背景一起送入MPEG 4帧复合器,生成MPEG 4流输出。
需指出的是:在VO分割后,每一个VO都需要一个VOP编码通道,在图一中只画出了一个。多个VOP帧发生器的输出在MPEG 4帧复合器中可实现灵活地多路复用编码或同步并行传输编码,以适应各种传输环境和要求。MPEG 4解码是以上编码过程的逆过程。可以看出,独立于背景的VO编码可以实现接收端的用户对VO对象进行选择性地操作。
3、MPEG 4视频编码功能与特点
MPEG 4标准的制定有两个目标:低比特率的多媒体通信和多工业的多媒体通信的综合。即MPEG-4遵循灵活的编码工具框架体系,设计了一个开放的编码系统,对于不同的应用采用不同的编码算法,以达到低比特率通信的目标。MPEG-4解码器是可编程的,相应的解码信息可与内容本身一起传输下载。与现有的MPEG-1和MPEG-2视频压缩相比,MPEG-4视频有一些重要的改进:
1)基于内容的交互功能: MPEG-4提供了全新的交互方式,根据制作者的具体自由度设计,在有限的时间内可实现对多媒体VO的时域随机存取(从不同的源获取内容或向不同的源发送内容)、快速搜索、改变场景的视角、改变场景中物体的位置、大小和形状,或对该对象进行置换甚至清除。
2)支持自然及合成信息的混合编码(NHC:Synthetic and Natural Hybrid Coding):MPEG-4支持合成信息的编码,可对合成的VO及其活动信息进行参数化描述。对于频繁出现的视觉对象则分别定义了它们的纹理形状和动画参数。
3)高效编码:包括视频VO数据的高效编码和多个并发数据的有效同步编码。
4)基于内容的伸缩性:是指分级编码后,纹理、图像和视频基于内容的伸缩性,视频序列中时域、空间及质量的伸缩性,表现为时域实时或非实时、数据率大小及重建的图像质量上。
5)可变的最终输出:不同的码率意味着支持不同的功能集。功能集的底层是VLBV核心(VLBV:Very Low Bit Rate Video),它为最低达5-64kbits/s视频操作与应用提供算法与工具,支持较低的空间分辨率(低于352×288像素)和较低的帧频(低于15Hz)。VLBV核心功能包括:矩形图像序列的有效编码、多媒体数据库的搜索和随机存取。MPEG-4的HBV(HBV: High Bit Rate Video,范围在64kbits/s-4Mbits/s之间)同样支持上述功能,但它同时还支持较高的空间与时间分辨率。其输入可以是ITU-R 601的标准信号,因此其典型应用为数字电视广播与交互式检索。
与MPEG-1和MPEG-2相比,MPEG-4的特点是其更适于交互式AV服务以及远程监控。MPEG-4是第一个允许用户端操作的的视频编码标准。MPEG 4的特点非常适合于互联网上的交互式影视服务:可适应各种应用终端的物理网络环境,可实现对视音频内容的交互操作,具有下载解码能力(在一定的硬件基础上,可下载解码工具,对不同编码方式的内容进行解码处理)。MPEG-4的设计目标还有更广的适应性和可扩展性:因特网多媒体应用、交互式视频游戏、实时可视通信、交互式存储媒体应用、广播电视、演播室技术及电视后期制作、多媒体内容存储和检索、采用面部动画技术的虚拟会议、多媒体邮件、移动通信条件下的多媒体应用、可视化合作实验室场景应用、远程视频监控、通过ATM网络等进行的远程数据库业务等等。
从矩形帧到VOP,MPEG-4顺应了现代图像压缩编码的发展潮流,即从基于DCT的传统编码向基于对象和内容的现代编码的转变。从这个意义上讲,MPEG-4视频编码技术翻开了图像编码史上崭新的一页。
四、 MPEG 4视频产品
在2001 NAB会展上,多家公司推出了他们的MPEG 4产品。Amnis公司推出了基于IP平台的MPEG4视频流技术,展示了可以重放MPEG1, MPEG2和MPEG4的桌面软件。Envivo 公司陈列了他们的应用于IP网络或MPEG2节目数据广播的MPEG4端到端解决方案。该方案是纯软件的,支持视频、音频和合成的2D动画的MPEG4方式编码,以及对MPEG 4文件的版权保护。Optibase公司推出的MGW系列是一个插件式的多通道流服务器系列,可插入不同的编码模块以适应不同的需求,其中MGW 4000是支持MPEG4(兼容MPEG1和MPEG2)的流服务器。Optibase还推出了支持多媒体和交互MPEG4流的IP实时编码、分配平台。最后,Optibase展示了从MPEG 1到MPEG 4的实时转码技术。Philips 提供了一个从制作到重放的、端到端的网上MPEG-4解决方案:包括互动内容编辑器(支持网上MPEG-4视频流的搜索、剪辑和编辑)、实时软件MPEG-4编码器(甚至支持简单视频和AAC音频的无线编码)、通用多点分配IP平台和解码软件(WebCine' player支持Win95,Win2000和NT操作系统;WinCE用于手提电脑;Trimedia是一个网上广播机顶盒)。SUN 公司也推出了他们的通用MPEG-4流服务器。
微软在它现在的WIN98和WIN2000操作系统中也已加入了一个MPEG-4的播放器,叫做Divx。它可以回放仍是以.AVI为后缀的MPEG 4文件。Divx可以附加到MPEG-4的数据流中,并可以进行设置以适应不同的使用要求。Divx视频编码技术是由 Microsoft MPEG4 V3 修改而来,使用MPEG 4压缩算法,打破了ASF的种种协定。但MPEG4毕竟是一种高比率有损压缩,其图象质量始终无法和 DVD 的 MPEG2 相比,即便是在MPEG4码率和DVD码率差不多时,总体效果还是有距离(在杂乱的细节上稍有模糊)。所以目前的MPEG4 只能面向于娱乐和欣赏方面的市场。
市场上的第一张DIVX-MPEG4格式的影碟《活火熔城》,长98分钟,采用512×288 16:9格式,帧频24帧/秒,64KB立体声音频。影片由720×480 16:9 30帧/秒的MPEG2制式转刻,刻在单张CD盘片上。
六、结 尾
在最后结束本文的时候,作者还想说一些与本文有关的阐述文字。由于工程实现与商机、市场的原因,我们所获得的工程技术成果经常是落后于科学家已经得心应手、并能信手拈来的实际的最前沿科技成果。MPEG-4标准即是多因素集合作用的结果,如果不考虑对已有产品的兼容,它还可以做得更好。
VOP编码方式是视频信号处理技术从数字化进入智能化得初探。另外,已VOP技术为依托,也使得模式识别技术从对符号的识别进入到对图形识别的更新的领域。资料表明,此类研究已经更进一步的逼近人脑对视觉信息的处理方式。人类永远不停的在揭示自然界无穷奥妙的同时,也更深入的探索人类自身。
7. 当前量子计算技术前沿是什么水平
量子通信技术迅速成名 对相关产业链有何影响
一直以来,人们关于通信技术的了解知之甚少。一方面是由于知识的欠缺,另一方面是通信技术的发展似乎和我们的生活没有直接的利益关系。据悉,日前欧洲物理学会新闻网站“物理世界”公布了2015年度国际物理学领域的十项重大突破,我国的“多自由度量子隐形传态”列于榜首。那量子通信到底是什么呢?
量子通信技术迅速成名 对相关产业链有何影响
12月11日,据新华网消息,欧洲物理学会新闻网站“物理世界”公布了2015年度国际物理学领域的十项重大突破,中国科学技术大学教授潘建伟、陆朝阳等完成的科研成果“多自由度量子隐形传态”入选并名列榜首。量子通信产业链的相关个股在周五涨势居前。
周末,机构也没有闲着,不断抛出研报,曾经提出TMT热门概念VR的安信证券再次发文表示,“哪怕错过VR,不要错过量子通信。”
量子通信技术一夜成名
关于量子通信技术,《每日经济新闻》记者随手一翻,发现其来历还真不小!
近日,谷歌和美国国家航空和宇航局宣布,通过测试,他们发现D-Wave量子计算机的运行速度已经达到普通计算机芯片装置的1亿倍。
在此概念的引领下,此次主推量子通信的又是安信证券!不得不说,上一个TMT热门概念VR正是安信证券的“得意之作”,尤其是安信证券研究中心总经理赵晓光,可谓是“A股虚拟现实挖掘第一人”。
今年11月7日,在每日经济新闻主办的第四届中国上市公司领袖峰会上,作为“行业成长论坛”演讲嘉宾的赵晓光一语道破天机:智能手机的大浪潮已经结束,包括虚拟现实在内的三大行业成为其心中最好的投资方向。话音刚落,水晶光电从24.5元涨到35.27元;利达光电从26元涨到40.37元;福晶科技从17元涨到22.17元。
年末行情纷繁复杂,如市场之前猛炒的VR暂时熄火,量子通信会不会接棒值得关注。对于投资者而言,如果这时候有好“声音”可以提供靠谱的前瞻观点把握行情那是再好不过。公众号“每经投资宝”的张道达投资手记正是如此。就在今年6月急跌前,张道达已持续一个月看空股市;11月27日早晨,张道达提示“警惕黑色星期五”,当日大盘大跌两百点。现在,只要您关注微信公众号“每经投资宝”,每晚9点可提前阅读张道达先生的最新观点。
量子通信到底是什么
据了解,量子信息是量子物理与信息技术相结合发展起来的新学科,主要包括量子通信和量子计算2个领域。量子通信主要研究量子密码、量子隐形传态、远距离量子通信的技术等等;量子计算主要研究量子计算机和适合于量子计算机的量子算法。谷歌对外的宣布与量子计算有关,而“物理世界”涉及的科研成果则与量子通信有关。量子计算,就是一种依照量子力学理论进行的新型计算,量子计算的基础和原理以及重要量子算法,为在计算速度上超越图灵机模型提供了可能。
关于量子通信,这是国家信息安全的“终极武器”,该技术作为一种绝对安全的通信方式,可以从根本上解决国防、金融、政务、商业等领域的信息安全问题。
安信证券表示,量子通信产业化应用在即,目前确切来说是量子保密通信方案+应用已经具备产业化条件。
由于量子通信具有超高安全、超大容量、超远距离保密通信、传输系统几乎无法破译等特点,世界各国都对此充满期待。而中国科学技术大学的研究成果,则让我国走在了该项技术的前沿。
潘建伟在报告中提到,目前在中科院的支持下,执行一个量子科学卫星的先导专项。现在正在进行研制,这颗卫星将于2016年上半年发射,在国际上率先实现高速的星地量子通信。这样的话,用光纤来做城域网,用卫星来做广域网,就可以构建天地一体化的广域量子通信网络。
潘建伟表示,“在信息科学方面,有信息安全的瓶颈。比如说芯片可以有后门,在光纤当中也可以对光路进行无感窃听,对服务器也可以进行窃听。世界上存在着各种各样的窃听和黑客攻击模式,人们一直在寻求一种在原理上可以无条件安全的通信模式。网络犯罪每年给全球带来数千亿美元的经济损失,这是美国战略和国际问题研究中心的评估,更不用讲在国防安全和其他方面的重要性了。”
券商赶工急推量子通信
值得一提的是,在突发消息面前,券商首先亢奋,周末也不休息了,加班搞研究。
据《每日经济新闻》记者了解,前述安信证券就是亢奋的券商之一,在周五率先搞出一份研报《量子通信:国家信息安全的“终极武器”》,之后又有《哪怕错过了VR不要错过量子通信》,热情可见一斑。
国泰君安通信宋嘉吉团队也没闲着,《“掀起你的盖头来”——揭秘量子通信》的电话会议也在周日晚间开启,特邀嘉宾为上海交通大学信息技术研究院教授石剑虹博士。
国金策略李立峰也发文表示,“量子通信”成为周末市场讨论最多的主题。
8. 信息论的创始人是谁
香农
香农被称为是“信息论之父”。人们通常将香农于1948年10月发表于《贝尔系统技术学报》上的论文《通信的数学理论》作为现代信息论研究的开端。这一文章部分基于哈里·奈奎斯特和拉尔夫·哈特利先前的成果。在该文中,香农给出了信息熵(以下简称为“熵”)的定义:
(8)算法信息论前沿扩展阅读:
信息论将信息的传递作为一种统计现象来考虑,给出了估算通信信道容量的方法。信息传输和信息压缩是信息论研究中的两大领域。这两个方面又由信道编码定理、信源-信道隔离定理相互联系。
信息论的基本内容的应用包括无损数据压缩(如ZIP文件)、有损数据压缩(如MP3和JPEG)、信道编码(如数字用户线路(DSL))。这个领域处在数学、统计学、计算机科学、物理学、神经科学和电机工程学的交叉点上。
信息论对航海家深空探测任务的成败、光盘的发明、手机的可行性、互联网的发展、语言学和人类感知的研究、对黑洞的了解,以及许多其他领域都影响深远。信息论的重要子领域有信源编码、信道编码、算法复杂性理论、算法信息论、信息论安全性和信息度量等。