⑴ 区块链与隐私计算的结合是必然趋势吗
区块链与隐私计算的结合是必然趋势吗?
我们目前对这个问题的思考框架是:如果不与隐私计算技术结合,区块链技术的应用是 否受到限制、无法向前发展;如果不与区块链技术结合,隐私计算技术是否受到限制、无法 向前发展。如果二者对彼此都是刚需,那么它们相结合的趋势就是必然。
以下为我们对这个问题的思考:
1、隐私计算技术的应用是否区块链技术的刚需
区块链技术有巨大的优势,但是如果没有隐私计算技术,区块链技术的应用会大大受到 限制,因为无法解决链上数据的隐私保护问题,这使得大量涉及敏感数据的场景不愿应用区 块链技术,比如金融和医疗领域。
(1)区块链技术的局限性
第一,链上数据公开透明,数据的合规处理和隐私保护能力不足 区块链作为分布式账本系统,数据的公开透明尽管有利于存证、防篡改,但也存在数据 可轻易被复制、泄漏个人隐私的风险。区块链在公有链上要求不同节点对交易和交易状态进 行验证、维护辩陆,形成共识,因此每个参与者都能拥有完整的数据备份,所有的交易数据公开 透明。如果知道某个参与者的账户,就很容易获取其每一笔交易记录,从而据此推断其 社会 身份、财产状况等。以消费场景为例,平台之间存在竞争壁垒,用户也希望保留消费隐私, 因此区块链缺乏对用户流水、物流信息、营销情况等与企业、个人隐私相关的数据缺乏保护 能力,往往导致数据拥有方不愿意让数据进入流通环节。在链上系统的交易不再受中心账本的控制,用户通过使用唯一的私钥进行交易,交易过 程被加密且加密前数据很难还原,仅以私钥作为交易凭证使得区块链内的交易变得更加匿名 和不可控。在分布式账本系统上,所有的转账以地址形式进行,一但发生了诈骗或者洗钱等 金融犯罪,即便可以公开查询地址,但对资金追踪的难度极大,且私钥作为交易凭证很难证 明使用者的身份,因此许多企业、个人通过区块链进行洗钱等违法交易,不利于数据的合规 处理和合法共享。
第二,数据处理能力不足,制约技术的进一步落地和商业化拓展 链上计算受限于网络共识的性能,使得链上交易难以具备实时性和高效率,区块链智能 合约的计算能力需要扩展。以最大的加密支付系统比特币为例,每秒钟只能够处理大约 3 到 7 笔交易5 ,且当前产生的交易的有效性受网络传输影响,往往需要等待 10 分钟左右的记账周 期才能让网络上的节点共同知道交易内容。此外,如果链上有两个及以上节点同时竞争到记账权力,则还需要等待下一个记账周期才能确认交易的准确性,最终由区块最长、记账内容 最多的链来完成确认。
完全去早灶卜中心化的系统与现实中大部分现有体系的兼容性不足,缺乏链上链下协同、多业 务发展的系统和功能,制约区块链技术的进一步落地。在区块链的技术落地过程中,首先, 各行业本身具有成熟的体系,区块链完全去中心化的形式不一定适合所有的领域和行业;其 次,区块链的陆穗平台设计和实际运行成本巨大,其所具备的低效率和延迟性的交易缺陷非常明 显,是否能够弥补原系统更换的损失需要经过一定的精算和比较;此外,使用区块链存储数 据需要对原有数据格式进行整理,涉及到政务、司法领域的敏感数据,更需要建立链接线上 和线下数据的可信通道防止数据录入有误,这带来了较高的人力、物力成本。
(2)隐私计算技术对区块链技术的帮助
隐私计算技术保障数据从产生、感知、发布、传播到存储、处理、使用、销毁等全生命 周期过程中的隐私性,弥补区块链技术的隐私保护能力,实现数据的“可用不可见”。通过 引入隐私计算技术,用户的收支信息、住址信息等个人数均以密文的形式呈现,在平台进行 数据共享的过程中,既能防止数据泄露,又能够保障用户个人隐私的安全,有利于进一步打 破数据孤岛效应,推动更大范围内的多方数据协作。隐私计算技术可与区块链技术形成技术组合,提升数据处理能力、扩大可应用范围。隐 私计算技术通过对数据进行规范化处理,能够提升数据处理、数据共享的效率,提升区块链 的数据处理能力。此外,隐私计算技术+区块链技术的技术组合能够应用于缺乏中心化系统、 但又对敏感数据分享有强烈需求的合作领域,扩展区块链技术的应用场景。
区块链技术的应用是否隐私计算技术的刚需
(1)隐私计算技术的局限性
第一,数据共享缺乏安全检验,制约数据流通的可信性
数据共享的整个流程涉及到采集、传输、存储、分析、发布、分账等多个流程,隐私计 算主要是解决全流程的数据“可用不可见”的问题,但是难以保证数据来源可信和计算过程 可信。
从数据来源可信的角度来说,在数据采集的环节,数据内容本身可能不完整,数据的录 入可能会存在失误;在数据传输的环节,数据的传输可能会被其他的客户端攻击,导致数据 在传输的过程中泄漏;在数据的储存环节,储存数据的角色方有可能会篡改数据或者将数据 复制转卖到黑市,这些都不会被隐私计算技术记录。如果无法保证数据共享各方的身份得到 “可信验证”,就有可能导致数据的隐私“名不副实”。从计算过程可信的角度来说,在数 据分析和发布的环节,数据的共享方有可能私自篡改数据的运行结果和发布内容,对最终数 据处理的结果进行造假。因此,一旦信息经过验证并添加到隐私计算的环境中,很难发现数 据是否被篡改、被泄漏,很难防止不同时间点不同节点的数据造假的情况,在涉及到金融、政务、医疗、慈善等关键领域里,如果数据有误则产生的一系列法律问题则难以追究。
第二,业务水平整体层次不齐,制约技术平台的扩展
当前,隐私计算的技术实现路径主要分为三种:多方安全计算、联邦学习、TEE 可信执行 环境。三种技术路径存在各自的应用缺陷和问题,由于行业内不同公司对于技术的掌握能力 和研发能力有限,导致技术平台的实际应用范围有限,可扩展能力不足。
多方安全计算尽管具有复杂高标准的密码学知识,但其计算性能在实际应用的过程中存 在效率低的缺陷。随着应用规模的扩大,采用合适的计算方案保证运算时延与参与方数量呈 现线性变化是目前各技术厂商面临的一大挑战。多方安全计算虽然能保证多方在数据融合计 算时候的隐私安全,但是在数据的访问、控制、传输等环节,仍然需要匹配其他的技术手段 防止数据泄露、篡改。
联邦学习技术目前在业内的应用通常以第三方平台为基础模型,在基础模型之上进行隐 私计算,这样的基础模型本身存在被开发者植入病毒的隐患。此外,联邦学习的机制默认所 有的参与方都是可信方,无法规避某个参与方恶意提供虚假数据甚至病害数据,从而对最终 的训练模型造成不可逆转的危害。由于联邦学习需要各个参与式节点进行计算,因此节点的 计算能力、网络连接状态都将限制联邦学习的通信效率。
TEE 可信执行环境在国内目前核心硬件技术掌握在英特尔、高通、ARM 等少数外国核心供 应商中,如果在关键领域从国外购买,则存在非常高的安全风险和应用风险。第三,数据共享缺乏确权机制,制约数据流通的应用性 隐私计算通过使用多方数据共同计算、产生成果,然而在实际合作的过程中,由于各个 数据共享方业务水平不同、数据质量不一导致在数据处理的每一个环节难以实现合理的确权。
按照常规的利益分配机制,拥有高质量数据、高成果贡献率的数据拥有方理应从中获取更多 的利润,但是隐私计算仅考虑到数据的“可用不可见”,数据共享方难以从最终结果来判断 谁的数据对于成果的贡献最大,造成利益分配的不公平。如果缺乏合理的成果贡献评估机制和利益分配机制,就会难以激励数据所有者和其他数 据持有者进行合作。尤其是在不信任的多方合作的场景下,会更加增加合作的信任成本,使 得多方协作难以达成,制约数据流通的实际应用性。
(2)区块链技术对隐私计算技术的帮助
区块链技术通过数据流通的所有环节、所有参与者进行记录,实现数据共享流程中的权 责分明,提升了数据流通的可信性。在数据传输的环节,区块链记录数据的提供者,确认数 据提供方身份的真实性和有效性,有利于数据确权,为公平可行的利益分配机制提供参考;在数据储存的环节,区块链保证数据的每一次修改都有迹可循,防止数据的恶意篡改。区块 链技术可作为隐私计算技术的底层平台,保证了加密数据本身的真实有效性,提升了隐私计 算平台里数据流通的可信性,拓展隐私计算技术的应用范围。
3. 结论
隐私计算技术和区块链技术的融合是必然的趋势。对于数据资产的流转来讲,没有隐私 计算,不能解决数据本身的安全和隐私保护问题;没有区块链,不能解决数据的确权问题以 及在更大范围内的数据网络协作问题。将区块链和隐私计算二者结合起来,建设大规模数据 流通网络,在目前的实践中成为有所共识的 探索 方向。
区块链与隐私计算的结合会改变什么?
1、形成大规模数据流通网络和数据要素市场
当前,数据流通存在三方面问题:数据拥有方的数据保护和数据确权难以实现;不同来 源数据的整合处理成本过高、缺乏统一标准;数据利益的分配机制不完善。
如前文所述,区块链和隐私计算技术相结合,可以一方面解决隐私保护问题,一方面解 决数据确权和多方协作问题,从而建立大规模的数据流通网络。
在大规模数据流通网络建立的基础上,真正意义上的数据要素市场才能够形成,数据作 为生产要素的价值才能够被充分发掘出来。
2、推动数据资产化的发展
所谓资产,是指由企业过去的交易或事项形成的,由企业拥有或者控制的,预期会给企 业带来经济利益的资源。
数据的资产化就是让数据在市场上发现价值,能够为企业创造新的经济益。
大规模数据流通网络和数据要素市场的形成,将大大推动数据价值的发现、数据资产化 的发展。
从企业一侧来看,企业的生产经营活动当中沉淀下来的数据会成为宝贵的资产。一方面, 对这些数据的分析和运用,将推动企业改善自身的业务;另一方面,与外部机构进行数据的 共享,能够推动数据发挥出更大的价值,企业自身也将从中获取更多收益。这会反过来进一 步推动企业的数字化转型和对数据资产的管理。未来,对数据资产的盘点可能成为企业在资 产负债表、现金流量表、利润表之外的“第四张表”。
数据资产化的发展,也会推动围绕数据价值挖掘形成全新的服务体系。其中包括数据确 权、定价、交易等各个环节。上海 社会 科学院信息研究所副所长丁波涛将未来数据资产服务体系中的机构分成四类:
第一类提供中介服务,包括数据经纪人,还有数据代理。
第二类提供数据评估,由于数据市场信息不对称或信息混乱,需要提供合规评估、数据 质量和数据价格的评估。
第三类提供价格咨询,如提供法律、经济咨询或者是上市辅导等的咨询服务企业。
第四类提供专业技术服务,包括数据开发、数据处理服务、数据交付服等。数据资产化的发展,带来的将是人们认知的提升、生产效率的提高、生产要素的重组、 创新的产生、经济的发展以及全 社会 整体福利的提升。
3、对现有业态的改变
区块链与隐私计算的结合,将提升企业和个人分享数据、利用数据的积极性,进一步推 动打破“数据孤岛”。其对现有业态的改变主要体现在以下几个层面:
第一,这将带来新的数据和 科技 变革。
首先,这将推动数据密态时代的到来。数据密态时代的核心,是数据流通使用方式的巨 大改变,数据将以密态形式在主体间流动和计算,显着降低数据泄露的风险,并在合规前提 下支撑各种形态业务的发展。此前,数据被加密之后只能用来传输或者存储,但是未来数据 在加密状态下可以被计算。这将带来一系列新的问题和挑战,引发许多相关技术领域的连锁 反应。
其二,这将重塑大数据产业。随着数据流通的安全化,以往较为敏感的数据领域逐渐开 放。以政务数据为例,隐私计算使联合政务、企业、银行等多方数据建模和分析成为可能, 进一步释放数据应用价值,创造了多样化的应用机遇。
其三,人工智能产业将获得新一轮的发展。数据、算法和算力是人工智能发展的三要素。近几年来,由于缺乏可用的数据,人工智能的发展遭遇瓶颈。未来,5G 和物联网的发展将使 得万物互联,数据量大幅增长。区块链+隐私计算技术的应用,可以使得人工智能利用海量数 据优化模型,真正迈向“智能化”。其四,这将为区块链产业的发展带来新的机遇。区块链与隐私计算相结合,将拓展联盟 链的节点数量,从而进一步扩大可协同利用的数据资源的范围。
第二,在 科技 变革的基础之上,区块链与隐私计算相结合,将给许多传统产业带来变革。
在政务领域,一方面,可以实现政府不同部门之间的互联互通及数据共享,从而促进政 府不同部门的协同,提高政府的效率以及决策质量,推动智慧城市的建设;另一方面,可以 促进政务数据与民间数据的双向开放。政务数据向 社会 开放,可以为企业或学界所用,释放 更多价值。民间的数据源向政府开放,可以提高政府在决策以及政务流程等方面的效率。
在金融领域,支付、征信、信贷、证券资管等各个领域都会因之发生变化。总体来看, 主要是影响到金融的风控和营销两个方面。区块链与隐私计算技术的结合,可以在符合法律 规定、不泄露各方原始数据的前提下,扩大数据来源,包括利用金融体系外部的互联网数据, 实现多方数据共享,联合建模,从而有效识别信用等级、降低多头信贷、欺诈等风险,也有 助于信贷及保险等金融产品的精准定价;同样,内外部多方数据的共享融合也有助于提高金融机构的反洗钱甄别能力。
在医疗领域,未来在疾病治疗、药物研究、医疗保险等多个领域,区块链与隐私计算都 能助推医疗信息化建设,带来巨大变革。在疾病治疗和药物研究方面,区块链与隐私计算结 合,能够促进更多的医疗数据被联合起来进行分析和研究,从而为许多疾病的治疗带来新的 突破。在医疗保险方面,区块链与隐私计算技术结合,主要是可以使得保险公司可以应用到 更多的数据,改善保险产品的设计、定价、营销,甚至可以促进保险公司对客户的 健康 管理 等。
区块链与隐私计算技术相结合,目前应用的重点领域是政务、金融、医疗领域,但是未来其应用将不仅仅局限于这三个领域,还将在更多领域发挥作用。
第三,数据权利、利益将重新分配。
这可能是区块链与隐私计算技术相结合所带来的最为核心,也是最为深刻的,与每一个人 的切身利益都息息相关的变革。
首先,这涉及到每个产业链不同环节利益的重新分配。
前述在广告营销领域的应用落地为例,此前广告营销的利益分配主要是在广告主与渠 道商之间。但是,未来应用区块链和隐私计算技术,可以在更大范围内进行数据协作,则要 解决广告主、多个渠道方、消费者之间多方数据协作的问题,这其中就涉及到多方之间权责 的划分、利益的重新分配。
其次,这还涉及到企业与个人之间利益的重新分配。
欧盟的 GDPR,美国的 CCPA 等法案中涉及用户的一项重要权益即“portability,(可携 带权)”。即第三方应用不能封锁个人数据,一旦个人有下载的诉求,APP 需要提供便利的 API 利于个人拷贝数据。美国公司已陆续为用户提供 API,如果在这方面功能缺失,个人客户 可以提出诉讼,而公司也将面临巨额的罚款。在中国的《个人信息保护法》当中,也有相关的条款。《个人信息保护法》第四十五条规 定,“个人有权向个人信息处理者查阅、复制其个人信息”、“个人请求查阅、复制其个人信息 的,个人信息处理者应当及时提供。个人请求将个人信息转移至其指定的个人信息处理者, 符合国家网信部门规定条件的,个人信息处理者应当提供转移的途径。”
目前,中国公司的区块链+隐私计算 探索 主要集中在 To B 服务领域,但是区块链是全球 化的商业,如果美国已经出现这样的模式,中国大概率不会完全不受影响。伴随着消费级软硬件技术能力的提升,区块链与隐私计算技术结合,会逐步对个人与机构 之间的数据服务进行变革。对于个人用户而言,将有机会获得自身隐私数据的完全掌控权, 并为数据业务过程中所涉及的数据隐私需求获得更强的技术性保障。目前关于 To C 服务的相关问题,国内业界还在探讨当中。
为什么区块链+隐私计算的应用尚未大规模普及?
第一,区块链+隐私计算的落地应用,主要是在涉及需要多方数据协作的情况,目前实际需求尚未爆发。
从隐私计算技术发展的角度来看,目前隐私计算尚在落地初期,解决的主要是两方之间 的数据协作问题,涉及到多方的场景还不多,因此很多时候还没有体会到对区块链+隐私计算 应用的需要。
从区块链技术发展的角度来看,区块链技术在许多领域的应用目前并非刚需。不少问题 可以应用区块链解决,但是不用区块链技术也能解决,而应用区块链技术解决的成本更高。因此,目前区块链项目的建设主要是政务部门和大型企业较为积极,因为政府和大型企业从 长远发展的角度来考虑,可以做前瞻性的投资建设和技术布局,但是大多数商业机构需要衡 量投入与产出。
区块链技术与隐私计算技术结合,主要是用于处理数据协作问题。从数据治理的角度来 看,目前大多数机构都在处理自身内部的数据治理问题,内部的数据体系梳理好之后,才涉 及到与外部进行数据协作,因此还需要时间。
第二,区块链+隐私计算的落地应用较为复杂,涉及到新商业模式的创造、权责以及利益 的重新分配,因此需要的时间更长。
以在广告营销领域的应用落地为例,目前的大多数应用 都只是落地了隐私计算平台,主要涉及两方数据协作,直接应用隐私计算技术,延续此前商 业应用即可。但是,如果引入区块链技术,则要解决广告主、渠道方、消费者之间多方数据 协作的问题,这其中可能涉及到多方之间权责的划分、利益的重新分配,新商业模式的形成 需要时间进行 探索 。
应用的大规模普及,还需要解决哪些问题?
区块链+隐私计算的应用在大规模铺开之前,还需要具备三方面的条件:
第一,从外部环境来看,需要全 社会 整体的数字化水平的提高。 打个比方,区块链+隐私 计算将来会形成数据流通的高速公路,但是路上要有足够的车。目前全 社会 的数字化正在快 速推进当中,大多数机构都是正在进行自身内部的数据治理,他们需要先处理好自己的数据, 之后才能产生更多的与外部数据进行协作的需求,这还需要时间。
第二,从技术发展来看,技术成熟尚需投入。 区块链+隐私计算技术的应用,实际上是牺 牲了数据流通的效率、提升了安全性,但是数据流通的效率也非常重要,未来需要在效率和 安全这两个方面形成一定的平衡,安全要保障,足够的效率也要满足,这其中涉及到许多技 术的研发、行业标准的制定,技术产品化的发展和完善、技术成本的进一步降低,还需要时 间。
第三,还需要相关法律法规的完善,以及数据交易商业模式的形成。 不过,这一条件与 前两个条件相比,其在目前的重要性相对次之。因为随着需求的爆发、技术的完善,相关的法律法规以及商业模式就会随之形成,这一条件在现阶段并非限制区块链与隐私计算技术落 地应用的最关键因素。
区块链+隐私计算的应用中还蕴藏着哪些趋势?
1、国产化的趋势
区块链+隐私计算的应用,涉及网络安全、数据安全,未来将成为新基建的重要组成部分。这是关乎网络空间主权、国家安全和未来发展利益的重要方面,因此这个领域的国产化是未来趋势。
在区块链+隐私计算技术应用的国产化当中,软件的国产化是相对容易实现的。难点在于 硬件的国产化,其中最难的部分是芯片的国产化。
这一部分的发展,与信创领域的发展相关。信创,即信息技术应用创新产业,其是数据 安全、网络安全的基础,也是新基建的重要组成部分。信创涉及到的行业包括 IT 基础设施:CPU 芯片、服务器、存储、交换机、路由器、各种云和相关服务内容;基础软件:数据库、操 作系统、中间件;应用软件:OA、 ERP、办公软件、政务应用、流版签软件;信息安全:边 界安全产品、终端安全产品等。
在区块链+隐私计算领域,目前已经有企业在尝试产品的国产化。例如,前文提到的,蚂 蚁链自研了密码卡、隐私计算硬件以及自研可信上链芯片,同时还推出了摩斯隐私计算一体 机。创业公司如星云 Clustar、融数联智也在进行相关国产化硬件产品的研发。
2、软硬件技术相结合、更多技术融合发展的趋势
目前,在区块链与隐私计算技术相结合的实践中,也呈现出了软硬件技术相结合、更多 技术融合发展的趋势。这主要是缘于几方面的需求:
第一,是加强数据安全性的需求。
隐私计算主要是解决数据在计算过程中不泄露的问题,区块链主要是解决存证问题,二者结合仅能解决数据安全的一部分问题。数据从产生到计算再到消亡,会涉及采集、传输、 存储、计算、销毁等多个环节,其生命周期可能会有数十年之久,要真正保障数据安全需要 一个更加全方位的、体系化的解决方案,以使得每个环节上都有对应的技术体系保障数据安 全 在数据采集阶段需要精心设计设备可信架构,在网络传输阶段需要合理运用安全协议, 在存储阶段需要兼顾加密与性能,在数据计算阶段需要灵活选择可信执行环境与密态运算。除此以外,计算环境的可信与安全在防御纵深建设上也至关重要。这些安全保障能力的技术 图谱会涉及到可信计算、软硬件供应链安全、隔离技术、网络与存储的透明加密、密钥管理、 可信执行环境等等。这其中每一个技术点都有软硬件结合、多种技术融合发挥的空间。
第二,是提升计算性能的需求。
隐私计算的性能目前还比较低,在计算机单机、单机和单机之间、计算机集群之间这三 个层面上都存在。
在计算机单机上,隐私计算由于运用了密码学技术,计算过程中涉及到很多加密解密的 步骤,这使得计算量以几何级数增加。以全同态算法为例,在通用芯片上密文运算的速度比 明文运算慢了 10 万倍。这意味着,做同样的运算,如果用全同态算法,在 Intel 最新的 Icelake 处理器上,跑出来的效果等同于 Intel 的第一代 8086 处理器,直接回退了数十年。这使得全 同态加密在现实情况下就不具备可用性了。算力问题也是导致全同态算法一直未得到广泛应 用的根本原因。
在单机之间和计算机集群之间,会涉及到单机之间和集群之间的通信效率问题。一方面, 主流的隐私计算技术无论是联邦学习还是多方安全计算,都有通信问题。密文膨胀、传输次 数膨胀,会导致单机之间网络传输效率成为隐私计算的瓶颈之一。另一方面,由于大多数隐 私计算的场景都是跨多方的,多方要通过公网进行通信,公网的带宽与时延目前也是巨大的 鸿沟。
性能的问题,会随着时间的推移越来越严重。2021 年,隐私计算的落地尚处于颇为早期 的阶段,主要是在一些机构内部或者是两方、三方之间应用,处理的数据量较小,这个问题 还不明显。可是未来,多方数据交换需求的到来、5G 和物联网的发展所带来的数据量急剧增 大,最终导致的将是数据量爆发式的增长,这需要消耗大量的算力。
到那时,隐私计算的性 能将面临巨大的挑战。现在在硬件的创新方面正处于体系结构的黄金时代。这是因为,移动互联网的飞速发展 使得应用场景发展很快,上层的软件也发展很快,这使得在计算机底层进行支持的硬件甚至 芯片都需要随之进行改变,进入了新一轮的创新周期。
而从区块链与隐私计算结合的长远发展来看,软硬件结合、多技术融合,对隐私计算来 说,可以提升性能、安全性和计算效果;对区块链来说,可以促使更多机构低成本加入联盟 链,扩大联盟链应用范围。
END
编辑 | 领路元
来源 | 零一 财经 《区块链+隐私计算一线实践报告(2022)》
⑵ 未来5年哪些技术将雄霸天下
3月19日-22日,IBM将召开IBM Think 2018大会,这个全球性的盛会将汇集40000多个高科技爱好者,会议主题将涵盖人工智能、数据分析以及物联网等诸多热点话题,旨在“让商业世界更智能”。
在这次活动中,IBM将给出他们对于未来五年的技术发展的预测,并解答有关新技术创新的问题以及这些创新会如何影响我们的生活。这五大技术预测包括Crypto-Anchors、Quantum Computing、Hacking、AI Bias、 AI Microscopes。
1. Crypto-Anchors
造假者人人喊打,而Crypto-Anchors和区块链结合起来能够有效打假。据悉,因经济欺诈全球每年会损失超6000亿美元,而IBM开发的防篡改数字指纹可嵌入产品中并与区块链链接以帮助证明真实性。
例如,Crypto-Anchors可以帮助证明拯救生命的药物是合法的,而不是伪造的。原本的疟疾药片可以涂上一层可食用的磁性墨水,只需简单扫描一下智能手机,医生或患者就可以立即发现该药片是安全和真实的。
除此之外,Crypto-Anchors还可以与特殊的光学设备、人工智能算法相结合,以识别物体的结构和标签,以验证它们是否真的如他们所说的。例如,一瓶1982年的波尔多葡萄酒或者昂贵的金属。
IBM设计了世界上最小的计算机,据了解这款电脑比我们平时见到的盐粒还要小,计算机能力可以达到1990年x86 PC的性能。
Crypto-Anchors的第一批模型可能会在未来18个月内推出,未来五年内,它们将推动各个领域的创新和进步。
2.量子计算
现在量子计算已经备受研究人员的青睐,五年内,量子计算必将成为主流,帮助开发人员解决之前一度被认为无法解决的问题。据IBM表示,量子计算只是将成为所有科学和工程计算的先决条件,大学教育将纳入量子计算的教学,量子算法和经典算法会同时教授。
而这些进步将推动着量子时代的到来,量子计算机将能够模拟更大的分子、化学反应和原子结合,这有助于新型材料的创造、个性化药物的开发以及更高效和可持续能源的发现。
未来,量子计算机不再是神秘的,会被普通大众所接受,未来五年内,业界将实现量子计算机和传统计算机共同解决特定问题的应用。
3.黑客
未来,量子计算机能够快速筛选出所有可能的安全概率,并且解密最强大的加密。目前IBM正在开发一种基于格密码的安全方法,它会将数据隐藏在格的复数代数结构中。
在数学领域,lattice存在很难解决的问题,而这个困难问题对于密码学家来说很有用,它可以用来保护数据,即使是在量子计算机中。
在数学领域,晶格存在很难解决的问题。这个困难对密码学家来说很有用,因为它可以用来保护信息,即使黑客在量子计算方面也是如此。基于格的密码术也是完全同态加密(FHE)的基础,而这可以在不查看敏感数据的情况下在文件上执行计算,从而防止受到攻击。通过FHE,信用报告机构可以在不解密个人数据的情况下分析和生成信用评分,初级保健医生可以在不透露患者身份的情况下共享医疗记录和相关数据。
目前我们的安全措施是严重不足的,未来五年,我们要在安全方面应该有更多的突破。
4. AI偏见
人工智能偏差将在未来五年内爆发。人工智能系统只与我们输入的数据保持一致,如果我们输入具有某些种族,性别或意识形态偏见的数据,那么人工智能偏见就会产生。不幸的是,许多AI系统现在都在接受这些不良数据的培训。IBM研究人员正在考虑如何确保人为偏差不会影响AI。
MIT-IBM Watson AI实验室正在研究使用计算认知建模来构建在决策中应用某些人类价值观和原则的机器,这其中的一个关键原则是避免偏见和歧视。IBM研究人员开发了人工智能算法,通过从之前被认为具有歧视性的数据中学习,减少了训练数据的偏差。IBM科学家还在开发一种无偏差的AI服务,a)补偿数据偏差,b)跟踪训练集中的偏差,或者c)引入偏差。最终用户可以确定每个场景中的可信度和偏差程度。
在未来的五年内,减少人工智能系统的偏差将是人类信任人工智能的关键,而且只有无偏差的人工智能才能生存。
5. AI显微镜
2025年,世界将有一半以上的人口生活在水资源紧张的地区,因此科学家们正在努力收集相关数据以防止这种情况发生。但即使是能够探测到水环境和化学物质的专门传感器,也不会无法预测意想不到的情况。
而检测浮游生物是一种感知水生健康的有效方法,但因为它们的微观大小,研究这些生物是困难的。IBM的研究人员正在建造小型、自主、人工智能的机器人显微镜,可以监测浮游生物,更好地了解浮游生物的行为,以及它们如何应对环境变化,并预测供水威胁。显微镜的芯片可以捕捉浮游生物的影子,从而产生一个健康的数字样本,而不需要聚焦。
在未来5年内,这些显微镜将发展的足够先进,能够在本地和实时分析解释数据。
⑶ 大数据发展的前景怎么样
我国大数据产业发展得如何?未来发展存在哪些机遇和挑战?
随着信息技术和人类生产生活交汇融合,全球数据呈现爆发增长、海量集聚的特点。无论是国家、企业还是社会公众,都越来越认识到数据的价值。因此,近年来,各地纷纷成立大数据发展局,企业纷纷推动数据资产治理,大数据辐射的行业也从传统的电信、金融逐渐扩展到工业、医疗、教育等。一时间,仿佛各行各业都在谈大数据,人人都在谈大数据。但也有声音说大数据迎来了“七年之痒”,面对大数据热潮也需要一些“冷思考”。我国大数据究竟发展得如何?未来我国大数据发展还有哪些机遇和挑战?
一、中国大数据产业进展显着
过去几年,大数据理念已经深入人心,“用数据说话”已经成为所有人的共识,数据也成了堪比石油、黄金、钻石的战略资源。五年来,我国大数据产业政策日渐完善,技术、应用和产业都取得了非常明显的进展。
1、在政策方面,我国从中央到地方的大数据政策体系已经基本完善,目前已经进入落地实施阶段。自从2014年“大数据”这个词写入政府工作报告以来,我国大数据发展的政策环境掀开了全新的篇章。在顶层设计上,国务院《促进大数据发展行动纲要》对政务数据共享开放、产业发展和安全三方面做了总体部署。《政务信息资源共享管理暂行办法》《大数据产业发展规划(2016-2020)》等文件也都已经出台。十九大报告中提出“推动大数据与实体经济深度融合”,“十三五”规划中提出“实施国家大数据战略”。
卫健、农业、环保、检察、税务等部门还出台了领域大数据发展的具体政策。截至2019年初,所有省级行政区都发布了大数据相关的发展规划,十几个省市设立了大数据管理局,8个国家大数据综合试验区、11个国家工程实验室启动建设。可以说,大数据的政策体系已经基本搭建完成,目前已经纷纷进入落地实施甚至评估检查阶段。
2、在技术方面,我国大数据技术发展属于“全球第一梯队”,但国产核心技术能力严重不足。我国独有的大体量应用场景和多类型实践模式,促进了大数据领域技术创新速度和能力水平,处于国际领先地位。在技术全面性上,我国平台类、管理类、应用类技术均具有大面积落地案例和研究;
在应用规模方面,我国已经完成大数据领域的最大集群公开能力测试,达到了万台节点;在效率能力方面,我国大数据产品在国际大数据技术能力竞争平台上也取得了前几名的好成绩;在知识产权方面,2018年我国大数据领域专利公开量约占全球的40%,位居世界第二。但我国大数据技术大部分为基于国外开源产品的二次改造,核心技术能力亟待加强。例如,目前国内主流大数据平台技术中,自研比例不超过10%。
3、在产业方面,我国大数据产业多年来保持平稳快速增长,但面临提质增效的关键转型。2018年,我国大数据产业延续多年来的增速,继续保持相对高速的增长。
据前瞻产业研究院发布的《中国大数据产业发展前景与投资战略规划分析报告》统计数据显示,2015年我国大数据产业规模已达2800亿元。截止至2017年我国大数据产业规模增长至4700亿,同比增长是30.6%。初步测算2018年我国大数据产业规模达到5400亿元左右,同比增长15%。预测在2020年我国大数据产业规模将突破万亿元。然而,综合国内外环境、新兴技术发展等多种因素,大数据产业的增速出现了下滑。我国的大数据产业也面临着从高速发展向高质量发展的关键转型期。
2015-2020年我国大数据产业规模统计情况及预测
数据来源:前瞻产业研究院整理
4、在应用方面,大数据的行业应用更加广泛,正加速渗透到经济社会的方方面面。随着大数据工具的门槛降低以及企业数据意识的不断提升,越来越多的行业开始尝到大数据带来的“甜头”。无论是从新增企业数量、融资规模还是应用热度来说,与大数据结合紧密的行业正在从传统的电信业、金融业扩展到政务、健康医疗、工业、交通物流、能源行业、教育文化等,行业应用“脱虚向实”趋势明显,与实体经济的融合更加深入。
二、中国大数据产业五大发展挑战分析
虽然我国大数据总体发展形势良好,也面临难得的发展机遇,但仍然存在一些困难和问题。
1、涉及核心技术的产业发展薄弱,未能有效提升我国核心技术竞争力
核心技术的影响力在大数据产业有着极高的重要性。由于大数据企业在完成产品开发后,可以近乎零成本无限制的复制,因此拥有核心技术的大企业,很容易将技术优势转化会市场优势,即凭借具体的信息产品赢得海量用户获得垄断地位。当前,从大数据技术与产品的供给侧看,我国虽然在局部技术实现了单点突破,但大数据领域系统性、平台级核心技术创新仍不多见。大数据处理工具都是“他山之石”,大部分企业用的都是国外的数据采集、数据处理、数据分析、数据可视化技术,自主核心技术突破还有待时日。尤其是开源产品的技术标准方面,我国的影响力尚亟待提升。
2、数据孤岛和壁垒降低了大数据产业资源配置效率
大数据产业发展必须实现数据信息的自由流动和共享,如果数据不开放、不共享,数据整合就不能实现,数据价值也会大大降低。无论是政府数据、互联网数据还是其他数据,数据拥有者往往不愿对其进行开放流通。受制于前期信息基础设施建设,目前我国政府数据往往还存在着诸多“数据孤岛”和“数据烟囱”,数据价值难以发挥。
3、数据安全管理薄弱增加了大数据产业的发展风险
大数据技术为经济社会发展带来创新活力的同时,也使数据安全、个人信息保护乃至大数据平台安全等面临新威胁与新风险。海量多源数据在大数据平台汇聚,来自多个用户的数据可能存储在同一个数据池中,并分别被不同用户使用,极易引发数据泄露风险。利用大数据技术对海量数据(21.90
-5.19%,诊股)进行挖掘分析所得结果可能包含涉及国家经济社会等各方面的敏感信息,需要对分析结果的共享和披露加强安全管理。
4、产业垄断与恶性竞争现象频发,“劣币驱逐良币”现象明显
由于资源型产业门槛低、利润高,新兴的大数据企业往往首先将目光盯在获取数据资源上面。大量依托数据资源优势的企业诞生,为大数据产业带来了低附加值的垄断经济模式,使得依靠技术壁垒打江山的企业不得不面对残酷的市场竞争,放缓了技术研发的步伐。同时,数据垄断问题也愈发明显。少数互联网巨头企业拥有巨大数据,不但对产业发展不利,甚至存在巨大的数据聚集隐患。
5、各地发展同质化严重,普遍存在重存储轻应用的现象
由于缺乏统一的大数据产业分类统计体系和产业运行监测手段,各地大数据产业的定位相似,同质化竞争加剧。而盲目的重复建设,更是可能导致大数据产业过剩。同时,由于部分地区信息化发展程度有限,大数据应用场景不够丰富,更是以数据中心等大数据存储设施的建设作为发展大数据产业的关键,且规模巨大,目标动辄以百万台计,后期若无法有效利用,将造成巨大的资源浪费。
三、未来三年中国大数据产业将呈现四大发展特点
未来三年,是我国大数据发展转型的重要机遇期。大数据的发展本身也呈现着一些趋势。在我看来,未来三年大数据行业有可能会呈现出如下特点:
1、大数据新技术继续快速发展
未来大数据技术将会沿着工具平台云化部署、多业务场景统一处理、专有高性能硬件适配几个方面进行突破。目前大数据技术工具的主要应用模式为应用企业在自建机房内独立部署,其存在资源浪费、弹性能力不足、管理复杂等缺点,这些缺陷可以通过基于云计算技术的云化部署方案解决,助力大数据技术工具的快速落地和应用;同时大数据技术工具主要瞄准的是分析型业务场景,但随着电子商务以及智能终端的爆发性发展,转账、计费等事务型业务场景也需要大数据处理能力,所以未来的多业务场景统一处理技术将会得到充分发展;最后由于GPU/TPU等专用硬件的发展,此类专用硬件能够助力某些大数据技术进行突破性升级,所以对新型硬件的适配成为很多大数据企业未来研发计划的重点。
2、数据流通共享将迎来关键突破
这些年,推动数据开放共享的政策举措一直在加强,然而效果与预期还有差距。可以说,技术手段将是数据流通共享瓶颈突破的关键。未来三年,随着同态加密、差分隐私、零知识证明、量子账本等关键技术的性能提升和门槛降低,随着区块链、安全多方计算等工具与数据流通场景进一步紧密结合,数据共享和流通将有望再前进一大步。
3、数据服务合规性将成为行业关注重点
近两年来,随着欧盟《通用数据保护条例》(GDPR)的颁布和正式实施,个人信息保护的重视程度被提到了前所未有的高度。GDPR对数据主体的权利规定细致入微,其“数据可携权”“被遗忘权”等方面的规定可能会对我国数据立法带来一定的参考。对我国企业来说,数据服务合规性的重要程度进一步提升,将对企业业务开展带来重大影响。目前中国信息通信研究院正在着力推动的“可信数据服务”计划也正是契合了行业的这一需求。
4、数据资产管理重要性将进一步提升
随着大数据应用进入深水区,企业将越来越重视数据资产管理方法论体系建设——即从架构、标准、研发、质量、安全、分析到应用的统一,从而实现技术到业务价值的转化和变现。未来三年,数据资产管理将仍是企业数据部门面临的难点与挑战。即使是领先的科技型企业,在数据资产管理这一课题上仍在不断探索新的方法,如全链路智能管理体系、数据资产的贡献度、数据基线度量与质量规范的工具化、可视化等。
四、四大建议应对挑战
大数据产业作为具有国家战略意义的新兴产业,在发展初期不仅要充分发挥企业的主体作用和有效市场的主导作用,而且要更好发挥政府的引导作用。
1、要加强核心技术攻关与产业化推动
自主研发创新是提高大数据产业竞争力的主引擎。要彻底改变目前我国大数据产业创新能力不强、关键核心技术对外依赖度偏高的这一局面,必须抓住重点领域、关键环节和核心问题,找准着力点和突破口,加大政府财政资金的引导支持力度。为此,建议在国家层面上设立大数据重点领域的关键技术研发创新的国家财政专项资金,支持突破一批关键核心技术研发创新与应用,构建具有核心技术自主权的大数据产业链,形成自主可控的大数据技术架构,提高关键核心技术的自主研发创新能力,有效破解制约产业发展的瓶颈。
2、完善大数据安全政策
需要开展数据确权、资产管理、市场监管、跨境流动等数据治理的重大问题研究,协调有关部门共同推进数据治理的法制化进程,加强对敏感政务数据、企业商业秘密和个人数据的保护。同时,推动完善适用于大数据环境下的信息安全等级保护制度,建立兼顾安全与发展的数据管理和保障体系,加强数据安全评测、安全防范、应急处置等相关机制建设。此外,还要强化网络空间的安全信息共享与动态感知能力,提高重大风险识别分析水平。
3、鼓励地方因地制宜发展大数据产业
大数据产业发展应注重差异化发展,形成差异化的产业布局。地方需要差异化发展,应该把大数据的发展重心放在因地制宜地促进应用创新上,放在打造完善的发展环境上,让市场在大数据发展要素配置上起决定作用。各地要结合产业基础和优势特色,着重发展大数据特色场景应用,推动大数据与当地重要实体经济行业加快融合。
4、推动行业加快大数据标准建设
当前大数据产业应用层出不穷,政府应通过标准化的途径规范行业、整合资源,促进各方达成共识,为大数据产业的健康发展提供基石。尤其是通过加强快速迭代、市场认可度高的行业/团体标准研制工作,为用户企业提供大数据产品选型指导,为数据安全提供保障,促进大数据交易等新兴服务模式规范发展,对推动我国大数据产业进程具有重要意义。
⑷ 隐私计算-密码学-同态加密
近年来,随着大数据与人工智能的盛行,针对个人的个性化的推荐技术的不断发展,人们在享受便利的同时,也深深的感觉到无处不在的监控与监事,比如刚刚浏览了一个网站的商品,当去其他网站访问的时候就会推荐类似的产品;刚刚搜索了某件商品,在很多其他的场景中都会给你推荐。这种体验,谈不上不好,也谈不上多坏,但是如果仔细想想,就感觉自己的网上进行裸奔,个人隐私,一清二楚,毫无隐私可言,细思极恐。
不过随着广大用户对于个人隐私的重视程度不断加强,以及法律法规的不断完善,针对个人隐私的保护提出了更高的要求,什么样的数据可以采集、收集与使用,如何使用都是一个比较敏感的问题。十三届全国人大常委会第三十次会议表决通过了《 中华人民共和国个人信息保护法 》,并与2021年11月1日起施行。确立个人信息保护原则、规范处理活动保障权益、禁止“大数据杀熟”规范自动化决策、严格保护敏感个人信息、赋予个人充分权利等。新规施行后,违法的主体将 最高可处五千万以下或者上一年度营业额百分之五 以下的罚款。
鉴于上述情况,近年来隐私计算技术被不断的提及,源于其有优秀的数据保护作用,使得 “数据不出域、数据可用不可见、数据可算不可见” ,限定了数据的使用场景,防止了数据的泄露,而引起了业界的热捧。
隐私计算技术的演进历程如下图描述,以下是杨强教授在KDD 2021中国区的分享材料:
可以看到,隐私计算技术从1979年就开始了,最开始是安全多方计算、到差分隐私、到TEE, 再到最近火的不能再火的联邦学习 ,一系列的技术应运而生。那为啥现在隐私计算这么火呢。
注:隐私计算技术成熟度曲线
但是这些技术本身的安全加密都是采用共同的方法与策略,下面讲述下隐私计算的加密技术。
本文主要介绍同态加密,
众所周知,优秀的程序员需要 严谨的逻辑思维与具象能力 ,当然在材料的时候,可能需要适当的渲染。但是对于技术的理解,对技术的探索,严谨的逻辑与坚实的推理是非常重要的。所以,对于“数据加密”这个命题,需要进行一番探索。
如此三态合一,即可保障数据的全链路的生命周期安全 。
那么有没有办法解决数据计算的安全问题呢?答案就是 同态加密技术 。保障数据的运行态的安全,那么同态加密技术具体是如何实现,如何应用,并且有哪些限制呢?
什么是同态加密? ,引用Gentry大佬的原话:
同态加密(Homomorphic Encryption, HE),指满足密文同态运算性质的加密算法,即数据经过同态加密之后,对密文进行某些特定的计算,得到的密文计算结果在进行对应的同态解密后的明文等同于对明文数据直接进行相同的计算, 实现数据的“可算不可见” 。同态加密的实现效果如图所示。
举个例子: 国内某家大型的三甲医院,由于历史悠久,并且医术精湛,历史遗留了大量的用户病例数据 。如今思考基于这些病例数据进行建模分析。但是由于数据量特别巨大,医院本身的IT资源有限,计算能力不足。
这个时候,云厂商找了过来。但是对于医院来说,这些数据本身是用户的隐私信息,并且也是医院的核心价值,所以尽管云厂商再三保证数据安全, 但是医院还是不能够放心的将数据上传到云厂商进行计算 。
正当这个事情推进不下去的时候,云厂商从密码行业花大价钱招来某个大牛,大牛提出一个方案,这样吧,我们现在有 这样一门技术,不需要传输明文数据,只需要传输密文就好,而且加密秘钥由医院自己保存,我们基于上传的密文数据做不解密的密态运算( 并计算函数医院提供就好),这样数据不会泄露,云厂商对数据无感知,之后传回密文结果,医院自己解密就好 。医院一听非常高兴,那就这么办吧。
下面将核心流程描述下。
这里,大家可能有个问题,这个f应该是什么样的函数,有什么样的限制条件?HE方案是支持任意的数据处理方法f,还是说只支持满足一定条件的f呢?根据f的限制条件不同,HE方案实际上分为了两类:
Paillier加密算法是Pascal paillier[1]在1999年发明的概率公钥加密算法,该算法 基于复合剩余类的困难问题,是一种满足加法的同态加密算法 ,已经广泛应用在加密信号处理或第三方数据处理领域。
前面我们分析过 同态加密的核心流程 ,大家可以一起回忆一下。核心的函数包括:秘钥生成、明文加密、密文解密,下面我们来一步一步的分析,并且描述下,
秘钥的生成主要有如下的步骤,
下面介绍一个完整的同态运算,m由 组成,介绍下同态加密的是如何使用密文计算的。
⑸ 同态加密的同态加密的主要应用
云计算、电子商务、物联网、移动代码等。