导航:首页 > 文档加密 > 量子计算pdf

量子计算pdf

发布时间:2023-06-14 21:02:04

Ⅰ 春节在家不再无聊,这份2019 AI研究进展回顾陪伴你

2019 年可以说是“预训练模型”流行起来的一年。自 BERT 引发潮流以来,相关方法的研究不仅获得了 EMNLP 大会最佳论文等奖项,更是在 NLP、甚至图像领域里引领了风潮。

去年也有很多 游戏 AI 取得了超越人类的水平。人工智能不仅已经玩转德州扑克、星际争霸和 Dota2 这样复杂的 游戏 ,还获得了 Nature、Science 等顶级期刊的肯定。

机器之心整理了去年全年 在人工智能、量子计算等领域里最为热门的七项研究 。让我们以时间的顺序来看:

第一个重磅研究出现在 2 月,继发布刷新 11 项 NLP 任务记录的 3 亿参数量语言模型 BERT 之后,谷歌 OpenAI 于 2019 年 2 月再次推出了一种更为强大的模型,而这次的模型参数量达到了 15 亿。这是一种 大型无监督语言模型 ,能够生产连贯的文本段落,在许多语言建模基准上取得了 SOTA 表现。此外,在没有任务特定训练的情况下,该模型能够做到初步的阅读理解、机器翻译、问答和自动摘要。

该模型名为 GPT-2,它是基于 Transformer 的大型语言模型,包含 15 亿参数、在一个 800 万网页数据集上训练而成。训练 GPT-2 有一个简单的目标:给定一个文本中前面的所有单词,预测下一个单词。GPT-2 是对 GPT 模型的直接扩展,在超出 10 倍的数据量上进行训练,参数量也多出了 10 倍。

GPT-2 展示了一系列普适而强大的能力,包括生成当前最佳质量的条件合成文本,其中我们可以将输入馈送到模型并生成非常长的连贯文本。此外,GPT-2 优于在特定领域(如维基网络、新闻或书籍)上训练的其它语言模型,而且还不需要使用这些特定领域的训练数据。在 知识问答、阅读理解、自动摘要和翻译等任务 上,GPT-2 可以从原始文本开始学习,无需特定任务的训练数据。虽然目前这些下游任务还远不能达到当前最优水平,但 GPT-2 表明如果有足够的(未标注)数据和计算力,各种下游任务都可以从无监督技术中获益。

最后,基于大型通用语言模型可能会产生巨大的 社会 影响,也考虑到模型可能会被用于恶意目的,在发布 GPT-2 时,OpenAI 采取了以下策略: 仅发布 GPT-2 的较小版本和示例代码,不发布数据集、训练代码和 GPT-2 模型权重

机器学习顶会的最佳论文,总会引起人们的广泛讨论。在今年 6 月于美国加州举办的 ICML 2019(国际机器学习大会)上,由苏黎世联邦理工学院(ETH)、德国马普所、谷歌大脑共同完成的《Challenging Common Assumptions in the Unsupervised Learning of Disentangled Representations》获得了其中一篇最佳论文。研究者在论文中提出了一个与此前学界普遍预测相反的观点:对于任意数据,拥有相互独立表征(解耦表征)的无监督学习是不可能的。

论文链接:https://arxiv.org/abs/1811.12359

在这篇论文中,研究者冷静地审视了该领域的最新进展,并对一些常见的假设提出了质疑。

首先,研究者表示从理论上来看,如果不对模型和数据进行归纳偏置,无监督学习解耦表征基本是不可能的;然后他们在七个不同数据集进行了可复现的大规模实验,并训练了 12000 多个模型,包括一些主流方法和评估指标;最后,实验结果表明,虽然不同的方法强制执行了相应损失“鼓励”的属性,但如果没有监督,似乎无法识别完全解耦的模型。此外,增加的解耦似乎不会导致下游任务学习的样本复杂度的下降。

研究者认为,基于这些理论,机器学习从业者对于超参数的选择是没有经验法则可循的,而在已有大量已训练模型的情况下, 无监督的模型选择仍然是一个很大的挑战

去年 6 月,来自德国波恩-莱茵-锡格应用技术大学和谷歌大脑的研究者发表了一篇名为《Weight Agnostic Neural Networks》的论文,进而引爆了机器学习圈。在该论文中,他们提出了一种神经网络架构搜索方法, 这些网络可以在不进行显式权重训练的情况下执行各种任务

论文链接:https://arxiv.org/pdf/1906.04358.pdf

通常情况下,权重被认为会被训练成 MNIST 中边角、圆弧这类直观特征,而如果论文中的算法可以处理 MNIST,那么它们就不是特征,而是函数序列/组合。对于 AI 可解释性来说,这可能是一个打击。很容易理解,神经网络架构并非“生而平等”,对于特定任务一些网络架构的性能显着优于其他模型。但是相比架构而言,神经网络权重参数的重要性到底有多少?

来自德国波恩-莱茵-锡格应用技术大学和谷歌大脑的一项新研究提出了一种神经网络架构搜索方法,这些网络可以在不进行显式权重训练的情况下执行各种任务。

为了评估这些网络,研究者使用从统一随机分布中采样的单个共享权重参数来连接网络层,并评估期望性能。结果显示,该方法可以找到少量神经网络架构,这些架构可以在没有权重训练的情况下执行多个强化学习任务,或 MNIST 等监督学习任务。

BERT 带来的影响还未平复,CMU 与谷歌大脑 6 月份提出的 XLNet 在 20 个任务上超过了 BERT 的表现,并在 18 个任务上取得了当前最佳效果。

来自卡耐基梅隆大学与谷歌大脑的研究者提出新型预训练语言模型 XLNet,在 SQuAD、GLUE、RACE 等 20 个任务上全面超越 BERT。

作者表示, BERT 这样基于去噪自编码器的预训练模型可以很好地建模双向语境信息,性能优于基于自回归语言模型的预训练方法 。然而,由于需要 mask 一部分输入,BERT 忽略了被 mask 位置之间的依赖关系,因此出现预训练和微调效果的差异(pretrain-finetune discrepancy)。

基于这些优缺点,该研究提出了一种泛化的自回归预训练模型 XLNet。XLNet 可以:1)通过最大化所有可能的因式分解顺序的对数似然,学习双向语境信息;2)用自回归本身的特点克服 BERT 的缺点。此外,XLNet 还融合了当前最优自回归模型 Transformer-XL 的思路。

延伸阅读:

2019 年 7 月,在无限制德州扑克六人对决的比赛中,德扑 AI Pluribus 成功战胜了五名专家级人类玩家。Pluribus 由 Facebook 与卡耐基梅隆大学(CMU)共同开发,实现了前辈 Libratus(冷扑大师)未能完成的任务,该研究已经登上了当期《科学》杂志。

据介绍,Facebook 和卡内基梅隆大学设计的比赛分为两种模式:1 个 AI+5 个人类玩家和 5 个 AI+1 个人类玩家,Pluribus 在这两种模式中都取得了胜利。如果一个筹码值 1 美元,Pluribus 平均每局能赢 5 美元,与 5 个人类玩家对战一小时就能赢 1000 美元。职业扑克玩家认为这些结果是决定性的胜利优势。 这是 AI 首次在玩家人数(或队伍)大于 2 的大型基准 游戏 中击败顶级职业玩家

在论文中,Pluribus 整合了一种新的在线搜索算法,可以通过搜索前面的几步而不是只搜索到 游戏 结束来有效地评估其决策。此外,Pluribus 还利用了速度更快的新型 Self-Play 非完美信息 游戏 算法。综上所述,这些改进使得使用极少的处理能力和内存来训练 Pluribus 成为可能。 训练所用的云计算资源总价值还不到 150 美元 。这种高效与最近其他人工智能里程碑项目形成了鲜明对比,后者的训练往往要花费数百万美元的计算资源。

Pluribus 的自我博弈结果被称为蓝图策略。在实际 游戏 中,Pluribus 使用搜索算法提升这一蓝图策略。但是 Pluribus 不会根据从对手身上观察到的倾向调整其策略。

在人工智能之外的量子计算领域,去年也有重要的研究突破。2019 年 9 月,谷歌提交了一篇名为《Quantum supremacy using a programmable superconcting processor》的论文自 NASA 网站传出,研究人员首次在实验中证明了量子计算机对于传统架构计算机的优越性:在世界第一超算 Summit 需要计算 1 万年的实验中,谷歌的量子计算机只用了 3 分 20 秒。因此,谷歌宣称实现“量子优越性”。之后,该论文登上了《自然》杂志 150 周年版的封面。

这一成果源自科学家们不懈的努力。谷歌在量子计算方向上的研究已经过去了 13 年。2006 年,谷歌科学家 Hartmut Neven 就开始 探索 有关量子计算加速机器学习的方法。这项工作推动了 Google AI Quantum 团队的成立。2014 年,John Martinis 和他在加利福尼亚大学圣巴巴拉分校(UCSB)的团队加入了谷歌的工作,开始构建量子计算机。两年后,Sergio Boixo 等人的论文发表,谷歌开始将工作重点放在实现量子计算优越性任务上。

如今,该团队已经构建起世界上第一个超越传统架构超级计算机能力的量子系统,可以进行特定任务的计算。

量子优越性实验是在一个名为 Sycamore 的 54 量子比特的完全可编程处理器上运行的。该处理器包含一个二维网格,网格中的每个量子比特与其他四个相连。量子优越性实验的成功归功于谷歌改进了具有增强并行性的双量子比特门,即使同时操作多个门,也能可靠地实现记录性能。谷歌使用一种新型的控制旋钮来实现这一性能,该旋钮能够关闭相邻量子比特之间的交互。此举大大减少了这种多连通量子比特系统中的误差。此外,通过优化芯片设计来降低串扰,以及开发避免量子比特缺陷的新控制校准,谷歌进一步提升了性能。

虽然 AI 没有打败最强人类玩家 Serral,但其研究的论文仍然登上了 Nature。2019 年 10 月底,DeepMind 有关 AlphaStar 的论文发表在了当期《Nature》杂志上,这是人工智能算法 AlphaStar 的最新研究进展,展示了 AI 在“没有任何 游戏 限制的情况下”已经达到星际争霸Ⅱ人类对战天梯的顶级水平,在 Battle.net 上的排名已超越 99.8%的活跃玩家

回顾 AlphaStar 的发展历程,DeepMind 于 2017 年宣布开始研究能进行即时战略 游戏 星际争霸Ⅱ的人工智能——AlphaStar。2018 年 12 月 10 日,AlphaStar 击败 DeepMind 公司里的最强玩家 Dani Yogatama;12 月 12 日,AlphaStar 已经可以 5:0 击败职业玩家 TLO 了(TLO 是虫族玩家,据 游戏 解说们认为,其在 游戏 中的表现大概能有 5000 分水平);又过了一个星期,12 月 19 日,AlphaStar 同样以 5:0 的比分击败了职业玩家 MaNa。至此,AlphaStar 又往前走了一步,达到了主流电子竞技 游戏 顶级水准。

根据《Nature》论文描述,DeepMind 使用通用机器学习技术(包括神经网络、借助于强化学习的自我博弈、多智能体学习和模仿学习)直接从 游戏 数据中学习。AlphaStar 的 游戏 方式令人印象深刻——这个系统非常擅长评估自身的战略地位,并且准确地知道什么时候接近对手、什么时候远离。此外,论文的中心思想是将 游戏 环境中虚构的自我博弈扩展到一组智能体,即“联盟”。

联盟这一概念的核心思想是:仅仅只是为了赢是不够的。相反,实验需要主要的智能体能够打赢所有玩家,而“压榨(exploiter)”智能体的主要目的是帮助核心智能体暴露问题,从而变得更加强大。这不需要这些智能体去提高它们的胜率。通过使用这样的训练方法,整个智能体联盟在一个端到端的、完全自动化的体系中学到了星际争霸Ⅱ中所有的复杂策略。

2019 年在 AI 领域的各个方向上都出现了很多技术突破。新的一年,我们期待更多进展。

此外,机器之心于 2019 年 9 月底推出了自己的新产品 SOTA 模型,读者可以根据自己的需要寻找机器学习对应领域和任务下的 SOTA 论文,平台会提供论文、模型、数据集和 benchmark 的相关信息。

Ⅱ 量子计算机能有效计算蛋白质折叠问题吗

优化经验函数时,量子计算可以帮上的是quantum genetic algorithm,Grover algorithm,解线性方程做优化算法或者量子退火其中Grover能把大小为N的搜索空间用根号N的计算难度找到最优解。但这有两个问题,其一是原来非多项式的搜索空间根号后还是很大,其二是Grover复杂度和计算系统time evolution的精读有关(根据quantum computing and quantum information那本书第六章),精度差一点就N的3/4方了,再差一点就线性了...解方程的HHL算法(https://arxiv.org/pdf/0811.3171.pdf)可以把原来N的线性方程计算时间减到logN level,可惜prepare任意quantum state(AX=b中的b)目前没有什么好方法,可能又要花上N的时间,于是实际中没有提高。再者就是蛋白能量函数是nonconvex,而且形状很差,用convex方法不保证能找到minimum量子退火是个wild card,并非通用量子计算机,我了解得更少,主要原理是利用量子尺度下波函数扩散面积大可以穿过energy barrier的特性,可以帮助突破local minimum,对蛋白会有帮助,对RNA折叠估计帮助更大,因为RNA的energy landscape要陡峭的多。QGA算法是个heuristic方法,利用量子比特能同时表达多个答案的特性,对答案们同时进行evaluation。这个算法很多研究者来自于非洲阿尔及利亚的University Mentouri(Comparison of Genetic Algorithm and Quantum Genetic Algorithm和Multiple Sequence Alignment by Quantum Genetic Algorithm)。在这两篇文章里,QGA的结果都优于先前方法(亦没有好得太惊人...)。但是西班牙的Rafael Lahoz-Beltra在Quantum Genetic Algorithm for Computer Scientists中指出,由于QGA不同于Simple GA,各个答案间并非独立(由同一串量子比特表达),于是进化筛选操作相当于将所有答案同时rotate向附近的最优解,所以会迅速收敛于local minimum,在他自己的benchmark上QGA表现和一些GA变种差不多,但是不如原始版的GA。所以Quantum heuristic能否在protein上好用要测试后才知道。之后,蛋白折叠精确度还受到energy function准确度的限制,就算目前最好的Rosetta,算得死去活来也经常给你一些完全就是直链的结构... 这点上,从原子物理性质出发的分(原)子模拟精确度会好得多。

Ⅲ 《理性的边界人类思维和世界的复杂关系》pdf下载在线阅读,求百度网盘云资源

《理性的边界》(诺桑·亚诺夫斯基)电子书网盘下载免费在线阅读

链接:https://pan..com/s/11KlZp7s20o-oJfReI6kxxg

提取码:e2lm

书名:理性的边界

作者:诺桑·亚诺夫斯基

译者:王晨

豆瓣评分:8.2

出版社:中信出版集团

出版年份:2019-11-1

页数:424

内容简介:

我们对世界了解得越多,对自己所不知道的东西就越清楚,发现可能之局限的方式,就是比可能走得更远!

一本比肩《世界观》和《为什么》的科学哲学通识,探索科学的极限,挑战人类对宇宙、理性和自我的根深蒂固的信念。

欧洲数学学会、得克萨斯大学哲学系、麦吉尔大学计算机系、伯尔尼大学哲学研究所推荐阅读!

从亚里士多德、牛顿到爱因斯坦、玻尔,科学的每一次进步,都源自科学家对人类知识极限的不断探索,对客观、理性和自我的深刻问题的一次次挑战。

有许多书解释了人类已知的科学,而这本书则聚焦于我们不知道的知识。研究领域横跨数学、物理学和计算机科学的美国科学家诺桑·亚诺夫斯基,希神世望通过探索未知,指出人类知识边界,并找到突破极限的方法。

亚诺夫斯基解读了量子的奇异性、相对论的意义、混沌理论的诞生过程、无限大的不同层次、无法用正常方法解决的数学问题、正确但无法证明的事游李肢实,为我们展示了知识的极限,并找到了制约人类认知的核心原因——隐藏在思想、逻辑和语言中的矛盾性。亚诺夫斯基认为,总结这些矛盾的共性,就能更好地理解理性的结构,找到突破知识极限的方法。

让我们阅读《理性的边界》,顺着亚诺夫斯基的笔触,遥望理性边界之外的未知领域,跳脱现有的科学体系,重新思考世界,认识自身,理解人类思维与世界的复杂关系。

作者简介:

诺桑·亚诺夫斯基,美国数学扰冲家、物理学家、计算机科学家,纽约城市大学计算机和信息科学教授。他继承数学大师塞缪尔·艾伦伯格“范畴论”的衣钵,并在量子力学、哲学和语言学方面发表了大量研究论文,获得了美国科学和数学界的多个奖项。他还着有《元范畴》和《计算机科学中的量子计算》等书。

阅读全文

与量子计算pdf相关的资料

热点内容
python编程基于自然语言处理库 浏览:133
javaseruntime 浏览:902
cad如何将命令放在鼠标旁边 浏览:746
程序员对粉色 浏览:125
编译器命令java 浏览:989
云服务器怎么数据同步 浏览:685
c盘文件修复命令语 浏览:966
文件夹中文件怎么上下移动 浏览:831
魅族手机用什么软件解压 浏览:763
加密币糖果 浏览:300
c编译调试是什么 浏览:631
安装mysql服务命令 浏览:734
程序员cpa考试 浏览:200
汕头买房用什么app好 浏览:23
民生原号码掉失如何登录app 浏览:710
如何设置服务器的重生点 浏览:272
租用服务器地址如何查询 浏览:575
编译的英语是啥 浏览:313
服务器如何上传网站东西 浏览:207
编译器怎么通过系统控制台输出的 浏览:469