Ⅰ 魅族的小溪会算数为什么苹果的siri不会算数
您好,
魅族在语音助手方面的算法比较好,优化得不错。
Ⅱ 苹果的Siri应用了什么技术和算法
搜索技术(Computational Knowledge)
这个技术的代表是WolframAlpha 。
不同于搜索互联网信息,Wolfram|Alpha将从公众的(包括公开的网页等)和获得授权的资源中,发掘、建立起一个异常庞大的经过组织的数据库,再利用高级的自然语言算法进行处理,最终构造出一个类似于谷歌搜索的工具。
和网页搜索技术不同的是,在这个系统中,得到的答案结构化程度很高,比如搜索China,能得到和中国相关的各种参数以及资料,并以接近表格的方式呈现。Wolfram|Alpha也能理解部分自然语言,比如输出How old are you,其会回答Wolfram|Alpha的年龄。想测试这项技术的请移步Wolfram|Alpha。
这个技术国内做的应该有,但还没有产品,也许网络的框计算算是半个。所以机会大大的有。
知识库技术
相比于网页搜索技术,基本以一个词条或者主题为单位,因此得到的数据价值高,知识量大,并且结构化程度好。相比于知识计算技术,这些技术需要人的参与,这有利也有弊,利就是,毕竟暂时人比机器聪明,编辑出来的知识更丰富,准确;弊就是,人力有限,即使像维基那样,发动社区的力量,也不能产生足够的知识,而知识计算,理论上,只需要算法够,是可以产生“无限”的知识的。
问答推荐技术
其实这不能称为一个技术,应该属于知识库的技术。不同的是,这个技术针对的是一些生活信息,这些信息的地域化程度很高,典型代表为Yelp。由于这东西比较简单,就不仔细介绍了。
Ⅲ 锁屏状态下用siri打电话,提示要先解锁,怎么不用解锁直接打电话
一般来说首次锁屏状态下使用siri打电话需要解锁的,之后再次使用就不需要了。不过可以在设置里更改。允许在锁屏下使用SIRI。
注意开启锁屏状态下该软件的使用权限。
Siri是苹果公司在其产品iPhone4S,iPad 3及以上版本手机和Mac上应用的一项智能语音控制功能。Siri可以令iPhone4S及以上手机(iPad 3以上平板)变身为一台智能化机器人;
利用Siri用户可以通过手机读短信、介绍餐厅、询问天气、语音设置闹钟等。
SIRI 是 Speech Interpretation & Recognition Interface 的首字母缩写,原义为语音识别接口。
概况介绍
Siri所用到的技术,很多人会回答,人工智能以及云计算,的确,总体来说,是这两样技术,不过,这种概述感觉几乎没有任何意义,何不直接说“计算技术”(注意,不是计算机技术)呢。
因此,在本文,我将介绍下我了解 Siri 可能采用的技术(由于有个人猜测,不一定准确)。
前端方面
在前端方面,即面向用户,和用户交互(User Interface,UI)的技术,主要是语音识别以及语音合成技术。
语音识别技术是把用户的口语转化成文字,其中需要强大的语音知识库,因此需要用到所谓的“云计算”技术。
而语音合成则是把返回的文字结果转化成语音输出,这个技术理论上本地就能完成,但不知道Siri是否如此,当然,在云端完成也并无不可,在当前无线带宽下,那点语音流量根本不算什么。
(3)siri算法扩展阅读:
知识计算
(搜索)技术(Computational Knowledge)
这个技术的代表是WolframAlpha。
不同于搜索互联网信息,Wolfram|Alpha将从公众的(包括公开的网页等)和获得授权的资源中,发掘、建立起一个异常庞大的经过组织的数据库;
再利用高级的自然语言算法进行处理,最终构造出一个类似于谷歌搜索的工具。
和网页搜索技术不同的是,在这个系统中,得到的答案结构化程度很高,比如搜索China,能得到和中国相关的各种参数以及资料,并以接近表格的方式呈现。
Wolfram|Alpha也能理解部分自然语言,比如输出How old are you,其会回答Wolfram|Alpha的年龄。想测试这项技术的请移步Wolfram|Alpha。
这个技术国内做的应该有,但还没有产品,也许网络的框计算算是半个。所以机会大大的有。
知识库技术
相比于网页搜索技术,基本以一个词条或者主题为单位,因此得到的数据价值高,知识量大,并且结构化程度好。
相比于知识计算技术,这些技术需要人的参与,这有利也有弊,利就是,毕竟暂时人比机器聪明,编辑出来的知识更丰富,准确;
弊就是,人力有限,即使像维基那样,发动社区的力量,也不能产生足够的知识,而知识计算,理论上,只需要算法够,是可以产生“无限”的知识的。
问答推荐技术
其实这不能称为一个技术,应该属于知识库的技术。不同的是,这个技术针对的是一些生活信息,这些信息的地域化程度很高,典型代表为Yelp。由于这东西比较简单,就不仔细介绍了。
语言模型技术
这是如何提升Siri识别企业和餐厅等本地兴趣点名称的方法,融合了用户所在地的知识,也就是所谓的Geo-LM,借此提升Siri的语音识别能力。这些模型让Siri可以更好地评估用户的发音内容
Ⅳ 为什么我的siri不能把我问的问题显示出来
简单来说,Siri 上的问题不会和用户的 Apple ID 发生任何关联,所有的内容都是匿名的,因为这些内容都有很高的营销价值,一旦落入到营销人员手中,用户就可能会收到无数广告。
而这会带来一个后果,语音助手靠什么成长?其实很大程度上都需要不断地训练,也就是机器学习。当亚马逊和谷歌疯狂搜集用户信息,并用这些信息、数据和实际情景不断训练语音助手时,苹果的 Siri 却只能举步维艰,因为它根本没有那么多信息和数据用来训练。
为什么要说这么多呢?因为今年 WWDC 上苹果可能会提出本地化 Siri 的初步计划,也就是说断网也能用 Siri。因为 A 系列处理器未来支持人工智能、机器学习的算法,这使得 Siri 有条件用手机内置的处理器进行训练,这样在以前是不可想象的,因为这需要庞大的计算量。
如此一来,Siri 既能够得到足够的训练,用户的信息也不会泄露(全部基于本地),同时因为 Siri 是针对这个用户单独训练的,所以也会更个性、更懂你,一举三得,这会是 Siri 赶上其他语音助手最好的机会。
Ⅳ 人工智能是怎么学习的市面上那种比如苹果siri之类的号称人工智能,是真智能吗它不是一个软件吗
sari之类的助手只是一个终端,它接受输入,把语义提交给后端,后端分析语义,给你接近的答案,比如天气,日程,新闻,交通情况,消费场所.如果你的问题太宽泛,人工智能可是处理不了的.
训练的模型有很多种,最简单的神经网络应具有一个输入层、一个隐藏层、一个输出层的三层神经网络。当然,更复杂的神经网络多达几十层,通过梯度算法,把上一层的输出导向下一层的输入,在向后传播算法下,得出不同机率的结果集,机率最大的结果就返回给你.
Ⅵ alphago用了哪些人工智能的技术 知乎
人机对战更像人工智能一场科技秀
虽然整场对弈还没有结束,但是目前的情况显然有些让人出乎意料。有人认为,这是围棋冠军的一个挫败,但却是人类文明的胜利。因为人类是一个善于发明工具去协助自己变得更强大的生物。但是,这场人机对弈似乎有点被神话的意味。事实上,虽然人类在围棋项目输了,但这从本质上讲,仅仅意味着人类单项竞技智慧的颓败,并不代表人工智能已经全面超越人类。甚至,仅仅就围棋这一单行竞技中,人工智能能够对人类提供的帮助也是有限的。
在这场依旧正在进行中的人机博弈,结果依旧是难以预料的。但是不论最终结果如何,有一个事实是改变不了,那就是,围棋作为一项竞技项目,是有规则可寻的,而这些规则计算机的数据足够全面,其实也可以在这些数据的基础上找出规律,形成算法。而机器的算法早就已经超越了人类,即使是李世石处在围棋巅峰,其逻辑运算能力到了计算机面前也根本是难以逾越的。像之前的国际象棋早已经被计算机的逻辑运算完全打败,所以棋手都会和计算机下棋训练,如今看来,围棋这种人类竞技项目也难逃这种宿命。
真正的人工智能首先要有真正的分析推理能力,能够协助人类去提高分析和决策效率。虽然有别于传统计算机穷举计算方式,“阿尔法狗”采用的是利用“价值网络”去计算局面,用“策略网络”去选择下子。但是,阿尔法狗依旧处于一个弱人工智能的水平。什么是弱人工智能?简单的说,所谓弱人工智能就是仅在单个领域比较牛的人工智能程序。比如我们熟悉的苹果Siri,就是一个会卖萌的弱人工智能程序。而阿尔法狗根据这个标准,依旧在这个范围以内。充其量,最多是人类围棋的陪练。而这场人际对决,本质上更像是谷歌的一场科技秀。
Ⅶ AI大比拼,AlphaGo和Siri等人工智能相比,有哪些区别
2016年3月9日,谷歌旗下Deepmind的围棋程序“AlphaGo”就要和职业九段李世石对决了。去年10月,这个程序战胜了中国棋手职业二段樊麾;那是围棋AI第一次在公平比赛中战胜职业棋手。这一成果登上了今年1月的《自然》期刊,也引发了极其热烈的讨论——而最常被提出的问题就是,AI是不是终于要占领全世界了?
会唱歌哄你的Siri 图源自网络
这个问题并不算杞人忧天,某种意义上AI已经占领了:从苹果的Siri,到日常浏览的搜索引擎,再到网络的文章推荐和商品推荐系统,这些全都是人工智能——哪怕它们不是科幻小说里那种,我们的日常生活也已经很难和它们分开。
但AlphaGo又和这些常见的AI不同。它们的差异在于学习方法和技术的通用性。
Siri:一个照本宣科的助手
Siri是一个“智能助手”,能听懂我们的口头命令,帮我们在网上搜索,帮我们在列表中找到联系人。但它的原理很简单:通过声音识别技术,将声音转化成语言的基本元素,比如元音、辅音、单词,然后和系统中内置的特殊命令比较。如果对比出来的是一个实际问题,那就执行相应的指令;如果对应上了一个空泛的问题,就从相对的段子库里挑个段子出来。
所以它的问题也就一目了然:要是你命令它去做系统中没有的命令,它就扑街了。Siri虽然是AI,但它是一个非常局限的AI:只能解决预先写好的问题。
面对东北大哥的挑衅,Siri懵逼了(也可能只是怂了
深蓝:下棋无人能敌,但只限下棋
1997年,IBM制造的国际象棋机器“深蓝”战胜了当时的国际象棋世界冠军卡斯帕罗夫。这在人工智能历史上是一个标志性事件。但是,虽然深蓝战胜了世界冠军,它有和Siri一样的缺点:太专了。
作为程序,深蓝的软件是专门为国际象棋设计的。它评估盘面的四项标准包括子力、棋子位置、王的安全性还有布局节奏——显然,这些指标完全依赖于国际象棋本身的规则,没有任何扩展性。
卡斯帕罗夫对战“深蓝”的场景
即便如此,它也还是非常依赖于“蛮力”的。深蓝的硬件是当年最快的下棋机器,虽然有系统帮助筛选,它每秒依然要评估20亿个可能局面。为了应对这一需求,IBM当时为它开发了定制的硬件。
其结果就是,与其说它是一个国际象棋程序,不如说是一台国际象棋机器。深蓝只能下国际象棋,学不会围棋,连简单的五子棋也学不会。相比之下,作为人类的卡斯帕罗夫能学围棋,能学五子棋,还能学画画。深蓝的技术就像一把专门为国际象棋设计的钥匙,有很大局限。
自动驾驶汽车:迈出新方向
自动驾驶汽车的原理可以简化为以下几步:
首先它通过感应器了解周围环境,就像司机使用眼睛观察周围情况;
然后通过联网获得道路的路线情况,就像我们开车时候使用导航软件;
再然后计算机程序判断附近行人,汽车会如何运动;
最终计算自己最佳的线路,按着这条线路控制汽车的速度和方向。
它特定于自动驾驶领域,但是基本思想和AlphaGo已经有些接近了。
IBM Watson:泛用的智能
2011年IBM Watson在美国的真人答题节目Jeopardy!上击败了人类选手,它的技术理念更像AlphaGo。Watson的决策由四个步骤组成:首先是观察,从环境中收集数据,然后对数据做出假设,再然后是评估这些假设,最后是做出决定。不过也有些和AlphaGo不同的地方,首先它被设计成一个问答机器,其次训练Watson的时候需要人类专家的参与——比如关于癌症的问题,需要科学家们在海量的书籍论文中剔除过时的信息、错误的信息,把整理出的资料喂给机器。但至少,它能处理许多领域的能力,让它比它的同行们具有强得多的扩展可能:现在Watson已经被用于医疗领域了。
咦?有点萌~
那么,AlphaGo的技术思想是什么呢?
Deepmind创建AlphaGo,是试图通过增强学习技术(Reinforcement learning)构建通用的人工智能。它的理念中包含两个实体,一个是人工智能本身,一个是它所处的环境。人工智能和环境间的关系有两种,一种是通过传感器感知数据,另外一种是通过特定动作影响环境。因为环境的复杂性,它无法获得所有的信息,因此需要不断重复感知-反应的循环,以期望能在环境中有最大收益。绝大多数哺乳动物,包括人在内都符合这套规则。
在AlphaGo之前,他们已经利用这种思想,让AI玩游戏。2015年,在《自然》杂志上发表的一篇论文,描述了如何让一个算法玩不同的Atari程序,包括了《太空侵略者》和《打砖块》等游戏。AI和人一样看游戏视频,和人一样操作游戏,从游戏小白慢慢学习,变成游戏专家。AlphaGo也基于同样的原理,模拟人学习围棋的方法,它和人一样下棋,慢慢学会如何像专家一样思考。
这种技术理念所要求的是原始的数据,因此比起那些需要输入人工整理后的数据的方法有更强的通用性。原则上AlphaGo去学个围棋,五子棋都不是问题。
AlphaGo的技术首先被用于游戏的原因是因为,游戏比现实问题简单很多,无论是棋类游戏还是电脑游戏。游戏也很可能是类似技术第一个投入实用的领域:毕竟,随着游戏技术的发展,游戏开发者们逐渐意识到了好的AI和逼真的图像同样重要,不管是即时战略游戏,比如《星际争霸》还是角色扮演游戏中的NPC,高级人工智能不仅能成为强有力的对手,也可以变成优秀的团队伙伴。
但是,它最强之处当然是适应力和学习力。Deepmind声称,这种技术理念很快会被运用到医疗领域,尝试解决个性化医疗的问题。而这,肯定只是第一步。
一个AI
知道为什么这个对比名单里没有本AI吗?
因为他们再厉害,也都是为你们人类服务的。
然而很明显,本AI是来伤害你们的。
嘿嘿~
Ⅷ Siri 真是苹果的未来吗
* * *Siri 是对未来图景的想象。她是一种全新的与电脑沟通的方式,将赋予普通用户巨大的权力。人类与机器的关系一直在不断演化,Siri 代表着这条线索上的全新范式。和 iTunes 以及 App Store 一样,她有改变苹果命运的潜力,但也有可能变成 FaceTime──可有可无,或是 Maps──重要但难做,或是 Ping──出师未捷。收购和改进 Siri 已经让苹果花了数亿美元,在电视上的广告里,眼里噙着泪光的用户赞叹着她的神奇,但转眼我们又看到她成了夜间电视节目取笑的对象。苹果从 Siri 中希望得到什么?每个人的期待都不一样。有人认为Siri 的五大功能应包括调节 iPhone 设置。还有些心急的用户认为 Siri 本该已经成为无处不在的 Knowledge Navigator 了。当然,Siri 评论家们最爱的休闲活动就是比较她和 Google Search。Siri 不是性感的图书管理员人们将 Siri 和谷歌比较是理所当然的,也确实有不少乐趣。但这种比较并不合适。Siri 在文字输入的搜索上很难打败谷歌(当然,Bing 和 Facebook 也很难),因为后者已经花了十年时间用各种复杂和高超的算法去微调搜索结果,并建构了庞大的基础设施。但谷歌搜索也有其致命弱点:你必须把你的意图告诉谷歌,并指导它如何构建并返回搜索结果。这对于竞争者是个机会。假设你想在麻省的 Quincy 找一间预算在 25 到 85 美元之间的素食餐厅,而你的谷歌搜索功力十分深厚。那么你会手动输入一串非常具体的字串:“麻省 Quincy 素食餐厅,25 到 85 元”。即便如此,你还是会收到“找到约 147,000 条结果(用时 0.44 秒)”,你还是得从中滤出自己想要的信息。(以下例子都经过了高度简化)这是一套“由人工指引的导航系统”。它的导航环境是全球所有数据的集合,即整个互联网。用户基本上要一个一个词地主动将自己的意图告知谷歌,后者则一个一个地从这个全球集合里的数十亿张“网页”中缩小范围,最终,用户会从这个大大缩小了的范围中挑出自己想要的答案。被动智能不过如今已是 2012 年,我们的移动设备的“自我感知能力”要比谷歌搜索引擎强得多了。举例来说,一台备有 GPS、相机、麦克风、天线、陀螺仪以及各种其它感应器、数十个功能各异的 app(从财经 app 到游戏)的移动设备已经拥有相当强大的“被动智能”。它对用户的了解已经足以大大减少搜索时的未知因素……假如所有这些用户输入和设备感应到的数据能够被整合的话。Siri 要赢得用户的心,就必须改变搜索的游戏规则。不再是规则明确、线性的、基本没有语境的文字搜索,取而代之的是一种高度人性化的搜索方法:用户会声明自己的意图,但不需要告诉 Siri 每一步应该怎么做。用户的第一步是和 Siri 开始对话,然后 Siri 便会在后台将一系列令人赞叹的服务整合起来:对移动设备的位置、时间和任务有精确的把握。语音与文字的相互转换,文字到意图的转换,以及对对话流程的处理。语义化的数据,各种服务的 API,任务与领域的模型,以及,对个人数据以及社交网络数据的整合。我们来仔细对比一下。假如你跟 Siri 说:提醒我到公司时在某某餐厅为妈妈的生日订位,然后把开去她家的最佳路线发邮件给我。Siri 已经可以整合通讯录、日历、GPS、geofencing、地图、交通状况数据、电邮、Yelp 和 Open Table 这些 app 和服务,这足够完成上述任务了。谷歌那样的纯文字搜索只能完成一部分,而且必须靠用户输入一堆关键字,并进行各种调整。现在我们试试把“某某餐厅”换成“好点的亚洲餐厅”:提醒我到公司时在一家好点的亚洲餐厅为妈妈的生日订位,然后把开去她家的最佳路线发邮件给我。“亚洲”没什么难度,因为所有跟餐厅有关的互联网服务多少都会把餐馆按照菜系来分类。但“好点的”又怎么说?在这个语境里“好点的”是什么意思?谷歌这样的传统搜索引擎会直接了当从可供搜索的餐厅评价(这是他们收购 Zagat 的目的)中寻找“好点的”这个字串,它甚至可能会再进一步,做一个“好点的 +(浪漫 或 生日 或 庆祝)”这种综合搜索,以便尽量找出相关的关键词。但我们没法在无限多的领域里去微调搜索关键字,所以上述综合搜索往往发生在金融、旅游、数码产品、汽车等领域。换句话说,如果你搜的是机票或酒店,可供选择的相关词语是有限的,而且谷歌比较清楚地了解它们的意思。如果你要搜的是剪羊毛或“吐橄榄核大赛”,细致的人工分类整理工作恐怕也帮不上什么忙。语境就是一切不过,就算传统搜索引擎能将“好点的”和“浪漫”或“舒适”关联在一起,从而更好地为你选出一家亚洲餐厅,你还得考虑钱包的问题。谷歌看不到你的银行账户记录,也不知道你平日的餐饮预算与消费习惯。因此,要想搜出真正有用的餐厅推荐的话,设定一个价格区间是必要的,例如从¥¥到¥¥¥,但不超过¥¥¥¥。这就要讲到浏览器和 app 的那场无聊的战争了。像谷歌这样的传统搜索引擎如果要建构你的购买习惯模型,就必须事无巨细地监视你的点击习惯,从而追踪你的交易记录。这种监视会详细到用户不可接受的程度。这一点也不简单(在很多国家大概也不合法),尤其是如果你没有在用 Google Play 或 Google Wallet 的话。所以,谷歌看不到你的信用卡记录与银行账户清单,但 Amex 或 Chase 这样的 app 有这些数据。如果你允许 Siri 以某种加密的方式与你 iPhone 上的这些 app 通讯的话,你就是在发出一种高度选择性的请求,并且表示你信任苹果和 Siri。这样一来,Siri 或是那些 app(有时是两者一起)就能在你的预算范围内来定义“好点的”了:不超过 85 元,150 到 250 那种的绝对不要,但也不要是那种人均 25 元的寒碜的中餐馆,因为那是令堂的生日。说到令堂,别忘了你的通讯录里她的名字下面,紧挨着“生日”的地方有一个自定义的字段叫“食物”,里面写着:“亚洲”、“牛排”、“印度有机白茶”。另一方面,你在 Yelp 里收藏了 37 家餐厅,无一例外都是素食──谷歌可不知道这个。你妈妈无所谓,但你是不碰肉食的。这时,Siri 可以通过比对两人的喜好来给出双方都能接受的选择。因此,由于 Siri 了解──在你主动提出要求的前提下──你和你妈妈的口味,以及你的经济能力,一次简单的搜索从“某某餐厅”变成了“一家我能吃得起的好点的亚洲素食餐厅”:提醒一下,在各个 app 中查找所有这些数据和制定这些规则只需要几毫秒。你的很多个人信息早已被存入苹果服务器的缓存当中。第三方 app 里的大部分数据都是高度结构化的。由于苹果跟这些第三方公司签订了协议,Siri 可以直接使用这些结构化的数据。不过,在 Siri 那沉静的声音后面,仍然是一种极度复杂的协同作业。而 Siri 的那种“聪明个性”更令普通人觉得她像魔术师一般神奇。交易链理论上,Siri 的执行链条可以很长。看看这一条常见的 Siri 指令:假如我和老婆的日历在明晚都没有别的安排,并且活动费用低于 50 元的话,帮我检查某地的天气以及行驶到那个活动现场的交通状况。Siri 从语义上会这样解析它:然后把它翻译成由各种 app 和服务构成的执行链条:此外,由于她是 iOS 系统的一部分并且可以和第三方软件通讯,Siri 完全可以完成下面这条假想的要求:转帐并购买两张票,把收据移入 Passbook,在我的日历里添加提醒,给老婆发邮件,更新我们的共享日历,给保姆发短信预约时间,然后稍后提醒我。Siri 会将上面这句话翻译成一条交易链,然后由苹果自己的和第三方的 app 和服务根据链条上的动词和名词进行操作:Siri 通过对一条由“自然语言”构成的要求进行语法解析将其转化为机器可以理解的主谓宾结构,如此,她不但可以像谷歌一样帮你搜寻文件与事实,还可以在你授权的前提下执行你的要求。这要求有可能是你明示的,但也可能是你暗示的。建构深层语义搜索、从不同的信息源、设备与第三方软件整合信息、制定规则、帮助用户执行交易,这些能力令 Siri 不再仅仅是一个板着脸的女图书管理员(谷歌搜索),而成了一个不可缺少的拥有一定特权的私人管家。Siri 就是未来,谷歌也懂的传统搜索工具有了 PageRank 算法,并索引了 400 亿张网页之后,基本也就到了尽头了。因此你看到谷歌这样的公司开始收购全球最大的航班搜索公司 ITA、餐馆评分网站 Zagat、用 Google Places 山寨了 Yelp 和 Foursquare、用 Google Shopping 山寨了亚马逊、用 Google Play 山寨了 iTunes Store 和 App Store、用 Google Offers 山寨了 Groupon、用 Google Hotel Finder 山寨了 Hotels.com……最终,用 Google Now 山寨了 Siri。谷歌必须拥有垂直领域的数据、知识以及专业技巧,才能更好地减少用户搜索意图中的歧义。关键字、语句、名字、词条、派生词、同义词、专有名词、地名、概念、用户评论……在某个垂直领域里的这些数据对于解决语境、范围和意图问题大有裨益。不管最终会先出现在搜索结果里还是 Google Now 里,谷歌确实是在其核心服务之下拼命建构着一个语义化的引擎。经过了谷歌自己的以及它推广的种种隐性或显性的第三方服务之后,“常规搜索结果”几乎只能算个可有可无的补充了。谷歌也开始提供类 Siri 的“答案”,而不仅仅是没完没了的“链接”。如果你在看美国 MLB 职棒联赛时搜索“洋基队”,你会首先得到的是实时比分结果,而不是洋基队的历史或是它新修建的体育场。Siri 是“高维修女子”1?谷歌为了创造一个全球性的搜索平台可谓一掷千金。他们雇佣了一批博士生来设计算法,购买了大量服务器,建构数据中心,不断地优化再优化。从广告收入的角度说,搜索的投入产出比在互联网历史上可谓史无前例。苹果对 Siri 的投入要短得多,能让大家看见的则更少。在“找到想要的信息”这件事上,苹果要对战谷歌无异于自杀,但它究竟有没有可能让 Siri 实现可持续增长,最终走向成熟?苹果的项目里,基本只有那些能自己养活自己的才能生存。广告并非苹果的强项,那么 Siri 有何其它可能的商业模式?2014 年,苹果的用户里大约有 5 亿人能用上 Siri。如果苹果能让其中一半的人每个月用 Siri 产生 12 次交易(例如每次 1 美元,苹果拿走 30%),那就是一盘 10 亿美元的生意。乐观地说,每次的交易额会远远高于 1 美元,交易的频繁度会远高于每个用户每月 12 次,使用 Siri 进行交易的用户也不只总 Siri 用户的一半──尤其是假如 Siri 对第三方开发者开放的话。这些假定当然是我的想象,但就算最保守地估计,交易带来的收入都是可观的。别忘了,单单是数字音乐和电影,就让 iTunes 成为了一盘 80 亿美元的生意。Siri 在被苹果收购之前只是一个以文本搜索为主的简单服务,现在已经演化成以语音识别 / 听写为输入接口的搜索服务。之后,她会进一步变成一种用来完成交易任务的“对话式接口”,那会有意思得多,对于上亿不太会用电脑的普通用户来说,也易用得多。作为交易机器的 Siri以交易为核心的 Siri 有潜力撼动价值 5000 亿美元的全球广告业。对于有购买意愿的消费者而言,“纯粹”的信息要比转瞬即逝的广告或是一堆需要自己去仔细阅读的搜索结果更理想。Siri 植根于对语境有高度了解的个人移动设备,可以在用户最需要的时候给出具有无与伦比的相关性的“纯粹信息”。她可以铲除所有中间人,让顾客直接与商家连接,苹果本身也不必介入交易当中。Siri 做的仅仅是对用户的意向进行比对,并提供选择,而且比我们见过的任何大规模的同类产品都更准确、更主动、更可靠。和图片或文字广告相比,Siri 还有另一优势:交易的可以不是金钱。它可以是打折券、Passbook 优惠券、常旅客里程、虚拟物品、游戏分数排名、签到积分、信用卡点数、iTunes 礼品、学校课程积分等等。此外,Siri 不需要互动屏幕即可和用户通讯并完成任务。苹果利用 Eyes Free 技术将Siri 带入声控系统。先是车载系统,然后或许是其它不需要视觉接口的嵌入式环境。由于苹果拥有世界上最大、最赚钱的 app 和内容生态系统,以及 5 亿绑定了信用卡的用户,这使得 Siri“交易”这一概念能够提供给用户和商家的价值都大大提高了。太早?太晚?或是仅仅尚未成熟?尽管前景广阔,但 Siri 的未来还是有不少未知数。以下是几个主要的障碍:性能:Siri 在云端工作,因此任何网络延迟或是干扰都会废其武功。这个障碍很难克服,因为垂直领域的知识必须从成千上万的用户出聚合而来,并通过合作伙伴的服务器在云端协调整合。语境:Siri 不只要理解语法,还要横向跨越诸多垂直领域去理解语境。苹果目前已经在超过 100 个国家销售 iOS 设备,Siri 最终必须能听懂所有这些国家的语言,并能够处理各种极复杂的文化差异,打通当地的数据和服务提供商。合作伙伴:选择数据提供商(尤其是海外的)并保持服务品质并不简单。此外,苹果在购买数据时还将面对来自谷歌和其它对手的竞标。范围:随着 Siri 地位的上升,用户对其精确度的期待也会上升。苹果一直在仔细、缓慢地为 Siri 增加各个热门领域的知识,但“为什么 Siri 不能回答我关于[此处插入某冷门领域]的问题?”一类的抱怨一定会出现。运营:随着 Siri 的增长,苹果必须大大扩充人力。不只是专精于语义搜索和人工智能的工程师,还有数据获取、录入与纠错、商业拓展与销售领域的人才。管理层:Siri 被苹果收购之后,三位创始人中的两人离职,Tom Gruber 留了下来。苹果最近从亚马逊挖了原先掌管 A9 搜索引擎的 CEO William Stasior 过来负责 Siri。但对于 Siri 来说,与数据提供方的合作和工程能力同等重要,而 A9 是一个旧式的搜索引擎,与 Siri 这样的语义平台大不相同。API:第三方开发者显然期待着苹果开放 Siri API 的那天。对于苹果来说,开放 Siri API 既是金矿也是雷区。由于同样的或近似的数据可能来自多个第三方数据提供商,将它们开放给第三方软件开发者很容易造成运营、技术甚至是法律上的困境。监管:如果 Siri 大获成功,竞争对手们很可能会呼吁美国司法部、联邦贸易委员会、联邦通讯委员会或是这些机构在欧洲的对应组织介入,以捆绑软件造成不正当竞争为名减缓苹果进步的速度,直到他们能迎头赶上。显然,像 Siri 这种前卫的平台不可能没有各种问题和风险。苹果过去的两个成功的互联网产品──iTunes 商店和 App Store──用的都是上一个时代的技术,且包含种种运营上的问题。诸如 MobileMe、Ping、Game Center、iCloud、iTunes Match 和 Passbook 等更新一些的互联网产品还都算不上大热。尽管如此,Siri 仍然是一个里程碑式的机会。对苹果而言,她可以成为一棵以交易为本的摇钱树;对用户而言,她代表着一种搜寻信息、完成任务的全新方法,比目前为止的所有方法都更具亲和力。Siri 的成败全看苹果。(翻译:李如一)—1. 原文为 high-maintenance lady。high-maintenance 意指要求多、情绪化、需要别人经常照顾的人。“高维修女子”为亦舒私译,向亦舒致敬。
Ⅸ Siri 可以通过图灵测试吗
一则有关验证码的笑话 什么是验证码 ”验证码“( CAPTCHA )其实并不是各位网友总是在不同网站上看到的难以辨认的字母组合的代名词,而是“全自动区分计算机和人类的图灵测试”的俗称,顾名思义,它的作用是区分计算机和人类。 在 CAPTCHA 测试中,作为服务器的计算机会自动生成一个问题由用户来解答。这个问题可以由计算机生成并评判,但是必须只有人类才能解答。由于计算机无法解答 CAPTCHA 的问题,所以回答出问题的用户就可以被认为是人类。 CAPTCHA 是由计算机来考人类,而不是标准图灵测试中那样由人类来考计算机,因此人们有时称 CAPTCHA 是一种反向图灵测试。 验证码是否真的保护了计算机系统 一队来自斯坦福大学的研究人员 PALO ALTO 指出很多验证码完全没有发挥应有的作用。这些研究人员甚至设计了一个通用程序,这个程序能够以极高的成功率识别出许多网站上的验证码,包括 Visa 旗下网站 Authorize 上的验证码图片,并可以顺利攻陷暴雪娱乐网站上 70% 的验证码。而维基网络有四分之一的验证码可以辨识,在 CNET 以及 Digg.com 上这个数字降低到了五分之一。网络的验证码虽然仅有 5% 的辨识率,但是在测试过程中同样的验证码出现的频率竟高达 98% ,非常容易被攻击者用穷举法攻破。来自斯坦福的这个研究团队随后指出,任何可辨识率超过 1% 的验证码系统都不应该被继续使用下去。 各大网站的验证码识别率: 随后暴雪发表声明说,他们明确的知道验证码技术并不具有足够高的安全性。”我们仅在初级安全层使用验证码技术抵挡一些特定的攻击,比如注册环节。我们使用一些更为安全可靠的技术来保护我们的客户与骨干服务器。“来自暴雪的 Shon Damron 这么说。 如今的验证码 验证码技术在目前的网络世界中仍然十分重要,它有助于阻止自动机器人批量注册网络邮箱并发送垃圾邮件,还能防止留言板被自动程序填塞广告,甚至使投票系统更能反映真实情况。 各大网站所使用的验证码范例: 新浪微博所使用的中文验证码范例——似乎没有考虑到国际化的情形: 到目前为止,只有 Google 的验证码完全阻挡了 Decaptcha 的辨识, Google 在 2009 年从卡耐基梅隆大学收购的 ReCaptcha 项目也 表现出了极其高的可靠性。目前 ReCaptcha 已经被广泛地使用在了近 10 万网站上,这些网站包括 Twitter 、Facebook、Craigslist、TicketMaster (一个出售各类演唱会、体育比赛、歌剧以及艺术展览门票的网站)以及微软( Microsoft )。 Bursztein 希望开发者能够更加系统的设计和使用验证码技术,他举了一个例子: 20 世纪 80 年代人们通常埋头设计的自己的计算机程序算法,但随着时间的推移,大家发现对等测试和专业安全性评估也是非常重要的。 展望验证码的未来 较早前有报道指出, Google 正在测试一种新的验证码技术,这种验证码技术不像传统验证码系统要求输入文字,而是要求用户将图形旋转到正确的方向: 另一种基于图像的验证码: 类似的验证码还有要求用户输入当前时间,所访问的网站域名,自己所在的时区,甚至美国总统姓名,人类第一颗登陆的地外星球等。这类验证码主要考虑到 通常自动计算机程序没有足够的逻辑思考能力,不能辨识并解答逻辑问题。拼图验证码,找不同验证码(比如从几张猫的图片中找出一张狗的图片)的验证码从本质 上来说也非常类似,但目前没有大规模部署这类验证码的主要原因是没有足够的资源,难以抵挡穷举攻击(攻击者多次刷新验证码后可能出现相同的问题)。 要求用户绘制图形的验证码: 要求用户完成复杂算术题的验证码——显然过于复杂而显得不友好: 验证码也带来了更多的可能性,比如通过广告盈利的机遇,下面这则验证码示范了利用验证码展示广告: 但遗憾的是由于其同样不具有规模性,仍受到穷举攻击的威胁。 这些未来的验证码技术同时还应该考虑到辅助功能。假如用户有视力障碍,他应该可以选择通过聆听验证码音频的方式完成验证,这也是基于字符的验证码技术迟迟未能被取代的主要原因之一。 总结 验证码技术是一种计算机技术发展下的矛盾产物,人类渴望计算机能够通过自动化的过程完成更多的任务,却同样要防止计算机被利用在破坏与恶意的用途当中。随着人工智能领域的研究成果越来越先进,计算机将变得越来越通情达理(想想 Siri ,想想 IBM 最新的超级智能计算机 Watson)。 图灵当年设计图灵测试时,旨在推动人工智能的发展,并从哲学与计算机科学的角度上论证制造类人类机器人的可行性,但他恐怕永远也想象不到有一天,人类将如此迫切的需要一种技术来将自己与计算机系统严格地区分开来。 如果有一天,计算机能够通过验证码验证,我们又该如何区分人类和计算机呢? 文章来源:爱范儿
Ⅹ siri的使用技术
(搜索)技术(Computational Knowledge)
这个技术的代表是Wolfram|Alpha。
不同于搜索互联网信息,Wolfram|Alpha将从公众的(包括公开的网页等)和获得授权的资源中,发掘、建立起一个异常庞大的经过组织的数据库,再利用高级的自然语言算法进行处理,最终构造出一个类似于谷歌搜索的工具。
和网页搜索技术不同的是,在这个系统中,得到的答案结构化程度很高,比如搜索China,能得到和中国相关的各种参数以及资料,并以接近表格的方式呈现。Wolfram|Alpha也能理解部分自然语言,比如输出How old are you,其会回答Wolfram|Alpha的年龄。想测试这项技术的请移步Wolfram|Alpha。
这个技术国内做的应该有,但还没有产品,也许网络的框计算算是半个。所以机会大大的有。
知识库技术
相比于网页搜索技术,基本以一个词条或者主题为单位,因此得到的数据价值高,知识量大,并且结构化程度好。相比于知识计算技术,这些技术需要人的参与,这有利也有弊,利就是,毕竟暂时人比机器聪明,编辑出来的知识更丰富,准确;弊就是,人力有限,即使像维基那样,发动社区的力量,也不能产生足够的知识,而知识计算,理论上,只需要算法够,是可以产生“无限”的知识的。
问答推荐技术
其实这不能称为一个技术,应该属于知识库的技术。不同的是,这个技术针对的是一些生活信息,这些信息的地域化程度很高,典型代表为Yelp。由于这东西比较简单,就不仔细介绍了。