导航:首页 > 源码编译 > ai算法优化教学视频

ai算法优化教学视频

发布时间:2022-12-29 21:15:33

A. 哪里有一些比较全面的ai教程,视频的,一定要全面

想要找比较全面的ai教程视频,推荐去【达内教育】的官网,AI视频分析一般包括算法、算力、平台三个部分,该官网三个部分视频都含有。AI的应用需要海量的数据训练以及丰富的应用场景采集数据,建议参加培训进行学习。【达内教育】该机构拥有一支具有丰富教学经验的教师队伍。

学习AI就业具体如下:
1、ai的发展方向科研机构(机器人研究所)软硬件开发人员、AI相关的计算机语言开发人员、专业培训机构的讲师等,还可以在优秀的大厂做搜索方向(智能搜索,语音搜索,图片搜索等方向)。
2、AI可以应用于各行各业,以软件形式落地行业更具价值。感兴趣的话点击此处,免费学习一下

想了解更多有关ai的相关信息,推荐咨询【达内教育】。作为国内IT培训的领导品牌,达内的每一名员工都以“帮助每一个学员成就梦想”为己任,也正因为达内人的执着与努力,达内已成功为社会输送了众多合格人才,为广大学子提供更多IT行业高薪机会,同时也为中国IT行业的发展做出了巨大的贡献。达内IT培训机构,试听名额限时抢购。

B. 求问五子棋AI算法思路

五子棋的核心算法

五子棋是一种受大众广泛喜爱的游戏,其规则简单,变化多端,非常富有趣味性和消遣性。这里设计和实现了一个人机对下的五子棋程序,采用了博弈树的方法,应用了剪枝和最大最小树原理进行搜索发现最好的下子位置。介绍五子棋程序的数据结构、评分规则、胜负判断方法和搜索算法过程。

一、相关的数据结构
关于盘面情况的表示,以链表形式表示当前盘面的情况,目的是可以允许用户进行悔棋、回退等操作。
CList StepList;
其中Step结构的表示为:

struct Step
{
int m; //m,n表示两个坐标值
int n;
char side; //side表示下子方
};
以数组形式保存当前盘面的情况,
目的是为了在显示当前盘面情况时使用:
char FiveArea[FIVE_MAX_LINE][FIVE_MAX_LINE];

其中FIVE_MAX_LINE表示盘面最大的行数。

同时由于需要在递归搜索的过程中考虑时间和空间有效性,只找出就当前情况来说相对比较好的几个盘面,而不是对所有的可下子的位置都进行搜索,这里用变量CountList来表示当前搜索中可以选择的所有新的盘面情况对象的集合:

CList CountList;
其中类CBoardSituiton为:
class CBoardSituation
{
CList StepList; //每一步的列表
char FiveArea[FIVE_MAX_LINE][FIVE_MAX_LINE];
struct Step machineStep; //机器所下的那一步
double value; //该种盘面状态所得到的分数
}

二、评分规则
对于下子的重要性评分,需要从六个位置来考虑当前棋局的情况,分别为:-,¦,/,\,//,\\

实际上需要考虑在这六个位置上某一方所形成的子的布局的情况,对于在还没有子的地方落子以后的当前局面的评分,主要是为了说明在这个地方下子的重要性程度,设定了一个简单的规则来表示当前棋面对机器方的分数。

基本的规则如下:

判断是否能成5, 如果是机器方的话给予100000分,如果是人方的话给予-100000 分;
判断是否能成活4或者是双死4或者是死4活3,如果是机器方的话给予10000分,如果是人方的话给予-10000分;
判断是否已成双活3,如果是机器方的话给予5000分,如果是人方的话给予-5000 分;
判断是否成死3活3,如果是机器方的话给予1000分,如果是人方的话给予-1000 分;
判断是否能成死4,如果是机器方的话给予500分,如果是人方的话给予-500分;
判断是否能成单活3,如果是机器方的话给予200分,如果是人方的话给予-200分;
判断是否已成双活2,如果是机器方的话给予100分,如果是人方的话给予-100分;
判断是否能成死3,如果是机器方的话给予50分,如果是人方的话给予-50分;
判断是否能成双活2,如果是机器方的话给予10分,如果是人方的话给予-10分;
判断是否能成活2,如果是机器方的话给予5分,如果是人方的话给予-5分;
判断是否能成死2,如果是机器方的话给予3分,如果是人方的话给予-3分。

实际上对当前的局面按照上面的规则的顺序进行比较,如果满足某一条规则的话,就给该局面打分并保存,然后退出规则的匹配。注意这里的规则是根据一般的下棋规律的一个总结,在实际运行的时候,用户可以添加规则和对评分机制加以修正。

三、胜负判断
实际上,是根据当前最后一个落子的情况来判断胜负的。实际上需要从四个位置判断,以该子为出发点的水平,竖直和两条分别为 45度角和135度角的线,目的是看在这四个方向是否最后落子的一方构成连续五个的棋子,如果是的话,就表示该盘棋局已经分出胜负。具体见下面的图示:

四、搜索算法实现描述
注意下面的核心的算法中的变量currentBoardSituation,表示当前机器最新的盘面情况, CountList表示第一层子节点可以选择的较好的盘面的集合。核心的算法如下:
void MainDealFunction()
{
value=-MAXINT; //对初始根节点的value赋值
CalSeveralGoodPlace(currentBoardSituation,CountList);
//该函数是根据当前的盘面情况来比较得到比较好的可以考虑的几个盘面的情况,可以根据实际的得分情况选取分数比较高的几个盘面,也就是说在第一层节点选择的时候采用贪婪算法,直接找出相对分数比较高的几个形成第一层节点,目的是为了提高搜索速度和防止堆栈溢出。
pos=CountList.GetHeadPosition();
CBoardSituation* pBoard;
for(i=0;ivalue=Search(pBoard,min,value,0);
Value=Select(value,pBoard->value,max);
//取value和pBoard->value中大的赋给根节点
}
for(i=0;ivalue)
//找出那一个得到最高分的盘面
{
currentBoardSituation=pBoard;
PlayerMode=min; //当前下子方改为人
Break;
}
}

其中对于Search函数的表示如下:实际上核心的算法是一个剪枝过程,其中在这个搜索过程中相关的四个参数为:(1)当前棋局情况;(2)当前的下子方,可以是机器(max)或者是人(min);(3)父节点的值oldValue;(4)当前的搜索深度depth。

double Search(CBoardSituation&
board,int mode,double oldvalue,int depth)
{
CList m_DeepList;
if(deptholdvalue))== TRUE)
{
if(mode==max)
value=select(value,search(successor
Board,min,value,depth+1),max);
else
value=select(value,search(successor
Board,max,value,depth+1),min);
}
return value;
}
else
{
if ( goal(board)<>0)
//这里goal(board)<>0表示已经可以分出胜负
return goal(board);
else
return evlation(board);
}
}

注意这里的goal(board)函数是用来判断当前盘面是否可以分出胜负,而evlation(board)是对当前的盘面从机器的角度进行打分。

下面是Select函数的介绍,这个函数的主要目的是根据 PlayerMode情况,即是机器还是用户来返回节点的应有的值。

double Select(double a,double b,int mode)
{
if(a>b && mode==max)¦¦ (a< b && mode==min)
return a;
else
return b;
}

五、小结
在Windows操作系统下,用VC++实现了这个人机对战的五子棋程序。和国内许多只是采用规则或者只是采用简单递归而没有剪枝的那些程序相比,在智力上和时间有效性上都要好于这些程序。同时所讨论的方法和设计过程为用户设计其他的游戏(如象棋和围棋等)提供了一个参考。

C. 人工智能结课论文

“人工智能”是大学本科自动化专业所开设的一门专业选修课,为了能够调动自动化专业的学生对本课程学习的积极性,对《人工智能》这门专业选修课程的 教学 方法 进行了探索和 总结 。以下是我整理分享的关于人工智能结课论文的相关 文章 ,欢迎阅读!

人工智能结课论文篇一

对《人工智能》专业选修课教学的几点体会

摘要:“人工智能”是大学本科自动化专业所开设的一门专业选修课,为了能够调动自动化专业的学生对本课程学习的积极性,提高《人工智能》专业选修课的教学效果,我们结合近几年的实际教学 经验 ,从优选教材、考核方式、教学内容调整、教学手段的改进和实践教学等方面对《人工智能》这门专业选修课程的教学方法进行了探索和总结。

关键词:人工智能 优选教材 考核方式内容 手段 实践

人工智能(Aritificial Intelligence,英文缩写为AI)是一门综合了应用数学、自动控制、模式识别、系统工程、计算机科学和心理学等多种学科交叉融合而发展起来的的一门新型学科,是21世纪三大尖端技术(基因工程、纳米科学、人工智能)之一。它是研究智能机器所执行的通常与人类智能有关的职能行为,如推理、证明、感知、规划和问题求解等思维活动,来解决人类处理的复杂问题。人工智能紧跟世界社会进步和科技发展的步伐,与时俱进,有关人工智能的许多研究成果已经广泛应用到国防建设、工业生产、国民生活中的各个领域。在信息网络和知识经济时代,人工智能现已成为一个广受重视且有着广阔应用潜能的前沿学科,必将为推动科学技术的进步和产业的发展发挥更大的作用。因此在我国的大中专院校中开展人工智能这门课的教学与科研工作显得十分紧迫。迄今为止,全国绝大多数工科院校中的自动控制、计算机/软件工程、电气工程、机械工程、应用数学等相关专业都开设了人工智能这门课程。南京邮电大学自动化学院自2005年成立至今,一直将“人工智能”列为自动化专业本科生的选修课程,到目前为止已经有八年的历史了。由于南京邮电大学是一所以邮电、通信、电子、计算机、自动化为特色的工科院校,因此,学校所开设的许多专业都迫切需要用人工智能理论和方法解决科研中的实际问题。在问题需求的推动下,南邮人经过多年的努力工作,在人工智能科研方面取得了丰硕的成果,如物联网学院所开发的现代智能物流系统、自动化学院所开发的城市交通流量控制与决策系统,为本课程的开设提供了典型的教学案例。我们结合近几年的实际教学经验,从优选教材、考核方式、教学内容调整、教学手段的改进和实践教学等方面对人工智能课程教学方法进行了总结归纳。

一、优选教材

目前,国内有关人工智能课程的中英版教材种类非常多,遵循实用、简单、够用的原则,再经过授课老师和学生们的共同调研,我们选用由中南大学蔡自兴教授主编的《人工智能及其应用》第三版作为南邮本课程的授课教材。本书覆盖的人工智能知识体系比较全面,包含知识表示、搜索推理、模糊计算、专家系统等。本书主要针对计算机、自动化、电气工程等本科专业的学生所编写,内容基础,难度适中。蔡教授所编写的这本教材全面地介绍了人工智能的研究内容与应用领域,做到了内容新颖、简单易懂、兼顾基础和应用,受到了全国广大师生们的一致好评,多年的教学实践证明我们所选择的教材是恰当的、正确的。

二、考核方式

在全国大部分高等院校,“人工智能”这门课大都选择开卷考试的方式来进行考核。为了强化学生对人工智能这门课基础知识的掌握,南京邮电大学自动化学院选用闭卷考试的方式来进行考核。为了打消部分学生想在期末闭卷考试中通过作弊手段来完成人工智能这门课考核的侥幸心理,我们加强了对学生平时考勤成绩、课下作业成绩和实验成绩的考核,从而杜绝了“一纸定成绩”的现象。我们对人工智能这门课的最后期末成绩是按如下权重来划分的:平时考勤成绩占10%、课下作业成绩占10%、实验成绩占20%、最后的期末考试卷面成绩只占60%。为了克服国家现行 教育 体制的弊端,避免学生“机械式”地的应对教学和考试,我们对考试题型进行了调整,不再是以往的填空、选择、简答等题型,而是改为以解决实际问题为导向的应用题型为主,这样学生只需要在理解授课内容的基础上利用自己的思维来解题就可以了,这也体现了国家目前正在提倡的应用型教学导向。

三、教学内容调整

对于本科生而言,人工智能这门课程所需要讲授的内容实在太多,由于课时所限,我们必须精简教学内容,让学生在掌握基础知识的同时,也能够了解它的具体应用。因此,我们将人工智能这门课程的教学内容分为两个部分:第一部分是基本理论和方法,包括人工智能的概述、知识表示方法、确定性推理方法等;第二部分为人工智能研究成果的具体应用,包括神经元网络计算、模糊智能计算、专家知识库系统、机器语言学习等。通过对教材内容的合理调整和安排,使得授课计划能够比较全面地覆盖了人工智能这门课程的基本知识点,从而满足了学生们的求知需求。

四、教学手段的改进

(一) 激发学生的学习兴趣

经过长时间的教学我们发现,在选修“人工智能”这门课程时,每个学生的心中所想各有不同,这些学生在刚开始学习时兴趣还比较强烈,但随着教学内容变得越来越抽象,学生逐渐对这本课的学习失去了信心,甚至上课时间不去听课,使授课教师对教学也渐渐失去了信心,导致恶性循环,严重影响了教学质量。针对这种现象,我们认为,在开课前充分激发学生的学习兴趣是很有必要的。我们要结合学校的实验条件,开课前给学生演示“机器人医疗服务”实验,通过该实验的演示,让学生们看到机器人能够给病人提供多项人性化的服务,理解人工智能技术在开发医疗服务机器人多项关键技术中的应用,让学生在开课前能够对本课程的学习产生极大的兴趣,实践证明这种方法是有效的。

(二) 借助多媒体教学

多媒体教学是现代教学过程中一种非常重要的形式,它往往根据教学目的和学生们的特点,通过合理的设计、选择教材内容,应用公式、图形、文字、视频等多种媒体信息进行有机组合并通过电脑和投影机显示出来,与传统教学手段相结合,形成合理的教学过程结构,达到最优化的教学效果。人工智能这门课具有针对性强、内容抽象、公式繁琐等特点,学生学习起来比较困难,为了让学生生动、形象地学习该课程,我们在教学过程中充分利用了多媒体技术来组织教学。例如在课堂教学过程中播放南邮自动化学院梁志伟博士带领学生所开发的“智能 足球 机器人”比赛片段;让学生在线观看北京大学工学院谢广明博士带领学生所开发的“自主视觉机器鱼”录像片段等。在讲解某些重要的求解算法时,借助Matlab软件和投影机,直接展现该算法的求解过程,从而改善了课程教学的形式,提高了教学质量。 (三)提倡课堂 辩论

我们在教学过程中打破了传统的“老师讲课学生听课”的教学模式,多次组织课堂辩论,辩论的主题包括人工智能研究过程中出现的技术困惑、人工智能研究成果转化中的市场前景等。如组织了“电脑PK人脑”“电脑是否让电视消失”“电脑的未来发展方向在哪里”等一系列 辩论会 。经过激烈的辩论,无论正方还是反方都感觉自己收获很大,增长了知识,开阔了眼界。在教学过程中通过将学生由“被动听课”角色变换为“主动参与”角色,大大地调动了学生的学习积极性,从而提高了课堂教学质量。

五、实践教学

实践教学是课堂教学不可缺少的重要组成部分,通过让学生亲自动手实验来对理论知识进行检验和应用是目前国内外各个大学提高学生综合素质、增强学生市场竞争力的重要手段。人工智能实验教学的目的是让学生通过亲自动手体会授课中的各种智能控制算法,从而使学生能够更加形象地掌握课本知识。人工智能教学计划安排了4学时实验课,设置了“传教士和野人过河”“机器人路径规划”这两个人工智能问题,要求学生独立完成这2个实验题目的编程,并书写实验 报告 。通过实验,学生动手实践了课堂上所掌握的理论知识,加深了对智能算法的理解。

人工智能是一门实用性较强的课程,我们总结了近几年来的教学经验,从优选教材、考核方式、教学内容调整、教学手段的改进和实践教学五个方面对人工智能课程教学进行了总结。从学生的反馈来看,我们所总结的教学经验对于指导新教师讲授“人工智能”这门课程具有积极的作用,需要指出的是,我们仍有很多不足之处,需要在以后的教学过程中不断努力完善,提高自己的教学能力,争取更好的教学效果。

参考文献

[1]蔡自兴,徐光佑.人工智能及其应用[M].北京:清华大学出版社,2003.

[2]路小英,周桂红,赵艳等.高等农业院校《人工智能》课程的教学研究与实践[J].河北农业大学学报:农林教育版,2007,9(4):66-68.

[3]马建斌,李阅历,高媛. 人工智能课程教学的探索与实践[J].河北农业大学学报:农林教育版,2011,13(3):330-332.

[4]赵海波.人工智能课程教学方法的探讨[J].科技信息,2011,(7):541.

[5]张廷,杨国胜.“人工智能”课程教学的实践与探索[J].课程与教学,2009(11):133-134.

本研究得到了江苏省2011年度研究生双语授课教学试点项目—“模式识别与智能系统”项目经费的资助。

下一页分享更优秀的<<<人工智能结课论文

D. 请问自学AI算法需要懂什么知识

首先你需要数学基础:高等数学,线性代数,概率论数理统计和随机过程,离散数学,数值分析
其次需要算法的积累:人工神经网络,支持向量机,遗传算法等等算法;当然还有各个领域需要的算法,比如你要让机器人自己在位置环境导航和建图就需要研究SLAM;总之算法很多需要时间的积累;
然后,需要掌握至少一门编程语言,毕竟算法的实现还是要编程的;如果深入到硬件的话,一些电类基础课必不可少;
人工智能一般要到研究生才会去学,本科也就是蜻蜓点水看看而已,毕竟需要的基础课过于庞大。

E. 极客时间上的AI算法工程师线上培训课程怎么样

我来贡献一波,极客时间挺不错的

F. CCCF专栏 | 智能计算系统——一门人工智能专业的系统课程

我国人工智能底层研究能力缺失的现象严重,最根本的原因在于这方面人才教育培养的缺失。2018年中,作者陈云霁在中国科学院大学开设了一门“智能计算系统”课程。这门课程受到了学生的欢迎,有很多选不上课的学生跟着旁听了整个学期。

关键词:智能计算系统 人工智能 专业课程

编者按 :5年前,本文作者陈云霁受邀在CCCF专栏上发表了一篇题为《体系结构研究者的人工智能之梦》 1 的文章,第一次公开介绍他从通用处理器转向深度学习处理器方向的心路历程(那篇文章后来也被收录进了《CCCF优秀文章精选》)。经过5年的努力,陈云霁在深度学习处理器方向作出了国际公认的贡献:他的学术论文被顶级会议ISCA’18超过四分之一的论文引用,他的技术成果被应用到华为、曙光、阿里等近亿台智能手机和服务器中。他因此被Science杂志评价为智能芯片的“先驱”和“领导者”。现在,当深度学习处理器已经成为学术界和工业界的热点时,陈云霁再次转身,迈向人工智能系统课程教学的新舞台。这篇文章将和大家分享他走向这个新舞台的心路历程。

智能计算系统课程的开设

我是一名中国科学院计算技术研究所的青年科研人员,主要从事计算机系统结构和人工智能交叉方向的基础研究。看到本文的标题和作者单位,大家可能会觉得有一点奇怪:作者和人工智能专业课程有什么关系?因为传统意义上,上课是高校教师的职责,中国科学院的员工除非是自愿担任了中国科学院大学(国科大)的岗位教授,否则并没有上课的义务。

驱使我主动思考人工智能专业课程设计的最主要的原因,是这样一个众所周知的现象:越是人工智能上层(算法层、应用层,见图1)的研究,我国研究者对世界作出的贡献越多;越是底层(系统层、芯片层),我国研究者的贡献越少。在各种ImageNet比赛中,我国很多机构的算法模型已经呈现“霸榜”的趋势,可以说代表了世界前沿水平。但这些算法模型绝大部分都是在CUDA 2 编程语言、Tensorflow编程框架以及GPU之上开发的。在这些底层“硬 科技 ”中,我国研究者对世界的贡献就相对少了很多。底层研究能力的缺失不仅会给我国人工智能基础研究拖后腿,更重要的是,将使得我国智能产业成为一个空中楼阁,走上信息产业受核心芯片和操作系统制约的老路。

图1 人工智能研究大致层次

我国人工智能底层研究能力缺失的原因很多,我认为最根本的原因在于这方面的人才教育培养的缺失。没有肥沃的土壤,就长不出参天大树。没有具备系统思维的人工智能专业学生,我国就难以出现杰夫·迪恩(Jeff Dean)这样的智能计算系统大师,也不会产生有国际竞争力的智能系统产品。因此,在人工智能专业学生的培养上,我们应当主动作为去改变局面。

2018年我国有35个高校设立了人工智能本科专业,这是重新思考和梳理人工智能培养体系的一次重大机遇。就我目前的了解,大部分高校在考虑人工智能课程体系时,采用的是纯算法、纯应用的教学思路。这样培养出来的学生,仍然是偏向上层应用开发,对智能计算系统缺乏融会贯通的理解。

事实上,各个高校不乏有识之士,在课程设计上绕开系统课程往往受制于三大客观困难:一是国内还没有太多人工智能系统类的课程可供参考,二是国内缺乏人工智能系统类课程的师资,三是国际上缺乏人工智能系统课程的教材。

基于自己的研究背景,我对人工智能的算法和系统都有一些粗浅的涉猎。我是否能为解决人工智能系统课程、师资、教材上的困难作一点微薄的贡献?是否可以身体力行地培养一些具备系统思维和能力的人工智能专业学生呢?

因此,2018年中,我向中国科学院大学申请开设一门人工智能专业的系统课程,名为“智能计算系统”(曾名“智能计算机”),希望能培养学生对智能计算完整软硬件技术栈(包括基础智能算法、智能计算编程框架、智能计算编程语言、智能芯片体系结构等)融会贯通的理解。这门课程受到了学生的欢迎,有很多选不上课的学生跟着旁听了整个学期。让我尤其感动的是,有其他研究所的学生慕名自发地从中关村跑到怀柔来听课,上一次课来回车程就要三个小时,回到中关村都是深夜。这也许能说明这门课对学生来说有一定吸引力,大家在听课中有真正的收获。

人工智能专业学生培养和课程体系

人工智能专业的课程体系设计应该服务于学生培养目标。那么高校人工智能专业应该培养什么样的学生?

这个问题可能还没有统一的答案。对比和人工智能专业非常接近的计算机专业,高校的计算机专业培养的显然不是计算机的使用者,而是计算机整机或者子系统的研究者、设计者和制造者。

我国计算机专业的前辈在六十多年前开始设立计算机专业时,就高瞻远瞩地设计了一个软硬结合的方案来培养计算机整机或者子系统的研究者、设计者和制造者。这套方案经过六十年的演进,依然基本保持了当年的初衷。今天,各个高校的计算机专业,基本都开设了计算机组成原理、操作系统、编译原理、计算机体系结构等系统类的必修课程(见图2)。也就是说,虽然计算机专业的学生毕业后大多从事软件开发工作,但是他们对计算机硬件系统还是有基础的了解的。

图2 网易云课堂上的计算机专业培养方案 3

人工智能专业学生的培养目标应当是人工智能系统或者子系统的研究者、设计者和制造者。只有实现这个目标,高校培养的人才才能源源不断地全面支撑我国人工智能的产业和研究。为了实现这个目标,人工智能专业的课程设计应当包括软硬两条线(就像计算机专业)。如果人工智能专业只开设机器学习算法、视听觉应用等课程,那充其量只能算是“人工智能应用专业”或者“人工智能算法专业”。毕竟算法只是冰山露出水面的一角,冰山底下90%还是硬件和系统。

就拿拥有世界上最大的AI算法研究团队的公司谷歌来说,谷歌董事长约翰·轩尼诗(John Hennessy)是计算机体系结构科学家,图灵奖得主;谷歌AI的总负责人杰夫·迪恩(Jeff Dean)是计算机系统研究者;谷歌AI最令人瞩目的三个进展(Tensorflow, AlphaGo, TPU)都是系统,而不仅仅是某个特定算法,算法只是系统的一个环节。因此,从人工智能国际学术主流来看,系统的重要性是不亚于算法的。

只学过算法的学生或许对于调模型参数很在行,但是对一个算法的耗时、耗电毫无感觉。这样的学生不具备把一个算法在工业系统上应用起来的基本功(因为一个算法真正要用起来必须满足延迟和能耗的限制)。

只有加入了系统线的课程,学生才能真正理解人工智能是怎样工作的,包括一个人工智能算法到底如何调用编程框架,编程框架又是怎么和操作系统打交道,编程框架里的算子又是怎样一步步在芯片上运行起来。这样的学生能亲手构建出复杂的系统或者子系统,在科研上会有更大的潜力,在产业里也会有更强的竞争力。正如业界所云:“会用Tensorflow每年赚30万人民币,会设计Tensorflow每年赚30万美元。”

有很多老师和我说:“人工智能专业确实应当有一些系统类的课程。但国内从来没有开过这样的课,也没有合适的教材,我们学院也缺乏相应的老师来教这样的课程。”这是很实际的三个客观困难,但不应当影响我们对人工智能专业的课程设计。

从学生角度讲,人工智能专业开设什么课程,应该是看国家和企业需要学生会什么,而不完全是看老师现在会什么。六十年前,我国没有几个人见过计算机,更别说开课了。但为了两弹一星等科学和工程计算任务,我国依然成立了中科院计算所,并在计算所办计算机教师培训班,在清华大学、中国科学技术大学等高校(此处恕不能一一列全)开设计算机专业,这才有了今天我国巨大的计算机产业。

从教师角度讲,人工智能的系统研究已经成为国际学术热点,讲授这类课程是一个教学相长的过程,能帮助教师走到国际学术前沿。今年美国计算机方向Top4高校(斯坦福大学、卡耐基梅隆大学、加州大学伯克利分校和麻省理工学院)以及其他多个国际单位的研究者联合发布了一份名为“Machine Learning System(机器学习系统)”的白皮书。在这样的新兴热门方向布局培育一批青年教师,无疑对提升所在高校乃至我国在人工智能学术界的影响力有巨大帮助。

因此,不论是对于人工智能专业的学生还是教师来说,把系统类课程开起来,都是有必要,也是有实际意义的。

什么是智能计算系统

简单来说,智能计算系统就是人工智能的物质载体。现阶段的智能计算系统通常是集成通用CPU和智能芯片(英伟达GPU或寒武纪MLU等)的异构系统,并向开发者提供智能计算编程框架和编程语言等。之所以要在通用CPU之外加上智能芯片,主要是因为通用CPU难以满足人工智能计算不断增长的速度和能耗需求。例如,2012年谷歌大脑用了1.6万个CPU核运行了数天来训练怎么识别猫脸,这对于工业应用来说是很难接受的。显然,要想真正把人工智能技术用起来,必须使用异构的智能计算系统。而为了降低异构智能计算系统的编程难度,就需要有面向智能计算的编程框架和编程语言。

事实上,智能计算系统已经以种种形态广泛渗透到我们的生活中了。IBM的超级计算机Summit用机器学习方法做天气预报,BAT的数据中心上运行着大量的广告推荐任务,华为的手机上集成寒武纪深度学习处理器来处理图像分析和语音识别,特斯拉的自动驾驶系统……都可以看成是智能计算系统。在智能时代,中国乃至全世界都需要大批的智能计算系统的开发者、设计者、应用者。

智能计算系统的发展并不是一蹴而就的事情。20世纪80年代面向符号主义智能处理的专用计算机(Prolog机和LISP机)可以被看成是第一代智能计算系统。但是当时人工智能缺乏实际应用,算法也不成熟,而且当时摩尔定律还处于飞速发展阶段,专用计算机相对每18个月性能就能翻番的通用CPU并没有太大优势。因此,第一代智能计算系统逐渐退出了 历史 舞台。

“智能计算系统”课程重点关注的是第二代智能计算系统,主要是面向深度学习等机器学习任务的计算机。相对于30年前的第一代智能计算系统,当今的第二代深度学习智能计算系统可谓是碰到了天时地利人和。当前图像识别、语音识别、自然语言理解、 游戏 、广告推荐等人工智能应用已开始落地,深度学习算法发展速度令人应接不暇。尤其重要的是,通用CPU性能发展已经趋停,要支撑不断发展的深度学习算法,必须要靠智能计算系统。因此,深度学习智能计算系统会在很长一个阶段里都是学术界和产业界关注的焦点。“智能计算系统”课程将能帮助学生深刻理解深度学习智能计算系统。

第二代智能计算系统主要支持深度学习等机器学习任务。未来如果人类真的要在通用人工智能道路上再往前走一步,那未来的第三代智能计算系统需要支持的算法将远远超出机器学习的范畴,必须包括联想、推理、涌现等高级认知智能算法。我个人猜测,第三代智能计算系统可能会是孵化通用人工智能的虚拟世界环境。“智能计算系统”课程或许能激发学生的好奇心,吸引学生投身于未来的第三代智能计算系统的研究中。

智能计算系统课程概况

“智能计算系统”这门课程主要是面向人工智能、计算机和软件工程专业的高年级本科生或研究生。课程目标是培养学生对智能计算完整软硬件技术栈(包括基础智能算法、智能计算编程框架、智能计算编程语言、智能芯片体系结构等)融会贯通的理解,成为智能计算系统(子系统)的设计者和开发者。

课程的前序课程包括C/C++编程语言、计算机组成原理和算法导论(或机器学习)。课程的课时相对比较灵活,可以是大学期上一个学期(40学时,课程提纲见表1),可以是小学期集中上一周(20学时),也可以嵌入到其他机器学习课程中作为一个补充。对于20学时的短期学习,课程希望学生能对智能计算系统“知其然”,主要是面向实际操作;对于40学时的长期学习,课程希望学生能对智能计算系统“知其所以然”,因此要把机理讲透。

表1 智能计算系统课程提纲(40学时)

在课程讲授上,应该秉承两个原则。一是应用驱动。一门好的工程学科的课程应当是学以致用的,尤其是“智能计算系统”这样的课程,如果上完之后只学会了一些定理和公式,那基本没效果。另外一个原则是全栈贯通。过去计算机专业课程设计有个问题,就是条块分割明显,比如操作系统和计算机体系结构是割裂的,操作系统对计算机体系结构提出了什么要求,计算机体系结构对操作系统有哪些支持,没有一门课把这些串起来。“智能计算系统”作为高年级本科生(或研究生)课程,有义务帮助学生把过去所有的人工智能软硬件知识都串起来,形成整体理解。

对于“智能计算系统”课程,驱动范例是一个抓手。在国科大上课时,我们选择了视频风格迁移作为驱动范例。简单来说,风格迁移可以保留一个视频中每帧图片的基本内容,但是把图片的绘画风格改掉(比如从普通照片迁移成毕加索风格或者中国水墨画风格等,见图3)。对于学生来说,这是很有意思又在能力范围之内的一个驱动范例。

图3 从普通照片到毕加索风格迁移的驱动范例

我们围绕如何实现视频实时风格迁移,一步步带着学生写出算法,移植到编程框架上,为编程框架编写算子,再为算子设计芯片,构建多芯片系统,并测评这个系统的速度、能效和精度上的优势和劣势,然后进行系统的闭环迭代优化。最后再给大家一个智能计算系统的实验环境,包括摄像头和智能芯片开发板,学生就可以实现一个对摄像头拍摄的视频进行画风实时转换的“半产品”应用了。

结语

我的母亲是一位中学教师。我自己成长过程中,对我帮助非常大的几位前辈恩师陈国良、胡伟武和徐志伟,也都是常年浸淫在教学第一线,有着极大教学热情的名师。从小到大,这些长辈的言传身教,让我深刻地感受到,教育是一项伟大的事业,能深刻地改变学生、改变行业、改变 社会 、改变国家、改变人类。今天我们教给学生的那些人工智能知识,可能会影响明天我国在智能时代的竞争力。因此,虽然手头有不少基础研究任务,但我还是情愿把培养人工智能的系统人才当成自己未来最重要的使命,把自己绝大部分时间精力花在“智能计算系统”这门课程在各个高校的讲授和推广上。

非常欣慰的是,“智能计算系统”这样新生的一门课程,虽然还有很多缺陷,但还是得到了很多师生的支持和鼓励。我们已在或将在中国科学院大学、北京大学、北京航空航天大学、天津大学、中国科学技术大学、南开大学、北京理工大学、华中 科技 大学等多个高校联合开设这门课程。今年我们还会开放这门课程的所有PPT、讲义、教材、录像、代码、云平台和开发板,供老师们批评指正。非常欢迎大家给我发邮件,提出宝贵意见。

未来,我们希望和更多培养人工智能专业学生的高校合作,广泛参与人工智能系统课程的交流研讨,共同提高人工智能系统课程的教学水平。相信通过大家的共同努力,一定能解决人工智能系统课程开设中的实际困难,使得我国未来培养出来的人工智能人才没有技术上的短板。

作为一名青年教师,我在教学能力和经验上与很多教育领域的前辈有着巨大的差距,还需要更多地学习。这门“智能计算系统”课程,对于我国的人工智能系统能力培养来说,也顶多是起到抛砖引玉的作用。正如鲁迅先生在《热风·随感录四十一》中写给青年的一段话所言:“有一分热,发一分光,就令萤火一般,也可以在黑暗里发一点光……倘若有了炬火,出了太阳,我们自然……随喜赞美这炬火或太阳;因为他照了人类,连我都在内。”

脚注:

1 此文发表在《中国计算机学会通讯》(CCCF) 2014年第5期,https://dl.ccf.org.cn/institude/institudeDetail?id=3738875863074816&_ack=1。

2 CUDA:Compute Unified Device Architecture,计算统一设备架构。

3 参见https://study.163.com/curricula/cs.htm。

作者介绍:

陈云霁

CCF杰出会员、CCF青年科学家奖获得者、CCCF编委。中科院计算所研究员。曾获首届国家自然科学基金“优秀青年基金”、首届国家万人计划“青年拔尖人才”以及中科院青年人才奖等奖项。主要研究方向为计算机体系结构。[email protected]

点击 “阅读原文” ,加入CCF。

G. “AI”能自我进化吗

AI确实进化了,它能做的事情越来越多,成绩斐然。它的背后是AI实现路径的“三级跳”。但是“AI自开发短期内应该无法替代人的工作,还有很长的路要走。”徐文娟说。赵志刚从学术角度分析道:“只有当人类把不同应用领域的AI模型设计出来,并进一步分解出一系列通用模块,如同化学中的元素周期表、生物中的DNA、RNA,这种自开发才能有更多的应用。”

“仅需几行代码就能构建一个回归模型。”程序员认可谷歌AutoML的工作表现,认为AutoML设计的模型和机器学习专家设计的不相上下。日前,谷歌工程师分别在中国和硅谷重点推介谷歌AutoML项目。不明就里的疑惑紧跟着纷至沓来——AI又进化了?!已经会自开发了?能操控自己的进化了?是要摆脱人类吗?

国家超级计算济南中心大数据研发部研究员赵志刚说:“起初我们用数学公式和‘if……then’等语句告诉计算机第一步做什么、第二步做什么,手把手地教,后来给机器n组输入和输出,中间的规则或规律由它自己学会。”

“之前,很多聪明的头脑花一辈子时间研究:如何抽取有效的特征。”专注于智能导购对话机器人的智能一点公司CTO莫瑜解释道,“神经网络算法的发明、深度学习技术的出现,使得AI进化到2.0,抽取特征的工作由AI自己进行,我们的工作也随之发生了变化。”

用数学函数的模式很容易解释“1.0”到“2.0”的转变:如果把识别图像、语义理解、下棋等任务的达成都看成是不同的Y=f(X),即输入的“猫”的图片、声音或棋招是“X”,输出的“猫”、回答、棋高一招是“Y”。深度学习之前,人通过自己的分析寻找函数f对应的公式,告诉给AI。而深度学习之后,人输入大量的X与Y的对应,AI自己发现函数f对应的公式。

“AI找到的函数f的具体内容,可能比人找到的更好,但是人类并不知道,就像一个黑匣子。”莫瑜说,“但是f的形式是AI研究员通过研究设计出来的,如果使用深度神经网络,网络中的模块以及模块之间的组织方式也是提前设计的。”

随着深度学习技术的成熟和普遍化,模型构建出现了特定可追寻的经验。“各种共性神经网络的发布,使得从业门槛越来越低。一些普通的模型构建与优化,刚毕业的学生在网上学学教程就能上手。”赵志刚说。

当构建模型成为可习得的技能,AutoML就出现了。它能做的正是AI研究员的模型设计工作。“将帮助不同公司建立人工智能系统,即使他们没有广泛的专业知识。”谷歌工程师这样推介。AI成功进化到3.0。

事实上,AutoML替代的仍旧是人类能够提炼出经验的工作。“如果说之前人描绘一套寻找函数f的‘路网’,在深度学习的技术辅助下,机器能最快找到优化路径;那么AI现在可以自己设计路网了。”赵志刚言简意赅。

可以看出,不论是深度学习、还是AutoML,都只替代人类的一部分群体已经钻研透了的工作。“机器能做的事情,尽量不要手工劳动”,这是很多程序员的人生信条,这个信条催生了AutoML。本着同样的信条,微软开发了DeepCoder。“它可以用来生成满足给定输入输出的程序。”莫瑜说,但它的表现目前还不尽如人意,只能编写一些简单的程序。

谁是“上帝”答案毫无疑问,人类。

既然AI在进化中走向了更高一阶的模型设计,那么“上帝之手”又发生了哪些变化呢?

“炼丹”,莫瑜用两个字形象地说起自己的工作,“智能一点是专业做智能客服的,研发人员的工作主要集中于问题建模(如何将实际问题转化为人工智能技术解决的问题)和算法优化(如何提升人工智能算法的效果)。”

“炼”意味着不断地调试和完善。“针对特定的人,越投脾气越好,回答越精准越好。”莫瑜说,“我们的X是客户的问话,Y是机器人客服的回复,中间的函数f需要训练。”

这是个不容易的任务。如果把人类社会的经验分为3类:有公式的确定规则、可言传的知识、只可意会不可言传的感觉。最后一类最难琢磨。

“因此,我们想办法构建完善的闭环反馈,了解特定用户的喜好,通过情感、趣味的表达,最终做到投其所好。”莫瑜说,“目前处于人机协同的工作阶段,但是越来越多样本的获取,将帮助我们的智能客服给出精准的、讨喜的回答。”

可见,并不是所有领域都适合交给AI自开发去做,比如问题建模方面,如何将实际问题抽象转换为机器学习问题, AI还无法自主完成。在AI2.0阶段,研发人员还需要人工设计函数f的形式。

H. 各类场景应用中涉及的AI算法汇总

整理了各类场景应用中AI算法

一、图像CV

内容安全,目标检测,图像识别,智能视觉生产,图像搜索,图像分割,物体检测,图像分类,图像标签,名人识别,概念识别,场景识别,物体识别,场景分析,智能相册,内容推荐,图库管理,网红人物识别,明星人物识别,图像搜索,商品图片搜索,版权图片搜索,通用图片搜索,车牌识别,垃圾分类,车辆检测,菜品识别,车型识别,犬类识别,实例分割,风格迁移,智能填充,智能识图,拍照搜商品,精准广告投放,电商导购,图像分析,图像理解,图像处理,图像质量评估,场景识别,物体识别,场所识别,图像自训练平台,图像分类,目标检测,图像分割,关键点检测,图像生成,场景文字识别,度量学习,图像识别,图像比对,图像分类使用手册,图像分类API文档目标检测使用手册,目标检测API文档Logo检测使用手册,Logo检测API文档,通用图片搜索,车牌识别,垃圾分类,车辆检测,车型识别,犬类识别,实例分割,风格迁移,智能填充,车牌识别,相册聚类,场景与物体识别,无限天空,图像识别引擎,黄色图片识别,暴力图像识别,工业轮胎智能检测,肋骨骨折识别,显微识别,图像处理,广告识别,人脸算法,人体算法,图像识别,图像增强,OCR,图像处理,ZoomAI,智能贴图,智能制作,质量评价,图像识别,智能鉴黄,图像识别,实时手写识别,唇语识别,通用文字识别,手写文字识别,图像技术,图像识别,图像审核,图像搜索,图像增强,图像特效,车辆分析,图像生成,绘画机器人独家,动漫化身独家,像素风独家,超清人像独家,图像融合,换脸技术,神奇变脸,图像风格化,证件照生成,线稿图像识别,宝宝检测,图像分类,圉像深度估计,天空分割,食物分割,猫狗脸技术,食物识别独家,图像美学评分,车辆分析,车型识别,车型识别(含指导价),车型识别(含配置参数),车标识别,人脸识别(活体),车牌识别,表情识别,安全帽识别,计算机影像,计算机视觉,聚焦光学字符识别、人脸识别、质检、感知、理解、交互,图像视频分析,Logo检测,内容审核,智能批改,笔记评估,思维导图评估,物体检测,物体识别。

二、人脸、体态、眼瞳、声音、指纹

人脸分割人脸识别,无,人体分析HAS,识别人的年龄,性别,穿着信息,客流统计分析,智能客服,热点区域分析,人体检测,人脸口罩识别,人脸对比,人脸搜索,人脸检测与属性分析,人脸活体检测,人体关键点检测,行人重识别,细粒度人像分割,人像分割,人脸解析,3D人体姿态估计,人脸融合,人脸识别,换脸甄别,人脸支付,人脸核身,人像变换,人脸试妆,人脸融合,人体分析,手势识别,人脸验证与检索,人脸比对,人脸比对sensetime,人脸水印照比对,静默活体检测,静默活体检测sensetime,人脸检测和属性分析,人脸特征分析tuputech,配合式活体检测,人脸安防,计算机视觉,智能应用服务,人脸查询人脸分析人脸统计名单库管理人脸布控,人脸应用,人体应用,人体查询,车辆查询车辆分析车辆统计车辆布控车辆名单库管理,车辆应用,人脸图像识别人体图像识别车辆图像识别,图像识别,图像比对,人脸比对,人体检测,人脸口罩识别,人脸对比,人脸搜索,人脸检测与属性分析,人脸活体检测,人体关键点检测,行人重识别,细粒度人像分割,人像分割,人脸解析,3D人体姿态估计,人脸融合,人脸识别,人脸检测,人脸比对,人脸搜索,人脸关键点,稠密关键点,人脸属性,情绪识别,颜值评分,视线估计,皮肤分析,3D人脸重建,面部特征分析人体识别,人体检测,人体关键点,人体抠像,人体属性,手势识别人像处理,美颜美型,人脸融合,滤镜,声纹识别支付,语音合成,语音合成,声纹识别,语音唤醒,人脸识别引擎,摄像头人脸识别,图片人脸检测,身份识别,人脸识别,人脸属性,人体识别,声纹识别,衣服检索及聚类,语音分析,声纹识别,说话人归档,人脸和人体识别,人脸检测,手势识别,人脸与人体识别,人脸识别云服务,人脸识别私有化,人脸离线识别SDK,人脸实名认证,人像特效,人体分析,人脸技不,皮肤分析独家,头部分割,宏观人脸分析,人脸关键点检测,微观人脸分析独家,头发分析独家,五官分割,头发分割人体技术,人体外轮廓点检测独家,精细化人像抠图,人体框检测,肢体关键点检测,人像分割,服饰识别,手势识别,皮肤分割,人脸,说话人识别,人脸检测识别,人脸1:1比对,人脸检测,AI人脸/人形车辆,大数据人像图片防伪,QoS保障,CDN,表情识别,举手动作识别,人脸检测,网络切片,边缘计算,人脸分析,人脸检测,人脸搜索,人体分析,手势识别,着装检测,人脸识别,行为检测,人脸识别,人形检测,行为分析,人脸检测,人脸跟踪,人脸比对,人脸查找,人脸属性分析,活体检测,声音指纹,声纹识别。

三、视频

视频分割、视频处理、视频理解、智能视觉、多媒体,视频内容分析,人体动作监控,视频分类,智能交通,人/动物轨迹分析,目标计数,目标跟踪,视频编辑-,精彩片段提取,新闻视频拆分,视频摘要,视频封面,视频拆条,视频标签-,视频推荐,视频搜索,视频指纹-,数字版权管理,广告识别,视频快速审核,视频版权,视频查重,视频换脸,车辆解析, 体育 视频摘要,视频内容分析,颜色识别,货架商品检测, 时尚 搭配,危险动作识别,无,无,视频,视频换脸,车辆解析, 体育 视频摘要,视频内容分析,颜色识别,货架商品检测, 时尚 搭配,危险动作识别,菜品识别,视频识别引擎,结肠息肉检测,胃镜评估系统,视频标签,场景识别,客流分析,手势识别,视频技术,短视频标签,视觉看点识别,动态封面图自动生成,智能剪辑,新闻拆条,智能插帧,视频技术,多模态媒资检索公测中,媒体内容分析,媒体内容审核,视频生成,视频动作识别,

四、ocr文字识别

手写识别,票据识别,通用文档,通用卡证,保险智能理赔,财税报销电子化,证照电子化审批,票据类文字识别,行业类文字识别,证件类文字识别,通用类文字识别,通用文字识别,驾驶证识别,身份证识别,增值税发票识别,行驶证识别,营业执照识别,银行卡识别,增值税发票核验,营业执照核验,智能扫码,行业文档识别, 汽车 相关识别,票据单据识别,卡证文字识别,通用文字识别,手写文字识别,印刷文字识别,银行卡识别,名片识别,身份证识别intsig,营业执照识别intsig,增值税发票识别intsig,拍照速算识别,公式识别,指尖文字识别,驾驶证识别JD,行驶证识别JD,车牌识别JD,身份证识别,增值税发票识别,营业执照识别,火车票识别,出租车发票识别,印刷文字识别(多语种),印刷文字识别(多语种)intsig内容审核,色情内容过滤,政治人物检查,暴恐敏感信息过滤,广告过滤,OCR自定义模板使用手册,OCR自定义模板API文档,通用文字识别,驾驶证识别,身份证识别,增值税发票识别,行驶证识别,营业执照识别,银行卡识别,身份证识别,驾驶证识别,行驶证识别,银行卡识别,通用文字识别,自定义模板文字识别,文字识别引擎,身份证识别,图片文字识别,通用文字识别,身份证识别,名片识别,光学字符识别服务,通用文字识别,手写体文字识别,表格识别,整题识别(含公式),购物小票识别,身份证识别,名片识别,自定义模板文字识别,文字识别,通用文字识别,银行卡识别,身份证识别,字幕识别,网络图片识别, 游戏 直播关键字识别,新闻标题识别,OCR文字识别,通用场景文字识别,卡证文字识别,财务票据文字识别,医疗票据文字识别, 汽车 场景文字识别,教育场景文字识别,其他场景文字识别,iOCR自定义模板文字识别,通用类OCR,通用文本识别(中英)通用文本识别(多语言)通用表格识别,证照类OCR,身份证社保卡户口本护照名片银行卡结婚证离婚证房产证不动产证,车辆相关OCR,行驶证驾驶证车辆合格证车辆登记证,公司商铺类OCR,商户小票税务登记证开户许可证营业执照组织机构代码证,票据类OCR,增值税发票增值税卷票火车票飞机行程单出租车发票购车发票智能技术,票据机器人证照机器人文本配置机器人表格配置机器人框选配置机器人,文字识别,行驶证识别,驾驶证识别,表单识别器,通用文本,财务票据识别,机构文档识别,个人证件识别,车辆相关识别,通用表格,印章识别,财报识别,合同比对,识别文字识别,签名比对,OCR识别,教育OCR,印刷识别,手写识别,表格识别,公式识别,试卷拆录

五、自然语言NPL

文本相似度,文本摘要,文本纠错,中心词提取,文本信息抽取,智能文本分类,命名实体,词性标注,多语言分词,NLP基础服务,地址标准化,商品评价解析智能短信解析,机器阅读理解,金融研报信息识别,法律案件抽取,行业问答推理,行业知识图谱构建,文本实体关系抽取,搜索推荐,知识问答,短文本相似度,文本实体抽取, 情感 倾向分析,兴趣画像匹配,文本分类-多标签,文本分类-单标签,定制自然语言处理,语言生成,语言理解,自然语言处理基础,文本摘要,数据转文字,文本生成,智能问答系统,内容推荐,评价分析,文本分类,对话理解,意图理解, 情感 分析,观点抽取,中文分词,短文本相似度,关键词提取,词向量,命名实体,识别依存,句法分析, 情感 分析,评论观点抽取,短文本相似度,机器翻译,词法分析,词义相似度,词向量,句法分析,文本分类,短语挖掘,闲聊,文本流畅度,同义词,聚类,语言模型填空,新闻热词生成,机器阅读理解,商品信息抽取,词法分析, 情感 分析,关键词提取,用户评论分析,资讯热点挖掘,AIUI人机交互,文本纠错,词法分析,依存句法分析,语义角色标注,语义依存分析(依存树),语义依存分析(依存图), 情感 分析,关键词提取,NLP能力生产平台,NLP基础技术,中文词法分析-LAC,词向量—Word2vec,语言模型—Language_model,NLP核心技术, 情感 分析、文本匹配、自然语言推理、词法分析、阅读理解、智能问答,信息检索、新闻推荐、智能客服, 情感 分析、文本匹配、自然语言推理、词法分析、阅读理解、智能问答,机器问答、自然语言推断、 情感 分析和文档排序,NLP系统应用,问答系统对话系统智能客服,用户消费习惯理解热点话题分析舆情监控,自然语言处理,文本分类使用手册,文本分类API文档, 情感 分析,评论观点抽取,短文本相似度,机器翻译,词法分析,词义相似度,词向量,句法分析,文本分类,短语挖掘,闲聊,文本流畅度,同义词,聚类,语言模型填空,新闻热词生成,机器阅读理解,商品信息抽取智能创作,智能写作,搭配短文,种草标题,卖点标题,社交电商营销文案,自然语言处理能力,基础文本分析,分词、词性分析技术,词向量表示,依存句法分析,DNN语言模型,语义解析技术,意图成分识别, 情感 分析,对话情绪识别,文本相似度检测,文本解析和抽取技术,智能信息抽取,阅读理解,智能标签,NLG,自动摘要,自动写文章,语言处理基础技术,文本审核, 情感 分析,机器翻译,智能聊天,自然语言,基于标题的视频标签,台词看点识别,意图识别,词法分析,相关词,舆情分析,流量预测,标签技术,自然语言处理,语义对话,自然语言处理,车型信息提取,关键词提取,语义理解,语义相似度,意图解析,中文词向量,表示依存,句法分析,上下文理解,词法分析,意图分析,情绪计算,视觉 情感 ,语音 情感 , 情感 分析,沉浸式阅读器,语言理解,文本分析,自然语言处理,在线语音识别,自然语言理解火速上线中, 情感 判别,语义角色标注,依存句法分析,词性标注,实体识别,中文分词,分词,

6、知识图谱

知识图谱,药学知识图谱,智能分诊,腾讯知识图谱,无,药学知识图谱,智能分诊,知识理解,知识图谱Schema,图数据库BGraph,知识图谱,语言与知识,语言处理基础技术,语言处理应用技术,知识理解,文本审核,智能对话定制平台,智能文档分析平台,智能创作平台,知识图谱,实体链接,意图图谱,识别实体,逻辑推理,知识挖掘,知识卡片

7、对话问答机器人

智能问答机器人,智能语音助手,智能对话质检,智能话务机器人,无,电话机器人,NeuHub助力京东智能客服升级,腾讯云小微,智能硬件AI语音助手,对话机器人,无,问答系统对话系统智能客服,Replika对话技术,客服机器人,智能问答,智能场景,个性化回复,多轮交互,情绪识别,智能客服,金融虚拟客服,电话质检,AI语音交互机器人,中移云客服·智能AI外呼,人机对话精准语义分析

8、翻译

协同翻译工具平台,电商内容多语言工具,文档翻译,专业版翻译引擎,通用版翻译引擎,无,机器翻译,无,机器翻译,音视频字幕平台,机器翻译,机器翻译niutrans,文本翻译,语音翻译,拍照翻译,机器翻译,机器翻译,文本翻译,语音翻译,通用翻译,自然语言翻译服务,文本翻译,图片翻译,语音翻译,实时语音翻译,文档翻译(开发版,机器翻译,文本翻译,语音翻译,拍照翻译,机器翻译实时长语音转写,录音文件长语音转写,翻译工具,机器翻译火速上线中

9、声音

便携智能语音一体机,语音合成声音定制,语音合成,一句话识别,实时语音识别录音文件识别,客服电话,语音录入,语音指令,语音对话,语音识别,科学研究,安防监控,声音分类,语音合成,语音识别,实时语音转写,定制语音合成,定制语音识别,语音合成,语音合成声音定制,离线语音合成,短语音识别,录音文件识别,声纹识别,离线语音识别,实时语音识别,呼叫中心短语音识别,呼叫中心录音文件识别,呼叫中心实时语音识别,语音识别,语音合成,声纹识别,语音识别,语音听写,语音转写,实时语音转写,语音唤醒,离线命令词识别,离线语音听写,语音合成,在线语音合成,离线语音合成,语音分析,语音评测,性别年龄识别,声纹识别,歌曲识别,A.I.客服平台能力中间件,语音识别,语音交互技术,语音合成,语音合成声音定制,离线语音合成,短语音识别,录音文件识别,声纹识别,离线语音识别,实时语音识别,呼叫中心短语音识别,呼叫中心录音文件识别,呼叫中心实时语音识别,远场语音识别,语音识别,一句话识别,实时语音识别,录音文件识别,语音合成,实时语音识别,长语音识别,语音识别,语音合成,波束形成,声源定位,去混响,降噪,回声消除,分布式拾音,语音识别,语音唤醒,语音合成,声纹识别,智能语音服务,语音合成,短语音识别,实时语音识别,语音理解与交互,离线唤醒词识别,语音识别,一句话识别,实时语音识别,录音文件识别,电话语音识别,语音唤醒,离线语音识别,离线命令词识别,远场语音识别,语音合成,通用语音合成,个性化语音合成,语音技术,短语音识别,实时语音识别,音频文件转写,在线语音合成,离线语音合成,语音自训练平台,语音交互,语音合成,语音识别,一句话识别,实时短语音识别,语音合成,语音唤醒,本地语音合成,语音翻译,语音转文本,短语音听写,长语音转写,实时语音转写,语音内容审核,会议超极本,语音交互技术,语音识别,语义理解,语音合成,音频转写,音视频类产品,语音通知/验证码,订单小号,拨打验证,点击拨号,数据语音,统一认证,语音会议,企业视频彩铃,语音识别,语音文件转录,实时语音识别,一句话语音识别,语音合成,通用语音合成,个性化语音合成,语音评测,通用语音评测,中英文造句评测,在线语音识别,语音识别,语音唤醒,语音合成,语音合成,语音识别,语音听写,语音转写,短语音转写(同步),语音识别,语音 情感 识别

十、数据挖掘AI硬件

算法类型:包括二分类、多分类和回归,精准营销,表格数据预测,销量预测,交通流量预测,时序预测,大数据,无,机器学习使用手册,机器学习API文档,大数据处理,大数据传输,数据工厂,大数据分析,数据仓库,数据采集与标注,数据采集服务,数据标注服务,AI开发平台,全功能AI开发平台BML,零门槛AI开发平台EasyDL,AI硬件与平台,GPU云服务器,机器人平台,度目视频分析盒子,度目AI镜头模组,度目人脸应用套件,度目人脸抓拍机,人脸识别摄像机,昆仑AI加速卡,智能预测,购车指数,数据科学虚拟机,平台效率,云与AI,抗DDoS,天盾,网站漏洞扫描,网页防篡改,入侵检测防护,弹性云服务器,对象存储服务,云专线(CDA,AI计算机平台—360net深度学习基础模型,AI算法训练适配主流AI框架

十一、其他

内容审核,智能鉴黄,特定人物识别,通用图片审核,文本智能审核,广告检测,Logo检测,商品理解,拍照购,商品图片搜索,通用商品识别,疫情物资识别,酒标识别,细分市场划分,品牌竞争力分析,老品升级,新品定制,商品竞争力分析,商品销量预测,商品营销,用户评论占比预测,商品命名实体识别,商品颜色识别,强化学习,智能地图引擎,内容审核,智能鉴黄,特定人物识别,通用图片审核,文本智能审核,广告检测,Logo检测商品理解,拍照购,商品图片搜索,通用商品识别,疫情物资识别,酒标识别,细分市场划分,品牌竞争力分析,老品升级,新品定制,商品竞争力分析,商品销量预测,商品营销,用户评论占比预测,商品命名实体识别,商品颜色识别,个性化与推荐系统,推荐系统,舆情分析,舆情标签,智慧教育,智能语音评测,拍照搜题,题目识别切分,整页拍搜批改,作文批改,学业大数据平台,文档校审系统,会议同传系统,文档翻译系统,视频翻译系统,教育学习,口语评测,朗读听书,增强现实,3D肢体关键点SDK,美颜滤镜SDK,短视频SDK,基础服务,私有云部署,多模态交互,多模态 情感 分析,多模态意图解析,多模态融合,多模态语义,内容审查器,Microsoft基因组学,医学人工智能开放平台,数据查验接口,身份验证(公安简项),银行卡验证,发票查验,设备接入服务Web/H5直播消息设备托管异常巡检电话提醒,音视频,视频监控服务云广播服务云存储云录制,司乘体验,智能地图引擎,消息类产品,视频短信,短信通知/验证码,企业挂机彩信,来去电身份提示,企业固话彩印,模板闪信,异网短信,内容生产,试卷拆录解决方案,教学管理,教学质量评估解决方案,教学异常行为监测,授课质量分析解决方案,路况识别,人车检测,视觉SLAM,高精地图,免费SDK,智能诊后随访管理,用药管家,智能预问诊,智能导诊,智能自诊,智能问药,智能问答,裁判文书近义词计算,法条推荐,案由预测,

I. 展现完美的自己 英伟达AI算法提升视频会议体验

受新冠疫情的影响,加速了各行业企业移动化办公的需求,这期间,有大量的用户和企业选择了线上视频会议。那么,我们如何在视频会议中展现更完美的自己呢?

近日,2021年国际计算机视觉与模式识别会议(CVPR 2021)正式召开。基于GAN研究的NVIDIA Maxine云AI视频流SDK现已在CVPR 2021上展出。让我们看一看GAN研究是如何重塑视频会议的呢?

起床、启动笔记本电脑、打开网络摄像头——得益于NVIDIA研究人员开发的AI技术,每次都能在视频通话中展现完美的自己。

Vid2Vid Cameo是用于视频会议的NVIDIA Maxine SDK背后的深度学习模型之一,它借助生成式对抗网络(GAN),仅用一张人物2D图像即可合成逼真的人脸说话视频。

要使用该模型,参与者需要在加入视频通话之前提交一张参照图像(真实照片或卡通头像)。在会议期间,AI模型将捕捉每个人的实时动作,并将其应用于之前上传的静态图像。

也就是说,上传一张穿着正装的照片之后,与会人员即使头发凌乱、穿着睡衣,也能在通话中以穿着得体工作服装的形象出现,因为AI可以将用户的面部动作映射到参照照片上。如果主体向左转,则技术可以调整视角,以便参与者看上去是直接面对摄像头的。

除了可以帮助与会者展现出色状态外,这项AI技术还可将视频会议所需的带宽降低10倍,从而避免抖动和延迟。它很快将在NVIDIA Video Codec SDK中作为AI Face Codec推出。

NVIDIA研究人员兼项目的联合创作者Ming-Yu Liu表示:“许多人的互联网带宽有限,但仍然希望与朋友和家人进行流畅的视频通话。这项基础技术除了可以为他们提供帮助外,还可用于协助动画师、照片编辑师和 游戏 开发者的工作。”

Vid2Vid Cameo本周发表于着名的国际计算机视觉与模式识别会议,这是NVIDIA在本次虚拟会议上发表的28篇论文之一。此外,它还在AI Playground上推出,在此所有人均可亲身体验我们的研究演示。

AI大出风头

在一部经典盗贼电影(同时也是Netflix的热门节目)的致谢中,NVIDIA研究人员将他们的人脸说话GAN模型迅速用于虚拟会议。演示重点介绍Vid2Vid Cameo的主要功能,包括面部重定向、动画头像和数据压缩

这些功能即将登陆NVIDIA Maxine SDK,为开发者提供经过优化的预训练模型,以便在视频会议和直播中实现视频、音频和增强现实效果。

开发者已经能采用Maxine AI效果,包括智能除噪、视频升采样和人体姿态估计。SDK支持免费下载,还可与NVIDIA Jarvis平台搭配用于对话式AI应用,包括转录和翻译。

来自AI的问候

Vid2Vid Cameo只需两个元素,即可为视频会议打造逼真的AI人脸说话动态,这两个元素分别是一张人物外貌照片和一段视频流,它们决定了如何对图像进行动画处理。

模型基于NVIDIA DGX系统开发,使用包含18万个高质量人脸说话视频的数据集进行训练。网络已掌握识别20个关键点,这些关键点可用于在没有人工标注的情况下对面部动作进行建模。这些点对特征(包括眼睛、嘴和鼻子)的位置进行编码。

然后,它会从通话主导者的参照图像中提取这些关键点,这些关键点可以提前发送给其他的视频会议参与者,也可以重新用于之前的会议。这样一来,视频会议平台只需发送演讲者面部关键点的移动情况数据,无需将某参与者的大量直播视频流推送给其他人。

对于接收者一端,GAN模型会使用此信息,模拟参照图像的外观以合成一个视频。

通过仅来回压缩及发送头部位置和关键点,而不是完整的视频流,此技术将视频会议所需的带宽降低10倍,从而提供更流畅的用户体验。该模型可以进行调整,传输不同数量的关键点,以实现在不影响视觉质量的条件下,适应不同的带宽环境。

此外,还可以自由调整所生成的人脸说话视频的视角,可以从侧边轮廓或笔直角度,也可以从较低或较高的摄像头角度来显示用户。处理静态图像的照片编辑者也可以使用此功能。

NVIDIA研究人员发现,无论是参照图像和视频来自同一个人,还是AI负责将某个人的动作转移到另一个人的参照图像,Vid2Vid Cameo均能生成更逼真、更清晰的结果,优于先进的模型。

后一项功能可将演讲者的面部动作,应用于视频会议中的数字头像动画,甚至可以应用于制作视频 游戏 或卡通角色的逼真形象和动作。

Vid2Vid Cameo论文由NVIDIA研究人员Ting-Chun Wang、Arun Mallya和Ming-Yu Liu共同撰写。NVIDIA研究团队在全球拥有超过200名科学家,专注于AI、计算机视觉、自动驾驶 汽车 、机器人和图形等领域。

我们要感谢演员Edan Moses ,他在Netflix上的《纸钞屋》中担任教授的英语配音,感谢他在以上我们最新AI研究的介绍视频中做出的贡献。

写在最后,视频会议现已经成为人们日常生活的一部分,能够帮助数百万人工作、学习、 娱乐 ,甚至就医。NVIDIA Maxine集成了先进的视频、音频和对话式AI功能,给那些帮助我们保持联络的视频会议平台带来效率突破。(陶然)

阅读全文

与ai算法优化教学视频相关的资料

热点内容
酒店怎么使用警察叔叔app 浏览:76
java数组怎么输入 浏览:383
java新建对象数组 浏览:146
aps系统排产EXCEL源码 浏览:185
cnc学什么编程语言 浏览:877
多元逻辑回归算法的矩阵 浏览:3
地铁逃生体验服显示服务器异常怎么办 浏览:323
14乘17的速算法 浏览:347
小型泡沫压缩机 浏览:106
php上传的文件名乱码 浏览:996
2017贺银成讲义pdf 浏览:854
麻将分算法 浏览:589
安卓手机如何打开sdl文件 浏览:215
为什么安卓手机截不了收付款的图 浏览:242
贱人插件命令 浏览:843
单片机发展论文 浏览:316
条件编译和符号干嘛用的 浏览:85
程序员坐牢了会被安排去写代码吗 浏览:855
iphoneapp使用时间怎么关闭 浏览:431
怎么建造生存服务器指令 浏览:554