導航:首頁 > 源碼編譯 > ai演算法優化教學視頻

ai演算法優化教學視頻

發布時間:2022-12-29 21:15:33

A. 哪裡有一些比較全面的ai教程,視頻的,一定要全面

想要找比較全面的ai教程視頻,推薦去【達內教育】的官網,AI視頻分析一般包括演算法、算力、平台三個部分,該官網三個部分視頻都含有。AI的應用需要海量的數據訓練以及豐富的應用場景採集數據,建議參加培訓進行學習。【達內教育】該機構擁有一支具有豐富教學經驗的教師隊伍。

學習AI就業具體如下:
1、ai的發展方向科研機構(機器人研究所)軟硬體開發人員、AI相關的計算機語言開發人員、專業培訓機構的講師等,還可以在優秀的大廠做搜索方向(智能搜索,語音搜索,圖片搜索等方向)。
2、AI可以應用於各行各業,以軟體形式落地行業更具價值。感興趣的話點擊此處,免費學習一下

想了解更多有關ai的相關信息,推薦咨詢【達內教育】。作為國內IT培訓的領導品牌,達內的每一名員工都以「幫助每一個學員成就夢想」為己任,也正因為達內人的執著與努力,達內已成功為社會輸送了眾多合格人才,為廣大學子提供更多IT行業高薪機會,同時也為中國IT行業的發展做出了巨大的貢獻。達內IT培訓機構,試聽名額限時搶購。

B. 求問五子棋AI演算法思路

五子棋的核心演算法

五子棋是一種受大眾廣泛喜愛的游戲,其規則簡單,變化多端,非常富有趣味性和消遣性。這里設計和實現了一個人機對下的五子棋程序,採用了博弈樹的方法,應用了剪枝和最大最小樹原理進行搜索發現最好的下子位置。介紹五子棋程序的數據結構、評分規則、勝負判斷方法和搜索演算法過程。

一、相關的數據結構
關於盤面情況的表示,以鏈表形式表示當前盤面的情況,目的是可以允許用戶進行悔棋、回退等操作。
CList StepList;
其中Step結構的表示為:

struct Step
{
int m; //m,n表示兩個坐標值
int n;
char side; //side表示下子方
};
以數組形式保存當前盤面的情況,
目的是為了在顯示當前盤面情況時使用:
char FiveArea[FIVE_MAX_LINE][FIVE_MAX_LINE];

其中FIVE_MAX_LINE表示盤面最大的行數。

同時由於需要在遞歸搜索的過程中考慮時間和空間有效性,只找出就當前情況來說相對比較好的幾個盤面,而不是對所有的可下子的位置都進行搜索,這里用變數CountList來表示當前搜索中可以選擇的所有新的盤面情況對象的集合:

CList CountList;
其中類CBoardSituiton為:
class CBoardSituation
{
CList StepList; //每一步的列表
char FiveArea[FIVE_MAX_LINE][FIVE_MAX_LINE];
struct Step machineStep; //機器所下的那一步
double value; //該種盤面狀態所得到的分數
}

二、評分規則
對於下子的重要性評分,需要從六個位置來考慮當前棋局的情況,分別為:-,¦,/,\,//,\\

實際上需要考慮在這六個位置上某一方所形成的子的布局的情況,對於在還沒有子的地方落子以後的當前局面的評分,主要是為了說明在這個地方下子的重要性程度,設定了一個簡單的規則來表示當前棋面對機器方的分數。

基本的規則如下:

判斷是否能成5, 如果是機器方的話給予100000分,如果是人方的話給予-100000 分;
判斷是否能成活4或者是雙死4或者是死4活3,如果是機器方的話給予10000分,如果是人方的話給予-10000分;
判斷是否已成雙活3,如果是機器方的話給予5000分,如果是人方的話給予-5000 分;
判斷是否成死3活3,如果是機器方的話給予1000分,如果是人方的話給予-1000 分;
判斷是否能成死4,如果是機器方的話給予500分,如果是人方的話給予-500分;
判斷是否能成單活3,如果是機器方的話給予200分,如果是人方的話給予-200分;
判斷是否已成雙活2,如果是機器方的話給予100分,如果是人方的話給予-100分;
判斷是否能成死3,如果是機器方的話給予50分,如果是人方的話給予-50分;
判斷是否能成雙活2,如果是機器方的話給予10分,如果是人方的話給予-10分;
判斷是否能成活2,如果是機器方的話給予5分,如果是人方的話給予-5分;
判斷是否能成死2,如果是機器方的話給予3分,如果是人方的話給予-3分。

實際上對當前的局面按照上面的規則的順序進行比較,如果滿足某一條規則的話,就給該局面打分並保存,然後退出規則的匹配。注意這里的規則是根據一般的下棋規律的一個總結,在實際運行的時候,用戶可以添加規則和對評分機制加以修正。

三、勝負判斷
實際上,是根據當前最後一個落子的情況來判斷勝負的。實際上需要從四個位置判斷,以該子為出發點的水平,豎直和兩條分別為 45度角和135度角的線,目的是看在這四個方向是否最後落子的一方構成連續五個的棋子,如果是的話,就表示該盤棋局已經分出勝負。具體見下面的圖示:

四、搜索演算法實現描述
注意下面的核心的演算法中的變數currentBoardSituation,表示當前機器最新的盤面情況, CountList表示第一層子節點可以選擇的較好的盤面的集合。核心的演算法如下:
void MainDealFunction()
{
value=-MAXINT; //對初始根節點的value賦值
CalSeveralGoodPlace(currentBoardSituation,CountList);
//該函數是根據當前的盤面情況來比較得到比較好的可以考慮的幾個盤面的情況,可以根據實際的得分情況選取分數比較高的幾個盤面,也就是說在第一層節點選擇的時候採用貪婪演算法,直接找出相對分數比較高的幾個形成第一層節點,目的是為了提高搜索速度和防止堆棧溢出。
pos=CountList.GetHeadPosition();
CBoardSituation* pBoard;
for(i=0;ivalue=Search(pBoard,min,value,0);
Value=Select(value,pBoard->value,max);
//取value和pBoard->value中大的賦給根節點
}
for(i=0;ivalue)
//找出那一個得到最高分的盤面
{
currentBoardSituation=pBoard;
PlayerMode=min; //當前下子方改為人
Break;
}
}

其中對於Search函數的表示如下:實際上核心的演算法是一個剪枝過程,其中在這個搜索過程中相關的四個參數為:(1)當前棋局情況;(2)當前的下子方,可以是機器(max)或者是人(min);(3)父節點的值oldValue;(4)當前的搜索深度depth。

double Search(CBoardSituation&
board,int mode,double oldvalue,int depth)
{
CList m_DeepList;
if(deptholdvalue))== TRUE)
{
if(mode==max)
value=select(value,search(successor
Board,min,value,depth+1),max);
else
value=select(value,search(successor
Board,max,value,depth+1),min);
}
return value;
}
else
{
if ( goal(board)<>0)
//這里goal(board)<>0表示已經可以分出勝負
return goal(board);
else
return evlation(board);
}
}

注意這里的goal(board)函數是用來判斷當前盤面是否可以分出勝負,而evlation(board)是對當前的盤面從機器的角度進行打分。

下面是Select函數的介紹,這個函數的主要目的是根據 PlayerMode情況,即是機器還是用戶來返回節點的應有的值。

double Select(double a,double b,int mode)
{
if(a>b && mode==max)¦¦ (a< b && mode==min)
return a;
else
return b;
}

五、小結
在Windows操作系統下,用VC++實現了這個人機對戰的五子棋程序。和國內許多隻是採用規則或者只是採用簡單遞歸而沒有剪枝的那些程序相比,在智力上和時間有效性上都要好於這些程序。同時所討論的方法和設計過程為用戶設計其他的游戲(如象棋和圍棋等)提供了一個參考。

C. 人工智慧結課論文

“人工智慧”是大學本科自動化專業所開設的一門專業選修課,為了能夠調動自動化專業的學生對本課程學習的積極性,對《人工智慧》這門專業選修課程的 教學 方法 進行了探索和 總結 。以下是我整理分享的關於人工智慧結課論文的相關 文章 ,歡迎閱讀!

人工智慧結課論文篇一

對《人工智慧》專業選修課教學的幾點體會

摘要:“人工智慧”是大學本科自動化專業所開設的一門專業選修課,為了能夠調動自動化專業的學生對本課程學習的積極性,提高《人工智慧》專業選修課的教學效果,我們結合近幾年的實際教學 經驗 ,從優選教材、考核方式、教學內容調整、教學手段的改進和實踐教學等方面對《人工智慧》這門專業選修課程的教學方法進行了探索和總結。

關鍵詞:人工智慧 優選教材 考核方式內容 手段 實踐

人工智慧(Aritificial Intelligence,英文縮寫為AI)是一門綜合了應用數學、自動控制、模式識別、系統工程、計算機科學和心理學等多種學科交叉融合而發展起來的的一門新型學科,是21世紀三大尖端技術(基因工程、納米科學、人工智慧)之一。它是研究智能機器所執行的通常與人類智能有關的職能行為,如推理、證明、感知、規劃和問題求解等思維活動,來解決人類處理的復雜問題。人工智慧緊跟世界社會進步和科技發展的步伐,與時俱進,有關人工智慧的許多研究成果已經廣泛應用到國防建設、工業生產、國民生活中的各個領域。在信息網路和知識經濟時代,人工智慧現已成為一個廣受重視且有著廣闊應用潛能的前沿學科,必將為推動科學技術的進步和產業的發展發揮更大的作用。因此在我國的大中專院校中開展人工智慧這門課的教學與科研工作顯得十分緊迫。迄今為止,全國絕大多數工科院校中的自動控制、計算機/軟體工程、電氣工程、機械工程、應用數學等相關專業都開設了人工智慧這門課程。南京郵電大學自動化學院自2005年成立至今,一直將“人工智慧”列為自動化專業本科生的選修課程,到目前為止已經有八年的歷史了。由於南京郵電大學是一所以郵電、通信、電子、計算機、自動化為特色的工科院校,因此,學校所開設的許多專業都迫切需要用人工智慧理論和方法解決科研中的實際問題。在問題需求的推動下,南郵人經過多年的努力工作,在人工智慧科研方面取得了豐碩的成果,如物聯網學院所開發的現代智能物流系統、自動化學院所開發的城市交通流量控制與決策系統,為本課程的開設提供了典型的教學案例。我們結合近幾年的實際教學經驗,從優選教材、考核方式、教學內容調整、教學手段的改進和實踐教學等方面對人工智慧課程教學方法進行了總結歸納。

一、優選教材

目前,國內有關人工智慧課程的中英版教材種類非常多,遵循實用、簡單、夠用的原則,再經過授課老師和學生們的共同調研,我們選用由中南大學蔡自興教授主編的《人工智慧及其應用》第三版作為南郵本課程的授課教材。本書覆蓋的人工智慧知識體系比較全面,包含知識表示、搜索推理、模糊計算、專家系統等。本書主要針對計算機、自動化、電氣工程等本科專業的學生所編寫,內容基礎,難度適中。蔡教授所編寫的這本教材全面地介紹了人工智慧的研究內容與應用領域,做到了內容新穎、簡單易懂、兼顧基礎和應用,受到了全國廣大師生們的一致好評,多年的教學實踐證明我們所選擇的教材是恰當的、正確的。

二、考核方式

在全國大部分高等院校,“人工智慧”這門課大都選擇開卷考試的方式來進行考核。為了強化學生對人工智慧這門課基礎知識的掌握,南京郵電大學自動化學院選用閉卷考試的方式來進行考核。為了打消部分學生想在期末閉卷考試中通過作弊手段來完成人工智慧這門課考核的僥幸心理,我們加強了對學生平時考勤成績、課下作業成績和實驗成績的考核,從而杜絕了“一紙定成績”的現象。我們對人工智慧這門課的最後期末成績是按如下權重來劃分的:平時考勤成績佔10%、課下作業成績佔10%、實驗成績佔20%、最後的期末考試卷面成績只佔60%。為了克服國家現行 教育 體制的弊端,避免學生“機械式”地的應對教學和考試,我們對考試題型進行了調整,不再是以往的填空、選擇、簡答等題型,而是改為以解決實際問題為導向的應用題型為主,這樣學生只需要在理解授課內容的基礎上利用自己的思維來解題就可以了,這也體現了國家目前正在提倡的應用型教學導向。

三、教學內容調整

對於本科生而言,人工智慧這門課程所需要講授的內容實在太多,由於課時所限,我們必須精簡教學內容,讓學生在掌握基礎知識的同時,也能夠了解它的具體應用。因此,我們將人工智慧這門課程的教學內容分為兩個部分:第一部分是基本理論和方法,包括人工智慧的概述、知識表示方法、確定性推理方法等;第二部分為人工智慧研究成果的具體應用,包括神經元網路計算、模糊智能計算、專家知識庫系統、機器語言學習等。通過對教材內容的合理調整和安排,使得授課計劃能夠比較全面地覆蓋了人工智慧這門課程的基本知識點,從而滿足了學生們的求知需求。

四、教學手段的改進

(一) 激發學生的學習興趣

經過長時間的教學我們發現,在選修“人工智慧”這門課程時,每個學生的心中所想各有不同,這些學生在剛開始學習時興趣還比較強烈,但隨著教學內容變得越來越抽象,學生逐漸對這本課的學習失去了信心,甚至上課時間不去聽課,使授課教師對教學也漸漸失去了信心,導致惡性循環,嚴重影響了教學質量。針對這種現象,我們認為,在開課前充分激發學生的學習興趣是很有必要的。我們要結合學校的實驗條件,開課前給學生演示“機器人醫療服務”實驗,通過該實驗的演示,讓學生們看到機器人能夠給病人提供多項人性化的服務,理解人工智慧技術在開發醫療服務機器人多項關鍵技術中的應用,讓學生在開課前能夠對本課程的學習產生極大的興趣,實踐證明這種方法是有效的。

(二) 藉助多媒體教學

多媒體教學是現代教學過程中一種非常重要的形式,它往往根據教學目的和學生們的特點,通過合理的設計、選擇教材內容,應用公式、圖形、文字、視頻等多種媒體信息進行有機組合並通過電腦和投影機顯示出來,與傳統教學手段相結合,形成合理的教學過程結構,達到最優化的教學效果。人工智慧這門課具有針對性強、內容抽象、公式繁瑣等特點,學生學習起來比較困難,為了讓學生生動、形象地學習該課程,我們在教學過程中充分利用了多媒體技術來組織教學。例如在課堂教學過程中播放南郵自動化學院梁志偉博士帶領學生所開發的“智能 足球 機器人”比賽片段;讓學生在線觀看北京大學工學院謝廣明博士帶領學生所開發的“自主視覺機器魚”錄像片段等。在講解某些重要的求解演算法時,藉助Matlab軟體和投影機,直接展現該演算法的求解過程,從而改善了課程教學的形式,提高了教學質量。 (三)提倡課堂 辯論

我們在教學過程中打破了傳統的“老師講課學生聽課”的教學模式,多次組織課堂辯論,辯論的主題包括人工智慧研究過程中出現的技術困惑、人工智慧研究成果轉化中的市場前景等。如組織了“電腦PK人腦”“電腦是否讓電視消失”“電腦的未來發展方向在哪裡”等一系列 辯論會 。經過激烈的辯論,無論正方還是反方都感覺自己收獲很大,增長了知識,開闊了眼界。在教學過程中通過將學生由“被動聽課”角色變換為“主動參與”角色,大大地調動了學生的學習積極性,從而提高了課堂教學質量。

五、實踐教學

實踐教學是課堂教學不可缺少的重要組成部分,通過讓學生親自動手實驗來對理論知識進行檢驗和應用是目前國內外各個大學提高學生綜合素質、增強學生市場競爭力的重要手段。人工智慧實驗教學的目的是讓學生通過親自動手體會授課中的各種智能控制演算法,從而使學生能夠更加形象地掌握課本知識。人工智慧教學計劃安排了4學時實驗課,設置了“傳教士和野人過河”“機器人路徑規劃”這兩個人工智慧問題,要求學生獨立完成這2個實驗題目的編程,並書寫實驗 報告 。通過實驗,學生動手實踐了課堂上所掌握的理論知識,加深了對智能演算法的理解。

人工智慧是一門實用性較強的課程,我們總結了近幾年來的教學經驗,從優選教材、考核方式、教學內容調整、教學手段的改進和實踐教學五個方面對人工智慧課程教學進行了總結。從學生的反饋來看,我們所總結的教學經驗對於指導新教師講授“人工智慧”這門課程具有積極的作用,需要指出的是,我們仍有很多不足之處,需要在以後的教學過程中不斷努力完善,提高自己的教學能力,爭取更好的教學效果。

參考文獻

[1]蔡自興,徐光佑.人工智慧及其應用[M].北京:清華大學出版社,2003.

[2]路小英,周桂紅,趙艷等.高等農業院校《人工智慧》課程的教學研究與實踐[J].河北農業大學學報:農林教育版,2007,9(4):66-68.

[3]馬建斌,李閱歷,高媛. 人工智慧課程教學的探索與實踐[J].河北農業大學學報:農林教育版,2011,13(3):330-332.

[4]趙海波.人工智慧課程教學方法的探討[J].科技信息,2011,(7):541.

[5]張廷,楊國勝.“人工智慧”課程教學的實踐與探索[J].課程與教學,2009(11):133-134.

本研究得到了江蘇省2011年度研究生雙語授課教學試點項目—“模式識別與智能系統”項目經費的資助。

下一頁分享更優秀的<<<人工智慧結課論文

D. 請問自學AI演算法需要懂什麼知識

首先你需要數學基礎:高等數學,線性代數,概率論數理統計和隨機過程,離散數學,數值分析
其次需要演算法的積累:人工神經網路,支持向量機,遺傳演算法等等演算法;當然還有各個領域需要的演算法,比如你要讓機器人自己在位置環境導航和建圖就需要研究SLAM;總之演算法很多需要時間的積累;
然後,需要掌握至少一門編程語言,畢竟演算法的實現還是要編程的;如果深入到硬體的話,一些電類基礎課必不可少;
人工智慧一般要到研究生才會去學,本科也就是蜻蜓點水看看而已,畢竟需要的基礎課過於龐大。

E. 極客時間上的AI演算法工程師線上培訓課程怎麼樣

我來貢獻一波,極客時間挺不錯的

F. CCCF專欄 | 智能計算系統——一門人工智慧專業的系統課程

我國人工智慧底層研究能力缺失的現象嚴重,最根本的原因在於這方面人才教育培養的缺失。2018年中,作者陳雲霽在中國科學院大學開設了一門「智能計算系統」課程。這門課程受到了學生的歡迎,有很多選不上課的學生跟著旁聽了整個學期。

關鍵詞:智能計算系統 人工智慧 專業課程

編者按 :5年前,本文作者陳雲霽受邀在CCCF專欄上發表了一篇題為《體系結構研究者的人工智慧之夢》 1 的文章,第一次公開介紹他從通用處理器轉向深度學習處理器方向的心路歷程(那篇文章後來也被收錄進了《CCCF優秀文章精選》)。經過5年的努力,陳雲霽在深度學習處理器方向作出了國際公認的貢獻:他的學術論文被頂級會議ISCA』18超過四分之一的論文引用,他的技術成果被應用到華為、曙光、阿里等近億台智能手機和伺服器中。他因此被Science雜志評價為智能晶元的「先驅」和「領導者」。現在,當深度學習處理器已經成為學術界和工業界的熱點時,陳雲霽再次轉身,邁向人工智慧系統課程教學的新舞台。這篇文章將和大家分享他走向這個新舞台的心路歷程。

智能計算系統課程的開設

我是一名中國科學院計算技術研究所的青年科研人員,主要從事計算機系統結構和人工智慧交叉方向的基礎研究。看到本文的標題和作者單位,大家可能會覺得有一點奇怪:作者和人工智慧專業課程有什麼關系?因為傳統意義上,上課是高校教師的職責,中國科學院的員工除非是自願擔任了中國科學院大學(國科大)的崗位教授,否則並沒有上課的義務。

驅使我主動思考人工智慧專業課程設計的最主要的原因,是這樣一個眾所周知的現象:越是人工智慧上層(演算法層、應用層,見圖1)的研究,我國研究者對世界作出的貢獻越多;越是底層(系統層、晶元層),我國研究者的貢獻越少。在各種ImageNet比賽中,我國很多機構的演算法模型已經呈現「霸榜」的趨勢,可以說代表了世界前沿水平。但這些演算法模型絕大部分都是在CUDA 2 編程語言、Tensorflow編程框架以及GPU之上開發的。在這些底層「硬 科技 」中,我國研究者對世界的貢獻就相對少了很多。底層研究能力的缺失不僅會給我國人工智慧基礎研究拖後腿,更重要的是,將使得我國智能產業成為一個空中樓閣,走上信息產業受核心晶元和操作系統制約的老路。

圖1 人工智慧研究大致層次

我國人工智慧底層研究能力缺失的原因很多,我認為最根本的原因在於這方面的人才教育培養的缺失。沒有肥沃的土壤,就長不出參天大樹。沒有具備系統思維的人工智慧專業學生,我國就難以出現傑夫·迪恩(Jeff Dean)這樣的智能計算系統大師,也不會產生有國際競爭力的智能系統產品。因此,在人工智慧專業學生的培養上,我們應當主動作為去改變局面。

2018年我國有35個高校設立了人工智慧本科專業,這是重新思考和梳理人工智慧培養體系的一次重大機遇。就我目前的了解,大部分高校在考慮人工智慧課程體系時,採用的是純演算法、純應用的教學思路。這樣培養出來的學生,仍然是偏向上層應用開發,對智能計算系統缺乏融會貫通的理解。

事實上,各個高校不乏有識之士,在課程設計上繞開系統課程往往受制於三大客觀困難:一是國內還沒有太多人工智慧系統類的課程可供參考,二是國內缺乏人工智慧系統類課程的師資,三是國際上缺乏人工智慧系統課程的教材。

基於自己的研究背景,我對人工智慧的演算法和系統都有一些粗淺的涉獵。我是否能為解決人工智慧系統課程、師資、教材上的困難作一點微薄的貢獻?是否可以身體力行地培養一些具備系統思維和能力的人工智慧專業學生呢?

因此,2018年中,我向中國科學院大學申請開設一門人工智慧專業的系統課程,名為「智能計算系統」(曾名「智能計算機」),希望能培養學生對智能計算完整軟硬體技術棧(包括基礎智能演算法、智能計算編程框架、智能計算編程語言、智能晶元體系結構等)融會貫通的理解。這門課程受到了學生的歡迎,有很多選不上課的學生跟著旁聽了整個學期。讓我尤其感動的是,有其他研究所的學生慕名自發地從中關村跑到懷柔來聽課,上一次課來回車程就要三個小時,回到中關村都是深夜。這也許能說明這門課對學生來說有一定吸引力,大家在聽課中有真正的收獲。

人工智慧專業學生培養和課程體系

人工智慧專業的課程體系設計應該服務於學生培養目標。那麼高校人工智慧專業應該培養什麼樣的學生?

這個問題可能還沒有統一的答案。對比和人工智慧專業非常接近的計算機專業,高校的計算機專業培養的顯然不是計算機的使用者,而是計算機整機或者子系統的研究者、設計者和製造者。

我國計算機專業的前輩在六十多年前開始設立計算機專業時,就高瞻遠矚地設計了一個軟硬結合的方案來培養計算機整機或者子系統的研究者、設計者和製造者。這套方案經過六十年的演進,依然基本保持了當年的初衷。今天,各個高校的計算機專業,基本都開設了計算機組成原理、操作系統、編譯原理、計算機體系結構等系統類的必修課程(見圖2)。也就是說,雖然計算機專業的學生畢業後大多從事軟體開發工作,但是他們對計算機硬體系統還是有基礎的了解的。

圖2 網易雲課堂上的計算機專業培養方案 3

人工智慧專業學生的培養目標應當是人工智慧系統或者子系統的研究者、設計者和製造者。只有實現這個目標,高校培養的人才才能源源不斷地全面支撐我國人工智慧的產業和研究。為了實現這個目標,人工智慧專業的課程設計應當包括軟硬兩條線(就像計算機專業)。如果人工智慧專業只開設機器學習演算法、視聽覺應用等課程,那充其量只能算是「人工智慧應用專業」或者「人工智慧演算法專業」。畢竟演算法只是冰山露出水面的一角,冰山底下90%還是硬體和系統。

就拿擁有世界上最大的AI演算法研究團隊的公司谷歌來說,谷歌董事長約翰·軒尼詩(John Hennessy)是計算機體系結構科學家,圖靈獎得主;谷歌AI的總負責人傑夫·迪恩(Jeff Dean)是計算機系統研究者;谷歌AI最令人矚目的三個進展(Tensorflow, AlphaGo, TPU)都是系統,而不僅僅是某個特定演算法,演算法只是系統的一個環節。因此,從人工智慧國際學術主流來看,系統的重要性是不亞於演算法的。

只學過演算法的學生或許對於調模型參數很在行,但是對一個演算法的耗時、耗電毫無感覺。這樣的學生不具備把一個演算法在工業系統上應用起來的基本功(因為一個演算法真正要用起來必須滿足延遲和能耗的限制)。

只有加入了系統線的課程,學生才能真正理解人工智慧是怎樣工作的,包括一個人工智慧演算法到底如何調用編程框架,編程框架又是怎麼和操作系統打交道,編程框架里的運算元又是怎樣一步步在晶元上運行起來。這樣的學生能親手構建出復雜的系統或者子系統,在科研上會有更大的潛力,在產業里也會有更強的競爭力。正如業界所雲:「會用Tensorflow每年賺30萬人民幣,會設計Tensorflow每年賺30萬美元。」

有很多老師和我說:「人工智慧專業確實應當有一些系統類的課程。但國內從來沒有開過這樣的課,也沒有合適的教材,我們學院也缺乏相應的老師來教這樣的課程。」這是很實際的三個客觀困難,但不應當影響我們對人工智慧專業的課程設計。

從學生角度講,人工智慧專業開設什麼課程,應該是看國家和企業需要學生會什麼,而不完全是看老師現在會什麼。六十年前,我國沒有幾個人見過計算機,更別說開課了。但為了兩彈一星等科學和工程計算任務,我國依然成立了中科院計算所,並在計算所辦計算機教師培訓班,在清華大學、中國科學技術大學等高校(此處恕不能一一列全)開設計算機專業,這才有了今天我國巨大的計算機產業。

從教師角度講,人工智慧的系統研究已經成為國際學術熱點,講授這類課程是一個教學相長的過程,能幫助教師走到國際學術前沿。今年美國計算機方向Top4高校(斯坦福大學、卡耐基梅隆大學、加州大學伯克利分校和麻省理工學院)以及其他多個國際單位的研究者聯合發布了一份名為「Machine Learning System(機器學習系統)」的白皮書。在這樣的新興熱門方向布局培育一批青年教師,無疑對提升所在高校乃至我國在人工智慧學術界的影響力有巨大幫助。

因此,不論是對於人工智慧專業的學生還是教師來說,把系統類課程開起來,都是有必要,也是有實際意義的。

什麼是智能計算系統

簡單來說,智能計算系統就是人工智慧的物質載體。現階段的智能計算系統通常是集成通用CPU和智能晶元(英偉達GPU或寒武紀MLU等)的異構系統,並向開發者提供智能計算編程框架和編程語言等。之所以要在通用CPU之外加上智能晶元,主要是因為通用CPU難以滿足人工智慧計算不斷增長的速度和能耗需求。例如,2012年穀歌大腦用了1.6萬個CPU核運行了數天來訓練怎麼識別貓臉,這對於工業應用來說是很難接受的。顯然,要想真正把人工智慧技術用起來,必須使用異構的智能計算系統。而為了降低異構智能計算系統的編程難度,就需要有面向智能計算的編程框架和編程語言。

事實上,智能計算系統已經以種種形態廣泛滲透到我們的生活中了。IBM的超級計算機Summit用機器學習方法做天氣預報,BAT的數據中心上運行著大量的廣告推薦任務,華為的手機上集成寒武紀深度學習處理器來處理圖像分析和語音識別,特斯拉的自動駕駛系統……都可以看成是智能計算系統。在智能時代,中國乃至全世界都需要大批的智能計算系統的開發者、設計者、應用者。

智能計算系統的發展並不是一蹴而就的事情。20世紀80年代面向符號主義智能處理的專用計算機(Prolog機和LISP機)可以被看成是第一代智能計算系統。但是當時人工智慧缺乏實際應用,演算法也不成熟,而且當時摩爾定律還處於飛速發展階段,專用計算機相對每18個月性能就能翻番的通用CPU並沒有太大優勢。因此,第一代智能計算系統逐漸退出了 歷史 舞台。

「智能計算系統」課程重點關注的是第二代智能計算系統,主要是面向深度學習等機器學習任務的計算機。相對於30年前的第一代智能計算系統,當今的第二代深度學習智能計算系統可謂是碰到了天時地利人和。當前圖像識別、語音識別、自然語言理解、 游戲 、廣告推薦等人工智慧應用已開始落地,深度學習演算法發展速度令人應接不暇。尤其重要的是,通用CPU性能發展已經趨停,要支撐不斷發展的深度學習演算法,必須要靠智能計算系統。因此,深度學習智能計算系統會在很長一個階段里都是學術界和產業界關注的焦點。「智能計算系統」課程將能幫助學生深刻理解深度學習智能計算系統。

第二代智能計算系統主要支持深度學習等機器學習任務。未來如果人類真的要在通用人工智慧道路上再往前走一步,那未來的第三代智能計算系統需要支持的演算法將遠遠超出機器學習的范疇,必須包括聯想、推理、涌現等高級認知智能演算法。我個人猜測,第三代智能計算系統可能會是孵化通用人工智慧的虛擬世界環境。「智能計算系統」課程或許能激發學生的好奇心,吸引學生投身於未來的第三代智能計算系統的研究中。

智能計算系統課程概況

「智能計算系統」這門課程主要是面向人工智慧、計算機和軟體工程專業的高年級本科生或研究生。課程目標是培養學生對智能計算完整軟硬體技術棧(包括基礎智能演算法、智能計算編程框架、智能計算編程語言、智能晶元體系結構等)融會貫通的理解,成為智能計算系統(子系統)的設計者和開發者。

課程的前序課程包括C/C++編程語言、計算機組成原理和演算法導論(或機器學習)。課程的課時相對比較靈活,可以是大學期上一個學期(40學時,課程提綱見表1),可以是小學期集中上一周(20學時),也可以嵌入到其他機器學習課程中作為一個補充。對於20學時的短期學習,課程希望學生能對智能計算系統「知其然」,主要是面向實際操作;對於40學時的長期學習,課程希望學生能對智能計算系統「知其所以然」,因此要把機理講透。

表1 智能計算系統課程提綱(40學時)

在課程講授上,應該秉承兩個原則。一是應用驅動。一門好的工程學科的課程應當是學以致用的,尤其是「智能計算系統」這樣的課程,如果上完之後只學會了一些定理和公式,那基本沒效果。另外一個原則是全棧貫通。過去計算機專業課程設計有個問題,就是條塊分割明顯,比如操作系統和計算機體系結構是割裂的,操作系統對計算機體系結構提出了什麼要求,計算機體系結構對操作系統有哪些支持,沒有一門課把這些串起來。「智能計算系統」作為高年級本科生(或研究生)課程,有義務幫助學生把過去所有的人工智慧軟硬體知識都串起來,形成整體理解。

對於「智能計算系統」課程,驅動範例是一個抓手。在國科大上課時,我們選擇了視頻風格遷移作為驅動範例。簡單來說,風格遷移可以保留一個視頻中每幀圖片的基本內容,但是把圖片的繪畫風格改掉(比如從普通照片遷移成畢加索風格或者中國水墨畫風格等,見圖3)。對於學生來說,這是很有意思又在能力范圍之內的一個驅動範例。

圖3 從普通照片到畢加索風格遷移的驅動範例

我們圍繞如何實現視頻實時風格遷移,一步步帶著學生寫出演算法,移植到編程框架上,為編程框架編寫運算元,再為運算元設計晶元,構建多晶元系統,並測評這個系統的速度、能效和精度上的優勢和劣勢,然後進行系統的閉環迭代優化。最後再給大家一個智能計算系統的實驗環境,包括攝像頭和智能晶元開發板,學生就可以實現一個對攝像頭拍攝的視頻進行畫風實時轉換的「半產品」應用了。

結語

我的母親是一位中學教師。我自己成長過程中,對我幫助非常大的幾位前輩恩師陳國良、胡偉武和徐志偉,也都是常年浸淫在教學第一線,有著極大教學熱情的名師。從小到大,這些長輩的言傳身教,讓我深刻地感受到,教育是一項偉大的事業,能深刻地改變學生、改變行業、改變 社會 、改變國家、改變人類。今天我們教給學生的那些人工智慧知識,可能會影響明天我國在智能時代的競爭力。因此,雖然手頭有不少基礎研究任務,但我還是情願把培養人工智慧的系統人才當成自己未來最重要的使命,把自己絕大部分時間精力花在「智能計算系統」這門課程在各個高校的講授和推廣上。

非常欣慰的是,「智能計算系統」這樣新生的一門課程,雖然還有很多缺陷,但還是得到了很多師生的支持和鼓勵。我們已在或將在中國科學院大學、北京大學、北京航空航天大學、天津大學、中國科學技術大學、南開大學、北京理工大學、華中 科技 大學等多個高校聯合開設這門課程。今年我們還會開放這門課程的所有PPT、講義、教材、錄像、代碼、雲平台和開發板,供老師們批評指正。非常歡迎大家給我發郵件,提出寶貴意見。

未來,我們希望和更多培養人工智慧專業學生的高校合作,廣泛參與人工智慧系統課程的交流研討,共同提高人工智慧系統課程的教學水平。相信通過大家的共同努力,一定能解決人工智慧系統課程開設中的實際困難,使得我國未來培養出來的人工智慧人才沒有技術上的短板。

作為一名青年教師,我在教學能力和經驗上與很多教育領域的前輩有著巨大的差距,還需要更多地學習。這門「智能計算系統」課程,對於我國的人工智慧系統能力培養來說,也頂多是起到拋磚引玉的作用。正如魯迅先生在《熱風·隨感錄四十一》中寫給青年的一段話所言:「有一分熱,發一分光,就令螢火一般,也可以在黑暗裡發一點光……倘若有了炬火,出了太陽,我們自然……隨喜贊美這炬火或太陽;因為他照了人類,連我都在內。」

腳註:

1 此文發表在《中國計算機學會通訊》(CCCF) 2014年第5期,https://dl.ccf.org.cn/institude/institudeDetail?id=3738875863074816&_ack=1。

2 CUDA:Compute Unified Device Architecture,計算統一設備架構。

3 參見https://study.163.com/curricula/cs.htm。

作者介紹:

陳雲霽

CCF傑出會員、CCF青年科學家獎獲得者、CCCF編委。中科院計算所研究員。曾獲首屆國家自然科學基金「優秀青年基金」、首屆國家萬人計劃「青年拔尖人才」以及中科院青年人才獎等獎項。主要研究方向為計算機體系結構。[email protected]

點擊 「閱讀原文」 ,加入CCF。

G. 「AI」能自我進化嗎

AI確實進化了,它能做的事情越來越多,成績斐然。它的背後是AI實現路徑的「三級跳」。但是「AI自開發短期內應該無法替代人的工作,還有很長的路要走。」徐文娟說。趙志剛從學術角度分析道:「只有當人類把不同應用領域的AI模型設計出來,並進一步分解出一系列通用模塊,如同化學中的元素周期表、生物中的DNA、RNA,這種自開發才能有更多的應用。」

「僅需幾行代碼就能構建一個回歸模型。」程序員認可谷歌AutoML的工作表現,認為AutoML設計的模型和機器學習專家設計的不相上下。日前,谷歌工程師分別在中國和矽谷重點推介谷歌AutoML項目。不明就裡的疑惑緊跟著紛至沓來——AI又進化了?!已經會自開發了?能操控自己的進化了?是要擺脫人類嗎?

國家超級計算濟南中心大數據研發部研究員趙志剛說:「起初我們用數學公式和『if……then』等語句告訴計算機第一步做什麼、第二步做什麼,手把手地教,後來給機器n組輸入和輸出,中間的規則或規律由它自己學會。」

「之前,很多聰明的頭腦花一輩子時間研究:如何抽取有效的特徵。」專注於智能導購對話機器人的智能一點公司CTO莫瑜解釋道,「神經網路演算法的發明、深度學習技術的出現,使得AI進化到2.0,抽取特徵的工作由AI自己進行,我們的工作也隨之發生了變化。」

用數學函數的模式很容易解釋「1.0」到「2.0」的轉變:如果把識別圖像、語義理解、下棋等任務的達成都看成是不同的Y=f(X),即輸入的「貓」的圖片、聲音或棋招是「X」,輸出的「貓」、回答、棋高一招是「Y」。深度學習之前,人通過自己的分析尋找函數f對應的公式,告訴給AI。而深度學習之後,人輸入大量的X與Y的對應,AI自己發現函數f對應的公式。

「AI找到的函數f的具體內容,可能比人找到的更好,但是人類並不知道,就像一個黑匣子。」莫瑜說,「但是f的形式是AI研究員通過研究設計出來的,如果使用深度神經網路,網路中的模塊以及模塊之間的組織方式也是提前設計的。」

隨著深度學習技術的成熟和普遍化,模型構建出現了特定可追尋的經驗。「各種共性神經網路的發布,使得從業門檻越來越低。一些普通的模型構建與優化,剛畢業的學生在網上學學教程就能上手。」趙志剛說。

當構建模型成為可習得的技能,AutoML就出現了。它能做的正是AI研究員的模型設計工作。「將幫助不同公司建立人工智慧系統,即使他們沒有廣泛的專業知識。」谷歌工程師這樣推介。AI成功進化到3.0。

事實上,AutoML替代的仍舊是人類能夠提煉出經驗的工作。「如果說之前人描繪一套尋找函數f的『路網』,在深度學習的技術輔助下,機器能最快找到優化路徑;那麼AI現在可以自己設計路網了。」趙志剛言簡意賅。

可以看出,不論是深度學習、還是AutoML,都只替代人類的一部分群體已經鑽研透了的工作。「機器能做的事情,盡量不要手工勞動」,這是很多程序員的人生信條,這個信條催生了AutoML。本著同樣的信條,微軟開發了DeepCoder。「它可以用來生成滿足給定輸入輸出的程序。」莫瑜說,但它的表現目前還不盡如人意,只能編寫一些簡單的程序。

誰是「上帝」答案毫無疑問,人類。

既然AI在進化中走向了更高一階的模型設計,那麼「上帝之手」又發生了哪些變化呢?

「煉丹」,莫瑜用兩個字形象地說起自己的工作,「智能一點是專業做智能客服的,研發人員的工作主要集中於問題建模(如何將實際問題轉化為人工智慧技術解決的問題)和演算法優化(如何提升人工智慧演算法的效果)。」

「煉」意味著不斷地調試和完善。「針對特定的人,越投脾氣越好,回答越精準越好。」莫瑜說,「我們的X是客戶的問話,Y是機器人客服的回復,中間的函數f需要訓練。」

這是個不容易的任務。如果把人類社會的經驗分為3類:有公式的確定規則、可言傳的知識、只可意會不可言傳的感覺。最後一類最難琢磨。

「因此,我們想辦法構建完善的閉環反饋,了解特定用戶的喜好,通過情感、趣味的表達,最終做到投其所好。」莫瑜說,「目前處於人機協同的工作階段,但是越來越多樣本的獲取,將幫助我們的智能客服給出精準的、討喜的回答。」

可見,並不是所有領域都適合交給AI自開發去做,比如問題建模方面,如何將實際問題抽象轉換為機器學習問題, AI還無法自主完成。在AI2.0階段,研發人員還需要人工設計函數f的形式。

H. 各類場景應用中涉及的AI演算法匯總

整理了各類場景應用中AI演算法

一、圖像CV

內容安全,目標檢測,圖像識別,智能視覺生產,圖像搜索,圖像分割,物體檢測,圖像分類,圖像標簽,名人識別,概念識別,場景識別,物體識別,場景分析,智能相冊,內容推薦,圖庫管理,網紅人物識別,明星人物識別,圖像搜索,商品圖片搜索,版權圖片搜索,通用圖片搜索,車牌識別,垃圾分類,車輛檢測,菜品識別,車型識別,犬類識別,實例分割,風格遷移,智能填充,智能識圖,拍照搜商品,精準廣告投放,電商導購,圖像分析,圖像理解,圖像處理,圖像質量評估,場景識別,物體識別,場所識別,圖像自訓練平台,圖像分類,目標檢測,圖像分割,關鍵點檢測,圖像生成,場景文字識別,度量學習,圖像識別,圖像比對,圖像分類使用手冊,圖像分類API文檔目標檢測使用手冊,目標檢測API文檔Logo檢測使用手冊,Logo檢測API文檔,通用圖片搜索,車牌識別,垃圾分類,車輛檢測,車型識別,犬類識別,實例分割,風格遷移,智能填充,車牌識別,相冊聚類,場景與物體識別,無限天空,圖像識別引擎,黃色圖片識別,暴力圖像識別,工業輪胎智能檢測,肋骨骨折識別,顯微識別,圖像處理,廣告識別,人臉演算法,人體演算法,圖像識別,圖像增強,OCR,圖像處理,ZoomAI,智能貼圖,智能製作,質量評價,圖像識別,智能鑒黃,圖像識別,實時手寫識別,唇語識別,通用文字識別,手寫文字識別,圖像技術,圖像識別,圖像審核,圖像搜索,圖像增強,圖像特效,車輛分析,圖像生成,繪畫機器人獨家,動漫化身獨家,像素風獨家,超清人像獨家,圖像融合,換臉技術,神奇變臉,圖像風格化,證件照生成,線稿圖像識別,寶寶檢測,圖像分類,圉像深度估計,天空分割,食物分割,貓狗臉技術,食物識別獨家,圖像美學評分,車輛分析,車型識別,車型識別(含指導價),車型識別(含配置參數),車標識別,人臉識別(活體),車牌識別,表情識別,安全帽識別,計算機影像,計算機視覺,聚焦光學字元識別、人臉識別、質檢、感知、理解、交互,圖像視頻分析,Logo檢測,內容審核,智能批改,筆記評估,思維導圖評估,物體檢測,物體識別。

二、人臉、體態、眼瞳、聲音、指紋

人臉分割人臉識別,無,人體分析HAS,識別人的年齡,性別,穿著信息,客流統計分析,智能客服,熱點區域分析,人體檢測,人臉口罩識別,人臉對比,人臉搜索,人臉檢測與屬性分析,人臉活體檢測,人體關鍵點檢測,行人重識別,細粒度人像分割,人像分割,人臉解析,3D人體姿態估計,人臉融合,人臉識別,換臉甄別,人臉支付,人臉核身,人像變換,人臉試妝,人臉融合,人體分析,手勢識別,人臉驗證與檢索,人臉比對,人臉比對sensetime,人臉水印照比對,靜默活體檢測,靜默活體檢測sensetime,人臉檢測和屬性分析,人臉特徵分析tuputech,配合式活體檢測,人臉安防,計算機視覺,智能應用服務,人臉查詢人臉分析人臉統計名單庫管理人臉布控,人臉應用,人體應用,人體查詢,車輛查詢車輛分析車輛統計車輛布控車輛名單庫管理,車輛應用,人臉圖像識別人體圖像識別車輛圖像識別,圖像識別,圖像比對,人臉比對,人體檢測,人臉口罩識別,人臉對比,人臉搜索,人臉檢測與屬性分析,人臉活體檢測,人體關鍵點檢測,行人重識別,細粒度人像分割,人像分割,人臉解析,3D人體姿態估計,人臉融合,人臉識別,人臉檢測,人臉比對,人臉搜索,人臉關鍵點,稠密關鍵點,人臉屬性,情緒識別,顏值評分,視線估計,皮膚分析,3D人臉重建,面部特徵分析人體識別,人體檢測,人體關鍵點,人體摳像,人體屬性,手勢識別人像處理,美顏美型,人臉融合,濾鏡,聲紋識別支付,語音合成,語音合成,聲紋識別,語音喚醒,人臉識別引擎,攝像頭人臉識別,圖片人臉檢測,身份識別,人臉識別,人臉屬性,人體識別,聲紋識別,衣服檢索及聚類,語音分析,聲紋識別,說話人歸檔,人臉和人體識別,人臉檢測,手勢識別,人臉與人體識別,人臉識別雲服務,人臉識別私有化,人臉離線識別SDK,人臉實名認證,人像特效,人體分析,人臉技不,皮膚分析獨家,頭部分割,宏觀人臉分析,人臉關鍵點檢測,微觀人臉分析獨家,頭發分析獨家,五官分割,頭發分割人體技術,人體外輪廓點檢測獨家,精細化人像摳圖,人體框檢測,肢體關鍵點檢測,人像分割,服飾識別,手勢識別,皮膚分割,人臉,說話人識別,人臉檢測識別,人臉1:1比對,人臉檢測,AI人臉/人形車輛,大數據人像圖片防偽,QoS保障,CDN,表情識別,舉手動作識別,人臉檢測,網路切片,邊緣計算,人臉分析,人臉檢測,人臉搜索,人體分析,手勢識別,著裝檢測,人臉識別,行為檢測,人臉識別,人形檢測,行為分析,人臉檢測,人臉跟蹤,人臉比對,人臉查找,人臉屬性分析,活體檢測,聲音指紋,聲紋識別。

三、視頻

視頻分割、視頻處理、視頻理解、智能視覺、多媒體,視頻內容分析,人體動作監控,視頻分類,智能交通,人/動物軌跡分析,目標計數,目標跟蹤,視頻編輯-,精彩片段提取,新聞視頻拆分,視頻摘要,視頻封面,視頻拆條,視頻標簽-,視頻推薦,視頻搜索,視頻指紋-,數字版權管理,廣告識別,視頻快速審核,視頻版權,視頻查重,視頻換臉,車輛解析, 體育 視頻摘要,視頻內容分析,顏色識別,貨架商品檢測, 時尚 搭配,危險動作識別,無,無,視頻,視頻換臉,車輛解析, 體育 視頻摘要,視頻內容分析,顏色識別,貨架商品檢測, 時尚 搭配,危險動作識別,菜品識別,視頻識別引擎,結腸息肉檢測,胃鏡評估系統,視頻標簽,場景識別,客流分析,手勢識別,視頻技術,短視頻標簽,視覺看點識別,動態封面圖自動生成,智能剪輯,新聞拆條,智能插幀,視頻技術,多模態媒資檢索公測中,媒體內容分析,媒體內容審核,視頻生成,視頻動作識別,

四、ocr文字識別

手寫識別,票據識別,通用文檔,通用卡證,保險智能理賠,財稅報銷電子化,證照電子化審批,票據類文字識別,行業類文字識別,證件類文字識別,通用類文字識別,通用文字識別,駕駛證識別,身份證識別,增值稅發票識別,行駛證識別,營業執照識別,銀行卡識別,增值稅發票核驗,營業執照核驗,智能掃碼,行業文檔識別, 汽車 相關識別,票據單據識別,卡證文字識別,通用文字識別,手寫文字識別,印刷文字識別,銀行卡識別,名片識別,身份證識別intsig,營業執照識別intsig,增值稅發票識別intsig,拍照速算識別,公式識別,指尖文字識別,駕駛證識別JD,行駛證識別JD,車牌識別JD,身份證識別,增值稅發票識別,營業執照識別,火車票識別,計程車發票識別,印刷文字識別(多語種),印刷文字識別(多語種)intsig內容審核,色情內容過濾,政治人物檢查,暴恐敏感信息過濾,廣告過濾,OCR自定義模板使用手冊,OCR自定義模板API文檔,通用文字識別,駕駛證識別,身份證識別,增值稅發票識別,行駛證識別,營業執照識別,銀行卡識別,身份證識別,駕駛證識別,行駛證識別,銀行卡識別,通用文字識別,自定義模板文字識別,文字識別引擎,身份證識別,圖片文字識別,通用文字識別,身份證識別,名片識別,光學字元識別服務,通用文字識別,手寫體文字識別,表格識別,整題識別(含公式),購物小票識別,身份證識別,名片識別,自定義模板文字識別,文字識別,通用文字識別,銀行卡識別,身份證識別,字幕識別,網路圖片識別, 游戲 直播關鍵字識別,新聞標題識別,OCR文字識別,通用場景文字識別,卡證文字識別,財務票據文字識別,醫療票據文字識別, 汽車 場景文字識別,教育場景文字識別,其他場景文字識別,iOCR自定義模板文字識別,通用類OCR,通用文本識別(中英)通用文本識別(多語言)通用表格識別,證照類OCR,身份證社保卡戶口本護照名片銀行卡結婚證離婚證房產證不動產證,車輛相關OCR,行駛證駕駛證車輛合格證車輛登記證,公司商鋪類OCR,商戶小票稅務登記證開戶許可證營業執照組織機構代碼證,票據類OCR,增值稅發票增值稅卷票火車票飛機行程單計程車發票購車發票智能技術,票據機器人證照機器人文本配置機器人表格配置機器人框選配置機器人,文字識別,行駛證識別,駕駛證識別,表單識別器,通用文本,財務票據識別,機構文檔識別,個人證件識別,車輛相關識別,通用表格,印章識別,財報識別,合同比對,識別文字識別,簽名比對,OCR識別,教育OCR,印刷識別,手寫識別,表格識別,公式識別,試卷拆錄

五、自然語言NPL

文本相似度,文本摘要,文本糾錯,中心詞提取,文本信息抽取,智能文本分類,命名實體,詞性標注,多語言分詞,NLP基礎服務,地址標准化,商品評價解析智能簡訊解析,機器閱讀理解,金融研報信息識別,法律案件抽取,行業問答推理,行業知識圖譜構建,文本實體關系抽取,搜索推薦,知識問答,短文本相似度,文本實體抽取, 情感 傾向分析,興趣畫像匹配,文本分類-多標簽,文本分類-單標簽,定製自然語言處理,語言生成,語言理解,自然語言處理基礎,文本摘要,數據轉文字,文本生成,智能問答系統,內容推薦,評價分析,文本分類,對話理解,意圖理解, 情感 分析,觀點抽取,中文分詞,短文本相似度,關鍵詞提取,詞向量,命名實體,識別依存,句法分析, 情感 分析,評論觀點抽取,短文本相似度,機器翻譯,詞法分析,詞義相似度,詞向量,句法分析,文本分類,短語挖掘,閑聊,文本流暢度,同義詞,聚類,語言模型填空,新聞熱詞生成,機器閱讀理解,商品信息抽取,詞法分析, 情感 分析,關鍵詞提取,用戶評論分析,資訊熱點挖掘,AIUI人機交互,文本糾錯,詞法分析,依存句法分析,語義角色標注,語義依存分析(依存樹),語義依存分析(依存圖), 情感 分析,關鍵詞提取,NLP能力生產平台,NLP基礎技術,中文詞法分析-LAC,詞向量—Word2vec,語言模型—Language_model,NLP核心技術, 情感 分析、文本匹配、自然語言推理、詞法分析、閱讀理解、智能問答,信息檢索、新聞推薦、智能客服, 情感 分析、文本匹配、自然語言推理、詞法分析、閱讀理解、智能問答,機器問答、自然語言推斷、 情感 分析和文檔排序,NLP系統應用,問答系統對話系統智能客服,用戶消費習慣理解熱點話題分析輿情監控,自然語言處理,文本分類使用手冊,文本分類API文檔, 情感 分析,評論觀點抽取,短文本相似度,機器翻譯,詞法分析,詞義相似度,詞向量,句法分析,文本分類,短語挖掘,閑聊,文本流暢度,同義詞,聚類,語言模型填空,新聞熱詞生成,機器閱讀理解,商品信息抽取智能創作,智能寫作,搭配短文,種草標題,賣點標題,社交電商營銷文案,自然語言處理能力,基礎文本分析,分詞、詞性分析技術,詞向量表示,依存句法分析,DNN語言模型,語義解析技術,意圖成分識別, 情感 分析,對話情緒識別,文本相似度檢測,文本解析和抽取技術,智能信息抽取,閱讀理解,智能標簽,NLG,自動摘要,自動寫文章,語言處理基礎技術,文本審核, 情感 分析,機器翻譯,智能聊天,自然語言,基於標題的視頻標簽,台詞看點識別,意圖識別,詞法分析,相關詞,輿情分析,流量預測,標簽技術,自然語言處理,語義對話,自然語言處理,車型信息提取,關鍵詞提取,語義理解,語義相似度,意圖解析,中文詞向量,表示依存,句法分析,上下文理解,詞法分析,意圖分析,情緒計算,視覺 情感 ,語音 情感 , 情感 分析,沉浸式閱讀器,語言理解,文本分析,自然語言處理,在線語音識別,自然語言理解火速上線中, 情感 判別,語義角色標注,依存句法分析,詞性標注,實體識別,中文分詞,分詞,

6、知識圖譜

知識圖譜,葯學知識圖譜,智能分診,騰訊知識圖譜,無,葯學知識圖譜,智能分診,知識理解,知識圖譜Schema,圖資料庫BGraph,知識圖譜,語言與知識,語言處理基礎技術,語言處理應用技術,知識理解,文本審核,智能對話定製平台,智能文檔分析平台,智能創作平台,知識圖譜,實體鏈接,意圖圖譜,識別實體,邏輯推理,知識挖掘,知識卡片

7、對話問答機器人

智能問答機器人,智能語音助手,智能對話質檢,智能話務機器人,無,電話機器人,NeuHub助力京東智能客服升級,騰訊雲小微,智能硬體AI語音助手,對話機器人,無,問答系統對話系統智能客服,Replika對話技術,客服機器人,智能問答,智能場景,個性化回復,多輪交互,情緒識別,智能客服,金融虛擬客服,電話質檢,AI語音交互機器人,中移雲客服·智能AI外呼,人機對話精準語義分析

8、翻譯

協同翻譯工具平台,電商內容多語言工具,文檔翻譯,專業版翻譯引擎,通用版翻譯引擎,無,機器翻譯,無,機器翻譯,音視頻字幕平台,機器翻譯,機器翻譯niutrans,文本翻譯,語音翻譯,拍照翻譯,機器翻譯,機器翻譯,文本翻譯,語音翻譯,通用翻譯,自然語言翻譯服務,文本翻譯,圖片翻譯,語音翻譯,實時語音翻譯,文檔翻譯(開發版,機器翻譯,文本翻譯,語音翻譯,拍照翻譯,機器翻譯實時長語音轉寫,錄音文件長語音轉寫,翻譯工具,機器翻譯火速上線中

9、聲音

便攜智能語音一體機,語音合成聲音定製,語音合成,一句話識別,實時語音識別錄音文件識別,客服電話,語音錄入,語音指令,語音對話,語音識別,科學研究,安防監控,聲音分類,語音合成,語音識別,實時語音轉寫,定製語音合成,定製語音識別,語音合成,語音合成聲音定製,離線語音合成,短語音識別,錄音文件識別,聲紋識別,離線語音識別,實時語音識別,呼叫中心短語音識別,呼叫中心錄音文件識別,呼叫中心實時語音識別,語音識別,語音合成,聲紋識別,語音識別,語音聽寫,語音轉寫,實時語音轉寫,語音喚醒,離線命令詞識別,離線語音聽寫,語音合成,在線語音合成,離線語音合成,語音分析,語音評測,性別年齡識別,聲紋識別,歌曲識別,A.I.客服平台能力中間件,語音識別,語音交互技術,語音合成,語音合成聲音定製,離線語音合成,短語音識別,錄音文件識別,聲紋識別,離線語音識別,實時語音識別,呼叫中心短語音識別,呼叫中心錄音文件識別,呼叫中心實時語音識別,遠場語音識別,語音識別,一句話識別,實時語音識別,錄音文件識別,語音合成,實時語音識別,長語音識別,語音識別,語音合成,波束形成,聲源定位,去混響,降噪,回聲消除,分布式拾音,語音識別,語音喚醒,語音合成,聲紋識別,智能語音服務,語音合成,短語音識別,實時語音識別,語音理解與交互,離線喚醒詞識別,語音識別,一句話識別,實時語音識別,錄音文件識別,電話語音識別,語音喚醒,離線語音識別,離線命令詞識別,遠場語音識別,語音合成,通用語音合成,個性化語音合成,語音技術,短語音識別,實時語音識別,音頻文件轉寫,在線語音合成,離線語音合成,語音自訓練平台,語音交互,語音合成,語音識別,一句話識別,實時短語音識別,語音合成,語音喚醒,本地語音合成,語音翻譯,語音轉文本,短語音聽寫,長語音轉寫,實時語音轉寫,語音內容審核,會議超極本,語音交互技術,語音識別,語義理解,語音合成,音頻轉寫,音視頻類產品,語音通知/驗證碼,訂單小號,撥打驗證,點擊撥號,數據語音,統一認證,語音會議,企業視頻彩鈴,語音識別,語音文件轉錄,實時語音識別,一句話語音識別,語音合成,通用語音合成,個性化語音合成,語音評測,通用語音評測,中英文造句評測,在線語音識別,語音識別,語音喚醒,語音合成,語音合成,語音識別,語音聽寫,語音轉寫,短語音轉寫(同步),語音識別,語音 情感 識別

十、數據挖掘AI硬體

演算法類型:包括二分類、多分類和回歸,精準營銷,表格數據預測,銷量預測,交通流量預測,時序預測,大數據,無,機器學習使用手冊,機器學習API文檔,大數據處理,大數據傳輸,數據工廠,大數據分析,數據倉庫,數據採集與標注,數據採集服務,數據標注服務,AI開發平台,全功能AI開發平台BML,零門檻AI開發平台EasyDL,AI硬體與平台,GPU雲伺服器,機器人平台,度目視頻分析盒子,度目AI鏡頭模組,度目人臉應用套件,度目人臉抓拍機,人臉識別攝像機,昆侖AI加速卡,智能預測,購車指數,數據科學虛擬機,平台效率,雲與AI,抗DDoS,天盾,網站漏洞掃描,網頁防篡改,入侵檢測防護,彈性雲伺服器,對象存儲服務,雲專線(CDA,AI計算機平台—360net深度學習基礎模型,AI演算法訓練適配主流AI框架

十一、其他

內容審核,智能鑒黃,特定人物識別,通用圖片審核,文本智能審核,廣告檢測,Logo檢測,商品理解,拍照購,商品圖片搜索,通用商品識別,疫情物資識別,酒標識別,細分市場劃分,品牌競爭力分析,老品升級,新品定製,商品競爭力分析,商品銷量預測,商品營銷,用戶評論佔比預測,商品命名實體識別,商品顏色識別,強化學習,智能地圖引擎,內容審核,智能鑒黃,特定人物識別,通用圖片審核,文本智能審核,廣告檢測,Logo檢測商品理解,拍照購,商品圖片搜索,通用商品識別,疫情物資識別,酒標識別,細分市場劃分,品牌競爭力分析,老品升級,新品定製,商品競爭力分析,商品銷量預測,商品營銷,用戶評論佔比預測,商品命名實體識別,商品顏色識別,個性化與推薦系統,推薦系統,輿情分析,輿情標簽,智慧教育,智能語音評測,拍照搜題,題目識別切分,整頁拍搜批改,作文批改,學業大數據平台,文檔校審系統,會議同傳系統,文檔翻譯系統,視頻翻譯系統,教育學習,口語評測,朗讀聽書,增強現實,3D肢體關鍵點SDK,美顏濾鏡SDK,短視頻SDK,基礎服務,私有雲部署,多模態交互,多模態 情感 分析,多模態意圖解析,多模態融合,多模態語義,內容審查器,Microsoft基因組學,醫學人工智慧開放平台,數據查驗介面,身份驗證(公安簡項),銀行卡驗證,發票查驗,設備接入服務Web/H5直播消息設備託管異常巡檢電話提醒,音視頻,視頻監控服務雲廣播服務雲存儲雲錄制,司乘體驗,智能地圖引擎,消息類產品,視頻簡訊,簡訊通知/驗證碼,企業掛機彩信,來去電身份提示,企業固話彩印,模板閃信,異網簡訊,內容生產,試卷拆錄解決方案,教學管理,教學質量評估解決方案,教學異常行為監測,授課質量分析解決方案,路況識別,人車檢測,視覺SLAM,高精地圖,免費SDK,智能診後隨訪管理,用葯管家,智能預問診,智能導診,智能自診,智能問葯,智能問答,裁判文書近義詞計算,法條推薦,案由預測,

I. 展現完美的自己 英偉達AI演算法提升視頻會議體驗

受新冠疫情的影響,加速了各行業企業移動化辦公的需求,這期間,有大量的用戶和企業選擇了線上視頻會議。那麼,我們如何在視頻會議中展現更完美的自己呢?

近日,2021年國際計算機視覺與模式識別會議(CVPR 2021)正式召開。基於GAN研究的NVIDIA Maxine雲AI視頻流SDK現已在CVPR 2021上展出。讓我們看一看GAN研究是如何重塑視頻會議的呢?

起床、啟動筆記本電腦、打開網路攝像頭——得益於NVIDIA研究人員開發的AI技術,每次都能在視頻通話中展現完美的自己。

Vid2Vid Cameo是用於視頻會議的NVIDIA Maxine SDK背後的深度學習模型之一,它藉助生成式對抗網路(GAN),僅用一張人物2D圖像即可合成逼真的人臉說話視頻。

要使用該模型,參與者需要在加入視頻通話之前提交一張參照圖像(真實照片或卡通頭像)。在會議期間,AI模型將捕捉每個人的實時動作,並將其應用於之前上傳的靜態圖像。

也就是說,上傳一張穿著正裝的照片之後,與會人員即使頭發凌亂、穿著睡衣,也能在通話中以穿著得體工作服裝的形象出現,因為AI可以將用戶的面部動作映射到參照照片上。如果主體向左轉,則技術可以調整視角,以便參與者看上去是直接面對攝像頭的。

除了可以幫助與會者展現出色狀態外,這項AI技術還可將視頻會議所需的帶寬降低10倍,從而避免抖動和延遲。它很快將在NVIDIA Video Codec SDK中作為AI Face Codec推出。

NVIDIA研究人員兼項目的聯合創作者Ming-Yu Liu表示:「許多人的互聯網帶寬有限,但仍然希望與朋友和家人進行流暢的視頻通話。這項基礎技術除了可以為他們提供幫助外,還可用於協助動畫師、照片編輯師和 游戲 開發者的工作。」

Vid2Vid Cameo本周發表於著名的國際計算機視覺與模式識別會議,這是NVIDIA在本次虛擬會議上發表的28篇論文之一。此外,它還在AI Playground上推出,在此所有人均可親身體驗我們的研究演示。

AI大出風頭

在一部經典盜賊電影(同時也是Netflix的熱門節目)的致謝中,NVIDIA研究人員將他們的人臉說話GAN模型迅速用於虛擬會議。演示重點介紹Vid2Vid Cameo的主要功能,包括面部重定向、動畫頭像和數據壓縮

這些功能即將登陸NVIDIA Maxine SDK,為開發者提供經過優化的預訓練模型,以便在視頻會議和直播中實現視頻、音頻和增強現實效果。

開發者已經能採用Maxine AI效果,包括智能除噪、視頻升采樣和人體姿態估計。SDK支持免費下載,還可與NVIDIA Jarvis平台搭配用於對話式AI應用,包括轉錄和翻譯。

來自AI的問候

Vid2Vid Cameo只需兩個元素,即可為視頻會議打造逼真的AI人臉說話動態,這兩個元素分別是一張人物外貌照片和一段視頻流,它們決定了如何對圖像進行動畫處理。

模型基於NVIDIA DGX系統開發,使用包含18萬個高質量人臉說話視頻的數據集進行訓練。網路已掌握識別20個關鍵點,這些關鍵點可用於在沒有人工標注的情況下對面部動作進行建模。這些點對特徵(包括眼睛、嘴和鼻子)的位置進行編碼。

然後,它會從通話主導者的參照圖像中提取這些關鍵點,這些關鍵點可以提前發送給其他的視頻會議參與者,也可以重新用於之前的會議。這樣一來,視頻會議平台只需發送演講者面部關鍵點的移動情況數據,無需將某參與者的大量直播視頻流推送給其他人。

對於接收者一端,GAN模型會使用此信息,模擬參照圖像的外觀以合成一個視頻。

通過僅來回壓縮及發送頭部位置和關鍵點,而不是完整的視頻流,此技術將視頻會議所需的帶寬降低10倍,從而提供更流暢的用戶體驗。該模型可以進行調整,傳輸不同數量的關鍵點,以實現在不影響視覺質量的條件下,適應不同的帶寬環境。

此外,還可以自由調整所生成的人臉說話視頻的視角,可以從側邊輪廓或筆直角度,也可以從較低或較高的攝像頭角度來顯示用戶。處理靜態圖像的照片編輯者也可以使用此功能。

NVIDIA研究人員發現,無論是參照圖像和視頻來自同一個人,還是AI負責將某個人的動作轉移到另一個人的參照圖像,Vid2Vid Cameo均能生成更逼真、更清晰的結果,優於先進的模型。

後一項功能可將演講者的面部動作,應用於視頻會議中的數字頭像動畫,甚至可以應用於製作視頻 游戲 或卡通角色的逼真形象和動作。

Vid2Vid Cameo論文由NVIDIA研究人員Ting-Chun Wang、Arun Mallya和Ming-Yu Liu共同撰寫。NVIDIA研究團隊在全球擁有超過200名科學家,專注於AI、計算機視覺、自動駕駛 汽車 、機器人和圖形等領域。

我們要感謝演員Edan Moses ,他在Netflix上的《紙鈔屋》中擔任教授的英語配音,感謝他在以上我們最新AI研究的介紹視頻中做出的貢獻。

寫在最後,視頻會議現已經成為人們日常生活的一部分,能夠幫助數百萬人工作、學習、 娛樂 ,甚至就醫。NVIDIA Maxine集成了先進的視頻、音頻和對話式AI功能,給那些幫助我們保持聯絡的視頻會議平台帶來效率突破。(陶然)

閱讀全文

與ai演算法優化教學視頻相關的資料

熱點內容
客戶端框架源碼 瀏覽:206
python自動辦公能幹嘛 瀏覽:873
程序員追愛 瀏覽:252
程序員邏輯故事 瀏覽:768
加密icsot23i2c 瀏覽:713
你們有什麼好的解壓軟體 瀏覽:607
常州空氣壓縮機廠家 瀏覽:241
安卓如何關閉app內彈出的更新提示 瀏覽:409
e4a寫的app怎麼裝蘋果手機 瀏覽:201
海立壓縮機海信系 瀏覽:210
社保如何在app上合並 瀏覽:220
小米加密照片後綴 瀏覽:236
我的世界網易手機怎麼創伺服器 瀏覽:978
載入單頁源碼 瀏覽:930
阿里雲伺服器seo 瀏覽:777
海洋斗什麼時候上線安卓 瀏覽:86
中行app如何查每日匯款限額 瀏覽:840
輸入伺服器sn是什麼意思 瀏覽:725
sha1演算法java 瀏覽:90
asp代碼壓縮 瀏覽:851