❶ 震驚世界的Magic Leap與微軟的Hololens有哪些異同
先說一下我關於Magic Leap的信息來源:
1、2014年11月10日,Magic Leap在2014年9月融了5個億以後,來Stanford招人,開了一個Info Session,標題是「The World is Your New Desktop」(世界就是你的新桌面)多麼霸氣!當時是Magic Leap感知研究的高級副總裁(VP of Perception)Gary Bradski和計算視覺的技術負責人(Lead of Computer Vision)Jean-Yves Bouguet來作演講。Gary是計算機視覺領域的領軍人物,在柳樹車庫(Willow Garage)創造了OpenCV(計算視覺工具庫),同時也是Stanford顧問教授。Jean-Yves原來在Google負責谷歌街景車(Street View Car)的製造,是計算視覺技術的大牛。他們加入Magic Leap是非常令人震驚的。我參加了這次Info Session,當時Gary來介紹Magic Leap在感知部分的技術和簡單介紹傳說中的數字光場Cinematic Reality的原理,並且在允許錄影的部分都有拍照記錄。本文大部分的干貨來自這次演講。
2、我今年年初上了Stanford計算攝影和數字光場顯示的大牛教授Gordon Wetzstein的一門課:EE367 Computational Imaging and Display(計算影像和顯示器):其中第四周的Computational illumination,Wearable displays和Displays Blocks(light field displays)這三節都講到Magic Leap的原理。現在大家也可以去這個課程網站上看到這些資料,EE367 / CS448I: Computational Imaging and Display
順便介紹一下Gordon所在的Stanford計算圖形組,Marc Levoy(後來跑去造Google Glass的大牛教授)一直致力於光場的研究,從Marc Levoy提出光場相機,到他的學生Ren Ng開創Lytro公司製造光場相機,到現在Gordon教授製造光場顯示器(裸眼光場3D顯示器),這個組在光場方面的研究一直是世界的領頭羊。而Magic Leap可能正在成為光場顯示器的最大應用。(相關內容可參考:Computational Imaging Research Overview)
3、今年參加了光場影像技術的研討會Workshop on Light Field Imaging ,現場有很多光場技術方面的展示,我和很多光場顯示技術的大牛交流了對Magic Leap的看法。特別的是,現場體驗了接近Magic Leap的光場技術Demo,來自Nvidia的Douglas Lanman的Near-Eye Light Field Displays 。(相關內容可參考:Near-Eye Light Field Displays)
4、今年年中去了微軟研究院Redmond訪問,研究院的首席研究員Richard Szeliski(計算機視覺大神,計算機視覺課本的作者,Computer Vision: Algorithms and Applications)讓我們試用了Hololens。感受了Hololens牛逼無比的定位感知技術。有保密協議,本文不提供細節,但提供與Magic Leap原理性的比較。
下面是干貨:
首先呢,科普一下Magic Leap和Hololens這類AR眼鏡設備,都是為了讓你看到現實中不存在的物體和現實世界融合在一起的圖像並與其交互。從技術上講,可以簡單的看成兩個部分:
對現實世界的感知(Perception);
一個頭戴式顯示器以呈現虛擬的影像 (Display) 。
我會分感知部分和顯示部分來分別闡釋Magic Leap的相關技術。
一、顯示部分
先簡單回答這個問題:
Q1. Hololens和Magic Leap有什麼區別?Magic Leap的本質原理是什麼?
在感知部分,其實Hololens和Magic Leap從技術方向上沒有太大的差異,都是空間感知定位技術。本文之後會著重介紹。Magic Leap與Hololens最大的不同應該來自顯示部分,Magic Leap是用光纖向視網膜直接投射整個數字光場(Digital Lightfield)產生所謂的Cinematic Reality(電影級的現實)。Hololens採用一個半透玻璃,從側面DLP投影顯示,虛擬物體是總是實的,與市場上Espon的眼鏡顯示器或Google Glass方案類似,是個2維顯示器,視角還不大,40度左右,沉浸感會打折扣。
本質的物理原理是:光線在自由空間中的傳播,是可以由4維光場唯一表示的。成像平面的每個像素中包含到這個像素所有方向的光的信息,對於成像平面來講,方向是二維的,所以光場是4維的。平時成像過程只是對四維光場進行了一個二維積分(每個像素上所有方向的光的信息都疊加到一個像素點上),傳統顯示器顯示這個2維的圖像,是有另2維方向信息損失的。而Magic Leap是向你的視網膜直接投射整個4維光場, 所以人們通過Magic Leap看到的物體和看真實的物體從數學上是沒有什麼區別的,是沒有信息損失的。理論上,使用Magic Leap的設備,你是無法區分虛擬物體和現實的物體的。
使用Magic Leap的設備,最明顯的區別於其他技術的效果是人眼可以直接選擇聚焦(主動選擇性聚焦)。比如我要看近的物體,近的物體就實,遠的就虛。注意:這不需要任何的人眼跟蹤技術,因為投射的光場還原了所有信息,所以使用者直接可以做到人眼看哪實哪,和真實物體一樣。舉個例子:在虛擬太陽系視頻的27秒左右(如下面這個gif圖),攝影機失焦了,然後又對上了,這個過程只發生在攝影機里,和Magic Leap的設備無關。換句話說,虛擬物體就在那,怎麼看是觀察者自己的事。這就是Magic Leap牛逼的地方,所以Magic Leap管自己的效果叫Cinematic Reality。
Q2. 主動選擇性聚焦有什麼好處?傳統的虛擬顯示技術中,為什麼你會頭暈?Magic Leap是怎麼解決這個問題的?
眾所周知,人類的眼睛感知深度主要是靠兩隻眼睛和被觀察物體做三角定位(雙目定位,triangulation cue)來感知被觀察物體的與觀察者的距離的。但三角定位並不是唯一的人類感知深度的線索,人腦還集成了另一個重要的深度感知線索:人眼對焦引起的物體銳度(虛實)變化(sharpness or focus cue) 。但傳統的雙目虛擬顯示技術(如Oculus Rift或Hololens)中的物體是沒有虛實的。舉個例子,如下圖,當你看到遠處的城堡的時候,近處的虛擬的貓就應該虛了,但傳統顯示技術中,貓還是實的,所以你的大腦就會引起錯亂,以為貓是很遠的很大的一個物體。但是這和你的雙目定位的結果又不一致,經過幾百萬年進化的大腦程序一會兒以為貓在近處,一會兒以為貓在遠處,來來回回你大腦就要燒了,於是你要吐了。而Magic Leap投影了整個光場,所以你可以主動選擇性聚焦,這個虛擬的貓就放在了近處,你看它的時候就是實的,你看城堡的時候,它就是虛的,和真實情況一樣,所以你不會暈。演講中Gary調侃對於Jean-Yves這種帶10分鍾Oculus就吐的傢伙來說,現在他一天帶16個小時Magic Leap都不會暈。
補充:有人問為什麼網上說虛擬現實頭暈是因為幀率不夠原因?
幀率和延時雖然是目前的主要問題,但都不是太大的問題,也不是導致暈得決定性因素。這些問題用更快的顯卡,好的IMU和好的屏幕,還有頭部動作預測演算法都能很好解決。我們要關心一些本質的暈眩問題。
這里要說到虛擬現實和增強現實的不同。
虛擬現實中,使用者是看不到現實世界的,頭暈往往是因為人類感知重力和加速度的內耳半規管感受到的運動和視覺看到的運動不匹配導致的。所以虛擬現實的游戲,往往會有暈車想吐的感覺。這個問題的解決不是靠單一設備可以搞定的,如果使用者的確坐在原定不動,如果圖像在高速移動,什麼裝置能騙過你的內耳半規管呢?一些市場上的方案,比如Omni VR,或者HTC Vive這樣的帶Tracking的VR系統讓你實際行走才解決這個不匹配的問題,但這類系統是受場地限制的。不過THE VOID的應用就很好的利用了VR的局限,不一定要跑跳,可以用很小的空間做很大的場景,讓你以為你在一個大場景里就好了。現在大部分虛擬現實的體驗或全景電影都會以比較慢得速度移動視角,否則你就吐了。
但是Magic Leap是AR增強現實,因為本來就看的到現實世界,所以不存在這個內耳半規管感知不匹配的問題。對於AR來講,主要挑戰是在解決眼前投影的物體和現實物體的銳度變化的問題。所以Magic Leap給出的解決方案是很好地解決這個問題的。但都是理論上的,至於實際工程能力怎麼樣就靠時間來證明了。
Q3. 為什麼要有頭戴式顯示器?為什麼不能裸眼全息?Magic Leap是怎麼實現的?
人類希望能憑空看到一個虛擬物體,已經想了幾百年了。各種科幻電影里也出現了很多在空氣中的全息影像。
但其實想想本質就知道,這事從物理上很難實現:純空氣中沒有可以反射或折射光的介質。顯示東西最重要的是介質。很多微信上的瘋傳,以為Magic Leap不需要眼鏡,我估計是翻譯錯誤導致的,視頻中寫了Shot directly through Magic Leap tech.,很多文章錯誤的翻譯成「直接看到」或「裸眼全息",其實視頻是相機透過Magic Leap的技術拍的。
目前全息基本還停留在全息膠片的時代(如下圖,我在光場研討會上看到的這個全息膠片的小佛像),或者初音未來演唱會那種用投影陣列向特殊玻璃(只顯示某一特定角度的圖像,而忽略其他角度的光線)做的偽全息。
Magic Leap想實現的是把整個世界變成你的桌面這樣的願景。所以與其在世界各個地方造初音未來那樣的3D全息透明屏做介質或弄個全息膠片,還不如直接從人眼入手,直接在眼前投入整個光場更容易。其實Nvidia也在做這種光場眼鏡。
Nvidia採用的方法是在一個二維顯示器前加上一個微鏡頭陣列Microlens array來生成4維光場。相當於把2維的像素映射成4維,自然解析度不會高,所以這類光場顯示器或相機(Lytro)的解析度都不會高。本人親測,效果基本就是在看馬賽克畫風的圖案。
而Magic Leap採用完全不同的一個方法實現光場顯示,它採用光纖投影。不過,Magic Leap用的光纖投影的方式也不是什麼新東西。在Magic Leap做光纖投影顯示(Fiber optic projector)的人是Brian Schowengerdt,他的導師是來自華盛頓大學的教授Eric Seibel,致力於做超高解析度光纖內窺鏡8年了。簡單原理就是光纖束在一個1mm直徑管道內高速旋轉,改變旋轉的方向,然後就可以掃描一個較大的范圍。Magic Leap的創始人比較聰明的地方,是找到這些做高解析度光纖掃描儀的,由於光的可逆性,倒過來就能做一個高解析度投影儀。如圖,他們6年前的論文,1mm寬9mm長的光纖就能投射幾寸大的高清蝴蝶圖像。現在的技術估計早就超過那個時候了。
而這樣的光纖高解析度投影儀還不能還原光場,需要在光纖的另一端放上一個微鏡頭陣列microlens array,來生成4維光場。你會疑問這不就和Nvidia的方法一樣了么?不,因為光纖束是掃描性的旋轉,這個microlens array不用做得很密很大,只要顯示掃描到的區域就好了。相當與把大量數據在時間軸上分布開了,和通訊中的分時一樣,因為人眼很難分辨100幀上的變化,只要掃描幀率夠高,人眼就分辨不出顯示器是否旋轉顯示的。所以Magic Leap的設備可以很小,解析度可以很高。
他本人也來Stanford給過一個Talk,Near-to-Eye Volumetric 3D Displays using Scanned Light。這個Talk講的應該就是Magic Leap早期的原型。(相關內容可參考: Fiber Scanned Displays)
二、感知部分
Q4. 首先為什麼增強現實要有感知部分?
是因為設備需要知道自己在現實世界的位置(定位),和現實世界的三維結構(地圖構建),才能夠在顯示器中的正確位置擺放上虛擬物體。舉個最近的Magic Leap Demo視頻的例子,比如桌子上有一個虛擬的太陽系,設備佩戴者的頭移動得時候,太陽系還呆在原地,這就需要設備實時的知道觀看者視角的精確位置和方向,才能反算出應該在什麼位置顯示圖像。同時,可以看到桌面上還有太陽的反光,這就要做到設備知道桌子的三維結構和表面信息,才能正確的投射一個疊加影像在桌子的影像層上。難點是如何做到整個感知部分的實時計算,才能讓設備穿戴者感覺不到延時。如果定位有延時,佩戴者會產生暈眩,並且虛擬物體在屏幕上漂移會顯得非常的虛假,所謂Magic Leap宣稱的電影級的真實(Cinematic Reality)就沒有意義了。
三維感知部分並不是什麼新東西,計算機視覺或機器人學中的SLAM(Simultaneous Localization And Mapping,即時定位與地圖構建)就是做這個的,已經有30年的歷史了。設備通過各種感測器(激光雷達,光學攝像頭,深度攝像頭,慣性感測器)的融合將得出設備自己在三位空間中的精確位置,同時又能將周圍的三位空間實時重建。
最近SLAM技術尤其火爆,去年到今年兩年時間內巨頭們和風投收購和布局了超級多做空間定位技術的公司。因為目前最牛逼的3大科技技術趨勢:無人車,虛擬現實,無人機,他們都離不開空間定位。SLAM是完成這些偉大項目基礎中的基礎。我也研究SLAM技術,所以接觸的比較多,為了方便大家了解這個領域,這里簡單提幾個SLAM界最近的大事件和人物:
1、(無人車)Stanford的機器人教授Sebastian Thrun是現代SLAM技術的開創者,自從贏了DARPA Grand Challenge的無人車大賽後,去了Google造無人車了。SLAM學術圈的大部分研究派系都是Sebastian徒子徒孫。
2、(無人車)Uber在今年拿下了卡耐基梅隆CMU的NREC(國家機器人工程研發中心),合作成立高等技術研發中心ATC。這些原來做火星車的定位技術的研究人員都去Uber ATC做無人車了。
3、(虛擬現實)最近Surreal Vision被Oculus Rift收購,其中創始人Richard Newcombe是大名鼎鼎的DTAM,KinectFusion(HoloLens的核心技術)的發明人。Oculus Rift還在去年收購了13th Labs(在手機上做SLAM的公司)。
4、(虛擬現實)Google Project Tango 今年發布世界上第一台到手就用的商業化SLAM功能的平板。Apple五月收購Metaio AR,Metaio AR 的 SLAM 很早就用在了AR的app上了。Intel 發布Real Sense,一個可以做SLAM的深度攝像頭,在CES上Demo了無人機自動壁障功能和自動巡線功能。
5、(無人機)由原來做Google X Project Wing 無人機的創始人MIT機器人大牛Nicholas Roy 的學生Adam Bry創辦的Skydio,得到A16z的兩千萬估值的投資,挖來了Georgia Tech的SLAM大牛教授Frank Dellaert 做他們的首席科學家。(相關內容:http://www.cc.gatech.e/~dellaert/FrankDellaert/Frank_Dellaert/Frank_Dellaert.html)
SLAM作為一種基礎技術,其實全世界做SLAM或感測器融合做得好的大牛可能不會多於100人,並且大都互相認識。這么多大公司搶這么點人,競爭激烈程度可想而知,所以Magic Leap作為一個創業公司一定要融個大資,才能和大公司搶人才資源。
Q5. Magic Leap的感知部分的技術是怎麼樣的?
這張照片是Gary教授在Magic Leap Stanford 招聘會中展示了Magic Leap在感知部分的技術架構和技術路線。可以看到以Calibration為中心,展開成了4支不同的計算機視覺技術棧。
1、從圖上看,整個Magic Leap感知部分的核心步驟是Calibration(圖像或感測器校準),因為像Magic Leap或Hololens這類主動定位的設備,在設備上有各種用於定位的攝像頭和感測器, 攝像頭的參數和攝像頭之間關系參數的校準是開始一切工作的第一步。這步如果攝像頭和感測器參數都不準,後面的定位都是無稽之談。從事過計算機視覺技術的都知道,傳統的校驗部分相當花時間,需要用攝像頭拍攝Chess Board,一遍一遍的收集校驗用的數據。但Magic Leap的Gary,他們發明了一種新的Calibration方法,直接用一個形狀奇特的結構體做校正器,攝像頭看一遍就完成了校正,極為迅速。這個部分現場不讓拍照。
2、有了Calibration部分後,開始最重要的三維感知與定位部分(左下角的技術棧),分為4步。
2.1 首先是Planar Surface Tracking(平面表面跟蹤)。大家可以在虛擬太陽系的Demo中看到虛擬太陽在桌子上有反光,且這個反光會隨著設備佩戴者的移動而改變位置,就像是太陽真的懸在空中發出光源,在桌子表面反射產生的。這就要求設備實時地知道桌子的表面在哪裡,並且算出虛擬太陽與平面的關系,才能將太陽的反光的位置算出來,疊在設備佩戴者眼鏡相應的位子上,並且深度信息也是正確的。難點在平面檢測的實時性和給出平面位置的平滑性(否則反光會有跳變)從Demo中可以看出Magic Leap在這步上完成得很好。
2.2 然後是Sparse SLAM(稀疏SLAM);Gary在Info Session上展示了他們實時的三維重構與定位演算法。為了演算法的實時性,他們先實現了高速的稀疏或半稀疏的三維定位演算法。從效果上看,和目前開源的LSD演算法差不了太多。
2.3 接著是Sensors; Vision and IMU(視覺和慣性感測器融合)。
導彈一般是用純慣性感測器做主動定位,但同樣的方法不能用於民用級的低精度慣性感測器,二次積分後一定會漂移。而光靠視覺做主動定位,視覺部分的處理速度不高,且容易被遮檔,定位魯棒性不高。將視覺和慣性感測器融合是最近幾年非常流行的做法。
舉例:
Google Tango在這方面就是做IMU和深度攝像頭的融合,做的很好;大疆的無人機Phantom 3或Inspire 1將光流單目相機和無人機內的慣性感測器融合,在無GPS的情況下,就能達到非常驚人的穩定懸停;Hololens可以說在SLAM方面是做得相當好,專門定製了一個晶元做SLAM,演算法據說一脈相承了KinectFusion的核心,親自測試感覺定位效果很贊(我可以面對白色無特徵的牆壁站和跳,但回到場中心後定位還是很准確的,一點都不飄。)
2.4 最後是3D Mapping and Dense SLAM(3D地圖重建)。下圖展示了Magic Leap山景城辦公室的3D地圖重建:僅僅是帶著設備走了一圈,就還原了整個辦公室的3D地圖,並且有很精緻的貼圖。書架上的書都能重建的不變形。
因為AR的交互是全新的領域,為了讓人能夠順利地和虛擬世界交互,基於機器視覺的識別和跟蹤演算法成了重中之重。全新人機交互體驗部分需要大量的技術儲備做支持。
接下來的三個分支,Gary沒有細講,但是可以看出他們的布局。我就隨便加點註解,幫助大家理解。
3.1 Crowdsourcing眾包。用於收集數據,用於之後的機器學習工作,要構建一個合理的反饋學習機制,動態的增量式的收集數據。
3.2 Machine Learning & Deep Learning機器學習與深度學習。需要搭建機器學習演算法架構,用於之後的識別演算法的生產。
3.3 Scenic Object Recognition場景物體識別。識別場景中的物體,分辨物體的種類,和特徵,用於做出更好的交互。比如你看到一個小狗的時候,會識別出來,然後系統可以把狗狗p成個狗型怪獸,你就可以直接打怪了。
3.4 Behavior Recognition行為識別 。識別場景中的人或物的行為,比如跑還是跳,走還是坐,可能用於更加動態的游戲交互。順便提一下,國內有家Stanford校友辦的叫格林深瞳的公司也在做這個方面的研究。
跟蹤方面
4.1 Gesture Recognition手勢識別。用於交互,其實每個AR/VR公司都在做這方面的技術儲備。
4.2 Object Tracking物體追蹤。這個技術非常重要,比如Magic Leap的手捧大象的Demo,至少你要知道你的手的三維位置信息,實時Tracking,才能把大象放到正確的位子。
4.3 3D Scanning三維掃描。能夠將現實物體,虛擬化。比如你拿起一個藝術品,通過三維掃描,遠處的用戶就能夠在虛擬世界分享把玩同樣的物體。
4.4 Human Tracking人體追蹤。比如:可以將現實中的每個人物,頭上可以加個血條,能力點之類。
5.1 Eye Tracking眼動跟蹤。Gary解釋說,雖然Magic Leap的呈像不需要眼動跟蹤,但因為要計算4維光場,Magic Leap的渲染計算量巨大。如果做了眼動跟蹤後,就可以減少3D引擎的物體渲染和場景渲染的壓力,是一個優化的絕佳策略。
5.2 Emotion Recognition情感識別。如果Magic Leap要做一個Her電影中描繪的人工智慧操作系統,識別主人得情感,可以做出貼心的情感陪護效果。
5.3 Biometrics生物識別。比如要識別現實場景中的人,在每個人頭上顯示個名字啥的。人臉識別是其中一種,國內有家清華姚班師兄弟們開得公司Face++就是干這個乾的最好的。
總結:簡單來講感知這個部分Magic Leap其實和很多其他的公司大同小異,雖然有了Gary的加盟,野心非常的寬廣,但這部分競爭非常激烈。
Q6: 就算Magic Leap已經搞定了感知和顯示,那麼接下來的困難是什麼?
1、計算設備與計算量
Magic Leap要計算4維光場,計算量驚人。不知道Magic Leap現在是怎麼解決的。如果Nvidia不給造牛逼的移動顯卡怎麼辦?難道自己造專用電路?背著4塊泰坦X上路可不是鬧著玩的。
下圖是,今年我參加SIGGraph 2015里,其中一個VR演示,每個人背著個大電腦包玩VR。10年後的人類看今天的人類追求VR會不會覺得很好笑,哈哈。
2、電池!電池!電池!所有電子設備的痛
3、一個操作系統
說實話,如果說「世界就是你的新桌面」是他們的願景,現在的確沒有什麼操作系統可以支持Magic Leap願景下的交互。他們必須自己發明輪子。
4、為虛擬物體交互體驗增加物理感受
為了能有觸感,現在交互手套,交互手柄都是 VR 界大熱的話題。從目前的專利上看,並沒有看出Magic Leap會有更高的見地。說不定某個Kickstarter最後能夠獨領風騷,Magic Leap再把他收了。
❷ 論內容理解演算法
經過幾年的膨脹期,演算法的熱度快速下降,不論是AI四小龍的上市之路艱辛,還是各大頭部互聯網公司的副總裁重返學術界,以及演算法人員的招聘凍結。這里有總體經濟形勢惡化帶來的影響,也與演算法本身的能力上限有關,在各類學習任務上,演算法的性能正在逐漸進入瓶頸,通用任務效果提升的梯度在逐漸變小,有效的進展都依賴於超大規模的數據和模型參數,以通用語義表徵任務為例,完成一次超大規模的預訓練模型的成本達到數百萬元,極大地限制了中小企業參與的機會。
在業務應用方面,經過幾年的持續建設和多種類型功能的輸出,業務依賴的不同方向所對應的內容理解演算法在應用和效果層面已趨成熟,能夠帶來驚喜效果的機會變的很少。這種形勢下,作為偏後台支持的角色,如何去識別並持續深化內容理解演算法的作用變得很重要。本文試圖從價值視角分析內容理解的生存形勢,發掘未來發展的可能性以及從業人員的應對手段方面做了些不算嚴謹的闡述。
一直以來我們定義內容理解演算法為業務的萬金油,隨時隨地可以插拔式應用。從配合內容生產者做創作提示,幫助運營做質量分析,版權保護,相似查找,幫助搜索演算法提供長尾查詢的效率增強,幫助推薦演算法提供標簽等細粒度語義特徵,根據消費者的負向反饋進行同類型的內容屏蔽(如軟色情,惡心,不喜歡的明星)。因此很自然地,我們把內容理解演算法的使命定義為「內容流轉的全鏈路提質提效」,這里的質量包含對確定性劣質的去除,以及優質內容的免審或者高曝推薦。效率指的是把內容從生產到消費的鏈路上的時間優化到最快,包括配合運營進行快速的內容篩選,輔助分發演算法進行人群和內容的精準匹配。
這里需要回答的是,在上述相對完備的能力基礎上,內容理解演算法所能提供的最核心的價值是什麼?
首先是客戶的定義問題,內容理解演算法的客戶不是運營,不是分發演算法,也不是生產者和消費者。而是要回歸到最原始的「內容」,用於對內容進行附加值的極大化提升。
其次,參與到內容流轉各環節的角色承擔了對內容理解演算法的價值落地和放大,不論是運營所主導的平台意志實現,分發演算法對內容和消費者的高效匹配,以及生產者和消費者分別從內容供給和消費方面對內容理解演算法的訴求。
最後,內容本身是一種載體,載體背後是人對現實世界的刻畫,平台層面有對內容進行按需取用的邏輯,消費者也有用腳投票的權利,這里的內容理解演算法不應當做任何的自我傾向,按照業務訴求的多樣化能力輸出是內容理解存在的核心價值,否則通過簡單搬運學術界的開源模型便可形成表面上的業務能力堆砌,顯然是無法滿足業務的增長訴求。
因此,我們可以形成價值定義: 「內容理解演算法的核心價值是內容全生命周期內,根據服務業務的多樣化訴求,提供智能化和結構化的理解能力,其衡量標准為上述能力帶來的附加效率提升和成本下降。」
從這個定義來看,內容理解演算法似乎沒有站在主戰線上,價值被隱性地統計起來。實則不然,就如戰爭一樣,沖鋒在前的部隊只有少數,而承擔防守和輔助任務的兵種實際上是不可或缺的,很多時候也決定了戰爭的走向, 歷史 上由於後勤保障問題導致戰爭走向改變的例子比比皆是。就如定義中的效率提升,它其實不是一票式的,由於效率的提升會帶來供給者和消費者的規模增大,又會產出對內容理解演算法效率提升的更多訴求,這種正反饋式的鏈路也是內容業務可以快速實現既定目標的重要方式。
一、估值 游戲
以2021年11月小紅書的估值來看,彼時6千萬DAU和47分鍾人均時長的內容社區獲得200億美金的估值認可,這屬於一個早期內容社區經歷過較長時間的成長後才能達到的高度。考慮一個相對創新內容業務,兩到三年的時間想要達到5000萬DAU和5分鍾的人均時長其實還是比較困難的,按照對標小紅書的邏輯,估值上限為30億美金,假設內容理解演算法對業務貢獻率用3%折算,估算下來內容理解估值為9千萬美金,按照簡單的市銷率10倍計算,內容理解每年的營收為900萬美金(按照估值反推營收的原因是是內容理解演算法對業務的點狀式能力輸出難以做到精準的量化統計)。
900萬美金是非常尷尬的數字,因為內容理解演算法存在比較高昂的成本,從大頭上來看,內容理解演算法支出分為三部分,第一部分是演算法人員,以15人的支撐團隊計算(看起來有點多,實則不然,想要支撐對未來預期的增長,15個人實際並不夠用),按照單人每年的支付成本150萬計算(這個成本折算到員工回報大約為100萬左右,已經沒多大市場競爭力),大約400萬美金/年;第二部分是資源消耗,按照百萬內容/天的規模計算,各種資源成本(包括機器,存儲、輔助軟體等)大約500萬美金/年;第三部分是配套工程人員,產品經理,外包標注支持等,這部分大約150萬美金/年。可以看到業務發展到這個階段,內容理解演算法是入不敷出的。
按照上述口徑,能夠改善內容理解價值的核心方法包括三個方向,一是業務估值的上升,需要業務DAU和時長的穩定提升。二是內容理解演算法的業務貢獻率提升,這里對內容理解演算法的要求是比較高的,不僅僅要從內容的質量,生產者的輔助,分發流量效率,業務的大盤生態,或者業務商業化上有所作為。三是降低成本,這個路徑的可行性很弱,反倒是隨著業務的成長,成本的消耗會進一步增加,能夠做的是控製成本增長的速度小於業務增長。
「按照業務貢獻對處於業務發展前期的內容理解演算法進行價值衡量,情況是非常不樂觀的」。
二、價值重塑
前面的視角是業務閉環下的價值衡量,放開到更大的視角,內容理解演算法之所以構成相對獨立的功能單元是因為它提供的能力是相對通用的,比如標簽識別演算法不僅僅可用於小紅書,也可用於抖音和快手這樣的內容業務。
因此在支撐具體的業務的過程中沉澱出通用演算法進行其他類似業務的價值輸出,是內容理解演算法的另一扇門。這裡面臨的另一個問題是如果是頭部業務,一定是要求內容理解演算法是為它量身定製的,而中小業務願意為內容理解演算法買單的價錢是有限的。針對這個問題的核心解法是在做頭部業務能力定製的時候,提供盡可能通用的能力,通過對數量眾多的中小業務形成價值輸出,實現量級的堆砌。
此外,要差異化成熟業務和創新業務,對於成熟業務而言,內容理解演算法對業務的微小提升可能是非常明顯的,以京東平台為例,如果內容理解演算法通過圖像搜索或者同款識別等能力提升業務成交0.1%,也將是數億美金每年的價值加成。對於創新業務而言,內容理解演算法應當深入業務,從內容的全生命周期為業務提供硬核的能力,用以幫助業務實現生產者和消費者體感的明顯提升,最終帶來業務的正反饋式增長,早期的抖音就是依託炫酷的AI特效體系實現用戶規模的快速增長。
「目前能看到的,讓內容理解演算法進行價值放大的有效途徑是貼身服務頭部業務的過程中,沉澱通用化能力橫向輸出盡可能多的同類型業務。針對成熟業務尋找對業務增長的確定性增長點,創新業務尋找到適合於業務快速增長的硬核能力」。
作為一名內容理解演算法沉浮六年的老兵,我對內容理解演算法的未來持謹慎樂觀的態度。原因有三個方面,一是這一輪深度學習帶來的演算法提升空間變得有限;二是互聯網用戶進入存量時代後,頭部內容會更加精耕細作,從追求效率轉向運營的精細化和粘性保持;三是對未來可能出現的下一代內容消費方式的期待和觀望。
一、相對有限的演算法提升空間
過去的幾年,內容理解演算法的演進可以分為三個方向,一次是從傳統的手工特徵到神經網路特徵的升級,通過大數據和大算力實現效果的明顯提升,也極大降低了演算法人員的准入門檻;二是對內容的理解從單一模態升級為多模態&跨模態,以及以圖神經網路為基礎的推理能力;三是極大規模數據的模型學習,即以大規模預訓練模型為基礎的統一內容表徵方式,催生了transformer家族的不斷壯大。
然則,演算法的性能逐漸接近瓶頸,不論是在看圖說話、 情感 分析、還是標簽識別等演算法任務上距離人類仍然存在一定的距離,並且這份距離看起來短期內沒有明確的突破機會。反倒是業界開始從監督學習往無監督學習靠近,試圖利用海量數據學到背後的範式,這本質上是對追趕上人類能力的背離。
以transformer為例,百億數據下訓練一次消耗數百塊GPU,數周的訓練時間才有可能獲得明顯的效果的提升,這還不包括精細的網路調整的令人沮喪時間成本。此外下游任務想要得到期待的效果,還需要進一步的遷移學習。從表象來看,只是提供一個更好的演算法學習的起點。
我們經歷了一個業務對我們翹首以待到逐漸理性的合作過程,AI演算法從來就無法成為救世主,而是有更強生產力的工具。當然我們不應當過於悲觀,起碼過往的幾年,蓬勃發展的演算法體系帶來了從業人員的准入門檻極大下降,大眾對AI演算法的廣泛認知也有助於內容理解演算法相對長期的旺盛生命力和成長。
二、存量用戶時代的內容社區的運營方式
中國互聯網用於見頂,意味著各大內容業務必須進入存量用戶階段。存量用戶階段面臨的困境是粗放式增長不復出現,用戶群體開始細分,用戶粘性變得更加艱辛,要求內容社區必須進行精細化運營。精細化運營背後的表現為對效率的要求下降,轉而對用戶心智和長期的戰術保持耐心。這種情況下內容理解演算法會成為散落到業務眾多需求列表的功能支撐點,獨當一面的機會愈發減少。
「從演算法學習的角度來看,人的創意,玩法設計,互動屬性是目標(ground truth)的天花板,因此此時此刻保持工具屬性是相對合理的態度」。
三、下一代的內容消費方式
互聯網時代的內容消費經歷了文本到圖像的升級,再到視頻的升級,每一次內容消費升級背後產出對內容理解演算法的爆發式增長,那麼下一代的內容消費方式又是什麼呢?
業界目前正在押注元宇宙,facebook甚至把名字都改成了meta。過去有幾波VR/AR的熱潮,看起來除了在某些線上成人網站和線下 游戲 設備之外,並未有足夠顛覆我們日常生活方式的輸出。
人類對更高級的感知外部環境和與他人無時空差別的交互需求是明確存在的,只是它是否由「元宇宙」承載卻是個未知數。如果元宇宙是這個載體的話,那麼虛擬世界的感情識別,觸感生成,自然交互,生態的 健康 治理,超大規模內容消費下的負載下降會是內容理解演算法可以嘗試去攻克和深耕的全新地帶,也會承擔更為核心的角色。
「下一代的內容理解消費方式有機會成為內容理解的下一個主戰場,但是目前的形勢並不明朗,需要我們保持耐心地思考和觀望」。
四、其他的可能
拋開頭部綜合性AI大廠商如網路,騰訊,阿里巴巴,華為等企業作為內容理解多樣性需求輸出的第一極之外,還有以內容理解演算法作為平台能力輸出的第二極,比較有名的是AI四小龍(商湯、曠視、依圖,雲從),以及深度結合各民生領域的產業AI能力輸出。
醫療AI,解決醫療資源匱乏導致看病需求無法被滿足,人工看診時間長等問題。比較典型的case是COVID-Moonshot眾包協議,由500多名國際科學家共同參與,以加速COVID-19的抗病毒葯物研發。
教育AI,解決優質教育資源匱乏導致的分配不公,及教師和學生的信息不對稱問題,雖然國家正在推新教育雙減政策,但是教育作為一項基本的人身權利應當得到更好的滿足,比較知名的企業有松鼠AI,猿輔導等。
製造AI,解決製造車間設備、數量、功能增多、調度分配難度大、需求端個性化要求等問題,利用AI,自動化,IOT,邊緣計算,雲,5G等手段,充分利用生產車間的海量價值數據,把人從簡單重復的勞動中解放出來以從事更高級的任務,幫助提高產量的同時降低缺陷率,比較知名的企業有正在香港上市的創新奇智和創新型工業AI-PASS平台提供商遠舢智能等。
此外,還有在智能駕駛、智慧城市、晶元AI等產業領域深度耕耘的各種公司,他們正在充分發揮大數據和AI演算法的能力,為各大產業帶來源源不斷的創新能力。
回到內容理解演算法的現存生存環境,仍然存在一定的潛力可以挖掘。在下一代內容消費方式到來之前,可以做得更好,形成與上下游的積極聯動,在現在的舞台上展現出更佳的風采。
一、產品
內容理解演算法的產品是不是剛需,這個話題有點爭議,有人說演算法的產出速度是比較慢的,讓昂貴的產品角色參與建設本身會存在浪費的情況。我個人認為內容理解演算法所對應的產品角色必須具備,因為在龐大的業務體系後面,如果缺失了面向業務需求的自頂向下的內容理解演算法體系設計和建設,非常容易出現業務賦能的水土不服。
產品需要考慮的核心問題是如何衡量長期和短期投入,演算法是比較精細的工作,對結果的預期是非確定性的,因此需要做好對業務預期的管理以及同業務需求的及時交互。為了保障演算法最終在業務的使用效果,前期可以通過簡化版本或者半成品演算法的產品化方案進行快速試錯,幫助業務決策的同時給演算法的長期迭代爭取空間。此外,針對演算法長期迭代設計有效的樣本數據迴流機制,通過配置化輸出給到業務盡可能多的試錯方式,以及業務上線使用後的效果實時監控等都是產品需要思考的工作。
二、運營
運營應該是內容理解演算法打交道最頻繁的相關方,內容理解演算法的評價標准和業務適配都需要運營來進行構建和監控。內容理解演算法是運營進行內容供給生態和消費生態運營的智能助手,從內容結構化標簽角度提供到運營各種分析使用方式,如內容審核、內容圈選,內容人群定投等。
和運營打交道對內容理解演算法提出高要求,如何快速衡量需求的合理性及可行性非常關鍵。有時候內容理解演算法做了過度承諾,導致上線效果不佳,影響業務的發展。有時候對演算法實現效果的不自信或產品化用法借力不夠從而拒絕需求導致業務失去寶貴的試錯機會。因此內容理解演算法應當對內容運營的鏈路有相當的掌握,可以和運營一起定義全鏈路演算法能力,從應用的視角推進演算法需求的合理有序的開展。
三、生產者
生產者對於平台來說至關重要,巧婦難為無米之炊,不論運營和分發演算法多麼牛逼,缺少了高質量的內容生產來源,業務是不可能有持續增長的。通常情況下兩千優質生產者加上數萬的普通生產者即可支撐起千萬DAU的業務,如何服務好這部分生產者對平台來說非常關鍵。
內容理解演算法和生產者目前的主要交互方式包括幾個方面,一是在內容生產的時候給到生產者的內容元素的智能推薦,如話題,標題,配樂的推薦等;二是進行內容展現效果的提升,如濾鏡,貼紙,美顏,畫質增強等;三是從質量層面給予生產者指導和管控,包括從業務視角給到生產者發布的內容大致因為何種理由不被平台採納,內容高熱趨勢消費榜單,內容的版權保護等。
從生產者視角來看,盡可能多地從平台獲取流量或者商業化價值是根本追求,因此往往會出現對平台規則的不斷試探以攫取利益,如發布大量的擦邊球或危言聳聽的內容。內容理解演算法需要在內容供給規模不斷變大的情況下幫助平台保持 健康 的生態和有效的流量分配同時盡可能給到生產者更多指導。這種相愛相殺的關系也給內容理解演算法帶來了不少的挑戰和生存空間。
四、分發演算法和消費者
把分發演算法和消費者放在一起的核心邏輯是內容理解演算法絕大部分情況下是需要通過分發演算法和消費者打交道的。從消費者視角觀察,高活用戶代表主流心智,如何服務好這波群體關繫到業務的生存問題。中低活用戶是平台的增量所在,持續加強這部分用戶的平台粘性是關鍵任務(這里會有部分用戶的出逃,為了維護平台的心智,這部分的犧牲是可接受的)。分發演算法承擔了把海量內容做負載下降後根據用戶的長短期興趣進行推薦的使命,分發演算法是需要秉承平台意志的,用於進行內容的流量調配用於影響消費者的體感和心智,給平台帶來源源不斷的生機。
早期編輯為主的內容分發模式下,消費者是被教育的對象,一天之內能夠看到的新鮮內容是非常少的,這種情況導致消費者的瀏覽深度和時長是受限的。個性化推薦模式下,用戶的興趣被極致放大,由於相關內容和新鮮內容的快速推送,消費者會感受到強烈的沉浸式消費體感。然而內容的多樣性,消費體感的持續維護,興趣的拓展等變得非常重要,這給分發演算法的精準性提出很高要求。提供分發演算法細粒度的識別能力是內容理解演算法可以大展身手的機會,內容是否具備不錯的分發潛力以加大分發流量?內容的適合人群是什麼?用戶無序瀏覽背後的核心興趣是什麼?軟色情/部分人群不喜好內容(蛇蟲寵物)如何精準識別用以分發調控等問題都是分發演算法難以觸達的地方,這些命題正是內容理解演算法可以深入研究並影響內容分發和消費的重要方面。
除了特定的場景(如互動玩法,個性化封面圖等),內容理解演算法應當恪守自己在內容生命周期的參與廣度。涉及到內容的分發和消費,內容理解演算法應當把自己定義為分發演算法不可或缺的助力,而不是試圖去做替換,站在內容理解演算法視角,分發演算法可以約等於消費者。以飯館運作為例,分發演算法是大廚,根據消費者的口味和食材和菜譜提供個性化的食物服務。內容理解演算法可以對食材進行質量管控,研發新的菜譜,在必要的時候提供半成品的菜品。和消費者的交互交由分發演算法來處理,畢竟術業有專攻,內容理解演算法可以在對內容的深度理解和消費者洞察上做縱向的深入,提供更多的可能性,包括生態、多樣性、內容保量等。
內容理解演算法和分發演算法的理想態是正和 游戲 ,零和 游戲 對雙方都是沒有意義的,因此這里額外對內容理解演算法提出的要求是在內容消費場景建立一套相對客觀的評價體系,通過演算法的標准化評估進行上線流程的加速,通過不斷的快速試錯給分發演算法提供更多槍支彈葯。
五、工程&數據分析
一個好漢三個幫,內容理解演算法背後也站著一群小夥伴,面向演算法生產的大規模工程基礎設施和面向演算法洞察的數據分析能力可以幫助內容理解演算法更好的發展。在內容爆炸式增長的今天,高效的演算法工程體系非常關鍵,甚至是拉開不同公司差距的最重要手段之一。有個非常明顯的例子,在業界舉辦的各種演算法大賽上,只要是大型互聯網公司參賽基本上都會出現霸榜的情況,這背後是模型訓練效率的強大先發優勢,擁有百塊級別GPU並發訓練能力的高校是非常少的。此外以通用向量檢索功能為例,百億級的向量索引能力在有限的算力和內存消耗下穩定運行起來是需要大量的工程優化手段的,而這個功能對演算法的高效使用至關重要。
服務於內容理解演算法,數據分析有非常多的應用。根據消費統計行為構建面向內容興趣的用戶畫像,風向趨勢內容消費對供給的指導,層次耦合的內容標簽的合理掛靠關系,演算法上線前的有效性分析,及演算法上線後持續監控和異常告警等。
內容理解演算法需要做的是面向業務場進行完整的架構設計,從演算法的效率角度,包括演算法服務效率,演算法洞察視角等方面聯動工程&數據分析提供強大的生產力,通過規模和系統厚度構建足夠的技術門檻。
2021年對中國互聯網,甚至是中國 社會 的前行都是不同尋找的一年,在全球經濟下行,國家間人為壁壘構建的情況下,恰恰又遭遇了國內人口增長的停滯,國家對互聯網平台的強管控,以及互聯網用戶滲透的見頂。
內容理解演算法背後的AI演算法體系多少也收到了波折,不過從整體形勢來看,AI演算法體系和產業化仍然在往前走。基礎理論研發體系中對應的論文發表、會議舉辦及大賽的舉行和參賽人員的規模都在增長。這兩年的遇冷問題主要是受到市場大環境的影響,AI占總體投資的比重仍然在上升。從國內方面來看,全球經濟的技術封鎖進一步堅定了中國立足自主創新的決心和信心,國家十四五計劃也明確提出了大數據,人工智慧,VR/AR的產業發展規劃,AI產業仍然有很強的潛力值得挖掘。
作為依附於業務的內容理解演算法,需要有清晰的自我認知和定位。我們的核心價值是什麼?它如何得到有效的定義和量化?作為服務於業務眾多角色中的一員,如何做好同其他角色的正向互動?上述問題背後的答案代表了內容理解演算法的核心作用。現在的演算法界有一股投機風,什麼熱門就搞什麼,有號稱無需數據標注的無監督學習,有號稱可以效果對標大量標注樣本的小樣本學習,有號稱單個演算法模型打遍天下的多模態預訓練學習等等。如果從問題抽象簡化的角度去研究基礎的理論體系和演算法學習範式是沒有問題的,但是如果業務的算同學也把這類概念擺在嘴上是有問題的,脫離了業務場景的核心訴求去談技術創造新商業,是一種對客戶的傲慢,屬於典型的機械主義。
作為深度結合業務的內容理解演算法,應當從業務場景出發,結合演算法的可行性去 探索 用於業務賦能的核心技術,對於明確可以產生正向業務價值的演算法技術,哪怕需要較長一段時期的打磨,也要敢於投注建設,在演算法研發的過程中不斷地思索業務的更多可能性,逐漸把業務的不確定性轉化為技術的相對確定性。對於較長時間無法形成對業務貢獻的演算法,應當果斷放棄深入研究,當然作為技術觀望跟進是沒有問題的。
從目前形勢來看,內容理解演算法的發展確實碰到了一些困難,但我們可以保持對未來的謹慎樂觀,期待下一代內容消費形態的來臨,同時盡可能多地進行業務場景的細化進行能力輸出和加強,把存量業務價值做好放大,通過演算法自身的持續建設,為將來可能來臨的那一刻做好技術儲備。
❸ 青島黃海學院現在的教師待遇怎麼樣啊教師工作需要坐班嗎
青島黃海學院現在的教師待遇還是不錯的,需要坐班。
青島黃海學院(Qing Huanghai University)是經教育部批准、具有學士學位授予資格的民辦普通本科高校。
師資力量
據2018年10月學校官網顯示,學校教師總數860餘人,大都具有碩士及以上學歷,高級職稱教師佔34%以上。12名教師榮獲青島市高校教學名師、山東省優秀教師等榮譽稱號。
以上內容參考 網路-青島黃海學院
❹ 浠嶢R鉶氭嫙璇曡。鍒扮ぞ浜ら瓟鏂癸紝銆岃嫳棰嗕箣閫斻嶅笇鏈涙瀯寤哄畬鏁碅R搴旂敤鐢熸
C絝疉R鐨勬牳蹇冩槸搴旂敤鐢熸
2016騫翠互鏉ワ紝鎴戝浗鐩哥戶鍑哄彴浜т笟鏀跨瓥鏀鎸乂R/AR琛屼笟鍙戝睍銆2018騫12鏈堬紝宸ヤ俊閮ㄥ彂甯冦婂叧浜庡姞蹇鎺ㄨ繘鉶氭嫙鐜板疄浜т笟鍙戝睍鐨勬寚瀵兼剰瑙併嬶紝浠庢牳蹇冩妧鏈銆佷駭鍝佷緵緇欍佽屼笟搴旂敤銆佸鉤鍙板緩璁俱佹爣鍑嗘瀯寤虹瓑鏂歸潰鎻愬嚭浜嗗彂灞曡櫄鎷熺幇瀹炰駭涓氱殑閲嶇偣浠誨姟銆傝屸滃嶮鍥涗簲瑙勫垝涔熸寚鍑猴紝瑕佸皢VR/AR浜т笟鍒椾負鏈鏉ヤ簲騫存暟瀛楃粡嫻庨噸鐐逛駭涓氫箣涓銆
鎹璧涜開鏁版嵁鏄劇ず錛2020騫存垜鍥絍R/AR琛屼笟甯傚満瑙勬ā杈懼埌413.5浜垮厓錛屽悓姣斿為暱46%錛涢殢鐫鎶鏈鏃ヨ秼鎴愮啛錛孷R/AR鍦ㄥ悇棰嗗煙鐨勫簲鐢ㄩ愭ュ睍寮錛岄勮2023騫存垜鍥絍R/AR琛屼笟甯傚満瑙勬ā灝嗚秴榪囧崈浜褲
鑻遍嗕箣閫旀垚絝嬩簬2016騫達紝浠ヨ蔣紜浠剁粨鍚堢殑鏂瑰紡錛岀爺鍙慉R浜у搧鍙婂簲鐢ㄥ満鏅錛屽苟榪涗竴姝ユ瀯寤篈R浜т笟鐢熸佸湀銆傛彁渚涢潰鍚態絝鐨凙R奼借濺銆丄R宸ヤ笟榪滅▼緇翠繚銆丄R鏁板瓧鍖栧満棣嗘敼閫犵瓑錛屽熀浜庡炲己鐜板疄鐨勪紒涓氬畾鍒舵湇鍔★紝騫朵笖鍦ㄥ姞閫熸帹榪涢潰鍚慍絝鐨凙R浜у搧鐮斿彂銆
鑻遍嗕箣閫斿笇鏈涙瀯寤哄畬鏁寸殑AR搴旂敤鐢熸
鑻遍嗕箣閫斿皢閫氳繃涓緋誨垪涓篊絝鐢ㄦ埛寮鍙戠殑浜у搧錛屽寘鎷錛欰R鉶氭嫙璇曡呫丄R絀挎惌闂歸挓銆丄R紺句氦欖旀柟銆佽。鑱旂綉銆丄R娓告垙鏈恆丄R鎵嬭〃銆丄R鏅鴻兘綆″訛紝絳夊嶮浣欐捐蔣紜浠舵惌閰嶇殑浜у搧錛屽艦鎴愬熀浜嶢R鐨勭ぞ浜ら棴鐜錛屽苟鏍規嵁涓嶅悓闇奼傦紝鎼閰嶈蔣浠跺瑰簲鐨勪笉鍚屽簲鐢ㄥ満鏅錛屼負緇堢鐢ㄦ埛鎻愪緵涓鎬у寲鐨勪嬌鐢ㄤ綋楠屻
鈥滄垚絝嬩箣鍒濓紝鑻遍嗕箣閫旂爺鍙戜簡涓濂桝R鐪奸暅錛屽皢鍏跺簲鐢ㄤ簬B絝瀹㈡埛錛屽苟寮鍙戜簡閰嶅楃殑宸ヤ笟榪滅▼緇翠繚絳夌郴緇熸柟妗堛傝嫳棰嗕箣閫斿壋濮嬩漢鍏糃EO榛勯槼涔嬪悜36姘浠嬬粛錛氣滀笌姝ゅ悓鏃訛紝鍏鍙稿畬鍠勪簡杞紜浠跺洟闃燂紝騫跺皢鐮斿彂閲嶇偣杞縐誨埌C絝錛屽紑鍙戜簡AR鉶氭嫙璇曡。緋葷粺錛宊_鍙闇_閮ㄦ櫤鑳絖鏈烘垨騫蟲澘鐢佃剳錛屽氨鑳藉皢鉶氭嫙鐨刜鏈嶅疄鏃剁┛鍦ㄧ湡瀹炰笘鐣岀殑___涓娿
AR鉶氭嫙璇曡
鍦ㄤ紶緇熺嚎涓婅喘鐗╂祦紼嬩腑錛岀敤鎴峰彧鑳藉弬鑰冩ā鐗瑰浘錛屽垽鏂鏂瑰紡鍗曚竴錛屽叆鎵嬪悗瀹規槗閫犳垚鈥滀拱瀹剁鐨勯棶棰橈紝閫璐ф祦紼嬮暱錛屽艱嚧鈥滄伓鎬у驚鐜銆傝屽競鍦虹幇鏈夎櫄鎷熻瘯琛i暅綾諱駭鍝侊紝鏅閬嶅瓨鍦ㄩ犱環楂樸佷嬌鐢ㄥ満鏅鍗曚竴銆佷綋楠屽樊絳夌‖浼ゃ
鑻遍嗕箣閫斿埄鐢⊿LAM絀洪棿瀹氫綅緋葷粺銆佺炵粡緗戠粶璁緇冦3D綰圭悊璇嗗埆絳夊氱嶆妧鏈綆楁硶灝嗚櫄鎷熺殑琛f湇涓庝漢浣撶浉緇撳悎銆佽櫄瀹炵粨鍚堬紝鏈澶х▼搴﹀啀鐜頒簡鐪熷疄鐨勮瘯瑁呮晥鏋溿
AR鉶氭嫙璇曡呯‖浠舵惌杞戒簡涓緋誨垪浠跨湡妯℃嫙鍣
浜у搧緇忓巻浜嗕笁嬈¤凱浠o紝澧炲姞浜嗕笁涓浠跨湡妯℃嫙鍣錛氬垎鍒鏄浼哥緝浠跨湡妯℃嫙鍣ㄣ侀潰鏂欎豢鐪熸ā鎷熷櫒鍜屾俯搴︿豢鐪熸ā鎷熷櫒錛岄珮搴﹁繕鍘熶簡綰誇笅璇曡。緔ф澗銆侀忔皵鎬с侀潰鏂欒川鎰熺瓑鐩磋備綋楠屻
鍒涙柊鐨勭‖浠剁粨鍚堢殑_寮忥紝浣垮緱_鏂欒川鎰熼肩湡銆佹湇瑁呬慨_璐村悎錛宊_鍙浠360擄鏌ョ湅涓嶅悓_搴︾殑璇曠┛鏁堟灉銆傚苟涓擾鎸乢鐢盌IY鎼閰嶏紝_閿鍒嗕韓濂界墿鍙婄┛鎼鏁堟灉鍥劇粰濂藉弸錛屾渶_鍖栬繕鍘熺嚎涓嬭喘_浣撻獙錛岄殢_鎵嬈叉惌閰嶆湇瑁呴犲瀷錛屽紑鎷撳湪綰胯瘯_璐璤鏂扮帺娉曘
瀵逛簬鍟嗗惰岃█錛岄噰鐢ㄨ嫳棰嗕箣閫旂殑AR鉶氭嫙璇曡。緋葷粺錛屽彲灝嗛璐х巼闄嶄綆40%錛岀敤鎴風矘鎬ф彁楂70%錛屾渶緇堝埄娑﹀彲鎻愰珮4鍊嶃
榛勯槼涔嬭〃紺猴細寮鍙慉R鉶氭嫙璇曡。緋葷粺鐨勭洰鐨勶紝鍏跺疄鏄涓轟簡鍙浠ュ湪C絝甯傚満鍚稿紩鏇村氱殑濂蟲х敤鎴楓傚逛簬鑻遍嗕箣閫斾笅涓姝ュ皢闄嗙畫鎺ㄥ嚭鐨凙R紺句氦銆丄R娓告垙銆丄R欖旀柟絳夊鉤鍙幫紝濂蟲х敤鎴鋒槸闈炲父閲嶈佺殑錛屽彲浠ュ拰鐢鋒х敤鎴峰艦鎴愰潪甯稿ソ鐨勪簰鍔錛屽逛簬浠ュ跺涵涓哄崟浣嶇殑娑堣垂錛屽ス浠涔熸槸姣旇緝寮哄姏鐨勬秷璐圭℃帶鑰呫
AR紺句氦欖旀柟
鑻遍嗕箣閫旂殑涓嬩竴浠d駭鍝丄R紺句氦欖旀柟涔熷湪蹇閫熻凱浠d腑錛屾渶鍒濈殑鎬濊礬錛屾槸鍋氫竴涓鍍忎箰楂樼Н鏈ㄦ傚康錛屽彲浠ュ垎浣撴媶鍗哥殑AR鏄劇ず璁懼囥備綔涓轟竴嬈続R紜浠朵駭鍝侊紝涓嶢R鐪奸暅鏈夊緢寮虹殑鍏遍氭э紝鏈鏍稿績鐨勯儴鍒嗛兘鏄鍏夊︽ā緇+宓屽叆寮忕郴緇熴傚叾鐗規ц〃鐜板湪錛1錛夌涓浜虹О瑙嗚夛紱2錛夊氱獥鍙f搷浣滐紱3錛夌┖闂村畾浣嶇郴緇燂紱4錛変氦浜掓с
AR紺句氦欖旀柟鐨勪駭鍝佸艦鎬佹槸鍏闈浣撻瓟鏂癸紝姣忎釜闈㈤兘鏄涓涓灞忓箷錛屽苟涓斿彲浠ユ嫾鍦ㄤ竴璧峰彉鎴愪竴涓澶у睆騫曪紝涔熷彲浠ュ垎寮鏉ユ姌鍙狅紝閫氳繃澶氫釜紿楀彛鎿嶄綔錛岃繕鎻愪緵涓板瘜鐨勪簰鍔ㄩ厤浠躲
AR紺句氦欖旀柟
鑻遍嗕箣閫斿逛簬鏈鏉ヤ駭鍝佽礬寰勭殑瑙勫垝涓昏佹潵鑷浜庡湪搴曞眰鎶鏈鏂歸潰澶氬勾鏉ョ殑縐緔娌夋穩錛岃嚜涓葷爺鍙戜簡鍏夊満鑺鐗囷紝騫惰嚜寤烘棤灝樿姱鐗囧皝瑁呭疄楠屽わ紝瀹炵幇鍏夊満鑺鐗囩殑瑙勬ā鍖栭噺浜э紱鍚屾椂鍏峰嘇R/VR澶氭櫙娣辨樉紺恆佹縺鍏夐浄杈炬牳蹇冨櫒浠躲侀氳棰嗗煙鐨勬牳蹇冩妧鏈銆
鍦ㄨ蔣浠剁畻娉曟柟闈錛岃嚜涓葷爺鍙戜簡澶氶」璁$畻鏈鴻嗚夊拰IMU鋙嶅悎鐨勭畻娉曪紝鐢ㄤ簬澶氱嶄氦浜掑拰瀹氫綅緋葷粺錛屽疄鐜癷nside-out錛屾棤闇澶栭儴鏍囪扮偣鐨勭┖闂村畾浣嶆妧鏈錛汼LAM絀洪棿瀹氫綅綆楁硶錛6Dof鎵嬫焺榪借釜綆楁硶錛涙墜鍔胯瘑鍒綆楁硶銆
鑻遍嗕箣閫旈氳繃AR鉶氭嫙璇曡。緋葷粺寤虹珛鑷宸辯殑搴旂敤鐢熸侀棴鐜錛屼竴鏂歸潰閫氳繃涓庣數鍟嗗鉤鍙板悎浣滐紝浠ュ強闈㈠悜灝廈絝鍒惰。浼佷笟鐨勫湴鎺錛屽艦鎴愬晢鍝佸強鍐呭規柟闈㈢殑騫沖彴鍙婄佸煙嫻侀噺錛涘彟涓鏂歸潰浠ヤ綆浠峰皢Eintoo璇曡。紜浠跺悜C絝澶ч噺閾鴻揣銆傜洰鍓嶅凡瀹屾垚甯傚満楠岃瘉錛岃揪鎴愬崈涓囩駭鐨勮㈠崟鍚堜綔鎰忓悜銆傛湭鏉ラ殢鐫AR紺句氦欖旀柟絳夋柊鐨勪駭鍝佺嚎闈涓栵紝濞變箰銆佹父鎴忋佹嶅叆騫垮憡絳夊皢鎴愪負钀ユ敹澧為暱鐐廣
鑻遍嗕箣閫旀ゅ墠鏇捐幏緹庡浗PNP銆佸拰闄嗗囧崥澹鐨勫囩嘩鍒涘潧鐨勫氳疆鋙嶈祫錛屽叕鍙告嫢鏈変笁鍗佷綑欏瑰彂鏄庡拰涓撳埄銆傚壋濮嬩漢榛勯槼涔嬬爺絀剁敓姣曚笟浜庤嫳鍥藉笣鍥界悊宸ヨ$畻鏈虹郴錛屾槸鍥藉唴杈冩棭鏈熺殑C絝澧炲己鐜板疄鐮旂┒瀛﹁咃紝鏇懼叆閫2018紱忓竷鏂涓鍥経30姒溿2020鑳℃鼎鍒涗笟棰嗚栨溿
鎹鎮夛紝鑻遍嗕箣閫斿湪鏃犻敗褰撳湴鏀垮簻鍙婅屼笟鍗忎細鏀鎸佷笅錛屽緩絝嬩簡鍏冨畤瀹欎駭涓氳胺鍒涗笟鍩哄湴錛屽勾搴曞皢浼氫婦琛岄暱涓夎掑厓瀹囧畽鍒涙柊鍒涗笟澶ц禌錛屽府鍔╂洿澶歑R棰嗗煙鐨勫壋涓氬叕鍙告彁鍗囧獎鍝嶅姏錛屽叡鍚屾垚闀褲
❺ 鍒樺効鍏浜虹墿浠嬬粛
鍒樺効鍏
鍒樺効鍏錛岀敺錛屽悓嫻庡ぇ瀛︽暀鎺堬紝鍗氬+鐢熷煎笀錛岃嫳鍥藉伐紼嬩笌鎶鏈瀛︿細浼氬+錛圛ETFellow錛夛紝ACM楂樼駭浼氬憳錛圓CMSeniorMember錛夛紝IEEE楂樼駭浼氬憳錛圛EEESeniorMember錛夛紝涓鍥借$畻鏈哄︿細錛圕CF錛夋澃鍑轟細鍛橈紝闃垮皵鍗$壒鏈楄鐮旂┒闄ALTA錛屽浗闄呮湡鍒奍EEECommunicationsLetters緙栧旓紝IEEEAccess緙栧旓紝KSIITrans.緙栧旓紝銆婁腑鍥介氫俊銆嬶紙鑻辨枃鐗堬級錛圕hinaCommunications錛夌紪濮旓紝IEEE涓婃搗鍖哄潡閾句富甯銆傝幏寰椻滃井杞鍥介檯瀹ゅ唴瀹氫綅鎶鏈澶ц禌鈥濆啝鍐涳紝鈥滀腑鍥藉伐涓氬崥瑙堜細錛堝伐鍗氫細錛夆濋珮鏍$壒絳夊栥佷腑鍥解滀簰鑱旂綉+鈥濆ぇ瀛︾敓鍒涙柊鍒涗笟澶ц禌鍏ㄥ浗閲戝栵紝涓繪寔鐮斿彂鈥滀腑鍥藉浗闄呰繘鍙e崥瑙堜細鈥濆畾浣嶅艱埅緋葷粺銆
涓鏂囧悕錛氬垬鍎垮龎
鍥界睄錛氫腑鍥
鑱屼笟錛氭暀甯
姣曚笟闄㈡牎錛氬崕涓縐戞妧澶у
涓昏佹垚灝憋細2016騫村井杞鍥介檯瀹ゅ唴瀹氫綅鎶鏈澶ц禌鍐犲啗
2014騫翠腑鍥藉浗闄呭伐涓氬崥瑙堜細楂樻牎鐗圭瓑濂
涓昏佹垚灝憋細2014騫磋嫳鍥藉伐紼嬩笌鎶鏈瀛︿細浼氬+錛圛ETFellow錛
2018騫村井杞鍥介檯瀹ゅ唴瀹氫綅鎶鏈澶ц禌瀹氫綅綺懼害絎涓
涓繪寔寤鴻鵑栧眾鈥滀腑鍥藉浗闄呰繘鍙e崥瑙堜細鈥濆畾浣嶅艱埅緋葷粺
浠h〃浣滃搧錛欴WELT瀹氫綅瀵艱埅鎶鏈
鑱岀О錛氬悓嫻庡ぇ瀛︽暀鎺
鐢熷鉤
紜曞+/鍗氬+錛氬崕涓縐戞妧澶у︼紝鍏夌數瀛愬伐紼嬬郴/嬋鍏夋妧鏈鍥藉墮噸鐐瑰疄楠屽わ紝鐗╃悊鐢靛瓙瀛︿笓涓氾紝鍒嗗埆浜1998鍙2001騫磋幏寰楃曞+鍙婂崥澹瀛︿綅錛岀曞+璁烘枃錛氭縺鍏夎皭鎸鑵旇捐★紱鍗氬+璁烘枃(鑾鋒牎浼樼鍗氬+璁烘枃)錛歁PLS璺鐢卞櫒璁捐°
2001-2003錛氶樋灝斿崱鐗規湕璁鍏鍙革紝鍏夌綉緇滈儴(OND)錛屼換欏圭洰緇忕悊鍙婇珮綰ф妧鏈欏鵑棶錛屼粠浜婨oS鍏夌綉緇滈」鐩/浜у搧鐨勭爺鍙戙佺$悊浠ュ強鏍囧噯鍖栫瓑宸ヤ綔錛屽寘鎷珽thernetOverSONET/SDH鍜屽氫笟鍔′紶閫佸鉤鍙癕STP絳夈
2003-2007錛氶樋灝斿崱鐗規湕璁鍏鍙革紝鐮旂┒涓庡壋鏂頒腑蹇(R&I)錛屼換楂樼駭鐮旂┒縐戝﹀訛紝浠庝簨鍒嗙粍緗戠殑TDM浼犺緭(TDMoP)錛屾棤婧愬厜緗戠粶(GPON/EPON)浠ュ強802.16WiMAX/802.16j鏃犵嚎澶氳煩涓緇ч」鐩鐨勭爺絀躲佺$悊浠ュ強鏍囧噯鍖栫瓑宸ヤ綔銆
鍦ㄩ樋灝斿崱鐗規湕璁鍏鍙稿伐浣滄湡闂達紝澶氭¤幏寰椾紭縐鍛樺伐/鏉板嚭涓撳埄濂/璁烘枃濂栫瓑銆傚洜鍏舵妧鏈璐$尞錛2006騫磋幏寰楅樋灝斿崱鐗規湕璁鐮旂┒闄㈤佸彂鐨勬渶楂樻妧鏈鑽h獕縐板彿ALTA銆
2007-2011騫達細鍔犲叆鑻卞浗甯濆浗鐞嗗伐瀛﹂櫌錛岀數姘斿強鐢靛瓙宸ョ▼緋伙紝鎷呬換鐮旂┒鍛橈紝浠庝簨涓嬩竴浠f棤綰跨綉緇滅爺絀躲傛壙鎷呮垨鍙傚姞澶氫釜欏圭洰錛屽悎浣滃崟浣嶅寘鎷緹庡浗鍐涙柟銆佽嫳鍥藉浗闃查儴銆佺害緲.闇嶆櫘閲戞柉澶у︺佸墤妗ュぇ瀛︼紝UCLA銆乁MASS銆佺憺澹鑻忛粠涓栫悊宸ュぇ瀛︺両BMWatson鐮旂┒闄銆佹嘗闊沖叕鍙革紝鑻辯壒灝斿叕鍙搞侀樋灝斿崱鐗-鏈楄鍏鍙搞両ntracom銆丆efriel絳夈
2011騫磋嚦浠婏細鍔犲叆鍚屾祹澶у︼紝鐢靛瓙涓庝俊鎮宸ョ▼瀛﹂櫌錛屼俊鎮涓庨氫俊宸ョ▼緋伙紝鎷呬換鏁欐巿錛堝崥澹鐢熷煎笀錛夛紝浠庝簨鏂頒竴浠f棤綰跨綉緇滃強鐗╄仈緗戞柟鍚戠殑鐮旂┒銆
棰嗗煎洟闃熺爺鍙戝嚭鍥藉唴棣栦釜鐧劇背閲忕駭鐨勬繁絀塊忛氫俊緋葷粺WCD錛岃幏寰2014騫翠腑鍥藉浗闄呭伐涓氬崥瑙堜細錛堝伐鍗氫細錛夐珮鏍$壒絳夊栥
棰嗗煎洟闃熺爺鍙戝嚭楂樼簿搴﹀ゅ唴瀹氫綅綆楁硶--鍔ㄦ佸姞鏉冭繘鍖栫殑璺寰勮拷韙綆楁硶DWELT銆2016騫磋幏寰椻滃井杞鍥介檯瀹ゅ唴瀹氫綅鎶鏈澶ц禌鈥濆啝鍐涳紝鍦ㄤ紬澶氬浗鍐呭栦紒涓氬拰澶у﹀弬鍔犵殑鐜板満嫻嬭瘯涓錛屼笉渚濊禆浜庝換浣曞熀紜璁炬柦鍜屽熀絝欙紝鍒╃敤鎵嬫満鑾峰緱鏈楂樺畾浣嶇簿搴︼紝鎶鏈鎬ц兘杈懼埌鍥介檯棰嗗厛姘村鉤銆侱WELT鎶鏈鑾峰緱2016騫粹滀腑鍥藉浗闄呭伐涓氬崥瑙堜細錛堝伐鍗氫細錛夆濆壋鏂伴摱濂栥2018騫達紝DWELT鎶鏈鍐嶆¤幏寰椻滃井杞鍥介檯瀹ゅ唴瀹氫綅鎶鏈澶ц禌鈥濆畾浣嶇簿搴︾涓鐨勪紭寮傛垚緇┿
鍩轟簬DWELT鎶鏈鐨勯」鐩鍏堝悗鑾峰緱2018騫翠腑鍥解滀簰鑱旂綉+鈥濆ぇ瀛︾敓鍒涙柊鍒涗笟澶ц禌涓婃搗甯傚喅璧涢噾濂栦互鍙婂叏鍥芥誨喅璧涢噾濂栥2018騫達紝鍩轟簬DWELT鎶鏈鐮斿彂鐨勨滃艱礬鑰呪濈郴緇燂紝鋙嶅悎浜嗕漢宸ユ櫤鑳藉拰AR/VR澧炲己鐜板疄/鉶氭嫙鐜板疄絳夋妧鏈錛屾垚涓洪栧眾鈥滀腑鍥藉浗闄呰繘鍙e崥瑙堜細鈥濆畾浣嶅艱埅緋葷粺錛堝寘鎷灝忕▼搴忓拰APP鐗堟湰錛夛紝鏄鍏ㄧ悆棣栦緥鐗瑰ぇ鍨嬪ゅ唴澶栦竴浣撶殑瀹氫綅瀵艱埅緋葷粺銆
浠昏亴
鏄疘ET浼氬+錛圛ETFellow錛夛紝ACM楂樼駭浼氬憳錛圓CMSeniorMember錛夛紝IEEE楂樼駭浼氬憳錛圛EEESeniorMember錛夛紝涓鍥借$畻鏈哄︿細錛圕CF錛夋澃鍑轟細鍛橈紝闃垮皵鍗$壒鏈楄鐮旂┒闄ALTA浼氬憳錛屼腑鍥界數瀛愬︿細楂樼駭浼氬憳銆傛槸IEEE涓婃搗鍖哄潡閾句富甯錛岃礋璐IEEE鍖哄潡閾句腑鍥藉悇鍦板尯灝忕粍鐨勭瑰囥傚湪宸ヤ笟鐣屽拰瀛︽湳鐣屽潎鏈夊氬勾緇忛獙銆傜爺絀跺叴瓚e寘鎷錛氱墿鑱旂綉錛圛oT錛夈佹繁絀塊忛氫俊緋葷粺銆5G銆佸嶆潅緗戠粶銆佸ぇ鏁版嵁銆佷漢宸ユ櫤鑳姐佸ゅ唴瀹氫綅銆佸尯鍧楅摼鎶鏈絳夈
甯稿勾鎷呬換IEEE/Elsevier/Springer/Wiley/ACM/OSA絳夋棗涓嬫湡鍒/浼氳鐨勫$匡紝鎷呬換澶氫釜鍥介檯浼氳鐨勬妧鏈濮斿憳浼氬斿憳銆佷富甯鎴栧垎浼氫富甯錛屾媴浠誨浗闄呭垔鐗㊣EEEAccess鐨勫壇涓葷紪錛圓ssociateEditor錛夛紝IEEECommunicationsLetters鐨勫壇涓葷紪錛圓ssociateEditor錛夛紝KSIITrans.鐨勭紪濮旓紙Editor錛夛紝銆婁腑鍥介氫俊銆嬶紙鑻辨枃鐗堬級錛圕hinaCommunications錛夌殑緙栧旓紝ChinaCommunications鍖哄潡閾句笓棰樼殑瀹㈠駭涓葷紪錛圙uestEditor-in-Chief錛変互鍙奍鍖哄潡閾句笓棰樼殑瀹㈠駭緙栧旓紙GuestEditor錛夌瓑銆
鍦ㄦ湡鍒/浼氳涓婂彂琛80澶氱瘒璁烘枃錛岀編鍥/嬈ф床/鏃ラ煩/涓鍥界瓑鍦板彂鏄庝笓鍒40澶氶」錛屾彁浜9欏瑰浗闄呮爣鍑嗗寲鑽夋堛
棰嗗煎洟闃熺爺鍙戝嚭鍥藉唴棣栦釜鐧劇背閲忕駭鐨勬繁絀塊忛氫俊緋葷粺WCD錛岃揪鍒板浗闄呭厛榪涙按騫籌紝鑾峰緱2014騫翠腑鍥藉浗闄呭伐涓氬崥瑙堜細錛堝伐鍗氫細錛夐珮鏍$壒絳夊栥
棰嗗煎洟闃熺爺鍙戝嚭楂樼簿搴﹀ゅ唴瀹氫綅綆楁硶--鍔ㄦ佸姞鏉冭繘鍖栫殑璺寰勮拷韙綆楁硶DWELT銆傚氭¤幏寰楀浗鍐呭栧栧姳錛屽寘鎷2016騫粹滃井杞鍥介檯瀹ゅ唴瀹氫綅鎶鏈澶ц禌鈥濆畾浣嶇簿搴︾涓銆2018騫粹滃井杞鍥介檯瀹ゅ唴瀹氫綅鎶鏈澶ц禌鈥濆畾浣嶇簿搴︾涓銆2016騫粹滀腑鍥藉浗闄呭伐涓氬崥瑙堜細錛堝伐鍗氫細錛夆濆壋鏂伴摱濂栥2018騫翠腑鍥解滀簰鑱旂綉+鈥濆ぇ瀛︾敓鍒涙柊鍒涗笟澶ц禌鍏ㄥ浗鎬誨喅璧涢噾濂栫瓑錛屾妧鏈鎬ц兘涓哄浗闄呴嗗厛銆傚熀浜嶥WELT鎶鏈鐮斿彂鐨勨滃艱礬鑰呪濈郴緇燂紝鏄鍏ㄧ悆棣栦緥鐗瑰ぇ鍨嬪ゅ唴澶栦竴浣撶殑瀹氫綅瀵艱埅緋葷粺錛屾槸棣栧眾鈥滀腑鍥藉浗闄呰繘鍙e崥瑙堜細鈥濆畼鏂圭殑瀹氫綅瀵艱埅緋葷粺錛堝寘鎷灝忕▼搴忓拰APP鐗堟湰錛夈
涓氫綑鐖卞ソ錛氶煶涔/鐢靛獎錛屼箳涔撶悆錛岄瓟鏂癸紝TTNews(澶╁ぉ鏂伴椈)/TTNetBars(澶╁ぉ緗戝惂)/SecIt(瀵規秷鎮/閭浠剁瓑鍔ㄦ佸姞瀵)絳夊厤璐硅蔣浠惰捐′互鍙婁縿緗楁柉鏂瑰潡娓告垙絳夈