⑴ 寒武紀發布第三代雲端AI晶元思元370 產品進入早期銷售階段
11月3日,寒武紀(688256)發布第三代雲端AI晶元思元370、基於思元370的兩款加速卡MLU370-S4和MLU370-X4、全新升級的CambriconNeuware軟體棧。
基於7nm製程工藝,思元370是寒武紀首款採用chiplet(芯粒)技術的AI晶元,集成了390億個晶體管,最大算力高達256TOPS(INT8),是寒武紀第二代產品思元270算力的2倍。思元370也是國內第一顆支持LPDDR5內存的雲端AI晶元,內存帶寬是上一代產品的3倍,訪存能效達GDDR6的1.5倍。
同時,寒武紀全新升級了CambriconNeuware軟體棧,新增推理加速引擎MagicMind,實現訓推一體,顯著提升了開發部署的效率,降低用戶的學習成本、開發成本和運營成本。
新一代智能處理器架構
寒武紀智能處理器架構MLUarch03,擁有新一代張量運算單元,內置Supercharger模塊大幅提升各類卷積效率;採用全新的多運算元硬體融合技術,在軟體融合的基礎上大幅減少運算元執行時間;片上通訊帶寬是上一代MLUarch02的2倍、片上共享緩存容量最高是MLUarch02的2.75倍;推出全新MLUv03指令集,更完備,更高效且向前兼容。
值得強調的是,寒武紀堅持自研智能晶元架構、指令集,是全球范圍內在該技術方向積累最為深厚的公司之一。MagicMind是寒武紀全新打造的推理加速引擎,也是業界首個基於MLIR圖編譯技術達到商業化部署能力的推理引擎,用戶僅需投入極少的開發成本,即可將推理業務部署到寒武紀全系列產品上,並獲得頗具競爭力的性能。
思元370升級了視頻圖像編解碼單元,可提供更高效的視頻處理能力和更優的編碼質量,支持更復雜、更繁重、低延時要求的計算機視覺任務。
此次發布中,兩款基於思元370的加速卡正式亮相:高密度、半高半長、功耗75W的MLU370-S4智能加速卡和高性能、全高全長、功耗150W的MLU370-X4智能加速卡。與上一代產品相比,370系列加速卡在性能、能效方面都有更為卓越的表現。例如,對標准ResNet-50v1進行軟體定製優化後,MLU370-X4加速卡性能高達30204fps。
據了解,此次寒武紀發布了兩款加速卡,未來還將推出更多基於思元370的產品。
產品進入早期銷售階段
從雲端推理思元270、邊緣推理思元220、雲端訓練思元290,到最新發布的推訓一體思元370,寒武紀為用戶提供了覆蓋不同場景、不同算力規模的全系列產品。此次發布的256TOPS算力的思元370主要面向中高端推訓場景,與主要面向訓練的512TOPS高端產品思元290形成協同,共同為客戶提供全功能、全場景的智能算力。
思元370在2020年三季度流片,相關加速卡產品於2021年二季度陸續送測客戶。目前,部分客戶已完成測試、導入,產品進入早期銷售階段。
阿里雲基礎設施異構計算負責人張偉豐博士表示,阿里雲基礎設施異構計算團隊已經完成了思元370的測試及導入,結合阿里雲震旦異構計算加速平台完成了ODLA的介面適配,總體性能表現超出預期。網路異構計算架構師黎世勇表示,自2018年起,網路與寒武紀展開了多維度的軟硬體協作,思元100等產品服務網路語音合成等多種業務場景。
日前寒武紀發布了2021第三季度業績報告。2021年前三季度,寒武紀營業收入2.22億元,同比增長41.19%;研發投入合計7.04億元,同比增加62.62%,研發投入占營業收入的比例為316.72%,同比增加41.74%。
資料顯示,寒武紀自成立以來一直專注於人工智慧晶元產品的研發與技術創新,致力於打造人工智慧領域的核心處理器晶元。寒武紀的主營業務是應用於各類雲伺服器、邊緣計算設備、終端設備中人工智慧核心晶元的研發、設計和銷售,以及為客戶提供豐富的晶元產品與系統軟體解決方案。目前,寒武紀的主要產品線包括雲端產品線、邊緣產品線、處理器IP授權及軟體。
⑵ 全球首發7nm!寒武紀AI晶元:算力恐怖
寒武紀創始人接受采訪時曾說過:「很多同行想去做上層的解決方案,但我們不會做應用層,我們只做好基礎系統軟體讓大家可以在我們上面開發好應用。」以此為指導思想,寒武紀有個原則:能讓的都讓出去,能不做的就不做,不碰客戶的核心利益。同時,寒武紀確立了雲邊端產品策略,以中立的方式與客戶共贏。
A股市場需要更多和寒武紀一樣的公司,一同構建硬實力。從開放的角度看,A股市場也需要更多像寒武紀一樣以中立生態為目標的公司,這樣才能逐步打破生態牆。
寒武紀 科技 的第三代IP產品「寒武紀1M」,全球首個採用台積電7nm工藝製造,能耗比達到5Tops/W,即每瓦特5萬億次運算,並提供2Tops、4Tops、8Tops三種規模的處理器核,滿足不同場景、不同量級的AI處理需求,並支持多核互聯。
寒武紀1M處理器延續了前兩代IP產品寒武紀1H/1A卓越的完備性,單個處理器核即可支持CNN、RNN、SOM等多樣化的深度學習模型,更進一步支持SVM、k-NN、k-Means、決策樹等經典機器學習演算法,支持本地訓練,為視覺、語音、自然語言處理以及各類經典的機器學習任務提供靈活高效的計算平台,可廣泛應用於智能手機、智能音箱、智能攝像頭、智能駕駛等領域。
從技術層面上來講:
寒武紀ai晶元曾經應用於華為麒麟970、980的cpu,而這兩代CPU也是在市場奠定麒麟地位的功勛之作,據了解,之前華為自己一直想做ai晶元,但是由於技術不成熟,所以轉而選擇寒武紀的晶元,等到3年之後,華為達芬奇架構成熟了,才選擇了自己的晶元。從這個背景來看,能讓華為選擇,並且領先華為2年的晶元,應該還是真的領先的。
11月6日,中科院孵化的寒武紀 科技 有限公司發布了全球新一代AI晶元:面向低功耗場景視覺應用的寒武紀1H8、擁有更廣泛通用性和更高性能的寒武紀1H16,以及可用於終端人工智慧產品的寒武紀1M
⑶ 寒武紀為什麼說是騙子
不是。寒武紀(南京)信息科技有限公司,成立於2021年,位於江蘇省南京市,其是一家受官網認證法律保護的正規公司,所以非常正規,該公司主要經營人工智慧基礎軟體開發、人工智慧應用軟體開發、人工智慧基礎資源與技術平台等。
⑷ 寒武紀來了
(文/觀察者網 呂棟)在距今大約5.3億年前的寒武紀時期,地球上在2000多萬年的時間里突然涌現出各種各樣的生物,一系列與現代動物形態基本相同的物種來了個「集體亮相」。而在此之前,更為古老的地層中卻長期沒有找到動物化石,這一時期史稱「寒武紀生命大爆發」。
5.6億年前寒武紀出現的最有代表性的遠古動物——三葉蟲。圖源:視覺中國
現如今,「寒武紀生命大爆發」仍然是古生物學和地質學中的一大懸案,更是困擾著包括達爾文在內的學界大佬。然而,當我們此刻在搜索引擎中輸入「寒武紀」這三個字時,排在輸出結果第一位的已不再是那個困擾科學界的謎題,而是一家人工智慧晶元領域的 科技 公司。
值得注意的是,最近幾年,國內涌現出不少初創AI晶元設計企業,它們在吸附大量一級市場資金後,一方面互相激烈競爭,另一方面還不得不面對來自巨頭的壓力。在該領域,不僅有英特爾、英偉達等晶元行業傳統巨頭,也有華為、阿里等跨界選手,無一不對這塊蛋糕「垂涎三尺」。
而寒武紀正誕生於上述背景中。
一個月前的2月28日晚間,北京證監會官網發布消息,2019年12月5日,中科寒武紀與中信證券簽署A股上市輔導協議,正式開啟沖刺科創板的進程。
而3月26日上交所官網顯示,創辦剛滿4年的寒武紀上市申請已獲受理。短短幾個字,意味著該公司距登陸科創板又近了一步,同時也再次將其置於輿論的放大鏡下。
市場普遍認為,如果寒武紀成功登陸科創板,將成為毫無懸念的「AI晶元第一股」。
殘酷的現實便是,中國集成電路進口額長期大於出口額。官方數據顯示,2019年中國集成電路進口總額為3055.5億美元,而出口僅1015.8億美元,進出口比例為3:1,時代也在期待中國晶元領軍者。
而該公司以「寒武紀」給自己命名,寓意「AI大爆發」,並以「全球智能晶元領域的先行者」作為自己定位,既彰顯了幾分神秘又凸顯了其「野心」。
別人眼中的學霸
提起寒武紀,就不得不提其創始人陳雲霽和陳天石這兩兄弟。
哥哥陳雲霽1983年出生,兩年後弟弟陳天石出生,江西南昌人。與大多數年過而立、尚未不惑的同齡人相比,他們可以說已有所成就。
1月16日,陳天石剛以寒武紀CEO身份成為2019年中國科學年度新聞人物十人之一,而陳雲霽早已從前輩手中接過2017年度 科技 創新人物獎。
不少人好奇,這對來自江西的「雙子星」,緣何既能讀書出色,又能在創業後搞出一個「獨角獸」。
履歷顯示,陳雲霽9歲上中學,14歲便考入中國科大少年班,24歲取得中科院計算所博士學位,29歲晉升為研究員,33歲獲得中國青年 科技 獎和中科院青年科學家獎。
小兩歲的陳天石,幾乎是沿著哥哥的腳步一路從中科大少年班追到了中科院計算所。他16歲考入中科大少年班,25歲在中科大計算機學院拿到博士學位,指導導師是陳國良和姚新。
事實上,這對別人口中的學霸,在他們自己看來並非「模範兄弟」。
陳雲霽曾提到,兩人小時候常打架,長大後一言不合就吵起來,要不是有血緣關系早就鬧崩了。不過,兩人最終還是會讓道理來說話。
在接受媒體采訪時,陳雲霽曾透露,「和很多人想像的不太一樣,我並不是學霸。相反,多數時候都是一個學渣。」而且他講到,在19年的學習生涯中,不但考第一名的次數不多,還常在班上排名倒數。
2002年,19歲的陳雲霽已經在中科大少年班度過了第五個年頭。酷愛 游戲 的他對於自己的課業成績並不太在意,而是把《星際爭霸》當做主課來修。他曾坦言,「掛科的壓力一直是懸在頭上的劍,但是科大的老師對於我們這些調皮的孩子非常包容,給了我們很大的空間去成長。」
當年,即將本科畢業的陳雲霽聽說中科院計算所在研製中國第一塊通用CPU晶元「龍芯1號」,希望能拜師計算所胡偉武老師,於是報考了中科院計算所的研究生。
這家始建於1956年的研究所,是中國第一個專門從事計算機科學技術綜合研究的學術機構。從這里走出的包括聯想控股、龍芯中科、中科曙光等,均為中國信息技術產業中的知名企業。
2017年,陳雲霽接受采訪時曾開玩笑稱,在他之前,中科院計算所從來沒有招過像他本科成績這么差的學生。但是,胡偉武看到他玩《星際爭霸》的表現,認定他有科研潛力,便力排眾議將他錄取。
「Work hard,play harder!胡老師就是看中了我這一點。」 陳雲霽當時說。
估值超220億
事實證明,陳雲霽確實沒有辜負胡偉武的期望。
博士畢業後,他留在了中科院計算所龍芯團隊,在胡偉武的指導下成為8核龍芯3號的主架構師。他還與胡偉武合著了《計算機體系結構》,並在2008年開發龍芯3號的過程中完成了一篇重量級的論文。
不僅如此,陳雲霽向胡偉武引薦了另一位「高徒」,他的弟弟陳天石。
與做硬體晶元出身的陳雲霽不同,陳天石的研究方向是人工智慧,專注於軟體演算法。 在博士畢業後他也加入了中科院計算所,這為後來兩個人一起設計出「讓計算機更聰明」的專門神經網路處理器埋下了伏筆。
時針撥回到2010年,當時國內人工智慧晶元尚處於較冷階段。
根據公開報道,在計算所匯合後,陳氏兄弟也曾就職業發展探討了好長時間,最後認定有兩件「非常好玩的事」可以做:一是用AI輔助做處理器的設計,另外一個就是做AI晶元。
起初,陳天石在向計算所領導匯報想做AI晶元時還曾拿自動駕駛舉例:「大家很早就在說有一天機器會替代人開車,但如果開車的機器人在做模式識別的時候速度不夠快,那麼這個車就完全沒有讓機器開的理由。所以,它一定需要很強的車載運算能力。」
2015年,早在寒武紀公司成立之前,在中科院戰略性先導專項和中科院計算所的支持下,陳氏兄弟主導的世界首款深度學習專用處理器原型晶元——「寒武紀」首次成功流片。
之所以取名為「寒武紀」,是想用地質學上生命大爆發的時代寓意人工智慧的未來。
次年春天,谷歌的AlphaGo「一戰成名」,人工智慧在全世界范圍內再次掀起波瀾,國內對人工智慧的重視也達到前所未有的高度。不僅如此,2017年以及之後的兩會中,人工智慧也成為關鍵詞之一。
而陳氏兄弟的研究也趕上了好時候。
2016年,全球首款可商用的深度學習處理器「寒武紀1A」處理器問世,寒武紀 科技 公司也正式成立於當年3月,其數千萬的天使輪融資也正是來自中科院。
值得一提的是,性格的不同也讓陳氏兄弟在公司擁有不同的角色。
陳雲霽在公司職務上更偏研究,思考技術路徑相關的部分,很少掛寒武紀頭銜,多以「中科院計算所研究員」示人。
據陳雲霽透露,他的性格偏外向、膽子大,喜歡做一些天馬行空的事情,更適合搞科研。
而弟弟陳天石比較慎重,每走一步都會想好可行性,能規避產業發展中的「坑」,適合帶領一個企業往前沖。
所以陳天石總以寒武紀創始人、CEO的身份出現在公眾視野。
根據公開報道,除陳氏兄弟外,寒武紀團隊成員不僅囊括了中科院技術精英,也有中國首個通用CPU「龍芯1號」的核心參與人員。
具體奮斗目標上,他們希望讓AI晶元計算效率提升1萬倍,功耗降低1萬倍,可以把「AlphaGo」這樣的領先AI應用裝入手機中。
不過,「天才少年」也曾被人吐槽。
根據中國科學報報道,在寒武紀最開始募資的時候,其團隊也曾碰釘子,有人吐槽他們「PPT做得差」,邊吐槽邊教育,「小夥子你這樣是融不到錢的」。
招股說明書顯示,在公司成立之後,寒武紀共經歷了6次增資和3次股權轉讓。
2017年8月,該公司完成估值10億美元的A輪融資,國投創業領投,阿里巴巴、聯想創投、國科投資、中科圖靈、元禾原點和涌鏵投資等參投,使得寒武紀成為全球AI晶元領域首家獨角獸公司。
不到一年之後的2018年6月,寒武紀宣布完成數億美元B輪融資,國有資本風險投資基金、國新啟迪、國投創業、國新資本等聯合領投,該輪融資後的寒武紀估值約為25億美元,距離一年前的10億美元翻了一番還多。
正是在此時,陳天石對外透露了公司上市動向:「未來傾向於考慮在境內A股上市」。
在此之後,寒武紀的估值便不得而知。根據招股書,2019年9月13日,寒武紀新增南京招銀、湖北招銀、國調國信智芯和嘉富澤地等股東;2019年9月16日,陳天石將其所持寒武紀有限2.43%的股權和0.86%的股權分別轉讓給艾溪合夥和納什均衡。
這也是寒武紀在上市前最後的增資與股權變動。
根據股權結構,南京招銀出資8億元,獲得寒武紀上市前3.61%的股權,納什均衡受讓了0.86%股權,耗資1.8億元。
據此計算得知,寒武紀在經歷6輪融資後估值約221.6億元。
由於在過去的幾輪融資中,國字型大小背景的投資方居多,寒武紀也因此被市場視為AI晶元的「國家隊」。
存銀行理財39億
寒武紀公開的招股書披露,其主營業務是應用於各類雲伺服器、邊緣計算設備、終端設備中人工智慧核心晶元的研發、設計和銷售,主要產品包括終端智能處理器IP、雲端智能晶元及加速卡、邊緣智能晶元及加速卡以及與上述產品配套的基礎系統軟體平台。
簡而言之,人工智慧晶元是相對於傳統晶元的概念。
目前,AI晶元主要是指GPU、FPGA、ASIC等人工智慧加速晶元,主要用於解決人工智慧龐大的算力需求。AI晶元的主要應用場景為雲計算數據中心與邊緣計算,後者包括攝像頭 IPC、自動駕駛、手機的Soc等。
縱觀處理器晶元市場,通用處理器晶元如CPU、GPU的晶元的壁壘極高,國內仍未實現突破,且通用處理器領域已經發展成熟,目前市場由國際巨頭高度壟斷,後來者難以競爭。
而AI晶元是全新的市場,進入者有後發先至的可能,寒武紀正是這樣的新入局者。
自寒武紀2016年3月成立以來,其先後推出了三大類產品:
招股書中介紹,寒武紀目前採用的盈利模式是「授權+成品」,前者類似ARM,將AI晶元的知識產權(IP) 授權給下游廠商,例如最知名的合作夥伴華為;後者則是寒武紀自己設計,找代工方生產後自行銷售。
值得注意的是,IP供應商相比於晶元提供商利潤規模並不高。
例如,ARM作為全球領先的半導體IP提供商,本身不直接從事晶元生產。
全球大部分的手機CPU都在使用ARM架構,市佔率非常高,但是營收規模卻在巨頭中比較遜色。2017年ARM核晶元出貨量213億顆,營收才17.8億美元,凈利8億美元,營收規模還不如國內很多晶元公司。
而處理器龍頭英特爾是晶元供應商,2017年營收628億美元,凈利潤為96億美元,收入規模遠超ARM。
公開資料顯示,人工智慧IP僅作為一個加速器晶元模塊,價格遠比不上ARM IP。
因此,IP研發需要巨大的成本投入,在IP未得到大規模應用情況下,是付出多回報少的「苦生意」。
由於智能晶元研發需要大量資本開支,作為初創公司,寒武紀也年年虧損。
招股書顯示,2017年-2019年,其營收分別為784.33萬元、1.17億元、4.44億元;營收增幅明顯,但盈利堪憂,連續三年分別虧損3.8億元、4104萬元和11.79億元,累計約16億元。
而巨額虧損主要來自兩方面,一是「研發支出較大,產品仍在市場拓展階段」,二是「報告期內因股權激勵計提的股份支付金額較大」。
其也在特別風險提示一欄中醒投資者,寒武紀無法保證未來幾年內實現盈利,其上市後亦可能面臨退市的風險。
正如寒武紀所言,其巨額虧損確實與研發大量投入有關。
2017年-2019年,其研發投入分別為2986.19萬元、2.4億元、5.43億元,占營收比例分別為380.73%、205.18%和122.32%,累計投入8.13億元,相當於三年累計營收的1.43倍。
截至2019年12月31日,寒武紀研發人員有680人,佔比接近員工總數的80%;擁有碩士、博士學歷的員工有546人,佔比超60%。
與此同時,寒武紀的高研發投入也獲得了相對可觀的回報。
截至2020年2月29日,其已獲授權的境內專利有50項,境外專利有15項,此外還有PCT專利申請120項,正在申請中的專利共有1474項。
在研發投入遠超營收的情況下,可以說寒武紀目前的營運資金主要依賴外部融資。
招股書顯示,2017年-2019年,寒武紀籌資活動產生的現金流量凈額分別為4.96億元、24.05億元以及17億元,總計為46.01億元。
而前述年度下,寒武紀期末現金及現金等價物余額則分別為2.27億元、13.54億元以及3.83億元。不難看出,其消化資金的速度有些驚人。
寒武紀還在招股書中稱,由於未來幾年將存在持續的大規模研發的投入,上市後未盈利的狀態可能持續存在。因此,足夠的運營資金對於持續高研發投入的寒武紀顯得尤為重要。
招股書顯示,寒武紀本次擬發行股份不超過4010萬股,不低於發行後總股本的10%,融資28.01億元,用於新一代雲端訓練晶元、雲端推理晶元、邊緣端人工智慧晶元及系統項目和補充流動資金。
在持續高研發投入的背景下,寒武紀還要融資28億,那現在應該很缺錢?
令人驚訝的是,截至2019年末,寒武紀貨幣資金余額為38.3億元, 銀行理財產品38.9億元 ,資產負債率為6.68%,且全部為日常經營過程中產生的非付息債務,無銀行借款等其他付息債務。
除此之外,寒武紀還有3.8億元的銀行存款。
值得注意的是,作為技術密集型企業,寒武紀的毛利率水平也較高。
2017年-2019年,其綜合毛利率分別為99.96%、99.90%及68.19%。其中,終端智能處理器IP業務的毛利在99%以上。針對去年毛利率有所下降,招股書解釋稱,這是因為這一年拓展了新業務——雲端智能晶元及加速卡、智能計算集群系統業務。
分道揚鑣
提到寒武紀,不得不提的就是華為。
寒武紀在招股書中提到,其寒武紀1A、寒武紀1H分別應用於某全球知名中國 科技 企業的旗艦智能手機晶元中,已集成於超過1億台智能手機及其他智能終端設備中。根據公開信息,其指的就是華為。
2017年,華為推出了移動處理器麒麟970,主打AI性能,其搭載的NPU IP就是來自寒武紀;次年的麒麟980,依然選擇與寒武紀合作,Mate 10、Mate 20、P20等旗艦機,均搭載了後者的NPU。
作為寒武紀最大客戶,2017年-2018年兩年間,來自 公司A 的收入一直占其營收比例在98%上下,為其第一大客戶。
招股書中提到,2018年 公司A 得到寒武紀授權,將寒武紀終端智能處理器IP集成於其旗艦智能手機晶元中。
艾瑞咨詢則在一份報告中稱:「僅從搭載麒麟970手機出貨量來看,若授權費為5美元/片,則超過4000萬台手機出貨量為寒武紀帶來約2億美元(摺合人民幣14億元)的收入。」
由於和華為的良好合作關系,寒武紀曾在2017年公開表示,計劃3年後佔有中國高性能智能晶元市場30%的份額,並使全世界10億台以上的智能終端設備集成有寒武紀終端智能處理器。
不過,事情在2018年發生了變化。
當年10月,華為在全連接大會上發布了升騰910、升騰310兩款AI晶元,其採用的是華為自研的達芬奇架構,而非寒武紀的方案。當時,這被媒體解讀為「華為要與寒武紀做徹底的切割」,走向獨立造芯之路。
次年6月,華為發布的nova 5搭載了中端移動處理器「麒麟810」,這是首款採用華為自研達芬奇架構的手機AI晶元;年底的麒麟990,依然採用的是前述架構,其在AIBenchMark跑分達到了麒麟980的476%。
近日,寒武紀CEO陳天石在接受采訪時談到與華為的合作關系稱:其實我們和客戶的關系一直挺好。還是我之前的觀點,AI晶元大家都做,恰恰說明它重要。
針對華為已經在用自研的達芬奇架構,對其收入有何影響?
陳天石並沒有正面回答,只是表示:「我們的收入增長很快,未來希望有機會向大家公開披露我們的財報。」
而寒武紀招股書中的數據顯示,來自 公司A 的收入佔比已經從2017年98.34%驟降到2019年的14.34%,比2018年大幅減少為6365萬元,並從第一大客戶降為第四大客戶。
眾所周知,華為是國內僅有的自研SoC的手機廠商。國內大部分的終端廠商不像華為一樣自研AI晶元。
不過,有觀點指出,如果寒武紀要進入vivo、OPPO等手機品牌,必須說服晶元供應商採用其產品,難度不小。
因此,寒武紀此後再未提及「三年佔領三成市場」的目標。
寒武紀在招股書中稱,2018年其終端智能處理器IP許可銷售收入同比大幅增長,主要原因系人工智慧技術和應用開始普及,採用該公司終端智能處理器IP的終端設備已實現規模化出貨,使得其終端智能處理器IP許可銷售收入大幅增加。
而2019年其終端智能處理器IP許可銷售收入同比下降較大。
招股書中解釋稱,主要原因系2018年向 公司A 逐步交付了終端智能處理器IP,2019年固定費用模式的IP許可銷售收入相應下降。
與此同時,寒武紀在招股書中還將華為海思列為了競爭對手。
寒武紀在招股書中坦言,與英偉達、英特爾、AMD等國際大型集成電路企業相比,其在整體規模、資金實力、研發儲備、銷售渠道等方面仍然存在著較大的差距。國內企業中如華為海思及其他晶元設計公司也日漸進入該市場,其面臨著市場競爭進一步加劇的狀況。
耐人尋味的是,寒武紀CTO梁軍就出身華為,先後就職於華為公司北京研究所、華為海思半導體公司,於2017年跳槽到寒武紀。目前這位CTO是所有高管中薪資最高的一位,持股也達到了3.2%。
值得注意的是,在市場調研機構Compass Intelligence2018年發布的AIChipset Index TOP24榜單中,英偉達高居第一,華為海思排名12位,而寒武紀則是第23位。
事實上,除了華為,寒武紀的投資方之一阿里巴巴也是其強大的競爭對手,後者在2018年成立了「平頭哥半導體有限公司」,整合了中天微系統有限公司和達摩院自研晶元業務。
次年7月,平頭哥首顆智能晶元玄鐵910發布,採用RISC-V架構瞄準端+雲市場, 與寒武紀有高度重合 。
客戶、供應商集中度高
「失去」華為的寒武紀,不再單獨依賴IP授權,開始轉向拓展雲端智能晶元及加速卡業務與智能計算集群系統業務。
招股書中提到,2019年其拓展了雲端智能晶元和加速卡、智能計算集群業務和相應的新客戶,如伺服器廠商、雲服務廠商、企業和地方政府等,第一大客戶銷售佔比下降,「實現了客戶多元化」,已不存在向單個客戶銷售比例超過公司銷售總額50%的情況。
寒武紀在招股書中透露,面向數據中心、雲計算、邊緣計算、移動終端、智能教育、智能製造、智能交通等多個領域,其已與紫光展銳、智芯微、浪潮、聯想、阿里巴巴、網路、滴滴、好未來、金山雲等眾多國內知名公司分別就一個或多個領域開展深度合作。
2019年11月,寒武紀簽下了珠海市橫琴新區管理委員會商務局的智能計算平台(二期)項目,該合同總價高達4.4億,當年直接為寒武紀帶來了2億營收。
另外,寒武紀還與西安灃東儀享 科技 服務有限公司、上海腦科學與類腦研究中心達成了智能集群系統的相關合作。
不過,寒武紀仍然面臨著客戶集中的風險。
其在招股書中介紹,2017-2019年,前五大客戶的銷售金額合計占營業收入比例分別為100.00%、99.95%和95.44%,客戶集中度較高。若主要客戶大幅降低對其產品的采購量或者其未能繼續維持與主要客戶的合作關系,將給其業績帶來顯著不利影響。
據艾瑞咨詢測算,晶元銷售利潤一般在每顆幾美金,只有當產量達到千萬量級時,晶元定價才能覆蓋研發費用和晶元成本。
因此有分析稱,作為專用晶元,寒武紀找到如此大規模的特定應用市場並不容易,收入很可能不足以支撐研發,這可能也是寒武紀尋求上市的主要原因。
除此之外,寒武紀採用Fabless模式經營,供應商包括IP授權廠商、伺服器廠商、晶圓製造廠和封裝測試廠等。2017年-2019年,其通過代理商采購晶元IP、EDA工具、晶圓及其他電子元器件等。
2017年-2019年,該公司向前五名直接供應商合計采購的金額分別為1422.28萬元、20315.49萬元和36271.17萬元,占同期采購總額的比例分別為92.64%、82.53%和66.49%,佔比相對較高。
其中,晶圓主要向台積電采購,晶元IP及EDA工具主要向Cadence、Synopsys和ARM等采購,封裝測試服務主要向日月光、Amkor和長電 科技 采購,采購相對集中。
寒武紀提到,由於集成電路領域專業化分工程度及技術門檻較高,部分供應商的產品具有稀缺性和獨占性,如不能與其保持合作關系,該公司短時間內難以低成本地切換至新供應商。
此外,寒武紀表示,未來若供應商業務經營發生不利變化、產能受限或合作關系緊張,或由於其他不可抗力因素不能與該公司繼續進行業務合作,將對其生產經營產生不利影響。
本文系觀察者網獨家稿件,未經授權,不得轉載。
⑸ 2018年全球最值得關注的AI晶元初創公司
Wave Computing
Wave Computing在2018取得了不少進展,推出其第一個DataFlow處理單元,收購MIPS,創建MIPS Open,並將首批系統交付給少數客戶。雖然Wave架構有一些非常有趣的功能,但我們更期待用戶的大規模真實體驗反饋。
Wave不是插入到伺服器的加速器,它是用於圖形計算的獨立處理器。這種方法有利有弊。從積極的方面看,Wave不會受到GPU等加速器面臨的內存瓶頸影響。從消極方面來說,安裝Wave設備將是新的升級,需要完全替換傳統的X86伺服器,也讓其成為所有伺服器製造商的競爭對手。
我不認為Wave能從某個點擊敗NVIDIA,但該架構的設計的非常好,該公司已經表示它很快就會有客戶的反饋。
圖1:Wave是從上面顯示的4節點「DPU」構建的系統。Wave Computing
Graphcore
Graphcore是一家資金雄厚(融資3.1億美元,目前估值為17億美元)的英國獨角獸創業公司,擁有全球化的團隊。它正在構建一種新型的圖形處理器架構,其內存與其邏輯單元位於同一晶元上,這應該能夠實現更高的性能。該團隊產品的發布時間暫不明確,不過他們去年四月表示「幾乎准備好發布」了,12月的最新信息表明它將很快開始生產。
Graphcore的投資者名單令人印象深刻,包括紅杉資本、寶馬、微軟、博世和戴爾 科技 。
我了解了該公司的架構,它非常令人印象深刻。從邊緣設備擴展到用於數據中心的訓練和推理的「Colossus」雙晶元封裝。在最近的NeurIPS活動中,Graphcore展示了其RackScale IPU Pod,它在一個32台伺服器的機架中提供超過16 petaflops的算力。雖然該公司經常聲稱它將提供比同類最好GPU強100倍的性能。
Graphcore表示,4「Colossus」GC2(8晶元)伺服器可提供500 TFlops(每秒數萬億次操作)的混合精度性能。單個NVIDIA V100可提供125 TFlops,因此理論上4 個V100就可提供與其相同的性能。
與往常一樣,細節更能發現差別,V100峰值性能僅在重構代碼執行TensorCore的4x4矩陣乘法時才可用,這是Graphcore架構巧妙避免的限制。更不用說V100消耗了300瓦的電能和大量現金這一事實。
此外,Graphcore支持片上互連和「處理器內存」(片上存儲器)方法,可以得到超出TFlops基準所認可的優秀性能。在一些神經網路中,如Generative Adversarial Networks,內存是瓶頸。
再次強調,我們將不得不等待真實的用戶用實際應用程序來評估此體系結構。盡管如此,Graphcore的投資者名單、專家名單和台天價估值告訴我,這可能是一件好事。
圖2:GraphCore展示了ImageNet數據集處理的照片。 可視化可幫助開發人員了解其訓練處理佔用處理周期的位置。
Habana Labs
Habana Labs是一家以色列創業公司,去年9月在第一次AI硬體峰會上宣布它已經准備好推出其首款用於推理的晶元,其創紀錄的性能用於卷積神經網路圖像處理。結果顯示在Resnet50圖像分類資料庫中該處理器每秒分類15,000張圖像,比NVIDIA的T4高出約50%,功耗僅為100瓦。
在2018年12月,Habana Labs的最新一輪融資由英特爾風險投資(Intel Venture Capital)領投,WRV Capital,Bessemer Venture Partners和Battery Ventures跟投,該公司的融資也由此前的4500萬美元增加了7500萬美元。
據悉,Habana Labs新的融資將部分用於流片其名為「Gaudi「的第二款晶元,該晶元將專注於訓練市場,據稱可擴展到1000多個處理器。
其它創業公司
我知道世界上有超過40家公司在為人工智慧設計訓練和推理晶元。我發現大多數公司都在進行簡單的FMA(浮點乘法累加)和混合精度數學(整型8位和浮點16位和32位)。對此我不會感到驚訝,因為這種方法相對容易實現並且會獲得一些成果,但它不會為像NVIDIA,英特爾以及少數初創公司做出不一樣的架構提供持久的架構優勢。
以下是一些引起我注意的公司:
中國AI晶元初創公司
中國一直試圖找到一條擺脫美國半導體的方式,人工智慧加速器可能會提供它一直在尋求的機會。中國設定了2030年要建立一個價值數萬億美元的人工智慧產業的目標,自2012年以來,投資者已經向創業公司投入了超過40億美元的資金。
寒武紀 科技 估值為25億美元,是已經發布了第三代AI晶元的中國獨角獸公司。寒武紀稱它可以用更低的功耗提供比NVIDIA V100更好的AI性能,他們還銷售其AI IP,搭載在華為麒麟970和麒麟980的處理器當中,作為AI加速硬體。
商湯 科技 也許是估值最高的AI創業公司,以在中國推廣智能監控攝像頭而聞名。這些安防攝像頭數量超過1.75億,包括其他公司生產的攝像頭。商湯 科技 在香港成立,最近一輪融資數額達6億美元,由阿里巴巴領投。據報道,這家初創公司的價值目前為45億美元。
商湯 科技 與阿里巴巴、高通、本田甚至NVIDIA等主要公司建立了戰略合作夥伴關系。該公司今天擁有一台超級計算機,運行大約8000塊(可能是NVIDIA提供?)GPU,並計劃再建造5台超級計算機來處理數百萬個攝像頭採集的面部識別數據。
雷鋒網編譯,via forbes
⑹ 華為系高管終出走,「AI晶元第一股」寒武紀何以「隕落」
曾被投資者冠以「國內NPU第一股」的寒武紀因與華為合作關系的破裂而跌落神壇,如今公司核心技術人員梁軍也選擇出走。隨著這位「華為系」高管的出走,或意味著寒武紀與華為正式分道揚鑣。
寒武紀與華為的「聯姻」走向末路。
3月14日晚間,寒武紀發布了一項重磅的人事變動公告。公告稱,公司核心技術骨幹CTO梁軍由於「與公司存在分歧」,已於2月10日通知公司解除勞動合同,離職後,其不再擔任任何職務。
CTO梁軍被外界視為寒武紀與華為「聯姻」的重要紐帶,隨著梁軍出走,或意味著寒武紀與華為正式分道揚鑣。
一年多以前,寒武紀登陸科創板時曾備受矚目,首日股價漲幅一度超過300%,市值突破千億。然而不到兩年時間,被冠以「國內AI晶元第一股」名號的寒武紀迅速跌下神壇。
股東大幅減持、股價創出 歷史 新低、首席技術官出走……寒武紀,曾經風光無兩的獨角獸,怎麼了?
華為系梁軍出走, 「聯姻」正式破裂
「梁軍的離職不會影響公司的技術創新,不會對公司整體研發實力產生重大不利影響,雙方也不存在知識產權的糾紛,公司知識產權完整性不會受影響……」
盡管寒武紀用了一連串否定句對外積極表態,梁軍出走的消息還是重錘寒武紀。
梁軍辭任的消息發布後,次日,寒武紀股價收跌18.38%,市值蒸發超36億,總市值僅餘260.57億元。
公開資料顯示,梁軍於2003年加入華為,後成為海思的技術專家,負責過海思團隊在手機soc設計、網路晶元架構設計等,2017年從華為跳出後加盟寒武紀,任副總經理和CTO。
作為華為的舊部,梁軍在加盟寒武紀的第一年,寒武紀就與華為終端晶元展開IP授權,市場中有聲音指出,梁軍在這場合作中起到了至關重要的作用。
抱上華為「大腿」後,寒武紀的業績迎來了暴發式的增長,更為公司日後的上市打下基礎。
根據公司招股書數據顯示,2017年到2019年,寒武紀對華為海思終端智能處理器 IP 授權業務的銷售金額為 771.27 萬元、1.14億元和以及6365.80 萬元,佔到公司終端智能處理器 IP 授權業務銷售收入比例的 100.00%、97.94%和 92.56%。
值得注意的是,其中,2017和2018年度,寒武紀的主營收入里,終端IP佔比高達98.33%和99.69%。可以說,沒有華為,寒武紀的AI晶元的商業化進程不會走的如此順遂。
對於一家創業公司而言,業內泰斗的或關乎公司的生死存亡。或是為了留住梁軍,2020年12月,寒武紀曾經向梁軍授予了10萬股激勵性股票。根據協議,梁軍在離職後已獲授未歸屬的8萬股作廢失效,以公司當前的股價65.22元/股計算,這部分股票的價值在522萬元左右。
此外,梁軍手中持有的北京艾溪 科技 37.6%的股權,也需要按照一定的實繳成本疊加5%利息的回購價格,進行轉讓。 換言之,梁軍此番離職近乎凈身出戶。出於何種原因,竟讓這樣一位業界大拿選擇出走?
權宜之計,
「備胎」寒武紀慘遭拋棄
外部推測,在華為脫離寒武紀自研人工智慧晶元後,寒武紀已經成了華為的「棄子」,梁軍的出走實則是在寒武紀身上看不到出路而做出的自救行為。
在2019年的一場峰會上,寒武紀一位高管透露,寒武紀在和很多互聯網頭部企業做技術評測,其中包括快手、滴滴。 但一位曾在滴滴雲就職的業內人士表示,在他任職期間,雖然有合作,但實際上並沒有具體項目使用,因為產品「不好用」。
此外,寒武紀此前宣稱,其晶元在網路有落地。雖然該消息屬實,但根據業內人士的觀點顯示,網路所採用的晶元數量只有百塊左右量級,並未用在核心業務上。
「寒武紀技術上不弱,但是產品也談不上比傳統大廠更好。」大型互聯網公司這樣的客戶,第一訴求是安全穩定,為什麼放棄那些成熟晶元,而去用一個小公司、未經檢驗的晶元?一位業內人士如是說。
手中產品在商業化進程中頻頻遇困,寒武紀當初又是如何獲得華為青睞的?或者說,華為與寒武紀的合作從一開始便只是一個權宜之計?
2016年,寒武紀推出首款AI處理器Cambricon-1A,確立中國第一AI獨角獸公司的地位,彼時AI概念正風靡全球。
時隔不久,2017年,手機巨頭蘋果便將這項紅極一時的ai晶元技術搬到了即將發布的iPhone11身上。
華為自然不願在這場智能化的浪潮中落後,為了搶奪「全球首款內置獨立npu智能機」的名號,華為決定在麒麟970晶元中集成寒武紀的AI處理器IP。
只是,華為在此後的宣傳活動中卻一直淡化其AI處理器的出處,同時有跡象表明,華為採用寒武紀AI技術開發麒麟970的2017年, 華為海思一直與ARM合作研發基於ARM Trillinum框架的AI技術。
風險正在醞釀。華為海思在2018年發布了雲端及邊緣晶元,此後便一直致力於覆蓋數據中心、邊緣端及消費終端的全場景,而這恰巧也是寒武紀的業務線。這也意味著,未來在終端、雲端、邊緣端人工智慧晶元產品領域,華為海思與寒武紀的正面交鋒不可避免。
此後不久,2018年10月,華為宣布採取自主研發的「達芬奇架構」,2019年華為麒麟810處理器便搭載了自研AI晶元。
華為有了自己的AI晶元, 最直接的結果就是寒武紀2019年的業務結構發生了一次大換血,由華為撐起的ip授權業務的收入發生斷崖式下滑,寒武紀的主要收入來源變成了智能計算系統集成。
失去華為這個大客戶,對寒武紀而言,無疑是巨大損失,寒武紀也直言「公司短期內難以拓展一家在采購規模上足以替代公司華為的客戶。」
成也華為, 敗也華為
根據公司招股書數據顯示,2019年,寒武紀的終端智能處理器IP許可銷售收入在出現同比下滑, 僅為6877.12萬元,在主營業務收入中的佔比也下降至15.49%。而這個數字在2017、2018年分別為98.34%和97.63%。
此外,根據彼時公司披露的招股書顯示,公司科創板上市的募投項目中也並無任何IP研發的內容。
這也引得上交所的問詢,函中上交所要求寒武紀說明:「該部分業務的未來經營計劃以及可持續性,是否存在逐步放棄該部分業務的趨勢。」
要知道,僅僅過去了一年的時間,公司賴以生存的主營業務就已經成了食之無味棄之可惜的雞肋業務。
沒了華為業務的支撐,寒武紀只能另尋他路,而公司的第二大股東中科院成了不二的選擇。
2019年4月25日,珠海橫琴新區管委會與中科院計算機所簽訂合作協議,建設橫琴先進智能計算中心項目。
而這個項目則是代替了IP授權業務成了支撐公司的「脊柱」。除了橫琴項目之外,寒武紀2019年還簽約拿下了西安市西咸新區灃東人工智慧計算創新中心的項目。
比較公司2019年的財務數據以及珠海橫琴和西安灃東兩個政府IDC項目貢獻的業績體量後不難發現,在2019年這兩個項目為寒武紀貢獻了約80%的收入,其中橫琴項目貢獻了60%的收入。
這兩個項目雖然收入豐厚,但背後的關聯關系和地方引資招商的戰略考量因素,卻讓商業上的價值大打折扣。
一家晶元公司儼然成了一家idc承包「關系戶」,不過,在這兩個政府idc項目的滋養下,公司順利登陸A股市場。
只是登陸A股後,二級市場中的投資者對公司的高估值並不買單。公司自上市第四日觸及股價 歷史 高點297.77元/股後便開始一路回落。截止發稿,公司股價報66.25元/股,較最高價跌幅接近8成。
短期而言,公司的基本面也難言反轉。根據寒武紀發布的2021年度業績快報顯示,公司2021年營業收入為7.21億元,同比增長57.12%;同時歸母凈虧損8.47億元,上年同期歸母凈虧損4.35億元,同比擴大94.98%。
⑺ 獨家 | 寒武紀二代晶元發布在即,提前揭秘如何挑戰英偉達!
「初創公司要貿然打入雲端市場,簡直就是自尋死路」。
長久以來,雲端的數據中心市場被視為創業公司的禁地,因為英特爾、英偉達、AMD 等巨頭林立,競爭太過兇殘。
但近年來,雲計算勢不可擋,雲端晶元市場呈現爆發式增長,不乏勇者前來破局。
作為一家發源於中科院計算所、背靠多家「國字輩」資本、估值已經來到 30 億美金的硬核創業公司,寒武紀挑戰雲端市場的底氣十足。
2018 年 5 月,寒武紀發布首顆雲端 AI 晶元,並對外透露獲得中國前三大伺服器浪潮、聯想、曙光的訂單。據機器之心了解,滴滴、海康威視也已經成為寒武紀的客戶。
與此同時,寒武紀成數億美元 B 輪融資。據機器之心了解,目前寒武紀的估值約為 30 億美元,與今年 2 月完成 6 億美元融資後成為「全球最具價值的 AI 晶元公司」的地平線不相上下。
一年後,寒武紀二代晶元已經箭在弦上,這顆積蓄了中科院計算所研發實力四年之久的二代或將為行業帶來不小震盪。
機器之心獨家獲悉,寒武紀二代雲端晶元或將於本月公布,同時我們采訪到寒武紀技術研發相關知情人士、寒武紀雲端晶元客戶等多方信源,提前揭秘關於該顆晶元的細節亮點和核心技術。
這回有了中文名
據機器之心了解,寒武紀二代雲端 AI 晶元代號為「MLU270」,延續上一代晶元「MLU170」的 MLU(Machine Learning Unit)系列。今年初,寒武紀已經為旗下晶元注冊兩大中文商標名,分別是「思元」、「玄思」。綜上,寒武紀二代雲端 AI 晶元中文名為「思元 270」。
在今年的新品議程表上,雖然還名列有其他晶元,但「思元 270」及其板卡將會是重頭戲。這也表明寒武紀將從終端向華為等品牌商授權 IP 的模式,轉向主打雲端市場的晶元方案提供商。
在晶元架構方面,寒武紀二代晶元將從上一代的「MLUv01」升級為「MLUv02」。考慮到視頻數據正呈現爆炸性增長,成為數據中心的任務主流,寒武紀在「思元 270」里內建視頻解碼單元,瞄準海量的視頻處理市場專門配置。
據機器之心了解,寒武紀「思元 270」在今年年初研製成功,製程工藝方面明顯拋棄了此前終端市場的激進打法,選擇仍然沿用台積電 16nm 工藝,定位於「專注雲端訓練計算」。
對比兩大巨頭的主流雲端產品線,英偉達去年 9 月發布並已發貨的 Tesla T4 採用 14nm 工藝,AMD 去年 11 月發布的 Radeon Instinct MI60 和 MI50 採用 7nm 工藝,寒武紀這次似乎希望單純依靠技術路線取勝,不再如去年對於 7nm 工藝寄予厚望。
「讓英偉達難受」
在晶元性能方面,「思元 270」的性能參數有意向業界標桿英偉達 Tesla T4 看齊。
據機器之心目前了解到的情況來看,「思元 270」可支持 INT16/INT8/INT4 等多種定點精度計算,INT16 的峰值性能為 64Tops(64 萬億次運算),INT8 為 128Tops,INT4 為 256Tops。
對比 Tesla T4,FP16 的峰值性能為 65 Tops,INT8 為 130 Tops,INT4 為 260 Tops。
功耗方面,「思元 270」功耗為 75w,與 Tesla T4 持平。
但值得注意的是,這些「理論峰值」不過是紙面規格,真正實測水平相比理論峰值通常有一定縮水。據某大體量計算數據中心負責人,同時也是阿里雲早期核心技術研發人員李立表示,「T4 在實測過程中,75w 功耗維持不了多久就降一半頻率。」
據該負責人介紹,他在幾個月前已經拿到「思元 270」的具體規格和特性,「對比而言,第一代 MLU100 是試水,第二代 270 就聚焦多了,威力非常大,NV 後面會很難受。」
與此同時,該負責人還指出,「寒武紀的方案在某些領域可能不會特別好使,尚待觀察。」
核心技術解密
這里需要引入一對運算表示法的概念,整數運算(定點運算)與浮點運算。
它們是計算機計算中最為常用的兩種運算表示法,顧名思義,其差異就體現在整數和浮點上,加減乘除運算都是一樣的。
整數表示法,即所有位都表示各位數字,小數點固定;浮點表示法,則分成兩部分,階碼和尾數,尾數就是數字部分,階碼表示乘冪的大小,也就是小數點位置。所以浮點數在做運算的時候,除了對尾數做加減乘除,還要處理小數點位置。
基於兩種不同的運算表示法規則,導致面對同樣長度的整數和浮點運算,後者計算模式更為復雜,需要消耗更多的資源去處理,並且二者功耗差距通常是數量級的。 簡單來說,就是浮點運算佔用的晶元面積和功耗相比於整數運算器都要大很多倍。
但浮點運算又有其不可取代性。首先,定點表示法運算雖然直觀,但是固定的小數點位置決定了固定位數的整數部分和小數部分,不利於同時表達特別大的數或者特別小的數,可能「溢出」。
而浮點的精度雖然沒有定點大,但是浮點運算的小數點位置可以移動,運算時不用考慮溢出,所以科學計演算法一般都使用浮點。所謂「溢出」,指超出某種數據格式的表示範圍。
此外,具體到使用 GPU 做訓練,業界通常更傾向於浮點運算單元,主要是因為在有監督學習的 BP 演算法中,只有浮點運算才能記錄和捕捉到訓練時很小的增量。 由於訓練的部分模塊對精度要求比較高,所以通常必須是高精度的浮點運算,比如 FP32 才能搞定,FP16 都難。
綜上,雖然浮點運算相比定點運算在功耗、計算速度、性價比等方面都不佔優勢,但截止目前,浮點計算在雲端的訓練場景中仍具有不可替代的特性,並且以高精度運算為主。
那麼,如何在不增加晶元面積和功耗的前提下,如何大幅提升晶元做訓練的運算能力就成為雲端訓練晶元的主要研課題之一。
參考計算過程相對簡單的推斷計算思路,目前該領域的 AI 晶元多採用集成大量整數運算器或低精度浮點運算器。
面對計算過程更為復雜的訓練計算,業界一直在嘗試是否可能用性價比更高的定點運算器實現。「但這個問題在學術界也還沒有普適的解決方案。」王一說道。
李立表達了類似的觀點, 目前大家的研究熱點之一,就在於如何全部的定點單元(比如 INT8)代替浮點單元,或者以主要的定點單元配合少量的高精度浮點計算單元(比如 FP32)做更多的訓練任務,目的是達到定點計算的快速度,同時實現接近高精度浮點計算的精度。
談到目前該方向的研究成果和代表論文,李立表示,行業相關的研究文章已經有一些,不過都不具有普適性。
王一進一步向機器之心透露了關於實現低精度運算的「關鍵心法」,要做好低精度訓練,就要找到一個好的數據表示方法,既能表達最後大的數,又能讓 0 附近的小量能夠更好地表達,因此這個數據表示可能需要有自適應性,能隨著訓練的過程調整。
他還補充, 「低精度訓練確實未必要是浮點數,只要能把數域表達好,0 附近的小量表達好,什麼樣的數據表示都可以。」
綜上,寒武紀在大幅度提升訓練階段的計算功耗比方面,很有可能採用的是以整數為主的低精度運算,這在目前已公布的 AI 晶元項目中屬於首創。
實際上,寒武紀在計算機計算領域的開創精神和技術積淀由來已久。早在 2014 年—2016 年期間,寒武紀創始人兼 CEO 陳天石、陳雲霽兩兄弟的研究就基本奠定了神經網路晶元的經典設計思路,也就是現在常談到的 AI 晶元架構。
當時他倆的「DianNao 系列」論文橫掃體系結構學術圈: Diannao(電腦)是 ASPLOSཊ 最佳論文(亞洲第一次),DaDiannao(大電腦)是 MICROཊ 最佳論文(美國以外國家的第一次)……
而在大洋彼岸,美國兩家風頭正勁的 AI 晶元公司 Graphcore、GTI(Gyrfalcon Technology, Inc.)正是沿用了 DianNao 系列論文的基本思路,採用大量堆疊的簡單計算單元以實現復雜的雲端計算。(機器之心曾進行過相關報道,《一款晶元訓練推理全搞,Hinton 為其背書,Graphcore 完成 2 億美元融資》、《30 年前的「CNN 夢」在這顆晶元落地,能效比高出 Tesla10 倍 | CES 直擊》)
此外,要切數據中心市場的蛋糕,一套完備成熟的軟體生態也是其核心競爭力的重要體現。英偉達之所以能夠在雲端訓練領域成為絕對主流,其 CUDA 軟體生態的基礎功不可沒。
據機器之心了解,寒武紀從 2016 年起逐步推出了寒武紀 NeuWare 軟體工具鏈,該平台終端和雲端產品均支持,可以實現對 TensorFlow、Caffe 和 MXnet 的 API 兼容,同時提供寒武紀專門的高性庫,可以方便地進行智能應用的開發,遷移和調優。
「雲芯」之爭一觸即發
盡管前述了寒武紀的種種硬核技術護體、大資本和客戶加持,但想要真正在數據中心市場紮下根,以實現陳天石去年在發布會上談到的目標:到 2020 年底,力爭占據中國高性能智能晶元市場的 30% 份額,仍然面臨著異常殘酷的市場競爭。
整體上,英特爾在數據中心伺服器晶元市場仍然牢牢占據著的 95% 以上份額。
而隨著深度學習計算和人工智慧技術逐步興起的雲端訓練市場,同樣被巨頭絕對壟斷。目前 90% 以上的雲端加速採用英偉達 GPU,AMD、FPGA 占據非常小的份額,剩餘市場還在被國內外晶元創業公司不斷瓜分。
據機器之心了解,近期還有一家國內知名 AI 演算法公司將要入局雲端推理晶元市場。據德勤最新出爐的報道顯示,到 2022 年,全球人工智慧訓練市場的規模將達到約 170 億美元,雲端推理晶元市場的規模將達到 70 億美元。
可以預見,2019 年,AI 晶元之爭將從端燃及雲上,雲端的大體量、高增速市場勢必迎來更多強勁玩家。
(應采訪者需求,文中李立、王一均為化名。)
⑻ 寒武紀2021年收入增近六成 因研發投入高尚未盈利
寒武紀的產品包括通用型智能晶元及其基礎系統軟體的研發需要全面掌握核心晶元與系統軟體的大量關鍵技術,技術難度大、涉及方向廣,是一個極端復雜的系統工程,其中處理器微架構與指令集兩大類技術屬於最底層的核心技術。
招股書顯示,寒武紀尚未盈利主要是由於其設計的復雜計算晶元需要持續大量的研發投入所致。公司為確保智能晶元產品及基礎系統軟體平台的高質量迭代,在競爭激烈的市場中保持技術領先優勢,持續加大研發投入,積極引進優秀人才、保持公司研發團隊穩定,報告期內研發費用增長幅度較大。同時,公司2020年底及2021年實施的股權激勵計劃,導致本報告期按歸屬期分攤的股份支付費用顯著增加。此外,由於智能晶元的市場及下游應用場景正處於高速發展階段,公司積極發力市場推廣及生態建設,向客戶提供高質量的服務,積聚品牌效應,銷售費用有一定程度的增加。
Allied Market Research發布的研究報告預計,到2030年全球人工智慧晶元市場將達到1949億美元,復合年增長率為37.4%。而現在國外廠商仍占據AI晶元市場很大的市場份額。據Omidia的數據,英偉達大約占據了以人工智慧為中心的數據中心晶元市場的80%。谷歌、英特爾、賽靈思(被AMD收購)更是占據了一定的市場份額。
為了打破國外的技術壁壘,保持高研發經費和人才激勵是不少國內AI、晶元企業的通用做法,否則就可能在競爭中處於不利局面,但即便如此,晶元行業的人才流動依然頻繁。2022年3月15日,寒武紀發布公告稱其核心技術人員梁軍先生因與公司存在分歧,通知公司解除勞動合同。
寒武紀稱,雖然公司尚未盈利且存在累計未彌補虧損,預計未來仍可能持續虧損,將存在短期內無法向股東現金分紅的風險,將對股東的投資收益造成不利影響。但是,研發投入和對人才的股權激勵是立足於企業長遠發展而進行的投入,是支撐企業未來發展的基石。
寒武紀表示,2022年公司將繼續增強市場開拓力度,深耕行業客戶,加速場景落地,如依託「東數西算」等產業背景,並藉助前期人工智慧集群業務的優良口碑,積極拓展智能計算集群系統業務等。同時,也將持續研發投入,升級迭代智能晶元產品,完善開發者社區,繼續推動人才體系健全等。
編輯 陳莉 校對 趙琳