⑴ 億萬次桌面超級計算機有什麼概念
1997年6月TOP500排名中第一次出現Linpack測試超過萬億次(1 Tflops)超級計算機,8年後全球最快超級計算機TOP500排行榜入門門檻提高到1 Tflops,萬億次計算時代來了。
"Petascale"、"Petaflops"是當前在高性能計算機領域經常使用的兩個詞彙。所謂"Petascale"或 "Petaflops"是指每秒進行1000萬億次雙精度浮點運算,這是當前全球最快的超級計算機--安裝在美國能源部洛斯阿拉莫斯國家實驗室 (NASL)的IBM藍色基因/L系統的3.5倍。自1997年6月TOP500排名中第一次出現Linpack測試超過萬億次(1 Teraflops)超級計算機,到8年後全球最快超級計算機TOP500排行榜入門門檻1 Teraflops,我們說萬億次計算時代真正到了。
千萬億次的概念
實際上我們在談千萬億次超級計算機時必須要區分三點:一是系統理論峰值計算速度千萬億次;二是通常意義下全球TOP500排名中 Linpack測試峰值Pflops; 三是在實際應用中持續應用性能Pflops。我們在談到千萬億次計算時更多的是指在實際應用中持續應用性能超過千萬億次每秒。
TOP500中幾年來第1名和第500名均保持6~8年的時間,也就是說當今的第1名在6~8年後則排名到第500名,而8~10年後微處理器晶元就可達到本年度TOP第500名的浮點性能。當前,全球高性能計算機學術界及產業界都期待並預測2010年6月第一台Linpack測試峰值千萬春灶億次(Petaflops)計算機的出現,並期待8年後,也就是2018年,千萬億次超級計算時代的真正到來,也就是說千萬億次將是全球TOP500排行榜的入門門檻。
超級計算機一直是各國關鍵技術裝備之一,廣泛應用於國防、信息安全、石油勘探、氣象預報、生物制葯、工程模擬、科學計算、商業計算等領域,是各國戰略競爭的制高點。當前,全球各國都投入了巨大的人力物力進行研究。
第28次全球TOP500超級計算機系統排行榜地域分布,我們可看到,全球最快性能TOP500超級計算機大部分在美洲,歐洲和亞洲最快 TOP500超級計算機告森友之和也不敵美國。近年歐洲超級計算機比例有所下降,美洲則有所增長。歐洲和亞洲已勢均力敵,其佔有量英國和德國佔有優勢。襪槐在亞洲超級計算機佔有量日本占優勢,中國和印度正在奮力直追,但與美日相比,仍有較大差距。
各國的千萬億次之路
⑵ 計算機每秒千萬億次的運算速度是什麼概念
通俗點
還真不好說。
這么給你說看你能明白不能。
就是電腦里所有的東西比如,聽歌,看電影,下載,聊天,等等
所有所有的操作。都會轉化成0和1這兩個數。因為電腦就認識這倆數字。0和1就是所謂的二進制代碼。
比如。你用滑鼠在桌面上點一下。這個動作,發生後,某些代碼程序就開始吧你這個動作開始進行轉換。最終轉換成0和1,然後電腦計算後,知道你要執行的是什麼動作。然後才給你執行。
這樣說起來,你升敬衫可能會認為,這樣麻煩,為什麼平時沒感覺出來。感覺滑鼠一點,立刻就有相關動作了。呵呵
這就說到計算上面了。
1206億次運算,就是特指二進制下的0和1的運算。每秒能運算1206億次0和1的運算。比如0和1每秒相加1206億次。
呵呵,就我剛才的例子。要是運算慢了,你點一下滑鼠,不還得卡半天啊。因為運算不稿悄過來啊。呵呵
雙精度就不用多說了吧,就是小數點後面兩位
剛才說了,計算機只能進行整數運算。浮點運算就是實數運算。機器有吵腔兩種方法表示實數,一種是定點運算
一種是
浮點。定點就是小數點位置不改變。浮點就是小數點的位置不固定。
呵呵
我只能這么說了,是在通俗不了呵呵!
⑶ [高性能計算的三大研究領域]高性能計算領域的研究內容
科學計算、海量信息處理與檢索以及正在普及的多核個人計算機是高性能計算的主要研究領域,由於領域的不同,對於高性能計算各自都有不同的研究重點。 美國宇航局(NASA)是超級計算機最大的用戶之一
從起源來看,計算機系統的原始需求來自軍事,如第一台計算機ENIAC是美國軍隊為了計算彈道而投資研製的。在隨後的30年中,計大逗算機主要應用於與國家安全相關的領域,如核武器設計、密碼破譯等。到20世紀70年代末,高性能計算機開始應用於石油工業、汽車工業等資本密集型工業。隨後,高性能計算機開始廣泛進入各個行業,協助進行產品設計、用戶分析等等。如醫葯公司使用高性能計算機輔助進行葯物設計,可以大大節省新葯的研發開支; 超市使用高性能計算機分析用戶消費模式,以推出恰當促銷措施等等。在這些領域,更高的計算性能就意味著在產品和服務方面的競爭優勢。在科學研究領域,數值模擬方法成為現代科學方法的重要組成部分,這里更高的計算性能就意味著更快的科學發現速度。目前,高性能計算技術已成為促進科技創新和經濟發展的重要手段,是一個國家綜合國力的重要組成部分。本文將就高性能的幾個最重要的應用領域進行介紹。
用高性能計算機解決科學挑戰
許多重要的科學問題非常復雜,需要功能非常強大的計算機來進行數值模擬,這些問題被視作科學上的重大挑戰,可以分為如下幾類:
1. 量子化學、統計力學和相對論物理學;
搜純2. 宇宙學和天體物理學;
3. 計算流體力學和湍流;
4. 材料設計和超導;
5. 生物學、制葯研究、基因組序列分析、基因工程、蛋白質折疊、酶活動和細胞建模;
6. 葯物、人類骨骼和器官建模;
7. 全球天氣和環境建模。
這些重大世仿咐挑戰問題大多可以看作傳統的高性能計算應用的延伸,其特點是: 大部分是浮點密集型應用程序,並行演算法要求多個並行進程之間進行較為頻繁的通信和同步,而非簡單的多個計算用例之間的並行,因此無法使用多台規模較小的系統來替代一台大規模系統。
這些重大挑戰問題對計算能力的需求遠遠超出了現有的高性能計算機的性能。以量子化學計算為例,需要20T~100Tflops的持續計算能力才能夠對目前進行的實際實驗結果進行預測。在核聚變研究領域,需要20Tflops的持續計算能力才能夠進行全規模的系統模擬。蛋白質折疊的計算需要1Tflops的持續計算速度。另一方面,重大挑戰問題對數據的存儲也提出了更高的要求,以計算生物學為例,進行蛋白質分析時需要使用的一台質譜儀每天就可以產生100GB的數據,50台質譜儀1天就可以產生5TB的數據。
目前,世界上最快IBM BlueGene/L的處理器個數為131072個,Linpack速度為280.6TFlops,達到了其峰值速度的76.5%(2005年11月數據)。但一般並行演算法要比Linpack的通信更加頻繁,訪存局部性也沒有Linpack好,這使得其並行效率相當低,通常僅能達到系統峰值速度的10%,甚至更低。為了能夠有效地解決上述重大挑戰性的問題,需要研製千萬億次高性能計算機系統,這就需要攻克系統結構、軟體工具和並行演算法等多方面的難關:
1. 能耗控制
隨著現代處理器頻率的增加,其功率也大幅度增加,最新處理器的功耗已經超過100W。這使得高性能計算系統本身的耗電問題已經十分嚴重。同時由於系統散發的大量熱量,必須在機房中採用大功率的空調系統才能保持系統機房的正常溫度。這兩方面的因素造成系統的整體電能消耗非常巨大,維護成本很高。分析結果表明,未來系統主要的維護成本將來自系統的電能消耗。在研製千萬億次高性能計算機系統時,必須重視系統的能耗問題。
目前有幾種方法來處理系統能耗問題,一是給處理器設定較低的工作電壓,通過並行性來獲得高性能,例如BlueGene/L處理器的工作頻率僅有700Mhz,因此單個內核的處理能力遠遠低於其他高頻率的處理器。但BlueGene/L通過大量的處理器來彌補單個處理器能力的不足,達到了較高的整體系統性能,並獲得了優化的性能/能耗比。另一種方法是通過軟體和硬體感測器確定和預測需要使用的部件和不需要使用的部件,然後將不需要立即使用的部分通過某種措施,如降低頻率或完全關閉來減少其耗電量,從而達到降低整個系統功耗的目的。這方面的工作根據控制的粒度不同可分為晶元級、主板/BIOS級以及結點級。
2. 高性能計算軟體與演算法
大規模並行處理硬體系統僅僅為高性能計算提供了一個平台,真正的功能還要通過高性能計算軟體來完成。高性能計算軟體與演算法的主要工作可以分為3類:
(1) 提出具有較低理論復雜度或較好實際性能的串列演算法
盡管可以通過並行計算來加快運算的速度,但並行處理往往需要較大的軟體開發成本和硬體成本,因此在進行並行演算法的開發之前,必須考察是否存在可以解決問題的更好串列演算法。以整數排序問題為例,使用並行的冒泡排序演算法,其效果還不如使用串列的快速排序演算法。因此,高效的串列演算法研究是高性能演算法研究的重要課題。著名的演算法包括線性規劃問題的單純型法、FFT、快速排序、矩陣特徵值的QR演算法、快速多極演算法等。近年來在演算法方面的突破使印度學者在素數判定問題上提出了多項式復雜度演算法。
(2) 優化現有演算法
演算法只提供了理論上的性能,要在實際系統上獲得高性能,必須對演算法的實現進行優化。現代處理器大多使用多級Cache來隱藏訪存延遲,因此必須根據目標系統的Cache參數來優化演算法的訪存行為。此外,許多處理器還提供了SIMD指令,合理使用這些指令可以達到較高的性能。許多優化的數學庫,如ATLAS、Intel公司的MKL等已經為不同的體系結構,特別是Cache配置進行了特別優化,可以達到較高的執行效率,為優化演算法實現提供了很好的幫助。
(3) 並行演算法與並行應用的開發
並行演算法的研究與串列演算法有聯系也有區別。優秀的串列演算法並不一定適合並行化,某些時候在串列演算法中並非最優的演算法在並行實現時卻能體現出較大的優勢。對於千萬億次計算機而言,其處理器(核)個數在10萬以上,並行應用的並行度需要達到數萬個並行進程才能有效地利用千萬億次計算機。並行演算法的三個主要優化目標是: 通信優化、負載平衡以及最大化並行區。通信優化的目標是盡量減少通信次數和通信量,減少由於處理器之間通信帶寬限制引起的性能下降。在大規模並行程序中,負載平衡問題也非常突出,少數負載不平衡的任務會使得整體性能急劇下降。同樣的,根據Amdahl定律,應用加速比的上限是串列區所佔比例的倒數,即應用中1%的串列區域就會使得整個應用程序的加速比不可能超過100。因此,要在數萬個並行進程的情況下取得理想的加速比給並行演算法的開發提出了很大的挑戰。
3. 系統可靠性與可管理性
隨著系統內結點個數的增加,系統失效的可能性也隨著增大。並行程序的特點是只要有一個並行進程失敗,整個並行程序都執行不成功。對可靠性問題的處理方法之一是設法提高系統的穩定性,這包括硬體系統可靠性和軟體系統的可靠性。但目前公認的結論是: 大規模系統的故障是在設計時必須考慮的前提條件,而並非可以通過技術手段加以解決的問題。因此,必須考慮如何在系統結點出現故障的情況下仍然能夠保證系統服務質量不發生顯著下降。
故障監測技術和動態系統重構技術可以用來減少或消除系統失效對應用的影響,即盡快隔離出現問題的結點,使得用戶可以使用狀態正常的結點進行計算。與系統動態重構技術類似的技術還有系統動態劃分技術,主要用於向不同的用戶提供相互獨立的結點集,使得整個系統的管理和使用更加有效和安全。
但是上述技術僅能解決系統對新的應用的服務質量問題,無法保證已經執行的應用在某個計算結點出現問題後的處理。某些並行應用,如石油數據處理需要連續運行幾十天的時間,一旦某個結點出現錯誤,會使得前面的計算前功盡棄,需要從頭開始計算。並行檢查點技術主要提供應用級的容錯,即能夠自動地定期記錄並行程序的狀態(稱作檢查點),在計算過程中某個結點發生失效後,可以從所記錄的並行程序檢查點恢復執行,避免了重新執行整個程序。
高性能計算與海量信息處理
人類所產生的信息量以指數速度增長,如何存儲、檢索和利用這些信息為信息技術提出了重要挑戰。從20世紀90年代開始,互聯網的飛速發展給信息的傳播與服務提供了新的機遇。傳統的信息服務系統以資料庫為中心,典型應用是OLTP(事務聯機處理)。而以Google為代表的海量信息檢索與處理服務是另一類重要應用,以Google集群系統為代表的系統體現了高性能計算系統的另一個發展方向。
信息檢索與處理服務系統的特點與科學計算非常不同,對處理系統也提出了不同的要求:
1. 信息處理與服務應用需要頻繁訪問動態的數據結構,包含很多不可預測的分支,使得現有超標量處理器中的許多技術,如分支預測、數據預取、亂序和推測執行等功能無法很好地發揮作用,應用的指令級並行性較差。
2. 大部分信息處理與服務應用具有較好的數據並行性,可以很容易地在分布式系統上執行。以信息檢索為例,一個信息檢索請求可以被分配到多個伺服器上進行並行檢索,最後再將搜索結果統一處理返回給用戶。這個過程中大多數的訪問是只讀的數據,並行任務之間的通信非常少,並行效率比較高。
3. 系統的性能指標一般不以單個服務請求的響應時間為量度,而更關注系統整體的吞吐率。以搜索引擎為例,信息服務系統更重視在1分鍾內能夠完成的用戶搜索次數,而對單次搜索在0.5秒內完成還是1秒內完成並不特別敏感。
4. 系統需要很高的可靠性和可維護性。可靠性是對服務而言的,即組成的系統必須能夠近乎不間斷地為用戶提供服務。可維護性是指系統的更換與維修可以簡單快捷地完成,新更換的結點可以快捷地加入到系統中。
5. 低成本。這包括系統構建成本和總擁有成本兩部分。海量信息處理和服務所需的系統規模極為龐大,Google Cluster在2003年就達到了15000台計算機的規模。如此巨大規模的系統,需要盡可能地降低成本。
為了能夠有效滿足上述信息處理與服務系統的要求,人們對於如何高效地構建相應的服務系統也展開了研究與實踐:
1. 使用副本技術通過軟體提供可靠性
在大規模系統中,單個系統結點的失效是不可避免的。現有的通過冗餘底層硬體提高系統可靠性的方式,比如冗餘電源、RAID技術等,成本較高,性價比較差。相反,在信息服務系統中可以廣泛使用軟體提供服務級別的可靠性。主要的方法是採用副本,即將服務和數據復制到多個系統結點上,即使單個系統結點的可靠性不是很高,多個副本提供了服務所需的可靠性。另一個使用副本技術的優點在於其提高系統可靠性的同時也提高了系統的性能,即保存副本的多個系統結點可以同時向用戶提供服務。
2. 注重系統的性能/價格比
由於信息服務系統應用容易並行的特點,採用大量低端系統組合的方法比使用少量高端系統在性能價格比方面更具有優勢(此處所指的低端系統是指1~2個CPU的PC機或入門伺服器,高端系統是指大規模處理器伺服器,如HP 的Superdom伺服器、IBM的P690伺服器等)。此外,信息服務系統與用於科學計算的高性能系統面臨同樣的挑戰: 能耗問題。在大規模信息處理與服務系統中,電費成本(包括系統本身耗電和空調系統耗電)將佔有總擁有成本的很大一部分。因此,在選用系統時,應選擇性能/能耗比較高的系統也是一個重要的原則。
(3) 使用多內核處理器
由於信息服務程序的特點,它更適合使用多個簡單內核構成的處理器,這些簡單內核僅需要按序執行,並使用較短的流水線。由於信息服務應用的指令級並行度較差,按序執行不會造成太多的性能下降,但可以節省復雜的亂序執行單元電路,從而可以降低功耗。另一方面,較短的流水線可以降低分支預測失效的開銷。
並行計算與個人計算機
隨著半導體工藝的發展,單個晶元上能夠集成的元件個數還將在5~10年內遵循摩爾定律繼續以指數級增長。但是當前的晶元散熱技術已無法支持晶元頻率的進一步提高,而通過提高發射寬度、提高分支預測效率以及數據預取等進一步在體系結構上提高單線程執行速度的方法也逐漸失去了有效性。多內核晶元通過在一個晶元內集成多個處理器內核,採用線程級並行提高處理器性能,已成為微處理器的主要發展趨勢。IBM公司在幾年前就推出了雙內核Power晶元,Intel公司和AMD在2005年推出的雙內核晶元更是標志著多內核技術進入了普及階段。支持更多核心的處理器晶元也正在快速涌現,如Sun公司已經推出了8核的Nigeria晶元,用於面向提高吞吐率的伺服器應用; IBM則聯合索尼和東芝推出了面向娛樂應用的9內核Cell晶元。Intel公司甚至已經在計劃100內核以上的處理器。
多核處理器的出現給計算機的使用帶來了新的挑戰。隨著多內核處理器的普及,成千上萬的桌面電腦將成為並行計算機。目前在桌面機上執行的應用程序大多數是單線程程序,無法有效利用多內核處理器提供的能力。如何有效地在個人電腦上利用多個處理器內核成為高性能計算領域一個重要的研究課題,從目前的趨勢來看主要有以下幾個方向:
1.使用多任務帶來的並發性
Intel的 雙核ViiV家用電腦是這方面的典型例子。ViiV電腦的典型使用模式是一個人在客廳使用ViiV電腦看電影,另一個在自己的房間里使用同一台電腦玩游戲,兩個人使用同一台電腦中的不同處理器內核,從而達到了有效發揮雙核能力的目的。但這種依靠多個用戶同時使用一台電腦的模式具有很大局限性,因為家庭成員的個數是有限的,對於4內核以上的多內核處理器,這種模式無法提供有效的支持。
2.聚合多內核的能力,加速串列程序的執行速度
計算機科學家們正在研究一種稱作推測多線程(TLS: Thread-Level Speculation)的技術,該技術可以自動分析串列程序,推測其中能夠並行執行的部分,在多個內核上並行執行。但一旦發現並行執行的部分有沖突,就撤銷其中一個沖突線程的執行,執行補償操作並重新執行該線程。推測多線程技術的優點在於無需用戶干預就可以在多內核系統上加速現有單線程程序,其缺點在於對於性能提高的幅度有限,大約在4內核系統上僅能比在單個內核上提高性能30%,而且再增加內核數,其加速比也不會顯著增加。因此,這種方式也無法支持更多內核的處理器。
另一種有前途的技術是自動並行化技術。自動並行化技術可以在編譯時識別程序中的並行性,並將其轉化為多線程並行程序。過去的自動並行化技術主要是面向SMP系統的,但不是很成功,原因是對真實應用程序,自動並行化無法得到滿意的加速比。一個程序通過自動並行化在4 CPU的SMP系統上得到20%的加速比是不能令人滿意的,因為4 CPU的系統通常價格是單CPU價格的10倍以上,自動並行化無法提供性能價格比上的優勢。但是對於多內核系統,如果能夠在四內核系統上通過自動並行化得到20%的加速比,應該是比較令人滿意的結果,因為這些內核是「免費」提供給用戶的,即用戶無法用四內核處理器1/4的價格購買一個單內核處理器。因此,多內核處理器在家用電腦上的普及,將大大降低人們對自動並行化效果的期望,使得自動並行化技術重新被接受和應用。
3. 並行化現有的桌面應用
既然採用多內核處理器加速串列應用無法充分利用多內核處理器的能力,那麼並行化現有的桌面應用就成為了一個重要選擇。這方面的研究主要是分析現有的桌面應用,對有代表性的應用進行手工並行化,這些研究試圖回答下面的問題: 哪些桌面應用能夠被有效並行化,哪些不能?並行化本身的難度有多大?應如何改進現有的編程模型、編程工具以及系統軟體來更好地支持應用的並行化?
研究表明,桌面系統上的大部分應用,如圖像處理、3D圖形運算、多媒體數據編碼與解碼、數據與文本挖掘、文本與媒體搜索、游戲與博弈等都可以有效地被並行化,並在多內核系統上得到有效的執行。但是,手工程序並行化的開銷仍然很大,並行程序員需要了解並行計算的有關知識,並對計算機體系結構、操作系統、編譯原理等有一定了解才能寫出有效率的並行程序。並行編程模型與並行編程工具還需要提供更好的支持,以幫助並行程序員開發、調試並行程序。
今天,高性能計算技術已成為整個計算機領域的引領技術。多內核處理器的出現,使得並行計算技術將很快普及到我們的每台計算機,滲入到我們生活的方方面面,這是計算機產業發展史上的一個重大變革,對我國而言是一次難得的機會。在「十一五」期間,我國將進一步加強對高性能計算技術研究的支持,注重引導企業應用高性能計算技術促進產業升級和科技創新,同時更加特別重視高性能計算技術的教育培訓工作,在高校的理工專業廣泛開設並行程序設計課程,培養更多了解和使用高性能計算技術的人才,在此次變革中實現跨越性的發展。
作者簡介
陳文光
清華大學計算機博士,清華大學計算機系副教授,863高性能計算機評測中心副主任。曾任Opportunity International Inc.總工程師。主要研究領域為並行計算的編程模型、並行化編譯和並行應用分析。
鏈接:高性能計算發展趨勢
隨著應用的需求與計算機技術本身的發展,近年來高性能計算的發展體現出一些新的特點,可以用「大,寬,小」來代表這三個特點:
「大」是指高性能計算系統向更大規模發展,處理器個數可達10萬個以上,主要用於解決超大規模的數值模擬問題。
「寬」是指在傳統的數值計算之外,高性能計算系統正越來越廣泛地應用於信息處理和服務領域,為海量信息的存儲與檢索以及網路服務提供有效的保證。
「小」是指多內核CPU的出現和普及,將使得今後的每台個人計算機都成為並行計算機,如何有效地利用個人計算機的多個內核是對高性能計算技術提出的新挑戰。
⑷ 哪些國家有運行速度達千萬億次的超級計算機分別是什麼時候研發的,叫什麼
在11月份剛剛出爐的排行榜上,美國的「美洲豹」榮登榜首寶座,中國的「天河一號」名列第五位。
1. 美洲豹:「美洲豹」超級計算機系統隸屬於美國能源部,坐落於美國橡樹嶺國家實驗室。在本期排行榜上,它以每秒1.8千萬億次的運算速度超越「走鵑」而名列榜首,它的運算速度比「走鵑」快大約70%。「美洲豹」是一台民用計算機,將主要用於模擬氣候變化、能源產生以及其他基礎科學的研究。
2. 走鵑 :自2008年6月起到本期排行榜出爐之前,「走鵑」一直穩居TOP500排行榜榜首位置,它也是世界上第一台打破每秒千萬億次運算速度的超級計算機。「走鵑」位於美國新墨西哥州的洛斯阿拉莫斯國家實驗室,它也是一種IBM系統計算機,每秒運算速度可達1042萬億次。它採用了一系列專門針對游戲和商業的技術,包括用於索尼「游戲站3」的九核Cell處理器和AMD雙核皓龍處理器。因此,「走鵑」是全球第一台採用Cell處理器的混合式超級計算機。「走鵑」系統主要用於對美國核武器進行復雜而秘密的評估。
3. 海妖 :「海妖」超級計算機由美國田納西大學國家計算科學研究院所研製。「海妖」系統中擁有10萬個AMD雙核帶虛皓龍處理器,運算速度為每秒831萬億次,它主要用於一些高端伺服器或工作站中。「海妖」也是世界上由學術機構所擁有的運算速度最快的計算機。
4. 尤金 :「尤金」是歐洲運算速度最快的巨型計算機,曾經也名列全球排行榜第二名。它是由德國尤利希超級計算機中心所研製,採用的是IBM藍色基因/P型機設計方案,使用許多小型、低能耗的晶元。該方案中,每一個獨立處理器的最大運行速度為850兆赫判悔,甚至比普通家用電腦的處理速度都還要慢。但是,「尤金」巨型機總共擁有292000個處理器晶元,如此多的晶元使得它的整體運算速度高達每秒825萬億次。本圖拍攝於今年初,當時科學家們正在對其進行升級。
5. 天河一號 :「天河一號」是首次進入全球超級計算機500強排行榜。它是中國首台千萬億次超級計算機系統,其系統峰值性能為每秒1206萬億次雙精度浮點運算,Linpack測掘行正試值達到每秒563.1萬億次。「天河一號」是由天津濱海新區和國防科技大學共同建設的國家超級計算機天津中心所研製,它的運算速度是中國此前最快的超級計算機的四倍多。在「天河一號」中,共有6144個Intel處理器和5120個AMD圖像處理單元(相當於普通電腦中的圖像顯示卡)。「天河一號」將廣泛應用於航天、勘探、氣象、金融等眾多領域,為國內外提供超級計算服務。
⑸ 曙光5000的創新
曙光5000方案中的創新點很多,現簡要描述以下三點信數。
1、在世界上首次提出既能應對千萬億次科學計算又能十分有效地支持能力計算(utility computing)、應用面廣的HPP體系結構(Hyper Parallel ProCESsing)。
高效能超級計算機的主要用途有兩種,一種是以最快的計算速度解決某個領域的科學問題,如IBM的BlueGene主要適用於解決蛋白質折疊計算;另一種是用於計算中心或數據中心的能力服務,即能有效地提供大量用戶需要的計算、存儲和I/O能力。迄今為止,全世界還沒有一種高效能超級計算機能較好地滿足這兩方面的要求。這是因為不同的應用需要不同的體系結構。
國外已有和正在研製的高效能超級計算機的體系結構的基本思路主要是大規模並行機(MPP)、機群(Cluster & Constellation)和分布式共享存儲(NUMA)三種,不管採用哪一種都有局限性。曙光5000准備採用的HPP體系結構是計算所、曙光公司和多位國外著名學者反復研討後提出的一種標新立異的結構。HPP是具有全局地址空間和三級並行的分布式系統,即片內是可擴展通用多處理器核並具有寄存器傳輸級通信機制;通過三層高速互聯實現片內、節點內、系統三級並行;具有全局共享地址空間,通過節點內和節點間兩級互連構罩坦賣成分布式系統;支持多通道並發的核到核通信;節點操作系統具有單一系統映像,並保持節點獨立性;有效支持「多線程分割全局地址空間」編程模型。
通過實現以上獨創技術,可以得到以下前所未有的好處:
(1)基於HPP體系結構,可通過虛擬化技術使曙光5000體現不同體系結構的優點,從應用的角度看,它既可以是MPP,也可以是Cluster或NUMA結構的計算機系統,顯著地擴大了應用范圍;
(2)曙光5000能有效地支持能力計算這一計算中心和大企業需要的新型計算模式,能根據用戶的需求動態地調度和優化利用計算機資源;
(3)曙光5000緩解了大規模可擴展和編程困難的矛盾,既增強了高效能計算機的可擴展性,又實現了全局共享地址空間,一定程度上克服了目前的分布式機群系統編程難的瓶頸,而且使目前商用機群上的大量應用軟體可以兼容運行;
(4)目前IBM BlueGene、Cray XT4、NEC ES等高端計算機技術下移至中低端系統時缺乏競爭力,而通過採用HPP體系結構,不但千萬億次計算機具有極高的性能價格比和性能功耗比,而且向下輻射做百萬億次甚至幾萬億次計算機時都有很強的競爭力,十分有利於產業化。以上這些創新點國際上千萬億次計算機研製中還沒有看到,如果這些設計都能得到有效實現,曙光5000很有可能在一些方面處於世界領先水平。
2、創新的設計主要體現在三款核心晶元上,曙光5000具有(百)千萬億次計算機的實實在在的自主知識產權。
從曙光一號到曙光4000,計算所和曙光公司在高效能超級計算機的研製過程中,曾設計、流片過Wormhole Routing等關鍵晶元,但基本上沒有量產。目前大量銷售的曙光高性能計算機的各種晶元幾乎都是進口的,CPU等晶元佔到高端計算機成本的80%以上。曙光5000與過去我們研製的高端計算機的重要區別是,(百)千萬億次計算機的三款物逗核心晶元都將由計算所和曙光公司自己設計。
這三款核心晶元是:龍芯多核CPU,連接一塊板上多個CPU的系統控制器(System Controller),和連接各節點的交換晶元(Switch)。這三款核心晶元難度都很大。如果能按計劃如期完成,我們可以十分自信地宣布,中國已完全掌握了高效能超級計算機設計的核心技術。
在我們的研製計劃中,這些晶元不是仿製國外的晶元,必須要按照HPP體系結構的要求獨立設計,包含許多原始創新:例如:我們爭取在世界上首次實現CPU內多核之間的寄存器級(RTL)數據傳輸機制,使得CPU內通信速度有可能超過計算速度,從根本上消除通信瓶頸;系統控制器和交換晶元中內置可直接定址的Test & Set硬體鎖,可顯著提高進程間同步的效率,硬體「同步」也會大大提高並行應用同步的效率;利用全局地址空間實現「賦值」式通信,降低CPU中核與核之間的通信延遲;利用多層網路提高了多核與多核之間並發數據交換的聚合帶寬和吞吐率,打破通信壁壘等等。
必須指出,研製(百)千萬億次計算機在工程實現上難度很大,不同於一般的科研課題。曙光5000必須解決一系列世界性難題:如千萬億次計算機的全系統模擬器;高頻數字模擬混合、光電混合信號;多核心(Kernel)操作系統容忍單個處理器故障,能夠支持節點之間的隔離性;對消息傳遞機制和全局地址空間兩種並行計算模式同時提供有效支持;上千個客戶端在多用戶並發訪問模式下保持穩定的I/O性能;改造現有演算法並利用並行編譯技術使應用與千萬億次計算機的體系結構相適應,以達到數萬個處理器的可擴展性等等。這些都是國際學術界和企業共同面對的難點。我國在工程技術上與國外還有較大的差距,掌握這些技術還需要我們付出艱苦的努力。
3、曙光5000創新技術還體現在低成本、低功耗和低佔地面積方面,曙光5000在單位性能的成本、功耗和佔地面積上的目標是瞄準世界領先水平。
龍芯多核CPU在可擴展多核結構、多指令集支持以及在低成本和低功耗的基礎上獲得高效能等方面有獨特的優勢。如果全部採用龍芯多核CPU,曙光5000在成本上將有極大的優勢。即使只採用一半龍芯多核CPU,另一半用國外CPU晶元(曙光5000的體系結構具有很大的靈活性,也可以支持其他主流CPU,不限於龍芯CPU),成本上也有較大優勢,比國外正在研製的千萬億次計算機成本要低得多。
曙光5000計劃分兩期進行,在2008年通過一台百萬億次曙光5000A系統、一台數萬億次原型機、一個模擬器分別驗證曙光5000在軟體、硬體、體系結構上的創新,在2010年推出千萬億次曙光5000L系統。
曙光5000在滿足國家千萬億次高效能計算機的戰略需求的同時,還要將關鍵技術輻射到企業伺服器、個人高效能計算機(萬億次)、箱式高效能計算機(十萬億次)、可擴展高效能計算機(百萬億次)等多種產品形態,到「十一五」末高效能計算機平均每萬億次的硬體成本要比曙光4000A時降低30倍,使得國產品牌高效能計算機的銷售量增加8-10倍,達到每年4000台以上,大大提高國內品牌高效能計算機的市場競爭力,有力地促進高效能計算機在中國的普及。
⑹ 大數據時代十大熱門IT崗位_大數據崗位有哪些
大數據時代十大熱門IT崗位
大數據時代十大熱門IT崗位,新的想法誕生新的技術,從而造出許多新詞,雲計算、大數據、BYOD、社交媒體、3D列印機、物聯網在互聯網時代,各種新詞層出不窮,令人應接不暇。這些新的技術、新興應用和對應的IT發展趨勢,使得IT人必須了解甚至掌握最新的IT技能。另一方面,雲計算和大數據乃至其他助推各個行業發展的IT基礎設施的新一輪部署與運維,都將帶來更多的IT職位和相關技能技術的要求。
毫無疑問,這些新趨勢的到來,會誕生一批新的工作崗位,比如數據挖掘專家、移動應用開發和測試、演算法工程師,商業智能分析師等,同時,也會強化原有崗位的新生命力,比如網路工程師、系統架構師、咨詢顧問、資料庫管理與開發等等。下面分別為大家介紹著十大IT技能所體現的工作崗位:
一、演算法工程師
何萬青博士曾經介紹把一件事做快做好的三種方法,其中就提到過「提高流水線效率、更好的演算法和更短的代碼關鍵路徑。」可以看出演算法在系統效率中的轎碰重要地位。演算法是讓機器按照人類設想的方式去解決問題,演算法很大程度上取決於問題類型和工程師對機器編程的理解,其效率的高低與演算法息息相關。
在數學和計算機科學之中,演算法(Algorithm)為一個計算的具體步驟,常用於計算、數據處理和自動推理。在大數據時代,演算法的功能和作用得到進一步凸顯。比如針對公司搜索業務,開發搜索相關性演算法、排序演算法。對公司海量用戶行為數據和用戶意圖,設計數據挖掘演算法。
演算法工程師,根據研究領域來分主要有音頻/視頻演算法處理、圖像技術方面的二維信息演算法處理和通信物理層、雷達信號處理、生物醫學信號處理等領域的一維信息演算法處理。另外數據挖掘、互聯網搜索演算法這些體現大數據發展方向的演算法,在近幾年越來越流行,而且演算法工程師也逐漸朝向人工智慧的方向發展。
二、商業智能分析師
演算法工程師延伸出來的商業智能,尤其是在大數據領域變得更加火熱。IT職業與咨詢服務公司Bluewolf曾經發布報告指出,IT職位需求增長最快的是移動、數據、雲服務和面向用戶的技術人員,其中具體的職位則包括有商業智能分析師一項。
商業智能分析師往往需要精通資料庫知識和統計分析的能力,能夠使用商業智能工具,識別或監控現有的和潛在的客戶。收集商業情報數據,提供行業報告,分析技術的發展趨勢,確定市場未來的產品開發策略或改進現有產品的銷售。
商業智能和邏輯分析技能在大數據時代顯得特別重要,擁有商業知識以及強大的數據和數學分析背景的IT人才,在將來的IT職場上更能獲得大型企業的青睞。不過這些技能並不是一般人都能掌握的,一些公司目前正在招聘統計學家並教授他們有關技術和商業的知識。
三、數據挖掘工程師
數據挖掘工程師,也可以叫做「數據挖掘專家」。數據挖掘是通過分析每個數據,從大量數據中尋找其規律的技術。數據挖掘是一種決策支持過程,它主要基於人工智慧、機器學習、模式識別、統計學、資料庫、可視化技術等,高度自動化地分析企業的數據,做出歸納性的推理,從中挖掘出潛在的模式,幫助決策者調整市場策略,減少風險,做出正確的決策。
數據挖掘專家或者說數據挖掘工程師掌握的技能,能夠為其快速創造財富。當年亞馬遜的首位數據挖掘工程師大衛·賽林格(DavidSelinger)創辦的數據挖掘公司,將類似於亞馬遜的產品推薦引擎系統銷售給在線零售和廣告銷售商,而這種產品推薦引擎系統,也成為亞馬遜有史塌帆中以來最賺錢的工具。數據挖掘的價值由此可見一斑。
四、咨詢顧問(專家)
任何業務部門和任何行業企業,都有IT系統在背後默默無聞地支撐著。在雲計算大數據時代,業務面臨的挑戰和機遇也會給IT系統帶來更多要求。在這種情況下,IT系統的規劃部署和運維,都要有更為精通的專業人士才能勝任,並滿足面向未來大數據分析、雲計算服務應用的需要。
紐約蒙特法沃醫療中心(center)的副主席傑克-沃夫(JackWolf)曾經表示,他尋求不僅會建立和使用系統而且還會給予其他員工技術支持的新員工,他說:"新的系統意味著你必須有更多的咨詢台來處理更多的咨詢量。"當然,這里體現的主要是某個系統的技術支持的功能,但管中規豹我們不難發現,無論是部署初期的物料采購還是運維過程中的金玉良言,都凸顯出這種技術咨詢顧問的重要性。
五、網路工程師
網路工程師可以說是一個「綠色長青」的職業,網路技術一直以來就處於團山急需之中,美國人力資源公司羅勃海佛國際(RobertHalf)第三季度IT招聘指數和技能報告指出,網路管理占總需求技能排名中的第二位。對於雲計算時代來說,網路在雲資源池中(計算、存儲、網路)更是扮演著更為重要的作用。
另一方面,IPv6標准、物聯網、移動互聯等蓬勃發展,使得對於網路工程師尤其是新型網路工程師(移動、IPv6、雲計算方向)的人才和技能要求也越來越多。網路工程師也因此而可以細分成多個發展方向,相應的技能要求其側重也有所不同。比如網路安全、網路存儲、架構設計、移動網路等等。
六、移動應用開發工程師
移動應用開發,會隨著移動互聯網時代的到來變得更受追捧。截至2012年底我國已經有10億手機用戶,移動智能終端用戶超過4億,在移動支付、移動購物、移動旅遊、移動社交等方面涌現了大量的移動互聯網游戲、應用和創業公司。
移動平台智能系統較多,但真正有影響力的也不外乎iOS、Android、WP、Blackberry等。大量原來PC和互聯網上的信息化應用、互聯網應用均已出現在手機平台上,一些前所未見的新奇應用也開始出現,並日漸增多。
移動應用開發,由於存有多個平台系統,因此不同的平台開發者其所面臨的機遇和挑戰也不盡相同。一個很明顯的例子就是,當初由Google公司和開放手機聯盟領導及開發的基於Linux的安卓系統,在開源之後就給廣大開發者(商)帶來巨大商機,而堅定選擇iOS平台的的開發工程師,也通過蘋果生態系統的不斷擴建和智能設備的高市場佔有,使得較早的一批開發者都賺得盆滿缽滿。不過在國內由於用戶習慣、產業環境和版權保護的問題,移動應用開發者並沒有因此而獲得相應的收益。
七、軟體工程設計師
近年IT業界逐漸涌現出一股軟體定義網路(SDN)、軟體定義數據中心、軟體定義存儲(SDS)和軟體定義伺服器(MoonShot)等浪潮,大有軟體定義未來一切IT基礎設施的趨勢。
PaaS、SaaS、數據挖掘和分析、數據管理和監控、虛擬化、應用開發等等,都是軟體工程師大展身手的好舞台。相應的,這些技術領域也對軟體工程師的要求會更高,尤其是虛擬化和面向BYOD、雲計算、大數據等應用的開發和管理,都需要有更高深的技術支撐。
和演算法工程師有點類似的地方在於,軟體工程師也需要注重設計模式的使用,一位優秀的工程師通常能識別並利用模式,而不是受制於模式。工程師不應讓系統去適應某種模式,而是需要發現在系統中使用模式的時機。
八、資料庫開發和管理
資料庫開發和管理在大數據時代顯得尤為重要,相關的資料庫管理、運維和開發技術,將成為廣大BI、大型企業和咨詢分析機構特別看重的技能體現。代表著更多類型(尤其是非結構化類型)的海量數據的涌現,要求我們實時採集、分析、傳輸這些數據集,在對基礎設施提出嚴峻挑戰的同時,也特別強調了資料庫開發和管理人員的挑戰。
比如分布式的、面向海量數據管理的資料庫系統之一NoSQL,就是面向大數據領域的非關系型資料庫的流行平台,高可用、大吞吐、低延遲、數據安全性高等應用特點成為了很多企業的看重的特點,並希望有足夠多的優秀IT開發人員深度開發NoSQL系統,解決對存儲的擴容、宕機時長、平滑擴容、故障自動切換等問題的困惱。
另外,更為知名的Hadoop分布式資料庫HBase的數據管理,需要藉助HRegion、HMaster、HClient組成的體系結構從整體上管理數據。這些也都需要有對Hadoop深刻理解和業務的精通才能勝任。而除此以外的大數據的存儲管理、內存計算、包括基於這些應用上的平台開發等等,也得會越來越受市場歡迎。
九、系統架構師
去年三星首席系統架構師吉姆·莫加德(JimMergard)跳槽至蘋果,屬於近期比較大的系統架構師人事變動,這種變動也說明了當今對於系統架構師的高度重視和認可。
眾所周知,雲計算和大數據的出現,使得傳統的數據中心基礎設施難以勝任;另一方面,日益激烈的市場競爭和移動互聯等商機的出現,勢必會給企業業務帶來深刻變革。這種變革和IT架構轉型,都會牽扯到IT系統架構這個核心問題。相比之前介紹的那些IT技能和所對應的崗位,系統架構師的規劃部署能力顯得尤為重要,它牽扯的是整個面而不是某個領域某個點的痛點。
十、系統安全師
同樣的,網路、計算、存儲還是系統架構,也都需要關注安全問題,而安全在現在的雲計算環境下,個人隱私和企業敏感數據的保護也不斷被強化。
在當前很多企業都收縮IT安全預算開支後,還不斷面臨著增強的合規要求等問題。企業們都在考慮是否應當將某些IT運營交給雲端服務提供商處理。實際上,每個人都深感壓力,預算不夠地情況下還要盡力防護數據地安全,特別是中小型企業,這也就意味著企業需要將部分IT運轉外包給第三方以減少資金和人力方面地投資。
即使不採用外包的形式,無論個人還是企業都會更加註重安全,因為「安全」本身是沒有行業限制和劃分的,尤其是企業在構建雲計算環境、提交或者收集海量數據進行處理分析、存儲和傳輸等等一系列環節,都會面臨新的挑戰。這種挑戰勢必會需要有更多更專業的技術人才幫助解決這些問題。相比傳統來說,系統安全師將更多的會結合具體的業務展開,而根植於系統平台和底層基礎設施的系統安全,則更多的會出現在運營
⑺ 天河二號超級計算機的應用領域
天河二號已應用於生物醫葯、新材料、工程設計與模擬分析、天扒寬氣預報、智慧城市、電子商務、雲計算與大數據、數字媒體和動漫設計等多個領域,還將廣泛應用於大科學、大工程、信息化等領域,為經濟社會轉型升級提供重要支撐。
天河二號逐步在生命科學、材料科學、大氣科學、地球物理、宇宙、經濟學,以及大型基因組組裝、基因測序、污染治理等一系列事關國計民生的大科學、大工程中「大顯身手」。此外,國家超算廣州中心積極推動國際交流與合作,利用天河二號為國外研究機構提供高性能計算服務。
據悉,科技部近年不斷加大對超算應用軟體研發的投入。「十二五液此搜」以來的相關研發投入已超過2億元。預計「十三五」期間投入將進一步加大。
根據該專項「面向大規模科學計算的高性能多核CPU」課題計劃安排,2011年中國將採用FT-1500CPU構建全自主國產千萬億次計算機——「天河二號」。
藉助天河二號的「計算神功」,國產C919大型客機開展了高精度外流場氣動計算;中科院上海葯物研究所開展了75萬個小分子化合物的結合親和力評估,完成了600多個各類葯物的體內外活性測試評價。天河二號適配了廣州市電子政務數據管理系統和雲盤存儲系統鬧歷等,為智慧城市建設搭建高效可靠的承載平台……
⑻ 雲計算中心的中國國家超級計算中心
現有國家級的雲計算中心5家:
天津雲計算中心(2009年)
國家超級計算天津中心是由國家科技部於2009年5月批准成立的第一家超算中心,由天津濱海新區和國防科技大學共同建設。
天津超算中心座落在天津經濟技術開發區(泰達)外包服務園5號樓,佔用房屋面積約8,500平方米,共建有2個大型機房共約4,000平米,其中一個機房用於安放「天河一號」超級計算機,第二個機房用於雲計算和系統擴充。另外建有變電站、製冷站,變電站供電能力為13,600KVA,製冷站供冷能力為9,600KW,具有較強的配套保障能力。
天津超算中心的主業務計算機是 「天河一號」超級計算機,是由科技部863計劃「高效能計算機及網格服務環境」重大項目支持,由國防科技大學與濱海新區於2009年9月聯合研製成功第一期系統;後經採用自主CPU和自主的高速互聯通信系統,以及全面優化,於2010年10月,研製完成了「天河一號」二期系統。「天河一號」超級計算機在2010年11月世界超級計算機Top 500排名中榮獲世界第一。
天津超算中心高性能計算的主要應用領域包括:生物醫葯、石油地震勘探數據處理、動漫與影視渲染、新材料新能源、高端裝備設計與模擬、航空航天、流體力學、天氣預報、氣候預測、海洋環境模擬分析等等。 2009年5月批准成立,2011年6月安裝調試,同年11月,超算中心投入運行啟動儀式;2012年6月,正式向社會提供高性能計算業務的商業服務;截止至2014年5月,計算資源使用率已超過55%,高性能計算用戶達到1,056個,雲計算個人用戶超過1,750,000人,機構達到13,221家。
國家超級計算深圳中心(深圳雲計算中心)是國家在深圳布局建設、深圳建市以來單個投資額最大的重大科技基礎項目。該項目是國家863計劃,廣東省和深圳市重大項目,同時也是深圳落實《珠江三角洲改革發展規劃綱要(2008-2020)》和《深圳市綜合配套改革方案》的具體行動。
國家超級計算深圳中心(深圳雲計算中心)主機系統於2010年5月經世界超級計算組織實測確認,運算速度達每秒1,271萬億次,排名世界第二。同時配備高達17.2PB的海量存儲及來源於各大運營商、教育網的豐富網路帶寬資源。
深圳市建築工務署介紹,超算中心的土建工程相對復雜,機房樓精密空調、冷水機組、冷卻塔、高低壓櫃等設備安裝量是相同面積普通建築的10倍,工程配置了光纜30公里,6類網線200公里,大樓內強電電纜達15公里。超算主機等設備冷卻水日用水量超過1,000立方米,接近一個標准游泳池容量。超算中心採用不間斷電源為主機供電,僅電池就有2,874組,相當於2.3萬塊汽車蓄電池總容量。工程自2010年9月進場施工,實際工期僅一年零三個月。
國家超級計算深圳中心(深圳雲計算中心)立足深圳、面向全國、服務華南、港、澳、台及東南亞地區,開展各種大規模科學計算和工程模擬、動漫渲染等計算業務,同時以其強大的數據處理和存儲能力為社會提供雲計算服務,將建成功能齊全、平台豐富、高效節能、國際一流的高性能計算研究開發中心和雲計算服務中心 。 國家超級計算長沙中心2011年試運行,2014年11月4日,揭牌正式運營 。繼天津和深圳之後獲批建設的第三家國家級超級計算中心。與國內其他超級計算中心不同的是,長沙超算中心完全依託高校運營。
選址:湖南大學校區內,採用國防科技大學「天河一號」高性能計算機,按每秒1000萬億次運算能力規劃建設,總投資7.2億元。國家超級計算長沙中心一期工程規劃建築面積30000平方米,計劃於2011年底全部建成竣工,建成後運算能力將達每秒300萬億次,由湖南大學負責運營,國防科技大學提供計算設備和技術支持,堅持公益性與經營性相結合原則,為社會和公眾提供高性能計算應用服務。
該中心自2011年試運行以來,已為氣象、國土、水利、衛生/醫療、交通等公共服務部門提供了高性能的計算平台服務。該中心與國內高性能計算、雲計算和動漫渲染領域機構建立了戰略合作關系,已在省內外一些大型企業平台進行試用,正式運營後,將面向全國裝備製造企業提供大規模模擬設計公共服務。
於2010年11月奠基開工,按照「政府主導、軍地合作、省校共建、市場運作」的模式積極推進項目建設。項目主機設備於2011年6月在國防科大全面上網試運行,項目主體建築工程於2013年7月竣工一次驗收合格,同時,主機設備從國防科大搬遷至湖南大學新址,並完成安裝調試,已具備了正式啟動運營的基本條件。 國家超級計算濟南中心是科技部批准成立的全國4個千萬億次超級計算中心之一,總投資6億元,建設主體為山東省科學院,並由其下屬單位山東省計算中心負責建設、管理和運營。
濟南中心於2011年3月正式啟動建設,當年10月27日落成揭牌並對外提供計算服務。濟南中心的建設成功,標志著我國已成為繼美國、日本後第三個能夠採用自主處理器構建千萬億次超級計算機系統的國家。經國家權威機構測試,濟南中心的神威藍光超級計算機系統持續性能為0.796PFlops(PetaFlops,千萬億次浮點運算/秒),LINPACK效率為74.4%,性能功耗比超過741MFlops/W(百萬次浮點運算/秒·瓦),組裝密度和性能功耗比居世界先進水平,系統綜合水平處於當今世界先進行列。
濟南中心依託山東省科學院組建了一支集技術研發、計算服務和技術支持於一體的科研和服務團隊,並與國內外專家、應用單位等密切合作,面向海洋科學、現代農業、油氣勘探、氣候氣象、葯物篩選、金融分析、信息安全、工業設計、動漫渲染等領域提供計算和技術支持服務,承接國家、省部等重大科技或工程項目,為我國科技創新和經濟發展提供平台支撐。中心定位:公益性高性能計算技術和咨詢服務機構。 北京超級雲計算中心位於北京懷柔雁棲經濟開發區,由北京市和中科院合作共建,於2014年6月宣布將正式對外提供超級雲計算服務。
北京超級雲計算中心一期提供每秒300萬億次計算能力,2015年的計算能力將達每秒2000萬億次。中科院超級計算中心主任遲學斌表示,該中心的成立將進一步深化中科院與懷柔區的合作,並加快中科院高精尖成果在懷柔區的轉化落地。 呂梁雲計算是在國家推動軍民融合深度發展的背景下,國防科技大學和呂梁市人民政府結合優勢特色首批重點建設項目,按照山西省委書記王儒林提出的「呂梁雲計算中心立足呂梁,服務山西,輻射全國 」的總要求,打造面向全國的高性能計算平台、面向山西及周邊省份的雲服務平台和面向華北地區的數據容災備份中心,服務於地區的科學研究、經濟建設、政府公共管理和信息安全,將逐步成為中西部地區科學創新、產業轉型的重要IT基礎設施。中心部署的業務主機為「天河二號」,該主機系統採用國防科大自主研製的CPU和操作系統,運算速度為3280萬億次/秒。伺服器集群系統包括1216台X86伺服器集群和4096個飛騰伺服器。中心現有存儲總容量為7PB,未來將擴展到10PB;在網路保障方面,中心接入聯通、電信、移動、教育網四線網路,並依託運營商直接接入國家西北地區骨幹網,獨享帶寬可最大拓展到50G。整體來說,呂梁雲計算中心具備高配置硬體及先進的雲計算技術,計算能力強、存儲空間大、網路接入能力多維,同時,中心依託國防科技大學建立了高度可靠的信息安全體系,用戶的數據安全有保障。
⑼ 「東數西算」的智慧大腦!26座城市搶建智算中心
智東西(公眾號:dxcom)
作者 | 楊暢
編輯 | 李水青
智東西2月25日消息,近日,「東數西算」國家項目正式啟動,為數據中心產業帶來了重要利好信號。(《 歷史 時刻!「東數西算」國家工程全面啟動》)
作為數據中心中領域的一顆「明珠」,智算中心也引起行業關注。
一般認為,智算中心全稱是人工智慧計算中心,主要是為人工智慧(AI)應用提供所需算力服務、數據服務和演算法服務,由AI晶元和算力機組等設備組成,與雲計算中心、超算中心有一定區別。企業和研究機構可以依託智算中心提供的強大算力,驅動AI模型進行數據深度加工,實現AI應用創新。
「東數西算」國家項目強調在京津冀、長三角、成渝等八大樞紐間建設算力網路,支持全國各地日益增長的算力需求。而沿著這張算力網路「地圖」,我們發現智算中心已經「遍地開花」。
細數過來,從2021年到2022年開年,全國有不下20座城市建成或正在建智算中心,智算中心數量達到27個,而其中位於八大樞紐的就有12個,接近50%。
「東數西算」工程國家算力樞紐節點范圍內的智算中心
那麼具體有哪些城市在建設或者規劃建設智算中心?「東數西算」工程會對智算中心帶來什麼樣的影響?各地智算中心項目建設進度如何?可能會對當地AI產業有何影響?
智東西通過調查2021年以來各地規劃、建設和建成的智算中心,並與業內人士交流,來與大家一起探討這些問題。
據智東西統計,從2021年1月1日到2022年2月15日,全國共有至少26個城市在推動或剛剛完成當地智算中心的建設,這些城市中既有省會城市,例如南京、西安,也有非省會城市,像許昌、青島。
其中,不少城市已經在本地建設了像大數據中心、雲計算中心、國家超算中心等信息基礎設施。不過這些中心並不能替代智算中心,它們之間的功能存在差異——像雲計算中心,主要是提供雲服務,超算中心主要為科學研究提供超算服務,智算中心則主要是為企業和科研院所提供普惠AI算力服務。
此外,中信所《人工智慧計算中心發展白皮書(2021)》中指出,智算中心借鑒了超級計算(高性能計算)中心和雲計算數據中心大規模並行計算和數據處理的技術架構,但它是以AI專用晶元為計算算力底座的。上述三類中心的軟體和業務架構不一樣,不過雲數據中心和超算中心也可以通過延展建設,來對外提供智能算力。
據我們統計,2021年,全國建成並投入運營或試運營的智算中心有8個,分別是武漢人工智慧計算中心、合肥先進計算中心、南京智能計算中心、中國電信京津冀大數據智能算力中心、浙江(長三角)新一代全功能智能超算中心、西安未來人工智慧計算中心、中原人工智慧計算中心、哈爾濱人工智慧先進計算中心,投運時間分別是5月、6月、7月、8月、9月、9月、10月和12月。這些智算中心中大部分都有二期建設規劃。
截至目前,2021年和2022年各地投入運營的智算中心情況
一些智算中心並沒有直接用「智算中心」或「人工智慧計算中心」命名,而是採用「先進計算中心」或「智能超算中心」的命名方式,但它們也提供智能算力,所以也可以算作智算中心,例如合肥先進計算中心和浙江(長三角)新一代全功能智能超算中心。
不同智算中心的測算算力時採用的算力測試基準有所差別,使用算力單位略有不同,但是無論是「1 P OpS」、「1 PFLOPS FP16」、「1 Petaflops」還是「1 P」,都相當於每秒可進行一千萬億次運算。
2022年開年以來,國內已經有一個新投運的智算中心,是位於上海的商湯 科技 人工智慧計算中心。
很多城市是正在建設智算中心,從2021年1月1日到2022年2月15日,全國共有至少18個城市簽約、開工、招標、計劃建設智算中心項目,其中已經宣布開工建設的至少有6個城市,分別是合肥、慶陽、大連、沈陽、深圳、長沙。
截至目前,2021年和2022年各地規劃或已經開始建設的智算中心情況
對比2021年之前的各地智算中心建設情況來看,2020年之前的智算中心項目更少一些。不過,部分2021年開工建成的智算中心其實在2020年就已經立項招標和預研規劃,比如武漢人工智慧計算中心項目。
智算中心並不是2021年才有的新類型數據中心,我國較早建成的智算中心還有深圳鵬城雲腦、曠視蕪湖AI超算中心等。2018年,鵬城雲腦I初步建成並上線運行,算力達到100 PFLOPS(1 PFLOPS相當於每秒運算能力為一千萬億次)。
從全國智算中心的地理位置分布來看,目前,東部、中部和西部都有省市在部署智算中心。作為數據中心的一種,各地的智算中心建設規劃難免會受到「東數西算」政策的影響。
特別是國家發改委等部門在《全國一體化大數據中心協同創新體系算力樞紐實施方案》等文件中指出:「原則上,對於在國家樞紐節點之外新建的數據中心,地方政府不得給予土地、財稅等方面的優惠政策。」智算中心作為各地政府主導的項目,極有可能受到影響,但是並不一定會大批向西部地區遷移。因為智算中心主要面向AI相關產業,這些業務對於網路通信的要求也比較高,在這方面,東部地區略有優勢。
中科曙光高級副總裁任京暘告訴智東西,「東數西算」工程會促進智算中心的發展,預計在全國一體化算力網路國家樞紐節點建設中,規劃的數據中心項目會配置一定規模的智能算力,有些項目還可能是直接以智算中心的形態出現。
另外,從這些智算中心公布的算力規模情況來看, 100P算力是很多智算中心的起步目標 。
一般認為,100P大約相當於5萬台高性能電腦的算力。拿科研場景為例,天文學家在20萬顆天體的星空圖中要定位某種特徵星體,如果算力不夠,耗時可能要超100天,如果擁有100P算力,定位星體所需時間僅為100秒。
任京暘說,一般智算中心提到的100P是指FP16或INT16,即半精度算力,就現階段而言,以100P起步,能實現比較大的規模效益。
從需求角度看,智算中心作為城市級公共算力平台,要滿足區域內政府、企業、高校等各類用戶的算力需求,起步規模不宜過小,否則無法支撐類似大模型訓練等大算力需求,也不足以發揮集約共享的規模效益。
任京暘補充道,從投資角度看,智算中心發展尚處於初期階段,建設、運營、應用與生態建設等投入較大,需要結合地方財政承受能力做出合理評估,根據實際需求進行適度的超前部署。
大部分智算中心都是分期建設的,建成一期,就可以投入運營一期,後期再根據運行情況和產業發展需求進行二期、三期建設。
例如武漢人工智慧計算中心,該智算中心在2021年5月完成了一期項目建設工作,並開始為企業提供AI算力,但很快飽和了。於是,武漢人工智慧計算中心又進行了二期項目擴容工作,將算力規模從100P擴容到200P。武漢人工智慧計算中心相關負責人在接受媒體采訪時說,現在二期算力也接近飽和,隨著准備進行進一步的算力擴容工作。
武漢人工智慧計算中心
根據各智算中心的數據,至少數百家企業已經簽約智算中心,例如武漢人工智慧計算中心已經為多家高校和科研院所、100多家企業提供算力,南京智能計算中心已經吸引超40家產學研機構入駐。
一個智算中心可以同時支撐的產業場景很多,例如自動駕駛、智慧醫療、智慧城市、智慧交通、智慧礦山、智能製造等等,主要看當地的需求,一般都是為了支撐當地的優勢產業更好發展。比如,青島靠近海域,其人工智慧計算中心招標文件就有提到青島人工智慧計算中心要支撐青島優勢產業集群,比如智能家居、智能製造等產業智能化持續領先,並著重強調支撐當地智慧海洋經濟的發展。
上述智算中心都並不局限於支撐單一產業。不過,也有一些城市選擇建設針對性更強的智算中心,像山西晉城建設了專門面向煤炭行業的智算中心(智能礦山創新實驗室創新成果&計算中心)。該智算中心由華為、晉能控股等企業參與建設,主要是為推動山西煤礦智能化建設。
智能礦山創新實驗室創新成果&計算中心
在智算中心建設過程中,市政和建築設計企業背後的AI和ICT企業是重要角色,例如曙光、華為、浪潮、騰訊、商湯 科技 等企業。
在 探索 智算中心過程中,作為計算領域的頭部玩家曙光提出了「5A級」智算中心建設方案,從開放、融合、綠色、普惠、服務五個方面,進行智算中心相關的實踐和 探索 。目前,曙光5A級智算中心已在廣東珠海、安徽合肥、浙江桐鄉等地陸續落成,其江蘇崑山等地的智算中心也進入建設階段。
合肥先進計算中心
曙光智算中心會採用兼容多種晶元、演算法、模型等的多元協作方式以實現多元算力提供。例如曙光參建的合肥先進計算中心不僅能提供智能算力,還能提供高性能計算所需算力。在降低智算中心、數據中心能耗方面,曙光研發有浸沒式相變液冷技術,可使智算中心的PUE值降至1.04到1.05。
華為應該是比較早嘗試智算中心的企業,而且也是參與各地智算中心建設最多的企業之一。華為升騰計算業務總裁許映童曾在2021世界人工智慧大會期間透露,華為希望在2021年內啟動超20個智算中心建設。
包括「鵬城雲腦II」、「武漢人工智慧計算中心」在內的幾個華為承建的智算中心項目幾乎都是使用華為的Atlas 900 AI集群架構,來實現AI算力供給的。Atlas 900 AI集群架構是由數千顆升騰910 AI處理器構成,其總算力達到256P 1024 PFLOPS FP16。
鵬城雲腦
浪潮在智算中心方面也有多年的研究,無論是智算中心運行過程中算力生產、算力聚合、算力調度還是算力釋放環節,浪潮都分別有相應的技術和軟硬體支撐。南京智能計算中心就是採用了浪潮AI伺服器算力機組和寒武紀思元270和思元290智能晶元及加速卡。
南京智能計算中心
作為數據中心行業的重要玩家,騰訊將其在數據中心方面的 探索 應用在了智算中心建設中,像騰訊智慧產業長三角(合肥)智算中心建設中就用到了騰訊第四代T-Block等高端模塊化技術,支持項目快速交付。騰訊第四代T-Block等高端模塊化技術就是將IT、空調等數據中心的各個功能模塊化,以實現按需靈活配置。
商湯 科技 是從2018年開始進行人工智慧計算中心預研工作的,2020年7月開始商湯 科技 人工智慧計算中心建設工作。2022年1月24日,商湯 科技 人工智慧計算中心啟動運營。商湯 科技 人工智慧計算中心的峰值算力高達3740 Petaflops,這背後包含了商湯 科技 的多種技術突破,包括高性能計算、分布式調度、硬體/軟體協同設計等。
商湯 科技 人工智慧計算中心
我們通過調查2021年以來建設和建成的智算中心,發現越來越多的城市已經開始了智算中心建設。這體現了各地對於AI產業的重視。從一些現有的智算中心建設工期來看,一般一期建設大概時間在半年到一年不等,今年可能會有更多在建的智算中心建成並投運。另外,「東數西算」工程也會對新的智算中心的規劃、建設產生多重影響。
目前參與智算中心建設的企業相對有限,隨著各地對智算中心建設需求的增加以及一些新玩家加入,智算中心領域玩家可能會面臨更激烈的競爭。
⑽ 關於計算機專業方向的選擇
其實都差不多。我的導師跟我說。現在計算機的出來要麼搞編程要麼就搞網管。
但是網管的發展不大。但是編程很傷身體。各有利弊吧。
還有現在那些大四的師兄跑招聘會的和我說。現在那些計算機相關的公司也是很多是在招軟體研發的人才。但是很多人不願意做凳穗因為太傷身體。呵呵。不過你要是很強的話。那兩個都有發展的哈。
另外。我們學校計算機研究所的所長和我說。現在硬體已經發展到巔毀粗散峰了。所以更側重軟體方面。所以軟體還是發展大點。等你畢業了出來搞幾年編程,然後好的話幾年後就做到管理層了。
最後。纖氏不管選什麼都要好好學。學好了就不怕了。祝你好運哈。