❶ 長城超雲伺服器怎麼硬碟啟動
1、首先,開機等待進入選項。
2、其次,進入啟動項選擇畫面以後選擇命令行模式。
3、最後,進入後即可選擇硬碟啟動。超雲是由CEC中國電子、雲基地產業基金聯合注資成立的國家高新技術企業。
❷ 長城超雲伺服器管理口地址怎麼配置
長螞賣城超雲伺服器管理口地址通過系統指令配置談物物。根據查詢相關公開信息:在遠程rdp伺服器上啟用網路級認證在遠程rdp伺服器上啟用網路級認證,通過系統含液指令配置。
❸ 長城超雲伺服器親手驗證如何充分激發CPU的AI加速潛能
黑格爾曾說:「沒有沖突不成戲劇。」觀察一下現在的AI行業實踐,可能有助於你理解這句話內味兒。
就在大家認為AI還只是個遙不可及的夢想時,深度學習技術的出現讓大家重拾希望;當人們認為AI會在實驗室里停留更長時間時,它已不聲不響地走進了眾多行業的實踐;當大家還在爭論,跑AI,到底是GPU好,還是應該開發更多種類、更專用的AI加速晶元時,有人卻說:「為什麼不先試試CPU呢?」,真是戲劇性、轉折感爆棚。
說出最後這句話的,正是IT圈兒的老朋友英特爾。
從2017年第一代至強可擴展處理器集成AVX-512,開始基於CPU對AI訓練和推理提供加速支持,到2018年第二代至強可擴展處理器在AVX-512技術之上擴展出深度學習加速技術,主打INT8推理加速,再到2020年面向多路伺服器的第三代至強可擴展處理器新增BF16加速,開始兼顧推理和訓練的加速,最後再到今年發布的面向單路和雙路伺服器的第三代至強可擴展處理器(Ice Lake)進一步強化INT8推理加速,將推理能力提升到上一代產品的1.74倍,這一套連貫的動作下來,足以證明英特爾「用CPU跑AI」並非口嗨。
圖註:AVX-512是英特爾推出的向量計算指令集,既兼顧了過去SSE指令集支持的計算類型,也擴展了更多功能,代號為「Skylake」的第一代英特爾至強可擴展處理器產品家族是首個全面支持AVX-512指令集的至強處理器產品線
圖註:BF16(bfloat16)加速是面向多路伺服器的第三代英特爾至強可擴展處理器的新增功能,其相比INT8和FP32,在速度和准確性方面能實現更好的平衡
不少英特爾的客戶也在說「用CPU跑AI效果不錯」。但作為極具折騰精神的E企研究院,我們更希望為大家親手驗證:
至強可擴展處理器,尤其是它最新一代產品,真的能為AI提供出色的加速效果么?還有我們需要用什麼樣的「姿勢」,才能用好CPU的這項新能力?
E企研究院這次用長城超雲的雙路伺服器平台---Ice Lake架構的第三代英特爾至強可擴展處理器——36核心72線程的至強鉑金8360Y處理器來進行驗證。需要說明的是,這次測試只使用了單顆CPU。
圖註:用於本次測試的長城超雲雙路伺服器,配備了36核心72線程的英特爾至強鉑金8360Y處理器,並安裝有8條64GB的DDR4 2933 MHz的DRAM內存,內存總容量為512GB。它還支持PCIe 4.0,可配備最新一代使用PCIe 4.0通道的U.2(NVMe)固態盤,如英特爾的D7與D5系列產品
摸出底線
我們先來測試CPU在無特別優化的情況下,跑AI應用時的性能表現。
我們把自己代入成一家主要用AI做推理的企業,具體場景是基於訓練好的模型,使用來自多個感測器收集的圖像或語音數據做推理的過程,因此出場的模型,我們選中了經過預訓練的ResNet50推理模型。
圖註:用於本次測試的ResNet50(v1.5)模型,是經過預訓練的推理模型,可供用戶下載使用
測試的主要流程是:在測試環境中安裝TensorFlow 2.5版本,並使用主流的ImageNet 2012資料庫,並將CPU設置為性能優先模式,然後運行ResNet 50推理模型。
結果是每秒處理超過72張圖片,平均時延在14ms以內,這個……也太沒吸引力了吧!
圖註:讓CPU處於性能優先模式下,運行原生版TensorFlow框架ResNet50(v1.5)推理模型所獲得的結果
先別急,CPU運行ResNet 50推理模型的性能根本還沒發揮出來呢。
優化動作開始
我們修改一下測試命令,同一個平台,吞吐性能超過每秒172張圖片,時延也減少到6ms以內,性能一下提升到之前的2.37倍。
圖註:劃橫線部分就是增加的代碼,意思是啟用TensorFlow中的oneDNN功能。oneDNN全稱為oneAPI Deep Neural Network Library,即oneAPI深度神經網路庫,它是從面向深度神經網路的英特爾數學核心函數庫(Intel MKL-DNN)發展而來的,是一個開源平台(open-source cross-platform)性能庫,主要用於深度學習應用程序,面向基於英特爾架構的處理器進行了優化,可充分利用其硬體加速特性提升運行AI應用的效率
一句簡單的命令居然有這么大威力?原因何在?
秘密就是:即便是在原生版的TensorFlow中,英特爾也貢獻了不少優化代碼,其中很多都是來自oneDNN,這是英特爾開發和開源的面向深度神經網路的數學核心函數庫,包含了高度矢量化和線程化的構建模塊,可幫助深度神經網路調優,來充分利用英特爾架構CPU集成的AI加速能力。上面這句命令的作用就是開啟了oneDNN的優化功能,可大大提升CPU運行AI推理類應用的效率。
圖註:oneDNN的主要概念包括原語(primitives),引擎(engines),流(streams)和內存對象(memory objects)。針對基元和內存對象具有多個抽象級別,從而為用戶提供更高靈活性
再進一步會怎樣
還有更多、更神奇的功能嗎?
接下來,我們使用英特爾自已發布的,專門且更為全面地面向英特爾架構優化的TensorFlow框架,切換到這個環境再來運行ResNet 50推理模型。
性能果然又有提升,又漲了約17%。
圖註:在面向英特爾架構優化的TensorFlow框架上運行ResNet50(v1.5)推理模型,吞吐性能提升到每秒超202張圖像,平均時延不到5ms。這種充分優化後的TensorFlow框架及模型庫(model zoo)都已開源在GitHub上,任何人都可下載使用。安裝和使用方式與原生TensorFlow並無區別
讓我們再算算:與最開始的、未經優化的TensorFlow環境相比,在面向英特爾架構優化的TensorFlow框架的加持下,運行ResNet 50的推理性能,已達到前者的2.77倍以上。
上述三輪測試考驗的,都是ResNet 50模型在全新第三代至強可擴展處理器上運行時的FP32性能。不難看出,只要優化動作到位,性能提升也會立即到位,況且這還只是單顆CPU的性能表現。
這意味著,企業用戶基本不需要對既有的IT基礎設施做大的改動,也不需要急著導入異構,只要你現在用的CPU是至強可擴展處理器,那麼,你就具備了執行AI推理的主要條件。
再放大招,大大招
你以為這就結束了么?並沒有,接下來才是大招。
我們將開始在CPU上執行INT8推理加速的測試。由於很多企業在使用AI推理時,並不需要FP32這么高的精度,我們可以把數據格式轉變為INT8,在確保准確率不明顯下降的情況下,看看性能會發生怎樣的變化。
這輪測試我們必須要激活英特爾深度學習加速,也就是DL Boost技術中的INT8加速功能,同樣基於面向英特爾架構優化的TensorFlow框架。結果是,時延降至3ms內,吞吐則超過了每秒391 張圖片。
圖註:在面向英特爾架構優化的TensorFlow中使用ResNet50(v1.5)運行INT8推理的結果
終於,我們迎來了最後一輪測試。由於上面多輪測試都在考慮單路推理的性能,而在實際應用中,很多用戶都會跑多路推理,那麼在這種情況下,用戶更希望在可接受的時延水平——譬如30ms上下——盡可能提升吞吐性能。
這組測試中我們使用的至強鉑金8360Y處理器終於火力全開,單顆CPU 36個物理核心對應36個INT8實例。
結果是:平均時延約為27ms,但總計吞吐能力超過每秒1300張圖片,這意味著用戶真的能用可接受的時延提升,換回3倍以上的性能輸出,多核威力有目共睹。
圖註:使用36個INT8實例並行運行(所使用的英特爾至強鉑金8360Y處理器具有36核心,每核心運行一個INT8實例)的測試結果
要知道,直到現在我們使用的都是單顆至強鉑金8360Y處理器,如果在一個雙路伺服器中採用兩顆全上的策略,那麼性能理論上是能夠翻倍,可見英特爾官宣的AI加速性能指標絕非空穴來風。
看到這里,你對至強CPU的AI加速能力是否有了更為直觀的體驗呢?你是否也有使用CPU加速AI應用的獨到經驗或問題呢?歡迎大家和我們分享,也歡迎大家一起動手探索驗證。
❹ 長城超雲伺服器怎麼樣
好。
1、長城超雲伺服器全面覆蓋雲計算、人工智慧、高性能等業務應用並皮,引領數字化建設潮流,釋放更高、更快、更強的計算能力。
2、長城超雲伺服器流暢性派此高,使用起來更好,長城超塵蔽迅雲伺服器好。