⑴ 數據中心伺服器技術發展趨勢與應用
當前,為推進IT支撐系統集約化建設和運營,進一步發揮集中化能力優勢,IT雲成為運營商IT支撐系統建設的基礎架構。但在IT雲資源池部署過程中,伺服器技術面臨多個新挑戰,主要體現在以下3個方面。
在性能方面,人工智慧(AI)應用快速擴張,要求IT雲採用高性能GPU伺服器。AI已在電信業網路覆蓋優化、批量投訴定界、異常檢測/診斷、業務識別、用戶定位等場景規模化應用。AI應用需求的大量出現,要求數據中心部署的伺服器具有更好的計算效能、吞吐能力和延遲性能,以傳統通用x86伺服器為核心的計算平台顯得力不從心,GPU伺服器因此登上運營商IT建設的歷史舞台。
在效率成本方面,IT雲部署通用伺服器存在弊端,催生定製化整機櫃伺服器應用需求。在IT雲建設過程中,由於業務需求增長快速,IT雲資源池擴容壓力較大,雲資源池中的伺服器數量快速遞增,上線效率亟需提高。同時,傳統通用伺服器部署模式周期長、部署密度低的劣勢,給數據中心空間、電力、建設成本和高效維護管理都帶來了較大的挑戰。整機櫃伺服器成為IT雲建設的另一可選方案。
在節能方面,AI等高密度應用場景的快速發展,驅動液冷服扒哪務器成為熱點。隨著AI高密度業務應用的發展,未來數據中心伺服器功率將從3kW~5kW向20kW甚至100kW以上規模發展,傳統的風冷式伺服器製冷系統解決方案已經無法滿足製冷需求,液冷伺服器成為AI應用場景下的有效解決方案。
GPU伺服器技術發展態勢及在電信業的應用
GPU伺服器技術發展態勢
GPU伺服器是單指令、多數據處理架構,通過與CPU協同進行工作。從CPU和GPU之間的互聯架構進行劃分,GPU伺服器又可分為基於傳統PCIe架構的GPU伺服器和基於NVLink架構的GPU伺服器兩類。GPU伺服器具有通用性強、生態系統完善的顯著優勢,因此牢牢占據了AI基礎架構市場的主導地位,國內外主流廠商均推出不同規格的GPU伺服器。
GPU伺服器在運營商IT雲建設中的應用
當前,電信業開始推動GPU伺服器在IT雲資源池中的應用,省公司現網中已經部署了部分GPU伺服器。同時,考慮到GPU成本較高,集團公司層面通過建設統一AI平台,集中化部署一批GPU伺服器,形成AI資源優化配置。從技術選型來看,目前運營商IT雲資源池採用英偉達、英特爾等廠商相關產品居多。
GPU伺服器在IT雲應用中取得了良好的效果。在現網部署的GPU伺服器中,與訓練和推理相關的深度學習應用佔主要部分,佔比超過70%,支撐的業務包括網路覆蓋智能優化、用戶智能定位、智能營銷、智能稽核等,這些智能應用減少了人工投入成本,提升了工作效率。以智能稽核為例,以往無紙化業務單據的人工稽核平均耗時約48秒/單,而AI稽核平均耗時僅約5秒/單,稽核效率提升達 90%。同時,無紙化業務單據人工稽核成本約1.5元/單,採用GPU進行AI稽核成本約0.048元/單,稽核成本降低達96.8%。
整機櫃伺服器發展態勢及在電信業的應用
整機櫃伺服器技術發展態勢
整機櫃伺服器是按照模塊化設計思路打造的伺服器解決方案,系統架構由機櫃、網路、供電、伺服器節點、集中散熱、集中管理6個子系統組成,是對數據中心伺服器設計技術的一次根本性變革。整機櫃伺服器將供電單元、散熱單元池化,通過節約空間來提高部署密度,其部署密度通常可以翻倍。集中供電和散熱的設計,使整機櫃伺服器僅需配置傳統機櫃式伺服器10%的電源數量就可滿足供電需要,電源效率可以提升10%以上,且單台伺服器的能耗可降低5%。
整機櫃伺服器在運營商IT雲建設中的應用
國內運營商在IT雲建設中已經推進了整機櫃伺服器部署,經過實際應用檢驗,在如下方面優勢明顯。
一是工廠預制,交付工時大幅縮短。傳統伺服器春穗碼交付效率低,採用整機櫃伺服器將原來在數據中心現場進行的伺服器拆包、上架、布線等工作轉移到工廠完成,部族賀署的顆粒度從1台上升到幾十台,交付效率大大提升。以一次性交付1500台伺服器為例,交付工作量可減少170~210人天,按每天配10人計算,現場交付時間可節省約17~21天。
二是資源池化帶來部件數量降低,故障率大幅下降。整機櫃伺服器通過將供電、製冷等部件資源池化,大幅減少了部件數量,帶來故障率的大幅降低。圖1比較了32節點整機櫃伺服器與傳統1U、2U伺服器機型各自的電源部件數量及在一年內的月度故障率情況。由於32節點整機櫃伺服器含10個電源部件,而32台1U通用伺服器的電源部件為64個,相較而言,整機櫃電源部件數減少84.4%。由於電源部件數量的降低,32節點整機櫃伺服器相對於32台1U通用伺服器的月度故障率也大幅縮減。
三是運維效率提升60%以上。整機櫃伺服器在工廠預制機櫃布線,網路線纜在工廠經過預處理,線纜長度精確匹配,理線簡潔,接線方式統一規范,配合運維標簽,在運維中可以更方便簡潔地對節點實施維護操作,有效降低運維誤操作,提升運維效率60%以上,並大幅減少發生故障後的故障恢復時間。
液冷伺服器技術發展態勢及在電信業的應用
液冷伺服器技術發展態勢
液冷伺服器技術也稱為伺服器晶元液體冷卻技術,採用特種或經特殊處理的液體,直接或近距離間接換熱冷卻晶元或者IT整體設備,具體包括冷板式冷卻、浸沒式冷卻和噴淋式冷卻3種形態。液冷伺服器可以針對CPU熱島精確定點冷卻,精確控制製冷分配,能真正將高密度部署帶到前所未有的更高層級(例如20kW~100kW高密度數據中心),是數據中心節能技術的發展方向之一,3種液冷技術對比如表1所示。
液冷伺服器在運營商IT建設中的應用
液冷伺服器技術目前在我國仍處於應用初期,產業鏈尚不完備、設備采購成本偏高、采購渠道少、電子元器件的兼容性低、液冷伺服器專用冷卻液成本高等問題是液冷伺服器尚未大規模推廣的重要原因。從液冷伺服器在運營商數據中心領域的具體應用案例來看,運營商在IT雲資源池規劃和建設過程中,通常會對液冷伺服器的發展現狀、技術成熟度等進行分析論證。
考慮到目前液冷伺服器規模化應用尚處於起步階段,需要3~5年的引入期,因此暫時未在IT雲資源池建設中進行大規模落地部署,但在部分地區有小規模應用,如中國移動南方基地數據中心已經開展液冷伺服器試點應用,中國聯通研究院也在開展邊緣數據中心伺服器噴淋式液冷系統的開發。未來,隨著IT雲建設規模、建設密度的繼續攀升,以及液冷產業生態體系的逐步成熟,液冷伺服器在IT雲建設中將有更大的應用空間。
總體來看,運營商IT雲資源池建設對伺服器計算性能、延遲、吞吐、製冷、定製化、分布式部署等方面都提出了更高要求。未來,GPU伺服器、定製化整機櫃伺服器、液冷伺服器等新興伺服器技術將快速迭代,為運營商數據中心伺服器技術的發展和演進帶來新的思路和路徑。
⑵ 藍海大腦的液冷伺服器適用於哪些場景
我握租核來和大家分享一下我的親身經歷。首先,我們主要做人工智慧、深度學習、HPC、數據挖掘、大數據分析、高性能計算等領域。用他的伺服器就夠了,我們最多可以內置20個型塵NVIDIA A100或者V100顯卡。廠商造這么多GPU卡很少見。為此領導表揚了我,說我選的段掘服務廠家很好(開心)。
⑶ 什麼是浸沒式液冷伺服器用它降溫有什麼好處
液冷散熱是指通過液體來替代空氣,把CPU、內存條、晶元組、擴展卡等器件在運行時所產生的熱量帶走。那麼浸沒式液冷就是利用冷卻液,將一排排的伺服器等浸泡在絕緣冷卻液里,更好的達到保護電子元器件低溫運行的效果,也能更好地提升伺服器的使用壽命。
綜合來說,浸沒液冷大幅降低傳熱溫差,利用浸沒式液冷整個數據中心的生態和運算能力都能得到良好優化,也更有助於提高高密度運算性能,計算密度和性能能實現新的突破。
冷伺服器是一款具備綜合性能更穩定、部署環境更綠色、能源損耗更低、幾乎無噪音等超多優點的新型高效節能產品。
⑷ 哪些場所需要使用液冷降溫
您好,液冷降溫通常用於機房、氏橋醫院、工廠、實驗室等場所,特別是在那些要求精確度高、熱量敏感的場合,所以需要使用液冷降溫技術。此外,液冷技術在生產廠家、汽車製造商、火車製造商等行業也有廣泛應用。其次,液冷降溫通常可以用於機房、電信、礦機等有高溫的機械設備的降溫。液冷還可以用爛中於車庫、溫泉酒店、高溫環境的工作場所飢核山、動物保護區、建築物空調。在中小型船舶、飛機、火箭發動機、發電廠和石油煉制廠,以及鐵路機車、拖拉機等機械設備中也有使用液冷降溫的場所。
⑸ 風冷和液冷有什麼不同GPU伺服器用它降溫有什麼好處
傳統的風冷散熱:通過散熱器將CPU發出的熱量轉移至散熱器塊,然後通過風扇將熱氣吹走。因此還需要空調給環境降溫。
液冷散熱:指通過液體來替代空氣,把CPU、內存條、晶元組、擴展卡、GPU 等器件在運行時所產生的熱量帶走
液冷散熱運行相比於風冷散熱更安靜(沒有風扇產生的噪音);同體積液體比同體積空氣帶走的熱量更多,導熱更強,也就是降溫效率更高;功耗也更低;而且採用液冷技術後,還可減少空調機的投入,節省空間。但液冷散熱的成本高,維護比較困難。
目前國內有很多企業像藍海大腦、聯想、華為、浪潮等都在從事研究液冷散熱這一領域。個人比較喜歡藍海大腦,主要是因為有次和他們合作,感覺他們做事情很職業很負責,溝通也比較順暢。是異構計算的高性能超算平台公司,專注為企業數據中心、雲計算、人工智慧、邊緣計算、生命科學等領域的高性能服務商。
⑹ 什麼是液冷散熱器呢
當今個人計算機散熱領域中,風冷散熱器雖然基本脫離了高噪音暴力散熱的怪圈,但卻普遍朝著大體積,多熱管,還有超重量的方向發展,這對用戶在散熱器的實際使用和安裝方面帶來了很大不便,同時也對電腦配件的承重承壓能力帶來很大的考驗。鑒於上述後風冷時代所出現的困境,液冷散熱器漸漸的被廣大電腦用戶所接受。作為一種成熟的散熱技術,液冷散熱方式檔橡一直以來都被廣泛應用於工業途徑,如汽車,飛機引擎的散熱。將液冷散熱技術應用於計算機領域其實並非是因為風冷散熱已經發展到了盡頭,而是由於液體的散熱速度遠遠大於空氣,因此液冷散熱器往往具備不錯的散熱效果,同時在噪音方面也能李李得到很好的控制。由於在散熱效率和靜音等方面有著的種種優勢,在計算機風冷散熱流行不久後,液冷散熱也隨之出現。
令人可喜的是,時至今日,計算機領域的液冷散熱正在普及開來,這種狀況歸根結於液冷的安全性和穩定性有了很大的進步。一套典型的水冷散熱系統必須具有以下部件:水冷塊、循環液、水泵、管道和水箱或換熱器。水冷塊是一個內部留有水道的金屬塊,由銅或鋁製成,與CPU接觸並將吸收CPU的熱量。循環液由水泵的作用在循環的管哪蠢遲路中流動,如果液體是水,就是我們俗稱的水冷系統。吸收了CPU熱量的液體就會從CPU上的水冷塊中流走,而新的低溫的循環液將繼續吸收CPU的熱量。
⑺ 為什麼現在都鼓勵使用液冷伺服器
液冷伺服器兄激是一種通過冷熱交換帶走伺服器熱量的伺服器。從伺服器的物理形式來看,有冷板式液冷伺服器和全浸沒式液冷伺服器。其中,冷板式液冷伺服器以工作流體作為中間傳熱的介質,將熱量從熱區傳遞到遠處再進行冷卻;全浸沒式液冷伺服器在浸沒式液體相變冷卻系統中,當冷媒溫度上升到系統壓力對應的沸點時,通過汽化熱吸收熱量實現熱量的轉移。
液冷伺服器的優勢:
散熱更好
與風冷技術相比,相同體積的液冷伺服器帶走的熱量是相同體積的三千多倍。比風冷散熱效果更好。
導熱效果更好
大家都知道液體的傳熱效果更好,是空氣的 25 倍,溫度傳遞效果更快更好。在挑戰伺服器處理器極限上更有優勢,對於伺服器處理頻率要求高的用戶來說更裂吵是一個好消息。
噪音更小
在相同的散熱水平下,液冷方式的噪音比風扇小很多。完全羨源襪不用擔心噪音,運維人員也可以在安靜的環境下工作。
更節能
在節能方面,液冷伺服器相比風冷可以節能30%左右。這和我們今天提倡的節能環保的主題是一致的,綠色數據中心也是未來數據中心的發展方向。