⑴ lammps 可以同時編譯 並行 和 單核嗎
並行技術可分為三類,分別是線程庫、消息傳遞庫和編譯器支持。線程庫(如 POSIX* 線程和 Windows* API 線程)可實現對線程的顯性控制;如果需要對線程進行精細管理,可以考慮使用這些顯性線程技術。藉助消息傳遞庫(如消息傳遞介面〔MPI〕),應用程序可同時利用多台計算機,它們彼此間不必共享同一內存空間。MPI 廣泛應用於科學計算領域。第三項技術是在編譯器中實現的線程處理支持,採用的形式自動並行化。一旦將線程處理引入到應用程序中,開發人員就可能要面對一系列新的編程缺陷(Bug)。其中許多缺陷是難以檢測到的,需要付出額外的時間和關注以確保程序的正確運行。一些比較常見的線程處理問題包括:數據爭用 ,同步,線程停頓 ,鎖 ,共享錯誤.
並行技術可以分為多進程編程和多線程編程。人們總會用某種IPC(inter-process communication,進程間通信)的形式來實現進程間同步,如管道(pipes),信號量(semaphores),信息隊列(message queues),或者共享存儲(shared memory)。在所有的這些IPC形式中,共享存儲器是最快的(除了門(doors)之外)。在處理進程間資源管理,IPC和同步時,你可以選擇 POSIX或者System V的定義。
線程技術早在20世紀60年代就被提出,但真正應用多線程到操作系統中還是在20世紀80年代中期。現在,多線程技術已經被許多操作系統所支持,包括Windows NT/2000和Linux。
在1999年1月發布的Linux 2.2內核中,進程是通過系統調用fork創建的,新的進程是原來進程的子進程。需要說明的是,在Linux 2.2.x中,不存在真正意義上的線程,Linux中常用的線程Pthread實際上是通過進程來模擬的。
也就是說,Linux中的線程也是通過fork創建的,是「輕」進程。Linux 2.2預設只允許4096個進程/線程同時運行,而高端系統同時要服務上千的用戶,所以這顯然是一個問題。它一度是阻礙Linux進入企業級市場的一大因素。
2001年1月發布的Linux 2.4內核消除了這個限制,並且允許在系統運行中動態調整進程數上限。因此,進程數現在只受制於物理內存的多少。在高端伺服器上,即使只安裝了512MB內存,現在也能輕而易舉地同時支持1.6萬個進程。
在Linux 2.5內核中,已經做了很多改進線程性能的工作。在Linux 2.6中改進的線程模型仍然是由Ingo Molnar 來完成的。它基於一個1:1的線程模型(一個內核線程對應一個用戶線程),包括內核內在的對新NPTL(Native Posix Threading Library)的支持,這個新的NPTL是由Molnar和Ulrich Drepper合作開發的。
2003年12月發布的Linux 2.6內核,對進程調度經過重新編寫,去掉了以前版本中效率不高的演算法。進程標識號(PID)的數目也從3.2萬升到10億。內核內部的大改變之一就是Linux的線程框架被重寫,以使NPTL可以運行其上。
在現代操作系統里,同一時間可能有多個內核執行流在執行,因此內核其實象多進程多線程編程一樣也需要一些同步機制來同步各執行單元對共享數據的訪問。尤其是在多處理器系統上,更需要一些同步機制來同步不同處理器上的執行單元對共享的數據的訪問。在主流的Linux內核中包含了幾乎所有現代的操作系統具有的同步機制,這些同步機制包括:原子操作、信號量(semaphore)、讀寫信號量(rw_semaphore)、spinlock、BKL(Big Kernel Lock)、rwlock、brlock(只包含在2.4內核中)、RCU(只包含在2.6內核中)和seqlock(只包含在2.6內核中)。
現在的隨著現在計算機體系結構的發展,指令級的並行和線程級的並行都在日新月異地發展著.
⑵ 寶祿48核伺服器(8255C)
寶祿48核伺服器搭載Intel Platinum 8255C CPU,主頻2.5G,睿頻可達3.1G。CPU核心數量為24核,支持48條線程,採用14納米工藝製造,工作效率為165W,內置35.75MB三級緩存。此伺服器性能強大,理論浮點計算峰值為3840GFlops。
結合6通道DDR4 3200內存,可實現高效計算。進行具體測試時,如g09測試中,針對7個碳環組成的碳平面進行核磁性質計算(giao,spinspin)b3lyp/6-311g(d),使用12核計算模式,計算耗時57分鍾。在120個原子組成的C3N4結構優化測試中(opt b3lyp/6-311g(d,p)),同樣12核計算,耗時266分鍾。對32個原子的鹵化物相互作用進行振動頻率計算(m062x/aug-cc-pvdz opt=noeigen freq),使用12核計算,耗時46分鍾。VASP測試中,對於C26N4CuF2O2H超胞結構的計算(原子數量36個,交換關聯勢PBE-GGA贗勢,截斷能500eV,K點2x2x1),使用8核計算,耗時118分鍾;Th結構(原子數量96個,交換關聯勢PBE-GGA贗勢,截斷能520eV,K點4x4x4),使用12核計算,耗時317.6分鍾;Au結構(原子數量108個,交換關聯勢PBE-GGA贗勢,截斷能400eV,K點5x5x5),使用12核計算,耗時34.6分鍾;MoS2結構中摻雜一個Co原子(原子數量49個,交換關聯勢PBE-GGA贗勢,截斷能400eV,K點1x1x1),使用12核計算,耗時37.5分鍾。
該伺服器廣泛應用於生物醫葯、新材料、新能源、航空航天、天氣預報與氣候預測、海洋環境模擬分析等多個領域。支持主流計算軟體如VASP、Gaussian、MS、CP2K、LAMMPS、Gromacs、AMBER等。科研預算起點為4W起。
伺服器特點包括一鍵部署至伺服器的科學計算、作業調度、運維監控軟體,遠程管理功能,支持集群擴展,實現多台伺服器跨節點計算,提供web圖文監控服務,隨時掌控各節點運行負載,並提供基礎系統、軟體使用培訓,確保用戶無憂使用。
具體配置如下:Intel Platinum 8255C CPU,24核48線程,14納米工藝,165W功率,35.75MB三級緩存,6通道DDR4 3200內存,適用於各種科研與計算場景。