⑴ lammps 可以同时编译 并行 和 单核吗
并行技术可分为三类,分别是线程库、消息传递库和编译器支持。线程库(如 POSIX* 线程和 Windows* API 线程)可实现对线程的显性控制;如果需要对线程进行精细管理,可以考虑使用这些显性线程技术。借助消息传递库(如消息传递接口〔MPI〕),应用程序可同时利用多台计算机,它们彼此间不必共享同一内存空间。MPI 广泛应用于科学计算领域。第三项技术是在编译器中实现的线程处理支持,采用的形式自动并行化。一旦将线程处理引入到应用程序中,开发人员就可能要面对一系列新的编程缺陷(Bug)。其中许多缺陷是难以检测到的,需要付出额外的时间和关注以确保程序的正确运行。一些比较常见的线程处理问题包括:数据争用 ,同步,线程停顿 ,锁 ,共享错误.
并行技术可以分为多进程编程和多线程编程。人们总会用某种IPC(inter-process communication,进程间通信)的形式来实现进程间同步,如管道(pipes),信号量(semaphores),信息队列(message queues),或者共享存储(shared memory)。在所有的这些IPC形式中,共享存储器是最快的(除了门(doors)之外)。在处理进程间资源管理,IPC和同步时,你可以选择 POSIX或者System V的定义。
线程技术早在20世纪60年代就被提出,但真正应用多线程到操作系统中还是在20世纪80年代中期。现在,多线程技术已经被许多操作系统所支持,包括Windows NT/2000和Linux。
在1999年1月发布的Linux 2.2内核中,进程是通过系统调用fork创建的,新的进程是原来进程的子进程。需要说明的是,在Linux 2.2.x中,不存在真正意义上的线程,Linux中常用的线程Pthread实际上是通过进程来模拟的。
也就是说,Linux中的线程也是通过fork创建的,是“轻”进程。Linux 2.2缺省只允许4096个进程/线程同时运行,而高端系统同时要服务上千的用户,所以这显然是一个问题。它一度是阻碍Linux进入企业级市场的一大因素。
2001年1月发布的Linux 2.4内核消除了这个限制,并且允许在系统运行中动态调整进程数上限。因此,进程数现在只受制于物理内存的多少。在高端服务器上,即使只安装了512MB内存,现在也能轻而易举地同时支持1.6万个进程。
在Linux 2.5内核中,已经做了很多改进线程性能的工作。在Linux 2.6中改进的线程模型仍然是由Ingo Molnar 来完成的。它基于一个1:1的线程模型(一个内核线程对应一个用户线程),包括内核内在的对新NPTL(Native Posix Threading Library)的支持,这个新的NPTL是由Molnar和Ulrich Drepper合作开发的。
2003年12月发布的Linux 2.6内核,对进程调度经过重新编写,去掉了以前版本中效率不高的算法。进程标识号(PID)的数目也从3.2万升到10亿。内核内部的大改变之一就是Linux的线程框架被重写,以使NPTL可以运行其上。
在现代操作系统里,同一时间可能有多个内核执行流在执行,因此内核其实象多进程多线程编程一样也需要一些同步机制来同步各执行单元对共享数据的访问。尤其是在多处理器系统上,更需要一些同步机制来同步不同处理器上的执行单元对共享的数据的访问。在主流的Linux内核中包含了几乎所有现代的操作系统具有的同步机制,这些同步机制包括:原子操作、信号量(semaphore)、读写信号量(rw_semaphore)、spinlock、BKL(Big Kernel Lock)、rwlock、brlock(只包含在2.4内核中)、RCU(只包含在2.6内核中)和seqlock(只包含在2.6内核中)。
现在的随着现在计算机体系结构的发展,指令级的并行和线程级的并行都在日新月异地发展着.
⑵ 宝禄48核服务器(8255C)
宝禄48核服务器搭载Intel Platinum 8255C CPU,主频2.5G,睿频可达3.1G。CPU核心数量为24核,支持48条线程,采用14纳米工艺制造,工作效率为165W,内置35.75MB三级缓存。此服务器性能强大,理论浮点计算峰值为3840GFlops。
结合6通道DDR4 3200内存,可实现高效计算。进行具体测试时,如g09测试中,针对7个碳环组成的碳平面进行核磁性质计算(giao,spinspin)b3lyp/6-311g(d),使用12核计算模式,计算耗时57分钟。在120个原子组成的C3N4结构优化测试中(opt b3lyp/6-311g(d,p)),同样12核计算,耗时266分钟。对32个原子的卤化物相互作用进行振动频率计算(m062x/aug-cc-pvdz opt=noeigen freq),使用12核计算,耗时46分钟。VASP测试中,对于C26N4CuF2O2H超胞结构的计算(原子数量36个,交换关联势PBE-GGA赝势,截断能500eV,K点2x2x1),使用8核计算,耗时118分钟;Th结构(原子数量96个,交换关联势PBE-GGA赝势,截断能520eV,K点4x4x4),使用12核计算,耗时317.6分钟;Au结构(原子数量108个,交换关联势PBE-GGA赝势,截断能400eV,K点5x5x5),使用12核计算,耗时34.6分钟;MoS2结构中掺杂一个Co原子(原子数量49个,交换关联势PBE-GGA赝势,截断能400eV,K点1x1x1),使用12核计算,耗时37.5分钟。
该服务器广泛应用于生物医药、新材料、新能源、航空航天、天气预报与气候预测、海洋环境模拟分析等多个领域。支持主流计算软件如VASP、Gaussian、MS、CP2K、LAMMPS、Gromacs、AMBER等。科研预算起点为4W起。
服务器特点包括一键部署至服务器的科学计算、作业调度、运维监控软件,远程管理功能,支持集群扩展,实现多台服务器跨节点计算,提供web图文监控服务,随时掌控各节点运行负载,并提供基础系统、软件使用培训,确保用户无忧使用。
具体配置如下:Intel Platinum 8255C CPU,24核48线程,14纳米工艺,165W功率,35.75MB三级缓存,6通道DDR4 3200内存,适用于各种科研与计算场景。