㈠ 八千字硬核长文梳理linux内核概念及学习路线
本文主要讲解Linux内核概念及其学习路线,旨在快速理解Linux内核作用与功能,提供资源,指引学习方法。
Linux内核是操作系统的核心,拥有超过1300万行代码,是世界上最大的开源项目之一。它负责将所有运行在用户模式下的应用程序连接到物理硬件,并允许服务器进程通过进程间通信(IPC)获取信息。内核分为微内核和单内核两种类型,微内核管理CPU、内存和IPC,不负责访问硬件,单内核则不仅包含CPU、内存和IPC,还包含设备驱动程序、文件系统管理和系统服务器调用等内容。
混合内核则介于两者之间,根据需要选择在用户模式下运行什么,以及在管理模式下运行什么。微内核具有可移植性优势,对内存和安装空间占用小,且更安全,因为只有特定的进程在用户模式下运行,而用户模式不具有管理员模式的高权限。单内核则更擅长硬件访问和多任务处理,但也存在更多潜在风险。
学习Linux内核资源丰富,推荐的优质资源包括Linux、云计算、虚拟化、OpenStack、Docker、K8S、网络、Python、Go等书籍和视频,可通过指定链接获取。
在Ubuntu中,内核文件存储在/boot文件夹中,称为vmlinux-version。vmlinuz文件名来源于unix世界,用来表示内核支持虚拟内存。内核文件名和版本号采用A.B.C.D格式表示,其中B可能是2.6,C是您的版本,D表示您的补丁或补丁。
Linux内核文件还包括initrd.img-version、system.map-version、config-version等,initrd文件用作小RAM磁盘,用于提取和执行实际的内核文件,系统.map文件用于内核完全加载之前的内存管理,配置文件用于加载选项和模块。
由于Linux内核是单片的,它比其他类型的内核占用空间最大,复杂度也最高,但这使得内核模块可以在运行时加载和卸载,允许动态添加或删除内核特性。模块通常向基本内核添加设备、文件系统和系统调用等功能。
内核学习时应避免“只见树木,不见森林”,不应过早深入底层代码,应先建立内核的大体框架,理解各个子系统的设计理念和构建思想,然后是具体实现方法和函数。推荐书籍包括《Linux内核设计与实现》、《深入理解Linux内核》、《Linux设备驱动开发》等,这些书籍从概念、设计、实现方法上描述各个子系统,同时提供指导性建议和编程注意事项。
学习内核时,要建立子系统框架和代码实现之间的关联,理解各子系统之间的交互和引用,选择感兴趣的子系统进行深入了解。对于驱动、网络、文件系统等子系统,需要学习特定的书籍和资源,这将大大降低学习难度,提高学习效率。
了解操作系统的实现后,使用内核API时可以考虑可移植性,并熟悉编码约定以编写可移植性代码。内核API与应用API相比,需要更多了解系统特性。学习内核API将指导选择API接口和实现方式,这有助于将理论与实践结合,提高系统编程能力。
最终,实践是学习内核的关键,通过编写代码和调试,加深对内核的了解。关注书籍中的序言和目录部分,可以提高学习效率。兴趣是学习动力,选择自己感兴趣的领域深入研究,将工作转化为享受。
㈡ linux 操作系统/boot目录下面都是什么文件
BOOT目录下的文件,
其中几个核心的如下:
System.map、vmlinuz、initrd-2.4.7-10.img
这几个文件是怎么产生的?又有什么作用呢?本文对此做些介绍。
一、vmlinuz
vmlinuz是可引导的、压缩的内核。“vm”代表“Virtual Memory”。Linux 支持虚拟内存,不像老的操作系统比如DOS有640KB内存的限制。Linux能够使用硬盘空间作为虚拟内存,因此得名“vm”。vmlinuz是可执行的Linux内核,它位于/boot/vmlinuz,它一般是一个软链接,比如图中是vmlinuz-2.4.7-10的软链接。
vmlinuz的建立有两种方式。一是编译内核时通过“make zImage”创建,然后通过:“cp /usr/src/linux-2.4/arch/i386/linux/boot/zImage/boot/vmlinuz”产生。zImage适用于小内核的情况,它的存在是为了向后的兼容性。
二是内核编译时通过命令make bzImage创建,然后通过:“cp/usr/src/linux-2.4/arch/i386/linux/boot/bzImage /boot/vmlinuz”产生。bzImage是压缩的内核映像,需要注意,bzImage不是用bzip2压缩的,bzImage中的bz容易引起误解,bz表示“big zImage”。 bzImage中的b是“big”意思。 zImage(vmlinuz)和bzImage(vmlinuz)都是用gzip压缩的。它们不仅是一个压缩文件,而且在这两个文件的开头部分内嵌有gzip解压缩代码。所以你不能用gunzip 或 gzip –dc解包vmlinuz。
内核文件中包含一个微型的gzip用于解压缩内核并引导它。两者的不同之处在于,老的zImage解压缩内核到低端内存(第一个640K),bzImage解压缩内核到高端内存(1M以上)。如果内核比较小,那么可以采用zImage或bzImage之一,两种方式引导的系统运行时是相同的。大的内核采用bzImage,不能采用zImage。vmlinux是未压缩的内核,vmlinuz是vmlinux的压缩文件。
二、initrd-x.x.x.img
initrd是“initial ramdisk”的简写。initrd一般被用来临时的引导硬件到实际内核vmlinuz能够接管并继续引导的状态。图中的initrd-2.4.7-10.img主要是用于加载ext3等文件系统及scsi设备的驱动。
比如,使用的是scsi硬盘,而内核vmlinuz中并没有这个scsi硬件的驱动,那么在装入scsi模块之前,内核不能加载根文件系统,但scsi模块存储在根文件系统的/lib/moles下。为了解决这个问题,可以引导一个能够读实际内核的initrd内核并用initrd修正scsi引导问题。initrd-2.4.7-10.img是用gzip压缩的文件,initrd实现加载一些模块和安装文件系统等功能。
initrd映象文件是使用mkinitrd创建的。mkinitrd实用程序能够创建initrd映象文件。这个命令是RedHat专有的。其它Linux发行版或许有相应的命令。这是个很方便的实用程序。具体情况请看帮助:man mkinitrd下面的命令创建initrd映象文件。
三、System.map
System.map是一个特定内核的内核符号表。它是你当前运行的内核的System.map的链接。
内核符号表是怎么创建的呢? System.map是由“nm vmlinux”产生并且不相关的符号被滤出。
对于本文中的例子,编译内核时,System.map创建在/usr/src/linux-2.4/System.map。像下面这样:
nm /boot/vmlinux-2.4.7-10 > System.map
下面几行来自/usr/src/linux-2.4/Makefile:
nm vmlinux | grep -v '\(compiled\)\|\(\.o$$\)\|\( [aUw] \)\|\(\.\.ng$$\)\|\(LASH[RL]DI\)' | sort > System.map
然后复制到/boot:
cp /usr/src/linux/System.map /boot/System.map-2.4.7-10
下图是System.map文件的一部分:
在进行程序设计时,会命名一些变量名或函数名之类的符号。Linux内核是一个很复杂的代码块,有许许多多的全局符号。
Linux内核不使用符号名,而是通过变量或函数的地址来识别变量或函数名。比如不是使用size_t BytesRead这样的符号,而是像c0343f20这样引用这个变量。
对于使用计算机的人来说,更喜欢使用那些像size_t BytesRead这样的名字,而不喜欢像c0343f20这样的名字。内核主要是用c写的,所以编译器/连接器允许我们编码时使用符号名,当内核运行时使用地址。
然而,在有的情况下,我们需要知道符号的地址,或者需要知道地址对应的符号。这由符号表来完成,符号表是所有符号连同它们的地址的列表。上图就是一个内核符号表,由上图可知变量名checkCPUtype在内核地址c01000a5。
Linux 符号表使用到2个文件:
/proc/ksyms
System.map
/proc/ksyms是一个“proc file”,在内核引导时创建。实际上,它并不真正的是一个文件,它只不过是内核数据的表示,却给人们是一个磁盘文件的假象,这从它的文件大小是0可以看出来。然而,System.map是存在于你的文件系统上的实际文件。
当你编译一个新内核时,各个符号名的地址要发生变化,你的老的System.map具有的是错误的符号信息。每次内核编译时产生一个新的System.map,你应当用新的System.map来取代老的System.map。
虽然内核本身并不真正使用System.map,但其它程序比如klogd,lsof和ps等软件需要一个正确的System.map。如果你使用错误的或没有System.map,klogd的输出将是不可靠的,这对于排除程序故障会带来困难。没有System.map,你可能会面临一些令人烦恼的提示信息。
另外少数驱动需要System.map来解析符号,没有为你当前运行的特定内核创建的System.map它们就不能正常工作。
Linux的内核日志守护进程klogd为了执行名称-地址解析,klogd需要使用System.map。System.map应当放在使用它的软件能够找到它的地方。执行:man klogd可知,如果没有将System.map作为一个变量的位置给klogd,那么它将按照下面的顺序,在三个地方查找System.map:
/boot/System.map
/System.map
/usr/src/linux/System.map
System.map也有版本信息,klogd能够智能地查找正确的映象(map)文件。