热门关键字:  ubuntu  分区  函数  linux系统进程  Fedora

当前位置 :| 主页>Linux教程>内核研究>

Linux操作系统源代码详细分析(一)

来源: 作者: 时间:2007-05-20 Tag: 点击:

内容简介:

Linux 拥有现代操作系统所有的功能,如真正的抢先式多任务处理、支持多用户,内存保护,虚拟内存,支持SMP、UP,符合POSIX标准,联网、图形用户接口和桌面环境。具有快速性、稳定性等特点。本书通过分析Linux的内核源代码,充分揭示了Linux作为操作系统的内核是如何完成保证系统正常运行、协调多个并发进程、管理内存等工作的。现实中,能让人自由获取的系统源代码并不多,通过本书的学习,将大大有助于读者编写自己的新程序。

第一部分 Linux 内核源代码

arch/i386/kernel/entry.S 2
arch/i386/kernel/init_task.c 8
arch/i386/kernel/irq.c 8
arch/i386/kernel/irq.h 19
arch/i386/kernel/process.c 22
arch/i386/kernel/signal.c 30
arch/i386/kernel/smp.c 38
arch/i386/kernel/time.c 58 
arch/i386/kernel/traps.c 65
arch/i386/lib/delay.c 73
arch/i386/mm/fault.c 74
arch/i386/mm/init.c 76
fs/binfmt-elf.c 82
fs/binfmt_java.c 96
fs/exec.c 98
include/asm-generic/smplock.h 107 
include/asm-i386/atomic.h 108
include/asm-i386/current.h 109
include/asm-i386/dma.h 109
include/asm-i386/elf.h 113 
include/asm-i386/hardirq.h 114
include/asm-i386/page.h 114
include/asm-i386/pgtable.h 115
include/asm-i386/ptrace.h 122
include/asm-i386/semaphore.h 123
include/asm-i386/shmparam.h 124 
include/asm-i386/sigcontext.h 125
include/asm-i386/siginfo.h 125
include/asm-i386/signal.h 127
include/asm-i386/smp.h 130
include/asm-i386/softirq.h 132
include/asm-i386/spinlock.h 133 
include/asm-i386/system.h 137
include/asm-i386/uaccess.h 139
include/linux/binfmts.h 146
include/linux/capability.h 147
include/linux/elf.h 150
include/linux/elfcore.h 156
include/linux/interrupt.h 157
include/linux/kernel.h 158
include/linux/kernel_stat.h 159
include/linux/limits.h 160
include/linux/mm.h 160
include/linux/module.h 164
include/linux/msg.h 168
include/linux/personality.h 169
include/linux/reboot.h 169
include/linux/resource.h 170
include/linux/sched.h 171
include/linux/sem.h 179
include/linux/shm.h 180
include/linux/signal.h 181
include/linux/slab.h 184
include/linux/smp.h 184
include/linux/smp_lock.h 185
include/linux/swap.h 185
include/linux/swapctl.h 187
include/linux/sysctl.h 188
include/linux/tasks.h 194
include/linux/time.h 194
include/linux/timer.h 195
include/linux/times.h 196
include/linux/tqueue.h 196
include/linux/wait.h 198
init/main.c 198
init/version.c 212
ipc/msg.c 213
ipc/sem.c 218
ipc/shm.c 227
ipc/util.c 236
kernel/capability.c 237
kernel/dma.c 240
kernel/exec_domain.c 241
kernel/exit.c 242
kernel/fork.c 248
kernel/info.c 255
kernel/itimer.c 255
kernel/kmod.c 257
kernel/module.c 259
kernel/panic.c 270
kernel/printk.c 271
kernel/sched.c 275
kernel/signal.c 295
kernel/softirq.c 307
kernel/sys.c 307
kernel/sysctl.c 318
kernel/time.c 330
mm/memory.c 335
mm/mlock.c 345
mm/mmap.c 348
mm/mprotect.c 358
mm/mremap.c 361
mm/page_alloc.c 363
mm/page_io.c 368
mm/slab.c 372
mm/swap.c 394
mm/swap_state.c 395
mm/swapfile.c 398
mm/vmalloc.c 406
mm/vmscan.c 409

 

第二部分 Linux 内核源代码分析

第1章 Linux 简介

让用户很详细地了解大多数现有操作系统的实际工作方式是不可能的,因为大多数操作系统的源代码都是严格保密的。除了一些研究用的及为操作系统教学而设计的系统外。尽管研究和教学目的都很好,但是这类系统很少能够通过对正式操作系统的小部分实现来体现操作系统的实际功能。对于操作系统的一些特殊问题,这种折衷系统所能够表现的就更是少得可怜了。

在以实际使用为目标的操作系统中,让任何人都可以自由获取系统源代码,无论目的是要了解、学习还是改进,这样的现实系统并不多。本书的主题就是这些少数操作系统中的一个:Linux。

Linux的工作方式类似于Uinx,它是免费的,源代码也是开放的,符合标准规范的32位(在64位CPU上是64位)操作系统。Linux拥有现代操作系统的所具有的内容,例如:

* 真正的抢先式多任务处理,支持多用户。

* 内存保护。

* 虚拟内存。

* 支持对称多处理机SMP(symmetric multiprocessing),即多个CPU机器以及通常的单CPU(UP)机器。

* 符合POSIX标准。

* 联网。

* 图形用户接口和桌面环境(实际上桌面环境并不只一个)。

* 速度和稳定性。

严格说来,Linux并不是一个完整的操作系统。当我们在安装通常所说的Linux 时,我们实际安装的是很多工具的集合。这些工具协同工作以组成一个功能强大的实用系统。Linux本身只是这个操作系统的内核,是操作系统的心脏、灵魂、指挥中心(整个系统应该称为GNU/Linux,其原因在本章的后续内容中将会给以介绍)。内核以独占的方式执行最底层任务,保证系统正常运行—协调多个并发进程,管理进程使用的内存,使它们相互之间不产生冲突,满足进程访问磁盘的请求等等。

在本书中,我们给大家揭示的就是Linux是如何完成这一具有挑战性的工作的。

1.1 Linux和Unix的简明历史

为了让大家对本书所讨论的内容有更清楚的了解,让我们先来简要回顾一下Linux的历史。由于Linux是在Unix的基础上发展而来的,我们的话题就从Unix开始。

Unix是由AT&T贝尔实验室的Ken Thompson和Dennis Ritchie于1969年在一台已经废弃了的PDP-7上开发的;它最初是一个用汇编语言写成的单用户操作系统。不久,Thompson和 Ritchie成功地说服管理部门为他们购买更新的机器,以便该开发小组可以实现一个文本处理系统,Unix就在PDP-11上用C语言重新编写(发明C 语言的部分目的就在于此)。它果真变成了一个文本处理系统—不久之后。只不过问题是他们先实现了一个操作系统而已……

最终,他们实现了该文本处理工具,而且Unix(以及Unix上运行的工具)也在AT&T得到广泛应用。在1973年,Thompson和Ritchie在一个操作系统会议上就这个系统发表了一篇论文,该论文引起了学术界对Unix系统的极大兴趣。

由于1956年反托拉斯法案的限制,AT&T不能涉足计算机业务,但允许它象征性地收取费用发售该系统。就这样,Unix被广泛发布,首先是学术科研用户,后来又扩展到政府和商业用户。

伯克利加州大学是学术用户中的一个。在这里,Unix得到了计算机系统研究小组(CSRG)的广泛应用。并且在这里所进行的修改引发了Unix的一大系列,这就是广为人知的伯克利软件开发(BSD)Unix。除了AT&T所提供的Unix系列之外,BSD是最有影响力的Unix系列。BSD在Unix中增加了很多显著特性,例如TCP/IP网络,更好的用户文件系统(UFS),工作控制,并且改进了AT&T的内存管理代码。

多年以来,BSD版本的Unix一直在学术环境中占据主导地位,但最终发展成为 System V版本的AT&T的Unix则成为商业领域的领头羊。从某种程度上来说,这是有社会原因的:学校倾向于使用非正式但通常更好用的BSD风格的 Unix,而商业界则倾向于从AT&T获取Unix。

在用户需求和用户编程改进特性的促进下,BSD风格的Unix一般要比 AT&T的Unix更具有创新性,而且改进也更为迅速。但是,在AT&T发布最后一个正式版本System V Release 4(SVR4)时,System V Unix已经吸收了BSD的大多数重要的优点,并且还增加了一些自己的优势。这部分由于从1984年开始,AT&T逐渐可以将Unix商业化,而伯克利Unix的开发工作在1993年BSD4.4版本完成以后就逐渐收缩,以至终止了。然而,BSD的进一步改进由外界开发者延续下来,到今天还在继续进行。正在进行的Unix系列开发中至少有四个独立的版本是直接起源于BSD4.4,这还不包括几个厂商的Unix版本,例如惠普的HP-UX,都是部分地或者全部基于BSD而发展起来的。

实际上Unix的变种并不止BSD和System V。由于Unix主要使用C语言来编写,这就使得它移植到新的机器上相对比较容易,它的简单性也使其重新设计与开发相对比较容易。Unix的这些特点大受商业界硬件供应商的欢迎,比如Sun、SGI、HP、IBM、DEC、Amdahl等等;IBM还不止一次对Unix进行了再开发。厂商们设计开发出新的硬件,并简单地将Unix移植到新的硬件上,这样新的硬件一经发布便具备一定的功能。经过一段时间之后,这些厂商都拥有了自己的专有Unix版本。而且为了占有市场,这些版本故意以不同的侧重点发布出来,以更好地占有用户。

版本混乱的状态促进了标准化工作的进行。其中最主要的就是POSIX系列标准,它定义了一套标准的操作系统接口和工具。从理论上说,POSIX标准代码很容易移植到任何遵守POSIX标准的操作系统中,而且严格的POSIX测试已经把这种理论上的可移植性转化为现实。直到今天,几乎所有的正式操作系统都以支持POSIX标准为目标。

现在让我们回顾一下,在1984年,杰出的电脑黑客Richard Stallman独立开发出一个类Unix的操作系统,该操作系统具有完全的内核、开发工具和终端用户应用程序。在GNU(“GNU誷 Not Unix”首字母的缩写)计划的配合下,Stallman开发这个产品有自己的技术理想:他想开发出一个质量高而且自由的操作系统。Stallman使用了“自由”(free)这个词,不仅意味着用户可以免费获取软件;而且更重要的是,它将意味着某种程度的“解放”:用户可以自由使用、拷贝、查询、重用、修改甚至是分发这份软件,完全没有软件使用协议的限制。这也正是Stallman创建自由软件基金会(FSF)资助GNU软件开发的本意(FSF也在资助其他科研方面的开发工作)。

15年来,GNU工程已经吸收、产生了大量的程序,这不仅包括Emacs、gcc (GNU的C编译器)、bash(shell命令),还有大部分Linux用户所熟知的许多应用程序。现在正在进行开发的项目是GNU Hurd内核,这是GNU操作系统的最后一个主要部件(实际上Hurd内核早已能够使用了,不过当前的版本号为0.3的系统在什么时候能够完成,还是未知数)。

尽管Linux大受欢迎,但是Hurd内核还在继续开发。原因有几个方面,其一是Hurd的体系结构十分清晰地体现了Stallman关于操作系统工作方式的思想,例如,在运行期间,任何用户都可以部分地改变或替换Hurd(这种替换不是对每个用户都是可见的,而是只对申请修改的用户可见,而且还必须符合安全规范)。另一个原因是据介绍Hurd对于多处理器的支持比Linux本身的内核要好。还有一个简单的原因是兴趣的驱动,因为程序员们希望能够自由地进行自己所喜欢的工作。只要有人希望为Hurd工作,Hurd的开发就不会停止。如果他们能够如愿以偿,Hurd有朝一日将成为Linux的强劲对手。不过在今天,Linux还是自由内核王国里无可争议的统治者。

在GNU发展的中期,也就是1991年,一个名叫Linus Torvalds的芬兰大学生想要了解Intel的新CPU—80386。他认为比较好的学习方法是自己编写一个操作系统的内核。出于这种目的,加上他对当时Unix变种版本对于80386类机器的脆弱支持十分不满,他决定要开发出一个全功能的、支持POSIX标准的、类Unix的操作系统内核,该系统吸收了BSD和System V的优点,同时摒弃了它们的缺点。Linus(虽然我知道我应该称他为Torvalds,但是所有人都称他为Linus)独立把这个内核开发到0.02 版,这个版本已经可以运行gcc、bash和很少的一些应用程序。这些就是他开始的全部工作了。后来,他又开始在因特网上寻求广泛的帮助。

不到三年,Linus的Unix—Linux,已经升级到1.0版本。它的源代码量也呈指数形式增长,实现了基本的TCP/IP功能(网络部分的代码后来重写过,而且还可能会再次重写)。此时Linux就已经拥有大约10万用户了。

现在的Linux内核由150多万行代码组成,Linux也已经拥有了大约1000 万用户(由于Linux可以自由获取和拷贝,获取具体的统计数字是不可能的)。Linux内核GNU/Linux附同GNU工具已经占据了Unix 50%的市场。一些公司正在把内核和一些应用程序同安装软件打包在一起,生产出Linux的发行版本,这些公司包括Red Hat和Caldera 公司。现在的GNU/Linux已经备受瞩目,得到了诸如Sun、IBM、SGI等公司的广泛支持。SGI最近决定在其基于Intel的Merced的系列机器上不再搭载自己的Unix变种版本IRIX,而是直接采用GNU/Linux;Linux甚至被指定为Amiga将要发布的新操作系统的基础。

1.2 GNU通用公共许可证

这样一个如此流行的操作系统当然值得我们学习。按照通用公共许可证(GPL, General Public License)的规定,Linux的源代码可以自由获取,这满足了我们学习该系统的强烈愿望。GPL这份非同寻常的软件许可证,充分体现了上面提到的 Stallman的思想:只要用户所做的修改是同等自由的,用户可以自由地使用、拷贝、查询、重用、修改甚至重新发布这个软件。通过这种方式,GPL保证了Linux(以及同一许可证保证下的大量其他软件)不仅现在自由可用,而且以后经过任何修改之后都仍然可以自由使用。

请注意这里的自由并不是说没有人靠这个软件盈利,有一些日益兴起的公司,比如发行最流行的Linux发行版本的Red Hat就是一个例子(Red Hat自从上市以来,市值已经突破数十亿美元,每年盈利数十万美元,而且这些数字还在不断增长)。但是任何人都不能限制其他用户涉足本软件领域,而且所做的修改不能减少其自由程度。

本书的附录B中收录了GNU通用公共许可证协议的全文。

最新评论共有 4 位网友发表了评论
发表评论
评论内容:不能超过250字,需审核,请自觉遵守互联网相关政策法规。
用户名: 密码:
匿名?
注册