第1章 计算机基础
1.1 什么是计算机
计算机是个笼统的概念,泛指一切计算功能的机器。这样扯的话,以前的算盘也是计算机了。我们现在的计算机应该称作电子计算机,我天朝人民称为电脑。听说谷歌在研究量子计算机,完全不懂是什么玩意。
一不小心在百度百科看到还有光子计算机,生物计算机,吓我一跳,赶紧复制链接过来,自己慢慢看《百度百科—-计算机》
计算机发明者约翰·冯·诺依曼
第一台电子计算机诞生:1946年2月14日 ENIAC(中文名:埃尼阿克)
1.2 计算机组成
我们现在通常理解为计算机是由硬件系统+软件系统组成的,根据冯·诺依曼体系结构。计算机主要由五大部件组成:
运算器(Datapath): 计算机中执行各种算术和逻辑运算操作的部件
控制器(Control):是整个计算机的中枢神经,其功能是对程序规定的控制信息进行解释,根据其要求进行控制,调度程序、数据、地址,协调计算机各部分工作及内存与外设的访问等
存储器(Memory):存储器的功能是存储程序、数据和各种信号、命令等信息,并在需要时提供这些信息。
输入设备(Input system):输入设备是计算机的重要组成部分,输入设备与输出设备合称为外部设备,简称外设,输入设备的作用是将程序、原始数据、文字、字符、控制命令或现场采集的数据等信息输入到计算机。常见的输入设备有键盘、鼠标器、光电输入机、磁带机、磁盘机、光盘机等。
输出设备(Output system):输出设备与输入设备同样是计算机的重要组成部分,它把外算机的中间结果或最后结果、机内的各种数据符号及文字或各种控制信号等信息输出出来。微机常用的输出设备有显示终端CRT、打印机、激光印字机、绘图仪及磁带、光盘机等
前面这些有些虚无缥缈(ps:就是太过于抽象),看看五大部件具体对应的看的见摸的着的事物:
运算器+控制器=======》CPU
存储器=========》内存(memory)
输入设备=========》键盘键盘、鼠标……
输出设备=======》显示器……….
1.3 计算机部件之间的通信
如果说主板(Mother Board)是一座城市,那么总线就像是城市里的公共汽车(bus),能按照固定行车路线,传输来回不停运作的比特(bit)。这些线路在同一时间内都仅能负责传输一个比特
总线(Bus)是计算机各种功能部件之间传送信息的公共通信干线,它是由导线组成的传输线束, 按照计算机所传输的信息种类,计算机的总线可以划分为数据总线、地址总线和控制总线,分别用来传输数据、数据地址和控制信号。
总线是一种内部结构,它是cpu、内存、输入、输出设备传递信息的公用通道,主机的各个部件通过总线相连接,外部设备通过相应的接口电路再与总线相连接,从而形成了计算机硬件系统
1.4 cpu
中央处理器(CPU,Central Processing Unit)是一块超大规模的集成电路,是一台计算机的运算核心(Core)和控制核心( Control Unit)。它的功能主要是解释计算机指令以及处理计算机软件中的数据。
详解请参考百度百科CPU
CPU指令集的作用:
指令集是存储在CPU内部,对CPU运算进行指导和优化的硬程序。拥有这些指令集,CPU就可以更高效地运行。Intel有x86,x86-64,MMX,SSE,SSE2,SSE3,SSSE3 (Super SSE3),SSE4.1,SSE4.2和针对64位桌面处理器的EM-64T。AMD主要是3D-Now!指令集。对电脑下达的每一个命令都需要CPU根据预先设定好的某一条指令来完成。 这些预先设定好的指令是预存在CPU中的。CPU依靠外来指令“激活”自己内存的指令,来计算和操控电脑。 每款CPU在设计时就规定了一系列与电脑其它部件相配合的指令系统。 预先存储的指令越多,CPU越“聪明”。可以做的“动作”越多。预先存储的指令越先进,CPU就越高级。多个指令集中在一起,通常叫指令集,这就是指令集的作用!
CPU的指令级别(RING0,RING1,RING2,RING3):
这得从CPU指令系统(用于控制CPU完成各种功能的命令)的特权级别说起。在CPU的所有指令中,有一些指令是非常危险的,如果错用,将导致整个系统崩溃。比如:清内存、设置时钟等。如果所有的程序都能使用这些指令,那么你的系统一天死机n回就不足为奇了。所以,CPU将指令分为特权指令和非特权指令(用户指令),对于那些危险的指令,只允许操作系统及其相关模块使用,普通的应用程序只能使用那些不会造成灾难的指令。形象地说,特权指令就是那些儿童不宜的东东,而非特权指令则是老少皆宜。
CPU将特权级别分为4个级别:RING0,RING1,RING2,RING3。只使用其中的两个级别RING0和RING3,RING0只给操作系统用,RING3谁都能用。如果普通应用程序企图执行RING0指令,只能提交操作系统来完成执行。
CPU架构类型:
x86
x64
arm (ARM)
m68000, m68k
power (IBM)
powerpc
ultrasparc
alpha
Itanium 安腾 (IA-64/32)
CPU南北桥:
南桥:低速
北桥:高速
1.5 memory
存储器的主要功能是存储程序和各种数据,并能在计算机运行过程中高速、自动地完成程序或数据的存取。存储器是具有“记忆”功能的设备
计算机中的存储器按用途存储器可分为主存储器(内存)和辅助存储器(外存),也有分为外部存储器和内部存储器的分类方法。外存通常是磁性介质或光盘等,能长期保存信息。内存指主板上的存储部件,用来存放当前正在执行的数据和程序,但仅用于暂时存放程序和数据,关闭电源或断电,数据会丢失。
1.6 IO
I/O输入/输出(Input/Output),分为IO设备和IO接口两个部分。IO与外部部件交互,常见的硬盘,网卡
五大部件里面都有缓存机制
cache is king (缓存为王)
各部件容量与速度性能关系:
第2章 操作系统基础
2.1 什么是操作系统
(Operating System,简称OS)是管理和控制计算机硬件与软件资源的计算机程序,是直接运行在“裸机”上的最基本的系统软件,任何其他软件都必须在操作系统的支持下才能运行。操作系统是用户和计算机的接口,同时也是计算机硬件和其他软件的接口
其实操作系统属于一种监控程序。真正的含义就是kernel,我们已经习惯的认为操作系统=内核+应用程序
2.2 程序与编程语言相关基础
2.2.1 什么是程序?
程序=指令+数据
指令:只读
数据:读写
程序:算法+数据结构
2.2.2 运行程序格式:
Windows: EXE, dll(dynamic link library) 动态链接库
Linux: ELF, so(shared object) 共享对象
2.2.3 编程层次
硬件规格:hardware specifiacation
系统调用:system call
库调用:library call
库调用,系统调用:允许被调用的程序;不提供数据,只提供指令
2.2.4 计算机编程语言
计算机语言通常是一个能完整、准确和规则地表达人们的意图,并用以指挥或控制计算机工作的“符号系统”。
高级语言(是一种人工设计的语言,它对具体的算法进行描述,所以又称为算法语言。高级语言独立于计算机的硬件,即与具体的硬件无关)
| (编译)
汇编语言(用有助于记忆的符号和地址符号来表示指令,便是汇编语言,也称为符号语言。一般称汇编语言为低级语言)
| (汇编)
机器语言(机器语言是最初级且依赖于硬件的计算机语言。机器语言可直接在计算机上执行(即为二进制形式),运算速度快。)
编程语言:
汇编语言:微码编程
系统中某些与硬件相关的特有代码、驱动程序开发
高级语言C,C++:
系统级应用、驱动程序
高级应用java,python,php:
应用程序
2.2.5 应用程序接口说明
ABI:Application Binary Interface
应用程序二进制接口,
API:Application Programming Interface
应用程序编程接口
Linux中用户编程接口API遵循了UNIX中最流行的应用编程界面标准—POSIX标准
POS:Portable Operation System
POSIX (可移植操作系统接口,Portable Operating System Interface)
linux写的程序,原代码可以在windows上运行(API相同),编译成二进制代码则不行(ABI不行)
2.3 操作系统功能
通用目的:将底层的各种硬件资源抽象为一种统一接口
硬件驱动
进程管理
内存管理
网络管理
安全管理
2.4 程序运行模式
用户空间:user space ,us
内核模式:system space
在多任务环境中,有许多进程都不允许应用程序去做。所以CPU以两种模式运行,即用户模式和内核模式。
①内核模式
当CPU运行于内核模式时,一切程序都可运行。任务可以执行特权级指令,对任何I/O设备有全部的访问权,还能够访问任何虚地址和控制虚拟内存硬件。这种模式对应80×86的ring0层,操作系统的核心部分,包括设备驱动程序都运行在该模式。
②用户模式
这个模式中,硬件防止特权指令的执行,并对内存和I/O空间的访问操作进行检查。这就允许WindowsNT4.0限制任务对各种I/O操作的访问,并捕捉违反系统完整性的任何行为。在用户模式中,运行的代码如果不通过操作系统中的某种门机制,就不能进入内核模式。在80×86处理器上,这个模式对应于 ring3层,操作系统的用户接口部分以及所有的用户应用程序都运行在该级别
2.5 操作系统发展历史
参考:
http://www.zzbaike.com/wiki/Linux%E5%8F%91%E5%B1%95%E5%8F%B2
n 1965 Bell, MIT 与 GE 的『 Multics 』系统
n 1969 年 Ken Thompson 的小型 file server system
n 1973 年 Ritchie 等人以 C 语言写出第一个正式 Unix 核心
n 重要的 Unix 分支: 1977 年 BSD 的诞生
n 百家齐鸣的 Unix 版本
System (Bell Lab)
AIX (IBM)、Solaris (SUN)、HP-UX (HP)
BSD: (BSRG)Berkeley System Distribution
NetBSD、OpenBSD、FreeBSD
n 1984 年的 GNU 与 Free Software Foundation
n 1988 年的图形接口 X-Free86 project
n 1991 年 芬兰大学生 Linus Torvalds linux-kernel
2.6 Linux操作系统发行版
Linux的发行版本可以大体分为两类,一类是商业公司维护的发行版本,一类是社区组织维护的发行版本,前者以著名的Redhat(RHEL)为代表,后者以Debian为代表
slackware:
suse (zypper,rpm)
opensuse
debian: —–纯社区维护 (apt,deb,dpkg)
ubuntu
mint
kali
redhat:(yum,rpm)
rhel: redhat enterprise linux
每18个月发行一个新版本
CentOS:兼容rhel的格式(已被redhat收购)
fedora:每6个月发行一个新版本
ArchLinux(pacman)
Gentoo
LFS: Linux From scratch
Android: kernel+busybox+java虚拟机
2.7 常见开源协定
现今存在的开源协议很多,而经过Open Source Initiative组织通过批准的开源协议目前有58种(http://www.opensource.org/licenses/alphabetical)。我们在常见的开源协议如BSD, GPL, LGPL,MIT等都是OSI批准的协议
2.7.1 BSD开源协议(original BSD license、FreeBSD license、Original BSD license)
BSD开源协议是一个给于使用者很大自由的协议。基本上使用者可以”为所欲为”,可以自由的使用,修改源代码,也可以将修改后的代码作为开源或者专有软件再发布。
但”为所欲为”的前提当你发布使用了BSD协议的代码,或则以BSD协议代码为基础做二次开发自己的产品时,需要满足三个条件:
-
如果再发布的产品中包含源代码,则在源代码中必须带有原来代码中的BSD协议。
-
如果再发布的只是二进制类库/软件,则需要在类库/软件的文档和版权声明中包含原来代码中的BSD协议。
-
不可以用开源代码的作者/机构名字和原来产品的名字做市场推广。
BSD 代码鼓励代码共享,但需要尊重代码作者的著作权。BSD由于允许使用者修改和重新发布代码,也允许使用或在BSD代码上开发商业软件发布和销售,因此是对商业集成很友好的协议。而很多的公司企业在选用开源产品的时候都首选BSD协议,因为可以完全控制这些第三方的代码,在必要的时候可以修改或者二次开发。
2.7.2 Apache Licence 2.0(Apache License, Version 2.0、Apache License, Version 1.1、Apache License, Version 1.0)
Apache Licence是著名的非盈利开源组织Apache采用的协议。该协议和BSD类似,同样鼓励代码共享和尊重原作者的著作权,同样允许代码修改,再发布(作为开源或商业软件)。需要满足的条件也和BSD类似:
-
需要给代码的用户一份Apache Licence
-
如果你修改了代码,需要再被修改的文件中说明。
-
在延伸的代码中(修改和有源代码衍生的代码中)需要带有原来代码中的协议,商标,专利声明和其他原来作者规定需要包含的说明。
-
如果再发布的产品中包含一个Notice文件,则在Notice文件中需要带有Apache Licence。你可以在Notice中增加自己的许可,但不可以表现为对Apache Licence构成更改。
Apache Licence也是对商业应用友好的许可。使用者也可以在需要的时候修改代码来满足需要并作为开源或商业产品发布/销售。
2.7.3 GPL(GNU General Public License)
我们很熟悉的Linux就是采用了GPL。GPL协议和BSD, Apache Licence等鼓励代码重用的许可很不一样。GPL的出发点是代码的开源/免费使用和引用/修改/衍生代码的开源/免费使用,但不允许修改后和衍生的代码做为闭源的商业软件发布和销售。这也就是为什么我们能用免费的各种linux,包括商业公司的linux和linux上各种各样的由个人,组织,以及商业软件公司开发的免费软件了。
GPL协议的主要内容是只要在一个软件中使用(“使用”指类库引用,修改后的代码或者衍生代码)GPL 协议的产品,则该软件产品必须也采用GPL协议,既必须也是开源和免费。这就是所谓的”传染性”。GPL协议的产品作为一个单独的产品使用没有任何问题,还可以享受免费的优势。
由于GPL严格要求使用了GPL类库的软件产品必须使用GPL协议,对于使用GPL协议的开源代码,商业软件或者对代码有保密要求的部门就不适合集成/采用作为类库和二次开发的基础。
其它细节如再发布的时候需要伴随GPL协议等和BSD/Apache等类似。
2.7.4 LGPL(GNU Lesser General Public License)
LGPL是GPL的一个为主要为类库使用设计的开源协议。和GPL要求任何使用/修改/衍生之GPL类库的的软件必须采用GPL协议不同。LGPL允许商业软件通过类库引用(link)方式使用LGPL类库而不需要开源商业软件的代码。这使得采用LGPL协议的开源代码可以被商业软件作为类库引用并发布和销售。
但是如果修改LGPL协议的代码或者衍生,则所有修改的代码,涉及修改部分的额外代码和衍生的代码都必须采用LGPL协议。因此LGPL协议的开源代码很适合作为第三方类库被商业软件引用,但不适合希望以LGPL协议代码为基础,通过修改和衍生的方式做二次开发的商业软件采用。
GPL/LGPL都保障原作者的知识产权,避免有人利用开源代码复制并开发类似的产品
2.7.5 MIT(MIT)
MIT是和BSD一样宽范的许可协议,作者只想保留版权,而无任何其他了限制.也就是说,你必须在你的发行版里包含原许可协议的声明,无论你是以二进制发布的还是以源代码发布的.
详细参考:http://blog.csdn.net/techbirds_bao/article/details/8785413
2.8 获取发行版
http://fossies.org/ 获取源码包
原创文章,作者:N21_Lorne,如若转载,请注明出处:http://www.178linux.com/20947
评论列表(1条)
写的很好,排版还可以在漂亮一些,加油