在看本文以前,请各位先熟悉一下有关术语,这对于深入理解文章含义有极大帮助。 CPUBGA(Ball Grid Array,球状矩阵排列)CMOS: Complementary Metal Oxide SemicondUCtor,互补金属氧化物半导体CISC(Complex Instruction Set Computing,复杂指令集计算机)COB(Cache on board,板上集成缓存)COD(Cache on Die,芯片内集成缓存)CPGA(Ceramic Pin Grid Array,陶瓷针型栅格阵列)CPU:Center Processing Unit,中央处理器EC(Embedded Controller,微型控制器)FEMMS:Fast Entry/Exit Multimedia State,快速进入/退出多媒体状态FIFO:First Input First Output,先入先出队列FPU:Float Point Unit,浮点运算单元HL-PBGA: 表面黏著,高耐热、轻薄型塑胶球状矩阵封装IA:Intel Architecture,英特尔架构ID:identify,鉴别号码IMM: Intel Mobile Module, 英特尔移动模块KNI(Katmai New Instructions,Katmai新指令集,即MMX2)MMX:MultiMedia Extensions,多媒体扩展指令集NI:Non-Intel,非英特尔PGA: Pin-Grid Array(引脚网格阵列),耗电大PSN(Processor Serial numbers,处理器序列号)PIB: Processor In a Box(盒装处理器)PPGA(Plastic Pin Grid Array,塑胶针状矩阵封装)PQFP(Plastic Quad Flat Package)RISC(Reduced Instruction Set Computing,精简指令集计算机)SEC: Single Edge Connector,单边连接器SIMD:Single Instruction Multiple Data,单指令多数据流SiO2F(Fluorided Silicon Oxide,二氧氟化硅)SOI: Silicon-on-insulator,绝缘体硅片SSE(Streaming SIMD Extensions,单一指令多数据流扩充)TCP: Tape Carrier Package(薄膜封装),发热小TLBs(Translate Look side Buffers,翻译旁视缓冲器)VLIW(Very Long Instruction Word,超长指令字)WHQL: Microsoft Windows Hardware Quality Lab(微软公司视窗硬件质量实验室)经常会碰见一些刚刚接触到电脑的朋友,他们也常常问我:一部电脑里面最重要的部件是什么呢?当我遇到这些问题的时候,只能够有一个答案:那就是电脑的“芯”棗CPU。相信懂得电脑的朋友都不会反对我这个答案吧。为什么?就因为电脑几乎所有的处理工作,都是通过CPU来完成的,没有CPU,一部“曾经”完整的电脑比起一个空空的铁箱子来说也强不到哪里去。CPU的概念其实是非常广泛的,不过我们今天经常挂在嘴头上面的这个CPU,一般都是指微型机、小型机专用的中央处理器。那么CPU究竟是怎么出现的呢?经过这么多年的发展,现在的CPU市场究竟成了什么样呢?21世纪眼看就要到了,未来CPU将会是一个什么样子呢?别急,等我慢慢来向大家阐述一下。 CPU的概念与重要性能指标在向大家介绍CPU详细的情形之前,务必要让大家弄清楚到底CPU是什么?它到底有那些重要的性能指标呢?CPU的英文全称是Central Processing Unit,我们翻译成中文也就是中央处理器。CPU(微型机系统)从雏形出现到发壮大的今天(下文会有交代),由于制造技术的越来越现今,在其中所集成的电子元件也越来越多,上万个,甚至是上百万个微型的晶体管构成了CPU的内部结构。那么这上百万个晶体管是如何工作的呢?看上去似乎很深奥,其实只要归纳起来稍加分析就会一目了然的,CPU的内部结构可分为控制单元,逻辑单元和存储单元三大部分。而CPU的工作原理就象一个工厂对产品的加工过程:进入工厂的原料(指令),经过物资分配部门(控制单元)的调度分配,被送往生产线(逻辑运算单元),生产出成品(处理后的数据)后,再存储在仓库(存储器)中,最后等着拿到市场上去卖(交由应用程序使用)。 CPU作为是整个微机系统的核心,它往往是各种档次微机的代名词,如往日的286、386、486,到今日的奔腾、奔腾二、K6等等,CPU的性能大致上也就反映出了它所配置的那部微机的性能,因此它的性能指标十分重要。在这里我们向大家简单介绍一些CPU主要的性能指标:第一、主频,倍频,外频。经常听别人说:“这个CPU的频率是多少多少。。。。”其实这个泛指的频率是指CPU的主频,主频也就是CPU的时钟频率,英文全称:CPU Clock Speed,简单地说也就是CPU运算时的工作频率。一般说来,主频越高,一个时钟周期里面完成的指令数也越多,当然CPU的速度也就越快了。不过由于各种各样的CPU它们的内部结构也不尽相同,所以并非所有的时钟频率相同的CPU的性能都一样。至于外频就是系统总线的工作频率;而倍频则是指CPU外频与主频相差的倍数。三者是有十分密切的关系的:主频=外频x倍频。 第二:内存总线速度,英文全称是Memory-Bus Speed。CPU处理的数据是从哪里来的呢?学过一点计算机基本原理的朋友们都会清楚,是从主存储器那里来的,而主存储器指的就是我们平常所说的内存了。一般我们放在外存(磁盘或者各种存储介质)上面的资料都要通过内存,再进入CPU进行处理的。所以与内存之间的通道棗内存总线的速度对整个系统性能就显得很重要了,由于内存和CPU之间的运行速度或多或少会有差异,因此便出现了二级缓存,来协调两者之间的差异,而内存总线速度就是指CPU与二级(L2)高速缓存和内存之间的通信速度。第三、扩展总线速度,英文全称是EXPansion-Bus Speed。扩展总线指的就是指安装在微机系统上的局部总线如VESA或PCI总线,我们打开电脑的时候会看见一些插槽般的东西,这些就是扩展槽,而扩展总线就是CPU联系这些外部设备的桥梁。第四:工作电压,英文全称是:Supply Voltage。任何电器在工作的时候都需要电,自然也会有额定的电压,CPU当然也不例外了,工作电压指的也就是CPU正常工作所需的电压。早期CPU(286棗486时代)的工作电压一般为5V,那是因为当时的制造工艺相对落后,以致于CPU的发热量太大,弄得寿命减短。随着CPU的制造工艺与主频的提高,近年来各种CPU的工作电压有逐步下降的趋势,以解决发热过高的问题。 第五:地址总线宽度。地址总线宽度决定了CPU可以访问的物理地址空间,简单地说就是CPU到底能够使用多大容量的内存。16位的微机我们就不用说了,但是对于386以上的微机系统,地址线的宽度为32位,最多可以直接访问4096 MB(4GB)的物理空间。而今天能够用上1GB内存的人还没有多少个呢(服务器除外)。第六:数据总线宽度。数据总线负责整个系统的数据流量的大小,而数据总线宽度则决定了CPU与二级高速缓存、内存以及输入/输出设备之间一次数据传输的信息量。第七:协处理器。在486以前的CPU里面,是没有内置协处理器的。由于协处理器主要的功能就是负责浮点运算,因此386、286、8088等等微机CPU的浮点运算性能都相当落后,相信接触过386的朋友都知道主板上可以另外加一个外置协处理器,其目的就是为了增强浮点运算的功能。自从486以后,CPU一般都内置了协处理器,协处理器的功能也不再局限于增强浮点运算,含有内置协处理器的CPU,可以加快特定类型的数值计算,某些需要进行复杂计算的软件系统,如高版本的AUTO CAD就需要协处理器支持。 第八:超标量。超标量是指在一个时钟周期内CPU可以执行一条以上的指令。这在486或者以前的CPU上是很难想象的,只有Pentium级以上CPU才具有这种超标量结构;486以下的CPU属于低标量结构,即在这类CPU内执行一条指令至少需要一个或一个以上的时钟周期。 第九:L1高速缓存,也就是我们经常说的一级高速缓存。在CPU里面内置了高速缓存可以提高CPU的运行效率,这也正是486DLC比386DX-40快的原因。内置的L1高速缓存的容量和结构对CPU的性能影响较大,容量越大,性能也相对会提高不少,所以这也正是一些公司力争加大L1级高速缓冲存储器容量的原因。不过高速缓冲存储器均由静态RAM组成,结构较复杂,在CPU管芯面积不能太大的情况下,L1级高速缓存的容量不可能做得太大。 第十:采用回写(Write Back)结构的高速缓存。它对读和写操作均有效,速度较快。而采用写通(Write-through)结构的高速缓存,仅对读操作有效. 第十一:动态处理。动态处理是应用在高能奔腾处理器中的新技术,创造性地把三项专为提高处理器对数据的操作效率而设计的技术融合在一起。这三项技术是多路分流预测、数据流量分析和猜测执行。动态处理并不是简单执行一串指令,而是通过操作数据来提高处理器的工作效率。动态处理包括了棗1、多路分流预测:通过几个分支对程序流向进行预测,采用多路分流预测算法后,处理器便可参与指令流向的跳转。它预测下一条指令在内存中位置的精确度可以达到惊人的90%以上。这是因为处理器在取指令时,还会在程序中寻找未来要执行的指令。这个技术可加速向处理器传送任务。2、数据流量分析:抛开原程序的顺序,分析并重排指令,优化执行顺序:处理器读取经过解码的软件指令,判断该指令能否处理或是否需与其它指令一道处理。然后,处理器再决定如何优化执行顺序以便高效地处理和执行指令。3、猜测执行:通过提前判读并执行有可能需要的程序指令的方式提高执行速度:当处理器执行指令时(每次五条),采用的是“猜测执行”的方法。这样可使奔腾II处理器超级处理能力得到充分的发挥,从而提升软件性能。被处理的软件指令是建立在猜测分支基础之上,因此结果也就作为“预测结果”保留起来。一旦其最终状态能被确定,指令便可返回到其正常顺序并保持永久的机器状态。
[1] [2]
(出处:http://www.sheup.com)
[1] [2]