CPU的发展趋势
1.
技术发展趋势
(1)工艺的影响。在过去30多年的发展过程中,高性能微处理器基本上都是按照著名的摩尔定律在发展。根据世界半导体行业共同制订的2003年国际半导体技术发展路线图及其2004年更新,未来15年集成电路仍将按摩尔定律持续高速发展。预测到2010年,高性能CPU 芯片上可集成的晶体管数将超过20亿个(到2018年超过140亿个)[4]。半导体技术的这些进步,为处理器的设计者提供了更多的资源(无论是晶体管的数量和种类)来实现更高性能的芯片,从而有可能在单个芯片上创造更复杂和更灵活的系统。
随着晶体管集成度的越来越高、频率和计算速度的越来越快,芯片的功耗问题、晶体管的封装、芯片的蚀刻等越来越难以处理。这些因素使得摩尔定律本身的发展及其对处理器的影响发生了一些深刻的变化。
首先,根据上述的路线图,摩尔定律指出的发展趋势已经变缓,由原来的1.5年一代变为2-3年一代。除了技术本身的难度增加以外,集成电路生产线更新换代的成本越来越昂贵,生产厂家需要更多的时间来收回生产线成本也是一个重要原因。
其次,处理器主频正在和摩尔定律分道扬镳。摩尔定律本质上是晶体管的尺寸以及晶体管的翻转速度的变化的定律,但由于商业的原因,摩尔定律同时被赋予每1.5年主频提高一倍的含义[4,5,6]。事实
上过去每代微处理器主频是上代产品的两倍中,其中只有1.4倍来源于器件的按比例缩小,另外1.4倍来源于结构的优化,即流水级中逻辑门数目的减少。但目前的高主频处理器中,指令流水线的划分已经很细,很难再细分。例如,Pentium IV的20级流水线中有两级只进行数据的传输,没有进行任何有用的运算。另外,集成度的提高意味着线宽变窄,信号在片内传输单位距离所需的延迟也相应增大,连线延迟而不是晶体管翻转速度将越来越主导处理器的主频。功耗和散热问题也给进一步提高处理器主频设置了很大的障碍。因此,摩尔定律将恢复其作为关于晶体管尺寸及其翻转速度的本来面目,摩尔定律中关于处理器主频部分将逐渐失效。
此外,虽然集成度的提高为处理器的设计者提供了更多的资源来实现更高性能的芯片,但处理器复杂度的增加将大大增加设计周期和设计成本。
针对上述问题,芯片设计越来越强调结构的层次化、功能部件的模块化和分布化,即每个功能部件都相对地简单,部件内部尽可能保持通信的局部性。
(2)结构的影响。在计算机过去60年的发展历程中,工艺技术的发展和结构的进步相得益彰,推动着计算机功能和性能的不断提高。工艺技术的发展给结构的进步提供了基础,而结构的进步不仅给工艺技术的发展提供了用武之地,同时也是工艺技术发展的动力[3]。
在过去60年的发展历程中,计算机的体系结构每20年左右就出现一个较大突破,已经经历了一个由简单到复杂,由复杂到简单,又由简
单到复杂的否定之否定过程。最早期的处理器结构由于工艺技术的限制,不可能做得很复杂,一般都是串行执行;后来随着工艺技术的发展,处理器结构变得复杂,流水线技术、动态调度技术、CACHE技术、向量机技术被广泛使用,典型的代表如IBM 360系列的机器以及Cray 的向量机;RISC技术的提出使处理器结构得到一次较大的简化;但后来随着工艺技术的进一步发展以及多发射技术的实现,RISC处理器的结构变得越来越复杂。以Intel和HP为代表研制的EPIC结构的实现并没有从根本上对处理器结构进行本质简化。在上述过程中,每一次由简单到复杂的变革都蕴涵着进一步简化的因素,例如在早期的复杂处理器CDC 6600以及Cray向量机中,已经有了只由load和store 进行访存的概念,IBM 360/91中的Tomasulo算法被后来的RISC处理器普遍使用。同样,每一次由复杂到简单的变革,也蕴涵着再次复杂的基础,例如RISC结构的特点使得它可以充分利用多发射以及乱序执行来提高性能,而多发射和乱序执行又会增加处理器的复杂度。以近年来RISC微处理器结构没有大的突破为标志,RISC结构已经成熟。现在的RISC微处理器普遍能允许几十到上百条指令乱序执行,如Alpha 21264处理器的指令队列最多可以容纳80条指令,MIPS
R10000为32条,HP 8700为56条,POWER 4为200多条,PIV为106条(PIV 处理器虽然指令系统是CISC,但内部的微操作则具备了很多RISC的特征)[7,8,9,12,13]。目前,包括超标量RISC和EPIC 在内的指令级并行技术使得处理器核变得十分复杂,通过进一步增加处理器核的复杂度来提高性能已经十分有限。
同时,由于以下原因,通过结构的方法细分流水线来提高主频的方法将来很难再延续下去:一是不可能使用少于6-8个FO4(等效4扇出反相器)产生出波形好的时钟脉冲;二是随着流水级的增加流水线结构的效率会越来越低;三是由封装承受能力引起的热包封限制使得难以实施很深的互连流水线结构;四是结构和电路的创新将越来越多地用于减轻给互连RC效应带来的不良影响而不太可能直接改善频率响应。目前的高主频处理器中,一级流水级只有10-15级FO4的延迟,考虑到控制流水线的锁存器本身的延迟,实际留给有效处理工作的逻辑只有6-9级FO4,已经难以再降低。
因此,传统的高主频复杂设计遇到了越来越严重的障碍,需要探索新的结构技术来在简化结构设计的前提下充分利用摩尔定律提供的片内晶体管,以进一步提高处理器的功能和性能。
(3)功耗问题。随着主频的不断提高,功耗问题越来越突出。现代的通用处理器功耗峰值已经高达上百瓦。例如,Alpha 21364为100瓦,AMD Opteron是90瓦,Intel的安腾2已超过100瓦。相应地,主板上向CPU供电的电流已接近100安培,跟发动汽车时蓄电池需要供出的电流差不多。最近,Intel公司利用90nm工艺重新实现了Pentium 4(简称P4)。但新的P4竟然和原先用0.13微米工艺制造出来的P4跑一样高的主频(不超过4GHz)。这主要是因为Intel没有办法把芯片在高频工作时的功耗降下来,如果进一步提高主频,芯片的功耗太大,芯片产生的热量散不出去导致片内温度升高,反过来导致芯片的性能和芯片的稳定性下降。有的发烧友通过提高芯片电压并
在芯片上加了异常复杂的散热和冷却装置后,已经把P4超频工作到6.5GHz了(当然这种工作状态是不能持续太长的时间的)。事实上,超过150瓦的功耗,无论是目前芯片的封装还是主板的供电能力,都已经难以为继了。在移动计算领域,功耗更是压倒一切的指标。因此如何降低功耗的问题已经十分迫切。
CMOS电路的功耗与主频和规模都成正比,跟电压的平方成正比,而主频在一定程度上又跟电压成正比。降低功耗需要包括工艺技术、物理设计、体系结构设计、系统软件以及应用软件的共同努力。如果说传统的CPU设计追求的是每秒运行的次数(performance per second)以及每一块钱所能买到的性能(performance per dollar),那么在今天,每瓦特功耗所得到的性能(performance per watt)已经成为越来越重要的指标。因此,必须探索新的结构,通过包括工艺技术、物理设计、体系结构设计、系统软件以及应用软件的共同努力来降低功耗。(4)应用的变化。在计算机发展的初期,处理器性能的提高主要是为了满足科学和工程计算的需求,非常重视浮点运算能力;而且主频不是很高,功耗的问题不是很突出。随着Internet和媒体技术的迅猛发展,网络服务和移动计算逐渐成为一种非常重要的计算模式,这一新的计算模式迫切要求微处理器具有响应实时性、处理流式数据类型的能力、支持数据级和线程级并行性、更高的存储和I/O带宽、低功耗、低设计复杂性和设计的可伸缩性;要求缩短芯片进入和退出市场的周期。
此外还应该看到,以个人电脑(PC)为主要应用模式的桌面应用已经
逐渐趋向饱和。一方面,对于大部分的桌面用户(如上网、办公、家庭应用等),目前的PC性能已经足够,再通过定义新的应用来提高PC机的用户对性能的要求(象Intel和Microsoft一直做的那样)已经有较大难度。另一方面,使用PC机的人群已经趋向稳定,如果需要大幅度增加计算机的使用人群,就需要通过使用模式等的革命大幅度降低计算机的购买和使用成本。与此相对应的是,虽然科学计算计算机已经不是市场的主流产品,但人类对科学计算的需求是永无止境的,高性能计算技术在航空航天、石油勘探和开发、大范围气象预报、核爆炸模拟、材料设计、药物设计、基因信息学、密码学、人工智能、经济模型、数字电影等领域起着重要的作用。高性能计算机可以对所研究的对象进行数值模拟和动态显示,获得实验很难得到甚至得不到的结果,从而产生了除了理论科学和实验科学以外的第三类科学,即计算科学。
在上述情况下,需要处理器的结构充分利用集成度的提高带来的海量晶体管资源,在满足新型的网络服务和媒体的应用的同时兼顾传统的科学计算的应用。
根据上述工艺、结构、功耗、应用等几个方面的趋势,需要对处理器的微体系结构进行突破性的变革,这场变革应该是一场由复杂到简单的变革,应该面向网络服务和媒体的应用,应该考虑低功耗的要求,应该采用层次的结构简化物理设计的复杂度。目前,片内多处理器及多线程技术作为较好符合上述趋势的处理器结构技术正在成为处理器体系结构设计的热点。
2.国内外现状
目前国外高性能微处理器的研制有两个明显的趋势。一是研制高性能处理器的公司在市场的洗牌中越来越集中到少数几家;二是单处理器性能的继续提高在主频、结构、功耗等方面都碰到了明显的障碍,因此各微处理器公司都纷纷推出多核结构的微处理器。
在九十年代末生产主流通用处理器的厂家很多,如Intel、AMD、IBM、HP、SUN、DEC、SGI等公司,形成了在通用处理器市场群雄逐鹿的局面。然而,经过近十年的市场洗牌,很多公司由于市场原因退出了通用处理器领域。目前,DEC、HP、SGI已经逐渐退出了处理器设计的角逐。
最早退出通用处理器市场的是DEC 的Alpha处理器。Alpha处理器无论从结构设计还是物理设计的角度都堪称技术的经典,甚至被很多教科书所采用,尤其是Alpha 21264采用0.35um的工艺实现四发射乱序执行的结构达到了600MHz的目标,现在也很难找到另外一支队伍能做出来。但在处理器市场中一个经验的规律是:技术越先进的公司,越没有市场。在DEC公司实现把同时多线程结构做到极致的Alpha 21464过程中,DEC公司就在1998被Compaq收购了。
具有讽刺意义的是,Alpha处理器的最早收购者,Compaq公司却比它更早消失。惠普公司在经过一笔富有争议的交易中合并了Compaq公司(这次的交易甚至导致了惠普管理层与包括惠普家族在内的部分股东的长时间的剧烈冲突)却马上面对一个个棘手的问题,即在扩展基于新的64位构架(IA64)系统生产线的同时,是否还要生产正在走
下坡路的另外两个系列的产品(PA-RISC和Alpha)。目前,HP公司已经宣布原Compaq的所有Alpha处理器开发和服务都将逐步中止(至2010年),而原先EV8的开发小组已经完整地被Intel招募了并且马上就投入了IA64架构的研发工作中,Alpha退出历史舞台已经是不争的事实。HP公司自己开发的PA8000系列处理器在2004年1月发布双核的PA8800芯片后也很久没有看到新产品推出[10]。
生产MIPS系列高性能处理器的SGI公司以2002年宣布停止MIPS 18000的研发为标志,也退出了处理器研发的历史舞台。由于连续十几年的亏损,SGI公司已经难以为继。
在剩下的几个微处理器生产厂商IBM、Intel、AMD和SUN中,前三者目前还看不到停止研发处理器的迹象,但IBM已经宣布不再对外销售Power系列处理器。SUN公司是否继续研发处理器则很大程度上取决于其雄心勃勃的Ultra SPARC V能否取得成功。下面对上述几个公司在多核处理器的研发方面的情况做简单介绍。
(1)IBM是最先推出多核微处理器的厂商,在高度自动化的MPU开发工艺上采用0.13微米工艺实现的Power4+已成为多核微处理器的代表性产品。IBM在蓝色基因巨型机中使用自己的双核芯片,奠定了其在多核微处理器研制方面的领先地位。
2001年发布的Power4片内集成两个Power3处理器核,每个核为8路超标量处理器,乱序执行,一级Cache私有,分别含有32KB的数据Cache和64KB的指令Cache,共享片内1.5MB的二级Cache。Power4采用180nm制造工艺铜互连,7层金属布线,大约集成了1.74亿个
晶体管[13]。
2004年IBM又发布了Power5,Power5是双核同时多线程微处理器,集成两个处理器核,每个核为同时多线程(Simultaneous
Multi-Threading, 简称SMT)处理器,能够同时执行2个线程。Power5由Power4扩展而来,改造为SMT仅增加了24%的芯片面积。Power5片内集成了1.92MB的二级Cache,此外还集成了三级Cache的目录以及存储控制器。Power5采用130nm制造工艺,集成了大约2.76亿个晶体管,工作频率在1.90GHz左右[14]。Power4/Power5主要用于高性能服务器和适度规模并行计算机系统。
2006年发布的Power6采用IBM的65nm SOI工艺,10层金属层,目标是5G Hz。相对于90 nm的工艺,在同样功耗的情况下,性能提高了30%,主要原因是采用DSL(dual-stress line)技术,该技术通过在CMOS channel加上不同的应力来达到提高电子或电洞迁移率。Power6中主要通过电路设计提高主频,其处理器核的频率达到5GHz。Power6是两路的多核处理器(Chip Multi-Processor,简称CMP)设计,集成了两个同时多线程的处理器核,每个核含有私有的L2 cache。4个Power6可以封装在一个多芯片模组中(MCM),包括32MB的L3 victim cache。
(2)Intel在过去一直不断对外表示,要推出超过十亿晶体管的处理器以捍卫摩尔定律,而Montecito就是Intel带给全世界的答案:17.2亿晶体管[18]。在晶体管数目的竞赛中,Intel凭借Montecito
取得遥遥领先的地位。Montecito是一款双核多线程处理器,同时开发指令集并行性和线程级并行性,每个处理器
核在Itanium2的基础上增加了2路阻塞多线程机制。Montecito采用90nm的制造工艺,片内集成17.2亿晶体管,每个处理器核分别含有16KB 一级指令Cache、16KB一级数据Cache、1MB二级指令Cache、256KB二级数据Cache以及12MB 三级Cache,最大功耗大约为100W,但CPU会根据当时的情况自动超频或降频运行,最低功耗可减少到70W。Montecito被Microprocessor Report评为2004最佳的服务器处理器,于2005年下半年发布。Intel在自己微处理器的发展蓝图中指出,今后各个领域的CPU都将采用多核结构。Intel基于P4系列的双核处理器为SmithField,采用90nm工艺,将两个P4的处理器直接封装在芯片上采用共享前端总线的结构,Yonah的处理器为共享L2 caches和系统接口,可以部分消除之前的前端总线竞争冲突问题。
2006年Intel推出了基于Core构架的处理器Conroe(酷睿2),处理器核基于Pentium M,最重要的一点是增加了流水线的宽度,由处理3条x86指令到能处理4条x86指令,增强了SSE功能,由64位通路增加到128位的通路,以及能执行128位的读指令(load),在cache共享上,能动态调节cache的分配,最优化cache的性能。Intel 的数据表明Conroe比上一代处理器在性能上提高了40%,而功耗降低了40%。
(3)AMD和Intel一直是全球处理器市场上的两大宿敌。面对处理
器高功耗的制约,Intel和AMD不约而同地将目光转向了多核处理器。AMD发展64位多核CPU的步伐走在了Intel前面,2004年8月演示了双核Opteron,其产品供货于2005年中期开始。双核Opteron片内集成2个x86-64核,每个处理器核有独立的L2 cache,通过crossbar互联处理器核和系统请求接口,片内集成的内存控制器,此外还集成互连和I/O控制器,包含3个HyperTransport 接口,能够方便地实现多处理器互连和I/O通信。双核Opteron采用90nm制造工艺,晶体管数量在2亿个以上,功耗小于95W,大大提高了微处理器的实际效能,相对于Intel早期推出的双核处理器,AMD有极大的性能和功耗有效性优势[17,21]。
(4)SUN和IBM一直在高端服务器市场竞争激烈。2001年,IBM率先发布了它的双核处理器POWER4 ,而SUN公司直到2004年上半年才发布了它的第一款双核微处理器UltraSPARC IV,并在下半年推出了UltraSPARC IV+。UltraSPARC IV采用CMT(chip multithreading)技术,片上集成了两个UltraSPARC III的内核、二级Cache的tag 体和MCU,外部缓存16MB,每个内核独享8MB。UltraSPARC IV由德州仪器生产,采用0.13微米工艺,主频1.2GHz,功耗100W,和UltraSPARC III管脚兼容,实现系统的平滑升级。UltraSPARC IV+是UltraSPARC IV的0.09微米工艺的升级版本,而且增加了片上高速缓存的容量,主频1.8GHz。根据Sun公司内部人士透露,Sun公司即将推出片内8个处理器核,每个处理器核4线程的UntraSPARC
V[15]。
2004年Sun公司公布了Niagara,也称为UltraSPARC T1,包括8个处理器核,每个核支持4个线程,共支持32个线程[16]。2006年8月,Sun公司推出了Niagara-2,包括8个Sparc的处理器核,每个核支持8个线程,共享4MB的L2 cache,分为8个bank,16路组相联,使用Crossbar把处理器核和L2 cache互联,含有4个双通道的FBDIMM(fully buffered DIMM)内存控制器,含有两个网络端口,1个PCI-E x8的端口,其信号管脚为711个,管脚的总数为1831。
与国外微处理器设计厂家不断合并相对应的是国内微处理器设计能力在“十五”期间的快速增长。在过去的五年中,国内微处理器设计主要包括以下特点:
(1)在通用处理器和嵌入式处理器的研发方面都蓬勃展开;(2)产业化刚开始起步,还需要较长时间形成规模产业化;(3)主要集中在单处理器核的设计方面,部分研究单位在单处理器的研发方面已经达到很高的水平,可望在“十一五”期间展开多核处理器的研发。在国家863计划和中国科学院知识创新工程资助下,中科院计算所从事龙芯系列高性能通用处理器的研制,先后完成32位的龙芯1号、64位的龙芯2号和龙芯2号增强型处理器(简称龙芯2E)的研制。龙芯2E兼容MIPS III指令系统,采用四发射的动态超标量超流水线结构,实现了先进的转移猜测、寄存器重命名、动态调度等乱序执行技术,以及非阻塞的Cache访问、取数猜测(Load Speculation)、存数合并缓存(Store Fill Buffer)等动态存储访问机制。龙芯2E
的浮点部件能够支持SIMD结构的媒体运算以及双单精度
(Paired-Single)的浮点运算。龙芯2E片内含64KB一级指令高速缓存、64KB一级数据高速缓存、以及512KB二级高速缓存,片内集成了DDR内存控制器。龙芯2E采用意法半导体(ST)90nm工艺设计,主频达到1GHz,具有低功耗(5-8瓦)、高安全性特点,SPEC CPU2000的定点/浮点实测分值均达到500分,性能与中档的Intel P4处理器相当。基于龙芯2E的Linux-PC系统可以满足绝大多数的桌面应用,包括运行浏览器、办公套件、播放多媒体视频等。龙芯2E于2006年9月通过中科院组织的鉴定,鉴定专家组一致认为:“龙芯2E高性能通用CPU芯片在单处理器设计方面已达到国际先进水平,居国内通用CPU研制领先水平”。基于龙芯2E的低成本龙梦电脑、龙芯笔记本等样机已经研制出来,正进入试点阶段,产业化前景良好[1,2]。目前,计算所正进行龙芯3号多核处理器的研制。龙芯3号将采用可扩展设计,处理器核数目很容易从几个扩展到几十个;将采用超级虚拟机技术,使得多种指令集(包括MIPS、Sun Sparc、X86)应用能够同时运行。此外,对于传统的如何利用多处理器核加速单线程问题,龙芯3号也将会采用软硬件结合的并行虚拟机方式加以解决。根据龙芯发展路线图,龙芯3号的第一个原型芯片将于2007年底推出。2003年,国防科技大学承担了863计划《高性能通用CPU芯片》重大研究课题(YHFT64-I),2005年国防科大又承担了该项目的滚动支持项目。YHFT64-I采用目前EPIC技术,利用软硬件方法实现Intel 指令集兼容,能够并发执行8条指令。芯片设计采用了大量先进的微
体系结构技术,如:多级分支预测技术、寄存器堆栈技术、控制前瞻/数据前瞻、谓词执行技术以及低功耗技术等,能够有效开发指令集并行性,极大提高处理器性能。YHFT64-1支持通用操作系统,支持多处理器结构,支持数据库、WEB等服务器应用。该芯片所有设计已经完成,采用Chartered 0.13μm Nominal 1P8M工艺,核心逻辑规模5800万晶体管,采用HPBGA封装,功耗12瓦,面积10X10mm2,引腿696个,工作频率300MHz,在2005年上半年完成投片。
此外,中芯微电子和北京大学、清华大学、同济大学等单位也已研制成功嵌入式CPU以及有关的SOC。
3.高性能微处理器发展前沿
3.1 研究中的几种新型体系结构的处理芯片
下面简单介绍国外研究中的几种新型体系结构的处理芯片。
(1) IBM开发中的千万亿次(PetaFLOPS)计算机蓝色基因(Blue Gene)中的核心处理芯片是探索新型高性能CPU体系结构的重要一步。该芯片中含32个简单的PowerPC处理器及内嵌的DRAM,峰值性能可达到32GFLOPS。将DRAM集成在片内,使处理器到存储器的访问延迟大为缩短,访问带宽大大提高,也很大程度上减少了能量的消耗。为了通过精简设计提高运算速度和极大地降低功耗,每个处理器能执行的指令的数量都大大地减少了,但每个处理器仍可支持8个同时执行的线程以提高处理器利用率。片上还集成了6个2GB/s带宽的通道以实现与系统中其它同类芯片的通信。另外,考虑到构建超大规模计算系统
时不可避免地会碰到因某个(些)结点失效而影响整体系统可用性的情况,它尝试采用自稳定和自修复的技术,即自动地从个别处理器或线程的失效中恢复过来。为此,在硬件上,处理器和通信链路上都采用了大量的冗余设计,在软件上,也需要特别增加分布式控制和恢复的机制。
图1 RAW中一个处理器的框图
(2) MIT研究的可重构RAW处理芯片采用了另一种思路[27]。RAW在单个芯片上将几百个非常简单的处理单元,用可重构逻辑连接起来,实现高度并行的体系结构。RAW允许编译器(或其它相当的软件工具)重新构建硬件体系结构的低层细节,对每个要加速的应用实现最佳的资源分配。这种结构设计简单,单元内部和单元之间的互连线短,能充分地支持流水线并行性,特别适于未来线宽变窄的半导体制造工艺。RAW的研究者认为,开始时,RAW体系结构还只适于流式的信号处理计算,但RAW方法未来将发展成为普适的解决方案。
图1给出了RAW中一个处理器的框图。其中下半部分就是一个普通的RISC流水线处理器(其复杂度跟龙芯1号差不多)。其特殊之处在于在执行部件前的旁路部分,除了常规从寄存器中取出的操作数和从功能部件刚算出的操作数外,还有通过通信网络从别的处理器那里送过来的操作数。在灵活的互连网络的配合下,这个机制巧妙地把多个处理器的功能部件耦合在一起,构成功能复杂、动态重构的并行处理系统。
(3) 在2005年国际固态电路会议(ISSCC)上,IBM、Sony和Toshiba 首次公开介绍了设计中的Cell高性能处理芯片[30]。这三个企业联合设计Cell芯片的工作始于2001年3月。Cell的一个主要用途是Sony的第三代Playstation游戏机PS3,但IBM同时也宣称,Cell 将是片上超级计算机(supercomputer-on-a- chip)。从ISSCC2005上披露的第一款Cell芯片的情况来看,它确实能同时满
足前述两个方面的应用要求。Cell处理芯片可在4GHz频率下工作,其宣称的峰值浮点运算速度为256GFLOPS,可惜这只是单精度且不符合IEEE 754标准的浮点运算(如果针对游戏应用,这是合适的,因为速度比精度更重要)。Cell同时也支持完全符合IEEE 754标准的双精度浮点运算,但速度约是单精度的十分之一,估计为
25-30GFLOPS。即使这个速度,也达到了当前主流高性能微处理芯片的5-10倍。因此,基于Cell处理芯片,在一个机柜里就可以实现足以跻身TOP500排行榜前列的超级计算机。
Cell采用了与主流高性能处理芯片全然不同的片内分布式体系结构(图2)。总体上看,它由一个相对比较简单的支持同时双线程并行的双发射64位PowerPC内核(称为PPE)和8个SIMD型向量协处理器(称为SPE)构成。片内有一个高带宽的环状高速总线(EIB)把PPE、SPE及RAMBUS内存接口控制器(MIC)、FlexI/O外部总线接口控制器(BIC)连接起来。PPE主要负责控制并执行操作系统,SPE完成主要的计算任务。SPE的SIMD执行部件是128位宽的,从而可在
一个时钟周期里完成4个32位的定点或浮点乘加运算。SPE里内置了256KB的SRAM作为局部存储器(它的编址独立于片外的DRAM)。不采用自动调配数据的cache机制,使SPE更像一个向量处理器,从而也更多地依赖程序员或编译器的作用来发挥性能。同样,SPE里没有动态分支预测机制。所以,SPE配备了较大的寄存器堆(128个128位的寄存器)来尽量减少对存储器的访问,并尽可能地展开循环、减少分支。
Cell虽然实现了很高的性能,但也存在一些问题。例如,如果要往游戏或多媒体以外的应用发展,编程模型和软件开发问题还没有很好解决。又如,前面提到的芯片设计的复杂度和功耗问题也没有很好地解决。Cell的第一款芯片用 42.5mm尺寸的BGA封装,共1236个接触点,其中506个是信号。据估计在1.1V供电4GHz运行时,芯片功耗约50-80瓦(据说1.4V供电时可运行到5.6GHz,功耗180瓦)。90纳米SOI工艺全定制实现,8层铜连线,芯片面积为221mm2,含2.34亿晶体管。这个复杂度已经超过了Intel的安腾二代,如果想用在家用游戏机里,成本是个大问题(据说Sony计划在PS3里采用只包括4个SPE的Cell
版本)。Cell芯片采用42.5mm
(4) IBM和德克萨斯州立大学联合开发中的TRIPS(Tera-Op Reliable Intelligently adaptive processing System)芯片是设计具有每秒万亿次运算能力芯片的第一个尝试[28,29]。TRIPS结构采用粗粒度的处理器内核,以便在有较高指令级并行性的单线程应用上实现更高
的性能;并在同一芯片上重复设置许多这样的内核,便于扩充。片上还集成了存储部件和通信部件,并允许软件调度程序对它们灵活配置,以获得最佳性能。图3给出了TRIPS结构的一个大略框图。左边是其总体框图,包括八个网格处理器(黑色大方块)、若干可配置的存储体(灰色小方块)和一些连接片外存储器(DRAM阵列)的接口通道(黑点)。右边是网格处理器的具体结构,其中圆点是处理单元,外围的一圈长方块里有共享的寄存器堆、高速缓存、分支预测器等。
图3 TRIPS处理器结构图
TRIPS的目标是在35纳米的工艺条件下,达到5TFLOPS的峰值浮点运算性能。TRIPS同时还兼顾桌面应用和服务器应用,希望到2010年,能把桌面PC、高性能计算、数字信号处理、服务器应用等都统一到同一类型的CPU芯片上。
(5) AMD正在逐步公布其技术路线图,尤其是四核处理器的计算技术。该四核处理器采用65纳米技术,其具有2MB三级缓存、512KB二级缓存和64KB一级缓存。该设计的四个核共享硅底板和隔热层,与现有的Socket F(1207)兼容。这样,用户就能轻松实现性能升级,而无须担心图像管理问题。该技术突出之处在于65纳米SOI处理技术、经过改进的Power Now!性能、集成的存储器控制器和直接互连架构。AMD四核处理器技术还将包括:改进的分支预测、乱序Load
执行、双128位SSE数据流、位级控制扩展和SSE扩展。另外,还包
括8GB/秒的HyperTransport连接、改进的Crossbar、DDR2支持技术。
(6) Intel开发万亿级研究芯片。2006年9月26日,在Intel开发者论坛中,Intel公司的首席技术官Justin Rattner首次介绍了Intel的“万亿级”研究原型芯片及其三个主要的技术突破。“万亿级”研究原型芯片是世界上第一个达到每秒1万亿次浮点运算(one trillion floating-point operations-per-second,TeraFLOP)的处理器,包括80个处理器核,频率为3.1 GHz。该研究原型芯片综合了Intel公司近来在硅光子学方面的技术突破,达到了万亿次级计算操作的三个主要要求:即TeraOPS的性能、每秒万亿字节的
访存带宽以及每秒万亿比特的I/O速度。尽管这些技术的商业应用可能在未来数年才能实现,不过这毕竟是在计算机和服务器中进行万亿次级操作方面跨出的激动人心的第一步。第一个创新点是:与其他现有芯片的晶体管排列方式不同,“万亿级”芯片包括了80个瓦片(tile),排成8×10的行列结构。每一个瓦片都包括一个带简单指令设置的小型核心,用于处理浮点数据,但是与Intel的结构不兼容。第二个创新点是:有一个20兆字节的SRAM内存芯片,其被重叠绑定在处理器模上。与处理器模的叠放使数百个芯片互连成为可能,并且可在内存和核心之间提供超过每秒万亿字节的带宽。第三个创新点是采用混合硅激光芯片,该技术可以形成每秒万亿比特的光学通路。
公司现状与未来发展趋势 中国物业管理从20世纪80年代初开始发展起来,经历了20多年,已逐步走入千家万户。物业管理从无到有,从小到大,从原有开发商的附属单位到现在的自主营利、自负盈亏,已形成一个独立的行业,其表现出良好的社会效益、经济效益日益明显,这期间物业管理企业走过了一段相当艰难的路程。 1994年8月8日,宁波市第一家物业管理公司——新街物业管理公司成立,并开始对新街小区实施了物业管理。15年后,物业管理得到了快速发展,市场主体也在快速增加,根据有关部门相关统计,截至今年6月底,仅宁波市就有经营资质的物业管理企业225家,从业人员3.4万余人,管理物业项目(住宅小区、大楼、别墅区)1513个,管理面积9829万平方米,享受物业管理服务住户近60万户,中心城区物业管理覆盖率达到88%。可以说,物业行业为宁波市经济社会的可持续发展,加速构建和谐社会做出了应有的贡献。 绿城物管公司为占领长三角地区市场空间,在05年组建并成立了宁波分公司,经过近四年的运作和发展,风雨之后终见彩虹,但是对公司未来的发展我们不容乐观,我们只有在不断进步当中,总结经验、找准差距,应运对策,公司才能得以健康发展,才能立于同行业不败之地。以下是我进入公司两年,通过在三个园区一个部门的工作实践中,结合目前物管行业的发展现状, 对我们宁波公司的现状及未来的发展趋势作如下分析: 一、回顾公司的昨天:起步较晚,发展迅速。
宁波物管市场现有经营资质的物业公司225家中,我们绿城宁波分公司也属其中一家,公司成立于2005年,起步较晚,但发展迅速;从当年第一个外接楼盘慈溪清水湾开始,07年又相继接管了新时代小区、聚金家园小区,08—09年外接楼盘紫郡花园、江南一品到内接楼盘桂花园、绿园、皇冠花园等,短短四年公司已经管理13个项目,面积达300万方(包括已签未交付),目前宁波分公司员工已有400多人,发展速度之快足以见证物业管理的发展空间之大。 二、俯视公司的现状: 宁波公司发展过快,人才出现紧缺;员工主动服务意识缺少、淡薄,员工的培训力度还需加强;与同行相比培训力度尚有差距;其次,基层团队的凝聚力、向心力也显现出不足,其主要表现在以下几个方面: (一)、发展过快、物业专业人才紧缺: 公司要发展,就要不断地向外拓展,不断拓展的同时,人才应该跟上公司的发展需求,然而宁波分公司过快的发展速度,出现物业管理人才的紧缺,熟、懂工程强、弱电,公司内部管理、办公自动化软件操作、硬件管理等专业的物业管理人才更是稀少,如何提升内部优秀员工及引进同行业中的物业精英,成为了当前公司应该面对的重头问题。 (二)、服务意识淡薄,团队凝聚力尚佳,员工的培训力度需进一步加强,整体现状与高端物业相比仍有差距: 1、员工主动服务意识淡薄: 目前园区除接管较早的新时代、聚金家园、慈溪清水湾和紫郡花
CPU的发展趋势 1. 技术发展趋势 (1)工艺的影响。在过去30多年的发展过程中,高性能微处理器基本上都是按照著名的摩尔定律在发展。根据世界半导体行业共同制订的2003年国际半导体技术发展路线图及其2004年更新,未来15年集成电路仍将按摩尔定律持续高速发展。预测到2010年,高性能CPU 芯片上可集成的晶体管数将超过20亿个(到2018年超过140亿个)[4]。半导体技术的这些进步,为处理器的设计者提供了更多的资源(无论是晶体管的数量和种类)来实现更高性能的芯片,从而有可能在单个芯片上创造更复杂和更灵活的系统。 随着晶体管集成度的越来越高、频率和计算速度的越来越快,芯片的功耗问题、晶体管的封装、芯片的蚀刻等越来越难以处理。这些因素使得摩尔定律本身的发展及其对处理器的影响发生了一些深刻的变化。 首先,根据上述的路线图,摩尔定律指出的发展趋势已经变缓,由原来的1.5年一代变为2-3年一代。除了技术本身的难度增加以外,集成电路生产线更新换代的成本越来越昂贵,生产厂家需要更多的时间来收回生产线成本也是一个重要原因。 其次,处理器主频正在和摩尔定律分道扬镳。摩尔定律本质上是晶体管的尺寸以及晶体管的翻转速度的变化的定律,但由于商业的原因,摩尔定律同时被赋予每1.5年主频提高一倍的含义[4,5,6]。事实
上过去每代微处理器主频是上代产品的两倍中,其中只有1.4倍来源于器件的按比例缩小,另外1.4倍来源于结构的优化,即流水级中逻辑门数目的减少。但目前的高主频处理器中,指令流水线的划分已经很细,很难再细分。例如,Pentium IV的20级流水线中有两级只进行数据的传输,没有进行任何有用的运算。另外,集成度的提高意味着线宽变窄,信号在片内传输单位距离所需的延迟也相应增大,连线延迟而不是晶体管翻转速度将越来越主导处理器的主频。功耗和散热问题也给进一步提高处理器主频设置了很大的障碍。因此,摩尔定律将恢复其作为关于晶体管尺寸及其翻转速度的本来面目,摩尔定律中关于处理器主频部分将逐渐失效。 此外,虽然集成度的提高为处理器的设计者提供了更多的资源来实现更高性能的芯片,但处理器复杂度的增加将大大增加设计周期和设计成本。 针对上述问题,芯片设计越来越强调结构的层次化、功能部件的模块化和分布化,即每个功能部件都相对地简单,部件内部尽可能保持通信的局部性。 (2)结构的影响。在计算机过去60年的发展历程中,工艺技术的发展和结构的进步相得益彰,推动着计算机功能和性能的不断提高。工艺技术的发展给结构的进步提供了基础,而结构的进步不仅给工艺技术的发展提供了用武之地,同时也是工艺技术发展的动力[3]。 在过去60年的发展历程中,计算机的体系结构每20年左右就出现一个较大突破,已经经历了一个由简单到复杂,由复杂到简单,又由简
关键字: register:寄存器interface:接口analog:模拟semiconductor:微处理器combination:混合体capacitor :电容器diode:二极管comparator:比较器loop:循环 polarity:极性potential:电位pickup:传感器circuitry:电路图resistance:电阻leakage:泄露电阻filt:过滤器current:电流buffering:缓冲器impedance:阻抗offset:补偿diode:二极管 国内的微处理器: ADC08031/ADC08032/ADC08034/ADC08038 8位高速单任务处理的I/O A/D转换器有多种传输方式,提高电压,和跟踪/控制功能 综述: ADC08031/ADC08032/ADC08034/ADC08038是8位连续的近似A/D转换器,有一系列I/O和配置输入多大8种方式,一系列的I/O被装置以达成NSCMICROWIRE TM的标准。简单连接COPS TM流派控制的一系列数据转换标准,也能简单连接标准转移寄存器或微处理器。 ADC08034和ADC08038提供一个2.6V中断源参考材料,为装置提供保障的电压参考温。以ADC08031/ADC08034和ADC08038为特点,一个跟踪/控制功能允许在现实A/D转换中在正极输入多种模拟电压。模拟输入被装置成操作各种但极点的有区别的,或假定一有区别的代码的混合体。总之,输入模拟跨度最小1V才能被容纳。 用途: 1,使自动传感器数字化。 2,程序控制监督程序。 3,在噪音环境中有遥感功能。 4,检测仪器。 5,测试系统。 6,嵌入式特征。 特征: 1,单任务处理器的数据连接要求少量的I/O插口。 2,模拟输入跟踪控制功能。 3,2- ,4-或8位输入多种逻辑地址的传输方式。 4,0V~5V模拟输入范围提供单极5V电压。 5,没有零或满的尺度判断要求。 6,TTL/CMOS输入/输出兼容。 7,在集成电路片上2.6V中断源参考材料。 8,0.3标准宽度.14或20个插口插入插件。 9,20个插口的微型插件 码的规范:
中国经济发展的历程与现状及发展趋势 社会经济的现代化贯通于资本主义产生、发展和社会主义确立、发展的全过程,是人类社会从传统的农业文明向现代工业文明转变的必然趋势。从内容上看,它是以科技为动力,以工业化为中心,以机器生产为标志,并引起经济结构、政治制度、生活方式、思想观念全方位变化的一场社会变革。 一、鸦片战争后中国社会经济结构的变动 1、自然经济开始解体 1842年五口通商以后,西方商品输人与日俱增,尤其是洋纱洋布的输入,摧毁了东南沿海地区中国传统的家庭手工棉纺织业,造成纺与织、织与耕的分离。传统的小农业与家庭手工业相结合的自给自足的自然经济开始解体。其后,随着更多的通商口岸的开放,洋纱洋布得以倾销,进而为机器棉纱纺织业的产生和发展准备了一定的原料和产品市场;陷入破产与失业的农民和手工业者,则为近代机器工业提供了劳动力市场。 传统的自给自足的自然经济开始瓦解只是发生在沿海局部地区,内地广阔的农村封建生产关系基本没变。另外,在东南沿海地区,棉纺等中国传统的手工业部门也同时受到打击和排挤,这些部门的资本主义萌芽受到遏制。 2、近代机器工业的出现 19世纪40年代外国资本的近代机器工业在中国出现。60年代开始的洋务运动,标志着中国工业近代化的开始。 鸦片战争后,外国商人为了贸易和航运的需要,在通商口岸私自创办了一批船舶维修厂、砖茶厂和机器缫丝厂等。外国企业在中国的开办,给中国带来了先进的机器与技术,打开了中国人的眼界,从而为中国资本主义机器工业的产生起了诱导的作用。
自19世纪60年代始,李鸿章、左宗棠等洋务派大官僚,先后创办了江南制造总局、金陵机器局、福州船政局、天津机器局等军事工业,清政府各省当局大多也创办了自己的军火生产机构。这些军事工业从外国购进设备生产船舰、枪炮、弹药,将大机器工业引入了中国。洋务派在这一时期所创办的上海机器织布局、汉阳铁厂等民用工业,也都属于使用机器生产的近代企业。除制造业外,洋务派大官僚李鸿章等人创办了上海轮船招商局、开平矿务局、天津电报总局,修筑了铁路,从而建立了中国自己的近代采矿、航运、铁路和通讯事业。 二、中国社会经济近代化进程的阶段 1.初步发展阶段(1840~1895 年) (1)鸦片战争后,西方列强利用不平等条约的特权向中国倾销商品,并非法开办企业(这是在中国最早出现使用机器生产的近代工业)。 (2)洋务运动,兴办了一批近代军事和民用工业。洋务运动是中国早期现代化的第一次大规模实践,产生了中国机器工业。 (3)19 世纪六、七十年代,中国民族资本主义工业兴起。民族资本主义工业冲击自然经济,中国社会的经济结构发生了重要的变化。 2.整体发展阶段:(1895—1927 年) (1)甲午战争后民族资本主义经济初步发展。 (2)1912—1919 年民族资本主义经济进一步发展。 3.曲折前进阶段(1927—1949 年) (1)国民政府统治前期,官僚资本形成,民族工业发展。 (2)抗战期间,原有的工业在军国主义的大举进攻下遭到严重摧残,近代化被打断。
嵌入式微處理器未來市場趨勢 CPU的架構大致上可分為CISC CPU & RISC CPU。 CISC CPU適用於大量資料運算的應用(INTEL、AMD、VIA的x86 CPU)。 RISC CPU所強調的是執行的效率與省電的要求(ARM、MIPS、ARC …)。 不論是CISC或是RISC CPU,都可以依據CPU內部處理資料匯流排的寬度,可區分成8位元、16位元、32位元與64位元等四種。根據In-Stat的統計,成長最快的是64位元嵌入式CPU,主要應用在STB、DTV與電視遊戲機等需要大量資料處理的產品。 8至64位元主要產品中所使用嵌入式CPU種類 全球的嵌入式CPU供應商第一大廠商是ARM,排名第二是MIPS。但兩家的產品定位並不完全相同。 ARM的CPU會強調省電應用;MIPS則主打高效能的產品。 因此在過去強調省電訴求的行動電話是嵌入式產品最大應用產品情況下,ARM 的營收皆優於MIPS。MIPS已逐漸淡出16位元CPU的市場,而專注於32位元以上的CPU。ARM與其最大競爭對手MIPS的差異處在於,以交易機制來分析,一般而言,ARM的授權金比重較高,而MIPS則收取比例較高的權利金。 早期台灣廠商CPU或MCU相關技術可區分成三類,8051架構、6502架構與自行研發等三種。INTEL的8051與Motorola的6502都是8位元的架構,初期都是由工研院所授權獲得,並推廣至國內業者。另外自行研發的也不在少數,例如凌陽、盛群、金麗或十速等公司,但都是32位元以下的架構。
嵌入式微處理(CPU)器與微控制器(MCU) 微處理器強調運算效能,而微控制器著重控制功能。 在SoC整合趨勢下,嵌入式微處理器加上記憶體、邏輯與I/O等IP將構成強大效能的微控制器;而增強位元數後的微控制器亦具有MPU的強大處理功能。 微處理器若以應用產品的軟體平台來區分,可分成特定應用型與泛用型兩種。特定應用型: 操作軟體大致是依據終端產品所需的功能加以設計,其最大特色是封閉的操作環境,終端產品的使用者大致上不需了解軟體的構造,也不能修改其操作功能,應用產品有印表機、數位相機、車用設備與遊戲機等,這類型產品通常較簡單其穩定性也要求較高。 泛用型: 如簡易的電腦一樣,有著相似而共通的作業系統,主要應用在PDA、Smart Phone、STB(視訊轉換器)、Thin Client等。此類產品因具有資訊交換的功能,其作業系統較複雜,相容性的要求也較高。 微控制器主要是負責系統產品中控制功能的IC元件。目前電子產品朝向輕薄短小、功能強大、價格低廉等目標發展,加上開發時程日益縮短,微控制器具有整合諸多功能於一身的特性,不但節省開發時間,在降低體積與成本上也有相當大的助益。 微控制器因有下列優點: 1.低價 2.較小的程式碼 3.可使用C語言編譯,開發更容易 4.耗電量較低 5.最高的效能與價格比 16位元以上的微控制器主要應用在通訊(如ISDN、USB等)、車用與工業等項目;由於需要符合工業規格,必須認證後才能出貨,技術層次較高。 隨著系統產品功能的多樣化,人機介面必須具有親和力…等,微控制器的效能亦不斷要求提升,近年來32/64位元微控制器成長率有越來越高的趨勢。
CPU未来发展方向 1、CPU发展历史: 集成的晶体管数量增加,内存扩大,时钟频率增加,地址总线增加,运行速度加快,兼容性提高。总体走向运算更快,体积更小,频率更高,兼容性更好的方向。通过大规模集成电路的发展,在更小的面积上可以集成更多的晶体管,从而使运算速度迅速增长。但是当集成电路增多后,运行产生的热量会是CPU的材料硅受到影响,所以散热问题阻碍了高度集成的进程。 CPU发展史可以说Intel公司的历史就是一部CPU的发展史。 1971 年,Intel 推出了世界上第一款微处理器 4004,它是一个包含了2300个晶体管的4位CPU。 1978年,Intel公司首次生产出16位的微处理器命名为i8086,同时还生产出与之相配合的数学协处理器i8087,这两种芯片使用相互兼容的指令集。由于这些指令集应用于i8086和i8087,所以人们也把这些指令集统一称之为X86指令集。这就是X86指令集的来历。1978年,Intel还推出了具有 16 位数据通道、内存寻址能力为 1MB、最大运行速度 8MHz 的8086,并根据外设的需求推出了外部总线为 8 位的 8088,从而有了 IBM 的 XT 机。随后,Intel 又推出了 80186 和 80188,并在其中集成了更多的功能。 1979年,Intel公司推出了8088芯片,它是第一块成功用于个人电脑的CPU。它仍旧是属于16位微处理器,内含29000个晶体管,时钟频率为4.77MHz,地址总线为20位,寻址范围仅仅是1MB内存。8088内部数据总线都是16位,外部数据总线是8位,而它的兄弟8086是16位,这样做只是为了方便计算机制造商设计主板。 1981年8088芯片首次用于IBM PC机中,开创了全新的微机时代。 1982年,Intel推出80286芯片,它比8086和8088都有了飞跃的发展,虽然它仍旧是16位结构,但在CPU的内部集成了13.4万个晶体管,时钟频率由最初的6MHz逐步提高到20MHz。其内部和外部数据总线皆为16位,地址总线24位,可寻址16MB内存。80286也是应用比较广泛的一块CPU。IBM 则采用80286 推出了AT 机并在当时引起了轰动,进而使得以后的PC 机不得不一直兼容于PC XT/AT。 1985年Intel推出了80386芯片,它X86系列中的第一种32位微处理器,而且制造工艺也有了很大的进步。80386内部内含27.5万个晶体管,时钟频率从12.5MHz发展到33MHz。80386的内部和外部数据总线都是32位,地址总线也是32位,可寻址高达4GB内存,可以使用Windows操作系统了。但80386芯片并没有引起IBM 的足够重视,反而是 Compaq 率先采用了它。可以说,这是 P C 厂商正式走“兼容”道路的开始,也是AMD 等 CPU 生产厂家走“兼容”道路的开始和 32 位 CPU的开始,直到今天的 P4 和 K7 依然是 32 位的 CPU(局部64位) 1989年,Intel推出80486芯片,它的特殊意义在于这块芯片首次突破了100万个晶体管的界限,集成了120万个晶体管。80486是将80386和数学协处理器80387以及一个8KB的高速缓存集成在一个芯片内,并且在80X86系列中首次采用了RISC(精简指令集)技术,可以在一个时钟周期内执行一条指令。它还采用了突发总线(Burst)方式,大大提高了与内存的数据交换速度。 1989 年,80486 横空出世,它第一次使晶体管集成数达到了 120 万个,并且在一个时钟周期内能执行 2 条指令。
国内外研究现状及发展趋势 世界银行2000年研究报告《中国:服务业发展和中国经济竞争力》的研究结果表明,在中国有4个服务性行业对于提高生产力和推动中国经济增长具有重要意义,它们是物流服务、商业服务、电子商务和电信。其中,物流服务占1997年服务业产出的42.4%,是比重最大的一类。进入21世纪,中国要实现对WTO缔约国全面开放服务业的承诺,物流服务作为在服务业中所占比例较大的服务门类,肯定会首先遭遇国际物流业的竞争。 物流的配送方式从手工下单、手工核查的方式慢慢转变成现今的物流平台电子信息化管理方式,从而节省了大量的人力,使得配送流程管理自动化、一体化。 当今出现一种智能运输系统,即是物流系统的一种,也是我国未来大力研究的方向。它是指采用信息处理、通信、控制、电子等先进技术,使人、车、路更加协调地结合在一起,减少交通事故、阻塞和污染,从而提高交通运输效率及生产率的综合系统。我国是从70年代开始注意电子信息技术在公路交通领域的研究及应用工作的,相应建立了电子信息技术、科技情报信息、交通工程、自动控制等方面的研究机构。迄今为止以取得了以道路桥梁自动化检测、道路桥梁数据库、高速公路通信监控系统、高速公路收费系统、交通与气象数据采
集自动化系统等为代表的一批成果。尽管如此,由于研究的分散以及研究水平所限,形成多数研究项目是针对交通运输的某一局部问题而进得的,缺乏一个综全性的、具有战略意义的研究项目恰恰是覆盖这些领域的一项综合性技术,也就是说可以通过智能运输系统将原来这些互不相干的项目有机的联系在一起,使公路交通系统的规划、建设、管理、运营等各方面工作在更高的层次上协调发展,使公路交通发挥出更大的效益。 1.国内物流产业发展迅速。国内物流产业正处在前所未有的高速增长阶段。2008年,全国社会物流总额达89.9万亿元,比2000年增长4.2倍,年均增长23%;物流业实现增加值2万亿元,比2000年增长1.9倍,年均增长14%。2008年,物流业增加值占全部服务业增加值的比重为16. 5%,占GDP的比重为6. 6%。预计“十一五”期间,我国物流产业年均增速保持在15%以上,远远高于美国的10%和加拿大、西欧的9%。 2.物流专业化水平与服务效率不断提高。社会物流总费用与GDP 的比例体现了一个国家物流产业专业化水平和服务效率。我国社会物流总费用与GDP的比例在近年来呈现不断下降趋势,“十五”期间,社会物流总费用占GDP的比例,由2000年的19.4%下降到2006年的18. 3%;2007年这一比例则下降到18. 0%,标志着我国物流产业的专业化水平和服务效率不断提高。但同发达国家相比较,我国物流
ARM微处理器体系结构及其发展趋势 摘要:嵌入式微处理器是体系结构研究领域的一个热点。本文从微处理器设计者的角度出发,对在嵌入式系统当中应用广泛的32位ARM微处理器系列的体系结构作了研究和探讨,同时分析了其发展趋势。 关键词: ARM;体系结构;嵌入式微处理器;发展趋势 1. 概述 嵌入式系统一般指非PC系统,它包括硬件和软件两部分。硬件包括处理器/微处理器、存储器及外设器件和I/O端口、图形控制器等。软件部分包括操作系统软件(OS)(要求实时和多任务操作)和应用程序编程。有时设计人员把这两种软件组合在一起。应用程序控制着系统的运作和行为;而操作系统控制着应用程序编程与硬件的交互作用。 嵌入式系统的核心是嵌入式微处理器。嵌入式微处理器一般具备以下4个特点:(1)对实时多任务有很强的支持功能,能完成多任务并且有较短的中断时间;(2)具有功能较强的存储区保护功能;(3)可扩展的处理器结构,以能最迅速地开发出满足应用的各种性能的嵌入式微处器;(4)功耗很低。 嵌入式处理器的基础是通用计算机中的CPU。但在工作温度、抗电磁干扰、可靠性等方面一般都作了各种增强。具有体积小、重量轻、成本低、可靠性高的优点,芯片中往往包括少量ROM和RAM甚至一定容量的FLASH,一般还包括总线接口、常用设备的控制器、各种外设等器件,从而极大的减少了构成系统的复杂性,因此又称之为片上系统(SystemOnchip,SOC)。 ARM(AdvancedRISCMachine)是英国ARM公司设计开发的通用32位RISC微处理器体系结构,其主要优势在于简单的设计和高效的指令集。ARM的设计目标是微型化、低功耗、高性能的微处理器实现。目前,ARM微处理器家族在嵌入式系统、掌上电脑、智能卡和GSM中断控制器等领域获得了广泛地应用,几乎占据了嵌入式处理器的半壁江山。 2. ARM体系结构 作为一种RISC体系结构的微处理器,ARM微处理器具有RISC体系结构的典型特征。还具有以下特点: (1)在每条数据处理器指令当中,都控制算术逻辑单元(ALU)和移位器,以使ALU 和移位器获得最大的利用率; (2)自动递增和自动递减的寻址模式,以优化程序中的循环; (3)同时Load和Store多条指令,以增加数据吞吐率; (4)所有指令都条件执行,以增大执行吞吐量。 这些是对基本RISC体系结构的增强,使得ARM处理器可以在高性能、小代码尺寸、低功耗和小芯片面积之间获得好的平衡。 作为一种RISC微处理器,ARM指令集的效率比基于CISC的系统高得多。指令集由11个基本指令类型组成,两种用于片上ALU、环形移位器和乘法器,3种用于控制存储器和寄存器之间的数据传送,另外3种控制执行的数据流和特权级别。最后3种指令用于控制外部协处理器,这使得指令集的功能可以在片外得到扩展。对于一些高级语言的编译器来说,ARM 的指令集是比较理想的。而且汇编器的编码也非常简单。ARM指令集的另一个特征是所有的
摘要:随着集成电路设计水平和ic制造工艺水平的快速发展,在单芯片上集成微电子应用产品所需的所有功能的系统芯片(soc)得到广泛应用。系统芯片(soc)开发的核心是微处理器ip 核,实际上多数公司和研究机构不具备开发自己的处理器的能力,较为普遍的做法是购买已成产品的微处理器ip核,但是这需要支付为数不少的使用许可费用。还有另一种选择,即使用开放源代码的微处理器ip核。本文介绍了leon系列微处理器的软核架构、在soc设计中的优势以及片上总线。 关键词:leon;可配置性;可移植性;amba 1leon软核架构介绍 leon软核是一个与sparc v8兼容的整数处理单元iu(integer unit),leon2是5级流水线,leon3是7级流水线。leon3微处理器具有以下特点: ●七级流水线结构; ●具有硬件乘法/除法和mac功能; ●独立的指令和数据cache(哈佛结构); ●可根据需求灵活配置cache的容量; ●片上总线使用amba2.0规范,支持apb和ahb标准; ●具备一些片上常用外设(如uart、中断控制、i/o接口、实时时钟、看门狗等)。leon3微处理器软核的可配置体系架构如图1所示。 除了关键的微处理器外,外围模块也是制约系统性能的重要因素,在本文主要介绍以下几个模块: fpu和协处理器leon3提供浮点单元的接口和一个自定义的协处理器。有两个可用的fpu 控制器,一个是用于高性能的grfpu,另一个是用于meiko fpu。只要不存在数据或者资源的依赖,浮点处理器、协处理器以及整数单元的并行执行并不会阻碍操作。 内存管理单元mmu内存管理单元mmu(memory management unit)遵循所有的sparc v8的规范,实现了32位虚拟地址和36位物理存储器的映射。mmu可配置多达64个完全关联tlb 入口,用于访问正在运行的硬件和软件代码,方便后期调试。 2leon在soc芯片开发中的优势 leon微处理器具有良好的综合性能,使用dhrystone 2.1测试平台对其进行测试时,其运算速度可以达到0.85 mips/mhz。 leon软核最突出的优势是其良好的可配置性和可移植性,以及遵循gpl许可证协议的开源性。 开源性基于gpl许可证协议,leon非容错版本软核ip提供vhdl源代码,仅是容错版本的leon软核需要商业授权。源代码公开使研究者和开发者从根本上研究软核的细节从而定制满足具体应用的软核成为可能。 可配置性 leon软核有一套非常丰富的接口和运算单元ip核库,用户可以根据自己的需要对leon软核的绝大多数模块进行配置,以达到性能、功耗和面积的平衡和优化。软核iu 可以配置流水线深度、地址和数据高速缓存;外围设备可以挂载在amba总线上;而硬件加速单元可以根据需求集成。 可移植性 leon软核通过层次分明的vhdl模型实现。通过vhdl中特定的配置接口,leon 核的关键参数(例如修改cache的大小和组织方式,乘法器的生成,速度、芯片面积的调整以及容错方案的选择)都能够灵活的设置和移植。
目录 1 CPU概念阐述 2 指令集架构的代表 3 国内CPU产品简介 4 海光不中科曙光 5 重点公司投资机会分析
指令计数器 存储单元 指令地址 代码段 指令 控制单元 控制指令 数据段 操作数地址 数据 数据 指令寄存器 运算器 输入设备 输出设备 控制器 秳序 CPU 的概念及其工作原理 ? 中央处理器(CPU ),是电子计算机的运算核心和控制核心。 ? 功能主要是解释计算机指令以及处理计算机软件中的数据。 ? 中央处理器主要包括运算器和高速缓冲存储器,及相关数据、总线。 ? 物理结构包括运算逡辑部件、寄存器部件和控制部件等。 操作命 数据 令 存储器 数据信号 控制信号 结果 反 控 馈 地 指 控 制 信 址 令 制 信 号 信 号 号 内存 请求信号 请求信号 CPU 运算单元 迕秳 指令1 指令2 指令3 … 指令n 数据1 数据2 … 数据m 中央处理器工作原理图
CISC 与RISC 对比 CPU 的两种指令集架构(x86 vs ARM ) ? 目前CPU 主要有两种指令集架构: ? 复杂指令集架构CISC (Complex Instruction Set Computer ):x86 ? 精简指令集架构RISC (Reduced Instruction Set Computer ):ARM 、MIPS 和RISC-V ? 为了使计算机的性能更快更稳定,人们对计算机指令系统的构造迕行了调整。最初,通过设 置一些功能复杂的指令,把原来软件的常用功能改用硬件的指令系统实现,以提高执行速度 ,即CISC 。另一种方法是尽量简化计算机指令功能,只保留那些功能简单的指令,而把较 复杂的功能用一段子秳序来实现,即 RISC 。 ? CISC 和RISC 是设计制造微处理器的两种典型技术,虽然都是在诸多因素中寻求平衡,以达 到高效的目的,但采叏的方法丌同导致二者在很多方面差异巨大。 CISC RISC 指令系统 丰富,有与用指令来完成特定的功能 对经常使用的指令设计得简单高效 存储器操作 指令多,操作直接 操作有陉制,控制简单化 秳序 编秳需要较大内存,实现特殊功能时秳序复杂,丌易设计 编秳相对简单,科孥计算及复杂操作的秳序设计相对容易,效率较高 CPU 包含丰富的电路单元,功能强、面积大、功耗大 包含较少的电路单元,面积小、功耗低 设计周期 微处理器结构复杂,设计周期长 微处理器结构简单,布局紧凑,设计周期短 用户使用 结构复杂,功能强大,实现特殊功能容易 结构简单,指令规整,性能容易把握,易孥易用 应用范围 适合亍与用机 适合亍通用机
中国近年来经济发展的现状及趋势 进入21世纪之后,中国的经济环境有了很大的变化。从国 际形势看,欧元区国家的经济合作已经启动,但发展前景不明朗;美国自从经历“9.11”事件之后本国经济陷入低迷,至今尚未全 面恢复;日本经济则长期低速徘徊.尽管我国政府采取了一系列 积极的措施,例如:正式加入WTO;推动APEC的发展和中国——东盟自由贸易区的发展;加强同中亚国家的合作等;但整体外部形势依然严峻。这就需要我们从内部经济入手,找到推动经济增长的有效方法和途径。在国内经济中,由于存在众多的问题,无法一一列举,所以本文试图从通货膨胀、失业、GDP的增长几个方面来探讨影响中国经济的原因,并且试图找出解决问题的方法和途径。 一、对三条曲线的复合与分析 (一)三条曲线在一个坐标系中的复合:图一(% (二)三条曲线各自特点的分析 A、GDP增长率曲线 1、曲线走势:最近中国十几年的GDP增长率变动呈现前快后慢的特点。在第一个阶段,1991——1996年,GDP增长保持在一个较高的水平,平均达到11.6%;而在第二个阶段,1997——2001年间,GDP增长保持平稳中速的增长趋势,平均达到 7.8%。前后两个阶段平均增长率差异较大,呈现出比较明显的 阶段性特点。 2、原因
1)、1991——1996年的经济高速增长主要是基于以下方面: 第一,经历了二十世纪八十年代末的经济衰退,当时称之为“市 场疲软”之后,中央政府采取了一系列积极的财政、货币政策, 推动了经济的快速增长;第二,邓小平同志的南巡,一方面澄清 了许多人认识上的误区,另一方面,他以个人的远见,在宏观上 为中国创造了一种宽松、积极的氛围,加速了经济的增长。 2)、1997——2001年经济增速下降,主要是以下原因:首先,在经历了1991——1996年的经济高速增长之后,一些经济指标过热,造成诸如通货膨胀水平过高等方面的问题。所以国家在宏观上需要执行一套稳健、收缩的财政、货币政策。其次,1997年爆发的亚洲金融危机虽然没有对我国经济造成直接破坏,但也严重地影响了我国的整体外贸环境。重要表现之一就是传统东南亚国家进口市场的缩小,外贸行业整体效益的下滑,对我们这个外贸依存度非常高的国家来说,对经济增速的下降造成了实际的 压力。第三,为了适应经济全球化和加入WTO的要求,我国陆续开放了一批部门和行业,大力下调平均关税水平;这一系列的举措使国内原本受到很大程度保护的许多产业顿时感受到巨大 的压力,使得这些传统上的经济增长点在实际推动经济增长时显 得力不从心。 B、通货膨胀水平曲线 1、曲线走势:1992——2001年中国通货膨胀水平呈现先 高后低、先正后负的情况,同样具有阶段性的特点。1992——1996年间,平均商品零售物价指数保持在12.2%,而1997——2001年其平均水平仅为-0.6%。两个阶段相差13%,这种有趣的现象非常值得我们研究。 2、原因
微型计算机和微处理器的发展 本篇报告的目的讲述微型计算机和微处理器的发展史,以此来深化对计算机功能结构的认识,并进一步了解计算机工作的模式,在此基础上对未来的计算机发展做一个合理的推测和预期。其实微型计算机的发展和微处理器的发展其实是紧密结合,密不可分的,微型计算机的发展主要表现在其核心部件——微处理器的发展上,每当一款新型的微处理器出现时,就会带动微机系统的其他部件的一并发展,比如在微机体系结构上,存储器存取容量、存取速度上,以及外围设备都在不断改进,在此基础上新设备也在不断出现并推动微型计算机的进一步发展。 第一篇 微机的发展上根据微处理器的字长和功能,将微型计算机的发展简单划分为以下几个阶段。 第一阶段: 概述:4位和8位低档微处理器(第1代) 基本特点:采用PMOS工艺,集成度低(4000个晶体管/片), 指令系统:系统结构和指令系统简单,主要采用机器语言或简单的汇编语言,指令数目少,基本指令周期为20~50μs,用于简单的控制场合。 举例:Intel4004和Intel8008微处理器和分别由它们组成的MCS-4和MCS-8微机 第二阶段: 概述:8位中高档微处理器(第二代) 特点:采用NMOS工艺,集成度提高约4倍,运算速度提高约10~15倍 指令系统:比较较完善,具有典型的计算机体系结构和中断、DMA等控制功能 软件方面:除汇编语言外,还有BASIC、FORTRAN等高级语言和相应的解释程序和编译程序,在后期出现操作系统。 举例:Intel8080/8085、Motorola公司、Zilog公司的Z80 第三阶段: 概述:16位微处理器(第三代) 特点:用HMOS工艺,集成度(20000~70000晶体管/片)和运算速度都比第2代提高了一个数量级 指令系统:指令系统更加丰富、完善,采用多级中断、多种寻址方式、段式存储机构、硬件乘除部件,并配置了软件系统 产品举例:Intel公司的8086/8088,Motorola公司的M68000,Zilog公司的Z8000 第四阶段: 概述:32位微处理器(第四代) 产品举例:Intel公司的80386/80486,Motorola公司的M69030/68040 基本特点:采用HMOS或CMOS工艺,集成度高达100万个晶体管/片,具有32位地址线和32位数据总线 评价:微型计算机的功能已经达到甚至超过超级小型计算机,完全可以胜任多任务、多用户的作业 第五阶段: 概述:奔腾系列微处理器(第5代) 产品举例:Intel公司的奔腾系列芯片及与之兼容的AMD的K6系列微处理器芯片 特点:AMD与Intel分别推出来时钟频率达1GHz的Athlon和PentiumⅢ。00年11月,Intel又推出了Pentium4微处理器,集成度高达每片4200万个晶体管,主频为1.5GHz。2002
现代仪器综述 学院: 专业: 班级: 姓名: 学号:
前言: 现代仪器仪表技术是一门集电子技术、单片机技术,自动化仪表、自动控制技术、计算机应用等于一体的跨学科的专业技术。自20世纪90年代初以来,这项技术已逐步引入到国内工科专业中的电子信息、通讯、自动化、计算机应用等信息类专业中。随着微电子技术和计算机技术的飞速发展,测控仪器仪表的智能化、总线化、网络化发展已在各个相关行业呈现出广阔的发展前景,同时也日益成为工程界和科技界人士所关注的重要问题之一。因此,了解和熟悉现代智能仪器仪表的特点功能,发展趋向及其应用前景是十分重要和必要的。 一:现代仪器仪表概念 近些年来,随着微处理器和单片机的发展和广泛应用,出现了一种新型的专用仪器——现代智能仪器。这种仪器一微处理器或单片机为核心,具有信息采集、显示、处理、传输以及优化检测与控制等多种功能。有些甚至还具有专家推断、逻辑分析与决策的能力。智能仪器的出现,极大地扩充了常规仪器的应用范围。由于现代智能仪器一开始就显示它强大的生命力,目前已成为仪器仪表发展的一个主导方向。它的不断发展对自动控制、电子技术、国防工程、航天技术与科学实验等将产生极其深远的影响。现代智能仪器是含有微型计算机或者微型处理器的测量仪器,拥有对数据的存储运算逻辑判断及自动化操作等功能。现代智能仪器的出现,极大地扩充了传统仪器的应用范围。现代智能仪器凭借其体积小、功能强、功耗低等优势,迅速地在家用电器、科研单位和工业企业中得到了广泛的应用。 二:现代仪器仪表的功能特点 随着微电子技术的不断发展,集成了CPU、存储器、定时器/计数器、并行和串行接口、看门狗、前置放大器甚至A/D、D/A转换器等在一块芯片上的超大规模集成电路芯片(即为主体,将计算机技术与测量控制技术结合在一起,又组成了所谓的“现代智能化测量控制系统”,也就是现代智能仪器。与传统仪器仪表相比,智现代能仪器具有以下功能特点: 1)操作自动化。仪器的整个测量过程如键盘扫描、量程选择、开关启动闭
2016-2017年第1学期 CPU的发展趋势 学院:电子信息与电气工程学院专业班级:通信工程2 0 1 4 级1班姓名: 学号: 指导教师: 2016年10月
CPU的发展趋势 摘要CPU是计算机的核心部件,CPU的性能当然能够体现出现代化社会计算机的发展程度。为了能满足计算机市场的需求,研究人员不断的对CPU进行更新迭代,来使CPU 的性能得以提高。本文通过对CPU发展历史的研究,和对现状的分析来对CPU的发展趋势进行探讨。 关健词 CPU 性能发展历史发展趋势 一、CPU的概述 CPU中文名是中央处理器,是计算机的核心部位,在计算机的运行中主要负责对指令的执行和数据的处理。在CPU 的内部由上百万个微型的晶体管共同组成控制单元、逻辑单元和存储单元。CPU 在计算机中主要的功能有以下四个方面: (1)处理指令 这是指控制程序中指令的执行顺序。程序中的各指令之间是有严格顺序的,必须严格按程序规定的顺序执行,才能保证计算机系统工作的正确性工作。 (2)执行操作 一条指令的功能往往是由计算机中的部件执行一序列的操作来实现的。CPU要根据指令的功能,产生相应的操作控制信号,发给相应的部件,从而控制这些部件按指令的要求进行动作。 (3)控制时间 时间控制就是对各种操作实施时间上的定时。在一条指令的执行过程中,在什么时间做什么操作均应受到严格的控制。只有这样,计算机才能有条不紊地工作。 (4)处理数据 即对数据进行算术运算和逻辑运算,或进行其他的信息处理。 其功能主要是解释计算机指令以及处理计算机软件中的数据,并执行指令。在微型计算机中又称微处理器,计算机的所有操作都受CPU控制,CPU的性能指标直接决定了微机系统的性能指标。CPU具有以下4个方面的基本功能:数据通信,资源共享,分布式处理,提供系统可靠性。运作原理可基本分为四个阶段:提取、解码、执行和写回。 二、CPU 的发展历史 1971年。世界上第一块微处理器4004在Intel公司诞生了。它出现的意义是划时代的,比起现在的CPU,4004显得很可怜,它只有2300个晶体管,功能相当有限,而且速度还很慢。 1978年,Intel公司首次生产出16位的微处理器命名为i8086,同时还生产出与之相配合的数学协处理器i8087,这两种芯片使用相互兼容的指令集。由于这些指令集应用于i8086和i8087,所以人们也把这些指令集统一称之为X86指令集。这就是X86指令集的来历。 1979年,Intel公司推出了8088芯片,它是第一块成功用于个人电脑的CPU。它仍旧是属于16位微处理器,内含29000个晶体管,时钟频率为4.77MHz,地址总线为20位,寻址范围仅仅是1MB内存。8088内部数据总线都是16位,外部数据总线是8位,而它的兄弟8086是16位,这样做只是为了方便计算机制造商设计主板。 1981年8088芯片首次用于IBM PC机中,开创了全新的微机时代。 1982年,Intel推出80286芯片,它比8086和8088都有了飞跃的发展,虽然它仍旧是16位结构,但在CPU的内部集成了13.4万个晶体管,时钟频率由最初的6MHz逐步提高到20MHz。其内部和外部数据总线皆为16位,地址总线24位,可寻址16MB内存。80286也是应用比较广泛的一块CPU。
微型计算机技术发展综述 自20世纪40年代世界上第一台计算机ENIAC(Electronic Numerical Integrator and Computer) 在美国宾夕法尼亚大学问世以来,微型机以其执行结果精确、处理速度快捷、性价比高、轻便小巧等特点迅速进入社会各个领域。此外,微型机技术发展、产品更新换代迅速,从单纯的计算工具发展成为能够处理数字、符号文字、语言、图形、图像、音频、视频等多种信息的强大多媒体工具,微型计算机现已经用于信息处理、事务管理、过程控制、仪器仪表控制、通信技术与计算机网络等各行各业。便携机更是以便于携带、使用方便等优点以及发展需要越来越受移动办公人士、学生等群体所喜爱。现如今微型计算机的应用已深入到社会的各个角落,极大地改变着人们的工作、学习和生活方式,成为信息时代的主要标志。 2 微型计算机系统的组成 微型计算机系统,简称“微机系统”。它可以简单地定义为:在微型计算机硬件系统的基础上配置必要的外围设备和软件构成的实体。 微型计算机系统从局部到全局分为三个层次:微处理器(CPU)、微型计算机、微型计算机系统。微处理器是指由一片或者几片大规模集成电路组成的具有运算器和控制器功能的中央处理器部件;微型计算机是以微处理器为核心,配上存储器、输入/输出接口电路及系统总线所组成的计算机(又称主机);而微型计算机系统则是以微型计算机为中心,以相应的外围设备、电源和辅助电路(统称硬件)以及
指挥微型计算机工作的系统软件所构成的系统。 由此可知单纯的微处理器和单纯的微型计算机都不能独立工作,只有微型计算机系统才是完整的信息处理系统,才具有直接的使用意义。 完整的微型计算机系统由硬件和软件组成。硬件系统由运算器、控制器、存储器、、输入/输出接口、总线以及外部设备等构成。 软件系统通常分为系统软件、应用软件两大类。系统软件是指不需要用户干预,能生成、准备和执行其他程序所需的一组程序。主要包括:操作系统、程序设计语言、数据库管理系统、联网和网络管理系统软件。应用软件是指除了系统软件以外,利用计算机为解决某类问题而设计的程序的集合,主要包括信息管理软件、辅助设计软件、实时控制软件等。简单概括为:系统软件支持机器运行,应用软件满足业务需求。 3 微型计算机的结构及工作原理 3.1 微型计算机的结构 目前的各种微型计算机系统,从硬件体系结构来看,采用的基本上是计算机的经典结构——冯·诺依曼结构。这种结构的特点是:由运算器、控制器、存储器、输入、输出设备五大部分组成。 数据和程序以二进制代码形式不加区别地存放在存储器中,存放位置由地址指定,地址码也为二进制形式。 控制器是根据存放在存储器中的指令序列即程序来工作的,由程序计数器(即指令地址计数器)控制指令的执行。控制器具有判断能
CPU的发展历程和趋势 文计081-2班李香 200890513216号 CPU是Central Processing Unit(中央微处理器)的缩写,它是计算机中最重要的一个部分,由运算器和控制器组成。它的发展非常迅速,个人电脑从8088(XT)发展到现在的Pentium 4时代,只经过了不到二十年的时间。从生产技术来说,最初的8088集成了29000个晶体管,而PentiumⅢ的集成度超过了2810万个晶体管;CPU的运行速度,以MIPS(百万个指令每秒)为单位,8088是0.75MIPS,到高能奔腾时已超过了1000MIPS。CPU的内部结构归纳起来可分为控制单元、逻辑单元和存储单元三大部分,这三个部分相互协调,对命令和数据进行分析、判断、运算并控制计算机各部分协调工作。按照其处理信息的字长,CPU可以分为: 4位微处理器、8位微处理器、16位微处理器、32位微处理器以及正在酝酿构建的64位微处理器。 Intel 8086/8088:1978年英特尔公司生产的8086是第一个16位的微处理器.8086微处理器最高主频速度为8MHz,具有16位数据通道,内存寻址能力为1MB。1979年,英特尔公司又开发出了8088。8086和8088在芯片内部均采用16位数据传输,所以都称为16位微处理器,但8086每周期能传送或接收16位数据,而8088每周期只采用8位。8088采用40针的DIP封装,工作频率为6.66MHz、7.16MHz或8MHz,微处理器集成了大约29000个晶体管。8086和8088问世后不久,英特尔公司就开始对他们进行改进,他们将更多功能集成在芯片上,这样就诞生了80186和80188。这两款微处理器内部均以16位工作,在外部输入输出上80186采用16位,而80188和8088一样是采用8位工作。1981年8088芯片首次用于IBMPC机中,开创了全新的微机时代。最早的i8086/8088是采用双列直插(DIP)形式封装,从i80286开始采用方形BGA扁平封装(焊接),从 i80386开始到Pentiumpro开始采用方形PGA(插脚),1982年,INTEL推出了80286芯片,该芯片含有13.4万个晶体管,时钟频率由最初的6MHz逐步提高到20MHz。其内部和外部数据总线皆为16位,地址总线24位,可寻址16MB内存。 Intel 80286:1982年,英特尔公司在8086的基础上研制出了80286微处理器,该微处理器的最大主频为20MHz,内、外部数据传输均为16位,使用24位内存储器的寻址,内存寻址能力为16MB。80286可工作于两种方式,一种叫实模式,另一种叫保护方式。80286集成了大约130000个晶体管。8086~80286这个时代是个人电脑起步的时代,当时在国内使用甚至见到过PC机的人很少,它在人们心中是一个神秘的东西。到九十年代初,国内才开始普及计算机。它除具有实模式和保护模式外,还增加了一种叫虚拟86的工作方式,可以通过同时模拟多个8086处理器来提供多任务能力。