| 多核之路(一) - 高度整合的架构 |
| 作者/vi 时间/2006-4-26 10:20:00 类别/技术 查看/ |
| 标签:CPU |
|
P.A.Semi公司的PWRficient处理器在去年微处理器论坛(MPF2005)上正式揭晓。对于P.A.Semi这个名字,相信所有人都感到陌生,这家专门从事RISC处理器设计的技术型企业成立于2003年,创始者都是微处理器业界的顶尖人物。其CEO曾负责Alpha服务器芯片和StrongARM手持机芯片的开发;负责技术的副总裁科勒也曾从事Alpha芯片的开发,后来进入AMD公司帮助定义了Opteron芯片的架构;另一负责架构的副总裁皮特同样曾为Alpha架构服务,在DEC公司发生的数次并购中先后进入康柏、惠普和英特尔。在MPF2005论坛上,P.A.Semi公司对外公布其设计的双核心PWRficient处理器,高度整合的设计令外界耳目一新,并兼具低功耗和高性能两大特性。该公司同时表示,PWRficient弹性的架构可被方便扩展到八核心或用于超级计算机系统,在高端服务器领域颇具竞争力。 在设计PWRficient之时,P.A.Semi面临的第一个问题就是指令系统的选择,X86无疑更加流行、市场更广阔,但该领域被英特尔、AMD把持,机会有限,加上X86指令系统复杂低效,与PWRficient的高端定位相悖。P.A.Semi最终选择了IBM的Power架构,这样PWRficient处理器便成为IBM Power大家族中的一个新成员。但除此之外,PWRficient与IBM的Power芯片并没有太多的共同点,它拥有一套极富弹性的架构、高度整合以及低功耗特性。PWRficient主要定位在刀片服务器和低运营成本的服务器集群,P.A.Semi公司将英特尔的Sossaman Xeon处理器(Yonah架构)作为主要的竞争对手。 我们先来看看PWRficient的系统架构,如图1,我们可以看到,PWRficient与通常的处理器逻辑非常不同,除了CPU内核和二级缓存外,它还包括一个名为ENVIO的智能型I/O子系统。换句话说,PWRficient上包含CPU和ENVIO I/O子系统等两大逻辑,两者通过一个名为CONEXIUM Interchage的高速交换总线联结为一个有机系统。CPU部分为两个代号为PA6T的64位Power CPU内核,运行频率为2GHz。与其他双核芯片不同的是,PWRficient的每一个 PA6T内核都拥有自己的DDR2内存控制器,但两者是以相互独立的模式而非组成共享的双通道。此种设计的好处在于每个CPU内核都能拥有属于自己的内存资源,最大限度降低内存抢占的几率。每个CPU内核都可支持64位或32位模式运作,具有诸如超标量、乱序执行、三发射等技术特性。另外,PA6T内核也都直接整合了硬件级的虚拟技术支持,可以在多套系统同时运行时仍保持出色的性能。PA6T内核整合了64KB指令缓存和64KB数据缓存,而两个PA6T核心再共同分享2MB容量的二级缓存。PWRficient并没有采用类似Xeon的大缓存方案,原因就在于它的每个核心都有自己的内存,出现内存抢占的几率远低于共享总线的落后设计。 两个PA6T核心、2MB二级缓存和两个DDR2内存控制器都是通过CONEXIUM Interchage交换总线联结为一体,如果未来有需要,也可以在这条交换总线上联结四个内核甚至八个内核。但CONEXIUM的功能不仅于此,PWRficient处理器中的ENVOI I/O子系统也是通过这套总线与CPU逻辑直接通讯。与我们通常所见的固定模式不同,ENVOI相当灵活且富有弹性,它直接整合了八个PCI Express控制器(每个控制器提供4GBps带宽)、两个10GbE网络控制器(万兆以太网)和四个GbE(千兆以太网)控制器,这三部分I/O逻辑共享24对串行传输线路。设备制造商可根据自身情况对这24对串行线路进行灵活配置,例如在NAS网络存储系统中,可以让连接磁盘系统的PCI Express传输获得更多线路资源,如果需要多端口的网络访问,那么便可以将线路资源朝向10GbE和GbE系统倾斜。这种高度弹性的架构让制造商拥有宽松的设计空间,可以根据企业的不同需要定制出最科学的服务器系统。而这种高度整合设计还有一个益处在于:无论是PCI Express系统还是网络系统,数据传输时的总线延迟都极短,进而获得卓越的数据传输效能。尽管PWRficient专门针对服务器应用,但它的设计思想对于X86产品仍然十分有借鉴意义。AMD计划在下一代处理器架构中引入类似的高度整合设计,直接内建PCI Express控制器,以提高系统的数据传输性能。事实上,整个芯片组的功能都可以被处理器所整合,这对于芯片组厂商而言显然不是什么好消息。 除了高度整合设计外,卓越的每瓦性能也是PWRficient处理器的主要卖点之一。PWRficient的核心频率为2GHz,芯片最高能耗区区25瓦,平均运行能耗甚至仅有5W的超低水平。IBM公司将重点放在高性能的Power 5/6和游戏机领域,对低功耗芯片重视不足,PWRficient便不会与IBM的产品有什么冲突。P.A.Semi公司将英特尔Sossaman核心的低功耗型Xeon作为主要对手,尽管Sossaman基于效率出众的Yonah架构,但它的能源效率远无法同PWRficient相提并论。PWRficient 2GHz的实际性能略高于Sossaman Xeon 2.5GHz,但后者的能耗达到73瓦,整整比PWRficient高出两倍。对服务器系统而言,低功耗芯片的意义不仅在于散热更佳,最大的好处在于能够节约出可观的运营成本。P.A.Semi公司作出了详细的对比:如果要构建一套运算速度达到32TFLOPS标准的服务器集群,需要使用6400枚Sossaman Xeon处理器,连带配套芯片组、万兆网卡等组件,整套集群的能耗将达到467200瓦;而如果转用PWRficient平台,只需4000枚芯片就能够实现相同的性能,由于主要功能都被CPU直接集成,配套的芯片组也变得简单,整个集群的功耗只有92000瓦,相当于英特尔Sossaman Xeon平台的1/5,集群的空间占用、散热系统费用也更为低廉。如果选择PWRficient平台,集群系统的运营费用可以被大幅度削减,对本例的32TFLOPS集群系统而言,就是每年可节约出至少100万美元运营费用,PWRficient的优势十分明显。 PWRficient将采用IBM的65纳米SOI工艺进行制造,P.A.Semi公司计划在下半年推出处理器样品,2007年正式上市。该芯片的主要销售对象包括服务器厂商、网络设备厂商,甚至还包括家电厂商,尤其在刀片服务器和服务器集群系统中,PWRficient具有明显的优势。但光有优秀的产品不足以说明问题,P.A.Semi只是一家小规模的技术型公司,自身没有服务器制造和推广力量,只有获得服务器厂商的支持才能够将PWRficient推向实用化。而对IBM来说,既然没有更多的精力来开发低功耗Power芯片,将P.A.Semi收归旗下不失为一个好选择。 图1 PWRficient处理器的逻辑架构,整合了大量的I/O功能,堪称一款SOC(片上系统)型芯片。 |
| 查看该用户更多文章>> |
