E X P

  • 编辑
  • 评论
  • 标题
  • 链接
  • 查错
  • 图文
  • 拼 命 加 载 中 ...

     

    模组化设计再建新功,CPU中塞进GPU

    模组化设计的Nehalem微架构,可灵活组合

      英特尔在去年发布的Nehalem微架构非常成功,关键在于它采用可扩展的技术,每个处理器单元均采用了Building Block模组化设计,组件包括有:核心数量、SMT功能、L3缓存容量、QPI连接数量、IMC数量、内存类型、内存通道数量、整合GPU、能耗和时钟频率等,这些组件均可自由组合,以满足多种性能需求,比如可以组合成双核心、四核心甚至八核心的处理器。

      正因为这样的模组化设计,英特尔可以灵活的制造出各种差异化的核心,比如在CPU中加入三通道DDR3内存控制器就是Bloomfield核心(研发代号,Core i7-900系列),加入双通道DDR3控制器和PCI-E 2.0控制器就变成了Lynnfield核心(Core i7-800/i5-700系列)。

    1月8日,英特尔推出2010全新Core(酷睿)处理器家族

      到了2010年,英特尔将GPU图形单元和CPU核心组合在一起,再加上双通道DDR3控制器和PCI-E 2.0控制器,搭配出了全新的Clarkdale核心(Core i5-600/i3-500系列),也就是本文的主角。严格上说,Clarkdale核心是基于Westmere微架构的,不过Westmere只能算是Nehalem的轻微改良版。

      Clarkdale是CPU史上首款整合有GPU的处理器,同时也是首款采用32nm制程技术的CPU,具有开创性的历史意义

      在2010年1月8日,英特尔正式发布了Clarkdale核心的处理器,这样它与之前上市的Bloomfield核心和Lynnfied核心处理器组成了全新的Core(酷睿)处理器家族,即Core i7/i5/i3系列处理器,形成一个完整的高中低产品线。

      Core i7以英特尔桌面旗舰处理器的身份统领高端消费市场,Core i5则是中端桌面处理器的领军人物,Core i3定位于Core家族入门处理器。在Core品牌之后,还有经典的Pentium品牌主导普通应用,Celeron系列提供入门级的解决方案,Atom处理器则是为上网本和手持设备量身定造。

    Clarkdale:首款32nm制程CPU

      英特尔的“Tick-Tock”战略众所周知,“制程技术-微架构”交替更新,比如说在2008年将CPU制程技术升级到了45nm,在2009年将微架构升级到了Nehalem,在2010年伊始,英特尔就非常精准地将制程提升到了32nm,Clarkdale乘此东风,成为首款采用32nm制程技术的处理器。

    Intel 首次在45nm制程中使用了High-K+Metal Gate技术,漏电情况大幅降低

      在45nm制程中,英特尔首次使用了High-K栅极介质和Metal Gate金属栅极,也就是“HK+MG”技术,使得晶体管漏电率大幅降低,具有非常出色的表现。

      英特尔在32nm制程中,将“HK+MG”技术发展到第二代,同时改用第四代Strained Silicon( 应变矽) 技术,用SiGe、Dual-Stress Strained Silicon( 双应力应变矽) 以及先进的应变记忆技术,能够有效提高晶体管的开关速度和电源效率,这样可以让处理器频率和功耗获益匪浅。

      32nm中的High-K等价氧化物厚度从45nm的1.0nm下降到0.9nm,Gate length(栅级长度)达到30nm,Gate Pitch(栅极间距)从160nm下降到只有112.5nm,也是有史以来最紧密的栅极间距。从性能上来看,与45nm制程相比,NMOS晶体管的漏电量减少5倍多,PMOS晶体管的漏电量则减少10倍以上,驱动电流也达到史上最高,晶体管整体性能提升22%,同比封装尺寸是45nm工艺产品的70%。

      Clarkdale的诞生,正式宣告了处理器制程工艺又向前迈进一大步。而且制程技术的提升,是微架构进步的基石,明年,基于32nm制程技术的Sandy Bridge新架构尤其令人期待。

    Clarkdale:首款整合GPU的CPU

      AMD在收购ATI后,首先提出了CPU与GPU融合的概念,然而一直停留在“纸上谈兵”的阶段。英特尔后发却先至,发布了首款整合GPU图形单元的处理器Clarkdale。

    一颗CPU里其实有两颗“芯”

      但是现阶段的Clarkdale处理器,只是简单的将GPU和CPU封装在一起,并没有真正达到“融合”,一颗CPU里其实有两颗“芯”。这样双“芯”独立并存的方式可能是未来很长一段时间内的主流。

      我们需要特别注意的是,Clarkdale中的CPU核心是采用的32nm制程技术,而GPU核心还是采用的45nm制程。两个核心采用MCP(Multi-Chip Package)的方式封装在一起。

      英特尔解释说,32nm制程Westmere处理器微架构比预期提早成熟,因此直接更新CPU核心至32nm的Westmere,图形核心还是停留在45nm制程,这样可以让Clarkdale尽早上市。另外,CPU核心与GPU图形核心是分开研发,如果全新GPU图形核心完成研发,英特尔可以将之取代旧有GPU芯片,并配合现有的x86处理器一同封装,立即应市。如此一来产品升级更具弹性,更能发挥Building Block模块化设计的优势。

    Clarkdale内核结构图

      从上面这张结构图可以很清楚看到Clarkdale的内部构造,它主要由CPU Die和GPU Die两个核组成。CPU核内包含有两个处理器内核,每个内核独享256KB的L2Cache,共享4MB的L3 Cache。原来和CPU内核一起封装的内存控制器和PCI-E 2.0控制器这次都移到了GPU核中,除此之外,GPU核中还有GPU内核以及DMI(Direct Media Interface)模块,整个GPU Die更像以前整合主板的北桥芯片。

      CPU Die与GPU Die两个核之间通过高速的QPI总线进行通讯。

      45nm制程的Lynnfield(Core i7-800/i5-700系列)处理器核心大小为296mm2,晶体管数为7.74亿个,而32nm制程的Clarkdale处理器中CPU Die大小为81mm2(不含GPU Die),晶体管数为3.82亿个,除了制程上的影响外,CPU Die不再包含内存控制器和PCI-E控制器,再加上核心和L3 Cache只有Lynnfield的一半,使得CPU Die的大小和晶体管数急剧减少。对于GPU Die来说,其大小为114mm2,晶体管数为1.77亿个。

    Westmere:Nehalem微架构的改良版

      Clarkdale核心处理器采用的是Westmere微架构,Westmere实际上是脱胎于大名鼎鼎的Nehalem微架构,并作了少少的增强设计,可以看作是Nehalem的改良版。

    Westmere微架构最主要的改进在于增加了AES指令集

      Westmere继承了Nehalem微架构的优秀设计,虽然Nehalem仍是基于上一代Core微架构改进而来的,但它的改进是全方位的。我们可以把这些重要特性分为计算内核(Core)和非计算内核(Uncore)的上的特性。

      Nehalem在非计算内核(Uncore)方面的改进:

      · 三级包含式Cache设计——L3采用共享式设计,被片上所有内核共享
      · 放弃FSB使用QPI总线——20位宽的QPI连接其带宽可达惊人的每秒25.6GB
      · 整合内存控制器,支持多通道DDR3——内存读取的延迟大幅度减少,内存带宽大幅提升

      Nehalem计算内核(Core)方面的改进:

      · 重拾超线程技术——第三代SMT超线程技术
      · 内核加速模式Turbo Boost——根据需要开启、关闭以及加速单个或多个内核的运行
      · SSE4.2:新增7条扩展指令——加速字符串和文本处理

      我们在以前的Core i7/i5处理器解析中已对这些改进作了详细介绍,因此不再赘述,有兴趣的读者可以点击相关链接进行查阅。

      对于Westmere这个新的微架构来说,它主要的改进在于增加了7条新的指令,其中包括六条AES-NI指令和一条Carryless Multiply(PCLMULQDQ)指令。

      AES是Advanced Encryption Standard,高级加密标准的缩写,而AES-NI(New Instructions)也就是支持这项高级加密标准的x86指令集。另外增加的Carryless Multiply(PCLMULQDQ)指令可以让处理器在一个周期内处理两组64Bit的Carry-less Multiplication,这是很多加密标准所必须要处理到的部分。

      然而不是所有的Clarkdale处理器都支持这些新指令的,比如Core i3-500系列和Pentium G6950就不支持,目前只有Core i5-600系列是支持的。

    AES-NI:加速AES算法应用程序

      密码学中的高级加密标准AES(Advanced Encryption Standard),又称Rijndael加密法,是美国政府采用的一种区块加密标准,目前已然成为对称密钥加密中最流行的演算法之一。

      Westmere中增加的六条AES指令中包括了四条的加密解密指令(AESENC、AESENCLAST、AESDEC、AESDECLAST)和两条的密钥生成(AESIMC、AESKEYGENASSIST)指令,英特尔称硬件支持AES加速可以比软件快四倍以上。AES-NI不但支持三种符合AES官方规范的密钥长度(ASE128、ASE192、ASE256)和所有符合AES官方规范的运算模式,还可以支持若干种并不在AES官方规范中的算法。

    AES-NI的应用领域

      在Westmere微架构中增加新的AES指令集,旨在强化AES数学操作,因此有助于加速一些AES算法的应用程序

      就现在的应用来说,快速加密已成为许多计算任务的一部分,像全盘加密、文件存储加密、高清内容加密、互联网安全和网络电话等方面,加密解密的计算日趋繁重。

      上面那些离我们的实际应用可能比较遥远,来看看非常熟悉的WinZip压缩软件。

    WinZip具有强大的AES加密能力

      许多用户购买WinZip的主要原因是其具有功能强大且简单易用的AES加密能力,能够实现256位AES加密文件压缩。如果搭配支持AES-NI的Clarkdale处理器,就可以通过硬件支持加密作业的速度提高数倍,像7-Zip这个软件也具有AES加密功能,在后面的章节我们会就此进行针对测试。

      在去年,富士通发布了首批采用256-Bit高级加密标准AES技术的500GB硬盘MJA2 CH系列,显然这样的硬盘与Westmere微架构处理器是天衣无缝的组合。

    新一代图形核心的架构与3D特性

      在Clarkdale处理器中整合了GPU图形核心,英特尔并没有为这个GPU核心取一个正式的名字,统称为“Intel HD Graphics”。

    新旧图形核心的架构与3D特性比较

      在英特尔G45主板芯片组中整合的GPU图形核心为GMA X4500 HD,那曾经是英特尔整合图形芯片中最顶级的产品,随着Clarkdale的诞生,X4500 HD已成为历史。

      Clarkdale中整合的GPU作为新一代高清图形核心,是英特尔目前最强的GPU,但它与X4500 HD相比并没有质的飞跃,仍然是GMA(Graphics Media Accelerator)架构,相当于X4500 HD强化版。

    新的英特尔显卡控制面板

      · 新图形核心制程升到到了45nm

      硬件上最明显的变化莫过于制程上的进步,Clarkdale的图形核心已升级到了45nm制程,而GMA X4500 HD使用的是65nm工艺,更小的晶体管则意味着更高的性能和更低的功耗和发热量。所以新的图形核心频率最高可以达到900MHz(Core i5-661),X4500 HD的核心频率最高只有800MHz。

      · GPU执行单元增加到12个

    Clarkdale的图形核心的EU增加到了12个

      规格上的另一个明显变化是EU(Execution Unit,执行单元)增加到了12个,而X4500 HD核心只有10个EU,因此在运行能力的提升是不言而喻。

      · 支持动态频率调整(移动版)

    移动版Arrandale的图形核心支持动态频率

      新一代的图形核心开始支持动态频率调整,这个有点像CPU上用到的Turbo Boost技术,当CPU负荷较低而GPU负荷较高时,CPU频率会适当降低而GPU频率会达到一个比较高的值。

      不过目前这一技术还仅限于移动版芯片(Arrandale,Clarkdale对应的移动处理器)。

      · 支持Hierarchical Z和Fast Z Clear技术

    Hierarchical Z与Fast Z Clear工作示意图

      新的图形核心开始支持Hierarchical Z(层次Z缓存算法)与Fast Z Clear(快速Z清除)技术,它们是为了在3D图形渲染硬件系统中节省带宽和提高消隐效率,在像英特尔图形核心这样带宽有限的GPU中,它们的作用尤为明显。Hierarchical Z会检测出那些在最终成像画面被隐藏的像素,并在进行渲染之前就将之丢弃,而Fast Z Clear能大幅加快消隐速度。

      另外,英特尔新一代高清图形核心还加强了硬件顶点处理功能、支持OpenGL 2.1、针对Windows 7操作系统作了优化、支持双HDMI同时输出等。

      虽然新的核心3D性能得到增强,但仍然处于入门级游戏显卡的地位,大部分3D游戏只能在低画质下来运行才能确保流畅,因此不能奢望它的游戏性能会有翻天覆地的变化。

    新一代图形核心的多媒体特性

      除了上一节介绍到的在3D架构上的改进外,Clarkdale的图形核心在多媒体功能上也得到了很大的增强,比如说开始支持双流解码、xvYCC色域标准、杜比True HD和DTS-HD MA音频等。

    新旧图形核心的多媒体特性比较

      · 支持Dual Video Decode

      Dual Video Decode(双视频解码)其实等同于NVIDIA/AMD显卡中的Dual-Stream Decode(双流解码),它能在播放HD/BD时让GPU同时处理两个不同视频流,以降低CPU占用率,比如你可以一边观看正片,一边浏览一些拍摄花絮等。

      · 支持xvYCC色域标准

      高显示能力一直是影像产品的最高目标,以显示色域来说,过去sRGB的范围对于未来的视讯是太过于狭窄,无法满足在HDTV环境下所追求的表现,最新的一代色域标准xvYCC也就应运而生。

    xvYCC色域图

      xvYCC标准是经国际电工委员会(IEC)认可并于2006年作为国际标准发布的最新一代广色域标准,其色彩范围不仅大大超越NTSC色域范围,更可以达到传统标准(sRGB)的两倍,几乎可以代表自然界中存在的颜色。当符合xvYCC标准的显示产品在播放同样符合xvYCC标准的内容时,能够忠实还原自然物体表面的色彩。

    普通色域和xvYCC广色域的对比(x.v.Color为SONY符合xvYCC标准的电视品牌)

      要还原出更真实的自然色彩,不只是显示器或电视等终端的事,显示卡作为输入内容的源头更是责无旁贷。Clarkdale的GPU核心以新一代的高清图形核心自居,也开始支持xvYCC标准。

      · 12bpc DP/HDMI color Depth

      xvYCC广色域标准可以扩展有效范围以使色彩的显示达到或超过人眼所能识别的程度。而color Depth(色深)能增加RGB或YCbCr色域定义的范围内有效色彩的数目。

      color Depth是指一个像点可以有多少种色彩来描述,它的单位是bpp(bits per pixel),由于一个像数颜色是由三原色混合而成,也可以用一种原色有多少色彩来描述,即bpc(bits per color)。

      我们通常所说的增加16位、真彩24位等都是bpp单位,色深的位数越高,所能同屏显示的颜色就越多,相应的屏幕上所显示的图像质量就越好。更多的色彩能消除屏幕上的色带,转换更平滑,色彩之间的渐变更细微,在黑色和白色之间展现更多倍的灰色阴影。

      Clarkdale的图形核心能支持的12bpc(36bpp)色深输出,每种原色可以有212=4096种色彩,因此一共可以有40963=687.2亿种颜色。数百亿种色彩丰富艳丽,层次丰富,并且也能够更准确的还原物体真实的色彩,达到惊人的程度,

    更高的色深能让色彩间过度更自然平滑

      由于色深增加会导致了显卡向显示设备传送数据量的增加,在高分辨下更为突出,不过从HDMI 1.3开始能支持10bpc、12bpc和16bpc的RGB色深和色彩空间,而之前的HDMI版本最多只能支持到8bpc。

      与Clarkdale配套的主板PCH(Platform Controller Hub)芯片原生支持DisplayPort和HDMI 1.3输出,因此Clarkdale的图形核心支持的12bpc色深输出不成问题。

      · Dolby TrueHD和DTS-HD Master Audio

      Clarkdale也开始支持Dolby TrueHD和DTS-HD Master Audio这样的无损压缩音频输出,为高清播放“尽心尽力”,给消费者带来真正的高清娱乐体验,这也是业界内首款支持TrueHD和DTS-HD的集成解决方案。

      Dolby TrueHD为lossless(无失真)的音效压缩制式,建于MLP Lossless技术发展,TrueHD可让音响工程师独立针对电影内容更准确地将声音定位修正,以重现更真实的声效,最高可支持多达八个分离的24bit/96 kHz全频带声道,在蓝光影碟中的码率最高为8Mbps。

      DTS-HD中的DTS-HD Master Audio(主体音频)也是无损压缩音轨,DTS宣称它是“bit for bit”的完整再现录音母带效果,是完全无损压缩,能达到了超高可变比特率——蓝光碟达24.5Mbps和HD-DVD至18.0Mbps,因此能对应音频的全部信息,7.1声道都达到96khz/24bit的取样率和深度。DTS-HD这个环绕声音标准的出现将把我们带进真正意义的7.1声道输出新境界。

      Dobly TrueHD和DTS-HD MA都需要借助庞大数据流量的帮助才可以实现相当高的取样率,因此用光纤或是同轴线缆进行传输已经显得捉襟见肘,HDMI等新一代接口就有了用武之地。

    认识Clarkdale核心处理器

      在前面的几节,我们粗略剖析了Clarkdale核心处理器在架构与功能上的一些改良,简单归纳如下:

      这次的Clarkdale核心处理器横跨三个系列,即Core i5、Core i3和Pentium,虽然Core i5中还有Lynnfield核心的CPU,Pentium系列中的CPU更多,但Clarkdale核心处理器共同的特点是整合有GPU图形单元,所以比较容易区分。

    Core系列处理器家谱

      英特尔规划中的Core品牌系列目前按市场定位划分为Core i7、Core i5、Core i3三个系列,涵盖高中低三个档次,所有的Core处理器从技术规格上又细分为Bloomfield、Lynnfield和Clarkdale三种核心,一般读者可能容易犯晕,上面的图表能清晰的列出各型号与核心的关系。

      Core i7/i5/i3间最简单的区分方法:8线程的为Core i7,四线程且支持Turbo Boost技术的则为Core i5,不支持Turbo Boost的就是Core i3了。

    Core系列处理器详细规格表

      Clarkdale核心的处理器相比于其它两种核心,除了整合GPU和改用32nm制程外,在规格上最大的变化在于只有两个CPU Core,同时L3 Cache也减少到了4MB,在性能上会低于Lynnfield和Bloomfield。

      Clarkdale核心的Core i5处理器目前一共有四种型号,分别为Core i5-670/661/660/650,均支持超线程和Turbo Boost技术;Core i3处理器暂时只有两款,即Core i3-540和i3-530,也支持超线程技术,但不支持Turbo Boost,也不支持AES-NI,定位于Core家族中的入门产品;Clarkdale核心的Pentium处理器只有G6950这一款,不支持超线程和Turbo Boost,也不支持AES-NI,L3 Cache只有3MB,整合的GPU还不支持Intel Clear Video技术,定位相当低。

      值得注意的是,Clarkdale处理器中集成的PCIE控制器只支持1x16模式,不能再像Lynnfield处理器那样可以拆分成2x8模式,所以在使用独立显卡时,不支持x8+x8的双卡互连。

    Clarkdale核心的Core i5和Core i3处理器

      GPU的核心频率上,除了Core i5-661为900MHz外,其它Core处理器显示频率频率均为733MHz,最低端的Pentiun G6950显示核心频率只有533MHz。

    双芯片解决方案确立主流地位

      从Lynnfield处理器开始,英特尔就抛弃了过去的三芯片结构(CPU + GMCH + ICH),开始采用新的双芯片结构(CPU + PCH)。在Clarkdale处理器中,CPU的整合度更高了,双芯片结构继续发扬光大,逐渐确立自己的主流地位。

    英特尔新一代平台都将采用双芯片结构

      新的H55/H57/Q57 PCH芯片是为Clarkdale处理器量身定做的,其中针对消费级市场的H55/H57将取代现有的整合芯片组G45,针对商用市场的Q57将取代Q45。

      在最初的计划中,H57、Q57包括胎死腹中的P57主板会加入Braidwood技术(Turbo Memory进化版本),但由于技术不成熟,英特尔取消了Braidwood计划,这样所有5系列PCH芯片都不支持Braidwood技术,因此原本 想和P55一起发布的P57主板直接“出师未捷身先死”。

      H57和Q57虽然也不支持Braidwood技术,但还是保全了身家性命,它们和H55的区别在于一些技术的支持上,比如H57可以支持Intel Rapid Storage Technology(快速存储技术),Q57还支持商用版的Intel Remote PC Assist Techonlogy(PC远程协助技术)和Intel Anti-Theft Technology(防盗技术)等。

      * 小资料:Braidwood技术也就是Turbo Memory改进版本,在PCH中内建有NVRAM控制器,透过NVRAM模块卡及主板上的Braidwood模块接口,将成为系统与储存接口的缓冲,令低端PC亦可拥有近似SSD的读写及储存性能,有效缩减系统启动及系统反应时间,提升 性能。

    英特尔H55芯片解析

      英特尔H55将会以支持Clarkdale处理器的主流芯片出现,相应的H55主板亦将占据Core系列的大半壁江山。由于同类的H57和Q57只是在技术支持上略有不同,因此不另作多述。

      新的H55(包括H57/Q57)能够支持整合有图形单元的Clarkdale处理器,同时也能支持没有图形单元的Lynnfield处理器,再加上目前市面上的H55主板在价格上普遍要比P55主板低一档,在很大程度上H55将会夺去P55的一半市场。P55主板保留的优势在于能支持x8+x8的双卡互连模式,并且支持Intel Rapid Storage(快速存储)和Matrix Stroage Manager(矩阵存储管理)技术。

      当然P55主板也能支持Clarkdale处理器,但是不能使用整合的GPU单元,需要安装独立显卡才能使用,比较浪费。

    Clarkdale平台架构图(来自後藤弘茂)

      原来在北桥的display控制器并没有随着GPU Core一起安身于CPU内,而是迁移到了PCH芯片中,因此对于像Clarkdale这样的处理器,在CPU里的GPU将渲染好的结果数据存放在帧缓存中,这些数据需要传送到PCH中display控制器,然后再作输出驱动送到显示终端。

      在双芯片结构平台中,CPU与PCH间会采用传统的DMI(Direct Media Interface)总线进行通信,实际上在三芯片时代,南北桥间就是依靠DMI总线作数据交换的。但是DMI总线带宽仅有2GB/s,为了不至于让DMI总线过于拥挤,英特尔在H55上单独开辟了一条专用通道来传送显示数据,即FDI(Flexible Display Interface)接口

      FDI连接于CPU中的GPU Core和PCH中的display控制器,这条通道是P55主板所不具备的,因此P55也就无从谈起支持CPU中的整合GPU了。

      display控制器是原生支持数字信号输出的,这样如果采用DisplayPort接口的话就可以直接输出了,不过考虑到目前民用显示器大多只支持DVI/HDMI接口,因此必须经过TMDS(最小化传输差分)电路转换为DVI/HDMI使用的TMDS信号。目前的H55主板很少有直接支持DisplayPort接口的。

      在H55 PCH芯片还包含有6条PCIE通道(其它型号的PCH中有8条),其中有两条PCIE通道分别被WiFi(无线网卡)和GbE(千兆以太网卡)占用,可供使用的还有剩余的4条通道,也就是还能提供一条x4模式PCIE 2.0接口,结合CPU提供的16条PCIE通道,理论上能提供x16+x4的双卡互连模式

      现在上市的H55主板中,大多数只提供了一条x16的PCIE 2.0插槽(由CPU提供),像华硕、EVGA等厂商也有双PCIE 2.0插槽的H55/H57主板,一条由CPU提供,一条由PCH提供。

    解放QPI倍频,“外频墙”不复再来

      所谓“外频墙”是指处理器的外频达到某一频率后不能突破,成为超频的瓶颈。对于Core家族处理器来说,“外频墙”主要是受制于QPI速度的极限。

      QPI速度的极限为8GT/s,当倍频为18x时BCLK(Base Clock,基础时钟频率)最大只可提升至222MHz(8GT/s÷18÷2)的水平,在16x倍频时BCLK可以提升到250MHz,在12x倍频时BCLK可以高达333MHz。

      对于Bloomfield核心的Core i7-900系列,其QPI频率在X58主板中一般只提供18x/22x/24x倍频可选 ,也就是BCLK最多只能达到222MHz,这也是目前大多数人只能将Core i7-900处理器外频超到222MHz的原因,222MHz也就成为一道“外频墙”。

      而Lynnfield核心的Core i7/i5系列,其QPI频率 倍频最低可以达到16x,这样的话,BCLK可以达到250MHz,比起222MHz又前进了一大步。

    H55主板BIOS中提供了12x倍频(1600MHz)的QPI频率可选

      到了最新的Clarkdale核心,英特尔进一步解放QPI倍频,相应的H55上提供了12x/14x/16x/18x/20x/22x/24x多种倍频可选,最低为12x,如此一来,BCLK理论上能达到333MHz,

    12x倍频的QPI频率是有效的

      333MHz的外频是一个相当高的高度,曾经的“外频墙”对于Clarkdale而言不复再来,再加上32nm制程技术,冲击新的超频记录指日可待。

      另外,Bloomfield核心的Core i7-900系列要求unCore频率(即UCLK,CPU-Z中标示为NB频率)必须是内存频率的两倍以上,比如内存设置在2000MHz,那么UCLK频率必须在4000MHz以上,而UCLK的极限也就在4000MHz左右。从Lynnfield核心处理器开始取消了这一要求,Clarkdale同样如此。

      在H55/P55这些主板BIOS中,已经没有UCLK频率的选项,实际Lynnfield和Clarkdale处理器的UCLK的倍频被锁定在 某一倍频,随BCLK而变化。

      对于Lynnfield,UCLK的倍频固定在16x,这样在默认情况下UCLK频率为2133MHz(16x133.3MHz),此时内存频率可以随意冲击极限而不再受制UCLK频率的制约,当BCLK达到250MHz时,UCLK频率才会达到极限的4000MHz。

      但是对于Clarkdale核心,UCLK是不是也固定在16x还不得知,最新的CPU-Z版本也不能显示出NB频率,暂时还不太好判断,如果也是16x的话,那么BCLK的极限只能达到250MHz左右,此时的“外频墙”不再是受限于QPI频率而是受限于UCLK频率。我们猜测Clarkdale的UCLK倍频会是12x。

    Core i5-661处理器写真

      Clarkdale核心的处理器目前一共有七种型号,均采用LGA1156接口设计,分别为Core i5-670/661/660/650,Core i3-540/i3-530和Pentium G6950,共中Core i5-661比较另类,它的GPU核心频率达到900MHz,而其它Core系列的只有733MHz(Pentium G6950的只有533MHz)。

    Core i5-661(ES版)


     

    Core i5-661的CPU-Z识别信息

      Core i5-661基于Clarkdale核心,CPU核心默认频率为3.33GHz(25*133MHz),双核心四线程,L3缓存大小为4MB,两个CPU核心各自独享256KB的L2缓存。支持Turbo Boost技术,最高可以自动超频到3.6GHz(27*133MHz)。

      与Core i5-660相比,它的GPU频率要高一些,CPU频率是相同的,因此TDP上Core i5-661达到87W,比GPU频率为733MHz的其它Clarkdale处理器要高出14W。另外,Core i5-661不支持Intel VT-d(Virtualization Technology for Directed I/O)和Intel TXT(Trusted Execution Technology)技术,在采购价上它与Core i5-660是相同的,均为196美元。

    Clarkdale(左)、Lynnfield(中)、Bloomfield(右)三种核心处理器比较

      可以看到,同样是LGA1156接口的Clarkdale处理器在大小上是与Lynnfield处理器一样的(37.5*37.5mm),外形也基本相近,只是在CPU背面Clarkdale的双核心设计略显痕迹。LGA1366接口的Bloomfield核心处理器在体积上要明显大块得多(42.5*45mm)。

    Biostar H55主板写真

      Biostar(映泰)的TH55XE主板是最早上市的H55主板之一,市场参考价799元。

    Biostar(映泰)的TH55XE主板

      Biostar TH55XE主板采用Micro ATX小板设计,适合组建HTPC,能够支持LGA1156接口系列处理器,当然最佳拍档是Clarkdale处理器。

    TH55XE主板的CPU供电部分

      TH55XE的CPU部分采用了7相供电,初步判断其中4相负责给CPU Core部分,另外3相负责unCore部分,包括1相为内存控制器供电,另外2相 给GPU供电。比较有特色的是TH55XE CPU供电部分使用了IR(International Rectifier)出品的DirectFET封装的MOSFET,这是一种超低阻全金属贴片MOSFET,具有良好的散热性能和极低的导通电阻。

    TH55XE主板的内存部分

      TH55XE提供了4条支持双通道的内存插槽,能够支持DDR3 1600/1333/1066的内存规格,内存容量最大可以支持到16GB,单独有2相供电为内存提供电能。

    只提供了一条PCIE 2.0插槽

      这款主板只提供了一条PCIE x16 2.0显卡插槽,方便用户使用独立显卡,不过不能支持双卡互连。另外主板还有提供了一条PCI-E x4插槽和两条PCI插槽。

    H55 PCH芯片

      H55芯片虽然功能上接近接近南桥,但从外形上更像原来的北桥,它采用了更先进的65nm制程,发热量也大为降低,所以这块主板仅使用了一块普通的散热片为它散热。

    TH55XE的IO接口

      TH55XE在I/O部分,视频输出支持HDMI + DVI + VGA等方式,另外还提供了SPDIF、IEEE 1394a和eSATA等接口,可惜不支持DisplayPort接口。

      另外这款主板还板载了Realtek ALC88音频芯片和Realtek RTL8111DL千兆网络芯片,提供了5个SATA接口(H55本身可以提供6个)。

    测试平台及说明

      并没有一个非常合适的Core 2 Duo处理器来与Core i5-661作对比,从频率上看Core 2 Duo E8600可能是最好的选择,但它的采购价远远高于Core i5-661($266 vs. $196),价格上与Core i5-661比例接近的是Core 2 Duo E8500($183),不过我们并没有E8500,最终只好选用E8400来作对比。E8400的采购价为$163,频率为3.0GHz,L2缓存为6MB。

    Core i3-540 CPU-Z信息

      另外我们还选用了Core i5-750来作内存性能对比,选用了Core i3-540来作AES-NI性能对比。

    Core i5-661超频测试

      本次测试仅对Core i5-661进行风冷超频测试,搭配的主板为映泰的TH55XE,散热器为Cogage True Spirit,使用ORTHOS进行超频后的稳定性测试,并利用EVEREST记录超频后的温度表现。

      ·Turbo Boost自动超频到3.6GHz

    Core i5-661开启Turbo Boost后单核心可达到3.6GHz(133MHz*27)

      在全部设置默认的情况下开启Turbo Boost模式,在系统中指定单核心运行Super PI 8M,此时CPU的单核心频率将提升至3.6GHz,倍频由默认的x25提升至于x27,外频维持133MHz不变。

      当然,Intel主推的Turbo Boost技术虽然好用,但并不能满足超频玩家的挑战欲望,下面我们再进行风冷下的进一步超频测试。

      ·风冷轻松超到4.5GHz

    Core i5-661风冷4.5GHz可顺利通过ORTHOS拷机(点击放大)

      经过一番摸索,我们在主板BIOS中把CPU核心电压提升至1.368V、VTT电压增加到1.345V、内存电压设定为1.645V、PCH电压为1.25V,IGD电压设置为1.38V,此时CPU频率可提升至4.5GHz,外频180MHz,倍频25,可以非常稳定地通过ORTHOS测试软件20分钟以上的拷机。

      从EVEREST我们还可以看到,CPU在超频至4.5GHz的情况下核心满载温度仅为62℃(裸机/室温24℃)。在如此高的频率下核心温度还可控制在65℃以内,表现令人相当满意。除了散热器性能不俗外,32nm工艺的功劳也是不可忽略的,新工艺使CPU核心发热量更低,这对超频是大有裨益的。

      Clarkdale处理器中还整合了GPU核心,这对于超频来说是会存在一定影响的,而我们在映泰H55主板BIOS的电压调节选项中除常见的参数外还增加了名为“IGD”的电压调节项,这是处理器中GPU核心电压的调节选项,可调节范围由1.18-1.78V,在超频过程中如果IGD电压不足将会导致花屏现象。

      理论上来说,Clarkdale核心处理器具有更好的超频空间,这主要是因为QPI倍频可以低至12x,再加上32nm制程的先进特性,Clarkdale的超频极限有待发烧玩家进一步挖掘。

    Core i5-661平台功耗测试

      满载下的功耗是在ORTHOS下得到的,高清回放是用PowerDVD播放MPEG2影片,由于主板的不同,因此数据只能作为参考,或者说可以看作是两套平台间的功耗差别。

      虽然Core i5-661的CPU频率和GPU频率均比E8400+G45组合要高很多,但在平台功耗上并没有表现出相应的增长,在待机下还要低5W,在高清回放和满载时(关闭Turbo Boost)两套平台的功耗几乎一样,只是在开启Turbo Boost时,满载下Core i5-661 + H55平台的功耗才比E8400平台高出5W,而此时Core i5-661的CPU频率达到了3.467GHz。

      Core i5-661功耗上的优秀表现主要得益于制程的进步和双芯片平台结构,对于GPU频率只有733MHz的其它Clarkdale处理器,功耗会更低些。

    AES-NI硬件加速测试

      在Westmere微架构中增加的AES指令集,能强化AES数学操作,有助于加速一些AES算法的应用程序。目前支持AES-NI的处理器只有Core i5-600系列,Core i3和Pentium G6950是不支持的。

      7-Zip这个软件自V9.09beta版本开始,对Westmere微架构处理器的AES-NI进行了优化设计,能够直接利用CPU中的AES指令实现硬件级加速加密/解密作业。

    7-Zip具有AES-256加密功能

      我们选用了一个上千文件1.2GB大小的文件夹来进行压缩,压缩时选择了AES-256加密处理,然后再将此压缩包解压处理,计算压缩和解压过程所花费的时间。

      测试中用Core i3-540作对比,并将Core i5-661的频率设为3.06GHz(23*133MHz),关闭Turbo Boost功能,这样两个CPU的频率保持一样。

      从测试结果来看,AES-NI确实能加速加密和解密的工作,在加密时的效果更突出一些,不过离英特尔宣传的几倍还有极大差距,可能是软件本身的加密负荷很小。

      PCMark Vantage的Communications测试部分能测试CPU的数据加密、数据解密的理论性能:

      这个测试中的差距就很明显,支持AES-NI的Core i5-661得分要比Core i3-540高出51%。

    Core i5-661内存性能测试

      Clarkdale核心的Core i5-661与Lynnfield核心的Core i5-750虽然都是整合有内存控制器,并且都是支持双通道DDR3,但是这两个核心在内存性能上还是有些差异。

      Lynnfield的内存控制器是与CPU Core整合在一个核心内,而Clarkdale的内存控制器是在GPU Die内,它与CPU Die是通过QPI来通信的,因此延迟时间增大,造成内存性能下降。

    Core i5-661的内存性能(DDR3-1333,Everest识别有误)

    Core i5-750的内存性能

      在CPU频率与内存频率同样的情况下,Core i5-661的内存延迟达到83.4ns,而Core i5-750只有57.1ns,在Read、Write和Copy等内存操作上,Core i5-750的性能要高于Core i5-661 30%以上。

      另外可以看到,在L1/L2/L3 Cache性能上,两种核心的水平相当。

    Core i5-661高清回放测试

      Core i5-661中整合有英特尔新一代的高清图形核心,能够支持H.264、VC-1和MPEG2等编码影片的硬件级解码加速。

      利用PowerDVD播放各类编码影片时,CPU的占用率都相当低,几乎不对CPU造成什么负担。高清回放对目前这一代显卡来说,已经完全不成问题。

    Core i5-661基础应用测试

      在基础应用及理论测试中,Core i5-661几乎全面领先Core 2 Duo E8400,尤其是在一些对多线程优化得比较好的应用软件中,如Fritz Chess、wPrime等,双核心四线程的Core i5-661的优势就更明显。优势最明显的在PCMark Vantage的Communication测试中,领先幅度达到60.9%,这个测试涉及到数据加密解密任务,AES-NI指令的加速起到了很大作用。

      在所有这些测试项目中,Core i5-661性能平均领先Core 2 Duo E8400 23%。

    Core i5-661游戏性能测试

      Core i5-661整合的新一代图形核心在规格上较G45整合的GMA X4500HD要高,尤其是GPU核心频率达到900MHz,因此其游戏性能也比上一代要强不少,在像Left 4 Dead、Streefighter IV这样的游戏中,低画质下可以比较流畅的体验游戏。

      应该英特尔新一代的整合图形核心的游戏性能还属于入门级的水平,不能奢望过高。

    全新Core系列处理器导购

      自Clarkdale发布后,英特尔全新的Core处理器就形成了一个完整的系列,按市场定位划分为Core i7、Core i5、Core i3三个系列,涵盖高中低三个档次,Core i7以英特尔桌面旗舰处理器的身份统领高端消费市场,Core i5则是中端桌面处理器的领军人物,Core i3定位于Core家族入门处理器。

    全新Core系列处理器型号列表

      如果你认真看完前面的内容,应该能清晰分辨出各个型号处理器间的差异,尤其是Bloomfield、Lynnfield和Clarkdale三种核心间的区别。

    英特尔对Core处理器的定位

      Bloomfield核心的Core i7将是发烧级玩家的选择,他们需要非常强劲的处理器性能,可以灵活搭配独立显卡,可以组建三通道内存,一台运算速度飞快的电脑是他们追寻的理想。

      Lynnfield核心的Core i7/i5以替代现在的Core 2 Quad为已任,它所面对的用户更注意性能与价格间的平衡,性能不可低,价格不可高,鱼与熊掌并非不可得兼。

      整合有GPU的Clarkdale核心处理器Core i5/i3将取代Core 2 Duo,它面向于高清HTPC市场和普通日常应用,这部分用户不需要很高性能的CPU,也不需要很强游戏性能的显卡,低功耗和高整合度是很多消费者的理想选择。Clarkdale整合的GPU强化了高清视频与音频输出品质,如支持xvYCC标准、支持Dolby TrueHD和DTS-HD MA无损音频输出,能够让它在HTPC市场大展身手。尤其是两款Core i3处理器,价格控制在千元以下,受众面更广。

    总结:Clarkdale开创CPU新纪元

      · 32nm:处理器制程技术迈进一大步

      Clarkdale的诞生,正式宣告了处理器制程工艺又向前迈进一大步。以第二代“HK+MG”技术为基础的32nm制程能够让CPU在性能上得到加强,而在功耗和成本上会控制得更低。

      最新的消息显示,AMD的32nm制程处理器Bulldozer由原定2010年中量产延至2011年,在制程技术上,Intel远远领先于AMD了。

      · 首次实现CPU整合GPU

      Clarkdale更重要的意义莫过于它是首款整合有GPU图形核心的CPU,双芯合二为一从过去的纸上谈兵终于变成现实,虽然Clarkdale还没有实现CPU和GPU两芯的完全融合,但已经是一个很大突破。

      而对手AMD内建显示核心的处理器还是一纸空文,预期要2011年下半年才能上市。

      · “3I”平台初具雏形

      Clarkdale处理器 + H55/H57主板,俨然是一套标准的“3I”平台(Intel处理器、Intel显卡、Intel主板),目前只有英特尔主板才能支持Clarkdale,消费者不知不觉地落入英特尔布下的局中,这一切恰好和AMD的3A平台形成分庭抗礼之势,问题是3A平台恐怕很难与之抗衡。

      Clarkdale还是脱胎于Nehalem微架构,从CPU架构技术上讲它并没多少值得惊喜的,但它的市场意义更大,而且将原来高高在上的Nehalem微架构彻底平民化。它的出现,开创了CPU新纪元。

    ×
    热门文章
    1微软将切换任务管理器里的内存速度单位:从MHz变成了MT/s
    2机械大师推出F36 MATX机箱:小型短风道设计,支持背插主板,售价389元起
    3苹果发布M4芯片:10核CPU+10核GPU,第二代3nm工艺制造,加速AI任务
    4Strix Point将命名为锐龙8050系列,而桌面版Zen 5则会叫锐龙9000
    5苹果推出全新iPad Pro和iPad Air,还带来了Apple Pencil Pro
    6VESA发布DisplayHDR 1.2规范,以适应显示技术的发展
    7SanDisk推出T40备份小魔方:4/8TB可选,最高存取速度达1000MB/s
    8美光推出英睿达LPCAMM2内存:LPDDR5X-7500规格,已用于联想移动工作站
    9微软关闭4家游戏工作室,以重整资源加强重点项目开发
    已有 16 条评论,共 29 人参与。
    登录快速注册 后发表评论
    • 游客  2010-02-16 15:34

      该评论年代久远,荒废失修,暂不可见。

      已有1次举报

      支持(1)  |   反对(0)  |   举报  |   回复

      16#

    • 游客  2010-01-15 12:21

      该评论年代久远,荒废失修,暂不可见。

      已有1次举报

      支持(1)  |   反对(0)  |   举报  |   回复

      15#

    • 游客  2010-01-14 19:23

      该评论年代久远,荒废失修,暂不可见。

      已有1次举报

      支持(1)  |   反对(0)  |   举报  |   回复

      14#

    • 游客  2010-01-14 13:32

      该评论年代久远,荒废失修,暂不可见。

      已有1次举报

      支持(1)  |   反对(0)  |   举报  |   回复

      13#

    • 游客  2010-01-14 12:18

      该评论年代久远,荒废失修,暂不可见。

      已有1次举报

      支持(1)  |   反对(0)  |   举报  |   回复

      12#

    • 超能网友管理员 2010-01-14 09:14    |  加入黑名单

      该评论年代久远,荒废失修,暂不可见。

      已有1次举报

      支持(1)  |   反对(0)  |   举报  |   回复

      11#

    • 超能网友管理员 2010-01-14 09:13    |  加入黑名单

      该评论年代久远,荒废失修,暂不可见。

      支持(1)  |   反对(0)  |   举报  |   回复

      10#

    • 超能网友管理员 2010-01-14 09:12    |  加入黑名单

      该评论年代久远,荒废失修,暂不可见。

      支持(0)  |   反对(0)  |   举报  |   回复

      9#

    • 游客  2010-01-13 21:17

      该评论年代久远,荒废失修,暂不可见。

      支持(0)  |   反对(0)  |   举报  |   回复

      8#

    • 超能网友教授 2010-01-13 20:58    |  加入黑名单

      该评论年代久远,荒废失修,暂不可见。

      支持(0)  |   反对(0)  |   举报  |   回复

      7#

    • 游客  2010-01-13 20:49

      该评论年代久远,荒废失修,暂不可见。

      支持(0)  |   反对(0)  |   举报  |   回复

      6#

    • 游客  2010-01-13 19:38

      该评论年代久远,荒废失修,暂不可见。

      支持(0)  |   反对(0)  |   举报  |   回复

      5#

    • 游客  2010-01-13 19:34

      该评论年代久远,荒废失修,暂不可见。

      支持(0)  |   反对(0)  |   举报  |   回复

      4#

    • 超能网友管理员 2010-01-13 18:16    |  加入黑名单

      该评论年代久远,荒废失修,暂不可见。

      支持(0)  |   反对(0)  |   举报  |   回复

      3#

    • 游客  2010-01-13 17:42

      该评论年代久远,荒废失修,暂不可见。

      支持(0)  |   反对(0)  |   举报  |   回复

      2#

    • 游客  2010-01-13 17:27

      该评论年代久远,荒废失修,暂不可见。

      支持(0)  |   反对(0)  |   举报  |   回复

      1#

    登录 后发表评论,若无帐号可 快速注册 ,请留意 评论奖罚说明