一个好的网站,除了吸引访问者外,访问速度和稳定性也非常重要,这当然与网站规划设计、软硬件配置有关。对于电子爱好者或DIY对于一族来说,也许每个人都对如何使服务器运行更稳定更感兴趣。99高端服务器的稳定性.99%,平均一年内当机时间不超过53分钟,而低端服务器的稳定性仅为90%,平均当机时间超过876小时。不可能100%不当机,但可以深入分析影响服务器稳定性的关键,有效提高稳定性,尽可能缩短当机时间。根据作者的经验,影响服务器稳定性和安全的因素主要包括电源供应、散热系统、服务器主板选择、软件应用等。根据测量结果,提高服务器的稳定性也是一个不断改进的过程。本文总结了一些服务器电源和散热、主板选择等方面的经验,供您参考。第一部份一、 电源供应器各位电子爱好者都知道,电源对于电子系统来说是何等的重要。电源质量直接影响系统的稳定性和硬件的使用寿命,而不仅仅是220V将交流转换为服务器所需的低压直流是如此简单。服务器电源必须能够应对各种恶劣的工作环境,并要求全年不间断工作。随着CPU随着速度的提高,硬盘容量和速度越来越大,功耗越来越快,对电源的要求也越来越高。与日常计算机不同,服务器通常支持多台计算机CPU,使用多个SCSI硬盘,RAM容量一般超过2G,功耗比较大也就不足为奇了。比如Intel P4 3.2G CPU功耗达82W,SCSI硬盘功耗也在10W以上,加上主板等配件的功耗,一般PC电源仅200W左右功率无法应付。对1U对于机箱服务器,电源功率一般应达到300W,2U应达到350W,确保足够的电源。实践经验告诉我们,服务器经常自动重启电源功率不足或过热(Reboot)一个重要的原因。CPU当负载增加,硬盘突然读写大量数据时,负载变化引起的电源电压波动是不可避免的。高质量的电源充分考虑了这些因素,问题的可能性要少得多。熟悉电子制造的朋友都知道,名牌大厂的产品设计和制造技术对产品质量有保证。笔者使用并测量过Sirtec International Co.,Ltd生产的400W服务器电源,型号为PUA-40060-PB1。该型号内部结构设计良好,材料精致,具有短路、过载、输入过压等保护功能,安全规则符合国际标准UL在40摄氏度环境下,4小时满载老化试验合格后出厂。在25度和75%的环境温度下MTBF(平均无故障时间)超过10万小时。二、 散热 服务器硬件一般1U、2U底盘与框架一起使用,在狭窄的空间内有大量的硬件高速运行,服务器一般需要24小时连续工作,散发出大量的热量。那么,如何有效地降低服务器的内部温度呢? 首先,服务器底盘的材料非常重要。首选全铝或铝合金,次选铁板。颜色应涂成黑色,以促进散热。CPU散热器应由全铜和直接整体切割而成。为达到最佳效果,必须配合优质散热膏,正确使用。 其次,风扇的选择也很重要。CPU它是服务器的核心,也是热情(热的中心)。Intel P4 CPU温度75℃ 及AMD CPU温度86℃工作温度极限,高温时CPU会自动降低工作效率。要降低CPU温度,首先是增加传导面积,使用高质量的散热器,尽可能增加表面积,其次是降低周围环境温度,增加周围空气对流,风扇派用场。 选择散热风扇也是一门学问。高风量(CFM)冷却风扇能有效降低服务器内部温度。散热风扇一般分为滚珠轴承和油封轴承。滚珠轴承更耐用,虽然噪音略高,但服务器通常在机房工作,通常采用无人看守远程监控,噪音稍大也可以接受。风扇上可以标注A(电流)和W(功率)初步判断风量,一般风量越大。建议大家选择Delta、Sunon、Nidec、Sanyo、Y.S.Tech等名牌。近期Sanyo推出1.5万转4cm电流0.55A风量20.83CFM及24.71CFM超强风扇,是1U服务器散热较佳配搭。 电源本身就是服务器中的一大热源。如Sirtec产的PUA-40060-PB1电源,自带2个风扇,使其工作温度不会过高。笔者试将Nidec风量15.53CFM的风扇换成Sanyo风量20.83CFM电源温度明显降低2-3度。对于服务器机箱的散热风扇,最好选择风量大的风扇。笔者将1U机箱内8个散热风扇更换为Sanyo 0.55A/20/83CFM机箱温度由原来的33-35度降至26-31度,CPU温度从49-57度降低到45-51度。有兴趣的读者可以试试。 最后,合理设计风道。安装硬件后,将机箱内部放置cable、电线整齐地扎好(如应用蛇皮网配合热缩套管能使机箱内部的布线更加有条理),以保证机箱内气流流通无阻。俗语云:“磨刀不误砍柴工”。要想服务器稳定工作,在这方面花点时间是值得的。 三、 主板 主板就像人的骨架,承载着CPU、运行内存等重要组件。若服务器电源质量可靠,容量充足;底盘内散热良好,但仍偶尔会莫名其妙地当机,问题可能来自主板。当机后,一些主板必须在启动前关闭电源,因为它们具有自我保护功能;更重要的是,必须清除CMOS只有在记忆中,才能重启。这严重阻碍了服务器的远程维护和管理,因此选择高质量的主板尤为重要。 INTEL主板是少数通过的WHQL微软WINDOWS操作系统硬件质量认证产品的稳定性和兼容性受到考验。在性能方面,INTEL原厂服务器主板配合自己的处理器,性能优异也就不足为奇了。INTEL有牺牲稳定性的传统,但服务器首先追求稳定性,所以建议您使用它INTEL主板。第二部份 一、主频不再行动CPU性能测量标准 众所周知CPU它是服务器的心脏,是服务器使用的CPU其性能和档次基本决定。曾几何时我们以CPU判断主频(核心时脉频率)CPU性能,Intel的CPU它还以高主频策略占据了更多的市场。多年以来,Intel始终遵循摩尔定律主频决定一切的原则MHz到GHz,工程师最关心的只有一件事:如何提高CPU工作频率。 随着CPU随着科学技术的不断发展,主频发展到近4个GHz,晶圆工艺也从180纳米、130纳米、90纳米甚至65纳米逐渐转变。随着主频率的提高,工艺的缩小,CPU发热问题也越来越突出。近期Intel放弃开发更高的主频率CPU,转向发展双核甚至多核心CPU,主要是大功耗电晶体所带来的散热问题未能解决,所以4GHz Pentium(P4) CPU尚未推出市场。 二、散热问题成为主频增加瓶颈 CPU它是服务器的核心,也是热情(热的中心),高温时CPU会自动降低工作效率,所以CPU温度对其性能至关重要。 然而解决CPU散热问题不容易!想象一下当年Pentium MMX 200MHz,只用一个小风扇。如今,爱好者使用水冷、干冰制冷,甚至一些超频爱好者使用液氮制冷。CPU热量增长有多大。 随着集成电晶体的增加,CPU功耗和热量都增加了。按过去的经验,通过采用新的制造工艺,可以将功耗降下来:比如从180纳米过渡到130纳米之后,Tualatin核心比Coppermine核心功耗大幅下降。但从130纳米到90纳米,功耗递减的规律失效。例如,旧的130纳米P 4 3.2GC Northwood 才82W,新型90纳米P4 3.2GE Prescott功耗值达到103W。 减少工艺会减少CPU核心占用面积,但其他相关部件可能会增加,这种减少与增加不是线性关系。晶片的工作电压也需要降低,比如130纳米Hammer处理器的工作电压为1.5V,90纳米的Hammer需要在1.4V工作,90纳米Prescott则只能在1.2V在电压下正常工作。晶片的功耗由电路工作中产生的动态功耗和泄漏电流引起的静态功耗组成。电压的降低意味着晶片的电晶体动态损耗会降低,但是减小面积的同时暂态泄漏电流就会增大,而且随着电晶体面积的减小,这个漏电电流会以几何级数增长。在以前的制造过程中,漏电电流几乎可以忽略不计,例如0.在25纳米工艺的晶片中,你几乎无法检测到泄漏电流的存在,但在90纳米时代,晶片的线宽缩小,晶体的栅极变得越来越薄,泄漏电流越来越大,因此泄漏的影响已成为电能消耗的主要因素,这也导致了过热的大问题。 缩小工艺CPU核心可以容纳更多的电晶,所以Intel在增加主频的同时,也增加了主频L2缓存(Cache)提高整体性能。CPU电晶体数量的急剧增加导致其总功耗的增加,这是CPU发热增长的第二个原因。Prescott核心面积比Northwood小25平方毫米,但比后者多容纳7000万个电晶!可想而知,7000万个电晶体工作时释放的热量。4GHz的Pentium4处理器,虽然主频是顶级的,但功耗一定不低,据说满负荷工作会达到200W!我想这才是Intel放弃4GHz处理器发布计划的原因吧。 三、双核心架构,增加缓存成新宠 Intel将CPU从单核到双核的架构,主要是因为目前CPU运算核心的发展已经达到了极致,主频的增加导致CPU热量大幅增加,但性能不一定同步增长。现在所有的制造商都在提高它CPU性能的希望寄托在双核甚至多核心,增加缓存(Cache)也是方法之一。 说到双核心处理器,相信很多朋友会问:双核心技术和超线程(Hyper-Threading)有什么区别?毕竟以前Intel的P利用超线程技术实现了双核功能。原则上,超线程技术可以单独使用CPU具有处理多线程的能力,物理上只使用一个处理器,但操作系统等软件将其识别为两个逻辑处理器。尽管支持超线程P4能同时执行两个线程,但在执行多线程时两个逻辑处理器均只能交替工作,因此,超线程技术所带来的性能提升远不能等同于两个相同主频处理器带来的性能提升。要使处理器资源真正实现并行处理模式,还需要入物理双核设计!在操作系统中,它是一个真正的双处理器,可以同时执行多项任务。双核心处理器的性能几乎比单核心处理器高50%-70%。此外,增加硬核不需要增加太多的晶体管,也可以通过减少二次缓存的容量来保持适当的电晶体规模,因此不会带来太多的功耗负担。 近年来增加缓存也有所改善CPU效率的主要方法是,但这会增加吗?CPU功耗?研究发现,增加主频带来的功耗增加是以平方计算的。相比之下,增加缓存只会增加一点电压,如1.4V提升到1.45V,电压的增加以倍数计算,易于控制。 事实上,面对散热等问题的瓶颈后,Intel缓存容量逐渐增加,以提高性能。不但P4处理器L2缓存由Northwood核心的512KB提升到Prescott核心的1MB之后又推出了搭配2MB版本的6系列P4.平价处理器Celeron在导入Prescott核心后,L缓存也从原来的1288开始KB加大到256KB。Intel最近推出了处理器的顶级产品P4至尊版(P4EE,P4 Extreme Editon)3.46GHz主频、1066MHz 外频增加2MB L3 Cache。以前就是这样XEON处理器上的技术现在已经进入了平民玩家的水平,有很多一般的服务器应用助。过去无论是Intel还是AMD都只是把Cache缓存的重点放在了L2 Cache上,容量一再进行提升。为了凸显P4 EE的与众不同,Intel赋予它多达2MB的三级缓存,加上512KB的二级缓存,P4 EE的缓存多达2.5MB,但L3 Cache到底有什么作用? 从处理器的工作原理来看,容量较小的L2缓存在纯数学运算中是肯定要快于容量较大的L3缓存的,而L3 Cache又远大于实体记忆体的资料交换速度。我们要注意Intel在P4 EE上的L3 Cache不仅仅是容量上单纯的提升,重要的是它的运行速度是和CPU外频一样的,最大程度的保证了CPU工作时和记忆体之间的资料交换速度,保证了单周期内和二级缓存之间的延时一致的,在资料的不断调用过程中幷不会因为延时的问题造成不必要的等待和性能损耗。 四、外频提升功耗不会显著增加 CPU性能的发挥,不单要看CPU主频及Cache大小,外频的影响也很关键,因为关系到CPU与RAM、显卡等设备交换资料的速度。例如: Intel最近推出P4 3.46GHz 主频(内频)、1066MHz外频的CPU,CPU实际执行频率(内频)3.46GHz =FSB 266.7MHz ×13倍频系数,外频1066MHz = FSB 266.7MHz ×4倍速度运作。提供8.5GB/s的频宽,可充分发挥Dual DDR2 533高频宽的优势,支持新一代的PCI-Express×16图像埠(其8GB/s频宽已经超出800MHz外频的极限)。 虽然外频是如此重要,但要增加外频却比内频困难。Pentium处理器刚推出时,内外频都为66MHz,而现在P4内频 3.6GHz外频只有800MHz,可见CPU内频提升了54倍,外频只提升了12倍。外频提升困难主要是因为牵涉太多的设备,不像内频提升只考虑CPU内部的设计为主,且随着高外频出现的EMI(电磁干扰)问题,比较难以解决。Intel与AMD推出Differential Bus Clocking,取代Single End Clocking,令工作频宽更易提升。此外,AMD更引入DDR技术,其后Intel更有QDR技术,令外频在FSB 100MHz的时脉下,产生400MHz的资料传输效果。传统外频除了难以提升频率外,在读写效率方面亦然。现在的外频在读写资料时是单向的,而新一代的周边系统如PCI-Express显示卡已经提供同时上传、下载功能,所以AMD采用扩充性高的HyperTransport技术优化外频,令CPU对外频宽大大提升,在执行效率方面也比传统外频先进,可同时进行读取和写入工作,期间不用进行切换。Intel采用PCI-Express,亦可实现先进的双向传输功能,达到16GB/s以上的频宽,满足CPU对外频的要求。外频的增加会否增加功耗呢?从800MHz到1066MHz外频,Intel的P4 EE CPU功耗增加十分轻微。P4 EE 3.46GHz的功耗为110.7W,比P4 EE 3.4GHz的109.6W轻微增加1.1W,现在明白为何Intel刚放弃了4GHz主频而能马上推出更高外频的CPU了。 五、向65纳米制程迈进 目前Intel要确保其双核心计划能顺利实施有一个至关重要的前提——采用更先进的生产技术。多核心尽管带来了更为强大的性能,但是也同样加大了功耗。目前部分主流CPU已经使用90纳米工艺制程,但正如上文所述,功耗过高的问题未能解决,所以正加紧开发新的工艺制程,功耗过高的问题会渐渐改善。CPU的性能完全依赖于其内核晶片的电路结构,更高的性能意味着电路更加复杂精密。但如果工艺制程不改进,电晶体数量增加到8倍后,体积和功耗也增加到8倍(发热量也增到8倍),而可供散热的表面积仅增加到4倍。所以在不改变工艺制程的情况下单纯增加电晶体的数量是不可取的。Intel 65纳米工艺在单元尺寸不变的情况下,集成电晶体数目却超过了5亿个,其中1平方毫米大小的晶片上电晶体数目已经达到1000万个!决定CPU价格的主要因素是晶片的尺寸,技术的进步带来了性能的提升,但成本却可能更低。 在开发65纳米工艺制程过程中,Intel最重视的一点就是在提高工作速度的同时降低泄漏电流以解决散热问题。为此,Intel在制造技术和电路技术方面均采取了降低泄漏电流的措施。在制造技术方面,通过采用90纳米工艺开始引进的“应变硅”核心技术而得以改善。具体而言,nMOS电晶体外形成了一层Si3N4膜,pMOS电晶体则在源极和漏极中采用了SiGe材料。由此就给电晶体沟道部分施加了拉伸应力,从而就能提高载流子的迁移率。结果,作为65纳米工艺,与不使用应变硅相比,可将工作速度提高约30%。另外,与90纳米工艺相比,65纳米工艺电晶体在工作速度相同的条件下,能够将泄漏电流减少到原来的1/4左右。 在电路技术方面,配置了一个用来切断泄漏电流流向缓存(SRAM)的开关。通过在SRAM元件与接地线之间插入nMOS开关电容器,切断空闲SRAM元件的电源。由此可将SRAM的泄漏电流降低到原来的1/3左右。 六、近期服务器CPU的选择建议 基于散热问题以及即将在2005年上市的双核心处理器进程影响,Intel已于近日正式宣布放弃4GHz Pentium(P4)处理器上市计划,并在11月1日已推出P4 EE 3.46GHz 主频,采用1066MHz外频、130纳米、内建2MB L3,而90纳米、2MB L2的Intel P4 EE则预计在2005年1季度推出。 随着制程技术的进一步提升,以双核心甚至多核心及加大L2/L3、外频及64bit来提高CPU性能,正成为当前服务器CPU发展趋势。目前准备更新服务器CPU的朋友,笔者建议仍采用价格适中的旧型130纳米P 4 3.2GC Northwood,待2005年下半年双核心65纳米制程推出如热量问题得到解决,2006年才是采用新CPU更新服务器的时候。第三部份 一、服务器进入DIY时代 随着互联网IT业的飞速发展,越来越多的中小企业甚至是个人用户都涉足到服务器这个熟悉而又新鲜的产品。一直以来,服务器在人们的心目中都觉得是属于专业应用的产品,是高深莫测和高端的,事实上是不是这样的呢?DO IT YOURSELF 做了就知道! 其实在外国,DIY服务器已经是司空见惯的事情了。在美国DIY服务器占市场总出货量40%。品牌服务器的高成本和缺乏灵活性的配置让大家望而却步,随着服务器技术走向普及,DIY服务器凭借可灵活采用最高性价比配件且稳定性好,己为大众接受。 如果你所需的是一台入门级服务器,用来架设办公室局域网,做文件存储、电子邮件,或者作为一般网站、简单数字库等用途,选择单颗P4或者P4E(Prescott)CPU就足够了,搭配865/875/E7525的芯片组,挑一块能集成显卡和网卡的主板,这类配置主要考虑的尽量追求高性价比和配件能安装在1U 机架式机箱内及良好散热就行。 对于工作站的服务器,需要比较高的性能和稳定性,可考虑采用双路Nocona / Irwindale Xeon(新/最新至强)CPU,主板可选用Intel、Tyan、华硕、超微(主板芯片组决定品质) ,内存选用Corsair、Kingston、三星(分普通/ECC/RECC DDR内存) ,SATA/SCSI硬盘采用 WD、Maxtor、Seagate,电源采用Sirtec、台达等配件组装起来的,在硬件上丝毫不逊于品牌机,却在性价比方面占据绝对优势。 二、PC服务器CPU受青睐 大家都知道如IBM、HP、SUN等巨头以前对于PC服务器的表现是不屑一顾的,认为采用Intel和AMD处理器的PC服务器是低档廉价产品。自Intel成功推出性能极高的P4、Xeon和64位Itanium处理器,AMD也成功推出令业界震惊的64位Opteron处理器后,得到了广大中小企业用户的认可。最近IBM和HP争相锁定还未正式发布的AMD双核心Opteron处理器。 其实Intel Nocona Xeon和AMD Opteron处理器都是64位处理器,IBM、HP等巨头为何看好双核Opteron而不选用Intel Xeon呢? 作为全球第一款兼容x86架构的32位和64位处理器,AMD Opteron处理器建立在采用直连架构的AMD64技术的基础之上。直连架构通过将处理器、内存控制器和I/O直接连接到中央处理器,消除前端总线固有的瓶颈,从而提高系统的总体性能和效率。 随后Intel宣布了Nocona处理器(带有EM64T的新至强),其外频(FSB ×倍频系数)提升到800MHz,支持32和64位应用的EM64T内存扩展技术。同时发布的芯片组E7520/7320,定位于服务器市场。 Nocona新至强具有更大的二级缓存,更高的主频,更重要的是具有了64位处理能力,通过搭配支持流行的PCI Express和DDR2内存技术的E7525芯片组,新“Nocona”Xeon确实有了很大的进步。 在许多基于Nocona和Opteron处理器的比拼测试中,AMD的Opteron处理器在不少项目均能挫败Nocona Xeon,但在某些经过对超线程技术做了特殊优化的程序中,Nocona的表现超过Opteron。因为Nocona处理器推出时间远晚于Opteron处理器,现有主流64位操作系统并没有对Nocona处理器进行优化,而Opteron处理器己进行了优化,所以目前的64位操作系统中,Nocona处理器并未真正发挥其优越性。Nocona处理器发热量太高可能也是IBM、HP等巨头暂时看好双核Opteron的原因吧。 AMD也发布型号为152、252、852低耗电的Opteron处理器,支持1GHz hypertransport,90纳米制程及Power Now! 降低功耗技术。在手提电脑处理器市场也推出了对抗Turion技术,使Intel霸主地位也遭遇到威胁。 Intel公司最近公布了其代码为Intel Xeon MP的Potomac CPU,而且拥有8MB L3 高速缓存和1MB L2 高速缓存,主打4P与8P等级企业用服务器高阶市场。 三、双核心时代来临 双核心取自双自强CPU系统的概念,其实是双CPU技术的缩影。因双核心芯片技术甚至多核心芯片技术可以大大提高处理器性能,目前处理器的厂商Intel和AMD都在调整自己的双核心处理器的市场战略,会在2005年中推出各自的双核心、多核心处理器。 Intel 第二季度会提供双核心64位Smithfield的处理器,主要面向桌面电脑市场,Smithfiel主频率3.660GHz起,可惜这些产品的功耗大约为130瓦,所以要支持新CPU除了芯片组要支持以外,还需要主板的电源供应设计能够与处理器搭配。 Smithfield双核心处理器将会采用90纳米的设计工艺,L2 2M,800MHz外频兼容现有915晶片组。其每一个处理单元会采用目前的P4 “Prescott”芯片一样架构,不过这新的中央处理单元将具备仲裁逻辑功能,该功能会让两个处理器核心的总线传输得到平衡。Smithfield将支持EM64T、Virtualization、XD和加强的Intel SpeedStep技术,性能得到较大提升,但仍然是过渡期产品,等待Intel 65纳米制程的手提电脑双核心Pentium M(Yonah)、P4的双核心Presler、双核心Xeon和XeonMP推出。这些双核心处理器才会是未来主流。 AMD双核心Opteron主频1.6/1.8/2.0GHz起,90纳米制程,2M L2 高速缓存,1GHz HT,估计也会在第二季度推出。 对于双核心CPU,Intel认为AMD的设计采用单核芯片上集成内存控制器的方式,并且使用混合传输方式,这将产生问题。因为AMD使用的不是共享式缓存而是单独的内存缓存。 而Intel将开发出提供更高性能并且不会局限于某一代内存的共享式缓存架构,如内存架构改变时,无需更改 CPU。Intel在其产品规划中早已经包括多核心及双核心产品了。 2005年是双核心的开始,Intel激进地将2006年双核心处理器的市场份额计划都提高到70%以上。双核心的出现虽然是处理器市场的一次突破,但是软件编写者还需要时间掌握这类功能强大的处理器。在现有的单线程软件下测试双核心处理器,它的优势尚未发挥。 2005年将是双/多核心处理器架构发展史重要里程碑。 四、缓存决定一切 Intel的“频率就是性能”的市场战术遇到前所未有的困难,取消了4GHz P4的发布计划。但显然Intel不会因开发不出更高主频的CPU而放弃市场的,他们又开始实行 “Cache is king(缓存决定一切)”的战略,其新曝光的处理器缓存越来越大。 在服务器的环境中,CPU主频不一定决定服务器主要的性能,例如由于服务器某些软件对高速缓存严重依赖,Intel公司的Xeon MP的 3.0GHz主频,采用4MB L3高速缓存能够带来更好的性能。但是根据Intel的公开资料,Potomac处理器的Cache比目前还要大!达到了8M!其性能快约16.7%。增加缓存的代价是巨大的,不但增加了成本,降低了良品率、成品发热量都是问题,目前Intel的CPU发热量确比AMD 大。 五、服务器需要协调发展 服务器作为网络环境中的一台电脑,它需要侦听网络上其他电脑(客户机)提交的服务请求,并以此为依据提供相应的服务;服务器必须具有承担服务并保障服务质量的能力。因此DIY服务器的原则将围绕这个应用核心进行。 在DIY服务器架设过程中,不要过分注重某些部件的性能,否则容易忽视系统整体性能各方面的平衡。例如:只追求处理器频率的提升,往往忽视与之相对应的前端总线(外频)的速率以及内存的频率的提升。这样会导致系统瓶颈的产生:处理器的计算能力虽然非常出色,但是由于它与内存之间的通信渠道受前端总线频率的限制,使得服务器系统的性能无法发挥到最大。 如何平衡并提升系统各部件的性能,消除系统瓶颈,将系统的整体性能发挥到最大?提升性能有几种方式:提升处理器的主频、修改处理器架构以扩展内存寻址能力(EM64T技术)、在处理器内部集成更大的高速缓存等。此外,利用Nocona处理器所具备的DBS(按需切换技术),可以根据系统使用率的变化动态调整处理器主频和电压,以达到降低处理器平均功耗的目的。由于主频的提升、缓存的增大、前端总线频率的提高,新一代Nocona处理器的性能比前一代提高了30%。Intel最新发布了升级版64位至强Irwindale处理器。其带有增强的2M二级高速缓存,与上代Nocona版本相比,可实现18%的性能提升。 六、DIY服务器CPU的选择 DIY一台服务器,选择一颗满意的“芯”尤其重要。Intel的服务器CPU占服务器处理器市场主流,产品线非常长从Itanium(安腾)系列、Xeon(至强)系列到P4,涵盖了高中低档应用需求。尽管AMD最近推出的CPU得到HP、IBM等服务器巨头的青睐,但考虑到其他配件的搭配和技术的成熟度,Intel系列的CPU仍是DIY服务器的较佳选择。目前的主流应用是32位,从性价比来说,笔者认为目前Intel的Prescott/Northwoo处理器都是DIY服务器的首选CPU(但旧型130纳米P 4 3.2GC Northwoo快停产)。Prescott使用90纳米制造工艺,拥有1MB L2缓存和SSE3指令,目前的高端875主板支持单路CPU,它拥有高速的系统总线(外频 800MHz),基于增强型NetBurst架构Enhanced Architecture,采用了甚长管道技术,这样做可以使得频率提升更加容易。Prescott 90纳米的制造工艺能减少核心尺寸,容纳更大的缓存。L1 数据缓存的容量由8KB提升到了16KB, L2缓存的容量提升到了1MB,与CPU核心连接的总线宽度为256bit。3.4GHz Prescott的缓存带宽达到了108GB/S。最新推出的Prescott核心 P4 XE 3.73Ghz,L2更增大到2MB。与AMD提升缓存不同,Prescott的缓存容量提升与其频率的增长同步。Prescott的另外一个亮点是改进的Hyper-threading技术,有效地提升多线程的实际执行效率。 对于DIY服务器来说,Intel将推出的支持64位和超线程(HT)技术的 6xx系列P4新产品也是不错的选择,L2缓存加大到2MB,采用EM64T技术,发热量也因EIST、C1E与TM2省电技术大为降低。 第一季内推出P4 660(3.8GHz)供应市场,Intel也推出600系列的低频版本,如600,620和640供应零售市场。 七、P4和单双至强之争 服务器采用单P4 CPU作数字库时,如CPU经常出现占用率90%以上时就要考虑转用至强CPU了。 近一年多来旧至强处理器几乎没有变化,外频停留在400、533MHz、其性能差过P4,只在缓存上有一定优势而己。最近采用90纳米工艺的新至强 Nocona外频上升到800MHz、 L2缓存 1M,比旧至强性能高达35%,但是, 90纳米的工艺并没有给新至强带来凉爽,反到因为频率的提升(由2.8至3.6GHz),功耗首次冲破100W,散热也成为新至强处理器特别迫切的问题,在1U狭小的空间中解决这一难题困难重重。由于新至强处理器功耗比前代产品上升了45%,虽然引入了在手提电脑处理器上广泛使用的SpeedStep技术来调整功耗,但服务器是持续运行,要如何彻底解决新至强新一代服务器的散热 ,确是需要费一翻工夫的。 采用90纳米工艺的新至强 Nocona外频上升到800MHz、支持64位扩展计算,是其PC服务器产品线历史上最大的动作。外频的提升让新至强的总线带宽提升了一大截,而且还将32位总线扩展到64位,通过与即将发布的Windows x64版相配合,实际的性能提升恐怕不能用一个数量级来形容了。 兼容前代至强处理器,继续通过DBS提供节能特性,并通过支持DDR2-400内存和PCI Express来提供增强的性能和灵活性。正如前面提到的,服务器整体性能的提升需要均衡发展。尽管新至强带来一些提升,但单路至强与新的P4相比,性能没提高多少。因此专业服务器厂家一直比较注重2、4、8路服务器的发展。双新至强与单个不支持HT的P4的对比起来差异就很大了。如在P4服务器上运行一个中型的商务信息网站,CPU经常都是使用率50%以上的,改为双新至强服务器,CPU使用率就降至10%以下。一般数字库程序应用在双新自强CPU平台环境会运行更快,加上双新自强CPU能比单P4 CPU整体性能有30-35%提升,由于双CPU支持“ 多线程” 能大大提 高CPU 的使用率。单CPU 一次只能执行一个线程,双CPU在执行多线程数字库程序运行的速度要比单CPU的系统快上50-70% 。对于访问量大的网站服务器,CPU性能对IIS 服务同时在线访问人数限制也至关重要。以P4 2.8G CPU 做的Web服务器可支持2000人以上同时在线,其内存最好在512M以上,1G更佳。采用双新至强2.8G CPU的Web服务器,则可支持高达3000~4000人同时在线。 综上所述,如果目前要由P4升级笔者建议应选最新双至强。 第四部份 上面主要介绍了DIY服务器CPU的选择,及双核心等一些CPU技术的最新发展。在随后的一年里,Intel将不断推出服务器CPU的新产品,如 Dempsey(双核心Xeon),Paxville,Tulsa和Montvale(双核心Itanium)。虽然目前部分处理器具体技术参数还未正式明朗,不过双核心设计全面化是必然的了。作为服务器DIY一族,我们要时刻留意CPU发展,内存、硬盘等技术和厂商的最新动向,在合适的时机选购性价比高的产品。 内 存(RAM) 一、 DDR内存工作原理 DRAM内存晶片是PC和服务器中使用的主要存储晶片内存的速度越快,计算机的工作就越流畅。目前PC中使用的内存晶片大多数是DDR(double date rate)内存晶片,数据处理速度为每秒钟266Mbps-400Mbps。 DDR内存能在控制时钟触发沿的上、下沿都能进行数据传输,而普通SDRAM内存只在控制时钟的下降沿进行数据传输,因此在一次控制信号过程中,DDR 内存能进行两次数据交换。这也是它相对同样实际频率的普通内存有双倍带宽的原理。 在普通内存中,存储单元(Cell)的数据容量和内存颗粒的位宽是相等的,通常为4bit、8bit或16bit;而在DDR内存中,Cell的容量是内存晶片位元宽的2倍,这就是常说的两位预取,也称为2-bit Prefetch。到了DDR2则进一步扩大为4-bit Prefetch。 二、DDR2和DDR3 随着CPU和主板晶片组的不断发展,DDR内存所能提供的频率和带宽已经捉襟见肘,比DDR速度更快的DDR2内存正逐步取代DDR成为主流配置。英特尔公司已经宣布其未来的所有晶片组将支援DDR2。 DDR2内存具有高数据速率、低功耗以及高密度特点,它的速度和带宽比DDR 内存高很多,1.8V工作电压也使得它比其上一代产品功耗低50%。 目前普及的DDR2数据传输速率为533Mbps,是DDR 266的两倍。除了在原始带宽方面的一些提高外,它还采用了多项新技术以方便系统设计提高系统的性能和功效。DDR2 4位预取架构,作为外部总线每个时钟从存储器单元阵列读/写的数据量是原来的四倍,而且其工作频率比内部总线频率快四倍。利用DDR2的片上端接(ODT)来简化DQ总线设计,以片外驱动器(OCD)校准,修正不同DRAM供应商之间的工艺差异。前置CAS和附加延迟,简化控制器设计以避免指令总线上的冲突。细间距球栅阵列(FBGA)封装,以减小系统尺寸,增加各模块之间的空气流动空间从而提高了热性能和可靠性。 最近三星研制出1066MHz的DDR 3内存,未来可能代替昂贵的DDR 2内存。DDR 3采用0.08微米制程,而DDR 2则是0.09微米。DDR 3内存将工作在1.5V的电压下,耗电量要小于DDR2内存晶片,且其数据处理速度可达1.06Gbps,内存容量达512Mb。 目前,半导体制造商们已经开始从DDR1转向DDR2了,DDR2已开始逐渐成为主流,价格逐渐走低,到今年第二季度末,其价格很有可能将会和DDR1差不多。 据市场预测,DDR3内存晶片将在2007年将成为普及产品。到2009年DDR3晶片将成占市场份额的2/3以上。 三、内存优劣判断技巧 DDR内存条主要由PCB、内存颗粒等组成。内存条的品牌虽多,不过能够生产内存颗粒的还是那么几家大厂。三星(SAMSUNG)、现代(Hynix)、英飞凌(Infi neon)等等。除内存颗粒外,我们还可以从下面几个方面来判断内存条的优劣:金手指、设计、工艺。 金手指 (插脚):内存的金手指通常有两种制造方法,电镀和化学镀。电镀金手指耐磨度和电气性能较化学镀的金手指好,电镀的薄20微米左右,不过肉眼很难看得出。电镀的金手指在末端会有一个“小辫子”(这是生产工艺造成,电镀必须要各金手指是导通的,电镀完后再分板将导通线切断)。 设计:根据JEDEC规范,DDR400内存条PCB应为6层,其中第2层为接地层,第5层为电源层,其余4层均为信号层。采用6层PCB板,有4层可以走信号线,表面布线比较宽松(同层布线),大面积覆铜设计,能降低EMI(电磁干扰)。不过为了控制成本,一些厂商通常采用折衷的办法,采用四层板,然后使用单面;或者采用六层板,双面都使用。 工艺:内存上颗粒、电阻、电容等如果焊点圆滑饱满富有光泽,那么这根内存所使用的焊锡和焊接工艺是比较好的。 四、DIY内存选择 内存从DDR到DDR2再到DDR3,技术在不断进步,且价格也差异巨大。作为DIY一族,怎样抉择? 大家都知道,CPU获得数据的途径和优先级是L1>L2>内存,CPU在L2缓存中如果没有找到需要的数据,就通过前端总线(FSB)向内存控制器发出请求继而在内存中寻找需要的数据或指令,最终通过前端总线返回给CPU,这样就存在一个内存带宽要和前端总线带宽相匹配的问题。所以选购内存的时候一定要注意频率够用就可以了。比如购买DDR内存,如果CPU是P4 3.2GC配合800Mhz外频双通道主板,那么买DDR 400的内存已经足够,不需要浪费金钱买DDR 466、DDR 500等规格。 DDR2虽然采用了大量新技术,会取代通行的标准DDR,但毕竟推出时间较短,价格昂贵。AMD就在最近宣布,尽管市场将向DDR2标准转移,但今年不准备修改当前的晶片以支援该标准。 综上所述,笔者认为DDR仍是目前服务器记忆体的首选。DDR2取代DDR只是时间问题,但因为价格高于DDR 70-80%且受CPU外频限制,效率提升并不显著,待到双核心CPU普及(双核心天价及高热量是目前的发展局限)后再选不迟。最新的DDR3即将量产,是未来主流。站在DIY的角度,目前服务器最佳配搭性价比推介新至强配DDR400记忆体和华硕 NCCH-DR主板。 硬 盘(Harddisk) 硬盘介面是硬盘与主机系统间的连接部件,作用是在硬盘缓存和主机内存之间传输数据。不同的硬盘介面决定着硬盘与电脑之间的连接速度,在整个服务器系统中,硬盘介面的优劣直接影响着程式运行快慢和系统性能好坏。 一、硬盘介面的“串列”革命 在过去的20年中,并行(Paralle)介面在占据了主导的地位。人们习惯用IDE来称呼最早出现IDE类型硬盘ATA-1,这种并行介面已经被淘汰。随着CPU时钟频率和内存带宽的不断提升,两种主要的并行总线接口技术ATA和SCSI逐渐显现出不足。对于ATA和SCSI技术,由于采用并行总线介面,传输数据和信号的总线是复用的,因此传输速率会受到一定的限制。如果要提高传输的速率,那么传输的数据和信号往往会产生干扰,从而导致错误。 在上述情况下,串列(Serial)总线接口技术就应运而生。串列总线接口技术并不是并行技术的改进,而是一种完全崭新的总线架构。同ATA和SCSI相对应的是SATA(Serial ATA)和SAS(Serial Attached SCSI)两种技术,它们克服了原先并行总线接口技术中的不足。在数据传输的过程中,数据线和信号线独立使用,并且传输的时钟频率保持独立,串列总线的传输速率可以达到并行的30倍。 二、SATA显优势 由于并行ATA的峰值传输速率有限,随着硬盘数据传输速率提高、磁盘转速更快,SATA得到广泛应用。SATA的进步不仅仅在传输性能上,还包括了功耗、安装简便性、线缆、内部散热以及驱动器配置方面带来很多的好处。这些因素 可能会比数据传输速率更为重要,尤其是对于那些需要节省时间和金钱的DIY族而言。相对于并行ATA又短又宽的笨重线缆而言,SATA串列线缆又小又细,并可以延伸至1米,使得在系统上安装设备和布线变得非常容易,采用这种线缆有效的改进了服务器内部散热,使得系统更加稳定。在电压方面,SATA使用两条数据通道分别发送和接收数据,500毫伏的电压就可以运行SATA了,这使得系统功耗有所减少。 在标准的SATA系统中,采用平均4通道的SATA主适配器时平均磁盘访问时间是14.5毫秒。磁盘读取平均最大值是47 mbps,写平均最大值是36.6 mbps。平均高峰传输速率为79.4 mbps(理论值达150 mbps)。 三、 NCQ的秘密 NCQ(Native Command Queuing,原命令队列)是被设计用于改进在日益增加的负荷情况下硬盘的性能和稳定性的技术。当用户的应用程式发送多条指令到用户的硬盘,NCQ硬盘可以优化完成这些指令的顺序,从而降低机械负荷达到提升性能的目的。 其实NCQ是属于SATA 300规范中的一条,它是一项提升硬盘性能的技术,NCQ允许设备重新排列命令,来进行更有效的数据传输。支援NCQ的系统在执行4条指令的情况(A、B、C、D),它并非按照原来指令的顺序执行,而是根据最优化的顺序执行,从演示来看只要1.25周期即可完成。不支援NCQ的系统,它是完全按照A、B、C、D指令发送的顺序执行的,需要2.75个周期才能完成。这个演示只是说明在这种情况下NCQ的优势,并不代表NCQ硬盘的性能就是2.75/1.25=2.2倍了。 因此在需要处理的任务比较繁重的应用中,比如高性能工作站、网络服务器中,NCQ可以带来更高的性能。当然,在日常的应用中,比如系统启动到文件拷贝,NCQ都能发挥一定的作用。在Seagate公布的PCMark测试数据显示,NCQ可以带来8.8-12.3%的性能提升。 NCQ是专为SATA介面的硬盘设计的,但是用户购买了NCQ硬盘无法立刻从NCQ中受益。用户还需要支援NCQ的主控制器/晶片组才能享受到NCQ所带来的优势。现在的Intel ICH6R已经提供了对于NCQ的支援,因此只要选购采用了这种ICH晶片的主板的用户就具有了支援NCQ硬盘的基本能力。 四、SCSI vs. SATA SCSI与ATA是硬盘的两大介面类型。长期以来,两者可以说互不侵犯,和睦共处,但如今,并行ATA至SATA的转变让大家刮目相看。尤其是万转SATA硬盘出现,使SATA vs.SCSI的话题再次成为了用户争论的焦点。 是不是SCSI硬盘的可靠性更好呢?其实可靠性是与介面无关的。介面在硬盘上就是一块PCB电路板,而决定产品可靠性的更多的是那些硬盘的其他可更换的组件、如磁头、马达、轴承、伺服系统、磁头臂以及磁盘。使用与SCSI硬盘相同的组件加上ATA介面电路完全可以达到相同的可靠性级别。WD740GD硬盘就可以提供120万小时的平均无故障时间和5年质保。 SCSI硬盘目前的最高转速可达15000rpm,SATA硬盘则是10000rpm,更高的转速可以获得更高的寻址速度,这永远是高转速硬盘的优势。但15000rpm并不是市场的主流,就目前最高采用率的SCSI硬盘而言,仍以10000rpm为主,此时SATA与之相比完全不处劣势。 介面速度方面,SCSI目前最高的水平是320MB/s,SATA是150MB/s。但SCSI总线是共用的,SATA则是点对点的,这就意味着当SCSI通道内的硬盘实际带宽总和超过320MB/s时SCSI总线反而将成为瓶颈。SATA则没有这个问题。举个例子来说,5块SCSI硬盘系统的数据传输率仍然是有限的320MB/s 然而5块SATA的系统则能够达到750MB/s。 SCSI的标记命令队列(TCQ)功能是相对于PATA的绝对优势。而新一代SATA硬盘也将会支援SATA-II标准中的原命令队列(NCQ)技术。 容量与成本方面,这方面显然是SATA占优了。SATA硬盘已经达到400GB,而计划上市的SCSI硬盘只达到300GB的水平。而且SATA硬盘的价格更加便宜。除此之外,SATA硬盘还具备热插拔能力,且介面好的可伸缩性好。 五、DIY硬盘选择 众所周知,在服务器系统中,除了CPU、内存外,对系统性能制约还有硬盘,硬盘对于系统整体性能的提升起到了越来越重要的作用。综合上述各点,笔者推荐DIY族采用西部数据的“猛禽”WD740GD硬盘。 西部数据给WD740GD的官方定位是小型服务器和高性能工作站的首选。“猛禽”的盘体技术其实就是万转的SCSI技术,转速是10000RPM,平均读取速度十分惊人,最高速度达到73.4MB/s,采用SATA介面,因此不需要购买价格不菲的SCSI卡,这样算起来WD740在价格上就比较有优势。 74GB对于单硬盘系统的配置来说确实是非常实用的,或者你可以构建一个RAID 0的方案,那样你就可以获得最大的数据传输率了(当然是以CPU利用率的牺牲为代价的,在采用新双至强时可考虑)。新一代猛禽除了会跟进SATA2和NCQ两项新技术外,还会在一些关键技术上做突破,但上市时间目前不确定。 采用NCQ技术的希捷Barracuda 7200.8硬盘也是不错选择,容量高达400GB,性能可与10000rpm SATA硬盘相媲美,但需考虑主板对NCQ的支援。 希捷公司最新宣布计划推出一种新型的2.5英寸硬盘平台,这种2.5 英寸硬盘产品,将采用当前版本的光纤通道、SCSI以及串列SCSI(SAS)。采用此2.5英寸硬盘比目前3.5寸体积大为减少,耗电降低40%,是未来1U机箱最佳选择。