• 简中
    • 繁中
  • 注册
  • 查看作者
  • 英特尔同AMD嘅x86服务器战争编年史

    转载:本文来自微信公众号“芯智讯”(ID:icsmart),转载经授权发布。

    英特尔同AMD嘅x86服务器战争编年史

    唔耐前,英特尔正式发布‌其第三代至强可扩展处理器(Xeon-SP)平台Ice Lake-SP(ICX)处理器,同时对外宣布,自从2017年推出第一款Xeon-SP 以来,英特尔向全球客户交货‌超过5000万粒Xeon-SP处理器。从2013年开始,云端服务业者总计部署超过10 亿个Xeon 核心,超过800 家云端服务供应商导入‌Xeon 处理器。

    英特尔同AMD嘅x86服务器战争编年史

    诞生于1998 年6 月29 日嘅Xeon,是英特尔第一个货真价实嘅服务器产品品牌,历经超过20年嘅光阴,更早已成为x86 指令集相容处理器,站稳服务器市场嘅龙头地位。

    英特尔同AMD嘅x86服务器战争编年史

    唔过,作为英特尔嘅老对手,AMD喺2003年到2017年间,也有针对服务器市场嘅产品Opteron,更曾喺2003~2007 年这段期间,喺服务器市场斩获颇丰,象征AMD喺服务器市场最辉煌嘅黄金岁月。

    英特尔同AMD嘅x86服务器战争编年史

    如同喺GPU 战场,对英特尔和AMD最重要嘅议题,喺于能否重返高效能运算和人工智能应用,并摆脱软件生态系统远唔如nVidia CUDA嘅困境。

    喺CPU领域,英特尔和AMD真正嘅决战焦点,绝非PC市场,而是可带来更高获利嘅服务器及数据中心市场,而英特尔这市场曾经拥有超过90%嘅占有率。

    英特尔同AMD嘅x86服务器战争编年史

    但好唔幸嘅,英特尔却喺今年第一季财报,上演英特尔财报出现“服务器毛利率低于个人电脑”嘅奇观(这应该是1998年Xeon品牌诞生以来首次)。对比之下,AMD则靠喺服务器市场出色嘅战果,交出‌年营收同比增长93%嘅靓财报。背后代表嘅意义,唔言可喻。

    英特尔同AMD嘅x86服务器战争编年史

    接下来,我哋就从服务器市场,重新审视英特尔和AMD那将近30年嘅服务器市场开拓史,并留畀各位认真思考“”x86双雄嘅未来”。

    经过超过25年嘅努力,英特尔和AMD携手建立x86指令集兼容嘅处理器,喺今日数据中心同服务器器嘅主宰地位。昔日难登大雅之堂、只能屈居个人电脑嘅“吴下阿蒙”,突破众多“RISC诸神”(MIPS、SPARC、PA-RISC、Power、Alpha)建立嘅马奇诺防线,并让“RISC诸神嘅黄昏”成为众多“计算机组机结构正统教义派”和“RISC十字军”唔愿面对嘅现实。

    踏入时间轴之前,笔者先分别以“技术”、“商业”和“政治”嘅角度,剖析为何x86 走到呢一步,然后未来又将面对边啲挑战。

    第一个大议题:从“技术”嘅角度来睇,x86 是点样一步一步取得服务器市场嘅主导地位嘅?

    x86 处理器喺伺服器市场最重要嘅一日?

    1995 年11 月1 日,英特尔发表P6 微架构嘅Pentium Pro,呢是英特尔公司史上最重要嘅芯片,没有之一。

    1990 年开始萌芽嘅当代高效能处理器微架构,有所谓嘅“4S指标”:超纯量(Superscalar)、超管线(Superpipeline)、多处理器延展性(Scalability)、系统管理能力(System Management) 。

    Pentium Pro 是当时x86 处理器唯一兼顾4S 者,同期Cyrix 同AMD 均难以望其项背,且Pentium Pro 嘅整数运算效能,足以跟同期高阶RISC处理器分庭抗礼。至于浮点运算全面超车RISC阵营,是SSE2指令集诞生后嘅事嘎啦。

    Pentium Pro 到底厉害喺边?

    结合高效率嘅系统总线、改良后嘅内建式可程式化中断控制器(APIC)、丝毫唔会浪费系统总线频宽嘅独立二级高速缓存,同处理器核心具备非顺序嘅存取能力,Pentium Pro 替x86 敲开服务器天堂嘅大门,让英特尔过‌快7 年嘅好日子,直到被宿敌AMD 用名为K8 嘅大榔头(Hammer)狠狠敲醒为止。

    边一日x86 处理器奠定喺服务器市场嘅坚实地位?

    1998 年6 月29 日英特尔推出嘅Xeon 品牌,从此成为x86 服务器嘅象征,以及英特尔最重要嘅现金母牛(Cash Cow)。

    依据英特尔嘅既定战略,服务器嘅大旗应由Itanium 一肩扛起,噉为何失败?

    因为英特尔一连串策略失误,加上缺乏对高端服务器市场嘅正确预判,让“64 位元真命天子”IA-64 指令集和Itanium 处理器,唔得唔消失喺历史嘅洪流,也结束‌英特尔企图消灭80×86 嘅野心。而家睇来这伟大嘅“历史使命”,似乎落喺ARM 阵营嘅肩上?

    英特尔同AMD嘅x86服务器战争编年史

    AMD 又系点样踏入服务器市场?

    2002 年4 月24 日,AMD针对服务器市场发布‌Opteron 品牌,刚啱好,微软也喺同一日宣布即将推出x86-64 版Windows 操作系统。

    英特尔同AMD嘅x86服务器战争编年史

    骨灰级电脑玩家一定记得2001 年6 月5 日嘅Athlon MP,但源自Alpha 嘅EV6 系统总线,大幅提高做多处理器平台嘅门槛,基本上可谓无疾而终,好快就被Opteron 取代。

    英特尔同AMD嘅x86服务器战争编年史

    AMD嘅Opteron有何过人之处?

    AMD K8 微架构从内到外嘅每个环节,几乎比照高阶RISC处理器设计,如果将K7 睇成“x86世界嘅Alpha 21264”,噉K8就是“穷人版嘅Alpha 21364”。

    AMD K8 微架构嘅Hyper-Transport 系统总线、处理器整合内存控制器、更先进嘅MOSEI 快取资料一致性协定、强大嘅RAS(可靠性、可用性、可服务性)、同诸多节能特色等优势,为x86服务器带来前所未有嘅多处理器及多核心延展能力,毋须价高量少嘅特殊服务器芯片组,任何一家服务器厂商都可轻松打造“”四粒甚至八粒处理器嘅x86服务器”。

    AMD K8 带领x86 进入64 位元嘅世界,彻底摧毁‌中低阶RISC / Unix 服务器仅存嘅脆弱保护伞。K8成功大幅提升‌AMD嘅市场影响力,让AMD喺高效能x86 处理器技术领域,拥有足以和英特尔平起平坐嘅地位。Xeon 同Opteron 两大品牌双日争辉、兄弟登山各自努力,扩大x86 喺服务器市场嘅版图。

    那为何“RISC诸神”好快又一蹶唔振,只剩下IBM Power 硕果仅存?

    因为佢叫“IBM”。

    第二个大议题:就商业和政治角度,“x86 Everywhere”是点样产生嘅?

    天底下任何产品演进和市场发展,都系“技术”、“商业”同“政治”彼此交错影响嘅结果。x86 指令集相容处理器能够“淘汰”RISC 诸神,相较冷冰冰嘅技术,商业和政治因素更举足轻重。

    1990 年代末期,x86 处理器逐步支配服务器市场嘅关键性因素:

    Windows NT。

    Linux(笔者私心谂加上FreeBSD)。

    出货量持续激增嘅个人电脑市场。

    个人电脑市场跟服务器又有乜嘢关系?

    1998年全球出货量突破“1亿”大关嘅个人电脑市场,成为英特尔和AMD长期维系半导体业界最先进制程同最庞大研发团队嘅基本盘,唔仅对“RISC诸神”拥有压倒性成本优势,利用更多嘅晶体管数量,充分弥补 x86指令集嘅众多先天缺陷(Pentium比PowerPC 601多30%晶体管,只为‌维持x86指令集相容性),更分摊天文数字般嘅产品研发开销。

    RISC 指令集应该更容易打造能效更高嘅处理器,但到头来喺服务器市场并唔系咁回事?

    这跟x86处理器喺1990年代末期延伸到笔记本电脑,有根深蒂固嘅关联,尤其当英特尔为‌Centrino量身订做Pentium M处理器,奠定“追求高能耗比”嘅长期发展方向后,服务器产品线也雨露均沾。2006年Merom微架构一统服务器、桌面PC和笔记本,更让Xeon产品线“强迫中奖”,让IBM Power和Oracle / Sun嘅SPARC相较之下,根本毫无优势。

    呢啲年来,假如各位也有关心那票前仆后继、有一阵没一阵嘅“ARM服务器”,也势必会注意到,嗰啲规格睇起来好暴力嘅ARM处理器,点样好像也没省电到那去?其实当处理器微架构嘅复杂度抵达“某条睇唔见嘅临界点”,“相对复杂又毫无道理可寻嘅”x86指令集带来嘅额外“赋税”也就唔会那么明显嘎啦。

    IBM 唔系一直想推动Power Everywhere,为何难以成功?

    因为IBM 自己也喺做服务器,会有“既当裁判又当球员”嘅疑虑,呢就是非常显而易见嘅政治因素。

    谁能动摇x86 处理器喺近代数据中心嘅主导地位?

    唯有这票大型云端服务业者通通采用自研嘅自家专用嘅“非x86”(唔见得是ARM,如Google 嘅TPU)处理器,否则将难以动摇x86 嘅地位。况且先进制程晶圆代工厂嘅产能,都系处于供唔应求嘅紧绷状态,贸然放弃拥有大量自有产能嘅英特尔处理器,风险唔可以说唔小。睇睇AMD 嘅缺货窘境就知道嘎啦,产品再好,出唔‌货也只是白费力气。

    至于一般商用服务器市场,都系要等到ARM 喺企业服务器应用嘅生态系统,成熟到连一般嘅MIS 都愿意采用,呢之前讲再多都多余。

    无论英特尔还是AMD,近代主流x86微架构都系“服务器、桌面PC、笔记本电脑”共用,噉眼前嘅Xeon-SP 和EPYC,难道真是“100%服务器最佳化”设计吗?

    噉就是x86 指令集嘅原罪:超级长嘅产品开发及验证周期,强迫拥有巨大研发能量嘅英特尔和AMD,也只能将资源聚焦喺极为少数嘅专案,也难以迅速应对新兴嘅应用需求,呢就是ARM 等IP 授权商、EDA 工具软体和专业晶圆代工,会主导消费性产品芯片嘅主因。

    这才是ARM 阵营喺服务器领域嘅最佳切入点,但偏偏也只有“实际嘅使用者”先知道需要嘅产品规格究竟是乜嘢,而佢哋却都有自己开发芯片嘅本钱。

    最后,ARM 能喺服务器市场引发迅速嘅“典范转移”吗?

    坦白讲,点样想都非常嘅困难,除非革命性嘅应用,像软件定义网路、网络功能虚拟化和25G+以太网络,让从1G迈向10G花‌整整十年以太网络,只花唔到3年就跑出一众Smart NIC,让整体数据中心应用架构出现颠覆性演化,要唔然都系难如登天。也许大家可以多多关切 Nvidia企图发动嘅革命,以及云端巨头又有边啲风吹草动。

    更何况英特尔和AMD 又唔会躺住等死,一切都还仲有得瞧。当然,AMD 自己带头做ARM 版EPYC 嘅话,噉又是另一条截然唔同嘅世界线嘎啦。

    而家就让我哋想像搭上时光机,回到世人对x86 嘅刻板印象,难以同“服务器”划上等号嘅古老年代。

    1995~1998 年:英特尔发动嘅酝酿期

    个人电脑普及化,带来更惨烈嘅价格竞争,1990 年代后期嘅英特尔和AMD 为‌维持获利,投入服务器市场,实乃唔得唔为之 。喺1994 年第一季,主频100MHz 嘅Pentium 可卖到“995 美元”(今日都足以组出一台顶配嘅台式机),只过个半年就要打7折嘎啦。

    个人电脑出货量抵达1亿台历史新高嘅1998年,“600美元个人电脑”蔚为风潮,引爆低阶处理器嘅价格战争,导致英特尔嘅Celeron和 AMD嘅K6-2 大打出手,仲要“顺便”打垮一票x86处理器小厂(Cyrix、Centaur、Rise),入门级CPU嘅平均售价(ASP),更加系下探到100美元。

    Xeon 并非英特尔首次进军伺服器市场,第二代Pentium(P54C)内建支援双处理器组态嘅先进可程式化中断控制器(APIC),和Pentium Pro(P6)带来革命性处理器微架构同崭新系统平台,都系以功败垂成黯然收场嘅尝试。

    好吧,200MHz Pentium Pro“胆敢”开价1,989 美元,都算系好‌唔起嘅丰功伟业嘎啦。

    反观那票从1980 年代末期开始,已经盘据伺服器市场已耐嘅“RISC 诸神”,早就享受丰厚利润,以Sun 嘅UltraSPARC 为例,1998 年第二季,都系个人电脑市场嘅削价战杀声震天之际,360MHz 嘅UltraSPARC II模组,要价高达3,961 美元。

    英特尔同AMD嘅x86服务器战争编年史

    我哋也知道,今日就算同样晶粒,封装印住唔同品牌,价格就天差地远。AMD 仲曾经为认识释单处理器嘅Opteron 100 系列和桌面PC嘅Athlon 64 究竟有何唔同,特别制作说明用简报,大意就是Opteron 用嘅晶粒品质比较好、验证项目比较多、微码(Microcode)修补bug 重点唔同之类嘅。

    哩个都系为何呢啲年来,连发迹于消费性电子产品嘅RISC指令集,像目前最普及嘅ARM,阵营也积极开拓服务器市场。x86处理器世界快没存喺感嘅VIA也沉潜多年,推出目标5G边缘伺服器(MEC)嘅 CHA系统单晶片。充满神秘俄系血统嘅俄罗斯Elbrus,更喺多处理器服务器领域耕耘已耐,只为‌让CPU唔受制于“邪恶嘅美国帝国主义者”。

    对技术有深度认知嘅读者,或多或少也认识,服务器用嘅CPU 唔仅需要更好效能、出色嘅多处理器扩充性同效能延展性、更完备嘅高可靠性、滴水唔漏嘅可用性,并搭配强大嘅系统晶片组和更高容量嘅系统内存。

    但商业因素却远比技术门槛更严峻:英特尔和AMD 要点样说服企业客户,一家长期研制100 美元桌面型PC芯片等便宜货嘅厂商,有能力卖3,500 美元等级嘅服务器芯片,所以好似另外成立「豪华车专属品牌」嘅汽车厂商,英特尔必须创造Xeon 以区隔市场。英特尔嘅老对手AMD,于相容Alpha EV6 总线嘅Athlon MP 企图抢滩服务器市场失败之后,2002 年4 月24 日也借Opteron 之名,踏上一条殊途同归嘅荆棘之路。

    1998~2001 年:Xeon 诞生嘅开创期

    英特尔首要之务莫过于推出“一睇就知道是服务器专用”嘅产品,巨大Slot-2“弹夹”就为此而生。

    英特尔同AMD嘅x86服务器战争编年史

    英特尔同AMD嘅x86服务器战争编年史

    但英特尔并非只为‌让Xeon睇起来比较专业,先搞出咁样嘅巨大塑胶盒,更为‌应对更高容量嘅同核心频率嘅高速二级缓存,原先242只针脚嘅Slot-1无办法满足供电需求,Slot-2扩展为330只,趁机塞入系统管理总线(SMBus),并将原生嘅多处理器支援性,恢复到Pentium Pro嘅4粒(Pentium II仅2粒)。此外,为确保四处理器时,系统总线可跑到100MHz,喺英特尔拥有专利嘅GTL+之外,进一步引进AGTL+信号,喺Pentium III世代再提升到133MHz。

    “扩大内存容量”和“高速缓存嘅定址范围”都系另一场重头戏。为‌突破32位元嘅4GB限制,除咗Pentium Pro问世嘅PAE-36模式,Pentium II世代Xeon 追加“效能较低,但比较唔需要修改软件系统”嘅PSE-36。Pentium II世代Xeon嘅L2缓存可涵盖到成个64GB可定址内存范围,唔像早期嘅Pentium II有512MB或4GB限制。提高数据可靠度嘅ECC纠错,更加系必备嘅制式武装。

    如同低价电脑Celeron,Pentiun III时代后期嘅Xeon,随住制程技术嘅进步,逐步将外高速缓存塞回CPU本体。2001年3月21日登场嘅Xeon 900A,内建多达2MB嘅L2高速缓存,开启英特尔高容量高速缓存之先例。也难怪日后英特尔常被取笑:呢间公司最大嘅业务唔系CPU,而是制造高速缓存。

    英特尔同AMD嘅x86服务器战争编年史

    2001~2004年:Xeon嘅扩张期同AMD Opteron即将带来嘅风暴

    英特尔2001年之后嘅Xeon产品线命名,完全拿掉Pentium字样,借此彻底摆脱个人电脑形象,也喺这段32位元NetBurst微架构期间,确立‌Xeon DP(双处理器)和Xeon MP(四处理器)分立嘅局面,也结束‌Pentium II / Pentium III时期,桌面处理器可以同时插两粒嘅美好年代。要支援多处理器,请乖乖掏钱购买更贵嘅Xeon。

    英特尔同AMD嘅x86服务器战争编年史

    因服务器产品追求更高嘅可靠性和稳定性,导致验证时期较长,Xeon MP通常推出时程较迟,且主频也较低,也有更大容量嘅高速缓存。相较之下,Xeon DP比较像桌面处理器换成另一种封装产物。从NetBurst开始出现嘅xAPIC,将APIC嘅3位元专属总线,直接融入系统总线嘅通讯协定,避免APIC运作时影响记忆体存取效能,并将处理器核心上限激增到255个。

    如同初代180nm制程Pentium 4被批评空有高主频,但部分效能唔如前代Pentium III甚至AMD Athlon MP,初期嘅Xeon DP也被指责整体效能唔及拥有2MB L2高速缓存嘅末代Pentium III Xeon,呢问题到‌130nm制程世代,主频大幅提升后,先渐渐消失。

    此外,一般资深电脑玩家对英特尔嘅HyperThreading嘅初次登场,印象多半是2002年11月之后嘅130nm制程Pentium 4,但其实早喺当年2月嘅130nm制程Xeon DP就问世嘎啦。对于多人多工作业嘅服务器嚟讲,可改善整体输出率嘅同时多执行绪(SMT)技术,确实是天作之合。

    英特尔同AMD嘅x86服务器战争编年史

    更重要嘅系,英特尔以实际行动证实180nm制程嘅NetBurst核心,已经内建HyperThreading嘅谣传,2003年3月嘅Xeon MP就支持这“一粒当两粒用”嘅神秘功能。至今英特尔尚未透露为何初代Pentium 4要咁样留一手,主因可能系个人电脑操作系统嘅多处理器支持性。

    面对来势汹汹嘅AMD K8,英特尔喺2003年9月,抢喺Athlon 64和Athlon 64 FX前一周,发布将Xeon专用核心“下放”到桌面PC嘅Pentium 4 Extreme Edition,但仍然难以挽回颓势,也让2004年2月嘅90nm制程Pentium 4 Prescott产品定位,显得更尴尬。

    Xeon MP一次连接四粒CPU嘅SMP系统总线,以及共用嘅内存控制器,成为明显嘅效能瓶颈,也突显AMD K8内建内存控制器同HyperTransport总线嘅绝大优势。喺2003年4月22日,AMD Opteron嘅降临,让英特尔做‌好几年恶梦,也让英特尔嘅处理器产品Roadmap,陷入‌前所未见嘅极大混乱。

    英特尔同AMD嘅x86服务器战争编年史

    2003年:开启AMD全盛期嘅Opteron

    英特尔跟HP合作嘅IA-64指令集同Itanium处理器,策略失当同出师唔利,送畀‌AMD伺机杀入服务器市场嘅大好机会。相较于英特尔,AMD Opteron唔仅享有压倒性嘅技术优势,其产品编号也极度嘅清晰易懂,可以想见“有备而来”嘅程度。

    1开头:单处理器

    2开头:双处理器

    8开头:多处理器(四粒或八粒)

    迈进DDR2内存后,编码变成x200,以此类推,2即代表“第二世代”。

    英特尔同AMD嘅x86服务器战争编年史

    加上当时正系x86服务器也需要直接定址超过4GB主内存嘅心理关键时刻,让AMD发布于1999年嘅x86-64指令集,因具备x86回溯相容性兼具倍增嘅缓存,变成好具吸引力嘅64位元方案。

    2002年4月24日,AMD公布Opteron品牌,同一日微软也“好巧合”宣布将发行x86-64版Windows,让英特尔钦定嘅“64位元真命天子”Itanium处理器嘅未来,蒙上唔祥嘅阴霾。

    英特尔同AMD嘅x86服务器战争编年史

    同时AMD第啲K8产品线品牌嘅发表日期,呢也代表住64位元x86指令集,逐步推广到第啲应用领域嘅里程碑。

    Athlon 64(桌面PC):2002年11月19日。

    Sempron(低价产品):2004年6月7日。BBS连线硬体版戏称为“散步龙”,和英特尔嘅“洗地龙”(Celeron)相互辉映,唯一嘅共同点就是“散步”和“洗地”都象征“跑唔快”。

    Turion 64(笔记本电脑):2005年1月10日,笔者还依稀记得HP还是带头冲第一嘅笔记本电脑厂商。

    AMD当时之所以能喺短短两年就席卷伺服器市场,从英特尔手上硬抢下超过30%市场占有率,除咗64位元,仲有好多重要因素。

    服务器等级嘅侦错容错机制:从ECC单位元纠错嘅L1缓存同L2缓存、预防内存多位元错误嘅Chipkill技术、Parity位元侦错嘅L1指令快取、巨大嘅转译后备缓冲区(TLB)、到回报系统错误嘅MCA(Machine Check Architecture)机能,都充分展现‌AMD抢攻服务器市场嘅决心。

    HyperTransport总线:Opteron直接提供点对点连接处理器嘅方式,唔像英特尔嘅传统北桥架构,每个处理器都要共用有限嘅FSB频宽外,打造大型系统也需要昂贵复杂嘅芯片组、如桥接芯片,呢让实作Opteron多处理器环境远比Xeon轻松。

    也因此,大型Opteron多处理器平台享有比Xeon MP更短嘅研发时间,唔仅成本比较低廉,效能和可靠度上更加系毫无妥协,一度让AMD喺四处理器以上x86服务器,曾有40%以上市占率。英特尔是到2008年嘅Nehalem有‌QPI,先追上AMD。

    英特尔同AMD嘅x86服务器战争编年史

    高效率嘅高速缓存一致性协定(Cache Coherence Protocol):这对多处理器环境效能有住举足轻重嘅影响,而AMD嘅MOESI协定有极为出色嘅表现。

    英特尔同AMD嘅x86服务器战争编年史

    和处理器核心同频率嘅整合型内存控制器:多处理器环境变成CC-NUMA(Cache Coherence-Non Unified Memory Architecture)分散式内存架构,让Opteron整体内存效能,远胜过英特尔嘅系统前端总线(FSB)连接北桥(North Bridge)嘅架构。

    整合式内存控制器让处理器数量越多,可扩增嘅内存容量也会更大。2005年,企业需要128GB主内存容量嘅服务器,采用Itanium嘅HP SuperDome要价4千其台币,但八粒Opteron嘅系统,如Sun X4600和Iwill H8501,每粒安装16GB内存,价格却仅十分之一,巨大优势唔言可喻。

    英特尔同AMD嘅x86服务器战争编年史

    直冲原生双核心:当北桥内存控制器都位于喺处理器晶粒之度,自然也唔必担忧双核心至多核心嘅内部频宽同延迟问题。AMD打从2001年,就宣布让K8直奔原生双核心(请注意下图嘅CPU 0和CPU 1),更喺2004年8月31日(2004年秋季IDF)就公开双核心样品,2005年4月准时登场,呢是AMD x86处理器发展史上最重大嘅战略胜利。

    英特尔同AMD嘅x86服务器战争编年史

    K7演进而来嘅成熟微架构:K8是以K7为基础进行改良嘅产物,相较于同时期嘅英特尔NetBurst体系,也享有压倒性嘅低功耗。AMD喺2002年2月26日(2002年春季IDF)首次展示单核心K8,隔年4月正式上市,屡次用较低嘅运行频率「屠杀」英特尔NetBurst体系嘅产品线。

    英特尔同AMD嘅x86服务器战争编年史

    强大动态分支预测和记忆体转译后备缓冲区:足以应付“分支密集且狂食内存频宽”嘅服务器端应用软体嘅行为模式。

    英特尔同AMD嘅x86服务器战争编年史

    值得一提嘅系,因为K8嘅L1 / L2缓存“互斥”(Exclusive),AMD还利用“L1指令缓存嘅数据,被迫回L2时,L2嘅ECC形同浪费”(L1指令缓存只有Parity)特色,将分支选择器“偷放”喺呢个栏位,以增强分支预测器嘅容量,并兼顾效能同成本,堪称非常厉害嘅巧思,毕竟L1缓存被侦测到数据受损,顶多从内存重新撷取一次就好嘎啦。

    英特尔同AMD嘅x86服务器战争编年史

    2003年底上市嘅Opteron 848,售价高达3,199美元,呢对过去只能喺个人电脑市场跟英特尔打价格战嘅AMD嚟讲,简直是连想都唔敢想嘅梦。

    2004年6月14日,AMD发新闻稿,昭告天下“我哋已经设计完毕原生双核产品”,并大方摊开产品Roadmap畀大家睇。

    英特尔同AMD嘅x86服务器战争编年史

    2004年7月17日:Cray宣布将建造由10880粒Opteron构建出来嘅Red Storm超级电脑。

    英特尔同AMD嘅x86服务器战争编年史

    2004年8月23日:AMD同Newisys喺IEEE HotChips 16发表Horus芯片组,呢是AMD史上首款32处理器嘅大型系统架构(就算后来胎死腹中)。

    英特尔同AMD嘅x86服务器战争编年史

    2005年4月21日,AMD发布双核心嘅Opteron 800系列,领先英特尔嘅Core 2家族整整超过一年,堪称AMD公司当时最意气风发嘅时刻。

    英特尔同AMD嘅x86服务器战争编年史

    只唔过,再多好运也有用完嘅一日。当时无人预料到,AMD唔仅将面对英特尔即将发动嘅帝国大反击(还是由Pat Gelsinger领军),更将喺迈向原生四核心处理器之路,重重跌‌一跤,仲要再唔可以爬起来。

    2004~2006年:陷入空前混乱嘅英特尔

    AMD喺服务器市场趁势崛起嘅期间,英特尔嘅64位元布局,被AMD搞得阵脚大乱,陷入内外交逼困境,结果就系一连串赶鸭子上架嘅64位元x86指令集、东拼西凑嘅效能改进方案、以及换汤唔换药嘅“双馅水饺”双核心。

    英特尔同AMD嘅x86服务器战争编年史

    这时期嘅Xeon,除咗具备大型化L3缓存嘅Xeon MP,和睇起来有啲似勉强赶工出来嘅双核Xeon DP,清一色都系桌面PC体系嘅衍生品,只差喺芯片封装是包一粒还是包两粒,然后顺便“解放”被封印嘅64位元。

    此外,值得一提嘅系,后来喺这NetBurst混乱期嘅末期,英特尔确立‌Xeon MP 7000和Xeon DP 5000命名体系。你而家睇到Xeon嘅四码数字型号,就是以这时候为起点。

    英特尔同AMD嘅x86服务器战争编年史

    但AMD喺服务器市场带来嘅空前威胁,逼出英特尔全部潜力,也让Xeon逐渐具备‌更强大嘅多处理器竞争力。以Xeon MP平台Truland为例,E8500系列晶片组唔仅藉由两条系统前端总线稍微弥补跟AMD Opteron嘅频宽差距,更“外挂”内存缓冲控制器(XMB,External Memory Buffer),实现更高嘅内存容量同频宽。

    英特尔同AMD嘅x86服务器战争编年史

    芯片组嘅管脚数量有限,就算不惜血本,喺北桥芯片组内“硬干”八通道内存,届时单一内存通道能够“推嘅动”几条模组,也将会是个大难题。唔如分而治之,将部份内存控制器嘅机能分割出来,反正高单价嘅多处理器服务器,也足以吸收呢啲额外嘅成本。有啲年纪嘅读者也应当知晓,呢早已是众多高阶服务器(像IBM嘅Power和Z系列大型主机)行之有年嘅特色。

    英特尔同AMD嘅x86服务器战争编年史

    日后一系列嘅Xeon MP也依循同样方式,像八核嘅Nehalem-EX、十核嘅Westmere-EX、十五核嘅Ivy Bridge-EX、十八核嘅Haswell-EX和二十四核嘅Broadwell- EX,直到英特尔从14nm制程“牙膏期”嘅Xeon-SP之后,将内存控制器机能全数收回到CPU内部。

    英特尔同AMD嘅x86服务器战争编年史

    为‌提升服务器嘅网络存取效能,微软2006年3月发布Scalable Networking Pack(SNP)同NDIS 5.2 Miniport驱动程式架构,技术核心嘅NetDMA规范,企图打通一条从网卡直奔应用程内存嘅「烟囱」,而英特尔嘅Xeon DP Bensley平台就成为首款对应I/OAT嘅产品。英特尔嘅I/OAT也陆续演进‌好几个世代,唯一唔变嘅就是“从CPU到芯片组到网卡,都要用英特尔嘅嘢”。

    总之,以2005年为起点,以Xeon MP和Opteron x800系列为主嘅x86处理器,喺四处理器以上高阶服务器芯片嘅出货量急速攀升,蚕食鲸吞传统高阶RISC服务器嘅地盘,到‌2014年,英特尔嘅Xeon足足食下94%市场,就算产品单价较低,也吞食超过80%营收,RISC伺服器嘅出货量更从一年32,000台掉到9,000台。

    顺便一提,喺这块市场,2014年IBM是12%~15%,并购Sun嘅Oracle更只剩下5%。既然连四处理器都咁,单处理器和双处理器平台就更连想都唔用想嘎啦。呢啲年来,昔日曾呼风唤雨嘅众多“RISC诸神”,沦落至此,令人唔胜唏嘘。

    英特尔同AMD嘅x86服务器战争编年史

    2006~2008年:英特尔开始转型并准备反攻AMD

    英特尔同AMD嘅x86服务器战争编年史

    英特尔原先预定嘅「三轨共构」(服务器Itanium、桌面NetBurst、笔记本电脑Pentium M)产品发展计划,2005年完全推翻,确立回归x86为中心,集中资源发展同时满足笔记本电脑、桌面PC和服务器嘅x86处理器微架构,为对AMD发动帝国大反击嘅开路先锋。英特尔嘅钟摆巨轮(Tick-Tock)开始缓缓转动,彻底辗碎AMD嘅服务器战线。

    英特尔同AMD嘅x86服务器战争编年史

    英特尔睇到Google呢啲云端服务业者,为‌降低成本,数据中心大量采用单处理器平台(Google第一代自制服务器使用单粒Pentium III),英特尔也将Xeon产品线延伸到单处理器、和桌面PC处理器相同脚位、相同产品代号嘅3000系列,落后AMD Opteron 100系列好几年。挂上Xeon品牌嘅价格当然比较昂贵,至于产品有没有比较可靠,就只有呢啲客户才会知道嘎啦。

    根据唔同脚位,Xeon产品线分成3块:

    单处理器Xeon UP:LGA775嘅3000

    双处理器Xeon DP:LGA771嘅5000

    四处理器Xeon MP:Socket 604嘅7000,呢个睇似老旧嘅脚位,生命周期长到让人讶异。

    相对应嘅系统芯片组,也采取同样嘅命名方式,让客户更容易理解边啲CPU应该搭配边啲芯片组。喺数字编号之外,以65nm制程嘅四核心为起点,型号另外加注E(高能耗)、L(低功耗)和X(高效能),突显产品属性。

    这时嘅Xeon,排除英特尔喺印度班加罗尔嘅研发团队所负责操刀嘅原生六核Dunnington,其余嘅四核心,也都还是包两粒芯片嘅“双馅水饺”,整合式内存控制器和分散式主内存仍付之阙如,相较AMD喺2007年底就发表原生四核K8(K10),英特尔Xeon仍睇似落后AMD一大截。

    英特尔同AMD嘅x86服务器战争编年史

    眼尖嘅读者势必察觉到某粒Xeon DP好唔一样,特别标示超低电压(ULV)嘅特色。Xeon LV嘅存喺理由唔外乎当时流行嘅“刀锋”服务器,带动超低功耗服务器CPU嘅需求,虽然以事后诸葛亮嘅角度回顾这段历史,刀锋服务器嘅风潮真嘅差唔多是“昙花一现”。

    其实这粒双核心嘅Xeon LV,源自于Core微架构(Merom)嘅前身Yonah,也同样出自于以色列海法研发团队之手,可视为从NetBurst转型到Core嘅“过渡时期实验性产品”。除咗没有64位元,众多Merom嘅特点,像双核心共用大型化L2快取记忆体,Yonah都睇得到。英特尔研发资源之充沛,由此可见一斑。

    英特尔同AMD嘅x86服务器战争编年史

    当CPU核心倍增,更需要大幅度提升内存容量同频宽,也因此,英特尔喺Xeon DP同Xeon MP嘅系统芯片组,导入FB-DIMM(Fully-Buffered DIMM),透过近似PCI Express嘅序列式(Serial)总线同通讯协定,连接内存控制器同内存模组上嘅AMB(Advanced Memory Buffer)。

    如果读者仲记得前面提到嘅英特尔E8500芯片组嘅IMI同XMB,就可以将FB-DIMM想像成“将IMI / XMB概念,转移到内存模组嘅JEDEC标准”。唔过,FB-DIMM存活喺市场上嘅时间并唔长,主因喺于高昂嘅成本同过长嘅内存存取延迟,导致普及度唔高,搞到连AMD都唔想用,也仅有Sun UltraSPARC T2共襄盛举,最终默默嘅消失喺所有厂商嘅产品Roadmap。

    英特尔同AMD嘅x86服务器战争编年史

    那时入门级服务器导向嘅5100芯片组(San Clemente)因维持「传统」嘅DDR2记忆体,加上性能表现也没比那票FB-DIMM嘅产品来得差,被视为「一股清流」 。比较高阶嘅芯片组,如5000X(Greencreek)、5400(Seaburg)和7300(Clarksboro),均内建高速缓存一致性协定窥探过滤器(Snoop Filter),一个记录内存区块位址共享状态嘅高速缓存,减少窥探广播嘅次数,以减轻系统总线嘅负担。

    英特尔同AMD嘅x86服务器战争编年史

    Core 2时代嘅英特尔Xeon并未一举击倒喺系统平台架构仍享有技术优势嘅AMD Opteron,到‌Nehalem / Westmere才开花结果,让AMD从此一蹶唔振到2017年。

    2008~2011年:英特尔倾尽全力打垮AMD

    英特尔同AMD嘅x86服务器战争编年史

    上面这张图片是原生八核、24MB L3缓存、晶粒面积高达648平方厘米嘅Nehalem-EX(Beckton),呢粒“巨兽”都系英特尔彻底终结AMD优势(以及摧毁自家嘅Itanium)嘅终极象征。虽然源自于笔记本电脑需求嘅Core微架构,已经明显优于AMD K8同K10,但系统架构层面仍落后于AMD。英特尔喺Nehalem世代一次“补好补满”,彻底瓦解AMD嘅服务器产品战线。

    虽然说自从Merom之后,英特尔所有x86处理器微架构,都须兼顾服务器、桌面PC和笔记本电脑,但Nehalem最重要嘅任务,只有“尽快将AMD逐出服务器市场”,所以一切以服务器和高效能桌面PC为最高优先权,到‌32nm制程嘅Westmere才抢滩笔记本电脑市场。

    这段期间,除咗单处理器3000、双处理器5000和四处理器7000,Xeon产品命名规则,新增以下项目:

    双处理器嘅核心代号多‌EP(Efficient Performance),多处理器则是EX(Expandable)。

    6000系列:将最高阶7000系列嘅处理器,“下放”成双处理器版本。

    因QPI大幅提升多处理器延展性,7000 / 8000系列可直接对应8处理器平台,唔再是AMD Opteron x800系列嘅特权。

    英特尔主流桌面PC处理器脚座嘅Socket H系列,以H1(LGA1156)为起点,直到今日嘅H5(LGA1200)。

    Jasper Forest是内建PCI Express NTB(Non-Transperent Bridge)技术嘅特规版Nehalem,直白一点,就是方便厂商研制双控制器(Dual Controller)相互备援嘅高可靠度硬件平台,如双控制器嘅企业级储存设备等。

    英特尔同AMD嘅x86服务器战争编年史

    相较于Merom,Nehalem最重大嘅突破,由内到外,可简述为以下几点:

    HyperThreading复活,CPU再度一粒当两粒用。

    所有核心独享L2缓存,共用内建嘅L3缓存。

    CPU整合内存控制器,MCH就此消失。

    引进源自于Alpha EV7嘅QPI总线,并一并翻修高速缓存一致性协定(Cache Coherence Protocol)成MESIF。

    Nehalem嘅x2APIC处理器核心数目上限是4294967295,可视为无限大。

    八核心嘅Nehalem-EX,也导入处理器内嘅环状(Ring)总线,奠定未来几年英特尔多核心x86处理器嘅技术基础,到‌Xeon-Phi和Xeon-SP才更替换成网状结构(Mesh)。

    英特尔同AMD嘅x86服务器战争编年史

    微架构层面,今日成为英特尔、AMD处理器共同制式武装嘅“微指令缓存”(uOp Cache),只要命中就唔须启动复杂又耗电嘅指令解码器,可同时改善功耗和效能,从NetBurst那失败嘅Trace Cache为起点,一路演进到Nehalem,先算出现真正雏型。

    这也让Nehalem微架构嘅Xeon平台,呈现和过去截然唔同嘅风貌,也长得更似过去几年嘅AMD Opteron,就算多一粒有啲碍眼、到Sandy Bridge才消失嘅IOH。唔再受制于系统前端总线和MCH嘅Nehalem世代,拥有更巨大嘅系统总线同内存频宽,整体效能表现更加系脱胎换骨,让AMD难以翻身。

    四处理器和八处理器Xeon平台为‌支持高容量内存同更多嘅内存体通道,NetBurst时代Xeon MP嘅IMI(Internal Memory Interface)界面XMB(External Memory Buffer),替换成更先进SMI(Scalable Memory Interface)界面嘅SMB(Scalable Memory Buffer)。

    英特尔同AMD嘅x86服务器战争编年史

    此外,为‌强化服务器嘅RAS(可靠性、可用性、可服务性),英特尔喺Nehalem-EX(Xeon 7500系列)将Itanium那一整套RAS架构原封唔动嘅移植到x86平台,“MCA(Machine Check Architecture )Recovery”可喺内存区块标示硬件无办法修复嘅错误,通知操作系统或虚拟机器管理员(Hypervisor),唔可以再使用呢啲单元,关闭标示错误嘅数据,并重新启动程序。

    当然,呢也需要操作系统嘅配合,例如从2008年Windows Vista和Windows Server 2008开始引进嘅WHEA(Windows Hardware Error Architecture)。持续唔断嘅补强,让x86处理器正式站稳高阶服务器嘅舞台。

    从Merom到Nehalem嘅“帝国大反击”,让AMD喺x86服务器嘅市占率急速下滑,更一举跌破10%到个位数水准,让一度响亮嘅Opteron品牌黯淡无光。AMD从Zen世代开始企图“重返农药”,也将服务器品牌重新更名为EPYC,唔再使用这曾代表AMD最辉煌岁月嘅名称。

    英特尔同AMD嘅x86服务器战争编年史

    这段期间AMD发生‌乜嘢事?

    英特尔同AMD嘅x86服务器战争编年史

    上面这张照片是原生四核心嘅K10 Barcelona,都系AMD Opteron极盛而衰嘅转折点。

    AMD从2003~2007年,压住英特尔猛打‌好几年。但英特尔从2006年吹起反攻号角,AMD喺2006年嘅夏天,耗资54亿美元并购ATi,也严重影响AMD内部产品研发时程,并造成一连串骨牌效应。

    当2006年嘅圣诞节,AMD宣布原生四核心嘅K10完成设计,并由CEO Hector Ruiz亲自主持庆功嘅圣诞晚会时,全世界都感受嘅到AMD早已力唔从心。结果2007年11月,爆发会造成系统宕机嘅“TLB臭虫”事件,但通过更新BIOS关闭TLB,将会降低10%~30%嘅效能。AMD喺服务器市场嘅气势,就如同自由落体直线下坠,难以挽回。

    英特尔同AMD嘅x86服务器战争编年史

    AMD喺2009年6月准时推出原生六核K10 Istanbul,并喺产品行销简报内大肆宣扬“使命必达嘅执行力”,但哩个都系AMD成功嘅极限,融合CPU同GPU嘅Fusion大战略,让AMD从此备多力分,产品时程也渐渐脱轨,接住得来唔易嘅服务器市占率,就被英特尔嘅钟摆巨轮狠狠辗碎,让AMD陷入长达十年嘅黑暗期。

    AMD从Socket G34“包双晶粒水饺”时,也将Opteron产品线精简成4000(单处理器或双处理器,Socket C32)同6000(双处理器或多处理器,Socket G34)系列,但x86服务器市占率依然跌至个位数。姗姗来迟嘅“救世主”推土机(Bulldozer)家族能否救驾成功?但事后证明,根本只是提油救火。

    2011~2017年:英特尔嘅钟摆巨轮辗碎AMD

    英特尔同AMD嘅x86服务器战争编年史

    英特尔唔动声色喺22nm制程,默默导入3D立体结构嘅Tri-Gate(三闸极)电晶体,并喺2011年5月才正式昭告天下,领先第啲厂商嘅FinFET起码超过三年,堪称这间以摩尔定律奉为登山宝训嘅公司,喺先进半导体制程领域最意气风发嘅时刻。

    当英特尔喺2014年2月10日嘅旧金山IEEE ISSCC(国际固态电路研讨会),正式公布代号Ivytown嘅Ivy Bridge-EX嘅技术细节,核心数量相较前代Sandy Bridge-EP几乎倍增嘅原生十五核,象征AMD Opteron被英特尔Xeon彻底压垮,连想利用“双馅水饺”嘅倍增核心数量,勉强抗衡英特尔嘅机会都无。

    英特尔同AMD嘅x86服务器战争编年史

    以2011年Sandy Bridge(Tock)为起点,英特尔嘅钟摆(Tick-Tock)巨轮开始全速转动,接连嘅Ivy Bridge(Tick)、Haswell(Tock)和Broadwell(Tick),制程从32nm、22nm演进到14nm,稳定推陈出新,让英特尔Xeon喺伺服器市场嘅优势更难以撼动。

    英特尔喺精准执行钟摆节奏嘅几年内,为‌因应唔同产品线需求,同一世代微架构嘅处理器组态,逐渐成形成LCC(Low Core Count,低数量核心)、HCC(High Core Count,高数量核心)同XCC(Extreme Core Count,超级多核心)等三种等级。Xeon嘅推出时程,因较长嘅产品开发同验证时间,和桌面PC、笔记本电脑处理器嘅“时差”也越拉越长,最高阶产品甚至可晚两年以上。

    英特尔同AMD嘅x86服务器战争编年史

    眼光转向英特尔嘅钟摆节奏,就唔难理解为何呢啲年是AMD最难过、最唔堪回首嘅日子。知名技术评论家、Real World Tech站长David Kanter曾咁样形容英特尔嘅钟摆“Damn Excellent At Execution”,的确是最贴切嘅写照。

    2011年(Tock):Sandy Bridge,系统架构扬弃又热又烫嘅IOH,引进AVX指令集,具备货真价实嘅微指令快取(uOp cache),换装NetBurst体系嘅乱序指令执行引擎,指令重新排序缓冲区同实体数据缓存分而治之,以减少CPU内部嘅数据流动量,利于省电。这时AMD推土机家族嘅Opteron,仍可用两倍嘅核心数勉强抗衡。

    2012年(Tick):Ivy Bridge,最主要嘅改进还是跑出十五核Ivy Bridge-EX呢个妖怪,唔畀AMD嘅“双馅十六核”任何反击嘅机会。

    分配、协调各I/O周边装置存取处理器需求,发出中断(Interrupt)时,知道该由边个处理器负责,是近代多处理器环境嘅必要条件,而起源于1993年Pentium嘅先进可程式化中断控制器(APIC, Advanced Programmable Interrupt Controller)则是技术核心。但和内存虚拟化嘅状况如出一辙,让VMM建立软件模拟嘅Shadow APIC唔仅耗费处理器效能,更会造成虚拟机频繁嘅进出执行环境。英特尔则系喺2013年发布APICv(APIC Virtualization)实用于Ivy Bridge微架构嘅Xeon E5-2600 v2。

    应对激增嘅核心数,为‌确保充裕嘅内存频宽同容量,继Boxboro-EX(Nehalem-EX / Westmere-EX)平台嘅SMI之后,Brickland平台(Ivy Bridge-EX / Haswell-EX / Broadwell-EX )升级成SMI2,数据传输界面从序列(Serial)转为64位元并列(Parallel),走线从70根爆增到110根,电气特性也截然唔同,总之就是砍掉重练。

    英特尔同AMD嘅x86服务器战争编年史

    2013年(Tock):Haswell,新增AVX2指令集,并带来英特尔x86处理器微架构史上,最大规模嘅执行单元扩张行动,并大幅强化虚拟化机能,进一步追求控制唔同虚拟机器占用L3高速缓存同内存频宽嘅精细调控机制,实现“L3高速缓存层级嘅QoS(Quality-Of-Service)”,避免系统资源被少数虚拟机食光,或让VMM集中资源喺最需要嘅虚拟机。Haswell-EP/EX最大核心组态再度略增到十八核,让AMD连核心数都占唔‌便宜。

    英特尔同AMD嘅x86服务器战争编年史

    2014年(Tick):Broadwell,虚拟化机能更精进,如更彻底嘅硬体化APICv(APIC Virtualization)和正名为Resouce Director Technology嘅L3高速缓存QoS,Broadwell-EX更将核心数推进到二十四核。

    英特尔同AMD嘅x86服务器战争编年史

    为‌阻止ARM或第啲RISC阵营,藉由低功耗和网络储存等应用“渗透”伺服器市场,英特尔推出整合网络控制器和一堆I/O界面嘅Xeon-D系统单芯片Broadwell-DE ,喺入门级企业储存同网通产品大受欢迎,后续还升级成Skylake-DE。

    英特尔同AMD嘅x86服务器战争编年史

    这时AMD Opteron已走到生命尽头。

    AMD当初挖角IBM Power4首席工程师Chuck Moore,开发号称“可以只增加50%晶粒面积,即可提升80%性能”嘅丛集多执行绪(CMT,Cluster-based Multi-Threading),却被一再延宕嘅产品研发时程拖累。

    英特尔同AMD嘅x86服务器战争编年史

    AMD也仿照英特尔,同时开发大核同小核,后者虽然喺游戏机领域得到重大战果,却也挽回唔‌喺服务器市场嘅颓势。

    英特尔同AMD嘅x86服务器战争编年史

    AMD错估英特尔钟摆节奏嘅进步幅度,规格四处偷工减料嘅推土机(Bulldozer),也注定对抗唔‌融合P6同NetBurst技术大成嘅Sandy Bridge,AMD服务器战线就此彻底崩盘,直到2017年EPYC才重返战场。

    英特尔同AMD嘅x86服务器战争编年史

    各位读者可先复习一下AMD近代x86处理器嘅家族简史,你会对2010年之后AMD产品线乱象更有感。

    英特尔同AMD嘅x86服务器战争编年史

    原本AMD打算靠住连续四个世代嘅丛集多执行绪微架构:推土机(Bulldozer)、打桩机(Piledriver)、压路机(Steamroller)、挖土机(Excavator),用两个比较简单嘅整数运算核心打英特尔一个大核,双核心共用嘅浮点运算器则“依据Fusion大战略,假以时日替换成GPU”,重夺Opteron嘅技术优势。

    英特尔同AMD嘅x86服务器战争编年史

    结果到头来AMD Opteron连核心数都输人,呢场“走音工地秀”也无办法走到尽头,丛集多执行绪嘅Opteron实际只进展到第二代(挖土机嘅X3000是沿用桌面PC嘅低阶产品),仲要乱入毫无竞争优势嘅ARM Cortex-A57核心嘅A1100系列。“正统”Opteron处理器嘅发展只撑到‌2012年,就黯然划下句点,接住就是等到Lisa Su走马上任,将满天飞舞嘅简报通通束之高阁,倾尽全力研发Zen。

    英特尔同AMD嘅x86服务器战争编年史

    物极必反,否极泰来,就轮到AMD吹起反攻嘅号角嘎啦,虽然喺2017年6月初代EPYC准备跟姗姗来迟嘅Skylake-SP Purley平台对垒时,声音还是相当微弱,几乎没有人听见。

    2017~2020年:乱迫牙膏嘅英特尔再次被AMD反打一枪

    可能领先优势已经拉太开,IBM也迟迟难以有效将Power“下放”到一般平民百姓家,睇喺毫无竞争对手嘅份上,英特尔2015年(Tock)“集技术之大成嘅最终英特尔x86处理器微架构”Skylake问世后,钟摆巨轮慢慢停下,转型成“14nm制程Skylake牙膏厂。

    英特尔金鸡母嘅Xeon亦唔可免俗,意图“一次到位”、满足所有市场需求嘅Skylake-SP Purley平台,历经几次延宕,到2017年7月才姗姗来迟,接住就被AMD一口咬住,启动“重返农药”大反击。

    英特尔同AMD嘅x86服务器战争编年史

    既然Skylake微架构是“奋钟摆六世之余烈”嘅技术集大成,噉以佢为心脏嘅Xeon当然也唔可以丢脸,唔让世人感到“耳目一新”实喺说唔过去。Skylake-SP之所以多出嗰个SP(Scalable Platform,可扩展性平台),充分彰显‌英特尔嘅企图:统合过去Xeon MP和Xeon DP及EN / EP / EX嘅系统架构,唔再分而治之,并企图降低整体成本。

    英特尔同AMD嘅x86服务器战争编年史

    所以Skylake-SP呈现‌和过去嘅Xeon平台截然唔同嘅崭新面貌,笔者仅列出几个比较显眼嘅重点:

    Skylake-SP核心比一般桌面PC、笔记本电脑处理器,多‌AVX-512指令集,为此新增两个专用执行单元(部份低阶型号Xeon仅启动一个),L2 / L3高速缓存也针对服务器,调整容量同区块置换策略,呢也让单一核心面积肥大化,也喺日后“吸引”‌唔少事后诸葛亮嘅批判,像Linus Torvalds就希望“AVX-512应该痛苦嘅死去”。

    英特尔同AMD嘅x86服务器战争编年史

    UPI(Ultra Path Interconnect)总线取代QPI。

    英特尔同AMD嘅x86服务器战争编年史

    省略掉XMB、SMB、SMB2记忆体缓冲器,内存模组通通直连CPU,从双处理器、四处理器、八处理器,统一成六通道DDR4内存。

    英特尔同AMD嘅x86服务器战争编年史

    系统芯片组整合对应iWARP嘅10GbE以太网路控制器,同提升数据压缩和加解密运算嘅QuickAssist辅助处理器。

    英特尔同AMD嘅x86服务器战争编年史

    部分型号内建英特尔自订嘅OmniPath总线控制器,超低延迟嘅特性利于高效能运算(HPC)等应用。唔过英特尔喺2019年宣布放弃OmniPath嘎啦。

    英特尔同AMD嘅x86服务器战争编年史

    3D XPoint内存模组Optane Apache Pass,但却延后到2年后嘅微幅改进版Cascade Lake-SP。

    英特尔同AMD嘅x86服务器战争编年史

    产品命名系统除咗数字,更加上白金、金牌、银牌、铜牌等名话,睇似80 PLUS电源供应器嘅效率等级认证。

    至于2019年4月登场嘅Cascade Lake-SP,则喺AVX-512追加以Deep Learning Boost为名嘅VNNI指令(重点喺于支持人工智能推理需要嘅INT8 / INT16短整数)同“幽灵(Spectre)、熔断(Meltdown)”攻击嘅防御措施,2020年6月嘅Cooper Lake-P则再补上对于深度学习必备嘅BFloat16格式嘅支持,补强重点都集中喺人工智能,制程也依然“死守”14nm。

    面对AMD EPYC来势汹汹嘅压倒性核心数量优势,英特尔也得重演“双馅水饺”嘅旧戏码,创造‌400W功耗、最多56核嘅Cascade Lake-AP。

    英特尔同AMD嘅x86服务器战争编年史

    这张表格应可帮助读者迅速理解英特尔Xeon-SP「牙膏期」嘅更迭史。

    英特尔同AMD嘅x86服务器战争编年史

    挺过Cooper Lake-SP被腰斩嘅风波,随住英特尔终于喺2020年嘅夏天,喺HotChips 32公开Ice Lake-SP技术细节,睇似漫长嘅“14nm Skylake牙膏期”即将划下句点,但Ice Lake-SP推迟到2021年第二季。

    英特尔同AMD嘅x86服务器战争编年史

    值得注意嘅系,英特尔喺第三代Xeon-SP短暂重现Xeon MP和Xeon DP分立嘅样貌,喺第四代嘅Eagle Stream平台和Sapphire Rapids处理器之前,如果需要BF16浮点格式做人工智能深度学习,就请乖乖掏钱购买比较贵嘅Cedar Island平台和Cooper Lake-P处理器。

    英特尔同AMD嘅x86服务器战争编年史

    时过境迁,AMD总算挺过‌最黑暗嘅10年。随住2017年AMD发布第一代EPYC服务器芯片,重新向数据中心处理器市场发起冲击之后,得益于出色嘅Zen架构以及台积电嘅先进制程嘅加持,仅过‌两年嘅嘅时间,根据官方公布嘅数据显示,2019年AMD喺服务器市场嘅份额就迅速增长到‌接近8%。而上年底AMD还推出基于Zen 3架构嘅第三代EPYC服务器芯片(代号Milan),呢将系一款基于台积电7nm工艺制程,最高64核心嘅产品。外界认为,新一代性能更强嘅EPYC服务器芯片有望助推AMD市场份额嘅进一步提升。但是也同样将面对英特尔最新推出嘅10nm工艺嘅第三代Xeon-SP带来嘅巨大压力。

    另外,目前AMD喺服务器市场嘅市占率,却仍睇唔到当年Opteron全盛时期嘅车尾灯。身为Opteron继承者,EPYC跟英特尔嘅Xeon-SP之间嘅激战,依然是未来几年内,处理器技术领域最值得关注嘅焦点(假若ARM没有喺数据中心领域出现爆发性成长)。

    2021年之后:英特尔再度重启钟摆巨轮

    Pat Gelsinger做为英特尔嘅CEO回归后,宣布重启“钟摆巨轮”,但呢次面临嘅局势,远比15年前更严峻。

    英特尔同AMD嘅x86服务器战争编年史

    综观已知嘅英特尔未来几年Xeon产品Roadmap,重点都唔喺于规格细节和有没有睇起来出色嘅尖端技术,而是英特尔能否重现“钟摆期”(2011~2017)使命必达嘅优异执行力。

    英特尔同AMD嘅x86服务器战争编年史

    除此之外,英特尔还得面对两个问题:“利润下滑”和“来自ARM嘅潜喺威胁”。

    现今以云端服务业者嘅数据中心为大宗嘅服务器市场,处理器采购案可谓杀价杀到刀刀见骨嘅程度,动辄砍到牌价三四成嘅惨案,亦随处可闻。哩个都系为何AMD宁愿付出效能代价、宁可让多芯片封装衍生出较长嘅数据存取延迟、选择Chiplet“多馅水饺”路线嘅主因,并且利于应对供货需求、灵活调配服务器和桌面PC嘅出货比例。

    英特尔同AMD嘅x86服务器战争编年史

    英特尔同AMD嘅x86服务器战争编年史

    当然,握有绝大多数市场嘅英特尔可透过大量嘅“商业手段”和“生态系统”维持市占率嘅稳定,唔过因为产品逐渐失去竞争力而导致获利下滑,对英特尔才是最致命嘅一击。请别忘‌Xeon一直是英特尔最重要嘅现金母牛,好唔幸嘅,呢件事似乎已经成为而家进行式嘎啦。

    x86双雄将点样面对伺服器市场巨变

    此外,对业界动态敏感嘅读者,应该有留意到一件睇似微不足道、但绝对影响深远嘅小事:VMware喺2020年10月6日(那时Pat Gelsinger还是VMware执行长),发表Arm版ESXi Hypervisor。这代表VMware可能认定Arm喺服务器应用嘅爆发性成长,即将抵达微妙嘅临界点同心理关键时刻。

    英特尔同AMD嘅x86服务器战争编年史

    回过头来,ARM要切入个人电脑市场嘅成功率,最终仍取决于微软嘅态度,系咪愿意再大费周章建立全新嘅生态系统。但假若UEFI和ACPI等规范,喺ARM处理器平台发展成熟度,可和现有x86平起平坐,让自行更替操作系统更方便,噉服务器市场将会呈现截然唔同嘅局面。

    各位可以想像一个画面:假以时日,ARM喺伺服器市场的确占有一席之地,并持续攻城掠地,然后AMD顺势推出脚位同x86版本相容嘅K12核心EPYC,并可无痛转换。这恐怕将是英特尔唔想睇到嘅。

    英特尔同AMD嘅x86服务器战争编年史

    但对x86双雄嚟讲,最可怕嘅长期危机还是“云端业者越来越多嘅开始自己开发服务器芯片”,佢哋拥有足够嘅本钱同条件,如果有人同你讲「Google搞唔好已经正喺度秘密开发可取代英特尔、AMD嘅RISC-V指令集处理器」,你大概也唔会感到惊讶。

    总之,Xeon、Opteron和EPYC,唔只是x86站稳服务器市场嘅象征,更加系见证英特尔同AMD兴衰嘅图腾,也许喺过去难以想像、甚至连想都唔敢想嘅巨变,将以出乎意料嘅速度,出而家我哋眼前。

    作者:痴漢水球    来源:technews

    编辑:芯智讯-浪客剑   

    cantonese.live 足跡 粵字翻譯

  • 0
  • 0
  • 0
  • 182
  • 请登录之后再进行评论

    登录
  • 任务
  • 发布
  • 偏好设置
  • 单栏布局 侧栏位置: