• 简中
    • 繁中
  • 注册
  • 查看作者
  • 芯片圈大镬‌:英伟达推出首个CPU,狂捧Arm生态

    转载:本文来自微信公众号“芯嘢”(ID:aichip001),转载经授权发布。

    作者 |心缘

    编辑 |漠影

    芯嘢4月13日报道,今日凌晨,一年一度影响人工智能及高性能计算技术盛会NVIDIA GTC如期而至,这是GTC大会继上年后第二次在线上举行。

    NVIDIA(英伟达)创始人黄仁勋依然穿住拉风嘅皮衣,喺自家厨房举办发布会。可以明显睇到,老黄嘅头发更白嘎啦,也更长嘎啦。

    芯片圈大镬‌:英伟达推出首个CPU,狂捧Arm生态

    上年NVIDIA重磅发布旗舰A100 GPU以及一系列服务器、集群、超算,轰动成个人工智能领域,而家,老黄带住一系列软硬件新品高调回归。

    万万没想到,呢一次,全球GPU霸主NVIDIA推出‌一款基于Arm嘅数据中心CPU!

    在宣布400亿美元收购Arm嘅6个月后,NVIDIA连发三款基于Arm IP打造嘅处理器,包括全球首款专为TB级加速计算而设计嘅CPU NVIDIA Grace、全新BlueField-3 DPU,以及业界首款1000TOPS算力嘅自动驾驶汽车SoC。

    “我哋每年都会发布激动人心嘅新品。三类芯片,逐年飞跃,一个架构。”黄仁勋说,数据中心路线图包括CPU、GPU和DPU这三类芯片,而Grace和BlueField是其中必不可少嘅关键组成部分。每个芯片架构历经两年嘅打磨周期(周期内可能出现转变),一年专注于x86平台,另一年专注于 Arm 平台。

    芯片圈大镬‌:英伟达推出首个CPU,狂捧Arm生态

    此外,NVIDIA还公布‌同亚马逊aws、Ampere Computing、联发科和Marvell等基于Arm嘅CPU平台嘅合作伙伴关系。

    在软件方面,超大规模语言模型训练同推理问答引擎Megatron、实时对话式AI平台Jarvis、AI网络安全框架Morpheus、Omniverse企业版、由GPU加速嘅量子电路模拟框架CuQuantum等一系列最新进展首次揭晓。

    显然,面向数据中心异构计算嘅新天地,NVIDIA正集合软硬件技术优势,打出高调嘅组合拳。

    01.3款自研Arm芯:首粒数据中心CPU落地全球最快AI超算

    呢次发布会令人最印象深刻嘅,就是NVIDIA在助推Arm生态方面不遗余力,从自研CPU、DPU、自动驾驶处理器到GPU嘅合作伙伴,从云、高性能计算、边缘计算到PC,无处不Arm。

    先来睇下呢次发布嘅三款硬件新品:

    1、首粒数据中心CPU:落地全球最快AI超算

    黄仁勋宣布嘅第一个重磅新品,系一款专为大规模人工智能和高性能计算应用而设计嘅CPU——NVIDIA Grace。

    绝大多数嘅数据中心仍将继续使用现有嘅CPU,而Grace主要将用于计算领域嘅细分市场,预计将于2023年可供货。

    由于超大规模嘅模型好难完全放进GPU内存,如果存储在系统内存,访问速度则会大大受限,这款CPU嘅问世主要即是为认识决呢一瓶颈。

    芯片圈大镬‌:英伟达推出首个CPU,狂捧Arm生态

    NVIDIA Grace以发明‌世界上第一个编译器、被称为“计算机软件工程第一夫人”嘅先驱计算机科学家Grace Hopper命名,具体有3点创新进步:

    (1)内置下一代Arm Neoverse内核,每个CPU能在SPECrate2017_int_base基准测试中单位时间运行超过300个实例;

    (2)采用第四代NVIDIA NVLink,从CPU到GPU连接速度超过900GB/s,达到相当于目前服务器14倍嘅带宽;从CPU到CPU嘅速度超过600GB/s。

    (3)拥有最高嘅内存带宽,采用嘅新内存LPDDR5x技术,带宽是LPDDR4嘅两倍,能源效率提高‌10倍,能提供更多计算能力。

    明年将有两台性能强大嘅AI超级计算机面世,都将采用NVIDIA Grace,据称其同NVIDIA GPU紧密结合,性能将比目前最先进嘅NVIDIA DGX系统(在x86 CPU上运行)高出10倍。

    这两台AI超算度,瑞士国家计算中心(CSCS)正喺度打造一个算力可达20Exaflops嘅系统,美国洛斯阿拉莫斯国家实验室(Los Alamos National Laboratory)也会系其研究人员配备新AI超算。

    2、Bluefield-3 DPU:220亿晶体管

    在黄仁勋睇来,负责在数据中心传输和处理数据嘅数据处理单元(DPU),正同CPU、GPU共同组成“未来计算嘅三大支柱”。

    NVIDIA全新BlueField-3 DPU包含220亿个晶体管,采用16个Arm A78 CPU核心、18M IOPs弹性块存储,加密速度是上一代嘅4倍,并完全向下兼容BlueField-2。

    BlueField-2能够卸载相当于30个CPU核嘅工作负载,而BlueField-3实现‌10倍嘅加速计算性能提升,能够替代300个CPU核,以400Gbps嘅速率,对网络流量进行保护、卸载和加速。该处理器也是首款支持第五代PCIe总线并提供数据中心时间同步加速嘅DPU。

    芯片圈大镬‌:英伟达推出首个CPU,狂捧Arm生态

    BlueField-3通过NVIDIA DOCA(集数据中心于芯片嘅架构)软件开发包为开发者提供一个完整、开放嘅软件平台,开发在BlueField DPU上开发软件定义和硬件加速嘅网络、存储、安全和管理等应用。DOCA已经喺今日发布并提供下载。

    新一代BlueField-3 DPU预计将于2022年第一季度发布样品,第四代BlueField DPU将包含640个晶体管,算力达1000TOPS,网络速率达800Gbps。

    芯片圈大镬‌:英伟达推出首个CPU,狂捧Arm生态

    3、车轮上嘅数据中心:算力达1000TOPS

    NVIDIA DRIVE Atlan是新一代AI自动驾驶汽车处理器,算力将达到1000TOPS,约是上一代Orin处理器嘅4倍,超过‌绝大多数现有无人驾驶出租车嘅子女计算能力。

    芯片圈大镬‌:英伟达推出首个CPU,狂捧Arm生态

    这是DRIVE平台首次集成DPU,通过Arm核为自动驾驶汽车带来数据中心级嘅网络,致力于应用到2025年嘅车型。

    该SoC采用下一代GPU嘅体系结构、新型Arm CPU内核、新深度学习和计算机视觉加速器,并内置为先进嘅网络、存储和安全服务嘅BlueField DPU,网络速度可达400Gbps。

    芯片圈大镬‌:英伟达推出首个CPU,狂捧Arm生态

    黄仁勋夸赞讲:“Atlan集NVIDIA在AI、汽车、机器人、安全和BlueField安全数据中心领域嘅所有技术之大成,堪称一项技术奇迹。”

    4、便捷式AI数据中心和DGX SuperPod双升级

    黄仁勋还宣布升级NVIDIA专为工作组打造嘅“便携式AI数据中心”NVIDIA DGX Station,以及NVIDIA专为密集型AI研发打造嘅AI数据中心产品NVIDIA DGX SuperPod。

    全新DGX Station 320G借助320GB超快速HBM2e连接至4个NVIDIA A100 GPU,内存带宽达到每秒8TB。但係,仅需将其插入普通嘅壁装电源插座即可使用,耗电量只有1500W。

    黄仁勋说,达到呢种性能嘅CPU集群成本约为100万美元,而DGX Station仅需14.9万美元。

    芯片圈大镬‌:英伟达推出首个CPU,狂捧Arm生态

    DGX SuperPOD使用全新80GB NVIDIA A100,将其HBM2e内存提升至90TB,实现2.2EB/s嘅总带宽。要实现咁嘅带宽,需要11000台CPU服务器,大约相当于有250个机柜嘅数据中心,比SuperPOD多15倍。

    目前佢已经升级至采用NVIDIA BlueField-2,且NVIDIA而家还为该产品提供配套嘅NVIDIA Base Command DGX管理和编排工具。

    5、Aerial A100:5G+AI嘅新型边缘计算平台

    黄仁勋还提到‌NVIDIA嘅AI-on-5G计算平台,这系一款专为边缘设计、将5G和AI相结合嘅新型计算平台。该平台将采用NVIDIA Aerial软件开发套件同NVIDIA BlueField-2 A100,将GPU和CPU组合成“有史以来最先进嘅PCIE卡。”

    富士通、谷歌云、Mavenir、Radisys和Wind River等合作伙伴都喺度开发适用于NVIDIA AI-on-5G平台嘅解决方案。

    芯片圈大镬‌:英伟达推出首个CPU,狂捧Arm生态

    02.协作亚马逊自研CPU支持云服务,打造Arm+GPU新PC

    除咗推出基于Arm嘅CPU外,NVIDIA还宣布一系列同Arm处理器设计商嘅合作进展,包括会系亚马逊AWSGraviton2 CPU提供GPU加速、为科学和AI应用开发提供支持嘅全新HPC开发者套件、提升边缘视频分析和安全功能、打造新一类基于Arm并搭载NVIDIA RTX GPU嘅新款PC等。

    呢啲举动反映出无论是市场还是NVIDIA自身,对基于Arm嘅解决方案嘅兴趣已经超出移动领域。

    1、NVIDIA GPu搭配亚马逊自研CPU赋能云服务

    2021年下半年,基于亚马逊云科学(AWS)自研服务器处理器AWS Graviton2嘅Amazon EC2实例将同NVIDIA GPU相结合,喺云端部署。

    呢一新组合将实现降低成本、支持更丰富嘅游戏串流体验、优化云上安卓游戏和人工智能推理、以更低成本提供更高嘅AI推理性能等优势。

    黄仁勋讲:“我哋致力于将Arm生态系统扩展到移动和嵌入式系统以外嘅市场,而今日宣布嘅新合作伙伴,正系我哋迈出嘅第一步。”

    芯片圈大镬‌:英伟达推出首个CPU,狂捧Arm生态

    2、新HPC开发者套件,支持科学和AI应用开发

    为‌更好地支持科学和AI应用开发,面向高性能计算领域,NVIDIA推出‌全新HPC开发者套件。

    NVIDIA全新HPC开发者套件为超级计算机提供‌一个高性能、高能效嘅平台,该平台结合‌1个Ampere Altra CPU(包含80个Arm Neoverse核,运行频率高达3.3GHz)、双NVIDIA A100 GPU(每个GPU可提供312TFLOPS嘅FP16深度学习性能)、两个用于加速网络、存储和安全嘅NVIDIA BlueField-2 DPU。

    该开发者套件包含一套NVIDIA编译器、库和工具,但系用于创建HPC和AI应用,以及将其迁移到GPU加速嘅Arm计算系统度,将于2021年第三季度上市,多家顶尖研究机构已率先展开部署。

    芯片圈大镬‌:英伟达推出首个CPU,狂捧Arm生态

    3、加速边缘安全功能,打造由GPU驱动嘅新PC

    今日NVIDIA还宣布‌提升边缘视频分析和安全功能、打造新一类基于Arm并搭载NVIDIA RTX GPU嘅新款PC等进展。

    在边缘计算领域,NVIDIA正扩大同Marvell嘅合作,将基于Arm嘅OCTEON DPU同GPU相结合,加速Ai工作负载,实现网络优化和安全。

    在PC领域,NVIDIA同全球最大嘅基于Arm嘅SoC供应商之一联发科合作,共同打造一个采用Arm核同NVIDIA显卡、支持Chromium、Linux和NVIDIA SDK嘅参考平台,将GPU嘅性能及先进嘅AI、光线追踪图形等技术带入Arm PC平台。

    此外,NVIDIA也正同富士通、SiPearl等第啲合作伙伴共同致力于扩展Arm生态系统。

    03.更多AI平台落地,首秀量子电路模拟框架

    NVIDIA在上年推出‌一个机架比肩AI数据中心嘅AI系统DGX A100、AI算力高达700 PFLOPS嘅集群DGX SuperPOD、千其亿级工作组服务器DGX Station A100。

    面向AI应用需求,NVIDIA已经提供Megatron、Jarvis、Merlin、Maxine、Isaac、Metropolis、Clara和DRIVE、以及各种可使用TAO进行定制化嘅预训练模型。

    今日,NVIDIA进一步强化企业计算服务,不仅推出大型语言模型训练同推理问答引擎、宣布对话式AI平台最新落地进展,仲要展示‌其量子电路模拟框架。

    1、NVIDIA EGX:扩大认证服务器生态系统

    为进一步实现AI民主化,黄仁勋发布‌来自顶尖制造商嘅新系列NVIDIA认证系统,即大容量企业级服务器,现已通过认证。

    呢一系统可运行NVIDIA AI Enterprise软件套件,该套件得到‌全球应用最广泛嘅计算虚拟化平台——VMware vSphere 7嘅独家认证。

    芯片圈大镬‌:英伟达推出首个CPU,狂捧Arm生态

    NVIDIA今日推出多款新系统,以扩大NVIDIA认证服务器生态系统。呢啲新系统配备用于主流AI和数据分析嘅NVIDIA A30 GPU,以及用于AI图形、虚拟工作站以及混合计算和图形工作负载嘅NVIDIA A10 GPU。

    2、Megatron:超大型语言模型训练同推理

    黄仁勋发布‌用于训练Transformers嘅超大语言模型嘅NVIDIA Megatron Triton推理服务器。

    Transformers已帮助开发者在自然语言处理领域取得‌突破性进展,能够生成文档摘要、将电子邮件中嘅短语补充完整、对测验进行评分、生成体育赛事现场评论、甚至生成代码。

    芯片圈大镬‌:英伟达推出首个CPU,狂捧Arm生态

    使用Megatron Triton嘅DGX A100能在1秒内做出响应,但系同时支持16项查询,而双插座CPU服务器支持1条问询就超过‌1分钟。

    3、Jarvis:实时对话式AI平台现可使用

    Jarvis系一个基于NVIDIA GPU提供实时性能嘅灵活、多模态对话式AI服务应用框架,但系帮助开发者轻松实现实时语音识别、转录、摘要、翻译、封闭式字幕、虚拟助手、聊天机器人等功能。

    而家,NVIDIA已经系一个生产就绪、现已可用嘅端到端对话式AI模型,企业可基于自身数据和特定需求对模型做进一步嘅微调,并使用NGC实而家云或边缘快速部署定制化语言型AI服务。

    芯片圈大镬‌:英伟达推出首个CPU,狂捧Arm生态

    为帮助客户将自身专业知识应用于AI领域,黄仁勋还宣布推出NVIDIA TAO,其可以运用客户和合作伙伴嘅数据,对NVIDIA预训练模型进行微调和适配,同时保护数据隐私。

    4、Morpheus:AI网络安全应用框架

    为‌保障现代化数据中心嘅安全,黄仁勋宣布推出基于NVIDIA GPU、BlueField DPU、Net-Q网络遥测软件和EGX嘅新型AI框架而构建嘅NVIDIA Morpheus数据中心安全平台,能够对完整嘅数据包进行实时检测、预防安全威胁,现可抢先试用。

    作为一个基于AI嘅云原生网络安全框架,NVIDIA Morpheus通过在边缘和AI技术嘅结合,利用实时嘅遥测、策略执行及操作,但系以在不牺牲成本和性能嘅情况下分析更多嘅安全数据,识别、捕捉和应对以往无办法识别嘅威胁和异常情况,如未加密敏感数据嘅泄露、网络钓鱼攻击和恶意软件。

    芯片圈大镬‌:英伟达推出首个CPU,狂捧Arm生态

    Morpheus同BlueField DPU相结合,使网络中嘅每个计算节点都成为边缘网络防御传感器,企业无需复制数据,也能够以线速分析每个数据包。相比之下,传统嘅AI安全工具通常只能采样5%左右嘅网络流量数据,因此威胁检测算法并非基于完整嘅模型。

    同步推出嘅BlueField-3可为NVIDIA Morpheus提供实时嘅网络可视化、网络威胁嘅检测同响应、以及监控、遥测和代理服务。开发者仲够晒在现有IP投资嘅基础上,使用深度学习模型来创建自己嘅Morpheus AI功能。

    5、CuQuantum:量子电路模拟框架

    为加快有赖于量子位(或量子比特,能作为单个嘅0或1存在,也可以同时作为二者存在)嘅量子计算研究,黄仁勋推出‌cuQuantum,为量子电路模拟器提供加速。

    这是专为模拟量子电路而设计嘅加速库,适用于张量网络求解器和状态向量求解器,经过优化后,但系以扩展到大GPU显存、多个GPU和多个DGX节点。

    芯片圈大镬‌:英伟达推出首个CPU,狂捧Arm生态

    运行cuQuantum基准测试时,状态向量模拟在双CPU服务器上需要10天,但在DGX A100上剩系要2个钟头,DGX上嘅cuQuantum可以高效模拟10倍嘅量子位,从而帮助研究人员设计出更完善嘅量子计算机。

    04.公布自动驾驶新平台,扩大同沃尔沃合作

    自动驾驶汽车(AV,Autonomous vehicles)是NVIDIA近年来极其重视嘅赛道之一。除咗前文提及嘅1000TOPS自动驾驶处理器外,呢次黄仁勋还推出‌Hyperion 8 AV平台,并宣布沃尔沃汽车扩大同NVIDIA嘅合作。

    NVIDIA Hyperion 8 AV平台系一个先进嘅数据采集、开发和测试平台,包含参考传感器、自动驾驶汽车和中央计算机、3D地面真实数据记录仪、网络以及所有必要嘅软件。

    芯片圈大镬‌:英伟达推出首个CPU,狂捧Arm生态

    沃尔沃汽车从2016年开始借助高性能且高能效嘅NVIDIA DRIVE嘅算力,基于NVIDIA DRIVE Xavier,为新车型开发AI辅助驾驶功能,软件则由沃尔沃汽车旗下嘅自动驾驶软件开发公司Zenseact自主研发。

    黄仁勋说,将于2022年投产嘅NVIDIA自动驾驶汽车计算系统级芯片NVIDIA DRIVE Orin,旨在成为汽车嘅中央电脑。

    芯片圈大镬‌:英伟达推出首个CPU,狂捧Arm生态

    而沃尔沃汽车会系新一代汽车嘅自动驾驶计算机配备NVIDIA DRIVE Orin。

    这意味住两家公司嘅合作深入到更多软件定义车型,首发就是将于2022年发布嘅新一代XC90。

    05.推出英伟达Omniverse企业版,赋能Drive SIM 2.0

    黄仁勋强调说,NVIDIA系一家软件平台公司,并大力发展NVIDIA AI和将3D世界连接至共享虚拟世界嘅NVIDIA Omniverse。

    NVIDIA Omniverse系一款多GPU可扩展嘅云原生平台,支持建模、布局、住色、合成、渲染、动画引等一系列构建3D虚拟建模所需嘅功能,用于仿真、协作和自主机器训练。

    其特点还包括:具有高物理精度、能够充分运用RTX实时路径追踪和DLSS、可以使用NVIDIA MDL模拟材料、可以使用NVIDIA PhysX模拟物理学并且同NVIDIA AI完全集成。

    黄仁勋提到:“Omniverse旨在创建共享虚拟3D世界,好似尼尔·斯蒂芬森在1990年代早期嘅小说《雪崩》中所描述嘅科幻虚拟空间那样。”

    上年12月,NVIDIA推出‌Omniverse公测版本。自公测版发布以来,建筑、游戏以及大型广告公司等合作伙伴都将Omniverse运用到其工作中。

    从今年夏季开始,NVIDIA将提供Omniverse企业授权许可。

    芯片圈大镬‌:英伟达推出首个CPU,狂捧Arm生态

    黄仁勋还宣布DRIVE Sim将于今年夏季开放供业界使用。他提到Omniverse中嘅DRIVE数字孪生是能够同车队中每一位工程师和每一辆车互联嘅虚拟空间。

    正如Omniverse能够构建汽车生产工厂嘅数字孪生一样,DRIVE Sim也可用于创建自动驾驶汽车嘅数字孪生,并将其用于自动驾驶汽车嘅开发。

    此外,NVIDIA正同宝马合作打造一个完全采用数字化设计嘅未来工厂,自始至终在Omniverse中进行模拟,创建数字孪生,并让机器人同人类协同工作开展运营。

    芯片圈大镬‌:英伟达推出首个CPU,狂捧Arm生态

    06.结语:NVIDIA集齐“未来计算嘅三大支柱”

    总体来睇,NVIDIA今日公布嘅多项成果同进展,为基于Arm嘅解决方案带来更多可能性,NVIDIA这又打造硬件又优化软件嘅势头,更加彰显‌其主导数据中心领域AI和HPC市场嘅决心,也为颇负盛名嘅GTC大会打出‌响亮嘅头炮。

    呢次GTC线上大会共超过10万人注册参会,共计将举行1600多场技术演讲。喺接下来嘅5天内,3位图灵奖得主、12位戈登-贝尔奖得主、10位奥斯卡奖得主,以及来自微软、Arm、奥迪汽车、亚马逊、通用电气、微软等企业嘅领导人均将喺呢次科技盛会上发表演讲。

    从最新一系列努力来睇,NVIDIA身上早已贴上远多于GPU巨头嘅更多标签,成为全栈计算平台。首款数据中心CPU嘅发布,也宣告住NVIDIA嘅异构计算布局再添新嘅关键元件,数据中心产品线集齐CPU、GPU、DPU这“未来计算嘅三大支柱”。

    NVIDIA正卯足‌劲儿推进将GPU同Arm系CPU相结合嘅生态发展,呢一切显然还只是开始。

    cantonese.live 足跡 粵字翻譯

    2021-04-13 07:35:08

  • 0
  • 0
  • 0
  • 174
  • 请登录之后再进行评论

    登录
  • 任务
  • 发布
  • 偏好设置
  • 单栏布局 侧栏位置: