• 简中
    • 繁中
  • 注册
  • 查看作者
  • 7纳米制程、2.6万亿晶体管、比ipad还大,初创公司推「巨无霸」芯片

    转载:本文来自微信公众号“机器之心”(ID:almosthuman2014),作者:小舟、陈萍,转载经授权发布。

    全球最大芯片出第二代‌!WSE 2 将于今年第三季度上市。WSE 2 采用 7 纳米制程工艺,晶体管数达 2.6 万亿个。

    近年来大量芯片进入市场,旨喺加速人工智能和机器学习工作负载。基于唔同嘅机器学习算法,呢啲芯片通常专注于几个关键领域,但佢们大多有一个共同嘅限制——芯片大小。

    两年前,Cerebras 揭开‌芯片设计领域嘅一场革命:佢哋研发‌一款名为 Wafer Scale Engine(WSE)嘅芯片,拥有 1.2 万亿个晶体管,是英伟达 GPU Titan V 嘅 57 倍。WSE 嘅尺寸比一台 iPad 还要大。Cerebras 嘅「暴力美学」曾引发人惊呼:「WSE 嘅晶体管数量已经超过人类大脑中嘅神经元‌!」Cerebras 也因此喺业界闻名。

    今日,该公司又宣布其下一代芯片 Wafer Scale Engine 2(WSE 2)将于今年第三季度上市,采用 7nm 制程工艺,晶体管数量翻倍到 2.6 万亿个,含有 850000 个 AI 核心。

    7纳米制程、2.6万亿晶体管、比ipad还大,初创公司推「巨无霸」芯片

    WSE-2:46225 平方毫米,2.6 万亿个晶体管。图源:https://cerebras.net/

    Cerebras 一直致力于将机器学习问题逻辑解决方案嘅作用发挥到极致。2015 年 Andrew Feldman 成立该公司时,训练神经网络需要花费较多嘅时间,大型网络则需要数周。最大嘅瓶颈是数据必须喺处理器和外部 DRAM 存储器之间进行几次传输,既浪费时间又消耗能源。WSE 嘅研发团队指出:我哋可以扩大芯片,使佢同 AI 处理器内核一齐容纳所需嘅所有数据。随住自然语言处理、图像识别等领域嘅发展,神经网络也变得非常庞大,AI 领域需要一个非常大嘅芯片。有多大?尽可能大,呢意味住是整块晶圆,46225 平方毫米。

    CEO Feldman 表示:「当你想做出改变时,总是会遇到物理设计上嘅挑战。所有嘅嘢都同几何有关。这真嘅好难,但台积电是我哋非凡嘅合作伙伴。」

    7 纳米技术嘅发展意味住巨大嘅进步,但据 Feldman 表示,该公司还对其 AI 核心嘅微架构进行‌改进。他唔愿透露细节,但表示喺同客户合作一年多后,Cerebras 吸取‌一啲经验教训,并将其整合到新嘅核心中。

    WSE 2:7 纳米制程工艺、2.6 万亿个晶体管

    WSE 2 采用台积电 7 纳米制程工艺。这令到其可以按比例缩小,并能够喺一定程度上缩小 SRAM,WSE 2 上具有 850000 个 AI 核心。WSE 2 嘅晶片尺寸同 WSE 保持一致,但几乎所有功能都翻倍增加,如下表所示:

    7纳米制程、2.6万亿晶体管、比ipad还大,初创公司推「巨无霸」芯片

    同一代 WSE 一样,WSE 2 喺 46225 平方毫米嘅硅片上拥有数十万个 AI 核心。WSE 2 拥有 850000 个核心,2.6 万亿个晶体管——相比之下,市场上第二大嘅 AI CPU 约为 826 平方毫米,拥有 0.054 万亿个晶体管。相比于 Ampere A100 嘅 40MB 内存,Cerebras 引入‌ 40GB SRAM 嘅板载内存,是前者嘅 1000 倍。

    7纳米制程、2.6万亿晶体管、比ipad还大,初创公司推「巨无霸」芯片

    图中是 WSE 1,WSE 2 同其外观相同,但核心数量翻倍。

    其核心通过一个带有 FMAC 数据路径嘅 2D 网格(2D Mesh)进行连接。Cerebras 同 WSE 嘅目标是提供一个通过创新专利设计嘅单一平台,该平台允许用于 AI 计算嘅更大处理器,现已扩展到更广泛嘅 HPC 工作负载中。

    7纳米制程、2.6万亿晶体管、比ipad还大,初创公司推「巨无霸」芯片

    WSE 2 以第一代为基础

    第一代 WSE 芯片拥有 1.2 万亿个晶体管,其数量是英伟达旗舰 GPU Titan V 嘅 57 倍,使用台积电 16 纳米制程工艺打造,面积 46,225 平方毫米,包含 400,000 个核心,片上存储高达 18G,功耗 1.5 万瓦(约等于 6 台电磁炉嘅功率),内存带宽 9PB / 秒,通信结构带宽 100PB / 秒。此外,第一代 WSE 还实现‌ 3000 倍嘅速度提升以及 10000 倍嘅存储带宽扩展。

    WSE-2 设计嘅关键是自定义图形编译器,佢采用 PyTorch 或 TensorFlow,并将每一层映射到芯片嘅物理部分,并允许数据流进行异步计算,拥有咁大嘅处理器意味住唔会浪费能源。编译器和处理器喺设计时也考虑到‌稀疏性,无论批处理大小点样,都允许高利用率,或者允许参数搜索算法同时运行。

    7纳米制程、2.6万亿晶体管、比ipad还大,初创公司推「巨无霸」芯片

    WSE 2 同第一代相比点样?

    两者相比,芯片本身嘅大小没有改变,300 毫米仍然是大规模生产中嘅最大晶圆尺寸,因此 WSE 2 芯片嘅外形尺寸没有改变,但是 AI 核心翻‌一倍。WSE 2 仍然被划分成一个 7×12 嘅矩形阵列。

    7纳米制程、2.6万亿晶体管、比ipad还大,初创公司推「巨无霸」芯片

    WSE 2(左)同 WSE 1(右)对比。

    此外,承载 WSE 2 嘅计算机系统 CS-2 也没有太大变化。CS-2 旨喺实现快速、灵活嘅训练和低延迟嘅数据中心推断。目前,CS-2 由 WSE-2 提供动力,同第啲数据中心 AI 解决方案相比,CS-2 具有更高嘅计算密度、更快嘅内存和更高嘅带宽互连,并使用领先嘅 ML 框架进行编程。

    7纳米制程、2.6万亿晶体管、比ipad还大,初创公司推「巨无霸」芯片

    迅速成长嘅初创公司 Cerebras

    Cerebras Systems 公司 2015 年喺美国加州成立,联合创始人及 CEO Andrew Feldman 之前曾创立服务器芯片公司 SeaMicro。

    7纳米制程、2.6万亿晶体管、比ipad还大,初创公司推「巨无霸」芯片

    Cerebras 联合创始人及 CEO Andrew Feldman

    经过几年嘅迅速发展,该公司嘅规模已基本翻倍,喺硅谷,圣地亚哥,多伦多和东京拥有约 300 名工程师。

    参考链接:

    链接

    链接

    链接

    链接

    cantonese.live 足跡 粵字翻譯

    2021-04-21 15:35:17

  • 0
  • 0
  • 0
  • 164
  • 请登录之后再进行评论

    登录
  • 任务
  • 发布
  • 偏好设置
  • 单栏布局 侧栏位置: