英伟达在数据中心的“带货能力”不是一般的强。
2020 年 4 月,英伟达宣布完成对以色列网络芯片商 Mellanox 高达 69 亿美元的收购交易,将 DPU 芯片推至半导体领域的焦点。半年后,英伟达就推出这笔收购所带来的最新成果 —— 新一代 DPU。
DPU,全名 Data Processing Units(数据处理单元),被英伟达创始人黄仁勋称作与 CPU、GPU 共同组成“未来计算三大支柱”。这个新型计算单元宛如数据中心的一匹黑马,一时间变得炙手可热,并在国内外均掀起新一波投资热潮。
仅在今年,国内 DPU 创企中科驭数、星云智联、大禹智芯、芯启源、云豹智能等均宣布完成新融资,其中有多笔融资金额达数亿元人民币。
在国外,明星 DPU 创企 Pensando、Fungible 已经是“吸金”能力超强的数据中心新宠,Marvell 创始人戴伟立、周秀文夫妇亦在 2019 年创立 DPU 新公司 Dream Big Semiconductor。英特尔、Marvell、博通等芯片巨头更是早早押宝。
这个日渐走红的新赛道,真有能与 CPU、GPU 分食数据中心计算市场的潜力吗?
▲ 2021 年公布新融资的国内 DPU 初创公司
“每台服务器可能没有 GPU,但绝对有 DPU,好比每台服务器都必须配网卡一样。”中科驭数创始人兼 CEO 鄢贵海非常看好 DPU 的未来,并认为 DPU 的出现是异构计算的一个阶段性标志。
近年来随着海量数据爆发,计算任务愈发密集,传统以 CPU 为中心的数据中心架构日渐面临性能提升的瓶颈,由 CPU 大包大揽各种计算和管控任务,逐渐演变为多类异构算力资源各司其职。
英伟达创始人兼 CEO 黄仁勋曾解释说,现代数据中心由软件定义,运行数据中心的传统基础设施需消耗 20-30% 的 CPU 核心资源,而 DPU 即是专为 CPU“减负”的一种新型专用处理器。
▲ CPU 主频算力相对网络数据传输速率升级的差距(来源:头豹研究院)
DPU 主要承担起网络、存储和安全的加速处理任务,旨在满足网络侧专用计算需求,尤其适用于服务器量多、对数据传输速率要求严苛的场景。
它将 CPU 所不擅长的网络协议处理、数据加解密、数据压缩等数据处理任务通通接手,通过处理器和网卡的组合,兼顾传输和计算的需求。DPU 也被看作是智能网卡(SmartNIC)技术的演化增强版本。
如今数据中心倡导以资源池的形式来做,各类资源分别管理、扩容,而 DPU 宛如一个连接枢纽,可以起到中心调度管理的作用,一端连接各种 CPU、GPU、SSD、FPGA 加速卡等本地资源,一端连接交换机/路由器等网络资源。
“大家认为,可能在未来的数据中心云端架构上,DPU 取代了 CPU,成为一个最关键的、最核心的芯片地位。”半导体行业知名投资人、华登国际合伙人王林说,如果将整个数据中心看成一整个大的服务,DPU 就相当于这个大服务器里的 CPU。
总体而言,DPU 不仅能提高网络传输效率,而且释放了 CPU 算力资源,从而带动整体数据中心的降本增效。
对于云计算厂商及大型互联网企业,采购 DPU 产品已是必然走向。往前追溯,国内外头部云计算厂商均已率先尝试类似的思路。
早在 2013 年,亚马逊云科技(AWS)就开始研究如何将网络、存储等之前由 CPU 处理的任务卸载到 NIC 卡上,随后收购以色列芯片商 Annapurna Labs,并在 2017 年发布典型产品 AWS Nitro。
AWS 的这一尝试,不仅释放 CPU 的算力资源,也降低了数据中心成本。国内阿里云亦在其神龙服务器核心组件 MOC 卡中应用了专用 X-Dragon 芯片,统一支持网络、I/O、存储和外设的虚拟化。
过去数年间,博通、Mellanox、赛灵思、英特尔等芯片公司均推出自家 DPU 产品,除了加强其对于网络协议和网络安全的处理能力外,也陆续在网络、存储和计算方面均分别展现出许多优势。
与 GPU 不同的是,DPU 面向的应用更加底层,类型更多样,冲在 DPU 前排的各家厂商在具体功能侧重上也各不相同,大体差别如下:
▲ 国外 DPU 主要厂商对比
在收购 Mellanox 后,英伟达进一步增强其 DPU 与 GPU 能力的组合,并在去年亮出新路线图,号称要将 DPU 性能三年提升 1000 倍。明年英伟达将发布加持 AI 能力的 BlueField-3X DPU。
▲ 英伟达 BlueField DPU 三年路线图
今年英特尔、Marvell 等芯片巨头继续加码 DPU。
6 月,英特尔发布了可编程网络设备 IPU(Infrastructure Processing Unit,基础设施处理器),用于扩展智能网卡功能,加速存储虚拟化、网络虚拟化和安全等功能,并释放 CPU 核心。其首个基于 FPGA 的 IPU 平台已为多个云服务提供商完成部署,首款 ASIC IPU 也正在测试中。
7 月,Marvell 推出采用台积电 5nm 制程工艺的 OCTEON 10 系列 DPU,首用 Arm Neoverse N2 CPU 核心,并集成了机器学习推理引擎。首批 OCTEON 10 产品预计将于今年年底前出样,据称相比前一代标量处理引擎,它能将数据包的处理吞吐量大幅提升至 5 倍。
由于 DPU 处于发展初期,业界尚未形成统一标准,也还没有形成足够的规模部署,这为国内 DPU 创企带来了发展良机。
在今年南京世界半导体大会期间的 SoC 设计技术论坛上,半导体行业知名投资人、华登国际合伙人王林提到 DPU 是今年 SoC 创业最火的概念,从去年开始苗头慢慢起来。
根据 Canalys Cloud Channels Analysis 预测,到 2023 年,中国 DPU 市场规模将达 190 亿人民币。另据头豹研究院预测,中国 DPU 市场规模预计将在 2025 年超过 37 亿美元(约合 240 亿人民币)。
▲ 到 2025 年,中国 DPU 市场规模预测(来源:头豹研究院)
目前中国 DPU 产品主要由英伟达、英特尔、博通等国际芯片巨头供应,同时中科驭数、大禹智芯、芯启源、益思芯、星云智联、云豹智能等国内 DPU 创企正组成推动 DPU 国产替代的生力军。
▲ 国内主要 DPU 初创公司
从创立时间来看,国内 DPU 代表创企集中创办于过去六年间,成立时间最早的是芯启源。大禹智芯、益思芯、云豹智能集中在 2020 年 6-8 月创立,星云智联则是今年 3 月刚成立。
作为新型数据中心最重要的芯片之一,DPU 正加速发展。在星云智联 CEO 于勇看来,未来十年,全球云计算和数据中心基础架构将迎来颠覆性变革,基于 DPU 的统一通信服务平台(CAAS)是这个未来架构的核心引擎。
从目前全球 DPU 产业格局来看,产品应用仍相对分散,尽管国际巨头占据技术和市场优势,但国内外的代际之差并非难以逾越。所幸国内多家企业已经在探索商业化落地的道路上。
对于接下来的发展,大禹智芯 CEO 李爽判断,DPU 需要朝两个方向努力:一是提高虚拟化效率,二是提升流动数据的吞吐能力,以助力数据中心网络跨入 100G 目标。
虽然无论是实现核心技术转化为主营收入,还是让 DPU 这个新兴概念被更多客户所接受,都尚需时日,但在产业链上下游厂商的共同努力下,相信未来会有更多公司投入这一新兴赛道,共同推动国内 DPU 生态走向繁荣。
版权及免责声明:凡本网所属版权作品,转载时须获得授权并注明来源“物联之家 - 物联观察新视角,国内领先科技门户”,违者本网将保留追究其相关法律责任的权力。凡转载文章,不代表本网观点和立场。
延伸阅读
版权所有:物联之家 - 物联观察新视角,国内领先科技门户