光子计算时代到来了吗?几家中美芯片创企正试图给出正面的回答。
2020 年 6 月,LightOn 发表用光学神经网络训练芯片运行 AI 模型的新论文;7 月,曦智科技拿到由和利资本投资的数千万美元 A + 轮融资;8 月,Lightmatter 在芯片顶会 HotChips 上展示了其光子芯片的架构细节;12 月,光子算数宣布其打造的光电混合 AI 加速计算卡已交予服务器厂商客户做测试。
在加速人工智能(AI)这条赛道上,光子计算芯片这条创新的技术方向正异军突起。这是一群勇敢的探路人,他们在期待和争议中前行,一步一个脚印地试图证明自己判断方向的正确性。
光子 AI 芯片距离产业化落地还有多远?在这一赛道的创业者们,能给计算芯片带来新的惊喜吗?
随着摩尔定律滞缓,硅光子技术成为超越摩尔定律的研究方向之一。
2017 年,来自英国艾克塞特大学、牛津大学和明斯特大学的研究人员,宣布了其类脑光驱动芯片研究成果。他们用特殊相变材料和光子集成电路模拟人脑神经突触,使得这款芯片在测试中的数据传输速度达 300Gbps,比当时现有标准处理器要快 10-50 倍,同时功耗大幅降低。
在同年 5 月的美国麻省理工学院 10 万美元创业大赛上,一支来自麻省理工学院(MIT)的团队凭借用纳米光子芯片执行 AI 任务,成功斩获大奖。
▲主创团队在 2017 年赢得麻省理工学院 10 万美元创业大赛
1 个月后,主创团队的研究成果登上顶级期刊《自然 · 光子学》的封面,论文描述了一种利用光学干涉进行神经网络计算的创新方法。当时,国际著名光学科学家、斯坦福大学终身教授 David Miller 评价称:“这一系列研究成果极大地推动了集成光学未来取代传统电子计算芯片的发展。”
这篇光子芯片论文的一作及通讯作者是 MIT博士后沈亦晨,二作是尼克 · 哈里斯(Nick Harris)。不久之后,这些论文合著者将成为商业上的竞争对手,开启各自的创业之旅,并分别获得来自谷歌、百度等科技巨头的投资。
▲麻省理工学院团队论文登上《自然 · 光子学》封面
论文链接:https://www.nature.com/articles/nphoton.2017.93
光子是当前速度最快的粒子,相较电子,速度更快而功耗极低。此前光学技术通常应用于通信传输领域,借助光的更快速度、更高容量等特点实现数据的远距离传输,但在计算领域进展缓慢。
实际上,光计算的研究历史并不短暂。在国外,1950 年代前后,贝尔实验室等机构花费大量精力来设计光学计算机部件;在国内,1987 年中科院上海光学精密机械研究所王之江院士曾于《中国科学院院刊》上撰文,提出了极具前瞻性的发展光计算技术的建议,并于此后在光学神经学逻辑计算方面开展了大量的工作。
由于光计算的应用场景并不清晰,软硬件体系也不够完善,关于如何用光子代替电子芯片执行计算的想法长期停留在研究阶段,鲜少在实际应用中发挥广泛的作用。
直到摩尔定律趋于滞缓,AI 的巨轮开始起航。
作为统治计算的一个基准法则,摩尔定律指出,微处理器芯片上的晶体管数每 18-24 个月翻一番,曾长期作为推动电子设备小型化和互联网普及的关键动力。
但这是芯片制造商及供应商竭力维系摩尔定律的结果,随着逼近物理尺寸极限、散热难题即将成为无法克服的挑战,以及许多关键的计算密集型应用发展提速,人们对摩尔定律的未来产生了更多疑虑,对芯片技术创新的需求也愈发迫切。
2016 年,《Nature》在 “超越摩尔(More than Moore)”一文中指出,摩尔定律已接近日薄西山,接下来硅晶技术的发展将不再以摩尔定律为中心,造出更好的芯片然后让应用跟进,而是从应用出发来看需要怎样的芯片支持,进而容纳更多细微复杂的创新方向。
而根据 OpenAI 发布的分析数据,自 2012 年以来,AI 训练对算力的需求每 3.43 个月翻一番,增速明显快于摩尔定律。
▲自 2012 年以来算力需求增长超过 30 万倍,而如果以摩尔定律的速度只会有 12 倍的增长(来源:OpenAI)
随着以神经网络计算为主的 AI 应用普及,一些研究人员意识到,深度学习可能是数十年来光学计算所等待的 “杀手级应用”。
首先,光速快于电子速度,理想状态下,光子芯片的计算速度能比电子芯片快约 1000 倍。同时,采用成熟半导体工艺技术的光子芯片,即可达到当下需要的计算能力。
其次,光子计算消耗能量少,同等计算速度下,光子芯片的功耗仅为电子芯片的数百分之一,可以缓解 AI 创新所需的数据中心建设对环境的影响。
▲Lightmatter 联合创始人兼 CEO 尼克 · 哈里斯在 2020 年 Hot Chips 上讲解光子计算相较电子计算的延时、带宽、功耗优势
最后,光计算技术具有并行计算的特点,光波的频率、波长、偏振态和相位等信息可以代表不同的数据,且光路在交叉传输时互不干扰。这些特性使得光子擅长做并行运算,与多数计算过程花在 “矩阵乘法”上的人工神经网络相契合。
总体而言,光具有高计算速度、低功耗、低时延等特点,且不易受到温度、电磁场和噪声变化的影响,在 AI 应用领域,将光学技术与电子学结合,有望提供比传统方法更好的速度和能效。
嗅到 AI 加速带来的机会后,来自英、法、美、中的一些创业团队开始扬帆起航,切入云端 AI 计算市场,其中不乏有初创公司得到来自科技巨头及知名投资者的投资。
2013 年成立的英国创企 Optalysys,曾于 2015 年创建一个光计算原型,实现了约 320Gflops 的处理速度,且能效非常低。去年上半年,Optalysys 推出了入门级光学协处理器 FT: X2000,计划出售给包括计算机制造、国防及航空航天领域的部分合作伙伴及早期客户。
▲Optalysys 入门级光学协处理器 FT: X2000
初创公司 Fathom Computing 成立于 2014 年,其光子原型计算机在 2014 年时识别手写数字的准确率还只有 30% 左右,到 2018 年时已经超过 90%。其创始人 Willam Andregg 称,这是机器学习软件首次使用激光脉冲电路而非电力进行训练。不过近两年,这家创企似乎并未公开更多进展。
2018 年,成立两年、总部位于法国巴黎的创企 LightOn 宣布,它已经开始在欧洲的数据中心测试自己的光学处理单元(OPU)技术。2020 年 6 月,LightOn 发表的新论文显示,其光学神经网络训练芯片在运行基于 MNIST 手写数字数据集训练的模型时,学习率为 0.01,测试准确率达到 95.8%;同一算法在 GPU 上的学习率为 0.001、准确率达 97.6%。而该光学芯片的功耗效率要比 GPU 高出一个数量级。
论文链接:https://arxiv.org/pdf/2006.01475.pdf
当然,名气最盛的光子芯片创业者,当属曾在《自然 · 光子学》上发表封面文章、来自麻省理工学院的沈亦晨和尼克 · 哈里斯,两人均在 2017 年成立光子芯片公司,都选择 Mach-Zehnder 干涉仪光开关阵列(MZI)作为基础计算单元,但具体的 MZI 结构及阵列架构有所不同。
沈亦晨在美国波士顿创办 Lightelligence,在中国上海成立曦智科技,发展了跨国多元团队,是目前全球融资额最高的光子计算初创公司。
▲曦智科技创始团队
曦智科技在 2018 年获得由百度风投和美国半导体高管财团领投的逾 1000 万美元种子轮融资;2020 年 4 月完成由经纬中国和中金资本旗下中金硅谷基金领投、百度风投继续追加投资的 2600 万美元 A 轮融资;2020 年 7 月完成由和利资本投资的数千万美元 A + 轮融资。
2019 年 4 月,曦智科技发布全球首款光子芯片原型板卡,在运行 TensorFlow 处理 MNIST 数据集的测试中取得百倍以上的速度提升,准确率接近电子芯片(97% 以上),而完成矩阵乘法所用的时间不到最先进电子芯片的 1/100。曦智科技计划从 2021 年起为 AI 云计算带来高效的量产产品。
▲曦智科技开发的全球第一款光子芯片原型板卡
尼克 · 哈里斯在波士顿创办的 Lightmatter 公司,则拿到了由谷歌风投、星火资本、经纬创投等投资的 3300 万美元资金。
▲Lightmatter 联合创始人 Darius Bunandar(左)、Nicholas Harris(中)、Thomas Graham(右)
在 2020 年的芯片顶会 Hot Chips 上,Lightmatter 展示了其用于 AI 推理加速的测试芯片 Mars,该芯片利用硅光电学和 MEMS 技术,通过由毫瓦级激光光源,为用光执行矩阵向量乘法提供动力。相较传统电子芯片,其计算速度提升数个量级。
Lightmatter 预计在 2021 年秋季推出这款测试芯片的首款商用产品,并为之打造了必要的软件工具链。哈里斯称其量产芯片在 BERT、Resnet-50 推理等工作负载上,能效将是 AI 芯片领导者 NVIDIA 旗舰芯片 A100 的 20 倍、吞吐量将是 A100 的 5 倍。
▲Lightmatter 测试芯片 Mars
看到《自然 · 光子学》上 MIT团队刊发的论文后,正在研究光电子的中国北京交通大学 2014 级博士生白冰获得了新的启发,他与十余位来自清华、北大等北京 8 所高校的博士生们一起,在 2017 年在北京创立光子算数团队,开始推进光子 AI 芯片商业化。
▲光子算数创始人兼 CEO 白冰
光子算数于 2018 年 9 月获得臻云创投、英诺天使基金投资的天使轮融资、2019 年获得由水木清华校友基金、常见投资、英诺天使基金、臻云创投等投资的 A 轮融资。
目前光子算数已研发可编程光子阵列芯片 FPPGA(Field Programmable Photonic Gate Arrays),并基于此与北京高校一起打造了面向服务器的光电混合 AI 加速计算卡,能完成包括机器学习推理、时间序列分析在内的一些定制化加速任务。
其计算卡已于 2020 年交由服务器厂商客户进行测试,在不到 70W 的运行功耗下,能做三四十路 1080P 视频同步处理,混合精度下峰值算力接近 20TOPS,光部分为低精度,电部分为高精度。
▲光子算数的光电混合 AI 加速计算服务器应用测试
从美国普林斯顿大学脱胎而出的美国光子 AI 芯片创企 Luminous Computing 成立相对晚一些。
该公司由首席策略官 Michael Gao、CEO Marcus Gomez 和 CTO Mitchell Nahmias 在 2018 年联合创立,于 2019 年筹得来自微软创始人比尔 · 盖茨、Uber 首席执行官 Dara Khosrowshahi 等知名投资者的 900 万美元种子轮融资,2020 年又筹得由 Helios Capital 领投的 900 万美元 A 轮融资。
Nahmias 在普林斯顿 PhD 期间的主要研究方向即是光子 AI 芯片。与 MIT团队不同,他们采用的并非 MZI,而是被称为 Broadcast and Weight 的方案,相较 MZI 型方案多了光电转换过程,且对相位不敏感。Nahmias 称其光子集成电路可以取代 3000 块 TPU 板,更加节省能耗,且能突破现有 AI 芯片传输数据的瓶颈。
▲Broadcast and Weight 方案的原理框架
这些创业团队的硬件均被设计为可以插入标准服务器和工作站中,可实现即插即用,并能与主流 AI 软件配合使用,以满足商用需求。
训练 AI 模型需要超高算力的计算机芯片,这使得芯片巨头、初创公司之间展开一场围绕 AI 计算的全新角逐。
如今光子计算仍处早期阶段,站在这一全新计算赛道上的玩家们,几乎没有前路可以借鉴,他们正顶着技术挑战、落地风险等方面的压力,试图构建起光子计算生态,探索着改变计算的可能。
对于投资者来说,新兴计算技术仍充满风险。但随着世界对多元计算方式的需求增加,以光子计算、神经拟态芯片、量子芯片等为代表的新兴计算方法,正被寄予打破标准计算系统制约的期待。
这是件令人期待的事情,光学计算已经在商业化道路上迈出了重要的一步,而一旦有初创公司解决工程化挑战、取得落地商用的成功,光学计算革命的大门或将由此开启。
参考
《光子芯片研究进展及展望》世界科学;
《MIT初创公司发布全球首个光子 AI 芯片原型!独立光学计算硬件,庞大系统成功集成至常规板卡 | 独家专访》DeepTech 深科技;
初创《光子 AI 芯片新玩家——Luminous Computing》光学小豆芽;
《Alphabet invests in a start-up using beams of light on chips for super-fast A.I.》CNBC
版权及免责声明:凡本网所属版权作品,转载时须获得授权并注明来源“物联之家 - 物联观察新视角,国内领先科技门户”,违者本网将保留追究其相关法律责任的权力。凡转载文章,不代表本网观点和立场。
延伸阅读
版权所有:物联之家 - 物联观察新视角,国内领先科技门户