成立三年就完成五轮融资,在其他初创企业还在为融资头疼的阶段,它被头部VC、国内互联网巨头、上海苏州两地国资基金等三类资本争相投资,沙特工业部部长班达尔·胡莱夫主动向其寻求订单和资本层面的合作,它是位于浦东张江的光本位科技,2024年研发出全球首颗达到商用标准的128×128矩阵规模光计算芯片。近日,它又宣布了一则令GPU、TPU产业界“炸锅”的消息,选择用玻璃代替硅作为光计算芯片的衬底,此举将让AI计算直接绕过算力增长依赖先进制程、高算力必定伴随高能耗等困扰进入“千POPS级算力和千TOPS/W能效比”时代。

在刚刚过去的12月,光本位科技在沙特工业转型展上展示的光计算产品被班达尔·胡莱夫盛赞为“比世界上现有的顶尖电计算产品更能代表AI计算的未来”,并邀请光本位科技联合创始人兼董事长熊胤江围绕未来全方位合作召开闭门交流会议。包括埃及阿尔马斯里报、美联社、NBC、雅虎财经、晨星、英国AI杂志和科技杂志等在内的700多家海外媒体对此事进行了报道。

光本位科技研发的光计算产品主要用于AI推理场景,预计到 2030 年推理将占 AI 计算总量的 75%,市场规模达 2550 亿美元,推理市场目前是谷歌 TPU、Groq LPU 等的天下,英伟达在能效比上不具优势。最近,初创公司Groq专为 AI 推理场景设计的 LPU因其“运行大语言模型的速度可达 GPU 的 10 倍,能耗却只有十分之一”而惹急了英伟达,花200 亿美元与Groq达成非排他性推理技术许可协议,通过这种方式英伟达可以在不直接购买的情况下获得Groq的人才和技术。

除了玻璃光计算芯片,光本位科技还提出基于玻璃光计算打造下一代全光计算系统,即整个AI计算任务都通过光计算完成,算力、能效比、计算效率的天花板将同时被打破,无独有偶,上海交通大学近期也在全光计算芯片领域取得突破。产业与学术的共鸣,清晰地指向一个问题:这是否意味着AI计算正在加速迈向“全光时代”,一场可能颠覆以英伟达为首的全球AI计算竞争格局的“新能源汽车”式科技和产业革命正式拉开序幕?



1400倍算力,200倍能效比,存储6.5亿个计算单元

在此之前,包括光本位科技在内的世界主流光计算公司都选择以硅为衬底制造光计算芯片,这是因为硅光平台与现有CMOS工艺之间几乎无缝兼容,但纯硅调制存在诸多局限性,因此矩阵规模从64×64扩大至128×128足足间隔了三年,而打破这个瓶颈的正是将相变材料与硅光异质集成用于光计算芯片的光本位科技。

光本位科技联合创始人程唐盛曾在牛津大学攻读材料科学与工程博士,期间带领团队开发了新型相变材料,并实现了相变材料光芯片大规模集成。为什么光本位科技选择用玻璃代替硅再次掀起科技革命?在程唐盛看来这是要让光计算产品在性能上远超世界上现有用于AI推理场景的主流电计算产品,只有这样AI计算才会迎来“光的时代”。

玻璃拥有平整性、热稳定性、宽光谱透明特性、与光波导工艺兼容性等特点,因此被视为半导体技术发展过程中取代硅中介层和有机基板的最佳材料,英伟达、英特尔、三星、AMD等海外巨头都在通过引入玻璃提升产品性能。受限于光刻机的最大光罩尺寸,当前硅光平台可设计的光计算芯片最大尺寸为32mm×25mm,如若进一步提升面积,后续每一次迭代的设计和工艺难度持续增长。用玻璃作为光计算芯片的衬底,通过纳米压印工艺,可以在保持芯片精度的同时突破已有硅光平台的曝光尺寸限制,从而容纳更多的计算单元,实现单颗芯片算力的提升,并且在后续制备更大尺寸的芯片时更易解决材料翘曲、波导损耗等问题,极大减轻产品迭代的设计和工艺难度。

据程唐盛介绍,200mmx200mm的玻璃光计算芯片算力可达2600POPS,是谷歌TPU的1400倍,是英伟达H200(非稀疏化)的1300倍,根据AI推理市场需求和工艺发展趋势预测芯片尺寸仍有数倍扩大空间。



能效比方面,光本位科技利用相变材料的非易失性实现了光计算芯片零静态功耗,只需一次电驱动即可执行完一个AI计算任务。由于玻璃的非线性光学效应极弱,因此光的波导传播损耗极低,在芯片设计时可选择小功率的激光器,此外玻璃在介电损耗、透光率、平整性、热稳定性等方面的优势也能进一步降低芯片功耗。程唐盛预测,200mm×200mm玻璃光计算芯片的能效比可以超过1000TPOS/W,相当于TPU的200倍以上。



玻璃光计算芯片还可以解决AI大模型面临的内存困局。光本位科技利用相变材料的非易失性实现了光芯片的存算一体,芯片的计算单元即是存储单元,可以存储AI计算的各种参数,打破了冯·诺依曼体系中的内存墙,芯片存储的参数量取决于计算单元的规模。而玻璃光计算芯片能够存储更多的AI计算参数,200mm×200mm玻璃光计算芯片可以存储6.5亿个计算单元。每一个token将以光速完成计算,无需反复读取模型参数,并且零静态功耗。

玻璃光计算是实现全光计算的更好路径?

据程唐盛透露,目前光本位科技已验证完毕光波导等光学器件在玻璃上的制备工艺,波导损耗已优化至低于硅光平台水平,同步开展了大规模阵列样品制备以及相变材料的工艺优化,并且打通了上下游产业链,上游与纳米压印等厂商联合优化工艺,下游与大型企业形成研发应用双向反馈机制。之所以在材料与制造上不断寻求突破,光本位科技的终级目标是将玻璃光计算芯片直接封装为超高性能全光计算系统,从而获得下一代AI计算技术标准的定义权。

全光计算系统是什么?即让光信号在光域内部实现反复计算与动态暂存,改变光计算只能作为“单个计算核心”的现状,令玻璃光计算芯片成为直接运行完整模型的AI计算平台。



发展全光计算已经成为全球学术界和产业界的共识,它的核心意义是突破电计算的能耗与散热瓶颈,使超高算力与超低能耗得以兼顾。在玻璃光计算之前,全光计算有两种主要的实现思路,一种是在光上实现与晶体管的与或非门类似的光学逻辑门,这种方式需要具备直接带隙特性的三五族平台,由于光学器件的特性,晶体管密度相较CMOS没有优势,一种是利用光学的干涉、折射、衍射等特性实现感存算一体,将光传感采集的光信号直接输入到计算单元中进行计算输出结果,这种方式不能实时地控制每个像素点对应的参数,使得场景较为固化。而玻璃光计算芯片计算核心内部的参数均可根据不同模型与需求进行实时调整,应用场景更全面更灵活,此外由于全光计算还需要实现非线性运算等不同的计算,而不同的计算需要不同的材料或方案实现,将具备表面平整、热膨胀系数低、翘曲率低等特性的玻璃作为衬底,更容易将不同平台的芯片集成在一起,从而实现全光计算。

对于光计算的未来,程唐盛认为,玻璃光计算芯片将改变当今光计算产品的“电主光辅”架构,形成“光电融合,以光为主”甚至“全光”的计算集群架构,而光本位科技的“星辰大海”是为不同类型用户提供全场景覆盖的全栈光计算解决方案,小到给C端用户提供50P+算力的玻璃光计算盒子,等同于一个家用小型数据中心,可以驱动人形机器人等,也可以为大模型公司等提供500P+算力的“光算+光连”方案,甚至可以为政府或者大型企业通过“光算+光连+光传”方案建设一个5000P+算力的大型数据中心。届时,包括光本位科技在内的中国企业有望赢得这场改写全球AI计算竞争格局的“新能源汽车”式科技和产业革命。