2026年1月2日,国产GPGPU厂商壁仞科技正式挂牌上市,发行价19.60港元。开盘后,股价在资本的热捧下迅速拉升,盘中触及42.88港元,涨幅高达112%,盘中一度突破千亿港元关口。最终收于 34.46 港元,首日涨幅约 75.8%,对应市值约 825 亿港元。

这是又一家成功走向资本市场的国产GPU公司。但上市从来不是功成名就的终点,而是一个接受全球投资者全方位、高倍率审视的起点。在AI算力成为全球科技产业关键基础设施的当下,资本市场究竟在壁仞身上买的是什么?

中国必须有自己的算力供给能力

在 AI 成为全球经济与产业体系核心驱动力的背景下,围绕模型训练、推理部署与高性能计算(HPC)的算力需求正呈现指数级放大。GPGPU为核心,ASIC 与 FPGA 为补充的智能计算芯片体系,已成为支撑新一代人工智能应用与数字基础设施的关键底座。根据灼识咨询数据,全球智能计算芯片市场规模已由 2020 年的 66 亿美元快速扩张至 2024 年的 1,190 亿美元,复合年增长率高达 106%;预计到 2029 年,市场规模将进一步增长至 5,857 亿美元,2024–2029 年期间的 CAGR 仍将保持在 37.5% 的高位。

作为全球最大的 AI 应用与算力需求市场之一,中国对智能计算芯片的需求增长更为迅猛。灼识咨询预计,中国智能计算芯片市场规模将于 2029 年达到 2,012 亿美元,2024–2029 年 CAGR 高达 46.3%,显著高于全球平均水平。这一增长不仅源于大模型、智能制造、自动驾驶等应用场景的快速扩展,也与中国云服务商、互联网平台及 AI 创业公司对算力基础设施的持续投入密切相关。尽管当前智能计算芯片的整体渗透率仍处于相对早期阶段,但需求端的集中爆发,正在为市场释放出可观的长期增长空间。

然而,这巨大的成长空间背后,隐藏着中国算力产业最深层的隐忧。从全球竞争格局看,智能计算芯片市场高度集中,长期由英伟达占据主导地位,AMD与英特尔分食有限份额。国内市场同样呈现出明显的头部集中趋势。根据壁仞科技招股书披露的数据,2024 年中国智能计算芯片市场中,前两大参与者合计占据 94.4% 的市场份额,其余市场由超过15家规模化参与者分散占据,但单一厂商市占率均未超过1.0%。

进一步聚焦至智能计算芯片中占比最高、技术壁垒最强的GPGPU领域,市场集中度更为突出。2024 年,国内 GPGPU 市场中规模化参与者不足十家,而前两大参与者合计市占率高达 98.0%。按收入计算,壁仞在中国智能计算芯片整体市场与 GPGPU 子市场中的市占率分别为 0.16% 与 0.20%,与其所面对的需求体量相比,仍处于极早期阶段,也意味着潜在成长空间仍然巨大。

在这一背景下,中国面临的核心问题,已不再是“是否拥有全球最先进的 GPU”,而是能否在复杂多变的国际环境中,持续、稳定地获得足够的算力供给能力。GPU 正从单纯的高性能计算器件,演变为支撑数字经济运行的关键基础设施,其可获得性、可持续性与可控性,正在成为与能源、通信同等重要的系统性问题。

但国内芯片厂商的成长,并非发生在一个理想化的技术竞赛场域。先进制程受限、良率波动与制造成本高企,使得“依靠工艺迭代与单点性能堆叠”的路径不确定性显著上升。要在约束条件下把算力真正交付出去,国产 GPU 厂商必须更强调工程可行性、系统级交付能力以及长期供给稳定性——从“做出一颗强芯片”,转向“建成一条可持续的算力供给链条”。

Chiplet技术路径:一种工程理性的选择

壁仞科技的路线选择具有一定代表性。其并未沿袭单芯片不断放大的传统路径,而是选择了一条以 Chiplet(芯粒)架构与系统级设计能力为核心的工程路线。壁仞也是国内首家采用2.5D芯粒技术封装双AI计算裸晶的公司。

从产业角度看,Chiplet 并非单纯的“架构创新”,而是一种应对现实约束的工程解法。随着单片 IC 在制程推进中面临的成本指数级上升、良率快速下降以及设计复杂度激增,芯粒化正逐渐成为高性能计算领域突破物理与经济边界的重要路径。壁仞在招股书中亦明确指出,芯粒方案具备更高的灵活性、可扩展性与成本效率,有助于缩短复杂 GPGPU 芯片的研发与上市周期。

这一技术路径在壁仞 BR166 产品上得到了集中体现。BR166 通过芯粒技术,将两颗 BR106 计算裸晶与四颗 DRAM 集成于同一封装之中,形成一颗面向高端 AI 训练与推理场景的高性能 GPGPU 芯片。相较于单颗 BR106,BR166 在峰值算力、内存容量、视频编解码能力以及片内互连等关键指标上均实现了约 2 倍提升

更关键的是芯粒之间的互连能力。两颗 BR106 裸晶之间通过 D2D(Die-to-Die)互连实现高速数据交换,其双向带宽最高可达 896GB/s,在架构层面保证了双芯粒协同计算时的数据一致性与吞吐效率,为大模型训练与高并发推理提供了必要的内部带宽支撑。

壁仞 BR166 GPGPU芯片(图源:壁仞科技招股书)

这种基于 Chiplet 的性能表现,不仅是技术参数的翻倍,更是国产算力在现有供应链条件下,实现高性能供给的一套成熟“工程样板”。

从“卖芯片”到“交付系统”

相较于单一芯片性能指标,壁仞科技在招股书中反复强调的,并非“某一代 GPU 的算力参数”,而是其系统级交付能力。这背后反映的,并不是产品形态的简单扩展,而是一种对算力商业化本质的判断:在大模型时代,客户真正采购的并不是一颗芯片,而是一套能够稳定运行、可规模扩展的算力系统。

因此,壁仞并未将自身定位为单纯的 GPU 芯片或加速卡供应商,而是围绕 GPGPU 架构,构建了覆盖 PCIe、OAM、服务器乃至大规模GPU集群的完整硬件体系,并配套自研软件平台与集群管理能力,向客户交付“可直接运行的智能计算整体解决方案”

壁仞将其解决方案概括为五大技术支柱:自主 GPGPU 架构、SoC 设计能力、硬件系统、软件平台以及集群级部署与优化能力。

首先,在架构层面,壁仞采用统一、持续演进的 GPGPU 架构,专门面向大规模 AI 负载,尤其是 LLM 训练与推理场景进行优化。该架构强调通用性、能效与可扩展性的平衡,使其能够适应模型规模、参数量与计算复杂度的持续增长,并为后续多代产品的快速迭代提供稳定的技术底座。

例如,壁仞科技开发了BR10X,一款专为AI工作负载量身定制的通用高性能计算架构。该架构为基于Transformer的大语言模型(LLMs)及传统的AI计算内核提供高效的处理,同时确保与新兴AI范例的前向兼容性。通过将通用灵活性与专用AI加速相结合,BR10X有助于无缝适配快速算法改进,满足AI性能优化及通用计算灵活性的双重需求。

在此基础上,壁仞形成了成熟的 SoC 设计方法论。依托自主 GPGPU 架构,自2019年以来,壁仞已成功开发三款芯片,即BR106、BR110、BR166,并率先在国内采用 2.5D 芯粒技术封装双 AI 计算裸晶。这一设计路径在控制制造风险的同时,提高了超大规模集成电路的一次流片成功率,使首代产品得以顺利实现量产与商业化落地。

根据灼识咨询的资料,截至2024年12月31日,壁仞科技在中国GPGPU公司中拥有最多的发明专利申请数;其GPGPU芯片及包含壁仞GPGPU芯片的服务器(由壁仞的服务器合作伙伴独立提交)于MLPerf Inference 2.1的封闭组别竞赛中,语言处理模型BERT及图像分类模型ResNet50的成绩均获得量产芯片组别中的第一名。

在硬件系统层面,壁仞并未止步于芯片或加速卡,而是构建了覆盖 PCIe 板卡、OAM、UBB 以及服务器的完整产品组合,并同时支持风冷与液冷方案。例如BR166可以同时支持 OAM 与 PCIe 板卡两种主流形态。通过系统级设计与散热方案协同,其硬件系统可有效降低数据中心 PUE,满足高密度算力部署与能效约束并存的现实需求,为企业级客户提供面向任务关键型场景的大规模计算基础设施。

软件层面是壁仞系统交付能力的另一核心支点。其自研的 BIRENSUPA 软件平台,承担着连接底层硬件系统与上层 AI 应用的关键角色。该平台不仅能够充分释放硬件能力、优化性能表现,还支持大规模 GPGPU 集群的统一管理,为用户提供编程接口、高性能算法库、训练与推理框架及完整工具链。同时,BIRENSUPA 对主流第三方 GPGPU 软件生态保持兼容,有效降低了客户迁移与使用门槛。

在更大尺度上,壁仞进一步将硬件系统、软件平台与合作伙伴的服务器、存储与网络设备整合,形成完整的智能计算集群解决方案。其集群管理平台 BIRENCUBE 面向上千乃至上万颗 GPU 芯片规模的集群设计,支持算力资源调度、运维与系统管理,帮助客户构建可持续扩展的 AI 基础设施。

整体来看,壁仞采用的是一种平台化、软硬件协同的产品策略:以统一的 GPGPU 架构和统一软件平台为核心,向下衍生多款芯片,向上形成覆盖多种形态的硬件与系统产品组合,并在持续迭代中保持跨产品的一致体验与兼容性。其“1+1+N+X”平台战略——即一个 GPU 架构、一个统一软件平台,延展出多款芯片与多形态系统产品——本质上是在降低系统复杂度的同时,提高整体交付效率。

高研发投入与持续亏损:GPU赛道的“长坡厚雪”

产品力最终需要通过业绩指引来验证。从收入结构看,壁仞科技的商业化进程呈现出典型的 GPU 产业早期特征:起点低、放量迅速,且伴随明显的客户结构与产品结构切换。

根据招股书披露,壁仞科技的智能计算解决方案自 2023 年开始产生收入,金额为6,200 万元。2024 年,公司收入进一步大幅增长至3.368亿元,同比增长超过4 倍。这一趋势在 2025 年上半年仍在延续。截至 2025 年 6 月 30 日止六个月,公司实现收入 5,815 万元,较 2024 年同期的3,930 万元继续增长。尤为值得一提的是,目前壁仞科技手握五份框架销售协议及24份销售合同,总价值约为人民币12.407亿元,为未来收入提供了较为清晰的可见性。

值得关注的是收入背后的客户变化。推动收入增长的并非短期项目堆积,而是来自特定行业头部企业的持续采购。相较于全球竞争对手,壁仞在中国本土的工程适配能力与实地客户支持,使其能够与 AI 数据中心、电信、AI 解决方案、能源与公用事业、金融科技及互联网等关键行业客户建立较为深入的合作关系,围绕具体业务负载持续优化交付方案。截至2025年12月15日,公司已向九家财富中国500强企业提供解决方案,当中有五家亦于财富世界500强上榜。

在毛利表现上,公司于 2023年及2024年分别录得毛利4,740 万元及1.792亿元,对应毛利率分别为76.4% 及 53.2%。自2023年起,毛利率的变化与智能计算解决方案的产品结构高度相关。2023 年属于高毛利起步,收入集中于头部客户的定制化服务器集群,由于包含较高比例的定制软件及系统集成服务,推高了阶段性毛利率;2024 年开始标准化扩张, 随着商业化规模放大,收入主力转为标准化的 PCIe 板卡(如壁砺 106M),53.2% 的毛利率水平已与行业平均值基本持平,标志着公司产品进入大规模通用市场;2025 年上半年,入门级产品(如壁砺 106C)占比上升,导致毛利率出现阶段性波动。

自 2019 年成立以来,壁仞持续高比例投入研发。2022 年、2023 年及 2024 年,其研发支出分别为人民币 10.18 亿元、8.86 亿元及 8.27 亿元,研发费用占同期总经营开支比例分别高达 79.8%、76.4% 与 73.7%。即便在 2025 年上半年,研发投入仍维持在 5.72 亿元,占经营开支比例达 79.1%。这类投入结构,本质上反映的是一家 GPU 公司在“产品完成之前,几乎没有削减研发的空间”。

从产品规划看,壁仞锚定下一代大模型训练与推理的效率需求,开展清晰、可行的代际产品规划:公司已完成下一代旗舰数据中心芯片 BR20X 的架构设计,当前正处于物理设计与流片验证阶段,预计将于 2026 年实现商业化。相较于现有产品,BR20X 将在单卡算力、数据格式支持(FP8、FP4)、内存规模与互连带宽等方面实现系统性升级,目标是提升大模型训练与推理效率、降低客户总体拥有成本(TCO)。

图源:壁仞科技招股书

与此同时,公司亦同步规划 BR30X(云训练与推理) 与 BR31X(边缘推理) 两条产品线,预计于 2028 年进入商业化阶段。这种“已交付一代、正在验证一代、同步规划下一代”的节奏,在 GPU 行业中属于较为理性的产品推进方式。

在更长周期内,壁仞仍将研发投入聚焦于自主核心技术,包括计算核心、NoC、高速 I/O 以及 SoC 设计能力,并同步探索 3D 堆叠、CPO(共封装光学)等前沿技术,以支撑未来大规模 GPU 集群在性能、能效与互连上的进一步提升。

在此基础上,再来看亏损问题,GPU 是典型的重资产赛道,从芯片定义、流片到系统级交付,投入必须大幅前置。真正关键的不是现阶段亏不亏损,而是其是否已经建立起订单牵引研发、研发反哺交付、交付沉淀客户的正向循环。从现阶段披露的数据看,壁仞已初步完成从“技术研发型公司”向“系统交付型公司”的关键转变,其后续业绩的核心变量,将取决于交付规模能否持续放大,而非单一年度是否盈利。

结语:自主算力是一场“马拉松”

资本市场真正押注的,并不是“下一家 NVIDIA”,而是一条在高度不确定的外部环境中,依然能够持续推进、不断修正、逐步落地的工程化路径。壁仞科技的成功上市,是中国 GPU 产业从“算力梦想”走向“商业闭环”的阶段性注脚。

从 Chiplet 架构的理性抉择,到“1+1+N+X”的系统级交付,再到深入千行百业的订单转化,壁仞展现出了一家国产芯片厂商在约束条件下,通过技术变通与产业深耕所能达到的广度。千亿市值的期待背后,是市场对中国必须掌握算力自主权这一战略底色的高度共识。

随着壁仞科技等领军企业的相继进场与破局,这条更现实、更坚韧的国产 GPU 路径,正在让中国数字经济的底座,变得更加厚实且可控。算力之火已点燃,未来的征程是星辰大海,更是脚下的每一寸硬核土地。