图源:视觉中国
文丨胡世鑫
编辑丨薛芳
出品丨深网·腾讯新闻小满工作室
国产GPU领域风云再起。
7月18日,成立仅六年的瀚博半导体悄然启动上市辅导,已连续三年跻身胡润全球独角兽榜单,最新估值突破百亿元;与此同时,在被禁售三个月后,英伟达CEO黄仁勋携H20芯片高调返场,重新叩响中国大门。
这次访华,黄仁勋亲口确认:美国政府已批准出口许可,公司将恢复销售专为中国市场“量身定做”的H20芯片。同日,AMD也放出风声,正申请将专供中国的MI308重新摆上货架。
这已经是黄仁勋年内第三次访华,频率之高前所未有。此次,商务部部长王文涛会见了他,他也与小米、阿里云王坚等人会面,并公开“点赞”了包括腾讯、在内的十余家中国企业。面对央视镜头,他直言:无论有没有英伟达,中国AI市场都会继续进步。
此次访华的背后,是英伟达在中国市场份额的不断缩水。今年5月,黄仁勋在台北国际电脑展上表示,英伟达在中国的市场份额已从拜登就任初期的95%下滑至50%。对于美国实施的AI出口限制,黄仁勋再次直言,这一策略“完全错误”。
然而,就在英伟达离开中国的三个月“空窗期”,国产GPU“四小龙”集体提速。
6月30日,国产GPU公司摩尔线程与沐曦科技的科创板IPO申请正式获上交所受理。摩尔线程计划融资80亿元,有望成为年内科创板最大IPO;沐曦科技的募资规模约为摩尔线程的一半。若将此前已进入上市辅导阶段的燧原科技和壁仞科技纳入考量,“四小龙”正扎堆冲刺IPO。
资本市场上,“四小龙”也备受追捧。据胡润研究院发布的《2024全球独角兽榜》,摩尔线程、沐曦科技、燧原科技、壁仞科技的估值分别达到255亿元、100亿元、160亿元、155亿元。
黄仁勋欲以H20稳住中国市场,国产GPU企业们则借上市储备弹药,但算力的城墙依旧高耸。今年一季度,英伟达市场占有率仍高达92%,收入达260亿美元;摩尔线程等国产GPU企业仍处于亏损状态,尚未盈利。
国产GPU“四小龙”的上市竞速赛
摩尔线程与沐曦科技均诞生于2020年。彼时,国际制裁骤然加码,芯片断供如乌云压顶,“国产替代”呼声骤起;一批曾在国际芯片巨头掌舵多年的高管,敏锐捕捉到这场危中之机,果断下海创业。
摩尔线程创始人张建中,曾在英伟达任职十余年,担任全球副总裁兼中国区总经理,一手搭建了英伟达在中国的GPU生态;沐曦科技创始人陈维良,则来自AMD,曾任公司GPU设计高级总监、GPU SoC芯片设计总负责人。
深厚的行业背景,让两人创立的GPU企业成为资本竞逐的明星项目。短短5年时间,两家公司便集结数十家投资机构——摩尔线程更是“100天跻身独角兽”。
公开信息显示,截至目前,摩尔线程已完成了六轮融资,累计金额逾45亿元,红杉中国、五源资本、纪源资本、深创投等知名VC悉数入局,最新估值达到255亿元。
而沐曦科技融资规模同样达数十亿元,最新估值为210亿元;红杉中国多次加仓,真格基金、经纬创投、中网投纷纷跟进,投资人葛卫东(江湖人称“牛散”)也与混沌投资合计持股7.48%,为其外部最大股东。
除此次同步递交招股书的两家公司外,同属“四小龙”的燧原科技和壁仞科技也于2023年9月启动了上市辅导,但尚未提交招股书,进度稍慢。
自2018年成立以来,燧原科技已累计完成11轮融资。壁仞科技则完成15亿元的新一轮融资,公开披露总融资额突破50亿元。
有媒体报道称,上述四家公司均准备“A+H”的上市方案。壁仞科技已经确定了会优先在港股上市。接近其财务顾问的人士表示,相比A股,港股上市的条件更加宽松,时间更快,对壁仞科技来说确定性也更强。
天使投资人、人工智能专家郭涛认为,“国产芯片厂商集中上市是多种因素共同作用的结果。从资金需求来看,技术研发深入和产业规模扩大使企业急需资金,这些资金要用于研发持续推进、生产设备升级和市场拓展,IPO能满足其融资需求。”
此外,由于美国芯片出口管制持续收紧,随着英伟达在华份额持续缩水,2023年其中国区营收同比下降23%。
这一市场缺口也为国产GPU企业们提供窗口期,是抓紧IPO的最佳时机。类似的故事也发生在AI芯片领域。连亏7年的寒武纪,从去年起,凭借自主芯片概念在资本市场异军突起,股价破800元,市值一度摸到3000亿元大关,成为2024年A股市场备受关注的GPU芯片标的。
国产GPU的豪赌
迄今,摩尔线程已迭代了“苏堤、春晓、曲院、平湖”四代GPU架构,并衍生出十余款芯片,覆盖了AI智算、专业图形与桌面级图形加速三大赛道。有业内人士指出,其产品布局与英伟达极为相似。
其中,AI智算业务是摩尔线程的第一增长引擎,去年收入达到3.36亿元,占总营收近78%。而大模型训练与推理需求的爆发,直接带动S4000、S5000等系列GPU的销量跃升。
(摩尔线程主营业务收入构成 / 图源:招股书)
值得关注的是,在桌面级显卡领域,摩尔线程是目前国内唯一能实现批量出货的GPU厂商。据悉,桌面显卡开发难度远高于AI加速卡:其必须为海量游戏逐一编写并持续优化驱动。与拥有庞大开发者生态和游戏厂商支持的英伟达不同,摩尔线程几乎从零起步。
招股书显示,旗下MTT S80性能已接近英伟达上一代中端型号的RTX 3060,成为国内首款消费级GPU产品;而在驱动层面,该卡在两年内实现了性能提升5倍,能成功兼容近千款游戏和应用。
而沐曦科技的产品策略则更聚焦,全部GPU均“面向训练-推理一体化(训推一体)或通用计算场景”。公司形成了三大系列:面向云端的曦思N系列、面向智算的曦云C系列以及面向图形渲染的曦彩G系列。
近两年,沐曦科技的业绩爆发则主要得益于首款智算推理芯片曦思N100和训推一体芯片曦云C500的相继量产并快速批量落地。截至2025年一季度,公司的GPU累计销量已突破2.5万片,先后交付北京、上海、杭州等9大智算集群,覆盖国家AI公共算力平台及多家商业化智算中心,并广泛搭载于新华三等主流服务器厂商。
有业内人士观点指出,摩尔线程的核心优势在于:其自主研发的MUSA架构,这一创新架构实现CUDA代码的“零成本迁移”,突破长期困扰国产GPU发展的生态壁垒,使其成为国内极少数能同时提供图形渲染和AI高性能计算的GPU企业。
从底层做彻底自研,一方面可针对计算密度和能效持续优化,使芯片兼具高能效与高通用性;另一方面也摆脱对海外IP的依赖,在地缘政治博弈中握有更大主动权。
营收方面,近三年来,摩尔线程由0.46亿元增至1.24亿元,再跃升至4.38亿元,累计6.08亿元,复合增速逾208%。需要说明的是,沐曦科技的基数较小,增长更为迅猛,从43万元起步,次年为0.53亿元,第三年达7.43亿元,年均复合增长率约4075%。凭借近两年商业化的提速,沐曦科技在规模和增速上甚至反超摩尔线程。
尽管商业化提速,国产GPU仍深陷亏损泥潭。招股书显示:近三年摩尔线程净亏损累计超50亿元。而沐曦科技也亏损超30亿元,去年亏损情况基本与摩尔线程相当。
究其原因,是GPU行业普遍面临的高昂的研发成本。
GPU研发属于“高投入、长周期、高风险”的典型“三高”领域,如流片(指设计好的芯片电路图送往晶圆厂进行试产)单次成本可高达数亿元,且需持续迭代架构,企业普遍面临较大资金压力。
此外,公司在用人方面也是一笔不小的开销。截至2024年末,摩尔线程共有员工1126名,其中研发人员占比达74.94%;2022年至2024年,该公司核心技术人员薪酬总额从769.28万元增长至1310.11万元。
摩尔线程近三年累计研发投入38.1亿元,约为同期营收的6倍;沐曦最近三年研发投入22亿元,占营收比例高达282.11%。不过,这些数额仅相当于英伟达同期研发投入的2.1%,后者2025财年研发费用甚至达到129亿美元。
招股书显示,两家公司均预计将在两三年内扭亏为盈:摩尔线程基于销量、价格及成本测算,最早可于2027年盈利;沐曦科技则预计明年达到盈亏平衡。从财务视角看,两家公司似乎都在“用亏损换未来”。
当资本盛宴遇上技术突围,国产GPU企业正面临一个残酷的现实:在追赶英伟达的路上,烧钱是必经之路,但烧钱未必能换来未来。
国产GPU的生态困境
国产GPU领域的领跑者摩尔线程和沐曦科技,在招股书中不约而同地强调“自主研发”:前者主打“全功能自研”,后者力推“全栈自研”。但行业共识表明,GPU的核心竞争力绝非单一技术突破,而是需要跨越硬件性能与软件生态的双重天堑。
从学界到投资界,对国产GPU生态困境的认知正在形成共识。中国工程院院士、清华大学高性能计算研究所所长郑纬民指出:“国产芯片近年硬件、软件进步显著,却难获用户青睐,症结正是生态薄弱。”
软件生态正是英伟达最深的护城河,也是国产厂商最大的短板。云岫资本芯片高级投资经理严家呈直言:“CUDA生态让英伟达的技术标准渗透到行业每个环节。”
CUDA是英伟达2006年推出的通用并行计算平台及编程模型,专为释放GPU并行算力而生。凭借持续迭代的硬件与完善的软件生态,英伟达在全球智算中心GPU市场占有率常年超过90%。
据2024年GTC大会数据:如今CUDA已汇聚600多万开发者,加速库数量突破900个,支持模型超10万个,成为事实上的AI基础设施。摩尔线程亦坦言:“相较英伟达、AMD,我们在技术积累、产品性能等方面仍有差距,英伟达在性能、兼容性和超大规模集群建设上优势明显。”
据IDC数据,2024年中国AI加速卡市场中,采用CUDA生态的产品仍占据91%份额,国产替代方案仅占5%。
软件层面,摩尔线程与沐曦科技均效仿英伟达“软硬一体”路线:前者推出兼容CUDA的统一系统架构MUSA,后者自建软件栈。但在精度支持、开发者工具链完备度及社区活跃度上,两家公司距英伟达仍有显著差距。
(摩尔线程芯片架构与可比公司的比较情况 / 图源:招股书)
作为曾投资过寒武纪、海光信息等多家半导体公司的投资人,新鼎资本董事长张弛认为,本土GPU厂商不太可能构建一个能与英伟达CUDA生态相媲美的体系。
“生态需要适配海量软件,就像Windows操作系统,壁垒已经形成,难以改变。所以市场就出现了分化,大厂奉行‘拿来主义’,怎么好用就怎么用;而信创产业、数据中心等项目则必须使用国产产品。”张弛说。
中国投资协会上市公司投资专业委员会副会长支培元认为,国产GPU厂商突围需聚焦三大维度:其一是计算架构创新,通过Chiplet等异构集成技术突破制程瓶颈;其二是软件生态建设,打造CUDA之外的替代方案(如MUSA);其三是场景化定制,在智能驾驶、科学计算等细分领域实现差异化。他进一步指出,AI推理加速可能成为“弯道超车”机会,国产厂商可借Transformer架构变革窗口期,在稀疏计算、低精度运算等新兴方向建立优势。
在生态建设仍举步维艰的背景下,“国产GPU四小龙”启动IPO只是万里长征第一步。正如智能手机时代安卓与iOS的生态之争,GPU战场同样面临“先发者通吃”的马太效应。当英伟达已开始布局量子-经典混合计算架构时,国产厂商的追赶更需要生态层面的“结盟破局”。
而这场关于国产GPU的讨论,本质上是一场关于技术自主与生态建设的世纪博弈。当中国GPU“四小龙”在资本市场高歌猛进时,更需要冷静思考:上市只是起点,真正的考验在于能否在英伟达的生态铁幕上撕开一道口子。