来源:华兴资本
11月8日,在华兴资本主办的2025进博会上海会议活动“人工智能赋能产业发展论坛”上,硅基流动CEO袁进辉博士围绕“AI Infra的演进与产业机遇”进行了深度分享。

袁博士长期深耕人工智能底层软件与算力基础设施,对于模型能力、算力需求及国产芯片生态发展的观察细致而系统。他指出,AI Infra并不是传统意义上的软件行业,也不仅是算力硬件的附庸,它是支撑智能经济时代的基础设施,真正的长期价值来自于连接硬件供给与应用需求之间的“技术鸿沟”。以下为根据现场演讲整理后的全文,以期更完整呈现他的系统性观察与思考。
过去两年,人工智能在模型、算力需求与算力供给三条主线上均经历了明显演进。在模型侧,头部模型能力仍在提升,但增速已从早期的跃迁式变化趋向稳定。2023—2024年的闭源模型呈现一骑绝尘之势,而2025年开始,开源体系呈现出快速追赶的态势,尤其是由中国团队主导的若干开源模型,已在部分任务中逼近甚至局部超越闭源模型。
今年年初DeepSeek的突破被视为开源生态信心明显增强的拐点,而近期发布的Kimi K2 Thinking模型进一步显示开源模型在推理与规划等复杂任务上具备与闭源体系直接对标的实力。开源的成熟意味着底层模型趋于多样化,企业的部署路径不再单一,同时也对AI Infra的适配能力提出更高要求。
在算力需求侧,每一次模型能力的提升都解锁了新的应用品类。过去一年间,从语言生成到知识整合,再到具备推理、规划与工具调用能力的Agent,大模型真正从“理解语言”走向“执行任务”。这样的能力扩展带来真实使用量的快速增长。
据行业公开信息,全球多家AI云服务商的Token调用量在一年内增长了数十倍,火山引擎2025年9月的日均Token生成量已达30万亿级。随着应用进入早期爆发期,推理成本与效率成为企业竞争的核心变量,也使得算力供给侧的变化更加关键。
在算力供给侧,英伟达依旧在全球范围内保持绝对优势,但中国由于产业链安全要求与地缘环境的影响,正在形成一套独特的发展路径。过去几年,国产芯片厂商在架构设计能力上已经达到国际领先水平。未来,一方面是解决芯片生产制造的问题,另一方面则在于如何让多元算力实现“可用、可调度、可规模化”。
参与算力建设的主体也呈现“多元并举”的态势,从互联网大厂扩展到国资、地方政府与民营资本,但这些算力主要以裸金属形态面向市场,这是中国AI Infra创业公司能够创造独特价值的地方。

袁博士认为,AI Infra的机会来自于行业面临的三大需求:更方便地使用模型、让国产芯片更加好用,以及更灵活地算力调度。
首先,在模型部署层面,越来越多企业在完成验证后选择从闭源模型转向开源模型,因为后者成本更可控、数据更安全、部署更加灵活。但开源模型“能跑”并不等于“跑得好”。从推理速度、上下文长度、并发能力,到数百上千个超参数的优化,再到大规模使用时的成本控制,这一系列环节都对工程能力提出极高要求。对于大量企业而言,自行优化模型并不现实,这使得模型部署优化成为清晰的创业机会。
其次,在国产芯片方面,许多讨论常聚焦于硬件性能及制造工艺瓶颈,但真正的短板往往来自软件生态。英伟达的成功不仅仅是因为芯片本身,而是其长期构建的系统级软件优势。国产芯片的编译器、推理引擎、驱动适配等底层软件生态仍不完整,这大大降低了国产GPU的可用性,也使得企业在实际生产环境中面临兼容性、稳定性及成本的压力。正因此,基础软件公司在这一环节拥有不可替代的价值空间。
第三个变化来自算力需求正在从“训练”向“推理”转移。推理处理Token的数量远远高于训练处理的Token数量,因此,模型训练阶段的算力需求像一个有边界的“水池”,而推理阶段随着真实应用的扩大,更像是一条没有上限的“河流”。
OpenAI在近期提到其日均推理Token已达百万亿量级,这意味着未来算力消耗的大头将来自推理而非训练。由于这种迁移,算力从过去服务少数大模型公司,变成要服务海量企业与开发者,需求高度波动、多样化,而算力销售也将从“整租”走向“零售”,需要支持多租户、弹性扩缩容与异构调度能力。这类基础能力也正在催生新的AI Infra创业公司。
无论从芯片、算力还是模型看,整个体系的两端——硬件供给与应用需求——之间存在一条明显的“鸿沟”。在中国,这条鸿沟更复杂:国产芯片仍在追赶,算力虽然快速铺开,但要真正变成能稳定、弹性、规模化提供服务的能力,还需要中间层的软件基础设施来打通。谁能在这一环节构建能力,谁就掌握了极为稀缺的产业价值。
硅基流动的实践正是围绕这条“鸿沟”展开。袁博士介绍,团队构建了由下至上的四层能力体系:底层是国产芯片优化,通过高性能推理引擎提升国产GPU的可用性;其上是FaaS异构算力纳管,统一管理和调度不同架构的算力资源;第三层是MaaS模型平台,提供开箱即用的模型服务;最上层是开发者工具链,为模型微调、应用构建与工作流提供工具化支持。其中,国产芯片优化与MaaS体系已在国内开发者生态和产业链中形成显著影响。
硅基流动的MaaS平台通过集成国内外主流开源模型,为开发者提供便捷的调用入口。平台注册用户超过八百万,每天有数十万开发者或企业用户在平台上活跃使用平台服务。在第三方工具链Dify的公开数据中,硅基流动的使用量长期位居前列,成为国内最活跃的开源模型服务平台之一。
另一方面,硅基流动在国产算力优化方面也取得一系列重要进展,包括在华为昇腾910B及其最新超节点平台上实现领先的推理性能,并与沐曦、摩尔线程等国产GPU厂商形成深度合作,持续推动国产芯片在真实推理场景中的规模化落地。
在演讲的最后,袁博士提到,AI基建的长期价值来自一件事:把算力、模型、开发者与应用真正连接起来。他认为,在底层投入已达如此规模的背景下,即便基础软件公司只创造整个链路10%的新增价值,市场空间都极其可观。中国的AI产业正在迎来关键发展节点,谁能够跨越这条“鸿沟”,谁就能在未来产业版图中占据核心位置。
免责声明:本文由华兴资本编写,谨供读者作参考用途,不应被视为在任何地区针对任何证券的研究报告,不构成任何投资分析或投资建议,也不构成买卖、认购证券或其它金融工具及产品的邀请或保证。读者不应仅依靠本文、而应按照自己的判断作出投资决定,并在作出任何投资行动前咨询专业意见。
特别声明:以上内容仅代表作者本人的观点或立场,不代表新浪财经头条的观点或立场。如因作品内容、版权或其他问题需要与新浪财经头条联系的,请于上述内容发布后的30天内进行。
https://finance.sina.com.cn/cj/2025-11-15/doc-infxmzea3561769.shtml
