《金基研》 寒松/作者 杨起超 时风/编审
在全球人工智能浪潮的推动下,算力已成为驱动科技革命与产业升级的核心引擎。作为算力基础设施的关键组件,GPU(图形处理器)凭借其强大的并行计算能力,已从传统的图形渲染领域迅速跃升为AI训练与推理、科学计算及数字创新的基石。现阶段,国际巨头英伟达主导GPU市场,其全功能GPU与CUDA生态共同构筑了“硬件+软件+社区+应用”的飞轮效应。
面对由国际巨头主导的竞争生态,国内GPU产业在挑战中孕育着巨大的机遇。在外部技术限制与内部强烈的自主创新及国产替代需求共同推动下,以摩尔线程智能科技(北京)股份有限公司(以下简称“摩尔线程”)、沐曦集成电路(上海)股份有限公司(以下简称“沐曦股份”)等为代表的本土GPU企业正从技术突破走向规模化商用。其中,摩尔线程是国内实现全功能GPU量产并大规模商用的厂商,全面对标英伟达。目前,国产GPU头部企业在手订单充沛,凸显了发展的确定性与成长性。
一、全功能GPU更契合AI发展趋势,企业级GPU成行业增长主要驱动力
GPU(图形处理芯片)又称显示核心、视觉处理器、显示芯片,是一种主要用于计算加速领域的微处理器。GPU从早期的图形渲染任务开始,随着软件和硬件技术的持续发展,逐渐扩展至计算加速等领域。随着深度学习的发展,GPU在AI训练与推理领域逐渐成为主流选择。
GPU凭借高带宽内存和并行计算架构,非常适合加速矩阵运算、卷积操作等神经网络的关键计算。因此,GPU应用已从AI延伸至科学计算、数据分析等诸多领域。伴随着成熟的开发生态和软件支持,GPU已成为现代计算基础设施的核心组件。
根据功能定位,GPU主要分为全功能GPU、图形GPU和GPGPU(通用GPU)。
全功能GPU,以英伟达和摩尔线程的产品为代表,具备完整的功能支持和计算精度,在工作效率、软件生态丰富度以及兼容性等方面更具优势。因而,全功能GPU能更好地适应未来前沿计算加速应用的需求。
图形GPU专为图形渲染和PC游戏设计,针对高清显示及高性能2D/3D图形计算进行了优化。而GPGPU省去了与图形显示和渲染相关的功能,专注于利用GPU架构执行通用并行计算任务。
与其他类型的GPU相比,全功能GPU可满足更广泛的应用需求,在世界模型、具身智能、物理AI等未来AI的发展趋势下,全功能GPU将拥有显著的竞争优势。
1.2、消费级与企业级共筑GPU产业生态,企业级GPU将成为行业增长主要核心引擎
根据应用场景定位,GPU行业主要分为消费级与企业级两大板块,它们源自相似的技术基础,但面向不同的应用场景,共同满足了从消费娱乐到企业级科学的广泛计算需求。
消费级GPU主要服务于普通消费者,广泛应用于台式电脑、笔记本、游戏主机及移动设备中,可进一步细分为桌面端与移动端两类。
其中,桌面端GPU主要面向高帧率游戏、内容创作(如视频剪辑、3D建模)以及轻量级AI推理等应用场景。桌面端GPU的核心诉求在于平衡高性能图形表现、良好的性价比以及有效的散热与功耗控制。移动端GPU应用于智能手机、平板等设备,受限于空间与功耗,其设计更强调能效比与系统集成度。
企业级GPU专为数据中心、服务器和高性能计算环境设计,是当前AI大模型训练、科学仿真、云计算等关键基础设施的核心组件,堪称驱动AI革命乃至整体算力升级的基石。
可以预见,在AI算力需求持续扩张的背景下,企业级GPU将成为行业增长的主要驱动力,而消费级GPU市场则随着游戏与创意内容产业的发展保持稳健。两者侧重点不同,共同构成了GPU产业的完整生态。
现阶段,GPU行业整体呈现寡头垄断格局,国际头部企业在技术、市场和生态方面具有显著优势。国内厂商凭借对下游客户需求的快速响应和本地化服务,已在特定领域取得一定市场份额,并持续向新应用领域延伸。
2.1、英伟达以94%份额主导独立GPU市场,AMD与英特尔寻求差异化突破
在海外,GPU行业主要由英伟达、AMD、英特尔三大阵营主导。
其中,英伟达是GPU行业绝对领导者,主要从事GPU的设计,产品应用于游戏、专业可视化、数据中心和自动驾驶等领域,尤其在数据中心(AI/高性能计算)领域占据垄断性优势。英伟达核心优势并非仅在于硬件,而在于其构建的“CUDA”软件生态系统。其依托数百万开发者、丰富的AI模型库及全栈解决方案构建的生态系统,形成了极高的用户黏性和转换成本形成了极高的用户粘性和转换成本。从H100到最新的Blackwell架构,英伟达持续领先的性能迭代能力巩固了技术领导地位。
AMD是主要的市场追赶者,采取开放平台策略,在消费级市场与英伟达竞争,在数据中心市场则是当前最具实力的竞争者。AMD以高性能比和卓越能效为核心卖点,通过积极推广开放的“ROCm”软件平台,旨在吸引受困于CUDA封闭性和高昂成本的客户。
英特尔是重要的新入局者,正凭借其庞大的CPU客户基础与制程优势奋起直追。
根据Jon Peddie Research发布的2025年第二季度独立GPU市场报告,英伟达再次刷新了其在独立显卡市场的份额记录,达到了惊人的94%,而AMD则仅占6%。
2.2、国产GPU企业群雄逐鹿,摩尔线程对标英伟达
在国内,GPU市场呈多元化竞争格局,代表性企业包括摩尔线程、上海燧原科技股份有限公司(以下简称“燧原科技”)、上海壁仞科技股份有限公司(以下简称“壁仞科技”)、沐曦股份、长沙景嘉微电子股份有限公司(以下简称“景嘉微”)等。
值得关注的是,摩尔线程同时布局消费级游戏显卡与企业级AI及专业图形市场,产品集成了AI计算加速、图形渲染、物理仿真和科学计算、超高清视频编解码等多种能力,是国内目前实现全功能GPU量产并规模销售的厂商,产品定位对标英伟达。
燧原科技、壁仞科技、沐曦股份等主要专注于AI/GPGPU加速卡,产品重心在于数据中心和大模型训练,通常未集成消费级图形渲染功能。
其中,燧原科技定位为GPGPU与训推一体化算力平台的国产AI芯片与算力服务提供者,专注于为通用人工智能(AGI)构建高算力、高能效比的云端算力基础设施。壁仞科技致力于成为GPGPU领域的领军企业,专注于为人工智能训练与推理、高性能计算(HPC)、科学计算及图形渲染等通用计算场景提供算力支持。沐曦股份专注于GPGPU设计与AI加速,旨在为数据中心、AI训练与推理、科学计算、图形渲染等高算力需求场景提供全栈芯片及解决方案。
此外,景嘉微主要聚焦图形GPU,产品主要用于高性能图形处理和人工智能计算。
总体而言,GPU行业呈现出国际企业主导、国内厂商快速追赶的竞争格局。随着国内企业在技术、生态和市场拓展方面的持续突破,未来有望在更多领域实现国产替代和市场拓展。
三、英伟达CUDA构筑生态壁垒,国产GPU生态立足兼容构建自主
GPU真正的竞争力不仅源于硬件的强大算力,更在于软硬件深度融合所构建的生态系统。当前,全球GPU生态格局呈现鲜明的两极态势:一方是以英伟达CUDA生态为代表的成熟垄断体系;另一方则是国内GPU产业在硬件追赶与软件生态攻坚中不断突破。
3.1、软硬件协同构筑GPU生态飞轮,英伟达CUDA生态竞争力全球领先
GPU的关键组件包括决定其处理能力和运算效率的微架构,以及由开发工具、程序库和应用程序接口(API)等构成的软件生态系统。成功的GPU生态不仅依赖于先进的制程与架构,更在于其通过十余年积累所形成的软件工具链、活跃的开发者社区以及对行业标准的影响力。
GPU生态的运行遵循着“硬件—软件—应用—开发者”之间形成的飞轮效应。
其中,强大的硬件为软件提供坚实的基础和性能上限;优化的软件栈将硬件潜力充分释放给开发者;繁荣的开发者社区基于易用的软件工具,开发出创新、多样化的应用;杀手级应用吸引更多用户,创造商业价值,并反馈需求给硬件和软件;需求反馈指导下一代硬件的架构设计和软件的优化方向。
该飞轮一旦高效运转,便会形成极高的生态壁垒。在全球范围内,仅有少数几家公司构建了完整的软件生态系统。
其中,英伟达的CUDA生态是该模式最成功的典范,在行业内已形成垄断地位。英伟达的CUDA生态系统自2006年推出以来不断扩大,吸引了数百万开发人员,构建起庞大而成熟的开发者生态。
3.2、硬件追赶+软件生态攻坚,国产GPU生态以兼容起步向自主进发
目前,英伟达的生态系统难以被超越,CUDA的兼容性预计将引导未来生态系统的发展方向。因此,能够与现有生态(如CUDA)保持兼容的新兴生态系统,有望实现快速发展并迅速扩大市场份额。
国产GPU技术生态已进入“硬件寻求突破、软件生态攻坚、场景深度落地”的关键阶段。
在硬件架构方面,国内GPU企业采取跟随与并行策略,部分产品达到国际中高端水平,但在先进制程、极致能效和互联技术上仍有差距;在软件生态方面,国内GPU企业的软件栈正在从“可用”向“好用”、“高效”迈进,兼容CUDA是主流策略,而自主生态建设刚起步。
国内GPU软件生态短期内需依靠兼容层与政策驱动实现部分替代,长期则必须构建起以自主指令集、统一编程标准和活跃开发者社区为核心的三位一体生态体系。
具体来看,国内GPU企业的生态建设主要分为三种路径,分别为兼容CUDA、拥抱开源生态(如ROCm,oneAPI)、打造原生自主生态。国内GPU厂商大多采用“组合拳”:短期通过兼容/开源路线保证“可用”,解决生存问题;同时长期投入自主生态建设,谋求未来。
其中,摩尔线程是国内GPU厂商中,生态策略最具特色、也最富挑战性的玩家之一。摩尔线程坚持“全功能GPU”路线,依托全栈自研的MUSA架构,构建了完整的软硬件生态系统,支持DirectX、OpenGL、Vulkan等主流图形应用开发技术,并兼容国际主流GPU生态。通过MUSA架构的兼容层,摩尔线程旨在为用户提供一条“阻力最小”的迁移路径。
综上,GPU产业的竞争本质是生态系统的竞争。英伟达通过“硬件-软件-应用-开发者”的飞轮效应,已建立起以CUDA为核心的全球领先生态,形成了短期内难以逾越的竞争壁垒。而国产GPU生态正处在关键攻坚期,在硬件快速追赶的同时,正通过兼容过渡、拥抱开源与自主建设并行的多元软件策略,构建GPU生态系统。
生态建设是长期而艰巨的工程,而市场需求却迫在眉睫。在努力构建自主生态的同时,国产GPU厂商也必须直面商业化落地的实际挑战。经过持续深耕,国产GPU企业不仅完成了从技术到应用的跨越,更在需求驱动下纷纷进入规模化商用新阶段,在手订单充沛,展现出清晰且可期的发展前景。
4.1、国产GPU企业构建差异化产品矩阵,科技成果转化成效显著
GPU行业的商业模式包括芯片、板卡、系统、一站式解决方案及SoC等形式,分别针对不同的客户群体和应用场景。这些商业模式在满足市场细分需求的同时,也为GPU厂商带来了多元化的收入来源和竞争优势。
经过多年研发与创新,国内主要GPU企业已基于各自技术路线和市场定位,构建了差异化的产品矩阵。
其中,2021-2024年,摩尔线程基于自主研发的MUSA架构,分别推出“苏堤”、“春晓”、“曲院”、“平湖”四代GPU芯片架构,并围绕芯片构建了板卡、一体机、智算集群等多种层级形态的全线产品矩阵,全方位满足企业级和消费级客户的不同需求。
值得一提的是,摩尔线程自研的MUSA已在芯片指令集级别实现与CUDA对标并兼容;摩尔线程基于“曲院”芯片构建了千卡集群智算中心,并依托“平湖”芯片打造了支持DeepSeek等前沿大模型预训练的万卡集群智算中心解决方案。2025年,摩尔线程推出新一代全功能GPU架构“花港”,实现5年5次迭代。在花港架构中,摩尔线程基于新一代指令集架构及MUSA处理器架构,算力密度提升50%,计算能效实现10倍提升,可支持十万卡以上规模智算集群。
作为国内高性能GPU产品的领军企业之一,沐曦股份的产品矩阵包括用于智算推理的曦思N系列GPU产品,用于训推一体和通用计算的曦云C系列GPU产品,以及用于图形渲染的曦彩G系列GPU产品,涵盖了计算(包括训练、推理、通用计算)和渲染的全场景。
此外,燧原科技已建立起覆盖智能加速卡、大模型一体机、高密度服务器及智算集群等全栈云端算力产品线。壁仞科技也推出了壁砺™系列通用GPU产品,打造了高性能、高能效的智算集群解决方案。景嘉微研发了以JM5400、JM7200、JM9系列和JM11系列为代表的一系列GPU芯片。
在商业化方面,国内主要GPU企业已取得实质性突破,逐步实现产品落地并拓展行业应用场景。
其中,摩尔线程产品已成功应用于大模型训练推理、数字孪生、消费电子、数字办公等领域,并与多个行业知名客户建立了良好的合作关系。近年来,摩尔线程的营业收入呈攀升态势,在手订单充裕。
2022-2024年及2025年1-9月,摩尔线程的营业收入分别为0.46亿元、1.24亿元、4.38亿元、7.85亿元。
截至2025年11月28日,摩尔线程预计订单金额约20亿元。其中,占比较大的AI智算相关订单,其对应收入预计将于2025年及2026年实现;智能SOC、专业图形加速及桌面图形加速相关订单收入预计于2025年实现。
2025年12月20日,摩尔线程举行首届MUSA开发者大会,公开包括新一代GPU架构“花港”、夸娥万卡智算集群、AI算力本MTT AI BOOK等一系列最新技术与产品进展。
在图形计算领域,摩尔线程在技术上率先拥抱“图形+AI”范式革命,推出自研AI生成式渲染架构(AGR),新一代GPU还增加了硬件光线追踪单元RTU,将支持实时光线追踪。在训练及推理领域,摩尔线程的夸娥万卡智算集群展示了其支撑万亿参数模型训练的工程化能力与可靠性,在多项关键精度指标上达到国际主流水平。
同时,沐曦股份已与产业链上下游建立了良好的合作关系,构成了由智算中心、服务器整机厂、操作系统厂商、大模型厂商、AI应用方等组成的合作生态。沐曦股份产品相继应用部署于10余个智算集群,算力网络覆盖国家人工智能公共算力平台、运营商智算平台和商业化智算中心。
截至2025年9月5日,沐曦股份在手订单金额(不含税)为14.30亿元,主要来自曦云C500系列板卡。
此外,燧原科技产品已深入多家互联网头部企业生态,其中包括腾讯、美图。壁仞科技的国产GPU千卡集群已实现大规模商用,其与运营商、智算中心、行业AI、金融、电力等众多行业的标杆客户深度合作。景嘉微图形处理芯片在专用与通用市场实现广泛应用。
在市场扩张的背景下,随着国产GPU的产品性能和生态得到持续验证,其发展的确定性与成长性日益凸显。
总的来说,以摩尔线程、沐曦股份、燧原科技、壁仞科技为代表的国产GPU企业,依托清晰的技术路线与差异化的产品矩阵,在手订单饱满、应用场景广泛、生态合作深入,标志着国产GPU正式迈入规模化落地与商业兑现的新阶段。
国产GPU企业能如此迅速地实现从技术突破到订单落地,并非孤立的企业行为。其背后,是强劲的市场需求与国家坚定的战略意志共同推动的时代浪潮。一方面,AI应用的爆发导致了前所未有的算力需求;另一方面,外部技术封锁与内部信息安全需求,叠加产业政策扶持,共同构筑了国产GPU发展的历史性窗口期。
5.1、近五年,国内算力规模CAGR达45.9%,GPU市场规模CAGR为43.64%
在数字经济飞速发展、新质生产力不断提升的背景下,以GPU为代表的具备超强计算能力和卓越性能的逻辑芯片得到了迅速发展。特别是当前领先的GPU产品已经展现出传统CPU难以比拟的指数级计算能力。
随着大模型、具身智能、智能驾驶等AI应用的不断突破,国内对算力需求攀升,带动国内GPU市场规模的持续增长。
根据数据统计,2020-2024年,国内算力规模分别为136.20EFLOPs(每秒浮点运算次数)、201.30EFLOPs、298.50EFLOPs、450.00EFLOPs、617.00EFLOPs,CAGR达45.9%;预计到2029年国内算力规模将达到3,442.89EFLOPs,CAGR为40.0%。
其中,智能算力是引领算力规模指数级增长的核心。近年来,AI技术的深入应用,促进了对高性能计算能力的强烈需求,推动智能算力持续扩容。
2020-2024年,国内智能算力规模分别为59.20EFLOPs、105.50EFLOPs、178.50EFLOPs、301.00EFLOPs、438.07EFLOPs,CAGR达64.9%,预计到2029年国内智能算力将增长至3,035.91EFLOPs,CAGR为45.3%。
算力的实现高度依赖底层硬件,其中以GPU为代表的AI加速芯片尤为关键。目前,GPU依然是AI市场的主导芯片。根据数据统计,过去五年,国内GPU产业呈现快速增长态势,市场规模从2020年的384.77亿元快速增长到2024年的1,638.17亿元,CAGR为43.64%。
5.2、出口管制凸显GPU战略地位,国产GPU产业发展迅猛
GPU作为信息技术产业的核心硬件基础,其发展面临国外企业寡头垄断、部分国家出口管制等多重限制。发展高性能GPU是提升国家算力主权、保障AI产业供应链安全的核心,属于战略必争之地。
2025年1月13日,美国正式发布了一项史上最严格的全球AI管控新规,标志着美国首次全面规范AI芯片和模型在全球范围内的扩散。
出口管制不仅凸显了高性能GPU在AI发展中的战略地位,也彰显了国内加快发展自主可控GPU的紧迫性与必要性。
同时,随着信息技术应用创新发展上升为国家重要战略,在信创产业等政策持续推动下,GPU等核心部件的国产替代逐步向各行各业渗透,以尽可能保障信息安全。国产GPU企业的发展显著受益于国家在集成电路、人工智能等领域出台的一系列系统性支持政策。
在外部限制性政策和国家数据安全保护需求的驱动下,本土GPU企业不断突破技术壁垒,加速国产GPU生态的技术验证与产业化进程。
以摩尔线程为代表的国内GPU企业,正抓住市场与政策的双重机遇,通过持续的架构创新与技术进步,积极满足国内AI产业对算力芯片的迫切需求,发展势头迅猛。
六、结语
综上所述,在AI应用持续深化、智能算力需求指数级攀升的大背景下,GPU的战略价值愈发凸显。英伟达凭借CUDA构建的深厚生态壁垒,占据了市场绝对主导地位。然而,AI算力需求的爆炸式增长与国家层面对于算力自主的迫切需求,为国产GPU企业开辟了广阔的发展空间。
以摩尔线程、沐曦股份、燧原科技、壁仞科技为代表的厂商,通过聚焦全功能或GPGPU等差异化路径,在兼容主流生态与构建自主体系间积极探索,不仅完善了产品矩阵,更收获了充沛的订单,标志着国产GPU正式迈入规模化商业落地的新阶段。尽管前路仍需跨越技术迭代与生态构建的挑战,但国产GPU企业已展现出清晰的成长路径与强大的发展韧性,有望在破解算力桎梏、保障国家数字主权安全的征程中,扮演愈发关键的角色。

发布评论
评论