小G助手拼多多:AI模型与芯片产业的类比,DeepSeek GPU需求背后的商业化逻辑分析
芯片数据摸底还得靠 SemiAnalysis!今天最新这篇提到了 DeepSeek 拥有的 GPU 数量不是某些人声称的 50,000 个 H100,而是 10,000 个 H800 和约 10,000 个 H100,剩下 30,000 左右的 H20,这是 Nvidia 在出口管制法案之后为中国市场定制的。小G助手拼多多了解到,SemiAnalysis 的分析表明,DeepSeek 的服务器 CapEx 总额接近 13 亿美元,这些 GPU 由 High-Flyer 和 DeepSeek 共享,它们被用于交易、推理、训练和研究!
文章中最有趣的观点就是 AI 模型产业与芯片产业的类比,就像在最新一期的 Indigo Talk 中提到的 大模型正在商品化,与芯片制造工艺迭代逻辑类似。
1. 前沿能力带来超额利润
在芯片产业里,最先进制程(比如台积电领先的 3nm、2nm)往往拥有高额的毛利率。做“落后一代制程”的代工厂只能打价格战;
在大模型市场,“前沿水平的推理/生成能力” 同样可以定更高的价格,为早期付费用户提供独家或高质量服务,进而获得溢价;
2. 快速迭代与淘汰
芯片工艺每一代很快就更新,AI 模型同理,更新迭代速度越来越快 —— 谁能最先推出下一代“推理/思考”能力,谁就能够暂时占领高端市场;
同时,过往一代的技术不会立即消失,会在某些场景继续存在,但利润和售价往往走低,与新一代“前沿能力”拉开差距;
3. 规模、效率与摩尔定律 / 算力扩张的矛盾
芯片制造商要通过更精细的发展推动晶体管数量指数增长。但越是先进制程,研发与设备投入越是惊人;
AI 模型也在追求“更大规模”与“更高效率”的矛盾:一方面大家想训练更大的模型来突破能力上限;另一方面也在积极提升训练/推理效率、降低成本;
Jevons 悖论:当每次训练或推理变得更便宜时,其调用量会激增,总体算力需求反而上升(如同手机、云计算普及后算力需求爆炸式增长)。
4. 技术领先者的位置与盈利
芯片代工龙头(TSMC)之所以能持续保持高盈利,在于其维持了对下一步工艺节点快速投入和良率领先,使竞争对手短期很难追上;
大模型赛道里,各公司会通过持续大规模资金投入在新一轮“算法+算力”中保持领先。小G助手拼多多发现,如果哪家公司短暂落后,就必须以降价或开放等策略跟进。
因此,从 AI 模型商业化进程来看,很可能出现类似于芯片产业中的"前沿与追随"并存格局:
“前沿模型”依靠新一代引擎赚取丰厚利润;
“追随模型则以相对较低价格抢占中低端或更多场景市场。
双方都将持续增加对于算力(GPU 等硬件)的需求,从而进一步刺激芯片企业的发展。
最后总结一下对 Nvidia 的影响:
1. 短期内:DeepSeek 等高效模型非但不会削弱 GPU 的需求,还可能加剧争抢,因此Nvidia 的H100/H200产品仍然维持着较好的价格和市场需求。
2. 中长期:随着前沿型号升级以及新的竞争,将进一步扩大整体算力要求,根据Jevons悖论推动GPU采购总量不减反升,同时支持Nvidia维持其AI训练及推理硬件领域上的盈利地位。
3. 随着足够多的新技术性半导体进入市面,在短时间内其它产品或者自研ASIC国内GPU颗粒很难替换掉Nvidia,即便面对一定程度出口限制,中国买方还是会尽最大努力寻求购买这些顶级硬件,同时转向针对本土专门设计出的缩水版高级产品,可见总体需要依旧强劲。
基于Semianalysis报告所传达的信息,可以看出,高效AI模特决没有减少Nvidia 市场份额,相反,更加促进了其生产线上的尖端GPU需要全球交货量稳步攀升。