上周,一位英伟达代理商向媒体透露,春节后首周,两家中国科技企业为支撑开源大模型DeepSeek的推理服务,紧急向其公司采购L20 GPU设备。“去年,客户下单前会反复比价,如今连库存里的禁售型号都被一抢而空。”
DeepSeek的崛起,颠覆了市场对AI赛道高性能GPU垄断地位的传统认知,使英伟达一度遭遇市场看空。然而,产业观察人士发现,近期无论是高性能H系列GPU,还是RTX 40系列高端显卡,英伟达GPU再次陷入供不应求的状态。
DeepSeek引爆算力抢购潮
上述英伟达代理商表示,目前正加紧调配英伟达产品,以满足客户激增的需求。他指出,英伟达芯片在中国市场几乎全线紧缺,部分禁售型号H800的存货已“一卡难求”。
与此同时,接入DeepSeek的企业已达数百家,涵盖云计算、互联网、手机、芯片、金融、医疗、汽车等多个行业。这一趋势为相关企业带来了巨大商业机遇:
- 云服务厂商借机兜售算力
- 芯片企业借势推广自家产品
- 车企以更低成本升级智能软件
- 上市公司借此推升市值
一家IT公司向媒体透露,其调用DeepSeek的平台在上线首日新增上万用户,导致服务器几近崩溃,现有算力远远跟不上用户需求。团队不得不紧急采购更多英伟达GPU。
多家上线DeepSeek的平台都出现“服务器繁忙”提示,实际上并非技术故障,而是提供的算力远远无法匹配用户的爆发式增长。
超算云服务商并行科技(839493.BJ)董事长陈健指出,AI模型的生命周期通常包括训练、部署、推理三个阶段,目前DeepSeek的推理需求正处于井喷式爆发,带动市场对英伟达GPU的抢购热潮。
目前,英伟达在华合法销售的型号包括:
- H20、L20、T4(企业级)
- RTX 40系列(除RTX 4090外)
- RTX 30系列及更早型号
- 最新RTX 5090D(限制版)
虽然市面上已有十余款国产GPU品牌,但在性能、稳定性、生态兼容性等方面仍难以匹敌英伟达,导致企业仍将其视为最优选择。
英伟达股价大起大落,DeepSeek影响几何?
DeepSeek的R1模型发布后,英伟达股价一度遭遇一年内最大单日跌幅(17%),引发市场震动。然而,自2月3日起,其股价已回升13%,显示市场情绪正在修复。
一位国内模型厂商高管向美股投资网表示,DeepSeek的出现让行业开始反思“算力泡沫”,是否未来AI训练能摆脱大规模高端GPU集群的依赖?但现实情况是,模型推理的算力需求仍在爆炸式增长,最终仍然推高了对英伟达GPU的需求。
并行科技董事长陈健指出,DeepSeek给行业带来的最大冲击在于:
大幅降低AIGC大模型的训练和推理算力消耗
短期内,推理需求远超训练需求,但训练的长期需求仍将稳步增长
DeepSeek算力需求是否可持续?
尽管DeepSeek展现出强大推理能力,但其算力消耗成本极高。上述国内模型厂商人士透露,DeepSeek的“满血版”至少需要两张H800 GPU才能运行,而国内许多基础模型仅需一张RTX 4090即可。
AI模型的能力通常取决于参数量和精度:
参数量决定AI知识储备
精度影响AI的推理能力
但由于许多企业上线DeepSeek时配备的算力不足,导致模型在推理精度上无法发挥最大潜力,进而影响用户体验。
不过,DeepSeek当前的算力需求或许不会长期维持高位。
开发者通常会将超600B参数的大模型进行蒸馏,压缩至更低参数规模,以便商业化部署。
由于DeepSeek发展过快,团队尚未完成模型蒸馏。
预计未来几个月,经过优化后的DeepSeek版本将降低推理算力需求,使企业减少对英伟达GPU的依赖。
总结
DeepSeek的爆发式增长,正在重塑AI算力市场:
英伟达GPU在中国市场全线告急,供不应求状况加剧
DeepSeek推理需求远超预期,企业纷纷加码GPU采购
英伟达股价受冲击后回暖,市场情绪正逐步恢复
长期来看,模型蒸馏技术或将降低GPU需求,但短期内DeepSeek仍将维持高算力消耗
DeepSeek的兴起,或许是AI算力市场的一次革命,但在“去GPU化”真正实现之前,英伟达仍是最大赢家。