为什么英伟达今天大跌？2025-01-29

2025-01-29

英伟达NVDA今天大跌的原因是阿里云通义千问发布类似DeepSeek最新模型，Qwen2.5-Max正式升级发布。据其介绍，Qwen2.5-Max模型是阿里云通义团队对MoE模型的最新探索成果，预训练数据超过20万亿tokens，展现出极强劲的综合性能，在多项公开主流模型评测基准上录得高分，全面超越了目前全球领先的开源MoE模型以及最大的开源稠密模型。

与Qwen2.5-Max进行对比的模型，就包括了最近火爆海内外的DeepSeek旗下的V3模型。受新模型的影响，阿里巴巴 (BABA)美股拉升，一度涨超7%，收盘录得6.71%的涨幅，报96.03美元/股。

当地时间1月28日，美国多名官员回应DeepSeek对美国的影响，表示DeepSeek是“偷窃”，正对其影响开展国家安全调查。就在前一天，美国总统特朗普还称DeepSeek是很积极的技术成果。

无论是在硅谷、华尔街及白宫掀起轩然大波的DeepSeek，还是阿里通义千问新发布的大模型，国产大模型最近的密集创新成果表明，中国人工智能的进步与追赶，已经极大程度改变了全球AI的行业格局。

阿里新模型性能全球领先

阿里通义千问团队表示，Qwen2.5-Max采用超大规模MoE（混合专家）架构，基于超过20万亿token的预训练数据及精心设计的后训练方案进行训练。

据介绍，Qwen2.5-Max在知识、编程、全面评估综合能力的以及人类偏好对齐等主流权威基准测试上，展现出全球领先的模型性能。指令模型是所有人可直接对话体验到的模型版本，在Arena-Hard、LiveBench、LiveCodeBench、GPQA-Diamond及MMLU-Pro等基准测试中，Qwen2.5-Max比肩Claude-3.5-Sonnet，并几乎全面超越了GPT-4o、DeepSeek-V3及Llama-3.1-405B。

同时，基座模型反映模型裸性能，由于无法访问GPT-4o和Claude-3.5-Sonnet等闭源模型的基座模型，通义团队将Qwen2.5-Max与目前领先的开源MoE模型DeepSeek V3、最大的开源稠密模型Llama-3.1-405B，以及同样位列开源稠密模型前列的Qwen2.5-72B进行了对比。结果显示，在所有11项基准测试中，Qwen2.5-Max全部超越了对比模型。

记者还注意到，除了发布Qwen2.5-Max以外，1月28日，阿里还开源了全新的视觉理解模型Qwen2.5-VL，推出了3B、7B、72B三个尺寸版本。其中，旗舰版Qwen2.5-VL-72B在13项权威评测中夺得视觉理解冠军，全面超越GPT-4o与Claude3.5。

受新模型的影响，阿里巴巴美股拉升，一度涨超7%，收盘录得6.71%的涨幅，报96.03美元/股。Qwen2.5-Max的发布引发了资本市场关于重估中国AI资产的讨论。如果将阿里巴巴美股上市后的股价走势时间轴拉长，其股价在2020年摸到311.046美元的高位后，便进入了下行的通道。业内人士分析，阿里云不仅发布了与全球顶尖模型比肩甚至更优的模型，而且具备完整的云生态，或能形成类似去年北美云计算服务商的投资逻辑。