今日(周一)美股一开盘,人工智能概念股集体狂飙。谷歌大涨超7%,英伟达大涨超5%,超微电脑大涨超7%,ARM上涨超2.5%。
原因是市场消息称苹果公司正在与谷歌进行谈判,商讨将谷歌的Gemini人工智能引擎内置于iPhone手机中,从而为今年推出的iOS 18提供一些新功能。
若双方达成协议,将对全球人工智能产业产生重大影响:
对苹果而言,将大幅提升其语音助手Siri的功能和性能,提供更智能化的交互体验,并增强其在人工智能领域的竞争力。
对谷歌而言,将是Gemini迄今为止最引人注目的合作,苹果拥有超过20亿部激活状态的设备,将为Gemini引擎提供巨大的用户基础,并为谷歌带来可观的商业收益。
对全球人工智能产业而言,此次合作将强强联合,加速人工智能技术在移动领域的应用,引领智能手机市场的新变革。
然而,英伟达股价在盘初一度涨幅超过5%的喜人局面,到下午一点时却戏剧性地回吐了所有涨幅。随着英伟达股价的持续下滑,市场资金开始纷纷撤离,转而流向特斯拉、苹果和谷歌等科技巨头。
机构们在今日开盘时选择在市场情绪高涨的时刻抛售,分析认为机构们可能利用了GTC大会这一契机进行出货操作,以获取更大的利益。
截至收盘,道指涨幅为0.20%;纳指涨幅为0.82%;标普500指数涨幅为0.63%。标普500指数结束了此前连续连续三个交易日下跌的趋势。
英伟达发布新架构超级GPU
在今日加州圣何塞举行的英伟达年度GTC大会上,公司首席执行官黄仁勋揭开了备受瞩目的新一代Blackwell图形处理器(GPU)的神秘面纱。
活动现场,黄仁勋更是将Blackwell与先前的Hopper GH100 GPU进行直观的尺寸对比,突显其技术革新。
黄仁勋自豪地宣称,Blackwell将成为全球最顶尖的芯片。其架构内的GPU集成了惊人的2080亿个晶体管,采用台积电先进的4NP制程工艺——这是4N工艺的改进版,且为双reticle定制版。两块小芯片间的互联速度高达10TBps,极大地提升了处理能力。
Blackwell还配备了192GB、速度达8Gbps的HBM3E内存,其AI算力更是达到了惊人的20 petaflops(FP4精度),相比前代H100的4 petaflops有了质的飞跃。
生成式 AI 的下一步是多模态和视频,也就意味着更大规模的训练,Blackwell 带来了更多可能性。
此外,大模型(LLM)的大规模推理始终是一个挑战,并非适合单个 GPU 的任务。在具有 1750 亿个参数的 GPT-3 LLM 基准测试中,GB200 的性能是 H100 的 7 倍,并且训练速度是 H100 的 4 倍。
相较于 H100 Tensor Core GPU,GB200 超级芯片可以为大语言模型(LLM)推理负载提供 30 倍的性能提升,并将成本和能耗降低高达 25 倍。这是能源节省是一个重要的方面。
英伟达的客户,包括微软、亚马逊、谷歌、Meta和特斯拉,目前正在使用或积极开发他们自己的内部AI芯片,以替代英伟达的产品。其中一个原因是,他们不必支付英伟达芯片预估的数万美元的成本。但另一个原因是,英伟达的芯片特别耗电。
英伟达通过宣传Grace Blackwell Superchip的节能效果,直接回应了客户的担忧。
英伟达表示,亚马逊、谷歌、微软和甲骨文(ORCL)将成为首批通过其云平台提供Blackwell芯片访问权限的公司。
「人们认为我们制造 GPU,但 GPU 看起来并不像以前那样了,」黄仁勋表示。「我现在一手拿着 100 亿,一手拿着 50 亿。」
现在,显卡不再是显卡,而是作为系统整体售卖,毕竟只有通过英伟达自家的组件才能达到最佳效率。「现在我们卖的 GPU 是 7000 个组件,3000 磅重。」
黄仁勋提到,大模型的参数量正在以前所未有的速度增长。例如,OpenAI的某个大型模型已经拥有1.8万亿个参数,需要处理数十亿个token。即使是PetaFLOP级的GPU,训练这样的模型也需要长达1000年的时间。这一言论还意外地透露了GPT-4的实际参数量,达到了惊人的1.8万亿。
Blackwell 的发布意味着,近八年来,AI 算力增长了一千倍。一些网友看完发布会惊叹:Nvidia eats world!
唯一遗憾就是 没有出现传说中的 B100,性能是H100的4倍。这可能是让华尔街稍微失望的原因,盘后小幅下跌。