Nvidia 发布新 AI 模型 Alpamayo-R1
Nvidia 在加州圣地亚哥举行的 NeurIPS AI 大会上宣布了一系列新基础设施和 AI 模型,旨在为物理 AI 的发展奠定基础,包括可以感知和与真实世界互动的机器人和自动驾驶车辆。
其中,最引人注目的是 Alpamayo-R1,这是一款专为自动驾驶研究而设计的开放推理视觉语言模型。Nvidia 称这是首个聚焦于自动驾驶的视觉语言行为模型,能够处理文本和图像,帮助车辆 “看” 到周围环境并做出相应决策。
Alpamayo-R1模型基于 Nvidia 的 Cosmos-Reason 模型,后者专注于在作出响应前进行思考和推理。Nvidia 在2025年1月首次发布了 Cosmos 模型系列,并在8月推出了更多模型。该公司表示,Alpamayo-R1的推出对那些希望达到四级自动驾驶(在特定区域和条件下完全自主)的大型企业至关重要。
Nvidia 希望这一推理模型能赋予自动驾驶汽车类似人类的 “常识”,更好地处理复杂的驾驶决策。此外,Nvidia 还发布了一系列新资源,包括逐步指南、推理资源和后续训练工作流程,统称为 Cosmos Cookbook,帮助开发者更好地使用和训练 Cosmos 模型,内容涵盖数据整理、合成数据生成和模型评估。
Nvidia 的联合创始人兼首席执行官黄仁勋多次表示,物理 AI 将是 AI 发展的下一个浪潮。Nvidia 首席科学家 Bill Dally 也在夏季与 TechCrunch 的对话中强调了物理 AI 在机器人领域的重要性。他表示,未来机器人将在世界上扮演重要角色,而 Nvidia 希望成为所有机器人的 “大脑” 制造者,因此必须开发关键技术。
同类文章推荐: