盖世汽车讯 据外媒报道,英伟达(NVIDIA)发布专为物理AI打造的开放世界基础模型NVIDIA Cosmos™ 3。该模型基于突破性的“混合Transformer”架构构建,将视觉推理、世界生成与动作预测整合于单一系统中。
图片来源:英伟达
Cosmos 3是全球首个完全开放的“全能模型”(omnimodel),能够以领先的物理精度原生理解并生成文本、图像、视频、环境音效及动作,从而将物理AI的训练与评估周期从数月缩短至数日。
NVIDIA还推出了“NVIDIA Cosmos 联盟”(NVIDIA Cosmos Coalition),这是一个汇聚了世界模型构建者与AI开发者的全球协作平台——成员包括Agile Robots、Black Forest Labs、Generalist、LTX、Runway和Skild AI——旨在携手推动下一代世界模型的发展。
NVIDIA创始人兼首席执行官黄仁勋表示:“得益于多模态推理、语言、视觉以及世界模型领域的突破性进展,物理AI的‘大爆炸’时刻已近在咫尺。Cosmos 3系列开放式前沿全能模型,将赋予开发者跨越代际的能力提升,助其打造出能够在物理世界中进行感知、推理、规划与行动的机器人、自动驾驶车辆以及视觉AI系统。”
*特别声明:本文为技术类文章,禁止转载或大篇幅摘录!违规转载,法律必究。
本文地址:https://auto.gasgoo.com/news/202606/3I70460450C409.shtml
 
联系邮箱:info@gasgoo.com
求职应聘:021-39197800-8035
简历投递:zhaopin@gasgoo.com
客服微信:gasgoo12 (豆豆)
新闻热线:021-39586122
商务合作:021-39586681
市场合作:021-39197800-8032
研究院项目咨询:021-39197921
