英伟达最新 | OmniDrive:用于3D感知、推理和规划功能的自动驾驶大语言模型

作者: 自动驾驶之心

作者简介: 自动驾驶之心官方唯一授权B站号。专注自动驾驶全栈技术与产业交流!

描述: 视频介绍了OmniDrive,一种用于端到端自动驾驶的新型框架,该框架使用大型语言模型(LLM)代理。我们的主要贡献包括在模型和基准(OmniDrive-nuScenes)两方面的创新解决方案。前者采用了新颖的3D视觉-语言模型设计,而后者则包含用于推理和规划的综合VQA(视觉问答)任务。 论文名称:OmniDrive: A Holistic LLM-Agent Framework for Autonomous Driving with 3D Perception, Reasoning and Planning

英伟达最新 | OmniDrive:用于3D感知、推理和规划功能的自动驾驶大语言模型

推荐视频

EM Planner is all u need?

EM Planner is all u need?

上传者: 自动驾驶之心

视觉3D检测如何做自动标注?

视觉3D检测如何做自动标注?

上传者: 自动驾驶之心