作者: 自动驾驶之心
作者简介: 自动驾驶之心官方唯一授权B站号。专注自动驾驶全栈技术与产业交流!
描述: 视频介绍了OmniDrive,一种用于端到端自动驾驶的新型框架,该框架使用大型语言模型(LLM)代理。我们的主要贡献包括在模型和基准(OmniDrive-nuScenes)两方面的创新解决方案。前者采用了新颖的3D视觉-语言模型设计,而后者则包含用于推理和规划的综合VQA(视觉问答)任务。 论文名称:OmniDrive: A Holistic LLM-Agent Framework for Autonomous Driving with 3D Perception, Reasoning and Planning