特斯拉世界模拟器亮相ICCV!VP亲自解密端到端自动驾驶技术路线

AIGC动态4小时前发布 QbitAI
34 0 0
特斯拉世界模拟器亮相ICCV!VP亲自解密端到端自动驾驶技术路线

 

文章摘要


【关 键 词】 特斯拉自动驾驶世界模拟器端到端技术路线

特斯拉自动驾驶副总裁Ashok Elluswamy在计算机视觉顶会ICCV上展示了其世界模拟器技术,该技术能够生成高度真实的驾驶场景视频,用于自动驾驶模型的训练和评估。这些场景包括突发状况如车辆突然变道、行人横穿等,甚至可转化为电子游戏供人类体验。该模拟器不仅适用于自动驾驶,还能应用于特斯拉的擎天柱机器人等具身智能场景

Elluswamy首次系统阐述了特斯拉的自动驾驶技术路线,强调端到端神经网络是实现自动驾驶的未来方向。该方法通过整合摄像头图像、运动信号、音频和地图等数据,直接生成车辆控制指令,避免了模块化系统中感知、预测与规划环节的接口模糊问题。端到端架构的优势包括更高效的人类价值观学习、整体网络优化、长尾问题处理能力以及确定性延迟的同质计算。例如,面对路面积水时,系统能像人类一样动态权衡借道绕行的风险与收益,这种复杂决策难以通过传统编程逻辑实现。

为克服端到端技术的核心挑战,特斯拉开发了世界模拟器作为评估工具。该模拟器通过合成未来状态实现闭环测试,支持大规模强化学习。面对输入数据量庞大(如20亿Token的传感器信息需精简为2个控制指令)的“维数灾难”,特斯拉依托日均500年驾驶当量的真实数据收集和精密的数据引擎筛选机制,使模型具备处理极端场景的泛化能力。在可解释性方面,系统通过生成中间推理Token(如高斯泼溅技术)实现行为追溯,当前已部分应用于FSD v14.x版本。

行业内在端到端框架下存在VLA(视觉-语言-动作)与世界模型两条技术路线之争。华为、蔚来等支持世界模型路线,认为其更贴近自动驾驶本质;而元戎启行、理想等选择VLA路线,强调其利用互联网常识数据和思维链推理的优势。特斯拉的方案因其历史技术选择的准确性备受关注,其最终路线选择可能成为影响行业格局的关键因素。这场技术路线的对决将直接影响自动驾驶未来的发展方向

原文和模型


【原文链接】 阅读原文 [ 1866字 | 8分钟 ]
【原文作者】 量子位
【摘要模型】 deepseek/deepseek-v3-0324
【摘要评分】 ★★★☆☆

© 版权声明
“绘蛙”

相关文章

“讯飞星辰”

暂无评论

暂无评论...