下注端到端：一场具身智能的谨慎豪赌

AIGC动态2年前 (2024)发布 aitechtalk

3,118 0 0

文章摘要

在2024年世界机器人大会（WRC）上，人形机器人以其操作能力的提升成为焦点，体现了人类对通用机器人终极形态的向往。在具身智能时代，除了机器人的外形，更重要的是实现智能，这涉及到软件与硬件的耦合。具身智能领域的团队在技术路径上有不同的选择，主要分为端到端的暴力美学和分层决策两种方法。

端到端架构通过单一神经网络将任务目标直接转化为控制信号，如特斯拉的Optimus机器人和谷歌的RT-2项目。这种模型虽然强大，但需要大量数据和算力，对小规模团队来说成本过高。此外，端到端模型的决策速度可能较慢，限制了其在实际场景中的应用。

分层决策模型则将任务分解为多个层级，分别训练不同的神经网络，最终整合。这种方法的优点是即时性高、可解释性和可控性强，且训练单个模型所需的数据量相对较少。Figure AI的Figure 02就是分层决策模型的代表，其输出频率高达200Hz，执行动作的延时只有5ms。

在具身智能的发展中，「大脑」和「小脑」的概念被引入，分别负责高层次的认知或决策问题和基础层面的功能性问题。具身智能的「大脑」涉及感知和规划决策系统，而「小脑」则负责将决策转换为动作指令并执行。

具身智能的实现不仅依赖于技术路径的选择，还面临数据质量和数量的挑战。不同的团队在解决这一问题上采取了不同的策略，如通过仿真数据、模拟器、Sim2Real等方法来提高数据的质量和数量。

总的来说，具身智能的发展正处于一个快速变化的阶段，无论是端到端的暴力美学还是分层决策架构，都需要不断地探索和优化。随着技术的进步，未来可能会有更多的创新和突破。

原文和模型

【原文链接】 阅读原文 [ 5491字 | 22分钟 ]
【原文作者】 AI科技评论
【摘要模型】 moonshot-v1-32k
【摘要评分】 ★★★★★

Moonshot AI

月之暗面是一家 AI 初创大模...

# AIGC动态 # AI大模型 # 机器人 # 人形机器人 # 具身智能 # 分层决策 # 技术路径 # 端到端

文章版权归作者所有，未经允许请勿转载。

52 分钟订单破千，5 小时登上热搜，Vbot 用一只机器狗开启具身智能元年

极客公园

609

弯道超车？国产具身，千小时人类数据激发智能涌现

机器之心

541

端侧 GPT-4o来了！面壁发布全新端侧模型，全模态、端到端，支持实时流式音视频通话！

AI前线

3,035

横扫全球15项SOTA！高德首个面向AGI的全栈具身技术体系大公开

量子位

630

硅谷活动｜与Ray-Ban Meta产品经理、K Scale联创深入交流，讨论AI与硬件的一切

硅星人Pro

2,739

看完智平方创始人郭彦东的这场演讲，我对 VLA 又有信心了

AI科技评论

260

暂无评论

暂无评论...

下注端到端：一场具身智能的谨慎豪赌

文章摘要

原文和模型

大语言模型如何助力药物开发? 哈佛 George Church Lab 最新综述

OpenAI开启推理算力新Scaling Law，AI PC和CPU的机会来了

相关文章

暂无评论

热门网址

热门文章

下注端到端：一场具身智能的谨慎豪赌

文章摘要

原文和模型

大语言模型如何助力药物开发? 哈佛 George Church Lab 最新综述

OpenAI开启推理算力新Scaling Law，AI PC和CPU的机会来了

相关文章

暂无评论

AstronClaw-安全养虾

LibTV-AI视频创作

讯飞AI大学堂

热门网址

热门文章