灵初智能陈源培:一个 00 后的机器人之梦

文章摘要
陈源培,灵初智能的联合创始人,作为00后技术创业者,凭借在具身智能领域的突出贡献,入选了福布斯“30 Under 30 – Asia – AI (2025)”榜单。尽管本科专业是土木工程,但他在大二时通过参加RoboMaster机器人比赛,对机器人产生了浓厚兴趣,并决定自学机器人技术。为了追踪前沿领域,他先后在北大和斯坦福进行访学,研究灵巧手和强化学习技术。陈源培的核心问题是:机器人如何才能真正服务人类?他认为,实验室环境无法模拟真实场景,因此需要一个团队来将经验和算法落地。
在杨耀东教授的推荐下,陈源培结识了灵初智能的创始人王启斌,并作为联创加入公司,负责技术研发。灵初智能在2024年12月发布了首个基于强化学习的端到端模型“Psi R0”,并于2024年4月推出最新的分层端到端VLA模型“Psi R1”,实现了机器人在开放环境下的自主推理决策和长程灵巧操作能力。这些成果的背后,陈源培的技术贡献不可忽视。
陈源培在灵巧手领域的研究始于2022年,当时强化学习在灵巧手控制上仍是一个小众领域。他通过开源项目Bi-DexHands,展示了灵巧手在抛铅球、转魔方等复杂任务中的潜力。这一项目为后续的灵巧手研究奠定了基础。陈源培认为,灵巧手的发展经历了几个关键拐点:2019年OpenAI通过Sim2Real技术复原魔方,展示了强化学习在灵巧手控制上的潜力;2020年后,GPU并行仿真的出现解决了部分数据问题。未来,人类世界的数据利用率可能成为第三个拐点。
在强化学习与模仿学习的对比中,陈源培指出,强化学习通过奖励机制明确目标,而模仿学习仅拟合数据,缺乏明确目标。灵巧手的高自由度控制使得传统方法难以应对,而强化学习则能够有效解决这一问题。然而,强化学习在自主探索能力上仍面临挑战,特别是在Sim2Real迁移和真机训练中,噪声和样本效率问题尤为突出。为此,结合人类专家经验的训练方法,如Offline to Online强化学习和逆强化学习,成为当前的研究重点。
灵初智能的Psi R1模型在Psi R0的基础上,进一步提升了长程规划和推理能力。通过分层端到端架构,Psi R1实现了上下层模型的各司其职,提高了数据采集效率和泛化性。陈源培强调,分层模型能够利用互联网数据进行上层训练,而机器人数据则用于下层训练,这种架构更贴近模型算法的上限。
陈源培选择创业而非继续读博,主要基于三点考虑:具身智能需要强大的团队和资源支持;当前AI领域技术驱动,学习能力强的人有机会脱颖而出;个人生活偏好也促使他回国发展。作为灵初智能的联创,他主要负责技术研发和场景策划,强调技术与商业化落地之间的平衡。他认为,具身智能的落地需要贴近真实场景需求,成功率和泛化性的平衡是关键。
灵初智能专注于算法而非硬件,陈源培解释,算法是决定灵巧手市场潜力的核心,而硬件则与数据紧密相关。公司计划率先在物流场景落地,因为物流场景结构化且国际化,适合拓展海外市场。未来,灵初智能的目标是打造通用机器人,但陈源培认为,当前应先在半结构化场景中打磨模型,积累数据,逐步解锁更多功能,最终实现通用机器人的商业化。
陈源培的技术路径和创业选择,展示了具身智能领域的前沿探索与商业化落地的紧密结合。他通过强化学习和分层模型,推动了机器人在开放环境下的自主决策和灵巧操作能力,为具身智能的未来发展提供了新的思路。
原文和模型
【原文链接】 阅读原文 [ 6682字 | 27分钟 ]
【原文作者】 AI科技评论
【摘要模型】 deepseek-v3
【摘要评分】 ★★★★★