港科广陈昶昊团队：只用一张 RGB 图像，让机器读懂室内 3D 空间丨CVPR 2026

AIGC动态2个月前发布 aitechtalk

340 0 0

港科广陈昶昊团队：只用一张 RGB 图像，让机器读懂室内 3D 空间丨CVPR 2026

文章摘要

【关键词】 占用预测、开放词汇、具身智能、单目视觉、高斯模型

定量评估结果显示，在零三维语义标签注入条件下，该算法斩获59.50的几何交并比与21.05的语义均分，基础占据预测精度已超越传统闭集基线，且单卡推理帧率实现大幅提升。实际测试层面，系统能够精准定位非预设训练类别的长尾细碎物件，展现出极强的开放场景泛化能力。受限于单目深度估计固有误差及二维先验模型质量，其细粒度语义对齐仍存在优化空间，但整体路径已充分验证了轻量级监督训练在复杂场景中的高效性。这项研究成功打通了低标注成本与高阶三维认知间的链路，为具身智能系统在真实家居环境中落地自然语言交互提供了核心算法支撑。

原文和模型

【原文链接】 阅读原文 [ 4905字 | 20分钟 ]
【原文作者】 AI科技评论
【摘要模型】 qwen3.6-plus
【摘要评分】 ★☆☆☆☆

阿里云百炼

大模型服务平台是阿里云基于通义大模型等多种大模型的一站式大模型开发平台。

# AIGC动态 # AI大模型 # 图像生成 # 具身智能 # 单目视觉 # 占用预测 # 开放词汇 # 高斯模型

© 版权声明

文章版权归作者所有，未经允许请勿转载。

xunfeiagent

相关文章

宇树、云深处和乐聚：三份招股书，一条生存线

钛媒体AGI

368

超6.4亿次下载！智源发布具身大脑等五大新技术，王仲远：具身智能的淘汰赛还没开始

钛媒体AGI

2,615

刚上完春晚，宇树新品机器狗就亮相了

机器之心

767

Agent终于长出了身体：Jiuwen Symbiosis背后的思考与实践

量子位

326

超700亿地方政府基金投向人形机器人，打脸朱啸虎“批量退出”论｜钛媒体AGI

钛媒体AGI

2,949

当世界模型开始“指挥双手”，蚂蚁灵波的具身路线更清晰了

硅星人Pro

1,046

trae

暂无评论

暂无评论...