标签:数据集
打造图像编辑领域的ImageNet?苹果用Nano Banana开源了一个超大数据集
苹果公司在开放研究领域取得突破性进展,发布了Pico-Banana-400K数据集,这是视觉编辑领域首个基于真实图像的大规模开放数据集。该数据集包含40万张图像,通...
零样本「即插即用」!智源开源RoboBrain-X0,一个基座模型开动不同机器人
智源研究院在2025机器人学习大会上开源了通用「小脑基座」RoboBrain-X0,旨在解决机器人行业「一机一调」的开发困境。该模型通过预训练即可实现零样本跨本体...
AI胡说八道这事,终于有人管了?
AI大模型的幻觉问题在高风险领域应用中愈发棘手,现有幻觉检测技术存在局限,而苏黎世联邦理工学院和MATS的新研究提出了低成本、可扩展的检测方法。揭示幻觉...
浙大叶琦:建立机器人 Benchmark,为算法提供公平「竞技场」
未来机器人的操作重心将超越单纯的“拾取与放置”,更注重“拾取”后的任务执行。叶琦,一位从计算机视觉转向机器人领域的研究者,见证了机器人技术的快速发展。...
英伟达开源15T数据集:32万个机器人训练轨迹
英伟达近日开源了其超大训练数据合集——NVIDIA Physical AI Dataset,这一数据集规模达到15T,涵盖了超过320,000个机器人训练轨迹和1,000个通用场景描述,并包...
CVPR 2025:长Prompt对齐问题也能评估了!当前最大AIGC评估数据集,模型评分超越当前SOTA
CVPR 2023年共收到13008份有效投稿,最终录用2878篇,录用率为22.1%。多模态相关内容仍然是今年研究的重点。上海交通大学-美团计算与智能联合实验室的论文被...
智元曝光「机器人大模型」,但真正的核心,并不是机器人!
智元机器人近期发布的通用具身基座大模型GO-1,标志着机器人行业迈向了一个新的里程碑。GO-1的核心优势在于其强大的泛化能力和极简学习机制,能够在极少数据...
“李飞飞团队 50 美元炼出 DeepSeek R1”被质疑,上海交大本科生新“低成本推理”或成新宠!
斯坦福大学和华盛顿大学的研究人员开发了一个名为 s1 的人工智能推理模型,该模型以不到 50 美元的云计算成本成功训练而成,并在数学和编码能力测试中表现出...
清华、东大等发布EMAGE,音频自动生成动作丰富的视频
研究人员联合开发了EMAGE模型,这是一种能够根据音频自动生成全身动作、面部表情和手势的创新工具。其主要功能是生成连贯且逼真的共语手势视频,适用于数字人...
16张H100训26分钟,超越o1-preview!李飞飞等用1K样本,揭秘测试时Scaling
提升大模型推理性能通常依赖于大量数据和算力,但李飞飞团队提出了一种新方法,仅使用1000个样本进行微调,并引入预算强制技术(budget forcing),在测试时...





