标签:模型训练

国内首个!具身数采「黑箱」正式开源,具身数据昂贵的时代结束了

自变量机器人公司近期开源了XRZero-G0项目,提供了一套涵盖无本体数据采集、质检、训练及真机评测的完整链路,并开放了包含2000多小时、覆盖3000个任务的多模...

AI真能学会心算?隐式思维链首次得到理论证明,Stuart Russell参与

当前AI推理模型在处理复杂任务时依赖显式思维链,逐个生成中间思考标记,导致推理延迟高且计算成本昂贵。为解决这一结构性问题,研究人员提出了隐式思维链技...

Anthropic全球警告!OpenAI已跨「可靠性阈值」:AI自我加速启动

Anthropic近期发出警告,指出AI正在加速自身发展,通往递归自我改进的路径或已浮现,呼吁减缓研究。与此同时,OpenAI后训练团队负责人Yann Dubois在访谈中揭...

Grok-5/MiniMax-M3爆料!更强的模型都在路上了

近期,人工智能领域在大语言模型的研发与应用方面取得了显著进展,其中Grok-5与MiniMax-M3两款新模型的动态备受瞩目。马斯克宣布,拥有1.5万亿参数的Grok-5已...

腾讯AI Lab绝唱:30B模型击败万亿旗舰,靠的是让AI学会「预习」

大模型智能体正经历从被动执行指令向具备自主演化能力的系统性转变。针对当前多轮推理场景高度依赖人工奖励机制、预设流程僵化且导致计算资源过度消耗的现状...

OpenAI公告正经解释:为什么GPT-5.5爱说“哥布林”

大型语言模型在版本迭代中逐渐频繁在回复中提及奇幻生物,引发技术界关注。OpenAI的技术复盘证实,该异常现象根源于模型人格功能引入的强化学习奖励机制。在...

Meta 开始记录员工每一次点击:AI 要接管工作,先监控会工作的人

技术采集与代理演进正在重塑工作流评估标准,但以削弱信任基础为代价的审计机制往往适得其反。产业观察表明,多家领先科技公司已同步开发具备自主交互能力的...

李飞飞团队新作:无需修改架构,重组数据即显著提升AI对视频理解能力

斯坦福大学、微软研究院和威斯康辛大学团队提出了一种名为VideoWeave的数据中心化方法,通过重组短视频素材显著提升了AI对长视频的理解能力,且无需增加计算...

烦人的内存墙

近年来,训练大型语言模型的计算需求呈指数级增长,但硬件性能的提升主要集中在峰值计算能力上,而内存带宽的增长速度远远落后。这种差距导致内存成为人工智...

具身智能数据战开打!每个普通人都能上手,边采边筛,只投喂机器人爱吃的丨穹彻

RoboPocket是一款由具身智能创企穹彻智能开发的便携式数据采集系统,通过手机和夹爪组合实现随时随地采集具身智能数据。采出的数据质量高,已在模型训练中验...
1 2 3 6