标签:强化学习

聚焦手机AI“超级入口”,中兴Nebula小模型让手机秒变“小秘”?

随着移动智能技术的快速发展,手机端AI“超级入口”成为行业竞争的新焦点。GUI Agent(图形用户界面智能体)凭借重塑流量分发格局的潜力,催生了千亿级市场机遇...

灵巧智能具身智能科学家陆逸文博士:物理一致的开源人手操作数据集

2025中国具身智能机器人大会(EAIRCon 2025)将于11月19日在深圳湾万丽酒店举办,这是智一科技在大湾区首次举办的机器人主题会议。大会以“具身启智 机器觉醒”...

L4大方向有了:理想自动驾驶团队,在全球AI顶会上揭幕新范式

人工智能技术正经历从依赖人类生成数据向体验式学习的范式转变,这一趋势在自动驾驶领域尤为明显。OpenAI前研究员姚顺雨提出AI已进入“下半场”,强调需要开发...

4倍速吊打Cursor新模型!英伟达数千GB200堆出的SWE-1.5,圆了Devin的梦!实测被曝性能“滑铁卢”?

Cognition公司近日推出高速AI编码模型SWE-1.5,该模型专为软件工程任务设计,现已在Windsurf代码编辑器中开放使用。通过与推理服务提供商Cerebras合作,SWE-1...

老黄亲自站台,英伟达编程神器!Cursor 2.0自研模型狂飙4倍

Cursor 2.0版本带来了多项重大升级,其中最引人注目的是首款自研编码模型Composer的发布。Composer的速度达到同等模型的4倍,专为低延迟智能编码设计,大部分...

让AI学习效率飙升50倍的秘密:在线策略蒸馏

Thinking Machines Lab的最新研究《On-Policy Distillation》提出了一种颠覆性的AI训练方法,旨在通过实时指导优化模型的学习过程。传统训练方式分为监督微调...

前Meta大神创业,用强化学习打造PokeeResearch-7B模型,刷新AI深度研究SOTA

Pokee AI近期发表的论文《借助基于AI反馈的强化学习和稳健推理框架实现高效深度研究》展示了其70亿参数模型PokeeResearch-7B的突破性表现。该模型通过创新的...

Meta用40万个GPU小时做了一个实验,只为弄清强化学习Scaling Law

在大型语言模型(LLM)领域,强化学习(RL)的算力扩展正成为关键研究范式,但其扩展规律尚未明确。Meta等机构的研究者通过40万GPU小时的实验,提出了可预测R...

Hassabis官宣用AI点燃「人造太阳」!无限能源时代加速到来

Google DeepMind与全球商业聚变能源公司CFS宣布合作,共同利用人工智能加速核聚变能源的开发。这一合作标志着AI技术正式进入核聚变科研的核心领域,旨在推动...

波士顿动力狗gogo回来了!“五条腿”协同发力

波士顿动力人工智能研究所的最新研究展示了机器狗Spot在动态全身操作任务中的突破性表现。Spot仅用3.7秒就能搬起重达15公斤的轮胎,相当于其自身重量的一半,...
1 2 3 22