强化学习 | 第 4 页

聚焦手机AI“超级入口”，中兴Nebula小模型让手机秒变“小秘”？

随着移动智能技术的快速发展，手机端AI“超级入口”成为行业竞争的新焦点。GUI Agent（图形用户界面智能体）凭借重塑流量分发格局的潜力，催生了千亿级市场机遇...

AI-Agent

4个月前

灵巧智能具身智能科学家陆逸文博士：物理一致的开源人手操作数据集

2025中国具身智能机器人大会（EAIRCon 2025）将于11月19日在深圳湾万丽酒店举办，这是智一科技在大湾区首次举办的机器人主题会议。大会以“具身启智机器觉醒”...

AIGC动态

4个月前

L4大方向有了：理想自动驾驶团队，在全球AI顶会上揭幕新范式

人工智能技术正经历从依赖人类生成数据向体验式学习的范式转变，这一趋势在自动驾驶领域尤为明显。OpenAI前研究员姚顺雨提出AI已进入“下半场”，强调需要开发...

AIGC动态

5个月前

4倍速吊打Cursor新模型！英伟达数千GB200堆出的SWE-1.5，圆了Devin的梦！实测被曝性能“滑铁卢”？

Cognition公司近日推出高速AI编码模型SWE-1.5，该模型专为软件工程任务设计，现已在Windsurf代码编辑器中开放使用。通过与推理服务提供商Cerebras合作，SWE-1...

AIGC动态

5个月前

老黄亲自站台，英伟达编程神器！Cursor 2.0自研模型狂飙4倍

Cursor 2.0版本带来了多项重大升级，其中最引人注目的是首款自研编码模型Composer的发布。Composer的速度达到同等模型的4倍，专为低延迟智能编码设计，大部分...

AIGC动态

5个月前

让AI学习效率飙升50倍的秘密：在线策略蒸馏

Thinking Machines Lab的最新研究《On-Policy Distillation》提出了一种颠覆性的AI训练方法，旨在通过实时指导优化模型的学习过程。传统训练方式分为监督微调...

AIGC动态

5个月前

前Meta大神创业，用强化学习打造PokeeResearch-7B模型，刷新AI深度研究SOTA

Pokee AI近期发表的论文《借助基于AI反馈的强化学习和稳健推理框架实现高效深度研究》展示了其70亿参数模型PokeeResearch-7B的突破性表现。该模型通过创新的...

AIGC动态

5个月前

Meta用40万个GPU小时做了一个实验，只为弄清强化学习Scaling Law

在大型语言模型（LLM）领域，强化学习（RL）的算力扩展正成为关键研究范式，但其扩展规律尚未明确。Meta等机构的研究者通过40万GPU小时的实验，提出了可预测R...

AIGC动态

5个月前

Hassabis官宣用AI点燃「人造太阳」！无限能源时代加速到来

Google DeepMind与全球商业聚变能源公司CFS宣布合作，共同利用人工智能加速核聚变能源的开发。这一合作标志着AI技术正式进入核聚变科研的核心领域，旨在推动...

AIGC动态

5个月前

波士顿动力狗gogo回来了！“五条腿”协同发力

波士顿动力人工智能研究所的最新研究展示了机器狗Spot在动态全身操作任务中的突破性表现。Spot仅用3.7秒就能搬起重达15公斤的轮胎，相当于其自身重量的一半，...

AIGC动态

5个月前

标签：强化学习

聚焦手机AI“超级入口”，中兴Nebula小模型让手机秒变“小秘”？

灵巧智能具身智能科学家陆逸文博士：物理一致的开源人手操作数据集

L4大方向有了：理想自动驾驶团队，在全球AI顶会上揭幕新范式

4倍速吊打Cursor新模型！英伟达数千GB200堆出的SWE-1.5，圆了Devin的梦！实测被曝性能“滑铁卢”？

老黄亲自站台，英伟达编程神器！Cursor 2.0自研模型狂飙4倍

让AI学习效率飙升50倍的秘密：在线策略蒸馏

前Meta大神创业，用强化学习打造PokeeResearch-7B模型，刷新AI深度研究SOTA

Meta用40万个GPU小时做了一个实验，只为弄清强化学习Scaling Law

Hassabis官宣用AI点燃「人造太阳」！无限能源时代加速到来

波士顿动力狗gogo回来了！“五条腿”协同发力

热门网址

标签：强化学习

Trae-AI IDE

讯飞星辰

讯飞文书-办公助手

有言AI-视频创作

热门网址