人大高瓴赵鑫团队新作:先拆掉 RLVR,再重建推理模型训练

当大语言模型开始被要求解数学题、写证明、规划任务流程,人们才真正意识到一件事:会生成并不等于会推理。过去几年,行业通过扩大模型规模和采用RLHF等技术...

有人提前五年,预判了 OpenAI 的预判。

Sam Altman在访谈中将现代手机使用体验比作置身纽约时代广场,充斥着各种干扰和注意力争夺。他认为当前手机形态本质上是一个不断打断用户的设备,每个应用都...

这场对话,藏着2026年AI和科技行业最重要的10个判断

四位硅谷核心人物在All-In Podcast中针对2026年科技与经济发展提出了十项关键预测。SpaceX可能通过反向合并方式并入特斯拉,形成涵盖制造、通信与AI的完整技...

火爆全网的《卢浮宫小猫》AI视频万字创作心得分享,这可能是他们最毫无保留的一次。

数字艺术家海辛和阿文在直播中详细分享了他们为浦东美术馆创作的AI视频作品《卢浮宫小猫》的全流程制作经验。作为曾创作过《故宫猫上班记》《文明小猫游浦东...

Zed 为什么不用自己造 Agent?OpenAI 架构师给出答案:Codex 重划 IDE × Coding Agent 的分工边界

Coding agents(编码智能体)已成为应用型AI最活跃的领域之一,但基础设施的脆弱性成为行业迭代的瓶颈。OpenAI提出的'模型与Harness(工具集)共同构建'模式...

美团上线首个开源“重思考”模型

美团LongCat团队近日开源了升级版AI模型LongCat-Flash-Thinking-2601,该模型在智能体搜索、工具调用及工具交互推理等核心评测基准上达到开源模型领先水平。...

用2D先验自动生成3D标注,自动驾驶、具身智能有福了丨IDEA团队开源

3D实例分割技术长期以来面临训练数据稀缺和标注成本高昂的挑战,这限制了其在自动驾驶、智能家居等领域的应用。传统方法依赖人工标注3D掩码,不仅耗时且难以...

我们对 Coding Agent 的评测,可能搞错了方向

当前对 Coding Agent 的评测存在方向性偏差,用户不满的核心并非功能缺失,而是过程规范遵循的失败。典型场景包括无视禁用emoji的提示、违反先备份后修改的指...

顶级视频模型半衰期只有 30 天,但生成式媒体 infra 公司的收入却在一年增长了 60 倍

在生成式媒体领域,算力需求呈现出指数级增长的特点。处理一个大型语言模型(LLM)的单个Prompt(约200 Token)所需的算力若定义为1个单位,生成一张高质量图...

Claude Code从来就不是什么编程工具

Anthropic近期发布的Claude Code及其衍生品Cowork揭示了人工智能领域一个关键转折点。这款最初以编程工具形态问世的产品,本质上是一个通用AI助手,其设计哲...
1 2 3 4 5 1,188