大模型

LLM,VLM,模型

揭秘DeepSeek R1-Zero训练方式,GRPO还有极简改进方案

DeepSeek-V3-Base 在强化学习调优之前已经展现出「顿悟时刻」,这一现象引发了研究人员对预训练特性如何影响强化学习性能的深入探讨。研究发现,DeepSeek-V3-...

强化学习也涌现?自监督RL扩展到1000层网络,机器人任务提升50倍

普林斯顿大学与华沙理工的研究表明,将对比强化学习(CRL)扩展到1000层可以显著提升性能,在某些机器人任务中性能提升高达50倍。这一发现挑战了传统观点,即...

王兴首次谈AI:美团的策略是进攻而非防守,今年将推AI生活助手|钛媒体AGI

美团创始人、CEO王兴首次对外披露了公司的AI战略,强调美团在AI领域的策略是“进攻而非防守”。王兴表示,AI具有根本性的革命潜力,将改变、颠覆或改造每个行业...

跟硅谷创业者聊 Agent:今年创业做 Agent,技术卡点在哪里?

3月份发布的Manus标志着Agent技术的首次大众化体验,R1、o3等推理模型的发布为Agent的发展奠定了技术基础。2025年被广泛认为是Agent技术的元年,但其发展仍面...

追觅扫地机器人逆天进化!机械手+具身大模型「长」出大脑,家庭清洁走向3D空间

追觅公司推出的新型扫地机器人通过仿生多关节机械手和具身智能大模型的结合,彻底改变了家庭服务机器人的形态和功能。这款机器人不仅能够完成传统的清洁任务...

Idea撞车何恺明「分形生成模型」!速度领先10倍,性能更强

澳大利亚国立大学的研究团队提出了一种全新的图像生成模型ARINAR,该模型在生成质量和速度上均取得了显著提升。ARINAR全称为双层自回归逐特征生成模型,其核...

英伟达团队发布最新具身模型 Cosmos-Reason1,在物理世界推理中碾压 Qwen、GPT-4o 等多个 VLM 模型

英伟达团队在GTC大会上发布了新的物理世界大模型Cosmos-Reason1,该模型专注于提升AI系统与物理世界交互的推理能力。作为Cosmos系列的一部分,Cosmos-Reason1...

万字探讨Agent发展真方向:模型即产品,Agent的未来要靠模型而不是Workflow

Alexander Doria,知名 AI 工程师和 Pleias 的联合创始人,近期发表了两篇文章,深入探讨了 AI 智能体的未来发展方向。他明确指出,未来的 AI 智能体将依赖于...

a16z详解MCP,以及AI工具的未来

模型上下文协议(MCP)作为一种新兴的开放协议,正在改变人工智能与外部工具的交互方式。该协议的核心在于为AI模型提供了一种标准化的接口,使其能够调用外部...

视频可以精准控制了!一句话给熊戴眼镜的那种,扩散模型立功,浙大悉尼科技大学出品 | ICLR 2025

随着视频生成技术的快速发展,视频编辑作为其中的一个重要方向,逐渐成为研究热点。然而,传统的视频编辑方法通常局限于风格转换或单一目标的编辑,难以满足...
1 55 56 57 58 59 586