标签:思维链

DeepMind:Transformer存在拓扑缺陷,思维链治标不治本

当前大语言模型普遍采用思维链机制来提升推理能力,但这导致推理成本大幅上升。谷歌DeepMind的研究指出,Transformer架构本身存在不擅长追踪状态的结构性缺陷...

HiDream-O1-Image-1.5 刷新国产图像生成模型纪录:砍掉 VAE,是图像模型的未来吗?

智象未来发布的HiDream-O1-Image-1.5文生图模型在Artificial Analysis榜单上跃升至第三位,展现出全球视觉生成大模型第一梯队的竞争力。通过与竞品的八维盲测...

AI真能学会心算?隐式思维链首次得到理论证明,Stuart Russell参与

当前AI推理模型在处理复杂任务时依赖显式思维链,逐个生成中间思考标记,导致推理延迟高且计算成本昂贵。为解决这一结构性问题,研究人员提出了隐式思维链技...

DeepSeek多模态新范式:一张图压缩7056倍,思考能力反超GPT和Claude

技术实现方面,研究基于DeepSeek-V4-Flash紧凑架构,采用压缩稀疏注意力机制对海量视觉信息进行极致压缩。一张图片的关键信息在模型缓存中仅占用约90个存储单...

进门CEO程建辉:做投研,AI越强大,人类越值钱

进门科技以金融投研为垂直场景,构建覆盖上市公司、券商研究所与专业投资者的闭环生态,其核心产品“AI进宝”已从辅助工具升级为具备任务执行能力的数字研究员...

从OpenClaw说起:Agentic AI时代CPU价值的回归

2026 年,轻量级 Agent 部署于 Mac Mini 等终端设备标志着 Agentic AI 时代的开启。AI 智能体区别于助理和 ChatBot 的核心在于自主性与目标导向,需具备感知...

从显式CoT到隐式CoT:复旦让AI告别啰嗦,实现大模型高效沉默推理

复旦大学与上海AI实验室联合团队提出的SIM-CoT(受监督隐式思维链)技术通过分步监督机制解决了隐式推理的稳定性问题。该方法在ICLR 2026被收录的论文中显示...

多模态思维链如何重塑 AI 与短视频的未来

快手高级算法专家文彬在AICon全球人工智能开发与应用大会上分享了Keye-VL多模态大模型的技术突破与应用实践。该模型通过多模态思维链技术实现了动态视频理解...

刚刚,OpenAI发布CoT监控,增强AI Agent自主能力

OpenAI最新发布的思维链(CoT)监控技术论文,旨在通过监督AI Agent等AI系统,增强其自主性。这一技术对于生产环境中的AI Agent尤为重要,尤其是在调试智能体...

将思维链(CoT)引入具身世界,哪种路径能真正打通机器人「知行合一」?

大模型处理复杂问题时,越来越倾向于生成推理链条,将问题拆解为多个环节逐步解决。支撑这一能力的核心技术是思维链(Chain of Thought, CoT),它从最初的提...
1 2 3