计算效率 | 学习AIGC

从显式CoT到隐式CoT：复旦让AI告别啰嗦，实现大模型高效沉默推理

复旦大学与上海AI实验室联合团队提出的SIM-CoT（受监督隐式思维链）技术通过分步监督机制解决了隐式推理的稳定性问题。该方法在ICLR 2026被收录的论文中显示...

AIGC动态

2个月前

AGI只是硅谷的幻想？！AI科学家盛赞中国，并从物理学角度宣告我们永远造不出AGI

物理世界不存在魔法，AGI和超级智能的宏大叙事正在撞上一堵名为物理法则的墙。当前关于人工智能的讨论往往陷入抽象哲学误区，忽视了计算的物理实体性。这种思...

AIGC动态

3个月前

JanusVLN：双重隐式记忆解耦语义与空间，开创视觉语言导航记忆新范式

JanusVLN框架通过双重隐式神经记忆机制，实现了视觉语言导航（VLN）中语义与空间信息的有效解耦。传统VLN方法依赖显式记忆存储历史观测数据，面临空间信息损...

AIGC动态

4个月前

刚刚，Kimi开源新架构，开始押注线性注意力

在智能体时代，推理的计算需求成为核心瓶颈，标准注意力机制的低效问题日益凸显。线性注意力虽能降低计算复杂度，但受限于表达能力，在语言建模中表现历来不...

AIGC动态

5个月前

长文本生成迎来新突破：拓元智慧推出 DrDiff ，实现效率与质量双提升

DrDiff框架通过动态资源调度机制，解决了长文本生成中效率与质量难以兼得的根本性挑战。该框架由拓元智慧团队联合中山大学、阿里巴巴及Snap Inc的研究团队开...

AIGC动态

5个月前

Mamba 架构上顶会ICLR 2026，AI大脑核心Transformer的王座还能坐稳吗？

Transformer架构在AI大模型领域占据主导地位，但其计算复杂度和能源需求随着序列长度呈二次方增长，引发了关于其可持续性的讨论。为解决这一问题，Mamba系列...

AIGC动态

5个月前

冲上热搜！美团大模型，靠「快」火了

随着 AI 普及，模型厂商开始关注在保证准确性的前提下，如何以最少算力解决问题并快速给出回应，相关开源模型也逐渐增多。美团新开源的 LongCat - Flash - Ch...

AI-Agent

7个月前

DeepSeek发布最新论文，5大杀手锏让大模型训练、推理暴涨

全球著名开源大模型平台DeepSeek发布了其最新开源模型V3的论文，重点探讨了在不牺牲性能的前提下，如何通过硬件架构和模型设计的创新突破硬件瓶颈。随着OpenA...

AIGC动态

10个月前

GPT-4.5 发布！OpenAI 史上最大最贵也可能是最慢那个，全网都在骂大街啦

OpenAI发布了GPT-4.5模型，目前以“研究预览”形式面向Pro订阅用户（每月200美元）和API开发者开放。该模型被官方称为“迄今知识最丰富的模型”，但明确强调其并...

AIGC动态

1年前 (2025)

何恺明ResNet级神作，分形生成模型计算效率狂飙4000倍！清华校友一作

何恺明团队最近提出了一种名为「分形生成模型」的新型AI图像生成技术，该技术通过模拟自然界中的分形现象，实现了高分辨率逐像素建模，并显著提升了计算效率...

AIGC动态

1年前 (2025)

标签：计算效率

从显式CoT到隐式CoT：复旦让AI告别啰嗦，实现大模型高效沉默推理

AGI只是硅谷的幻想？！AI科学家盛赞中国，并从物理学角度宣告我们永远造不出AGI

JanusVLN：双重隐式记忆解耦语义与空间，开创视觉语言导航记忆新范式

刚刚，Kimi开源新架构，开始押注线性注意力

长文本生成迎来新突破：拓元智慧推出 DrDiff ，实现效率与质量双提升

Mamba 架构上顶会ICLR 2026，AI大脑核心Transformer的王座还能坐稳吗？

冲上热搜！美团大模型，靠「快」火了

DeepSeek发布最新论文，5大杀手锏让大模型训练、推理暴涨

GPT-4.5 发布！OpenAI 史上最大最贵也可能是最慢那个，全网都在骂大街啦

何恺明ResNet级神作，分形生成模型计算效率狂飙4000倍！清华校友一作

热门网址

标签：计算效率

Trae-AI IDE

讯飞星辰

讯飞文书-办公助手

有言AI-视频创作

热门网址