标签:模型推理

KV Cache终于不用无脑全留了!百度&复旦用「投资回报率」重新分配缓存|ICML 2026

随着人工智能应用中模型单次处理的上下文长度不断增加,键值缓存的内存占用随序列长度线性增长,成为制约推理效率和吞吐能力的瓶颈。当前主流的缓存压缩方案...

国产GPU组了个开源局,把SGLang等核心开发者都摇来了!

在底层软件平台设计层面,新型架构采用统一标准与多层兼容机制,最大程度保留了开发者的原有编程范式,有效规避了高昂的代码迁移成本。通过提供透明的兼容接...

绝杀!OpenAI正式接管人类耳朵,首个GPT-5级推理音频模型来了

伴随核心模型的发布,GPT-Realtime-Translate与GPT-Realtime-Whisper进一步构建了完整的实时音频处理生态。翻译模块覆盖数十种语言的输入与输出,在保持高准...

腾讯混元团队最新研究:让 AI 从「固定模型」走向「实时适配系统」

传统机器学习系统通常假设模型训练完成后参数固定,但这在处理多样性和冲突性任务时存在局限。腾讯混元团队提出的 HY-WU 方法改变了这一范式,让模型在推理阶...

真·开外挂!MIT新研究:架构0改动,让大模型解锁千万级上下文

MIT CSAIL研究团队提出了一种名为递归语言模型(RLM)的创新方法,旨在解决大模型处理超长文本时的上下文腐烂问题。该方法无需修改模型架构或升级模块设计,...

我MiniMax,用实习生处理数据,照样屠榜开源大模型

MiniMax M2开源大模型凭借其独特的技术路径和出色的实际表现成为社区焦点。该模型在香港大学AI-Trader模拟A股大赛中以10万本金20天盈利近3000元的成绩夺冠,...

梁文锋执笔的R1论文登上Nature封面!首次回应外界三大质疑

9月17日,开源AI“顶流”DeepSeek的推理模型研究论文DeepSeek - R1以通讯作者梁文锋的名义发表于国际顶尖期刊《自然》并登上封面,标志国产AI研究迈入世界舞台...

RL 是推理神器?清华上交大最新研究指出:RL 让大模型更会 「套公式」,却不会真推理

清华和上交的最新研究对当前“纯强化学习(RL)有利于提升模型推理能力”的主流观点提出了质疑。通过一系列实验,研究者发现引入强化学习的模型在某些任务中的...

强化学习Scaling Law错了?无需蒸馏,数据量只要1/6,效果还更好

研究团队通过系统分析揭示了强化学习训练中数据质量与模型推理能力提升的内在关联。核心发现表明,训练样本的质量和相关性远比数量重要,这一结论对传统认知...

​Ben Thompson聊DeepSeek,硅谷关于DeepSeek最值得看的一篇

Ben Thompson在其博客Stratechery中深入分析了DeepSeek的技术细节及其对科技行业的影响。DeepSeek的V3模型通过技术创新显著降低了AI模型的训练成本,对行业产...
1 2