长上下文 | 学习AIGC

全球首个英伟达含量为0的万亿模型，成了海外开发者的抢手货

美团近期推出LongCat-2.0模型，该模型采用混合专家架构，总参数规模达到1.6万亿，原生支持100万超长上下文。这是首个在国产算力上实现从训练到推理全链路闭环...

AIGC动态

1周前

杀上闭源前沿，国产最强已经无法满足 GLM-5.2 了

为了验证实际生产力，通过执行包含近两百万token的185篇论文整理与知识图谱网站生成任务进行了深度实测。实测表明，GLM-5.2展现出卓越的长链路任务保持、大规...

AIGC动态

2周前

Code Arena全球可用模型第一！智谱GLM-5.2上线并开源

智谱近期上线并开源了GLM-5.2大语言模型，在多项全球权威评估中表现卓越。在前端开发评估系统Code Arena及全球最大众包设计基准平台上，该模型均取得全球可用...

AIGC动态

4周前

KV Cache终于不用无脑全留了！百度&复旦用「投资回报率」重新分配缓存｜ICML 2026

随着人工智能应用中模型单次处理的上下文长度不断增加，键值缓存的内存占用随序列长度线性增长，成为制约推理效率和吞吐能力的瓶颈。当前主流的缓存压缩方案...

AIGC动态

4周前

模型也需要「睡觉」？CMU新论文让LLM在梦中「巩固记忆」

大语言模型在处理长上下文任务时面临显存占用高、推理速度慢以及细节记忆丢失等问题。为解决这一困境，研究人员受动物睡眠期间记忆巩固过程的启发，提出了一...

AIGC动态

1个月前

硅谷CEO深夜站台！MiniMax M3冲上开源第一，中文社区却吵翻了？

在多项极限测试中，M3展现出卓越的综合实力。在代码生成与多模态理解方面，M3能够流畅生成复杂动画代码，并在极低消耗下完成长逻辑代码编写。面对长达五十页...

AIGC动态

1个月前

MiniMax M3来了：编程超 GPT-5.5，即将开源

MiniMax近期发布了M3大语言模型，该模型在编程、百万上下文和原生多模态三个核心方向上均达到了国际前沿水平，并且即将开源。作为国内首个齐备图片与视频输入...

AIGC动态

1个月前

超越 TurboQuant! OSCAR：面向真实 Serving 的 2bit KV Cache量化

长上下文模型在在线推理服务中面临KV Cache带来的显存容量和带宽压力。OSCAR方案旨在通过面向长上下文服务的近2-bit KV Cache量化技术，解决低比特压缩后模型...

AIGC动态

2个月前

大模型也需要睡觉！让AI打个盹，醒来更聪明

卡内基梅隆大学和马里兰大学的研究团队提出了一种旨在提升大语言模型处理长上下文和复杂逻辑能力的新机制。研究表明，大语言模型在面对长上下文和深度推理任...

AIGC动态

2个月前

LLM近期重大架构进化一览：从Gemma 4到DeepSeek V4

随着大模型上下文窗口不断扩展，KV缓存膨胀与注意力计算成本飙升已成为制约长序列推理的核心瓶颈。近期多款主流开源模型的架构演进表明，降低长上下文推理的...

AIGC动态

2个月前

标签：长上下文

全球首个英伟达含量为0的万亿模型，成了海外开发者的抢手货

杀上闭源前沿，国产最强已经无法满足 GLM-5.2 了

Code Arena全球可用模型第一！智谱GLM-5.2上线并开源

KV Cache终于不用无脑全留了！百度&复旦用「投资回报率」重新分配缓存｜ICML 2026

模型也需要「睡觉」？CMU新论文让LLM在梦中「巩固记忆」

硅谷CEO深夜站台！MiniMax M3冲上开源第一，中文社区却吵翻了？

MiniMax M3来了：编程超 GPT-5.5，即将开源

超越 TurboQuant! OSCAR：面向真实 Serving 的 2bit KV Cache量化

大模型也需要睡觉！让AI打个盹，醒来更聪明

LLM近期重大架构进化一览：从Gemma 4到DeepSeek V4

热门网址

标签：长上下文

AstronClaw

LibTV-AI视频创作

AI大学堂

热门网址