标签:大模型

一文总结2026火山引擎FORCE大会 – 向Coding和Agent全面进军。

伴随基础模型的升级,豆包专业版推出了全新的办公模式。底座模型智能体能力的提升,使得该办公模式能够出色执行复杂的通用办公任务,实现了从底层模型到上层...

微信推了 AI 助手「小微」,它会成为 AI 大模型的战场吗?

微信近期低调测试了原生AI助手“小微”,该助手能够通过文字或语音操作微信原生功能、调起小程序并完成各类生活服务,展现出成为互联网超级入口的潜力。小微背...

DeepSeek-OCR推进一大步!百度Unlimited-OCR将KV cache压成常数,性能SOTA

百度推出的Unlimited-OCR模型成功将端到端光学字符识别技术提升至新高度,有效解决了长文档解析中的工作记忆难题。当前主流大语言模型在处理长序列时面临KV c...

GAIR Paper 103|上海交大联合腾讯提出 Token 级别幻觉优化,实现大模型幻觉精准消除

大语言模型在医疗、金融等高风险场景部署时面临严重的幻觉问题。先导实验揭示,幻觉在词元层面极其稀疏,但在回答层面却非常普遍。传统的响应级强化学习方法...

GPT-5.6倒计时:放弃单一API幻想,算力迭代再快也敌不过一纸合规

全球AI产业底层运行逻辑已发生实质性重构,正式步入受控闭源与本地开源并存的“双轨制”阶段。在这一进程中,大模型的“可用性”权重实质性超越“先进性”,合规与...

诺奖得主转投Anthropic,谷歌48小时连失两大牛,内部信仰崩塌?

谷歌在短短四十八小时内相继失去了两位人工智能领域的核心人物。Transformer奠基人之一、Gemini团队联席主管Noam Shazeer宣布离职并加入OpenAI担任架构研究负...

本周 AI 项目推荐:UXBench、MemLens、RoadmapBench…下一代模型,需要下一代 Benchmark

当前大模型的发展正经历评测标准的深刻转变,下一代基准测试的核心目标已从单纯评估模型的答题能力,转向衡量系统在真实世界中稳定执行任务的综合表现。未来...

Redis 之父为 DeepSeek 抱不平:美国 AI 圈又为“蒸馏”吵起来了

Redis之父Salvatore Sanfilippo近期在社交平台上强烈反驳了“中国AI模型依靠API蒸馏美国模型获取能力”的流行观点。他明确指出,经典的知识蒸馏需要访问教师模...

AI成绩单背后,藏着一位华人“出题人”

随着前沿大语言模型能力的快速提升,传统的MMLU等基准评测逐渐面临“旧考卷失灵”的困境,前沿模型准确率逼近满分,难以有效区分模型间的真实能力差距。为解决...

智谱创始人唐杰隔空对话马斯克:赶超Claude Fable 5不用等到2027年

近期,马斯克与智谱创始人唐杰围绕中美大模型差距问题展开了隔空对话。针对中国大模型何时达到国际领先水平的疑问,有技术专家认为目前智谱GLM-5.2与海外顶尖...
1 2 3 96