标签:大模型
诺奖得主转投Anthropic,谷歌48小时连失两大牛,内部信仰崩塌?
谷歌在短短四十八小时内相继失去了两位人工智能领域的核心人物。Transformer奠基人之一、Gemini团队联席主管Noam Shazeer宣布离职并加入OpenAI担任架构研究负...
本周 AI 项目推荐:UXBench、MemLens、RoadmapBench…下一代模型,需要下一代 Benchmark
当前大模型的发展正经历评测标准的深刻转变,下一代基准测试的核心目标已从单纯评估模型的答题能力,转向衡量系统在真实世界中稳定执行任务的综合表现。未来...
Redis 之父为 DeepSeek 抱不平:美国 AI 圈又为“蒸馏”吵起来了
Redis之父Salvatore Sanfilippo近期在社交平台上强烈反驳了“中国AI模型依靠API蒸馏美国模型获取能力”的流行观点。他明确指出,经典的知识蒸馏需要访问教师模...
AI成绩单背后,藏着一位华人“出题人”
随着前沿大语言模型能力的快速提升,传统的MMLU等基准评测逐渐面临“旧考卷失灵”的困境,前沿模型准确率逼近满分,难以有效区分模型间的真实能力差距。为解决...
智谱创始人唐杰隔空对话马斯克:赶超Claude Fable 5不用等到2027年
近期,马斯克与智谱创始人唐杰围绕中美大模型差距问题展开了隔空对话。针对中国大模型何时达到国际领先水平的疑问,有技术专家认为目前智谱GLM-5.2与海外顶尖...
AI看病成为医患新包袱?补上「多轮追问」,通用AI才迈得过医疗关
随着公众越来越多地将症状和病历交由通用人工智能进行初步诊断,医患沟通成本显著增加,这凸显了通用大模型直接承担医疗判断的局限性。落地医疗场景的人工智...
Code Arena全球可用模型第一!智谱GLM-5.2上线并开源
智谱近期上线并开源了GLM-5.2大语言模型,在多项全球权威评估中表现卓越。在前端开发评估系统Code Arena及全球最大众包设计基准平台上,该模型均取得全球可用...
具身智能的“大平行理论”会成真吗?
具身智能领域正探讨是否能复刻大语言模型的快速发展路径,即通过大规模预训练建立世界理解并完成物理环境对齐。当前该领域在模型架构上存在显著分歧,视觉语...
最近听过最过瘾的推荐系统和 LLM 技术分享。
互联网核心的搜索、推荐和广告系统正全面进入大模型时代,经历着底层基础设施的重构。传统推荐系统依赖历史行为与统计相关性,面临模块独立、难以端到端优化...
DeepMind:Transformer存在拓扑缺陷,思维链治标不治本
当前大语言模型普遍采用思维链机制来提升推理能力,但这导致推理成本大幅上升。谷歌DeepMind的研究指出,Transformer架构本身存在不擅长追踪状态的结构性缺陷...




