标签:大模型
Redis 之父为 DeepSeek 抱不平:美国 AI 圈又为“蒸馏”吵起来了
Redis之父Salvatore Sanfilippo近期在社交平台上强烈反驳了“中国AI模型依靠API蒸馏美国模型获取能力”的流行观点。他明确指出,经典的知识蒸馏需要访问教师模...
AI成绩单背后,藏着一位华人“出题人”
随着前沿大语言模型能力的快速提升,传统的MMLU等基准评测逐渐面临“旧考卷失灵”的困境,前沿模型准确率逼近满分,难以有效区分模型间的真实能力差距。为解决...
智谱创始人唐杰隔空对话马斯克:赶超Claude Fable 5不用等到2027年
近期,马斯克与智谱创始人唐杰围绕中美大模型差距问题展开了隔空对话。针对中国大模型何时达到国际领先水平的疑问,有技术专家认为目前智谱GLM-5.2与海外顶尖...
AI看病成为医患新包袱?补上「多轮追问」,通用AI才迈得过医疗关
随着公众越来越多地将症状和病历交由通用人工智能进行初步诊断,医患沟通成本显著增加,这凸显了通用大模型直接承担医疗判断的局限性。落地医疗场景的人工智...
Code Arena全球可用模型第一!智谱GLM-5.2上线并开源
智谱近期上线并开源了GLM-5.2大语言模型,在多项全球权威评估中表现卓越。在前端开发评估系统Code Arena及全球最大众包设计基准平台上,该模型均取得全球可用...
具身智能的“大平行理论”会成真吗?
具身智能领域正探讨是否能复刻大语言模型的快速发展路径,即通过大规模预训练建立世界理解并完成物理环境对齐。当前该领域在模型架构上存在显著分歧,视觉语...
最近听过最过瘾的推荐系统和 LLM 技术分享。
互联网核心的搜索、推荐和广告系统正全面进入大模型时代,经历着底层基础设施的重构。传统推荐系统依赖历史行为与统计相关性,面临模块独立、难以端到端优化...
DeepMind:Transformer存在拓扑缺陷,思维链治标不治本
当前大语言模型普遍采用思维链机制来提升推理能力,但这导致推理成本大幅上升。谷歌DeepMind的研究指出,Transformer架构本身存在不擅长追踪状态的结构性缺陷...
年入40亿美元,AI编程「印钞机」Cursor被马斯克收编;ChatGPT市占率首次跌破50%,GPT-5.6发布在即;Snap推出首款独立AR眼镜丨硅谷大事件
在人工智能领域的并购与市场竞争方面,SpaceX以600亿美元收购AI编程工具Cursor,补足编码短板并获取B端销售渠道,这一创纪录的并购标志着独立AI编程工具的黄...
腾讯Robotics X开源HyVLA-0.5:基于亚毫米级指套UMI与真机强化,摆脱繁重遥操
腾讯联合多个团队发布了面向真实世界机器人操作任务的端到端具身智能模型HyVLA-0.5。该模型基于自研的高精度指套式数据采集软硬件,构建了超过一万小时的人类...




