标签:大模型
大模型训练省钱秘籍:清华POPO一招组级回放,把浪费的算力全部捡回来
在大模型可验证奖励强化学习(RLVR)的后训练过程中,让模型生成多条长链推理回答的成本极其高昂。当同一提示词下的多条回答全部正确或全部错误时,其奖励方...
OpenAI塌房!Scaling law原作曝bug,万亿算力全白烧
OpenAI在2020年提出的规模法则曾主导全球人工智能行业的发展方向,其核心结论是在固定算力下应优先扩大模型参数量。然而,前OpenAI研究员指出该原始论文存在...
清华特奖获得者顾煜贤,加入DeepSeek
DeepSeek近期在算法、研发、产品等多个核心部门展开大规模人才招聘,同时其V4正式版模型即将于本月中旬上线。清华大学计算机系博士生顾煜贤已正式加入DeepSee...
年入1亿美元!两个90后伯克利室友,搞出最赚钱的AI生意
UC伯克利团队发起的开源研究项目Chatbot Arena,现已发展为全球AI大模型评测的核心平台Arena。该平台通过用户真实盲测和投票机制,生成具有极高含金量的Elo式...
别争了!香农老婆,才是世界上第一个大语言模型
香农与其妻子在1950年前后进行的猜字母实验,被视为人类历史上最早的真人版下一个词元预测。在该实验中,可预测的字母被省略,不可预测的字母被保留,直观地...
GTC四大天王:成为黄仁勋座上宾的四位90后华人青年
观察英伟达创始人在重大活动中的核心座上宾,可洞察当前人工智能产业的前沿发展趋势。近年来,四位年轻的华人创业者杨植麟、王兴兴、王鹤和朱毅鑫成为产业焦...
异构Token工厂不再踩坑!多机构联合发布工业级设计实践,拆解跨硬件推理服务的核心边界
随着大模型推理面临成本与算力约束,Prefill-Decode分离的异构推理成为生产落地的必然选择。但硬件、量化精度、网络与缓存存储选型互相耦合,业界缺乏统一设...
Anthropic 公告里最刺眼的 3 个名字,有 1 家中国模型
近期,全球人工智能市场格局发生显著变化,中国大语言模型正加速从“廉价替代品”向“优质技术供给”转型,并在海外市场实现了重要突破。随着中国模型性价比与技...
百度基础模型换将,这一次把牌交给年轻人
选择孙天祥的主要原因在于其具备完整的大模型实战经验与产业化视野。他在博士期间曾主导类ChatGPT开源大模型的研发,并在国际上提出模型即服务的相关概念,完...
Claude Fable 5解禁,Sonnet 5发布,但各种骚操作封禁中国用户
近期,Anthropic在大模型发布与出口管制方面有一系列动作,同时其客户端的安全检测机制引发了关于隐私与信任的广泛争议。在模型发布与解禁方面,美国商务部解...


