标签:大模型

对话Teeni.AI袁琳:AI儿童硬件的善意,是蹲下来与孩子对话

袁琳作为连续创业者和两个10后孩子的母亲,凭借双重身份的敏锐直觉,带领Teeni.AI全面转向青少年AI智能体领域。她认为“AI对10后来说,就像互联网对我们这代人...

斯坦福英伟达推出测试时强化学习:微调开源模型胜过顶级闭源模型,仅需几百美元

斯坦福大学、英伟达等机构的研究团队提出了一种名为TTT-Discover的创新方法,为大模型的持续学习开辟了新路径。该方法基于开源模型gpt-oss-120b,在数学、算...

美团智能体SOTA模型LongCat-Flash-Thinking-2601开源

美团龙猫团队开发的LongCat-Flash-Thinking-2601模型标志着智能体推理能力的重大突破。这个总参数5600亿、激活参数270亿的混合专家模型(MoE),在代理搜索、...

DeepSeek-R1推理智能从哪儿来?谷歌新研究:模型内心多个角色吵翻了

过去两年,大模型的推理能力经历了显著跃迁,尤其在数学、逻辑和多步规划等复杂任务上,推理模型如OpenAI的o系列、DeepSeek-R1和QwQ-32B已稳定超越传统指令微...

马化腾内部员工大会安利「元宝派」新玩法,结合腾讯优势开启AI社交新赛道

腾讯在2026年员工大会上明确了其AI战略的稳健路线,强调保持定力并专注自身节奏。董事会主席兼首席执行官马化腾指出,腾讯混元大模型在过去一年经历了深度重...

2.4万亿参数“最强文科生”,文心5.0正式版,你挺懂山东人啊?

文心大模型5.0正式版的发布标志着国产AI技术进入全球第一梯队。参数量高达2.4万亿的原生全模态架构使其在语言、视觉、音频等多领域展现出卓越性能。LMArena竞...

大模型Infra新突破!腾讯混元开源LLM推理算子库,推理吞吐提升30%

腾讯混元AI Infra团队开源了生产级高性能LLM推理核心算子库HPC-Ops,该库通过底层架构创新和指令级优化,显著提升了大模型推理效率。在真实场景测试中,混元...

清华教授翟季冬:Benchmark正在「失效」,智能路由终结大模型选型乱象

「选择悖论」正在AI模型与算力领域显现。随着大模型参数激增、算力成本下降,用户的实际落地负担却日益加重。翟季冬教授指出,Benchmark的高分未必能匹配真实...

首个真正“能用”的LLM游戏Agent诞生!可实时高频决策,思维链还全程可见

近期,一个名为“快递员”的神秘游戏账号在51小时内以93%的胜率登顶韩服《英雄联盟》,引发全网对AI参与竞技游戏的广泛讨论。尽管其身份尚未确认,但这一事件凸...

人大高瓴赵鑫团队新作:先拆掉 RLVR,再重建推理模型训练

当大语言模型开始被要求解数学题、写证明、规划任务流程,人们才真正意识到一件事:会生成并不等于会推理。过去几年,行业通过扩大模型规模和采用RLHF等技术...
1 2 3 73