标签:大模型
天津大学牵头「拧干」RLVR「低效海绵」:ICLR 2026新作ReMix 让样本效率暴涨 30–450 倍
随着大语言模型在复杂推理任务中的广泛应用,强化学习已成为激发其深度思考潜力的核心范式。然而,当前主流的强化微调方法普遍面临严重的样本效率瓶颈,导致...
全球首个大模型在轨部署:中国太空算力解锁“软硬一体”
把大模型送上太空,这件事正在从科幻变成现实。2025年11月,中国科技企业国星宇航成功将千问大模型Qwen3实时部署到在轨卫星上,完成全球首次通用大模型的在轨...
阿里官宣自研AI芯片,“通云哥”成AI时代梦之队
阿里平头哥正式发布高端AI芯片“真武810E”,标志着国产芯片技术迈入国际顶尖梯队。该芯片整体性能对标英伟达H20,累计出货量达数十万片,超越寒武纪成为国产GP...
最强开源机器人大脑!蚂蚁两万小时真机数据开启物理AI缩放定律
蚂蚁集团开源的具身智能基座模型LingBot-VLA标志着机器人学习领域的重要突破。该模型通过两万小时真机数据验证了机器人学习存在类似大语言模型的缩放定律,且...
对话Teeni.AI袁琳:AI儿童硬件的善意,是蹲下来与孩子对话
袁琳作为连续创业者和两个10后孩子的母亲,凭借双重身份的敏锐直觉,带领Teeni.AI全面转向青少年AI智能体领域。她认为“AI对10后来说,就像互联网对我们这代人...
斯坦福英伟达推出测试时强化学习:微调开源模型胜过顶级闭源模型,仅需几百美元
斯坦福大学、英伟达等机构的研究团队提出了一种名为TTT-Discover的创新方法,为大模型的持续学习开辟了新路径。该方法基于开源模型gpt-oss-120b,在数学、算...
美团智能体SOTA模型LongCat-Flash-Thinking-2601开源
美团龙猫团队开发的LongCat-Flash-Thinking-2601模型标志着智能体推理能力的重大突破。这个总参数5600亿、激活参数270亿的混合专家模型(MoE),在代理搜索、...
DeepSeek-R1推理智能从哪儿来?谷歌新研究:模型内心多个角色吵翻了
过去两年,大模型的推理能力经历了显著跃迁,尤其在数学、逻辑和多步规划等复杂任务上,推理模型如OpenAI的o系列、DeepSeek-R1和QwQ-32B已稳定超越传统指令微...
马化腾内部员工大会安利「元宝派」新玩法,结合腾讯优势开启AI社交新赛道
腾讯在2026年员工大会上明确了其AI战略的稳健路线,强调保持定力并专注自身节奏。董事会主席兼首席执行官马化腾指出,腾讯混元大模型在过去一年经历了深度重...
2.4万亿参数“最强文科生”,文心5.0正式版,你挺懂山东人啊?
文心大模型5.0正式版的发布标志着国产AI技术进入全球第一梯队。参数量高达2.4万亿的原生全模态架构使其在语言、视觉、音频等多领域展现出卓越性能。LMArena竞...




