标签:大模型
18个月,中国Token消耗狂飙300倍!别乱烧钱了,清华系AI Infra帮你腰斩API成本
中国大模型API服务市场正面临前所未有的挑战与机遇。随着Clawdbot等应用的爆发式增长,Token消耗量在一年半内激增300倍,达到日均30万亿的规模。这种爆炸式增...
18个月,中国Token消化狂飙300倍!别乱烧钱了,清华系AI Infra帮你腰斩API成本
中国大模型API服务市场正面临严重的'黑盒'焦虑,服务碎片化和不透明性导致开发者面临巨大挑战。数据显示,中国大模型数量已超过1500个,日均Token消耗量从202...
天津大学牵头「拧干」RLVR「低效海绵」:ICLR 2026新作ReMix 让样本效率暴涨 30–450 倍
随着大语言模型在复杂推理任务中的广泛应用,强化学习已成为激发其深度思考潜力的核心范式。然而,当前主流的强化微调方法普遍面临严重的样本效率瓶颈,导致...
全球首个大模型在轨部署:中国太空算力解锁“软硬一体”
把大模型送上太空,这件事正在从科幻变成现实。2025年11月,中国科技企业国星宇航成功将千问大模型Qwen3实时部署到在轨卫星上,完成全球首次通用大模型的在轨...
阿里官宣自研AI芯片,“通云哥”成AI时代梦之队
阿里平头哥正式发布高端AI芯片“真武810E”,标志着国产芯片技术迈入国际顶尖梯队。该芯片整体性能对标英伟达H20,累计出货量达数十万片,超越寒武纪成为国产GP...
最强开源机器人大脑!蚂蚁两万小时真机数据开启物理AI缩放定律
蚂蚁集团开源的具身智能基座模型LingBot-VLA标志着机器人学习领域的重要突破。该模型通过两万小时真机数据验证了机器人学习存在类似大语言模型的缩放定律,且...
对话Teeni.AI袁琳:AI儿童硬件的善意,是蹲下来与孩子对话
袁琳作为连续创业者和两个10后孩子的母亲,凭借双重身份的敏锐直觉,带领Teeni.AI全面转向青少年AI智能体领域。她认为“AI对10后来说,就像互联网对我们这代人...
斯坦福英伟达推出测试时强化学习:微调开源模型胜过顶级闭源模型,仅需几百美元
斯坦福大学、英伟达等机构的研究团队提出了一种名为TTT-Discover的创新方法,为大模型的持续学习开辟了新路径。该方法基于开源模型gpt-oss-120b,在数学、算...
美团智能体SOTA模型LongCat-Flash-Thinking-2601开源
美团龙猫团队开发的LongCat-Flash-Thinking-2601模型标志着智能体推理能力的重大突破。这个总参数5600亿、激活参数270亿的混合专家模型(MoE),在代理搜索、...
DeepSeek-R1推理智能从哪儿来?谷歌新研究:模型内心多个角色吵翻了
过去两年,大模型的推理能力经历了显著跃迁,尤其在数学、逻辑和多步规划等复杂任务上,推理模型如OpenAI的o系列、DeepSeek-R1和QwQ-32B已稳定超越传统指令微...



