标签:大模型
Agnes团队:不堆参数、不烧算力!小模型也能跑出大模型能力
当前大模型发展高度依赖扩大参数规模、数据量和算力,面临训练成本高昂且边际收益递减的行业困局。针对这一瓶颈,研究者提出了Mythos架构假想,其核心思路是...
把 GPT-4o 拉下神坛!星源智联合北大推出 RoboAgent,让 3B VLM 在未知场景跑出 94% 成功率
当前视觉语言模型在处理真实环境中的具身任务时,常常面临多轮交互、长程推理以及奖励信号稀疏等实操困境。为解决这一难题,北京大学与星源智团队共同提出了...
硅谷大事件丨OpenAI成立机器人团队,奥特曼下场捞人;Opus 4.8「坦诚」人设反遭用户质疑;Meta筹备新AI硬件,下半年整体销量目标1000万台
科技巨头正加速从纯软件向软硬件一体化及底层基础设施转型,人工智能行业的商业化与硬件落地进入新阶段。OpenAI正式成立机器人团队,通过高薪招募工程师致力...
Claude Opus 4.8发布,Mythos也将登场!Anthropic H轮融资后估值超OpenAI
在下一代模型规划方面,Anthropic预告了定位高于Opus的Mythos级别模型。该模型在网络安全领域展现出极强的能力,能够自主发现上万个覆盖主流操作系统和浏览器...
中国版 Anthropic 是个伪命题
Anthropic近期完成巨额融资,估值逼近万亿美元,其高估值的底层逻辑不仅在于模型能力领先,更在于其成功切入了美国万亿级企业软件市场。Anthropic通过编程工...
阶跃发布 Step 3.7 Flash,效率模型开始争夺 Agent 主战场
在人工智能向智能体时代演进的过程中,Flash模型的定位正发生深刻转变,从旗舰模型的轻量版本转变为智能体时代的任务基座。在真实的智能体工作流中,速度、智...
Claude Opus 4.8实测封神!强到离谱,也贵到肉痛
Anthropic近期发布了全新大语言模型Claude Opus 4.8,将其定位为擅长编程、智能体任务和长时间推理的复杂任务模型,并同期宣布完成高额估值融资。该模型的发...
DeepSeek狂吞17万亿Tokens?国产AI算力,最关键一战来了!
DeepSeek系列模型在OpenRouter平台上的月调用量表现突出,合计超过17万亿tokens,标志着Token消耗的绝对主力已从传统聊天机器人转向具备规划、检索和工具调用...
「马嘉祺」让大模型翻车,而他一年前洗澡时就发现了问题
大语言模型在生成低频词汇时存在明显的退化现象,这一问题近期因特定人名生成错误而引发公众广泛关注。低频词元退化并非全新的技术发现,而是大模型在预训练...
Grok-5/MiniMax-M3爆料!更强的模型都在路上了
近期,人工智能领域在大语言模型的研发与应用方面取得了显著进展,其中Grok-5与MiniMax-M3两款新模型的动态备受瞩目。马斯克宣布,拥有1.5万亿参数的Grok-5已...


