标签:大模型
阶跃发布 Step 3.7 Flash,效率模型开始争夺 Agent 主战场
在人工智能向智能体时代演进的过程中,Flash模型的定位正发生深刻转变,从旗舰模型的轻量版本转变为智能体时代的任务基座。在真实的智能体工作流中,速度、智...
Claude Opus 4.8实测封神!强到离谱,也贵到肉痛
Anthropic近期发布了全新大语言模型Claude Opus 4.8,将其定位为擅长编程、智能体任务和长时间推理的复杂任务模型,并同期宣布完成高额估值融资。该模型的发...
DeepSeek狂吞17万亿Tokens?国产AI算力,最关键一战来了!
DeepSeek系列模型在OpenRouter平台上的月调用量表现突出,合计超过17万亿tokens,标志着Token消耗的绝对主力已从传统聊天机器人转向具备规划、检索和工具调用...
「马嘉祺」让大模型翻车,而他一年前洗澡时就发现了问题
大语言模型在生成低频词汇时存在明显的退化现象,这一问题近期因特定人名生成错误而引发公众广泛关注。低频词元退化并非全新的技术发现,而是大模型在预训练...
Grok-5/MiniMax-M3爆料!更强的模型都在路上了
近期,人工智能领域在大语言模型的研发与应用方面取得了显著进展,其中Grok-5与MiniMax-M3两款新模型的动态备受瞩目。马斯克宣布,拥有1.5万亿参数的Grok-5已...
硅谷大事件丨Anthropic 以9650亿美元估值登顶王座;Claude Opus 4.8发布,主打「知错就认」;苹果憋大招,欲将Gemini蒸馏塞入iPhone
近期人工智能领域在资本市场、模型技术以及基础设施布局方面呈现出显著的发展态势。在资本与市场表现方面,Anthropic完成650亿美元融资,投后估值达到9650亿...
Opus 4.8:一个不太诚实的模型
Anthropic近期发布了Claude Opus 4.8模型,此次升级被官方定义为温和但确实存在的改进,核心卖点聚焦于提升模型的诚实度与可靠性,同时在编码与智能体能力上...
实测Claude Opus 4.8,这可能是第一个不会偷懒的模型。
Anthropic近期发布了Claude Opus 4.8模型,并完成了新一轮巨额融资,估值逼近万亿美元。此次更新主要源于激烈的市场竞争压力以及前代模型表现未达预期。新模...
四道题评测 Qwen3.7-Max:从空间推理到 3D 建模,它离 Agent 更近了吗?
阿里云通义千问团队在三个月内连续发布三款旗舰大模型,最新推出的Qwen3.7-Max在多项权威评测中表现卓越,位列全球第五、国产第一。该模型在推理和编程智能体...
小米狂撒Token!最高降幅99%,全面对标DeepSeek
近期,国产大模型API市场掀起激烈的价格战,竞争已正式杀入成本线。DeepSeek宣布V4-Pro API永久降价,随后小米MiMo迅速跟进,最高降幅达99%,其Pro版核心价格...




