标签:推理成本

每百万 Token 成本砍六成,出海 AI 团队开始重算推理这笔账

随着AI出海团队的业务重心从模型打磨转向正式服务与推理部署,算力成本与架构优化成为决定项目盈利的关键因素。在推理场景下,盲目追求高端训练卡并非最优解...

AI真能学会心算?隐式思维链首次得到理论证明,Stuart Russell参与

当前AI推理模型在处理复杂任务时依赖显式思维链,逐个生成中间思考标记,导致推理延迟高且计算成本昂贵。为解决这一结构性问题,研究人员提出了隐式思维链技...

小米狂撒Token!最高降幅99%,全面对标DeepSeek

近期,国产大模型API市场掀起激烈的价格战,竞争已正式杀入成本线。DeepSeek宣布V4-Pro API永久降价,随后小米MiMo迅速跟进,最高降幅达99%,其Pro版核心价格...

云天励飞罗忆:推理超越训练,国产算力的真正战场在生态与成本丨GAIR 2025

第八届GAIR全球人工智能与机器人大会聚焦AI算力新十年的发展趋势,云天励飞副总裁罗忆在主题演讲中系统阐述了国产芯片路径与AI普惠化的核心观点。他指出,当...

8.9ms,推理速度新记录!1块钱百万token,浪潮信息AI服务器加速智能体产业化

浪潮信息在人工智能计算大会上发布了两款突破性产品——元脑SD200超节点和元脑HC1000超扩展AI服务器,旨在解决智能体产业化阶段的速度与成本核心挑战。元脑SD20...

Anthropic联创:Scaling Law没崩,但推理成天价!有了TTT,25年AI更加速

Anthropic联合创始人Jack Clark近日发文反驳了关于AI发展已到达瓶颈的观点,他认为AI的发展还远远没有达到极限。Clark指出,OpenAI的技术秘诀并不是让模型变...

如何理解 OpenAI o3 ?以及对其的技术分析

O3作为OpenAI的新一代模型,继承自O1,其命名跳过O2是为避免与同名公司混淆。尽管O3并非AGI,但其能力在某些方面已超越人类,这一点从ChatGPT 3.5延续至今,...

当大模型升级速度变缓,AI Infra 创业还是一门「好生意」吗?

AI Infra领域的发展呈现出两极分化的格局,海外市场被巨头垄断,而国内市场则显得过于分散。中国AI Infra创业主要由清华系背景的团队引领,这些企业主要聚焦...

阿里通义千问GPT-4级主力模型降价97%,1 块钱200万 tokens!

阿里云宣布对其通义千问系列的Qwen-Long模型进行大幅度价格调整,将API输入价格从0.02元/千tokens降至0.0005元/千tokens,降幅高达97%。这一降价举措使其成为...