标签:成本优化

把医疗AI禁锢在严肃区间:百川M3 Plus首创“证据锚定”,幻觉率2.6%刷新全球纪录

百川智能最新发布的循证增强医疗大模型Baichuan-M3 Plus在医疗AI领域取得重要突破。该模型通过独创的六源循证技术,将幻觉率降低至2.6%,创下全球最低纪录。...

阶跃星辰深度研究32B媲美Gemini深度研究能力,成本不到1/10

训练管线采用三阶段渐进式设计:代理式中间训练聚焦32K-128K上下文长度下的原子能力培养;监督微调阶段连接孤立能力形成端到端任务处理链条;强化学习阶段通...

推理成本打到1元/每百万token,浪潮信息撬动Agent规模化的“最后一公里”

当前全球AI产业正经历从模型性能竞赛向智能体规模化落地的关键转型,“降本”已成为决定行业突破与企业存续的核心命脉。浪潮信息最新发布的元脑HC1000超扩展AI...

背靠通义大模型,这家阿里系公司正在重写体育场馆新的「定价公式」

「橙狮慧影 Smartshot」系统通过AI技术将专业级网球鹰眼系统的功能平民化,以万元级成本为大众运动提供数据分析和影像服务。该系统由阿里旗下橙狮体育研发,...

硅谷大佬带头弃用 OpenAI、“倒戈”Kimi K2!直呼“太便宜了”,白宫首位 AI 主管也劝不住

硅谷正经历从昂贵闭源模型向更便宜开源替代方案的显著转变。知名投资人Chamath Palihapitiya透露,其团队已从亚马逊Bedrock平台迁移至搭载中国模型Kimi K2的G...

一颗芯片的新战争

每年9月通常是手机新品发布的高峰期,但今年科技界的焦点已转向AI推理芯片领域的激烈竞争。随着AI应用从训练转向商业化落地,推理市场正迎来爆发式增长。麦肯...

别让大模型想太多了,过度思考会影响性能

加州大学伯克利分校和苏黎世联邦理工学院等高校的研究人员深入探讨了大模型在执行Agent任务时面临的“过度思考”问题。过度思考是指大模型过度依赖内部推理,而...

得一微发布AI-MemoryX显存扩展技术,助力DeepSeek训推一体机

得一微电子推出的AI-MemoryX显存扩展解决方案,通过自研存储控制芯片和系统级创新,将单机显存容量从传统显卡的几十GB提升至10TB级别,解决了大模型微调训练...

10美元成功复现DeepSeek顿悟时刻,3B模型爆发超强推理!微软论文反驳涌现

荷兰开发者Raz采用轻量级强化学习算法Reinforce-Lite,以低于10美元的成本在3B参数规模的模型上复现了DeepSeek的'顿悟时刻'。该方法通过简化传统强化学习的复...

DeepSeek R1之后,AI创业、AI投资会发生什么变化?

DeepSeek的技术突破正在重塑全球AI产业格局,其创新主要体现在模型架构与训练效率的显著提升。通过混合专家(MoE)架构、多层级注意力(MLA)机制以及模型蒸...
1 2