标签:降本增效
低成本复刻Fable 5的路子找到了:OrcaRouter多模型组队,性能反超
AI网关OrcaRouter近期推出了一套可编程路由策略,通过多模型组合编排与自动仲裁机制,使多个常规模型协同答题的综合胜率超越了顶级单体模型。测试数据显示,...
国内首个!具身数采「黑箱」正式开源,具身数据昂贵的时代结束了
自变量机器人公司近期开源了XRZero-G0项目,提供了一套涵盖无本体数据采集、质检、训练及真机评测的完整链路,并开放了包含2000多小时、覆盖3000个任务的多模...
热门Harness项目OpenSquilla:拯救烧token烧到绝望的Agent们,估值1亿
当前AI应用公司面临严峻的算力账单挑战,对于Agent产品而言,token毛利通常需要达到30%以上才能使商业模式进入可循环状态。在模型厂商下调单价的背景下,控制...
独家解读丨马斯克Cybercab还没交卷,中国无人车已经卷到伦敦街头
随着Waymo、萝卜快跑、小马智行等企业获得巨额融资或实现单城盈利,2025年被视为智能驾驶公司收入暴涨元年,而2026年则成为Robotaxi集体海外布局的关键节点。...
400 tokens/秒!阶跃Step 3.7 Flash,把Agent任务成本打到Claude零头
阶跃星辰正式发布了Step 3.7 Flash多模态大模型,旨在解决人工智能代理在规模化应用中面临的高成本与高延迟问题。该模型以极高的生成速度和仅需竞品九分之一...
5亿Tokens白送!全球首个商用AI主机发布,终于能放开烧Token了
随着AI Agent在业务中的深入应用,按Token计费的模式导致企业成本线性增长,缺乏规模效应,同时核心数据上云也带来安全隐患。对于一人公司和成长型企业而言,...
为什么科技行业越繁荣,岗位越少?
在裁员结构上,科技公司的裁员重点已从边缘业务和末位淘汰转向职务清理,初级软件工程师、中后台运营及客服支持等流程化程度高的岗位面临极大的替代压力。企...
AI公司烧不起Token了!国产Agent杀出,逼近Opus 4.6还免费
随着AI Agent迎来爆发元年,大模型在企业级生产流程中的高频调用导致Token处理量呈指数级暴增。Token消耗已演变为AI时代的“电力消耗”,高昂的算力成本正成为...
推翻二十年组网逻辑,智谱落地ZCube,让同样的GPU多干15%的活
在人工智能大模型迈向超大规模集群的进程中,单纯堆砌GPU算力的边际效益正逐渐递减,网络通信瓶颈日益成为制约整体性能的关键变量。传统数据中心广泛采用的Cl...
拆掉Token暴利墙,云厂商下场造芯 | 企服国际观察
全球头部云计算厂商正加速推进自研芯片战略,其发展路径已从早期的内部业务降本,逐步演变为争夺市场话语权与重构AI基础设施的核心手段。在Agent爆发与大模型...




