文章摘要
【关 键 词】 推理成本、模型迁移、开源模型、智能代理、降本增效
当前,推理成本已成为可持续人工智能部署的最大障碍,许多企业面临高昂的支出压力,部分公司的相关账单甚至超出预期数倍。为应对这一行业挑战,Linux基金会成立了Tokenomics基金会,旨在围绕人工智能Token成本建立开放标准。在此背景下,初创公司Lindy将其全部人工智能代理流量从Anthropic转移到了DeepSeek v4,每年可节省数百万美元的推理成本。
Lindy是一个无代码人工智能代理平台,其创始人兼首席执行官Flo Crivello指出,推理是该平台占比最高的单项支出,甚至超过了员工薪资。经过数月的评估与测试,Lindy最终选择了DeepSeek v4这一旗舰开源模型。此次迁移不仅大幅降低了运营成本,还在电子邮件分类和草稿回复等核心用例上实现了显著的性能提升。尽管迁移过程中的模型评估和提示词调整工作量远超预期,且在工作流自动化等复杂任务上DeepSeek仍略逊于原有模型,但整体收益充分证明了转型的合理性。
DeepSeek v4的崛起在行业内引发了深远影响。该模型不仅以极低成本达到了顶尖性能,还实现了从芯片、框架到模型完全由中国自主研发,降低了对美国芯片基础设施的依赖。这种高性价比的开放权重模型的出现,促使人工智能模型市场逐渐向超高端前沿模型和廉价替代方案两极分化,原本舒适的中间地带正在萎缩。为解决数据主权问题,Lindy选择了美国服务商Atlas Cloud在本土托管DeepSeek v4模型,从而在享受低成本的同时保障了数据安全。
此次基础设施的全面切换对Lindy的财务前景产生了积极的深远影响。虽然Lindy在内部仍继续使用Anthropic的订阅方案,但在外部产品中已全面转向DeepSeek,仅在极少数任务失败时才会升级到更高级的模型。对于大量消耗Token的企业而言,寻找更具成本效益的模型供应商已成为维持商业可行性的必然选择。
原文和模型
【原文链接】 阅读原文 [ 2501字 | 11分钟 ]
【原文作者】 AI前线
【摘要模型】 qwen3.7-max
【摘要评分】 ★★★★★



