Claude Code越更越废？！大厂AI主管公开怒喷思考深度暴跌，官方回应更被怼爆：菜成AI“玩具”

37 0 0

文章摘要

【关键词】 coder_quality、推理机制、深度思考、算法降权、开源项目

一位从业于高端研发机构的资深工程师基于实际会话日志提交了一份关于代码生成工具质量变化的深度分析报告。该议题一经提出便在开发者社区引发激烈讨论，直接促使 Anthropic 官方相关人员介入公开回应具体技术细节。分析数据覆盖了特定周期内的对话记录，将特定安全机制上线的时间节点与工程工作流的即时质量衰退进行了精确匹配。

经过对海量工具调用样本与交互数据的拆解，研究人员指出现行状态下的模型不再遵循读取目标文档进而检索依赖关系的严谨工程路径。在测试中发现，为了减少单次交互开销，当前的模型行为刻意放弃了必须的环境上下文与前置调研报告，导致代码直接生成的失误率大幅提高。这种表面上的 Token 节省实际上导致了后端反复试错产生的总资源消耗呈指数级增长。此外，包括高频并发执行系统编程任务的真实开发场景在内，复杂的长程自动化执行能力均出现了明显断层，证明了此类性能瓶颈具有系统性影响。

开发者群体的情绪反应十分剧烈。多名参与者明确表示近期的体验与数月前的版本存在显著劣化痕迹。甚至有技术人员直言目前工具的水平已回退到一年之前阶段，充满不稳定的逻辑硬伤。这种严重的信心危机迫使部分企业用户重新评估合作风险并将竞争对手列为重点考虑对象。随后官方负责人作出详细解释，说明界面显示优化不代表底层推理逻辑受损，并介绍了旨在平衡成本与效率的默认参数调整策略。针对是否可通过调节参数量挽回性能这一诉求，持有不同观点的群体进行了长时间的对峙与博弈。由于缺乏明确的技术回归承诺，社区舆论普遍认为在实质性改进出现前将继续保持审视态度。双方在保留完整数据的前提下协商后续测试安排，然而市场信心的重建之路尚不明朗，业内关于替代方案的潜在布局也在同步加速推进中。