文章摘要
【关 键 词】 回归吐槽、自动降级、安全误伤、账单猫腻、跑分缩水
Claude Fable 5回归后迅速遭遇大量网友吐槽,争议焦点集中在系统自动降级、安全机制误伤、账单猫腻以及跑分严重缩水等方面。
多名开发者测试发现,Fable 5在处理任务时会暴露未经打磨的“私有语言”思考过程,并在后台自动将部分请求标记为无需Fable 5处理,进而悄悄降级转给Opus 4.8模型。同时,模型的安全护栏设置过于严格,导致解释“人类”词汇或计算“raspberry”中字母r的数量等基础且安全的问题被频繁误拦截,且不同用户的拦截结果呈现出极大的随机性。
费用结算与实际服务质量方面,测评机构的账单明细显示,在支付Fable 5的高昂费用后,约四分之三的实际代码工作量由被降级调用的Opus 4.8完成,引发“货不对板”的欺诈质疑。更为关键的是,基准测试数据表明,Fable 5回归后的核心性能指标出现断崖式下跌,其中调试能力降幅超过六成,排名大幅下滑。深入拆解分析发现,性能大幅暴跌的真相并非模型自身算法能力退化,而是大部分任务在运行中途被严格的安全机制拦截,并在打分体系中全部记为零分。
上述种种现象集中反映出当前模型产品体验受损的核心症结。Fable 5的实际表现下滑并非源于底层模型能力削弱,而是由于过严的安全护栏和未透明化的自动降级机制,导致用户支付的成本预期与获得的实际模型服务产生严重落差。外界的讨论焦点已从单纯的模型基础能力转向产品机制的透明度,用户核心关注点在于所选模型是否诚实、如实地提供了对应的算力与逻辑服务。
原文和模型
【原文链接】 阅读原文 [ 1927字 | 8分钟 ]
【原文作者】 量子位
【摘要模型】 qwen3.7-plus
【摘要评分】 ★★★★☆
© 版权声明
文章版权归作者所有,未经允许请勿转载。
相关文章
暂无评论...



