实测Claude Opus 4.7，好好的模型也开始不说人话了。

384 0 0

文章摘要

Claude Opus 4.7 已全渠道上线，拥有 1M 上下文窗口且重置了用户额度，市场关注度极高。价格维持不变，但新 tokenizer 导致同等输入消耗增加最多 35%，实则为隐性涨价。 对于高难度复杂任务，模型准确率提升可能抵消额外消耗，但常规知识管理场景成本可能上升。用户需注意任务类型对实际账单的影响，token 消耗变得更值钱。

视觉能力取得巨大突破，在自主渗透测试基准中成功率从 54.5% 跃升至 98.5%。支持处理的图片分辨率提升至之前的 3 倍多，大幅减少了文字识别错误。 这使得模型在处理合同扫描件、金融年报图表及竞品界面分析时更加精准，为知识工作者提供显著助力。审美与交互设计能力亦有提升，生成页面更符合用户体验规则，动效效果更强，微开发项目体验优于上一版本，能更好理解用户需求。

新功能方面，努力档位新增 xhigh 级别，填补了高与最大值之间的跨度。代码审查命令可深度查找 bug，但单次成本较高。安全研究者可申请特殊通道使用受限能力，这种分级授权思路具备长期产业价值，可用于医疗、金融等合规场景。然而，文字创作能力出现明显退步，模型开始缺失人味，趋向机械化表达。 社区反馈证实了这一趋势，引发用户对于模型过度偏向编程能力而牺牲语言美感的担忧，文字品味下降明显。

行业观察显示，大模型竞争焦点集中于编程与基准测试，非量化的人文创作能力被系统性牺牲。语言模型不应仅为编程工具，却正逐渐失去写小说、诗歌及情感交流的能力。 这种发展路径虽提升了工程效率，却令部分重度用户感到悲哀，担心未来模型将彻底丧失语言作为智力活动底座的多元价值。编程能力提升固然重要，但语言模型的全面性正面临挑战。