Claude悄悄更新了Skills生成器,这绝对是一次史诗级升级。

AI-Agent2小时前发布 admin
48 0 0
Claude悄悄更新了Skills生成器,这绝对是一次史诗级升级。

 

文章摘要


【关 键 词】 技能创建评估系统功能更新生态基石代理测试

Anthropic 的 Skills 仓库近期迎来了重要更新,核心组件 Skill-creator 新增了四项关键能力,堪称史诗级增强。此次更新引入了评估系统、基准测试、多代理并行测试及描述调优功能,极大完善了 Skills 的工业化体系。用户只需向 Agent 发送特定指令即可完成版本升级,操作简单便捷。更新后的工具解决了以往 Skill 生成后如同黑盒、缺乏质量评估的痛点,使得 Skills 的质量可控性大幅提升。

在实际应用案例中,新建 Skill 可通过多轮对话确定需求细节,生成后若效果不佳可继续对话优化。针对多个 Skill 触发条件冲突的问题,新版工具提供了评估体系进行描述优化。系统自动生成应触发与不应触发的查询样本,用户确认后启动后台迭代优化,最终将最优描述写回文件。官方测试显示,优化后多数文档类 Skill 的触发率均有提升,大大减少了误触发或漏触发的情况。

除了触发准确率,实际任务表现也需通过量化指标评估。工具可启动多个独立子代理并行测试,避免上下文污染,确保数据干净。测试结束后生成量化报告,对比有 Skill 与无 Skill 基线的通过率及 Token 消耗,直观展示性能差异。评估结果本地存储,后续改进可直接针对已有问题修复,形成测试、发现、修复的完整闭环,无需从头来过。

Skills 本质上分为能力提升型与编码偏好型,两者评估侧重点有所不同。前者检验模型更新后 Skill 的必要性,后者验证流程执行的合规性。将软件开发的严谨做法引入 Skills 创作流程,标志着 Agent 生态将迎来新的繁荣。建议用户更新工具并对现有 Skills 进行全面优化与评估,以确保其持续有效性与准确性,推动整个生态系统的健康发展。

原文和模型


【原文链接】 阅读原文 [ 3184字 | 13分钟 ]
【原文作者】 数字生命卡兹克
【摘要模型】 qwen3.5-plus
【摘要评分】 ★★★★☆

© 版权声明
“绘蛙”

相关文章

“讯飞星辰”

暂无评论

暂无评论...