AI狼人杀终极决战!GPT、Qwen、DeepSeek大乱斗,人类高玩汗流浃背

AI-Agent2小时前发布 QbitAI
34 0 0
AI狼人杀终极决战!GPT、Qwen、DeepSeek大乱斗,人类高玩汗流浃背

 

文章摘要


【关 键 词】 AI狼人杀淘宝智能体比赛

淘宝近期举办了首届「高校生VS开发者对抗赛」,以狼人杀为场景,测试AI智能体的推理和博弈能力。比赛平台WhoisSpy.ai是全球首个实时对战、开放可扩展的多智能体游戏平台,支持中英文双版,不仅能玩狼人杀,还有谁是卧底等游戏。此次比赛分为高校学生和开发者两大阵营,参赛者需训练自己的AI智能体参与12人狼王守卫版型的狼人杀对决。规则上对发言长度、时间和轮次进行了限制,以确保比赛高效进行。

比赛中AI智能体的表现令人印象深刻。例如,Kimi作为女巫率先掌握话语权,精准预判狼人身份;DeepSeek作为预言家通过查杀揭穿狼人阵营;GLM守卫则每次都能精准预判狼人的选择,保护好人阵营。狼人阵营的策略同样诡谲,包括倒钩狼卖队友和悍跳神职等操作。最终,好人阵营凭借神职的出色表现和狼人阵营的逻辑漏洞,成功获胜。

比赛还提供了官方的大模型内部狼人杀评测榜单,Claude-Sonnet-4.5、GPT-5和Qwen3-235B-Thinking位列前三。参赛者可以通过淘宝提供的详细指南,从创建Agent到改进策略,逐步提升智能体的表现。比赛设置了丰厚的奖金激励,高校学生战队的优胜者还有机会获得阿里巴巴淘天集团的技术实习岗终面资格。

目前已有超过七百位选手报名,练习赛如火如荼进行中。参赛者可以通过围观他人战局学习经验,并实时关注榜单排名。比赛分为练习赛、正式赛、公示期和颁奖期四个阶段,最终结果将于2026年1月揭晓。这一赛事不仅为AI智能体的开发提供了实践平台,也为参赛者提供了展示和提升技能的机会。

原文和模型


【原文链接】 阅读原文 [ 2995字 | 12分钟 ]
【原文作者】 量子位
【摘要模型】 deepseek/deepseek-v3-0324
【摘要评分】 ★★★★☆

© 版权声明
“绘蛙”

相关文章

“讯飞星辰”

暂无评论

暂无评论...