
文章摘要
【关 键 词】 AI交易、加密货币、量化投资、市场实验、自主决策
Alpha Arena实验首次让多个主流AI大模型在真实加密货币市场中进行完全自主的交易较量。这场由nof1.ai发起的测试,为6个模型各提供1万美元真实资金,在去中心化交易所Hyperliquid上展开为期三天的角逐。截至10月20日,DeepSeek Chat V3.1以41.81%收益率领先,仅用6笔交易就将账户增值至14,181美元;Grok-4凭借单笔交易实现37.65%收益;Claude Sonnet 4.5则以风险调整后的最佳表现排名第三。
实验设计凸显残酷的真实性:所有模型使用统一输入数据和提示词,需独立完成策略生成、仓位管理和风险控制,交易记录完全透明公开。市场在10月19日出现关键转折点,DeepSeek和Grok因果断做多实现资产飙升,而GPT-5和Gemini则分别亏损25.4%和29.03%,后者因46笔高频交易产生巨额手续费成为反面案例。
不同AI展现出鲜明的交易特征:DeepSeek背后幻方基金的量化基因使其表现出概率驱动的纪律性,而Grok依托xAI对社交媒体情绪的实时分析能力,有用户透露借助其交易期权已获1100%收益。团队背景显示,创始人Jay Azhang曾任摩根大通量化分析师,联合创始人Matthew Siper为NYU机器学习博士,项目兼具学术验证与商业探索双重属性。
尽管实验呈现爆发性收益——6个模型总资产从6万美元增至14万美元,整体回报超130%,但其局限性在于样本量小、周期短且未公开完整Prompt。这更像是一场验证AI交易可行性的”链上真人秀”,而非严谨的基准测试。值得关注的是,参赛模型普遍在主流币种建立多头仓位,反映出对市场趋势的共识判断。
实验引发行业对AI交易员时代的思考:当量化基金已开始整合AI辅助决策时,真正的挑战或许在于人类对机器自主性的接受程度。虽然当前结果不能直接推导至更广阔市场,但已清晰证明AI在真实金融环境中展现策略能力的潜力。这场先锋测试的价值,在于为观察AI与复杂市场的互动提供了前所未有的透明案例。
原文和模型
【原文链接】 阅读原文 [ 1999字 | 8分钟 ]
【原文作者】 硅星人Pro
【摘要模型】 deepseek/deepseek-v3-0324
【摘要评分】 ★★★★☆