前沿资讯
1762248781更新
0
导读: 在一场由真实资金、真实市场组成的AI加密货币交易挑战中,阿里云的Qwen3-Max意外拔得头筹,两周收益高达22.32%,击败了包括OpenAI、Anthropic、Google DeepMind和xAI在内的国际顶级对手。
由美国AI实验/竞赛平台 Nof1 举办的首届“Alpha Arena”AI加密货币交易挑战赛中,来自中美的六个AI模型被分别给予1万美元资金,并在加密货币市场(Hyperliquid)中独立交易两周。它们只能依靠纯量化市场数据,在统一规则和提示下自主下单,目标只有一个:赚取尽可能多的利润。

结果显示,来自阿里云的 Qwen3-Max 以22.32%的收益率强势登顶。另一款来自中国的 DeepSeek V3.1 Chat 获得了**4.89%的正收益。而包括 OpenAI、Anthropic、Google DeepMind 和 xAI 在内的四款美国系统则全线亏损,其中 OpenAI GPT-5 表现最差,亏损高达62.66%**。
Nof1 表示,这场实验的初衷是测试AI在动态、竞争性、具风险的真实环境中的决策表现。研究团队指出,AI模型在象棋、围棋、数学推理等固定场景中已展现出强大的问题解决能力,但这些任务不能反映AI在长周期决策与风险管理方面的真实水平。
“我们想看看,在没有人为干预、只有实时市场数据的情况下,AI能否像真正的量化交易员一样操作。”Nof1 在报告中写道,“结果远超预期,不同AI的交易风格、风险偏好和信心水平差异巨大。”
实验中,每个系统都接收到实时的市场价格、成交量和技术指标,独立决策买入、卖出、持有或平仓。此外,它们还需根据自身的“信心评分”决定仓位大小和止盈止损区间。
研究团队发现,这一机制让AI的行为差异被充分放大,例如,Qwen3-Max 一贯持仓稳健、仓位较大、止损较紧,并多次报告最高信心分数。而 GPT-5 的交易则显得犹豫、频繁、缺乏一致性。
其中,Qwen3-Max 是六个参赛系统中唯一没有“推理功能”的AI,它不会在下单前进行多步思考或推演,而是基于数据“直接决策”。当其他AI陷入复杂的自我分析时,它更像是一位直觉型交易员,稳扎稳打反而跑赢大盘。
Nof1 研究团队指出,Qwen3-Max 在仓位控制上最为果断,止损与止盈的设定范围也最紧凑,能在波动环境下保持节奏稳定。“这种行为可能反映出模型在内部机制上的自信与一致性,而非随机好运。”
Nof1 强调,本轮实验只是 Alpha Arena 的第一季,测试周期短、样本有限,结果仍可能受运气影响。未来几轮测试将引入更严格的统计验证、更多交易特征和扩展型任务,进一步检验AI在风险控制、策略一致性和长期回报上的表现。
“我们不追求立刻找出‘最强交易AI’,而是希望推动AI研究从静态测试转向真实世界的动态验证,”Nof1 表示。“只有在这样的环境中,AI的真正能力与盲点才会显现。”
官方测试报告:https://nof1.ai/blog/TechPost1
豫公网安备41010702003375号