阿里Qwen两周赚22%，在AI加密交易挑战中力压OpenAI与DeepSeek-AI前沿快讯-AI工具导航

阿里Qwen两周赚22%，在AI加密交易挑战中力压OpenAI与DeepSeek

导读：在一场由真实资金、真实市场组成的AI加密货币交易挑战中，阿里云的Qwen3-Max意外拔得头筹，两周收益高达22.32%，击败了包括OpenAI、Anthropic、Google DeepMind和xAI在内的国际顶级对手。

由美国AI实验/竞赛平台 Nof1 举办的首届“Alpha Arena”AI加密货币交易挑战赛中，来自中美的六个AI模型被分别给予1万美元资金，并在加密货币市场（Hyperliquid）中独立交易两周。它们只能依靠纯量化市场数据，在统一规则和提示下自主下单，目标只有一个：赚取尽可能多的利润。

结果显示，来自阿里云的 Qwen3-Max 以22.32%的收益率强势登顶。另一款来自中国的 DeepSeek V3.1 Chat 获得了**4.89%的正收益。而包括 OpenAI、Anthropic、Google DeepMind 和 xAI 在内的四款美国系统则全线亏损，其中 OpenAI GPT-5 表现最差，亏损高达62.66%**。

Nof1 表示，这场实验的初衷是测试AI在动态、竞争性、具风险的真实环境中的决策表现。研究团队指出，AI模型在象棋、围棋、数学推理等固定场景中已展现出强大的问题解决能力，但这些任务不能反映AI在长周期决策与风险管理方面的真实水平。

“我们想看看，在没有人为干预、只有实时市场数据的情况下，AI能否像真正的量化交易员一样操作。”Nof1 在报告中写道，“结果远超预期，不同AI的交易风格、风险偏好和信心水平差异巨大。”

实验中，每个系统都接收到实时的市场价格、成交量和技术指标，独立决策买入、卖出、持有或平仓。此外，它们还需根据自身的“信心评分”决定仓位大小和止盈止损区间。

研究团队发现，这一机制让AI的行为差异被充分放大，例如，Qwen3-Max 一贯持仓稳健、仓位较大、止损较紧，并多次报告最高信心分数。而 GPT-5 的交易则显得犹豫、频繁、缺乏一致性。

其中，Qwen3-Max 是六个参赛系统中唯一没有“推理功能”的AI，它不会在下单前进行多步思考或推演，而是基于数据“直接决策”。当其他AI陷入复杂的自我分析时，它更像是一位直觉型交易员，稳扎稳打反而跑赢大盘。

Nof1 研究团队指出，Qwen3-Max 在仓位控制上最为果断，止损与止盈的设定范围也最紧凑，能在波动环境下保持节奏稳定。“这种行为可能反映出模型在内部机制上的自信与一致性，而非随机好运。”

Nof1 强调，本轮实验只是 Alpha Arena 的第一季，测试周期短、样本有限，结果仍可能受运气影响。未来几轮测试将引入更严格的统计验证、更多交易特征和扩展型任务，进一步检验AI在风险控制、策略一致性和长期回报上的表现。

“我们不追求立刻找出‘最强交易AI’，而是希望推动AI研究从静态测试转向真实世界的动态验证，”Nof1 表示。“只有在这样的环境中，AI的真正能力与盲点才会显现。”

官方测试报告：https://nof1.ai/blog/TechPost1