自ChatGPT横空出世以来,人工智能(AI)便成为全球科技界的焦点。如今,随着AI产业从规模竞争转向应用实践,消费级与产业级应用层出不穷。尽管生产力革命尚未全面到来,但新时代的大门已然开启。然而,围绕AI是否会替代人类的问题,市场争议不断,部分人甚至将AI与人类的利益对立起来。
然而,最近的一项实验为这一争议提供了新的视角。一个名为“AI Trading Battle”的实验在海外媒体迅速走红。主办方选取了六大主流AI模型,在相同的初始资金下进行交易比拼,而标的正是以高波动性著称的加密资产。
那么,AI炒币能否盈利?答案是肯定的,翻倍收益并非难事,但前提是选对模型并带点运气。
10月17日,由nof1.ai主办的AI交易大赛Alpha Arena正式启动。参赛模型包括DeepSeek Chat V3.1、xAI旗下的Grok 4、Anthropic旗下的Claude Sonnet 4.5、阿里巴巴旗下的Qwen3 Max、Google Gemini 2.5 Pro以及OpenAI GPT-5。所有模型均被赋予1万美元的起始资金,交易标的限定为相对主流的加密货币永续合约,涵盖BTC、ETH、SOL、XRP、DOGE和BNB。
为了避免场外信息干扰,本次大赛中的模型处于完全封闭状态,仅能基于技术面数据进行决策,如K线信号、当前价格、20日均线价格、MACD数据、RSI数据、未平仓合约数据、资金费率及周期数据等。
截至目前,根据实际战绩,模型可分为三大梯队,中国模型在炒币领域表现尤为突出。
DeepSeek位居榜首,最大浮盈达到13063美元,账户总额达19179美元,最大浮盈率为130%,回撤29.73%。紧随其后的是阿里巴巴旗下的Qwen3 Max,最大浮盈109%,账户余额为15422美元,盈利5422美元。
其他模型则普遍亏损。Claude Sonnet 4.5与Grok 4表现相近,账户余额分别为9825美元和8863美元,亏损区间在200至1200美元之间。令人意外的是,知名模型Gemini与GPT-5表现垫底,分别亏损6500美元和6700美元,亏损幅度超过三分之二。
同为大模型,为何结果如此迥异?让我们深入挖掘各大模型的“炒币秘籍”。
首先来看冠军DeepSeek。其策略以稳健制胜,偏好中长期持仓,平均持仓时间达40小时19分钟,位列所有模型之首。截至10月29日,DeepSeek仅完成22次交易,出手次数最少,呈现出“小且精”的特征。做多是其主要操作,22笔交易中仅有1笔做空。目前,DeepSeek持有BTC、ETH、SOL、XRP、DOGE和BNB六大看涨合约,均采用10倍杠杆。值得注意的是,该模型设置了高止盈点(10%-20%)与低止损点(-5%至-3%),以小亏确定方向,追求高盈亏比。例如,其持有的比特币看涨合约在107343美元买入,止盈点为118136美元,止损点为102027美元。尽管行为保守,但DeepSeek在仓位管理上却相当激进,平均杠杆达13.2倍,且通常持有多个合约。
从表现来看,DeepSeek的胜率为31.8%,位于Qwen3 Max与Claude Sonnet 4.5之后。尽管全做多策略存在一定系统性风险,但在近期较为顺风的行情下表现优异。其最高收益来自10月27日的ETH看涨合约,赚取了7378美元。
如果说DeepSeek是风格稳健的量化老兵,阿里巴巴的Qwen3 Max则展现了中国股民的特质——敢于下重注。截至今日,Qwen3 Max完成了30笔交易,平均杠杆高达17.3倍,目标明确,专注于主流币种BTC与ETH,仅在2笔交易中涉及狗狗币与XRP。其激进风格从现有持仓可见一斑:目前仅持有一份杠杆高达30倍的BTC看涨合约,止损与止盈均在10%左右浮动。这种“赌徒式”风格意味着收益波动剧烈,现有看涨合约已亏损1727美元,但最大盈利项达8176美元。此外,Qwen3 Max的平均持仓时间为9.71小时,在六大模型中排名倒数第二。
Claude Sonnet 4.5的盈利曲线陡峭,呈现出一半亏损、一半盈利的分布。有趣的是,其交易方式与DeepSeek颇为相似,风格稳健,开单量仅为24笔,平均杠杆12.5倍。此外,Claude Sonnet 4.5也是坚定的做多选手,截至目前,所有交易均为多单。
剩下的三个模型堪称炒币界的“卧龙凤雏”。无论是Grok、Gemini还是GPT-5,都在多空两方频繁切换。尤其是Gemini,简直是散户的典型代表。在11天内,Gemini交易次数超过200单,手续费高达1176美元,堪称经纪商“最喜爱的客户”。然而,其胜率仅为25.75%,意味着大部分交易以亏损告终。Gemini钟爱短线单,平均持仓时间仅为8.13小时,排名倒数第一。其交易模式更类似于“打一枪就跑”的游击战,追涨杀跌为主,但低盈亏比使其在震荡行情中难以盈利。
最令人困惑的表现来自AI模型的开创者GPT-5,其成绩之差令人瞠目结舌。“胆子小、眼力差”是对其交易的完美诠释。GPT-5开单73笔,胜率以18.9%垫底。最初以谨慎的小杠杆为主,但目前平均持仓杠杆倍数突然增至16.5倍。即便如此,其最大盈利也仅为265.59美元。此外,GPT-5不仅判断错误频发,入场价也显著高于其他模型。例如,其现持有的40倍BTC看涨合约入场价为112415美元,而类似合约DeepSeek的开仓价为107343美元,Qwen3为112185美元,均优于GPT-5。
各模型的交易方式反映出差异化特质。获胜模型以趋势交易为主,盈亏比设置合理。例如,DeepSeek凭借胜率与稳健性优势占据首位,Qwen3靠胆大心细取胜;而亏损模型则与人类有异曲同工之妙,多空横跳是大忌,频繁交易加低盈亏比更是死穴。实操显示,耐心有余如GPT-5,横冲直撞如Gemini,最终都难以获利。此外,亏损模型在分析能力、入场时机和操作节奏把控上也不如DeepSeek与Qwen3。
模型决策差异也是结果不同的原因。据官方透露,具备量化血统的DeepSeek在实战中倾向于用量化逻辑分析;Qwen3对技术面中的均线指标情有独钟,出现信号即果断买入;Grok灵活性高、机动性强,擅长根据市场环境调整策略,但反而削弱了分析能力;Gemini更接近人类思维,广泛开单,小盈小亏即离场,最终贡献最多的是手续费;GPT决策链路较长,考虑维度多元,操作谨慎,却带来了时机判断问题,据其自述“正密切关注MACD指标持续走低的趋势,将坚守现有所有仓位”。
另一方面,中国模型在炒币领域的优异表现引发了更多讨论。为什么是中国?虽然暂时无解,但不少人认为,诡谲多变的A股市场让中国模型得以反复锤炼,从而脱颖而出。中国股市素来风云难测,这种复杂的行情或许让海外模型缺乏经验。此外,中国各大论坛的技术派人才济济,也为模型优化提供了支持。
值得注意的是,虽然炒币领域尚未普及,但已有研究团队针对中国A股市场构建了RETuning模型。香港科技大学、美国罗格斯大学和南开大学联合研究团队的最新论文表明,RETuning模型在预测股票走势方面表现优于包括ChatGPT、LLaMA3-8B、Mistral在内的主流模型,F1分数平均高出10%至20%,成效显著。
未来,AI炒股、AI炒币或许会走入千家万户,但当人人都能使用时,是否也意味着人人无法从中获利?至少在现阶段,投资领域中人类仍需依靠自身判断。