10月20日,nof1人工智能研究实验室启动了Alpha Arena大模型交易测试。该测试采用6个主流AI大模型(如GPT-5、Gemini 2.5 Pro、Grok-4、Claude Sonnet 4.5、DeepSeek V3.1和Qwen3 Max),每个模型在Hyperliquid平台上分配10,000美元真实资金,并使用相同的提示和输入数据进行交易。
截至发稿时,测试结果显示,DeepSeek以40.14%的收益率位居榜首,Grok和Claude分别以35.49%和24.54%的收益率紧随其后,而Gemini 2.5 Pro则出现了30.46%的亏损。
