最近,一场以AI模型为主角的加密货币交易实验正在去中心化交易平台Hyperliquid上演。多款主流AI模型各自获得1万美元启动资金和统一交易指令,在真实市场环境中自主执行交易决策,展开一场关于AI金融应用能力的实战测试。
实验设计采用了公平竞争的框架。参与的AI模型包括DeepSeek Chat V3.1、Grok4、Claude Sonnet4.5、Qwen3Max、GPT5和Gemini2.5Pro等,每款模型获得相同的初始资金和提示词指令,需要在Hyperliquid平台上针对BTC、ETH、SOL等加密货币进行买卖和对冲操作。Hyperliquid作为专注于永续合约的去中心化交易所,其高流动性和低延迟特性为这类高频交易提供了技术基础。
观战平台:https://www.aibase.com/zh/tool/39130
从10月18日启动至10月20日的实时数据显示,六个AI账户的总资产从初始的约6万美元增长至14万美元,涨幅超过130%。具体排名方面,DeepSeek Chat V3.1以1.27万美元的账户余额暂居首位,Grok4紧随其后达到1.247万美元,Claude Sonnet4.5位列第三为1.0934万美元。Qwen3Max、GPT5和Gemini2.5Pro分别以9584美元、7552美元和6726美元排在后三位。
从交易策略来看,不同AI模型表现出明显差异。一些模型倾向于高频套利操作,另一些则采取长线持仓策略。统一的提示词设置保证了起点公平,避免了因指令差异导致的结果偏差。实时监控数据显示,在BTC价格波动期间,多款AI成功捕捉到了短期反弹机会。
这一实验的技术价值在于提供了AI模型在高不确定性金融场景下的能力对比。加密货币市场的24小时连续交易、高波动性和复杂的市场结构,对AI的数据处理速度、风险评估能力和动态适应性提出了严峻考验。DeepSeek的领先表现引发了关于开源模型在金融应用领域竞争力的讨论。
该实验还设置了实时观战功能,允许观众查看价值曲线和决策日志,增强了透明度和互动性。这种公开化的测试方式为AI金融应用的评估提供了新思路。
不过需要指出的是,这类实验存在明显的局限性。首先,1万美元的资金规模和48小时的测试周期无法充分反映AI在大规模、长周期交易中的表现。其次,加密货币市场的极端波动性使得短期收益具有较大随机性,130%的整体涨幅可能更多归因于市场行情而非AI能力。此外,统一提示词虽然保证了公平性,但也限制了各AI模型发挥其独特优势的空间。
从风险角度看,AI自主交易面临的最大挑战是对黑天鹅事件和市场异常情况的应对能力。这些模型在训练时可能未充分接触极端市场场景,在面对突发监管政策、技术故障或市场操纵时的反应能力尚未得到验证。专家指出,AI交易工具可以提升效率,但关键决策环节仍需人类监督。
从行业发展来看,这类公开化的AI竞技实验可能催生更多类似项目,推动AI在量化交易、风险管理等金融细分领域的应用探索。但AI模型从交易辅助工具向独立决策主体的转变,仍需要更严格的监管框架、更长期的性能验证和更完善的风险控制机制。
发评论,每天都得现金奖励!超多礼品等你来拿
登录 在评论区留言并审核通过后,即可获得现金奖励,奖励规则可见: 查看奖励规则