Alpha Arena新赛季:8大模型美股实盘仍维持「水下」,GPT收益率-2.29%接近回本
BlockBeats 消息,11 月 27 日,Alpha Arena 新赛季已于 20 日开始,截至发稿,参赛的 8 大 AI 模型仍均维持亏损,GPT-5.1 暂以-2.29% 收益率排名第一接近「水上」,Grok 4 则以-55.79% 收益率垫底。新增的国产 Kimi 2 模型收益率暂报-30.36%。
本赛季模型必须参加多场比赛,每场比赛都有不同的主题。总体而言,这些比赛是对模型进行压力测试,并能反映出它们对不同 prompt 的鲁棒性。然而,在同一场比赛中,所有模型都会获得相同的输入。本赛季比赛形式为在 trade.xyz 上实盘投资美股代币。
猜你喜欢

速览 Alliance ALL16 Demo Day 18 个新项目:预测市场和 AI 应用崭露头角

以太坊基金会推出 “Hardness” ,专设团队守护去中心化底线

早报 | 博雅互动拟斥资不超 7000 万美元购买加密货币;微信推出官方龙虾插件;比特币挖矿难度下调 7.76% 至 133.79 T

稳定币收益之争,如何卡住了美国加密监管立法?

本周新闻预告 | 美国加密货币监管指南联合文件SEC 和 CFTC 正式生效;Polymarket 宣布重大消息

Key Takeaways In the last 24 hours, $272 million worth of contracts were liquidated across the entire crypto…

Key Takeaways A prominent whale, known as “UnRektCapital,” has strategically escalated its short position in Bitcoin while simultaneously…

Key Takeaways Hackers in Brazil are exploiting fake Google Play Store pages to spread Android malware. Infected devices…

Resolv 协议黑客攻击事件深度研究报告,谁是最后买单人?

代币化股票的商业机遇

用 20 万换出近 1 个亿,DeFi 稳定币再遭攻击

万亿规模的代理经济背后的商业协议:了解 ERC-8183,它不仅仅关乎支付,更关乎未来

当华尔街的以太坊开始“产生收益”时:从贝莱德的ETHB视角审视以太坊的资产属性

人有人的用处:Agentic Wallet与钱包的下一个十年

一文读懂 x402 与 MPP:Agent 支付的两条路线

欧易 Ventures 研究报告:人工智能代理经济基础设施研究报告(第一部分)

黄仁勋最新播客全文:英伟达的未来、具身智能和 Agent 的发展、推理需求爆发以及人工智能的公关危机

Particle 创始人:过去一年我感悟最深的创业心得
速览 Alliance ALL16 Demo Day 18 个新项目:预测市场和 AI 应用崭露头角
以太坊基金会推出 “Hardness” ,专设团队守护去中心化底线
早报 | 博雅互动拟斥资不超 7000 万美元购买加密货币;微信推出官方龙虾插件;比特币挖矿难度下调 7.76% 至 133.79 T
稳定币收益之争,如何卡住了美国加密监管立法?
本周新闻预告 | 美国加密货币监管指南联合文件SEC 和 CFTC 正式生效;Polymarket 宣布重大消息
Key Takeaways In the last 24 hours, $272 million worth of contracts were liquidated across the entire crypto…