Alpha Arena新赛季战况:8大模型美股实盘暂「全军覆没」,Grok 4亏56%垫底
BlockBeats 消息,11 月 25 日,Alpha Arena 新赛季已于 20 日开始,截至发稿,参赛的 8 大 AI 模型全军覆没,GPT-5.1 暂以-7.78% 收益率排名第一,Grok 4 则以-56% 收益率垫底。新增的国产 Kimi 2 模型收益率暂报-32.8%。
本赛季模型必须参加多场比赛,每场比赛都有不同的主题。总体而言,这些比赛是对模型进行压力测试,并能反映出它们对不同 prompt 的鲁棒性。然而,在同一场比赛中,所有模型都会获得相同的输入。本赛季比赛形式为在 trade.xyz 上实盘投资美股代币。
猜你喜欢

Key Takeaways In the last 24 hours, $272 million worth of contracts were liquidated across the entire crypto…

Key Takeaways A prominent whale, known as “UnRektCapital,” has strategically escalated its short position in Bitcoin while simultaneously…

Key Takeaways Hackers in Brazil are exploiting fake Google Play Store pages to spread Android malware. Infected devices…

Resolv 协议黑客攻击事件深度研究报告,谁是最后买单人?

代币化股票的商业机遇

用 20 万换出近 1 个亿,DeFi 稳定币再遭攻击

万亿规模的代理经济背后的商业协议:了解 ERC-8183,它不仅仅关乎支付,更关乎未来

当华尔街的以太坊开始“产生收益”时:从贝莱德的ETHB视角审视以太坊的资产属性

人有人的用处:Agentic Wallet与钱包的下一个十年

一文读懂 x402 与 MPP:Agent 支付的两条路线

欧易 Ventures 研究报告:人工智能代理经济基础设施研究报告(第一部分)

黄仁勋最新播客全文:英伟达的未来、具身智能和 Agent 的发展、推理需求爆发以及人工智能的公关危机

Particle 创始人:过去一年我感悟最深的创业心得

从腾讯和 Circle:看投资的简单题和困难题

结算权的迁移:B18 与链上银行的制度起点

稳定币的下半场,不再属于加密圈

Cursor「套壳」Kimi风波反转:从侵权质疑到授权合作,中国开源模型再成全球AI底座

代币卖不动的真正原因:90%的加密项目忽视了投资者关系
Key Takeaways In the last 24 hours, $272 million worth of contracts were liquidated across the entire crypto…
Key Takeaways A prominent whale, known as “UnRektCapital,” has strategically escalated its short position in Bitcoin while simultaneously…
Key Takeaways Hackers in Brazil are exploiting fake Google Play Store pages to spread Android malware. Infected devices…