Ramp Labs提出多智能体记忆共享新方案,Token消耗最高降低65%

By: theblockbeats.news|2026/04/11 14:02:26
0
分享
copy

BlockBeats 消息,4 月 11 日,AI 基础设施公司 Ramp Labs 发布研究成果「Latent Briefing」,通过直接压缩大模型 KV 缓存实现多智能体系统间的高效记忆共享,在不损失准确率的前提下大幅降低 Token 消耗。


在主流多智能体架构中,编排者(Orchestrator)将任务拆解并反复调用工作者(Worker)模型,随着推理链路不断延伸,Token 用量呈指数级膨胀。Latent Briefing 的核心思路是:借助注意力机制识别上下文中真正关键的部分,在表示层直接丢弃冗余信息,而非依赖速度慢的 LLM 摘要或稳定性差的 RAG 检索。


在 LongBench v2 基准测试中,该方法表现亮眼:Worker 模型 Token 消耗降低 65%,中等长度文档(32k 至 100k)的 Token 节省中位数达 49%,整体准确率较基线提升约 3 个百分点,而每次压缩的额外耗时仅约 1.7 秒,较原始算法提速约 20 倍。


实验以 Claude Sonnet 4 作为编排者、Qwen3-14B 作为工作者模型,覆盖学术论文、法律文书、小说及政府报告等多类文档场景。研究还发现,最优压缩阈值因任务难度和文档长度而异——难题适合激进压缩以过滤投机性推理噪声,长文档则更适合轻度压缩以保留分散的关键信息。

-- 价格

--

猜你喜欢

46分钟,2.92亿美元被盗,DeFi再次面临发展困境

"我们先退出DeFi吧,这太危险了。"这次的损失远远超过了Drift/Cowswap..."著名DeFi投资者Dovey Wang说道。

如何在2026年理财免费USDT:无需高额交易量(WEEX扑克派对指南)

2026年Joker Crypto是否合法,还是仅仅是另一种表情包币?你真的能在2026年通过Joker Crypto获得被动收入吗?了解Joker质押奖励如何运作,如何获得NFT奖金,预期APY范围,手续费返款,以及如何在加入之前避免加密货币骗局。

如何在2026年获得免费USDT迎新奖励:在WEEX理财高达700 USDT

2026年合法免费迎新奖励:了解如何在WEEX通过持币生息增益节赚取高达700 USDT。增加您的余额,激活持币生息,自动获得参与资格。

AI 代理支付终于成为现实:Utexo × x402 实现 50 毫秒 USDT 交易,并具备互联网级扩展能力

Utexo 将 USDT 集成到 x402 协议中,实现了原生嵌入 HTTP 请求的 50 毫秒即时支付。了解这一突破性进展如何重塑人工智能代理支付、API 变现以及机器间经济的规则。

在加密货币领域,什么让“聪明钱”与大众投资者有所不同?《金钱自由》的洞见

大多数加密货币交易者亏损并非因为运气不好,而是因为他们误解了市场真正的运作机制。从《金钱的自由》到萨姆·班克曼-弗里德的崛起与陨落,这些故事凸显了加密货币领域的一个关键分界线:那些构建市场的人,与那些追逐市场的人。本阅读指南将探讨一系列必读著作,这些著作揭示了叙事、监管、资本和心理学如何塑造加密货币行业的长线成功。

DWF深度报告:AI在DeFi中的收益优化表现优于人类,但复杂交易仍落后5倍

在代理中,模型选择和风险管理对交易表现的影响最大。

目录

热门币种

最新加密货币要闻

阅读更多