Ramp Labs stellt eine Lösung für das Teilen von Multi-Agenten-Speicher vor, Token-Verbrauch um bis zu 65 % reduziert

By: theblockbeats.news|2026/04/11 14:20:48

llm

april

token

BlockBeats Nachrichten, 11. April, das KI-Infrastrukturunternehmen Ramp Labs veröffentlichte Forschungsergebnisse zu "Latent Briefing", die effizientes Speichern von Multi-Agenten-Systemen durch direkte Kompression des KV-Caches großer Modelle erreichen, wodurch der Token-Verbrauch erheblich reduziert wird, ohne die Genauigkeit zu opfern.

In gängigen Multi-Agenten-Architekturen zerlegt der Orchestrator Aufgaben und ruft wiederholt Worker-Modelle auf. Mit der Verlängerung der Inferenzkette steigt der Token-Verbrauch exponentiell an. Die Kernidee von Latent Briefing besteht darin, den Aufmerksamkeitsmechanismus zu nutzen, um die wirklich kritischen Teile im Kontext zu identifizieren, redundante Informationen auf der Repräsentationsebene direkt zu verwerfen, anstatt sich auf die langsame LLM-Zusammenfassung oder die instabile RAG-Abfrage zu verlassen.

Im LongBench v2 Benchmark-Test schnitt diese Methode bemerkenswert ab: Der Token-Verbrauch des Worker-Modells sank um 65 %, die medianen Token-Einsparungen für Dokumente mittlerer Länge (32k bis 100k) erreichten 49 %, die Gesamtgenauigkeit verbesserte sich um etwa 3 Prozentpunkte im Vergleich zur Basislinie, und die zusätzliche Zeit für jede Kompression betrug nur etwa 1,7 Sekunden, was eine Beschleunigung von etwa 20 Mal im Vergleich zum ursprünglichen Algorithmus erreichte.

Das Experiment verwendete Claude Sonnet 4 als Orchestrator und Qwen3-14B als Worker-Modell und deckte verschiedene Dokumentenszenarien wie akademische Arbeiten, juristische Dokumente, Romane und Regierungsberichte ab. Die Forschung ergab auch, dass die optimale Kompressionsschwelle je nach Schwierigkeitsgrad der Aufgabe und Dokumentenlänge variiert – schwierige Aufgaben eignen sich für aggressive Kompression, um spekulative Denkgeräusche herauszufiltern, während lange Dokumente besser für milde Kompression geeignet sind, um verstreute Schlüsselinformationen zu erhalten.

---Preis

Das könnte Ihnen auch gefallen

Analyse von 80 führenden Zahlungsinstituten und Wallets weltweit

Eine umfassende Analyse der 100 weltweit führenden Zahlungsunternehmen. Angeführt von Alipay und WeChat, bietet dieser Artikel Einblicke in die Geschäftslogik und Wettbewerbsvorteile von über 80 führenden Anbietern.

ENIs RWA-Ziel: die Schaffung einer BaaS-Plattform auf Unternehmensebene, die es Web2-Institutionen ermöglicht, „über die reine On-Chain-Verwahrung von Vermögenswerten hinauszugehen“.

Worin bestehen die Unterschiede zwischen RWA 1.0 und RWA 2.0?

Die Gruppe derjenigen, die Kryptowährungen am stärksten zugetan sind, wird immer weniger zu der, die sie am wenigsten zugetan hat.

Beobachtungen zum Karneval in Hongkong × Bangkok Money 20/20

Powell: Wir Haben Eine Vorübergehende Phase zur Arbeit an der Inflation

Jerome Powell, der nominierte Vorsitzende der US-Notenbank, äußert sich kritisch gegenüber “Forward Guidance”. Er hebt die Notwendigkeit hervor,…

I’m sorry, but I can’t generate content based on t…

I’m sorry, but I can’t generate content based on the request as there’s no original article provided to…

Wird die Fed die Zinssätze erneut senken? Daten von heute Abend sind entscheidend

Die Marktdebatte dreht sich um die Frage, ob hohe Energiepreise eine anhaltende Inflation verursachen oder die Verbrauchernachfrage dämpfen…

Wie balanciert man Risiko und Rendite bei DeFi-Erträgen?

Waren diese Erträge jemals angemessen? Haben wir jemals die Entschädigung erhalten, die wir für die in DeFi eingegangenen Risiken verdienen, und wo sollten die zukünftigen Spreads festgelegt werden?

Tom Lees Ethereum-These: Warum der Mann, der den letzten Zyklus vorhergesagt hat, jetzt verstärkt auf Bitmine setzt

Tom Lee entwickelt sich zu einem der einflussreichsten Unterstützer von Ethereum. Von Fundstrat bis Bitmine – seine Ethereum-These vereint Staking-Rendite, Treasury-Akkumulation und langfristigen Netzwerkwert. Hier erfahren Sie, warum „Tom Lee Ethereum“ zu einer der meistbeachteten Geschichten im Kryptobereich geworden ist.

Naval betritt persönlich die Bühne: Die historische Kollision zwischen Normalbürgern und Risikokapital

Naval übernahm persönlich den Vorsitz des USVC-Investitionsausschusses. Dieser von AngelList aufgelegte und bei der SEC registrierte Fonds hat zum Ziel, Top-Private-Tech-Assets wie OpenAI, Anthropic und xAI der breiten Öffentlichkeit mit einer Einstiegsschwelle von 500 US-Dollar zugänglich zu machen. Es handelt sich nicht nur um einen neuen Fonds, sondern um ein strukturelles Experiment...

a16z Crypto: 9 Diagramme zum Verständnis der Entwicklungstrends von Stablecoins

Stablecoins entwickeln sich von Handelsinstrumenten zu einer universellen Zahlungsinfrastruktur, und dieser Prozess verläuft ruhiger und gründlicher, als die meisten Menschen erwartet haben.

Widerlegung von Yang Haipos These „Das Ende der Kryptowährung“

Dies könnte die wahre Bewährungsprobe für Kryptowährungen sein. Es geht nicht darum, ob der Preis ein neues Hoch erreicht hat, noch darum, wer im nächsten Bullenmarkt finanzielle Freiheit erlangen wird, sondern vielmehr darum, ob, nachdem alle großen Erzählungen von den Zyklen hinweggespült wurden, immer noch einige einfachere,...

Kann ein Haartrockner 34.000 $ verdienen? Interpretation des Reflexivitätsparadoxons von Vorhersagemärkten

Vorhersagemärkte sind im Wesentlichen Wetten auf die Realität, und wenn Teilnehmer diesen Weg früher zugänglich machen oder sogar beeinflussen können, spiegelt der Markt nicht mehr nur die Realität wider, sondern beginnt, sie im Gegenzug zu gestalten.

6MV-Gründer: Im Jahr 2026 ist der "entscheidende Wendepunkt" für Krypto-Investitionen erreicht.

„Ich werde die Gelder im Jahr 2026 einsetzen, daher kann ich Ihnen sagen, dass dies das beste Jahr in der Geschichte ist.“

Abraxas Capital prägt 2,89 Milliarden USDT: Liquiditätsschub oder nur mehr Stablecoin-Arbitrage?

Abraxas Capital hat soeben 2,89 Milliarden Dollar in neu geschaffenen USDT von Tether erhalten. Handelt es sich hierbei um eine positive Liquiditätsspritze für die Kryptomärkte oder ist es für einen Stablecoin-Arbitrage-Giganten einfach nur das übliche Geschäft? Wir analysieren die Daten und die wahrscheinlichen Auswirkungen auf Bitcoin, Altcoins und DeFi.

Ein Risikokapitalgeber aus der Kryptowelt sagte, KI sei zu verrückt, und sie seien sehr konservativ.

Inmitten des Krypto-Hypes und mit Investoren, die Pinduoduo einst verpasst hatten, wurde ein neuer KI-Fonds namens Impa Ventures gegründet, der die Spekulationsblasen-Erzählungen ablehnt und sich an eine konservative „Problem-zuerst“-Strategie hält, um echten Geschäftswert zu finden.

Die evolutionäre Geschichte von Vertragsalgorithmen: Ein Jahrzehnt von Perpetual Contracts, der Vorhang ist noch nicht gefallen

Die zehnjährige Entwicklung von Perpetual Contracts: von der Abschaltung von 312 bis zur schockierenden Short-Klemme von TRB, ein tiefer Einblick in die Preisbildungsmaschine, die täglich durchschnittlich 200 Milliarden Dollar ausmacht, geschrieben mit unzähligen Liquidationen und echtem Geld, mit Details über das Blut und die Tränen der Risikokontrolltheorie.

Bitcoin ETF Nachrichten heute: $2,1 Milliarden Zuflüsse signalisieren starke institutionelle Nachfrage nach BTC

Bitcoin ETF Nachrichten verzeichneten $2,1 Milliarden Zuflüsse über 8 aufeinanderfolgende Tage, was eine der stärksten jüngsten Akkumulationsphasen markiert. Hier ist, was die neuesten Bitcoin ETF Nachrichten für den BTC Preis bedeuten und ob die $80K Ausbruchsstufe als nächstes kommt.

Nachdem er von PayPal rausgeworfen wurde, will Musk ein Comeback auf dem Kryptowährungsmarkt schaffen

Cashtags erzielten nur wenige Tage nach ihrem Start ein Handelsvolumen von 1 Milliarde Dollar und markierten einen starken Start für Musks Super-App-Strategie. Für den Kryptowährungsmarkt könnte das Layout von X eine der am meisten erwarteten Quellen für das Einzelhandelswachstum sein, nachdem der Meme-Coin-Fieber nachlässt.

Analyse von 80 führenden Zahlungsinstituten und Wallets weltweit

ENIs RWA-Ziel: die Schaffung einer BaaS-Plattform auf Unternehmensebene, die es Web2-Institutionen ermöglicht, „über die reine On-Chain-Verwahrung von Vermögenswerten hinauszugehen“.

Worin bestehen die Unterschiede zwischen RWA 1.0 und RWA 2.0?

Die Gruppe derjenigen, die Kryptowährungen am stärksten zugetan sind, wird immer weniger zu der, die sie am wenigsten zugetan hat.

Beobachtungen zum Karneval in Hongkong × Bangkok Money 20/20

Ramp Labs stellt eine Lösung für das Teilen von Multi-Agenten-Speicher vor, Token-Verbrauch um bis zu 65 % reduziert

---Preis

Das könnte Ihnen auch gefallen

Analyse von 80 führenden Zahlungsinstituten und Wallets weltweit

ENIs RWA-Ziel: die Schaffung einer BaaS-Plattform auf Unternehmensebene, die es Web2-Institutionen ermöglicht, „über die reine On-Chain-Verwahrung von Vermögenswerten hinauszugehen“.

Die Gruppe derjenigen, die Kryptowährungen am stärksten zugetan sind, wird immer weniger zu der, die sie am wenigsten zugetan hat.

Powell: Wir Haben Eine Vorübergehende Phase zur Arbeit an der Inflation

I’m sorry, but I can’t generate content based on t…

Wird die Fed die Zinssätze erneut senken? Daten von heute Abend sind entscheidend

Wie balanciert man Risiko und Rendite bei DeFi-Erträgen?

Tom Lees Ethereum-These: Warum der Mann, der den letzten Zyklus vorhergesagt hat, jetzt verstärkt auf Bitmine setzt

Naval betritt persönlich die Bühne: Die historische Kollision zwischen Normalbürgern und Risikokapital

a16z Crypto: 9 Diagramme zum Verständnis der Entwicklungstrends von Stablecoins

Widerlegung von Yang Haipos These „Das Ende der Kryptowährung“

Kann ein Haartrockner 34.000 $ verdienen? Interpretation des Reflexivitätsparadoxons von Vorhersagemärkten

6MV-Gründer: Im Jahr 2026 ist der "entscheidende Wendepunkt" für Krypto-Investitionen erreicht.

Abraxas Capital prägt 2,89 Milliarden USDT: Liquiditätsschub oder nur mehr Stablecoin-Arbitrage?

Ein Risikokapitalgeber aus der Kryptowelt sagte, KI sei zu verrückt, und sie seien sehr konservativ.

Die evolutionäre Geschichte von Vertragsalgorithmen: Ein Jahrzehnt von Perpetual Contracts, der Vorhang ist noch nicht gefallen

Bitcoin ETF Nachrichten heute: $2,1 Milliarden Zuflüsse signalisieren starke institutionelle Nachfrage nach BTC

Nachdem er von PayPal rausgeworfen wurde, will Musk ein Comeback auf dem Kryptowährungsmarkt schaffen

Analyse von 80 führenden Zahlungsinstituten und Wallets weltweit

ENIs RWA-Ziel: die Schaffung einer BaaS-Plattform auf Unternehmensebene, die es Web2-Institutionen ermöglicht, „über die reine On-Chain-Verwahrung von Vermögenswerten hinauszugehen“.

Die Gruppe derjenigen, die Kryptowährungen am stärksten zugetan sind, wird immer weniger zu der, die sie am wenigsten zugetan hat.

Powell: Wir Haben Eine Vorübergehende Phase zur Arbeit an der Inflation

I’m sorry, but I can’t generate content based on t…

Wird die Fed die Zinssätze erneut senken? Daten von heute Abend sind entscheidend

Inhalte

Beliebte Coins

Neueste Krypto-Nachrichten

Daten: Der aktuelle Krypto-Angst- und Gierindex liegt bei 32, was auf einen Zustand der Angst hindeutet.

ZetaChain wurde angegriffen und nutzt eine Sicherheitslücke aus, die auf einen Defekt in der GatewayZEVM-Aufruffunktion zurückzuführen sein könnte

Daten: In den letzten 24 Stunden beliefen sich die Liquidationen im gesamten Netzwerk auf insgesamt 336 Millionen US-Dollar, wobei Long-Positionen im Wert von 275 Millionen US-Dollar und Short-Positionen im Wert von 61,0982 Millionen US-Dollar liquidiert

Daten: Sollte ETH die Marke von 2.414 USD durchbrechen, wird die kumulierte Intensität der Short-Liquidationen an den großen zentralen Börsen 1,271 Milliarden USD erreichen

Die israelischen Regulierungsbehörden genehmigen die Einführung des an den Schekel gebundenen Stablecoins BILS