Warum explodieren die GPU-Preise förmlich?

By: blockbeats|2026/04/07 00:16:09
0
Teilen
copy
Originaltitel: Der große GPU-Mangel – Mietkapazität – Einführung unseres H100-Mietpreisindex für 1 Jahr
Originalautoren: Daniel Nishball, Jordan Nanos, Cheang Kang Wen usw.
Übersetzung: Peggy, BlockBeats

Anmerkung der Redaktion: Da sich KI von einem "Werkzeug" zu einer "Workflow-Infrastruktur" wandelt, haben die Mietpreise für GPUs eine Phase beschleunigten Anstiegs erreicht, während das Angebot immer knapper wird.

Von einem Preisanstieg von fast 40 % beim H100 innerhalb eines Jahres über die Sicherung der Hash-Leistung bis zur zweiten Hälfte des Jahres 2026 bis hin zur kontinuierlichen Sicherung des Angebots durch KI-Labore mittels langfristiger Verträge und Verlängerungsmechanismen hat sich die Funktionsweise des GPU-Marktes erheblich verändert: Die Preise werden nicht mehr primär durch die Hardwarekosten bestimmt, sondern gemeinsam durch den Token-Verbrauch, die Modellfähigkeiten und die Produktionseffizienz.

Die Veränderungen auf der Nachfrageseite sind von besonderer Bedeutung. Neue Paradigmen wie Multiagentensysteme, native Inhaltsgenerierung, KI-Programmierwerkzeuge usw. treiben die Token-Nutzung in eine exponentiell wachsende Phase. Die zentrale Schlussfolgerung des Berichts wird ebenfalls deutlich: Der ROI von KI-Tools wurde bestätigt, mit einer Rendite von 5-10x, was es schwierig macht, die Nachfrage über längere Zeiträume effektiv durch die Preise für Hash-Leistung einzuschränken.

Die daraus resultierende Spannung wird immer deutlicher: Auf dem realen Markt für Hash-Leistung herrscht umfassende Knappheit und eine Verschiebung der Preissetzungsmacht nach oben, während der Kapitalmarkt noch immer in der Erwartung einer „eventuellen Überversorgung und Kommodifizierung“ verharrt. Diese Diskrepanz zwischen Erwartung und Realität verändert die Bewertungslogik des Wettlaufs um die KI-Infrastruktur.

Da Hash-Leistung zu einem neuen Produktionsmittel wird, unterliegen ihr Preismechanismus, ihre Angebotsstruktur und ihre Kapitalrendite einer tiefgreifenden Umstrukturierung.

Es folgt der Originaltext:

Die Nachfrage nach Anthropics Claude 4.6 Opus und Claude Code ist sprunghaft angestiegen. Ihre jährlich wiederkehrenden Einnahmen (ARR) sind von 9 Milliarden US-Dollar Ende letzten Jahres auf über 25 Milliarden US-Dollar in nur einem Quartal gestiegen, was einem Wachstum von fast einer Verdreifachung entspricht. Gleichzeitig haben Open-Source-Modelle wie GLM und Kimi K2.5 auch die rasante Verbreitung von Anwendungen im Zusammenhang mit Open-Source-Modellen vorangetrieben. Die kontinuierliche Finanzierung durch Unternehmen wie Anthropic, OpenAI und mehrere Neolabs verstärkt die Nachfrage nach GPU-Ressourcen ebenfalls.

Dieser Wendepunkt kennzeichnet einen rasanten Anstieg der Nachfrage innerhalb kurzer Zeit, wobei Hyperscaler und aufstrebende Cloud-Anbieter (Neoclouds) einen regelrechten Kaufrausch bei GPUs erleben.

Diese neue Nachfrage treibt die Preise entlang der gesamten Lieferkette in die Höhe, von DRAM- und NAND-Speichern über Glasfaserkabel und Rechenzentrumshosting bis hin zu Infrastrukturen wie Gasturbinen. Nahezu alle damit verbundenen Produkte und Dienstleistungen verzeichnen Preissteigerungen.

Bei den Mietpreisen für GPUs handelt es sich um den jüngsten Bereich innerhalb einer Reihe von Produkten und Dienstleistungen im Bereich der Computertechnik, bei dem es zu Angebotsengpässen und Preisspitzen kommt. Der Preis für einen einjährigen GPU-Mietvertrag für eine H100-GPU ist von einem Tiefstand von 1,70 US-Dollar pro GPU und Stunde im Oktober 2025 auf 2,35 US-Dollar im März 2026 gestiegen, was einem Anstieg von fast 40 % entspricht.

Die On-Demand-GPU-Mietkapazität ist über alle Modelle hinweg nahezu vollständig ausverkauft – Nutzer, die sich On-Demand-Instanzen gesichert haben, zögern, Rechenleistung wieder auf den Markt zu geben, selbst nach Preiserhöhungen. Anfang 2026 ist die Suche nach GPU-Rechenleistung vergleichbar mit dem Versuch, den letzten Platz in einem Flugzeug zu ergattern: Die Preise sind hoch und die Verfügbarkeit gering. Eine passendere Analogie wäre vielleicht die, weniger mit dem Ergattern eines Sitzplatzes in einem Flugzeug zu vergleichen, sondern eher mit dem Versuch, „eine Bezugsquelle für Medikamente zu finden“.

Warum explodieren die GPU-Preise förmlich?

Bei SemiAnalysis verfolgen wir seit langem verschiedene Trends und wichtige Themen im Bereich Neocloud und des Hyperscale-Cloud-Ökosystems, darunter auch die Mietpreise für GPUs. Diese Fähigkeit basiert auf unserer kontinuierlichen Forschung und Praxis in Projekten wie ClusterMAX, InferenceX und der Betrachtung der Gesamtbetriebskosten (TCO) von KI-Cloud-Lösungen.

Gleichzeitig haben wir uns intensiv darum bemüht, verschiedene KI-Labore mit Neocloud-Dienstleistern zu vernetzen, GPU-Mietressourcen auf dem Markt zu beschaffen und die Kommunikation mit nahezu allen Akteuren im Ökosystem hinsichtlich Änderungen der GPU-Mietpreise aufrechtzuerhalten.

Seit 2023 haben wir für unsere Kunden ein Preisindexsystem für GPU-Miete eingerichtet und gepflegt, das gängige GPU-Modelle wie H100, H200, B200, B300, GB200, GB300, MI300, MI325, MI355 sowie verschiedene Mietbedingungen von kurzfristigen Einmonatsmieten bis hin zu verlängerten 5-Jahres-Verträgen abdeckt. Dieser Index basiert auf Forschungsdaten von mehreren Neocloud-Dienstleistern und Rechenleistungskäufern und wurde durch tatsächliche Transaktionsdaten und von uns vermittelte Verhandlungsergebnisse validiert.

Heute stellen wir den H100-Preisindex für die einjährige GPU-Miete der Öffentlichkeit zur Verfügung, um der Branche mehr Daten und Erkenntnisse zu liefern. Dieser Index wird monatlich aktualisiert, und wir werden auch weiterhin die neuesten Trendanalysen und Marktbeobachtungen über X und LinkedIn veröffentlichen. Umfassende Preisdaten, die verschiedene Leasingstrukturen und andere gängige GPU-Modelle abdecken, sind derzeit nur für institutionelle Nutzer verfügbar, die unser KI-Cloud-TCO-Modell abonniert haben.

Dieser Bericht konzentriert sich auf die neuesten Trends auf dem Markt für GPU-Vermietung, Beobachtungen aus erster Hand und wichtige Daten, um zu analysieren, wie wir die Gesamtmarktstruktur verstehen und eine erste Einschätzung der zukünftigen Mietpreisentwicklung vornehmen können.

Der GPU-Mietmarkt tritt in die Phase der "dynamischen Preisgestaltung" ein.

Ein Blick auf die einjährige Mietpreisentwicklung des H100 reicht nicht aus, um das Ausmaß der Marktspannungen vollständig zu erfassen – die tatsächlichen Erfahrungen bei der Beschaffung von Rechenleistung an vorderster Front und das Feedback der Marktteilnehmer spiegeln eine deutlich ernstere Situation wider.

Die aktuelle Nachfrage resultiert aus einer Vielzahl sehr unterschiedlicher Anwendungsszenarien, für die es praktisch keine „Einheitslösung“ gibt. Auf der Inferenzseite eignen sich beispielsweise groß angelegte Mixture-of-Experts-Modelle (MoE) besser für die Ausführung auf den neuesten Großrechnersystemen wie dem GB300 NVL72; und auf der Trainingsseite behält der H100 nach wie vor seinen Vorteil in puncto Kosteneffizienz, sodass die Nachfrage auch für eine vergleichsweise „ältere Generation“ von GPUs hoch bleibt.

Kunden zahlen jetzt sogar bereitwillig bis zu 14 US-Dollar pro GPU und Stunde für AWS p6-b200 Preemptible Instances; einige führende Neocloud-Service-Provider haben den Verkauf einzelner Knoten eingestellt; einige H100-Vertragsverlängerungspreise sind die gleichen wie bei Vertragsabschluss vor zwei bis drei Jahren; und einige H100-Verträge wurden direkt bis 2028 verlängert, mit einer Laufzeit von bis zu 4 Jahren. Mittlerweile ist es nicht einfach, überhaupt noch einen H100- oder H200-Cluster mit 8 Knoten (64 GPUs) zu finden – die Hälfte der von uns angefragten Serviceanbieter ist komplett ausverkauft, und die meisten Serviceanbieter antworten, dass in absehbarer Zeit keine GPUs mit Hopper-Architektur auslaufen und neu aufgelegt werden.

Wir haben sogar gehört, dass einige Mieter von Rechenleistung damit beginnen, die von ihnen gemieteten Cluster aufzuteilen und unterzuvermieten, ähnlich wie man während des Großen Preises von Monaco eine Wohnung aufteilt und untervermietet. Werden wir als nächstes das Aufkommen sogenannter „Neocloud-Untervermieter“ erleben? Es ist wohl nicht mehr nur ein Witz.

Auch bei Blackwell ist das Angebot extrem knapp. Wir haben erfahren, dass sich der Bereitstellungs- und Lieferzyklus einer neuen Charge von Blackwell-Clustern aufgrund der starken Nachfrage nach Open-Source-Gewichtsmodellen und der anhaltend explosionsartigen Nachfrage nach Inferenz auf Juni bis Juli verlängert hat. Darüber hinaus sind die meisten dieser bevorstehenden Cluster bereits vorgebucht. Tatsächlich ist, wenn man den gesamten Markt betrachtet, die zusätzliche Kapazität, die erst im August bis September 2026 zur Verfügung stehen wird, nahezu vollständig ausgebucht.

GPU-Mietpreise: Ein Comeback feiern

Doch wie kam es zu dieser Marktsituation? Noch vor sechs Monaten hegten die meisten Marktbeobachter eine skeptische Haltung gegenüber dem „Endwert“ von GPUs und glaubten im Allgemeinen, dass die Mietpreise für GPUs im Laufe der Zeit unweigerlich weiter sinken würden. Würde ein Neocloud- oder Hyperscale-Cloud-Anbieter zu jener Zeit einen 6-jährigen Abschreibungszyklus für GPU-Computing-Anlagen in seinem Finanzmodell anwenden, würde er sogar von Finanzanalysten kritisiert werden. Bevor wir über zukünftige Trends sprechen, wollen wir kurz rekapitulieren, wie sich die Dinge bis heute entwickelt haben.

Bis zur zweiten Hälfte des Jahres 2025 ging man im gesamten Ökosystem allgemein davon aus, dass mit dem weitverbreiteten Einsatz von Blackwell und den deutlich niedrigeren Rechenkosten pro Einheit die Leasingpreise für Hopper (d. h. H100 und H200) stark sinken würden. Die Realität erwies sich jedoch als genau das Gegenteil. In der zweiten Jahreshälfte 2025 hat sich die Nachfrage nach H100 nicht nur nicht abgeschwächt, sondern in vielen Szenarien sogar noch verstärkt. Die rasche Einführung von Open-Weight-Modellen und die stetig steigende Nachfrage nach Inferenz waren zu dieser Zeit die ersten Anzeichen für diese schier endlose Welle des Bedarfs an Rechenleistung.

Im Januar 2026 erlebte der Markt für Rechenleistung den nächsten Wendepunkt: Nach mehreren Quartalen rasanten Anstiegs begannen die Preise für DRAM- und NAND-Speicher in eine fast parabolische Aufwärtsphase einzutreten. Gemäß unserem Speichermodell stiegen die Vertragspreise für LPDDR5 und DDR5 im ersten Quartal 2026 im Vergleich zum Vorjahr um fast das Vierfache bzw. Fünffache.

Um dem starken Anstieg der Komponentenkosten und den damit verbundenen Gewinnmargenrisiken entgegenzuwirken, begannen die OEM-Hersteller, die Preise für KI-Server zu erhöhen, wobei die Preiserhöhungen deutlich höher ausfielen als die der zugrunde liegenden Komponenten selbst. Dies machte die Investitionsentscheidungen für Cluster komplexer: Die höheren Serverbeschaffungskosten drückten die erwarteten Renditen der Projekte und zwangen einige Betreiber, die Einführung zu verlangsamen oder sogar geplante Projekte ganz aufzugeben. Infolgedessen wurde ein Teil des ursprünglich geplanten zusätzlichen Angebots, das hätte in Betrieb genommen werden können, verschoben oder ganz auf Eis gelegt, was die angespannte Lage auf dem Leasingmarkt weiter verschärfte.

In diesem Beschaffungschaos, das durch die „unkontrollierte Preisgestaltung für KI-Server“ ausgelöst wurde, beschleunigte sich die Nachfrage nach GPU-Leasing erheblich, und die verbleibende Rechenleistung auf dem Markt wurde im Januar und Februar fast vollständig absorbiert. Bis März gab es kaum noch freie Kapazitäten, egal ob für H100, H200 oder B200, unabhängig von der Mietdauer. Der Preis für einjährige Leasingverträge hatte Ende Januar bereits 2 US-Dollar pro GPU und Stunde überschritten und stieg in der zweiten Februarhälfte gegenüber Ende Januar nochmals um 15–20 %. Bis Ende März wird ein weiterer Anstieg von 15–20 % gegenüber dem Vormonat erwartet.

Einer der Haupttreiber der Nachfrage zu Jahresbeginn in diesem Jahr war die Generation der nativen Medien. Anwendungen wie Seedance und Nano Banana treiben die Nutzer dazu an, Bilder und Videos in großem Umfang zu generieren und zu bearbeiten, wodurch der Token-Durchsatz deutlich erhöht wird. Die wichtigere und sichtbare Quelle der Nachfrage ist jedoch der Anstieg von Multiagenten-Workloads – Systeme, die mehrstufige Prozesse ausführen, kontinuierlich in Umgebungen mit hoher Parallelität iterieren und den Tokenverbrauch sowie den Bedarf an Rechenleistung zu einem „exponentiellen“ Wachstum führen.

Dieser Trend ist besonders deutlich in den Daten von Claude Code zu erkennen, wie wir bereits in mehreren Artikeln erwähnt haben. Nehmen wir SemiAnalysis als Beispiel: Allein in den letzten 7 Tagen hat das Unternehmen intern mehrere zehn Milliarden Token verbraucht, wobei die durchschnittlichen Kosten bei etwa 5 US-Dollar pro Million Token lagen. Die Zeitersparnis, die Erweiterung der Arbeitsabläufe und die verbesserten Funktionen überwiegen jedoch bei Weitem die Kosten. Heute hat SemiAnalysis eine vollständige Reihe von KI-Tools in verschiedene Arbeitsabläufe integriert, die sich nicht mehr auf einfache Suche und Zusammenfassung beschränken, sondern auf Daten-Dashboards, automatisiertes Scraping, groß angelegte Datenverarbeitung und agentenbasierte Finanzmodellierungsszenarien ausgeweitet wurden.

Wir verfolgen das explosive Wachstum dieser Nachfrage auch anhand von Kennzahlen wie Claudes täglichen Commitments, um diesen Trend zu beobachten. Bei der aktuellen Entwicklungsrate gehen wir davon aus, dass Claude Code bis Ende 2026 über 20 % aller Code-Commits ausmachen wird. Man kann sagen, dass KI, ohne dass Sie es merken, bereits begonnen hat, den gesamten Softwareentwicklungsprozess zu "verschlingen". Institutionelle Kunden, die an einem Zugriff auf diesen Datensatz interessiert sind, wenden sich bitte an unser API-Team. Kleiner Spoiler: Das Commit-Volumen ist bereits deutlich höher als zum Zeitpunkt unseres ursprünglichen Starts.

In unserem Umfeld nutzt fast jeder Claude Code intensiv. Uns ist aber auch bewusst, dass dieser Kreis selbst tief im Bereich der KI und der Halbleitertechnik verwurzelt ist, im Grunde genommen nur „eine kleine Gruppe an der Spitze“.

Für viele Fortune-500-Unternehmen und die breite Öffentlichkeit sind Claude Code und die „Agentenwelt“ lediglich ein etwas ungewöhnliches Randthema, das gelegentlich im Facebook-Feed oder in NPR-Podcasts auftaucht. Sie haben kaum begriffen, dass eine von Akteuren ausgelöste Produktivitätswelle und ein struktureller Schock bevorstehen.

Da immer mehr Akteure der Realwirtschaft den erstaunlichen Return on Investment der Nutzung von KI-Tools erkennen und sich dieser „Rechenleistungswelle“ anschließen, wird der Token-Konsum weiterhin schrittweise ansteigen. Die Debatte um den ROI von KI-Investitionen ist im Grunde beigelegt – der durch den Einsatz von KI-Tools geschaffene Wert übersteigt deren Kosten oft um ein Vielfaches. In diesem Kontext bildet die anhaltende Rechtsverschiebung der Token-Nachfragekurve eine starke und (zum jetzigen Zeitpunkt) relativ unelastische Kraft, die die GPU-Mietpreise kontinuierlich nach oben treibt.

Vereinfacht ausgedrückt: Wenn der ROI des Einsatzes von KI-Tools das 5- bis 10-fache erreichen kann, dann haben die Mietpreise für GPUs noch erhebliches Aufwärtspotenzial, bevor sie die Nachfrage wirklich einschränken. Wir schließen auch nicht aus, dass weitere Mietpreiserhöhungen sich weiterhin auf vorgelagerte Bereiche auswirken und die Kosten für Server und Kernkomponenten in die Höhe treiben werden.

SemiAnalysis H100 Einjahres-Leasingpreisindex veröffentlicht

Heute stellen wir den Preisindex für einjährige Leasingverträge der H100 von SemiAnalysis der Öffentlichkeit kostenlos zur Verfügung, um das Marktbewusstsein und die Transparenz der Preisentwicklung im Bereich GPU-Leasing zu verbessern.

Dieser Index basiert auf monatlichen Umfragedaten von über 100 Marktteilnehmern, darunter Neocloud-Dienstleister, Käufer und Verkäufer von Hashpower, um eine repräsentative Spanne (25. bis 75. Perzentil) der GPU-Leasingpreise zu ermitteln. Zusätzlich führen wir eine Kreuzvalidierung mit tatsächlichen Transaktionsdaten durch und ermöglichen Handelsgeschäfte innerhalb unseres Netzwerks, um die Preisniveaus weiter zu kalibrieren.

Seit 2023 beobachten wir die Vertragspreise für GPUs, darunter H100, H200, B200, B300, GB200 und GB300, über Leasingzeiträume von 3 Monaten bis 5 Jahren; wir haben auch Daten zu AMD-Serien (MI300, MI325, MI355) einbezogen.

Im Vergleich zu bestehenden GPU-Indizes auf dem Markt weist der H100-Einjahresleasingvertragspreisindex von SemiAnalysis einige wesentliche Unterschiede auf:

Erstens basieren viele GPU-Leasing-Indizes auf Spot-/On-Demand-Angeboten oder öffentlichen Listenpreisen, aber in Wirklichkeit werden die meisten GPU-Leasing-Transaktionen über langfristige Verträge abgewickelt, oft mit einer Laufzeit von 6 Monaten oder mehr. Diese Preise werden üblicherweise durch bilaterale Verhandlungen festgelegt und nicht öffentlich bekannt gegeben. Die meisten großen Neocloud-Dienstleister bevorzugen Mietverträge mit einer Laufzeit von mindestens einem Jahr, wobei 2-3 Jahre üblicher sind, und idealerweise wird ein groß angelegter Großhandelsvertrag über 5 Jahre abgeschlossen. Der H100-Einjahresleasingindex von SemiAnalysis konzentriert sich auf diesen „Vertragsmarkt“ – den liquidesten Teil des Marktes. Durch die explizite Ausrichtung auf eine bestimmte Mietdauer ist es für die Nutzer einfacher, das abgedeckte Marktsegment zu verstehen und es mit ihren eigenen Beobachtungen zu vergleichen.

Zweitens stellen die öffentlich bekanntgegebenen Preise nicht die tatsächlichen Transaktionspreise dar. Die von Hyperscale-Cloud-Anbietern und Neocloud veröffentlichten Preise geben eher Trends als tatsächliche Handelsniveaus wieder. Diese Preise hinken oft den Veränderungen am Vertragsmarkt hinterher und werden typischerweise erst angepasst, nachdem sich die Nachfrage nach Hashpower verändert hat. Insbesondere im On-Demand-Markt werden die Preise in der Regel auf einem relativ festen Niveau festgelegt, wobei sich tatsächliche Angebots- und Nachfrageänderungen durch die Auslastung bzw. Ressourcennutzung widerspiegeln und Anpassungen nur unregelmäßig und bei Bedarf vorgenommen werden. Weitere Einzelheiten zu diesem Marktmechanismus werden in den nachfolgenden Abschnitten dieses Artikels behandelt.

Obwohl es auf dem Markt viele Indizes gibt, die große Mengen an Kurs-, Preis- und Handelsdaten verarbeiten können und einen Vorteil bei der Trendanalyse haben, legt unser Ansatz Wert auf die direkte Interaktion mit den Marktteilnehmern. Hinter jedem Angebot und jedem Handel stehen der jeweilige Kontext und die zugrunde liegende Entscheidungslogik. Wir hoffen, neben diesen qualitativen Informationen und Beobachtungen aus erster Hand auch quantitative Daten präsentieren zu können, um die wahre Struktur des GPU-Leasingmarktes umfassender darzustellen.

Für institutionelle Abonnementnutzer bieten wir außerdem vollständige Laufzeitstrukturdaten an, die nahezu alle gängigen GPU-Leasingmärkte abdecken.

Parallel zur Veröffentlichung des einjährigen Vertragspreisindex für den H100 haben wir auch das SemiAnalysis Tokenomics Dashboard für institutionelle Tokenomics-Modellabonnenten eingeführt, um die Landschaft der fortschrittlichen KI-Modelle zu verfolgen und zu verstehen. Dieses Dashboard unterstützt Benutzer bei benutzerdefinierten Vergleichen über verschiedene Dimensionen hinweg, wie z. B. Code, Inferenz, Mathematik und KI-Agentenbewertung, beim Vergleich der API-Preise verschiedener Modelle und Dienstanbieter sowie bei der Anzeige wichtiger Daten, die von großen KI-Laboren veröffentlicht werden, einschließlich Token-Nutzung, Umsatz, Bewertung und Kundenstamm.

Aktuelle Struktur des GPU-Leasingmarktes

Bis zur zweiten Hälfte des Jahres 2025 war das Preisumfeld auf dem Markt für GPU-Leasing vergleichsweise wettbewerbsintensiver. Zu dieser Zeit verfügten die Betreiber über deutlich größere GPU-Bestände, während die Endnachfrage gerade erst zu steigen begann. Daher war der Wettbewerb zwischen den verschiedenen Neocloud-Dienstleistern sehr intensiv; im Allgemeinen wetteiferten sie um Kunden mit attraktiveren Preisen. Das Hauptziel bestand darin, die Auslastung zu erhöhen und den Wert der vorhandenen Rechenleistungsressourcen vor dem nächsten GPU-Iterationszyklus vollständig auszuschöpfen.

Die Marktlandschaft hat sich jedoch seither um 180 Grad gewandelt. Heute haben Neocloud- und Hyperscale-Cloud-Anbieter die volle Kontrolle übernommen – ihr Hauptziel ist es, die Auslastung vor dem nächsten GPU-Iterationszyklus so weit wie möglich zu steigern und den Wert ihrer bestehenden Rechenleistungsressourcen auszuschöpfen. Sie können höhere Vorauszahlungen, bessere Preise, längere Vertragslaufzeiten fordern und sogar die Start- und Endzeiten der Verträge an ihre Lager- und Kapazitätsvereinbarungen anpassen. Gleichzeitig spielt die Zeit auch der Angebotsseite in die Hände: Sie können in ihrem eigenen Tempo agieren und in einem Umfeld steigender Preise schrittweise den besten Kundenmix auswählen.

Strukturell lässt sich der Markt für GPU-Leasing grob in drei Hauptsegmente unterteilen, wobei jedes Segment unterschiedlichen Kundenbedürfnissen entspricht:

Kurzzeitvermietung: On-Demand-, Spot- und Vertragslaufzeiten von weniger als 3 Monaten

Mittelfristige Verträge: Verträge mit einer Laufzeit von 3 Monaten bis über 3 Jahren

Abnahmevereinbarung: Ein Vertrag mit einer Laufzeit von 4 bis 5 Jahren, wobei 5 Jahre die häufigste Dauer sind.

Kurzzeitmietvertrag: On-Demand-, Spot- und Vertragslaufzeiten von weniger als 3 Monaten

Kurzfristiges Leasing steht am Anfang der gesamten Leasingstruktur und entspricht oft einer „Überkapazität“. Einige Dienstleister (wie Runpod, Lambda) konzentrieren sich jedoch darauf, substanzielle und flexible On-Demand- oder Spot-Rechenleistung bereitzustellen.

Es ist wichtig zu beachten, dass sich der Preisbildungsmechanismus im On-Demand-Markt deutlich von anderen Vertragsmärkten unterscheidet. Typischerweise legen Dienstanbieter ein relativ festes Preisniveau für On-Demand-Ressourcen fest und passen es nur in sehr wenigen Fällen an. Mit anderen Worten: Der Preis am kurzfristigen Markt wird nicht ausschließlich durch Angebot und Nachfrage in Echtzeit bestimmt, sondern spiegelt vielmehr die Marktverknappung durch Veränderungen in der Ressourcennutzung wider.

Die Dienstleister passen die Preise in der Regel einmalig an die Ressourcenauslastung an: Bei geringer Auslastung senken sie die Preise, um die Nachfrage anzukurbeln, und bei nahezu voller Auslastung erhöhen sie die Preise, da die Nachfrage auch bei einem höheren Preisniveau hoch bleibt.

Dies erklärt auch, warum die On-Demand-Preise von Neocloud in einer Zeitreihenanalyse oft über einen langen Zeitraum unverändert bleiben und dann plötzlich einen sprunghaften Anstieg oder Rückgang erfahren. Im On-Demand-Markt spiegelt nicht der Preis, sondern die Ressourcenauslastung die Nachfrageänderungen in hoher Frequenz wider.

Quelle: Lambda Labs, SemiAnalysis

---Preis

--

Mittelfristige Verträge

Aus ökonomischer Sicht ist der „Vertragsmarkt“ von entscheidenderer Bedeutung, da der überwiegende Teil des Transaktionsvolumens im Bereich GPU-Leasing in diesem Segment anfällt. Unter diesen ist der 1-Jahres-Vertrag von besonderer Bedeutung – er spiegelt sowohl die marginale Nachfrage von Kunden aus Nicht-KI-Laboren als auch die Überschussnachfrage von Großkunden wider und ist somit der sensibelste Indikator für eine Marktverknappung.

KI-native Unternehmen und kleine bis mittelgroße KI-Labore sind hauptsächlich im 1- bis 3-Jahres-Bereich aktiv. Ein bemerkenswerter Trend der letzten Zeit ist jedoch, dass diese Institutionen auch versuchen, Rechenressourcen durch längerfristige Verträge zu sichern – viele davon haben eine Laufzeit von über 4 Jahren und sie sind sogar bereit, eine Vorauszahlung von über 20 % zu leisten, was bei Verträgen mit einer Laufzeit von über 4 Jahren in der Vergangenheit nicht üblich war.

Langfristige Abnahmen

Im längerfristigen Markt mit einer Laufzeit von 4–5 Jahren sind die dominierenden Akteure große KI-Labore, die sich frühzeitig umfangreiche Rechenressourcen sichern. Diese Transaktionen entsprechen typischerweise Clustern von 50 MW, 100 MW oder sogar noch größeren Einheiten, was ungefähr 24.000 bis 48.000 GB300 NVL72 GPUs entspricht. Insgesamt haben solche langfristigen Abnahmeverträge einen bedeutenden Anteil am Neocloud-GPU-Leasingmarkt erobert.

KI-Labore bevorzugen diese Verträge, weil sie sich so auf einen Schlag umfangreiche Rechenressourcen sichern können, um der schnell wachsenden Nachfrage der Endnutzer gerecht zu werden. Gleichzeitig beschäftigen sich diese Institutionen häufig intensiv mit der Clusterentwicklung, einschließlich wichtiger Aspekte wie Speicherung, Netzwerk, CPU-Konfiguration und mehr. Diese Transaktionen werden oft in **Bare-Metal**-Form abgewickelt, da KI-Labore über ausreichende Engineering-Kapazitäten verfügen, um den Tech-Stack auf einer niedrigeren Ebene anzupassen und so die optimalen Gesamtbetriebskosten (TCO) und die beste Performance zu erzielen.

Für Neocloud-Dienstleister sind diese Transaktionen ebenfalls attraktiv. Zum einen können sie ihre Vertriebsressourcen auf wenige Großaufträge konzentrieren, ohne sich mit zahlreichen Kleinkunden auseinandersetzen zu müssen, und trotzdem den gleichen Umsatz erzielen. Andererseits ermöglichen langfristige Verträge auch bessere Konditionen für die Fremdfinanzierung – indem sie die Finanzierungslaufzeit an die Vertragslaufzeit anpassen, können sie Laufzeitdiskrepanz und Preisschwankungen wirksam reduzieren und in den meisten Fällen den internen Zinsfuß (IRR) des Projekts um zweistellige Prozentpunkte sichern.

Darüber hinaus fungieren Hyperscaler in diesem Prozess oft als eine Art „Auffangnetz“ – sie treten als direkte Käufer auf, erwerben Rechenleistung von Neocloud und verkaufen diese an KI-Labore weiter. Diese Struktur ist für alle Beteiligten ein Gewinn: Neocloud kann bessere Finanzierungsbedingungen durch Käufer mit AAA-Rating erzielen, während Hyperscaler an den Projektrenditen partizipieren können, indem sie Kreditgarantien übernehmen, ohne ihre Bilanzen zu erweitern.

Die folgende Tabelle gibt einen Überblick über einige der großen Abnahmeverträge, die wir beobachten. Wir werden eingehende Analysen dieser Transaktionen durchführen, um den impliziten GPU-Stundenpreis ($/Std./GPU) sowie wichtige Rentabilitätskennzahlen wie den internen Zinsfuß (IRR) und die EBIT-Marge des Projekts zu ermitteln.

Im aktuellen Marktumfeld wird die überwiegende Mehrheit der expandierenden großen KI-Cluster tatsächlich von KI-Laboren „intern verbraucht“. Allerdings treten diese Institutionen weiterhin in den Markt für Verträge mit einer Laufzeit von unter vier Jahren ein, um ihre Rechenleistung zu ergänzen, und verhindern indirekt, dass das Angebot wieder auf den Markt kommt, indem sie bestehende H100- und H200-Cluster erneuern. Mit der schrittweisen Einführung der GB200- und GB300-Super-Large-Cluster wird die Entwicklung des Angebots-Nachfrage-Verhältnisses auf dem Markt für 1- bis 3-Jahres-Verträge in naher Zukunft eine wichtige Variable sein, die es zu beobachten gilt.

„Wohin der Puck geht“

Die derzeit interessanteste Entwicklung ist die offensichtliche Diskrepanz zwischen der zugrundeliegenden Realität und der Marktstimmung. Trotz deutlicher Anzeichen für Angebotsengpässe und Preissteigerungen (die sich alle positiv auf Neocloud auswirken – Margenausweitung und Verlängerung der Anlagenlebensdauer) sind die öffentlichen Märkte zunehmend pessimistischer gegenüber Unternehmen wie CoreWeave, Nebius und Iris Energy geworden, deren Aktienkurse immer noch nahe den Tiefstständen der letzten 6–12 Monate verharren.

Der Markt wird weiterhin von der Erzählung einer „ultimativen Überversorgung und Kommerzialisierung von Hash-Leistung“ dominiert, wobei die erwähnten Änderungen die Bedenken der Anleger hinsichtlich des langfristigen Wertes von GPUs nicht ausräumen konnten. Doch in der Praxis führt die anhaltende Angebotsknappheit und die gestiegene Preissetzungsmacht dazu, dass nahezu die gesamte Hashpower von der Nachfrage absorbiert wird – selbst bei Leistungsunterschieden ist es im gegenwärtigen Umfeld extremer Knappheit eindeutig, dass die Nachfrage das Angebot übersteigt.

Drei wichtige Beobachtungen für die Zukunft

Um abzuschätzen, ob die Preise für GPU-Leasing weiterhin hoch bleiben werden, sollten Sie sich auf drei Schlüsselfaktoren konzentrieren:

1. Ausbautempo des GB300-Clusters (2026)
Entscheidend ist das Verhältnis zwischen neu hinzugekommener Hash-Leistung und Token-Nachfrage – ob das Angebot die Knappheit lindert oder die Nachfrage das Angebot weiterhin übersteigt. Dies wird sich direkt darauf auswirken, ob KI-Labore weiterhin im Markt für Projekte mit einer Laufzeit von unter vier Jahren aktiv sein werden und wie sich die Preise in diesem Bereich entwickeln.

2. Weitere Verschlechterung der Chipknappheit
Dies umfasst die N3-Prozesskapazität von TSMC, HBM, DRAM, NAND und andere kritische Verbindungen, bei denen jegliche Schwankungen auf Fertigungsebene das Angebot weiter verknappen könnten.

3. Jährliche wiederkehrende Einnahmen (ARR) und Wachstumsrate des Token-Konsums von AI Lab
Die Kommerzialisierung von KI und der Umfang ihrer Nutzung bestimmen die Intensität der Endnachfrage, die eine zentrale Variable für die Nachfrage nach Hashpower darstellt.

Einseitige Preisbewegung mit erhöhten Renditen

Insgesamt lässt sich relativ eindeutig feststellen, dass die Wahrscheinlichkeit eines weiteren Anstiegs der GPU-Leasingpreise höher ist als die Wahrscheinlichkeit eines Rückgangs.

Dieser Prozess weist eine klare selbstverstärkende Eigenschaft auf: Sobald Neocloud eine Verknappung des Angebots und steigende Preise feststellt, sichert sich das Unternehmen im Voraus mehr Hardware, wodurch das Marktangebot weiter verknappt und die Preise noch weiter in die Höhe getrieben werden. Dies ist vergleichbar mit dem GPU-Mangelzyklus von 2023–2024, in dem Lieferengpässe zu einer deutlichen Margenausweitung für OEMs und erheblichen Preiserhöhungen bei Servern führten (wobei sich dieser Prozess in diesem Zyklus mit einer höheren Marktreife möglicherweise nicht vollständig wiederholt).

Gleichzeitig verbessert die erneute Erhöhung der GPU-Mietpreise auch die Kapitalrendite (ROIC) von Neocloud:

Zum einen hat es die Gewinnspanne der eingesetzten Vermögenswerte erhöht.

Andererseits hat es die wirtschaftliche Nutzungsdauer der GPUs verlängert und ermöglicht es dem Kapital, über einen längeren Zeitraum Cashflow zu generieren.

Wer profitiert derzeit am meisten?

Die unmittelbarsten Nutznießer sind derzeit die Hash-Power-Anbieter mit folgenden Eigenschaften:

• Hauptsächlich auf kurzfristige Verträge ausgerichtet (was eine schnelle Preisanpassung ermöglicht)

• Besitzen Sie einen großen Bestand an H100-Produkten?

• Neue Kapazitäten werden in Kürze in Betrieb genommen

Die kurze Vertragslaufzeit von Neocloud ermöglicht die schnelle Auflösung alter Verträge und deren Neuverhandlung zu höheren Preisen, was zu einer raschen Gewinnsteigerung führt. Gleichzeitig werden auch die großen Cloud-Anbieter, die sich Hash-Leistung der nächsten Generation gesichert haben (mehrjährige Verträge), im zukünftigen Zyklus profitieren.

Die Frage ist also: Wird es diesmal wirklich „anders“ sein?

[ Link zum Originalartikel ]

Das könnte Ihnen auch gefallen

In einem 70-seitigen vertraulichen Schreiben wird erstmals der Vorwurf der „Lüge“ erhoben; Altman erklärt dem Vorstand: „Ich kann meine Persönlichkeit nicht ändern“

Ich spüre jeden Tag die Last dieser Verantwortung

Wie beherrscht man Claude Cowork vollständig?

Ein System, mit dem KI für Sie arbeitet, anstatt mit Ihnen zu chatten

Beginnt die Altcoin-Saison erst 2026? Worauf Händler jetzt achten sollten

Die Anzeichen für eine Altcoin-Saison werden im Jahr 2026 deutlicher, da sich die Kapitalrotation auf den Kryptomärkten beschleunigt. Hier erfahren Sie, worauf Händler achten sollten und wie sich die strategiebasierte Teilnahme im aktuellen Marktzyklus entwickelt.

Bitcoin-ETF-Zuflüsse im Jahr 2026: Auswirkungen auf den Bitcoin-Preis und Kryptomarkttrends

Die Zuflüsse in Bitcoin-ETFs werden die BTC-Preisentwicklung und die Liquidität des Kryptomarktes im Jahr 2026 verändern. Erfahren Sie, wie institutionelles Kapital die Volatilität, das Handelsverhalten und die Portfolioallokationsstrategien auf den Kryptomärkten beeinflusst.

Börsenumschlag

Die Finanzbranche entwickelt sich wie immer weiter und wird jede Struktur übernehmen, die die Lücke zwischen dem Eintreten von Ereignissen und der Preisbildung von Meinungen verringern kann.

Visas Stablecoin-Strategie: Karten, Abrechnung und Zukunft

Damals betrachtete das Team Kryptowährung nicht mehr als „Kartenprodukt“, sondern begann, Stablecoins als eine echte Lösung zu sehen, die in der Lage ist, reale Probleme zu lösen.

Beliebte Coins

Neueste Krypto-Nachrichten

Mehr lesen