Analyse: Huang Renxun muss Groqs Integrationsstrategie heute noch unter Beweis stellen, sonst wird sich die Erzählung vom kundenspezifischen Chip durchsetzen.
Laut Recherchen von 1M AI News veröffentlichte der prominente Branchenanalyst Patrick Moorhead vor der Eröffnung der GTC 2026 eine ausführliche Analyse, deren wichtigste Schlussfolgerung lautete: Die wahre Bewährungsprobe für Huang Renxuns heutige Rede wird sein, ob er einen vollständigen Fahrplan für den kollaborativen Betrieb von Trainings-GPUs, Inferenzbeschleunigern, Groq-Decodierungsprozessoren und CPUs unter einer einheitlichen Softwareschicht aufzeigen kann. Ein Erfolg würde die GTC 2026 als Abschluss der Plattformtransformation von NVIDIA markieren; ein Misserfolg würde den Fokus auf die hauseigene Chipentwicklung von Hyperscale-Cloud-Anbietern lenken.
Die von ihm dargelegten bestätigten Fakten lauten wie folgt: Das Vera Rubin NVL72 Rack (72 Rubin GPUs + 36 Vera CPUs, NVLink 6 mit 3,6 TB/s pro GPU-Verbindung) wurde in den vier Cloud-Fabriken von AWS, Google Cloud, Microsoft und Oracle implementiert, wobei die Massenproduktion in der zweiten Jahreshälfte hochgefahren wird. Die Rubin GPU, mit der 1,6-fachen Transistoranzahl von Blackwell, erzielt die fünffache Inferenzleistung und erreicht 50 Petaflops für Inferenz und 35 Petaflops für Training. Die 20 Milliarden US-Dollar schwere Übernahme von Groq wurde abgeschlossen. Dabei kam ein nicht-exklusives Lizenzmodell zum Einsatz, wodurch Gründer Jonathan Ross und rund 80 % des Entwicklerteams übernommen wurden. Dies übertrifft den Umfang der 7 Milliarden US-Dollar schweren Mellanox-Übernahme im Jahr 2019.
Moorheads Vorhersagen für die heutige Rede: Offizielle Markteinführung von NemoClaw (NVIDIAs Open-Source-Plattform für KI-Agenten in Unternehmen); Präsentation der Roadmap für die Feynman-Architektur 2028, die laut Analystenberichten den A16 1,6-nm-Prozess von TSMC übernehmen wird; Ross wird voraussichtlich ebenfalls auf der Bühne stehen.
Er wies außerdem auf drei Risiken hin: Die Integration von Groq auf Hyperscale-Cloud-Niveau ist noch nicht validiert, und die Investition von 20 Milliarden Dollar in unerprobte Technologie ist kostspielig; Energieengpässe sind die größte Variable für 2027, wobei sich fast 40 % der neuen Rechenzentren im energiereichen Texas konzentrieren, Küstenregionen jedoch mit echten Engpässen konfrontiert sind; Der Marktanteil von NVIDIA im Bereich KI für Rechenzentren wird voraussichtlich in den nächsten zwei Jahren von über 90 % auf rund 70 % sinken.
