Das Label für Jugendliche aus Kleinstädten, das große KI-Modelle kennzeichnet

By: blockbeats|2026/04/07 13:05:34
0
Teilen
copy
Autor | Sleepy.md

In Datong, Shanxi, einer Stadt, die einst vom Kohlebergbau lebte und sich nun vom Kohlenstaub befreit hat, hat eine scharfe Spitzhacke die Kohlenminen ersetzt und steuert auf eine andere unsichtbare Mine zu.

Im Bürogebäude des Jinmao International Centers im Stadtbezirk Pingcheng gibt es keine Bergwerkschächte oder Kohle-Lkw mehr. Stattdessen gibt es Tausende von eng angeordneten Computerarbeitsplätzen. Das Shanghai Runxun Cloud Sonic Valley Big Data Smart Service Center erstreckt sich über mehrere Etagen, mit Tausenden von jungen Mitarbeitern, die Kopfhörer tragen, auf Bildschirme starren, klicken, ziehen und auswählen.

Laut offiziellen Daten hat die Stadt Datong bis November 2025 745.000 Server in Betrieb genommen, 69 Unternehmen zur Datenkennzeichnung eingeführt, mehr als 30.000 Menschen in Beschäftigung gebracht, mit einem Produktionswert von 750 Millionen Yuan. In dieser digitalen Mine sind 94 % der Praktizierenden Einheimische.

Es ist nicht nur Datong. In der ersten Charge von Datenkennzeichnungsbasen, die vom Nationalen Statistikamt identifiziert wurden, sind Landkreise in der westlichen Region wie der Landkreis Yonghe in Shanxi, Bijie in Guizhou und Mengzi in Yunnan aufgeführt. In der Datenkennzeichnungsbasis im Landkreis Yonghe sind 80 % der Mitarbeiter Frauen. Die meisten von ihnen sind ländliche Hausfrauen oder junge Menschen aus ländlichen Gebieten, die keine geeigneten Jobs finden können.

Vor hundert Jahren waren die Textilfabriken in Manchester, Großbritannien, mit landlosen Bauern überfüllt. Heute sitzen in den Computerbildschirmen dieser abgelegenen Landkreise junge Menschen, die in der realen Wirtschaft keinen Platz finden können.

Sie sind mit einer futuristischen, aber extrem primitiven Stücklohnarbeit beschäftigt, die die notwendigen Daten für die KI-Riesen in Peking, Shenzhen und im Silicon Valley produziert.

Niemand sieht darin ein Problem.

Eine neue Produktionslinie im Lössplateau

Das Wesen der Datenkennzeichnung besteht darin, Maschinen über die Welt zu lehren.

Autonomes Fahren muss Verkehrsampeln und Fußgänger erkennen, und große Modelle müssen zwischen Katzen und Hunden unterscheiden. Maschinen selbst haben keinen gesunden Menschenverstand und müssen von einem Menschen ein Kästchen auf dem Bild zeichnen lassen, um ihnen zu sagen: "Das ist ein Fußgänger", bevor sie lernen können, ihn zu erkennen, nachdem sie Millionen von Bildern verarbeitet haben.

Dieser Job erfordert kein hohes Bildungsniveau, sondern nur Geduld und einen Finger, der unermüdlich klicken kann.

Während des goldenen Zeitalters von 2017 konnte ein einfaches 2D-Kästchen mehr als einen Cent kosten, und einige Unternehmen boten sogar einen hohen Preis von einem halben Yuan an. Ein schnell klickender Etikettierer konnte fünf bis sechshundert Yuan verdienen, indem er zehn Stunden am Tag arbeitete. In der Kreisstadt wird dies definitiv als gut bezahlter und anständiger Job angesehen.

Aber als sich große Modelle weiterentwickelten, begann die harte Realität dieser Pipeline sichtbar zu werden.

Bis 2023 war der Stückpreis für einfache Bildannotationen auf 3 bis 4 Cent gesenkt worden, ein Rückgang von über 90%. Selbst bei herausfordernden 3D-Punktwolkenbildern, bei denen die Punkte so dicht sind, dass die Kanten erhebliches Vergrößern erfordern, um erkannt zu werden, müssen die Annotatoren sorgfältig ein dreidimensionales Kästchen im Raum zeichnen, das Länge, Breite, Höhe und Orientierungswinkel umfasst, um nahtlos ein Fahrzeug oder einen Fußgänger einzuschließen. Der Preis für ein so komplexes 3D-Kästchen beträgt jedoch nur 5 Cent.

Das Label für Jugendliche aus Kleinstädten, das große KI-Modelle kennzeichnet

Die direkte Folge dieses Preisverfalls ist eine dramatische Zunahme der Arbeitsintensität. Um ein monatliches Gehalt von zwei bis drei tausend Dollar zu halten, müssen die Annotatoren kontinuierlich und unermüdlich ihre Geschwindigkeit verbessern.

Das ist keineswegs ein einfacher Bürojob. In vielen Annotationseinrichtungen ist das Management so streng, dass es erstickend wirkt; den Mitarbeitern ist es nicht erlaubt, während der Arbeit Anrufe entgegenzunehmen, und Mobiltelefone müssen in Aufbewahrungsschließfächern eingeschlossen werden. Das System zeichnet akribisch jede Mausbewegung und die Leerlaufzeit jedes Mitarbeiters auf, und wenn es eine Unterbrechung von mehr als drei Minuten gibt, wird eine Backend-Warnung wie eine Peitsche zuschlagen.

Noch frustrierender ist die Toleranzrate. Die Bestehensquote der Branche liegt normalerweise über 95%, wobei einige Unternehmen sogar 98%-99% verlangen. Das bedeutet, dass, wenn Sie 100 Kästchen zeichnen und 2 Fehler machen, das gesamte Bild zur Nachbearbeitung zurückgeschickt wird.

Dynamische Bilder bestehen aus Frames, wobei Fahrzeuge die Spur wechseln und verdeckt werden, was die Annotatoren zwingt, ihre Vorstellungskraft zu nutzen, um jedes einzelne zu identifizieren; in 3D-Punktwolkenbildern muss jedes Objekt mit mehr als 10 Punkten eingekästelt werden. In einem komplexen Parkplatzprojekt, wenn die Linien zu lang sind oder etwas übersehen wird, wird die Qualitätskontrolle immer Fehler finden. Es ist üblich, dass ein Bild vier oder fünf Mal überarbeitet wird. Am Ende, nach einer Stunde Arbeit, verdient man nur ein paar Cent.

Eine Annotatorin in der Provinz Hunan hat ihre Abrechnung in sozialen Medien veröffentlicht, die zeigt, dass sie nach einem Arbeitstag über 700 Kästchen zu einem Preis von 4 Cent pro Stück gezeichnet hat und insgesamt 30,2 Yuan verdient hat.

Dies ist eine extrem fragmentierte Szene.

Auf der einen Seite stehen die glänzenden Tech-Giganten auf Konferenzen, die darüber diskutieren, wie AGI die Menschheit befreien wird; auf der anderen Seite, in Landkreisen auf dem Lössplateau und in den Bergen des Südwestens, starren junge Menschen acht bis zehn Stunden am Tag auf Bildschirme, zeichnen mechanisch Kästchen, Tausende, Zehntausende, und träumen sogar nachts, während ihre Finger die Fahrbahnmarkierungen in der Luft nachzeichnen.

Jemand sagte einmal, dass die Fassade der künstlichen Intelligenz ein brüllendes Luxusauto ist, aber wenn man die Tür öffnet, findet man hundert Menschen, die Fahrräder treten, die Zähne zusammenbeißen und hart treten.

Niemand denkt, dass daran etwas falsch ist.

Die Stücklohn-Handwerker lehren Maschinen "Wie man liebt".

Nach dem Durchbruch des Engpasses der Bilderkennung haben große Modelle eine tiefere Evolution durchlaufen und müssen lernen, zu denken, zu kommunizieren und sogar "Empathie" wie Menschen zu zeigen.

Dies hat den kritischsten und teuersten Teil des großangelegten Modelltrainings hervorgebracht — RLHF (Human Feedback-basiertes Verstärkungslernen).

Einfach ausgedrückt, geht es darum, dass echte Menschen die von KI generierten Antworten bewerten und ihr sagen, welche Antworten besser, mehr im Einklang mit menschlichen Werten und emotionalen Vorlieben sind.

Der Grund, warum ChatGPT "menschlich" aussieht, liegt darin, dass hinter ihm unzählige RLHF-Annotatoren stehen, die es unterrichten.

Auf Crowdsourcing-Plattformen sind solche Annotierungsaufgaben oft klar bepreist: ein Stückpreis von 3 bis 7 RMB. Annotatoren müssen extrem subjektive emotionale Bewertungen zu KI-Antworten abgeben, um zu beurteilen, ob die Antwort "warm", "einfühlsam" oder "rücksichtsvoll gegenüber den Emotionen des Nutzers" ist.

Jemand, der nur ein paar tausend RMB pro Monat verdient, der im Schlamm der Realität kämpft und kaum in der Lage ist, sich um die eigenen Emotionen zu kümmern, wird nun im System dazu aufgefordert, als emotionaler Mentor und Werte-Schiedsrichter der KI zu fungieren.

Sie müssen gezwungen werden, Wärme, Empathie und andere hochkomplexe, subtile menschliche Emotionen in kalte Bewertungen von 1 bis 5 zu zerlegen. Wenn ihre Bewertungen nicht mit den vordefinierten richtigen Antworten des Systems übereinstimmen, wird ihre Genauigkeit als unzureichend angesehen, was zu Abzügen von ihrem mageren Stücklohn führt.

Dies ist eine kognitive Belastung. Menschliche Emotionen, Moral und Mitgefühl, so komplex und nuanciert, werden gewaltsam in den Trichter des Algorithmus gepresst. Im eiskalten Bereich der Quantifizierung und Standardisierungsskalen werden sie ihrer letzten Wärme beraubt. Während Sie das cybernetische Ungeheuer auf dem Bildschirm bewundern, das gelernt hat, Gedichte zu schreiben, Musik zu komponieren, Fürsorge zu zeigen und sogar eine Haut melancholischer Sensibilität angelegt hat; hat sich die Gruppe einst lebhafter Menschen außerhalb des Bildschirms durch tägliche mechanische Urteile in gefühllose Bewertungsmaschinen zurückentwickelt.

Dies ist die geheimnisvollste Seite der gesamten Industrie, die niemals in Finanznachrichten oder technischen Fachartikeln erscheint.

Niemand denkt, dass daran etwas falsch ist.

985 Master-Abschlussinhaber vs. Jugend aus Kleinstädten

Niedrigqualifizierte Arbeiten am Fließband werden von den Tritten der KI zerdrückt, wodurch dieses cybernetische Förderband nach oben drängt und beginnt, höherwertige Gehirnarbeit zu verschlingen.

Der Appetit großer Modelle hat sich verändert. Sie sind nicht mehr damit zufrieden, sich mit grundlegenden Allgemeinwissen zu begnügen, sondern verlangen nun nach dem Verschlingen menschlicher Expertise und fortgeschrittener Logik.

Auf verschiedenen großen Jobportalen hat eine neue Art von Teilzeitjob begonnen, häufig zu erscheinen, wie "Logische Schlussfolgerungsannotation für große Modelle" und "AI-Geisteswissenschaftstrainer." Dieser Teilzeitjob hat eine extrem hohe Hürde, oft wird ein "Master-Abschluss oder höher von 985/211 Universitäten" gefordert und umfasst Fachgebiete wie Recht, Medizin, Philosophie und Literatur.

Viele Absolventen von renommierten Universitäten werden angezogen und schließen sich den Outsourcing-Gruppen dieser Technologieriesen an. Sie erkennen jedoch schnell, dass dies kein einfaches geistiges Training ist, sondern vielmehr eine Form mentaler Folter.

Bevor sie offiziell Aufgaben übernehmen, müssen sie Dutzende von Seiten mit Bewertungsdimensionen und Evaluierungskriterien lesen und zwei bis drei Runden von Testannotationen durchlaufen. Wenn sie die Standards erfüllen, werden sie während der formalen Annotation, wenn ihre Genauigkeit unter das Durchschnittsniveau fällt, ihre Qualifikation verlieren und aus dem Gruppenchat ausgeschlossen.

Am erdrückendsten ist, dass diese Standards überhaupt nicht festgelegt sind. Wenn man mit ähnlichen Fragen und Antworten konfrontiert wird, kann das Bewerten mit demselben Denkprozess völlig gegensätzliche Ergebnisse liefern. Es ist, als würde man an einer endlosen Prüfungsaufgabe arbeiten, für die es keine Standardantwort gibt. Die Genauigkeit kann nicht durch eigene Anstrengungen oder Studium verbessert werden; man kann sich nur endlos im Kreis drehen und sowohl geistige als auch körperliche Energie aufbrauchen.

Dies ist die neue Form der Ausbeutung im Zeitalter großer Modelle – Klassenfaltung.

Wissen, einst als goldene Leiter angesehen, um Barrieren zu durchbrechen und aufzusteigen, ist nun zu einem komplexeren digitalen Futter geworden, das Algorithmen zum Kauen angeboten wird. Angesichts der absoluten Macht von Algorithmen und Systemen haben die Masterstudenten von Eliteuniversitäten in ihren Elfenbeintürmen und die jungen Menschen aus Kleinstädten auf dem Lössplateau den seltsamsten Konvergenzweg eingeschlagen.

Gemeinsam stürzen sie in diese bodenlose Cyber-Mining-Grube, ihrer Heiligenscheine beraubt, Unterschiede auslöschend, alle zu billigen Zahnrädern auf dem Förderband verwandelt, die jederzeit ersetzt werden können.

Es ist im Ausland dasselbe. Im Jahr 2024 entließ Apple direkt ein 121-köpfiges Team für die Sprachannotation von KI in San Diego. Diese Mitarbeiter waren dafür verantwortlich, die mehrsprachigen Verarbeitungsfähigkeiten von Siri zu verbessern. Sie dachten einst, sie stünden am Kernrand des Geschäfts eines Technologieriesen, nur um sofort in den Abgrund der Arbeitslosigkeit zu stürzen.

In den Augen der Technologieriesen sind sowohl eine mittelalte Dame, die einen Lebensmittelladen in einem kleinen Landkreis betreibt, als auch ein Logiktrainer mit einer angesehenen Ausbildung grundsätzlich "Verbrauchsmaterialien", die jederzeit ersetzt werden können.

Niemand denkt, dass daran etwas falsch ist.

---Preis

--

Ein Billionen-Dollar-Turm von Babel, gebaut mit ein paar Cent Ausbeutung.

Laut Daten, die vom China Information and Communications Research Institute veröffentlicht wurden, erreichte der chinesische Markt für Datenannotation im Jahr 2023 ein Volumen von 6,08 Milliarden Yuan und wird voraussichtlich bis 2025 20-30 Milliarden Yuan erreichen. Es wird prognostiziert, dass die globalen Verkaufszahlen im Markt für Datenannotation und -dienstleistungen bis 2030 auf 117,1 Milliarden Yuan in die Höhe schnellen werden.

Hinter diesen Zahlen stehen Technologieriesen wie OpenAI, Microsoft und ByteDance, deren Bewertungen die Billionen-Dollar-Marke erreichen.

Diese himmelhohen Reichtümer sind jedoch nicht zu denen geflossen, die tatsächlich KI "füttern".

In Chinas Datenkennzeichnungsindustrie ist eine typische umgekehrte Pyramidenstruktur im Outsourcing offensichtlich. An der Spitze stehen die Technologieriesen, die die Kernalgorithmen fest im Griff haben; die zweite Ebene besteht aus großen Datenserviceanbietern; die dritte Ebene umfasst Datenkennzeichnungszentren und kleine bis mittelgroße Outsourcing-Unternehmen, die im ganzen Land verstreut sind; nur ganz unten finden wir die Stücklohn verdienenden Fußsoldaten - die Kennzeichnungsarbeiter.

Jede Outsourcing-Ebene nimmt einen erheblichen Anteil. Wenn die großen Fabriken einen Einheitspreis von 0,5 RMB anbieten, was nach mehreren Ausbeutungsstufen in den Händen eines Kennzeichnungsarbeiters in einer Kleinstadt landet, könnte weniger als 0,05 RMB sein.

In seinem Buch "Techno-Feudalismus" brachte der ehemalige griechische Finanzminister Yanis Varoufakis einen durchdringenden Standpunkt vor: Die heutigen Technologieriesen sind nicht mehr Kapitalisten im traditionellen Sinne, sondern "Cloudalisten".

Sie besitzen keine Fabriken und Maschinen, sondern Algorithmen, Plattformen und Rechenleistung, die digitalen Territorien der Cyber-Ära. In diesem neuen feudalen System sind die Nutzer keine Verbraucher, sondern digitale Leibeigene. Jedes Like, jeder Kommentar und jeder Blick in sozialen Medien ist kostenlose Arbeit, die Daten an die Cloudalisten liefert.

Inzwischen sind die Datenkennzeichner in Schwellenländern die niedrigsten digitalen Leibeigenen in diesem System. Sie müssen nicht nur Daten produzieren, sondern auch massive Rohdaten bereinigen, kategorisieren und bewerten, um sie in qualitativ hochwertige Daten zu verwandeln, die große Modelle verarbeiten können.

Dies ist eine geheime Bewegung zur kognitiven Einhegung. Ähnlich wie die Einhegungsakte des 19. Jahrhunderts in England die Landwirte in Textilfabriken trieben, drängt die heutige KI-Welle junge Menschen, die keinen Platz in der physischen Wirtschaft finden können, vor Bildschirme.

KI hat die Klassenunterschiede nicht nivelliert; vielmehr hat sie ein "Daten- und Blut-Schweiß-Förderband" von kleinen Landkreisen in Zentral- und Westchina direkt zu den Hauptquartieren der Technologieriesen in Peking, Shanghai, Guangzhou und Shenzhen etabliert. Die Erzählung von technologischer Revolution ist immer groß und prächtig, aber ihr Fundament ist für immer der skalierte Verbrauch von billiger Arbeit.

Niemand scheint zu denken, dass daran etwas falsch ist.

Ein Morgen ohne die Notwendigkeit von Menschen.

Die brutalste Schlussfolgerung rückt schnell näher, immer schneller.

Mit dem Aufstieg der Fähigkeiten großer Modelle werden Aufgaben, die einst Tag und Nacht menschliche Arbeit erforderten, nun von der KI selbst übernommen.

Im April 2023 enthüllte Li Xiang, der Gründer von Ideal Auto, auf einem Forum, dass Ideal früher manuell etwa 10 Millionen Bilder von autonomem Fahren in einem Jahr kennzeichnen ließ, wobei die Outsourcing-Kosten nahe einer Milliarde lagen. Nachdem sie jedoch große Modelle für die automatisierte Kennzeichnung eingesetzt hatten, kann das, was früher ein Jahr dauerte, jetzt in etwa 3 Stunden erledigt werden.

Die Effizienz ist 1000 Mal höher als die der Menschen, und sie wurde bereits 2023 erreicht. Allein im letzten März hat Ideal die nächste Generation der automatischen Annotationsmaschine MindVLA-o1 veröffentlicht.

Ein düsterer, wahrer, selbstironischer Spruch kursiert in der Branche: "Je mehr Intelligenz, desto künstlicher." Aber jetzt gab es einen kliffartigen Rückgang von 40%-50% bei der Auslagerung von Datenannotation durch Technologieriesen.

Diese jungen Menschen aus kleinen Städten, die unzählige Tage und Nächte vor Computern gesessen haben, mit blutunterlaufenen Augen von der Anstrengung, haben persönlich ein Ungeheuer großgezogen. Und jetzt dreht sich dieses Ungeheuer um und zerschmettert ihre Reis-Schalen.

Wenn die Nacht hereinbricht, bleiben die Bürogebäude im Pingcheng-Distrikt von Datong so hell wie am Tag. Die jungen Menschen im Schichtdienst tauschen schweigend ihre müden Hüllen in der Aufzugshalle aus. In diesem gefalteten Raum, der von unzähligen Polygonen gefangen gehalten wird, kümmert sich niemand um den epischen Sprung der Transformer-Architektur auf der anderen Seite des Ozeans, noch versteht jemand das Dröhnen der Rechenleistung hinter den hundert Milliarden Parametern.

Ihr Blick ist an der roten/grünen Fortschrittsanzeige des Backstages festgeklebt, die die "Grenzlinie" darstellt und berechnet, ob die mageren Stückzahlen am Ende des Monats ein anständiges Leben zusammenflicken können.

Auf der einen Seite feiern die Riesen mit erhobenen Gläsern den Eintritt von AGI, während die Schlussglocke der Nasdaq und die kontinuierliche Berichterstattung durch die Tech-Medien ertönen; auf der anderen Seite können diese digitalen Leibeigenen, die KI mit ihrem Fleisch und Blut genährt haben, nur inmitten schmerzhaften Schlafes nervös darauf warten, dass das Ungeheuer, das sie mit eigenen Händen großgezogen haben, an einem gewöhnlichen Morgen gleichgültig ihre Reisnäpfe wegtritt.

Niemand denkt, dass daran etwas falsch ist.

Das könnte Ihnen auch gefallen

Beliebte Coins

Neueste Krypto-Nachrichten

Mehr lesen