Zum Hauptinhalt springen
ukiyo journal - 日本と世界をつなぐ新しいニュースメディア Logo
  • Alle Artikel
  • 🗒️ Registrieren
  • 🔑 Anmelden
    • 日本語
    • English
    • 中文
    • Español
    • Français
    • 한국어
    • ภาษาไทย
    • हिंदी
cookie_banner_title

cookie_banner_message Datenschutzrichtlinie cookie_banner_and Cookie-Richtlinie cookie_banner_more_info

Cookie-Einstellungen

cookie_settings_description

essential_cookies

essential_cookies_description

analytics_cookies

analytics_cookies_description

marketing_cookies

marketing_cookies_description

functional_cookies

functional_cookies_description

Anzeichen von Arbeitslosigkeit erscheinen in "Posts" — Soziale Netzwerke spiegeln die Wirtschaftslage früher wider als offizielle Statistiken

Anzeichen von Arbeitslosigkeit erscheinen in "Posts" — Soziale Netzwerke spiegeln die Wirtschaftslage früher wider als offizielle Statistiken

2026年01月01日 11:03

Wo ist die "Realität schneller als die Statistik"?

Beschäftigungsstatistiken wie Arbeitslosenquote und Arbeitslosenversicherungsanträge sind das Thermometer der Wirtschaft. Doch bis das Thermometer misst, aufzeichnet, zusammenfasst und veröffentlicht, vergeht zwangsläufig Zeit. Besonders in der Anfangsphase einer Krise ist diese "Verzögerung" schmerzhaft.


Gibt es keine Möglichkeit, "Anzeichen von Arbeitslosigkeit" vor den offiziellen Daten zu erkennen? Forscher richteten ihren Blick auf die lebhaften Worte, die in sozialen Netzwerken geteilt werden. "Ich habe meinen Job verloren", "Ich bin beim Vorstellungsgespräch durchgefallen", "Die Jobsuche ist hart". Diese könnten nicht nur einfache Beschwerden sein, sondern auch als "Eilmeldungen" der Wirtschaft dienen. Phys.org


Forschungszusammenfassung: Was JoblessBERT getan hat

Die aktuelle Forschung (PNAS Nexus) schlägt einen Rahmen vor, um "Selbstoffenbarungen von Arbeitslosigkeit" in SNS-Posts mit KI zu erkennen und Arbeitslosenversicherungsanträge (UI claims) in den USA bis zu zwei Wochen im Voraus vorherzusagen. Das Modell heißt JoblessBERT. Es ist ein BERT-basiertes Transformer-Klassifikationsmodell, das speziell auf die Erkennung von Selbstoffenbarungen zur Arbeitslosigkeit abgestimmt ist. Phys.org


Es gibt zwei Schwerpunkte.
(1) Die Vielfalt der Posts nicht zu übersehen: Auch Slang, Tippfehler und umgangssprachliche Ausdrücke (z.B. "needa job") werden erfasst. Im Vergleich zur herkömmlichen Methode, bei der nach 75 bestimmten Phrasen gesucht wird (regelbasiert), findet es bei gleicher Genauigkeit weitaus mehr "arbeitslosigkeitsähnliche Selbstoffenbarungen". OUP Academic


(2) Korrektur der Verzerrung in SNS und Erstellung eines "Index": SNS repräsentiert nicht die gesamte Population. Daher wird die Verzerrung der Poster mit geschätzten Benutzerattributen und Bevölkerungsprognosen des Zensus korrigiert (Post-Stratifikation), um einen "Twitter-Arbeitslosenindex" zu erstellen und in das statistische Modell einzufügen. OUP Academic


Welche Daten wurden zum Training verwendet?

Das Forschungsteam nutzte öffentliche Posts von 31,5 Millionen Nutzern in den USA, die zwischen Januar 2020 und Dezember 2022 gesammelt wurden. Der Fokus lag auf Nutzern, deren Profilstandort in den USA verortet werden konnte, und die Stichprobe wurde durch "Schneeball"-Sammlung erweitert, indem Erwähnungsbeziehungen berücksichtigt wurden. OUP Academic


Zusätzlich wurde JoblessBERT mit 8.838 gelabelten Posts trainiert und durch aktives Lernen (Priorisierung unsicherer Posts zur zusätzlichen Labelung) weiter verbessert. OUP Academic


"Gute Erkennung" allein reicht nicht: Die Hürde der Repräsentativität

Wenn SNS-Daten für politische Zwecke verwendet werden, ist die größte Herausforderung die "Verzerrung". Wer postet und wer nicht. Die Nutzung ist auf bestimmte Altersgruppen oder Regionen konzentriert. Und nicht jeder Arbeitslose teilt seine Situation auf SNS.


Die Forschung geht dieses Problem direkt an und schätzt Alter, Geschlecht und Standort aus Profilinformationen, um Korrekturen entsprechend der Bevölkerungsstatistik vorzunehmen. Für die Schätzung von Alter und Geschlecht wurde ein Deep-Learning-Modell verwendet, das Profilbilder und Metadaten nutzt (bei Unkenntnis werden fehlende Daten ergänzt). OUP Academic


Dies ist ein Punkt, der auch auf SNS zu kontroversen Meinungen führt. Wie später erwähnt, gibt es Reaktionen, die sagen, dass "die Schätzung von Attributen aus Bildern zur Verbesserung der Genauigkeit beängstigend ist", während andere argumentieren, dass "Anonymisierung und Aggregation im öffentlichen Interesse sind".


Wie stark hat sich die Genauigkeit verbessert?

Die Studie vergleicht zunächst die Leistung der Erkennung von Selbstoffenbarungen. Regelbasierte Methoden haben eine hohe Präzision, aber eine niedrige Rückrufquote. JoblessBERT hingegen behält eine ähnlich hohe Präzision bei und verbessert die Rückrufquote erheblich, indem es "etwa dreimal so viele relevante Posts wie bisher erfasst". Darüber hinaus trägt die Erweiterung der Ausdrucksbreite dazu bei, dass mehr "erfassbare Nutzer" erreicht werden und die Stichprobe der Arbeitslosen repräsentativer wird. OUP Academic


In Bezug auf die Vorhersage wird bewertet, wie gut die Arbeitslosenversicherungsanträge vor ihrer Veröffentlichung (bis zu zwei Wochen im Voraus) vorhergesagt werden können, und es wird berichtet, dass die RMSE im Vergleich zu den Konsensprognosen der Branche um 54,3% verbessert wurde. OUP Academic


Was es bedeutet, dass der "Anstieg" zu Beginn der Corona-Pandemie früher erkannt wurde

Diese Studie zeigt symbolisch die dramatische Veränderung im März 2020. In der Woche unmittelbar nach der Pandemieerklärung stiegen die UI claims von etwa 250.000 auf 2,9 Millionen an. Während die Konsensprognosen den Anstieg weitgehend verfehlten, erkannte das Modell mit dem SNS-Index die plötzliche Veränderung und erhöhte die Vorhersagewerte erheblich. Das JoblessBERT-Modell kam zwei Tage vor dem Ende der Woche auf 2,66 Millionen und am Tag vor der Veröffentlichung auf 2,8 Millionen, was den tatsächlichen 2,9 Millionen sehr nahe kam. OUP Academic


Wichtig ist hier nicht, dass "SNS allmächtig" ist, sondern dass die **"Schnelligkeit der Berichterstattung in der Anfangsphase einer Krise"** gezeigt wurde. Der Wert zeigt sich mehr in Momenten, in denen die Wirtschaft plötzlich ins Rutschen gerät, als in Zeiten, in denen sie sich gleichmäßig bewegt. Je mehr politische Maßnahmen (zusätzliche Zahlungen, kommunale Unterstützung, Verstärkung der Anlaufstellen usw.) "eine Woche früher" wirksam werden, desto attraktiver werden die Signale aus SNS.


Nicht nur "landesweit": Der Ehrgeiz auf Bundesstaaten- und Stadtebene

Der Schmerz der Arbeitslosigkeit ist im nationalen Durchschnitt schwer zu erkennen. Die Industrie- und Mietstruktur sowie der Anteil der Einwanderer unterscheiden sich. Die Studie bewertet das Modell auch auf Bundesstaaten- und Stadtebene und zeigt das Potenzial für subnationale Überwachung. Phys.org


Wenn dies implementierbar ist, könnte es möglich sein, "welche Stadt in welcher Branche von einem Schock betroffen ist" früher als offizielle Statistiken zu erfassen.


Doch das größte Thema ist, ob es nicht zu "Überwachung" wird

Eine häufige Reaktion auf SNS ist die folgende Frage.

  • Wird das Sammeln von "Selbstoffenbarungen der Arbeitslosigkeit" nicht dazu führen, dass Menschen in Not verfolgt werden?

  • Führt die Schätzung von Attributen (Alter, Geschlecht) aus Bildern nicht zur Identifizierung von Personen?

  • Werden Regierung und Unternehmen es nicht "nach Belieben" nutzen und es für Selektion statt Unterstützung verwenden?


Die Studie diskutiert diese Bedenken und betont die Notwendigkeit eines **"verantwortungsvollen Zugangs"** zu anonymisierten Signalen, die Zusammenarbeit mit Plattformen und die Art der Regulierung. Es wird argumentiert, dass es notwendig ist, ein System zu schaffen, das nicht "alles erfassen" kann, sondern für öffentliche Zwecke genutzt werden kann, während die Privatsphäre gewahrt bleibt, um Forschung und Überwachung zu ermöglichen. OUP Academic


Die Realität der Plattformabhängigkeit: Die Schwäche, dass es sich um Twitter (X) handelt

Ein weiterer SNS-Kritikpunkt ist, "ist das nicht vorausgesetzt, dass es sich um Twitter (X) handelt?" Die Nutzerbasis verändert sich, und auch die API-Spezifikationen und die Möglichkeit des Zugriffs schwanken. Die Studie betont, dass es sich um eine "Demonstration in einem bestimmten Zeitraum und auf einer bestimmten Plattform" handelt und präsentiert es als "anpassbaren Rahmen" statt als Allzweckwerkzeug. OUP Academic


Das bedeutet, dass es in Zukunft notwendig sein könnte, es auf andere SNS (Reddit, Threads, regionale SNS usw.) oder andere Sprachräume zu übertragen. Dies ist einerseits "interessant als Forschung", andererseits auch ein "schwieriger Punkt für die politische Umsetzung".


Reaktionen auf SNS (Zusammenfassung nach häufigen Diskussionspunkten)

Diese Studie wurde auch über den offiziellen Account von Phys.org vorgestellt und ist ein Thema, das in sozialen Netzwerken geteilt wird. LinkedIn


Die daraus resultierenden (oder leicht entstehenden) Reaktionen lassen sich nach Diskussionspunkten wie folgt zusammenfassen.


1) Lob: "Die Erhöhung der Geschwindigkeit von Statistiken ist ein öffentlicher Nutzen"

  • "In Notfällen wie Naturkatastrophen oder Pandemien sind zwei Wochen Vorsprung enorm"

  • "Wenn man auf Bundesstaaten- oder Stadtebene frühzeitig reagieren kann, kommt die Unterstützung rechtzeitig"
    (entspricht dem Punkt, dass die Forschung "in Krisenzeiten stark" ist) OUP Academic


2) Bedenken: "Verwandeln Sie die Stimmen der Schwachen nicht in 'Überwachungsdaten'"

  • "Posts über Arbeitslosigkeit sind fast ein SOS. Wenn sie gesammelt werden, sollte das Design zuerst auf Unterstützung abzielen"

  • "Es gibt Widerstand gegen die Schätzung von Attributen aus Profilbildern"
    (die Durchführung der Attributschätzung wird in der Studie klar erwähnt) ##HTML_TAG_368

← Zurück zur Artikelliste

Kontakt |  Nutzungsbedingungen |  Datenschutzrichtlinie |  Cookie-Richtlinie |  Cookie-Einstellungen

© Copyright ukiyo journal - 日本と世界をつなぐ新しいニュースメディア Alle Rechte vorbehalten.