Aller au contenu principal
ukiyo journal - 日本と世界をつなぐ新しいニュースメディア Logo
  • Tous les articles
  • 🗒️ S'inscrire
  • 🔑 Connexion
    • 日本語
    • English
    • 中文
    • Español
    • 한국어
    • Deutsch
    • ภาษาไทย
    • हिंदी
cookie_banner_title

cookie_banner_message Politique de confidentialité cookie_banner_and Politique des cookies cookie_banner_more_info

Paramètres des cookies

cookie_settings_description

essential_cookies

essential_cookies_description

analytics_cookies

analytics_cookies_description

marketing_cookies

marketing_cookies_description

functional_cookies

functional_cookies_description

Les signes de chômage apparaissent dans les "publications" — Les réseaux sociaux reflètent l'économie plus rapidement que les statistiques officielles

Les signes de chômage apparaissent dans les "publications" — Les réseaux sociaux reflètent l'économie plus rapidement que les statistiques officielles

2026年01月01日 11:02

Où se trouve la "réalité plus rapide que les statistiques" ?

Les statistiques de l'emploi, telles que le taux de chômage et les demandes d'allocations chômage, servent de thermomètre à l'économie. Cependant, ce thermomètre prend inévitablement du temps pour mesurer, enregistrer, compiler et publier les données. Plus la crise est récente, plus ce "retard" est douloureux.


Alors, n'y a-t-il pas un moyen de détecter des "signes de chômage" avant les données officielles ? Les chercheurs se sont tournés vers les mots crus qui débordent sur les réseaux sociaux. "J'ai perdu mon emploi", "J'ai échoué à un entretien", "La recherche d'emploi est difficile". Ces expressions pourraient ne pas être de simples plaintes, mais plutôt un "flash info" de l'économie. Phys.org


Points clés de la recherche : Ce que JoblessBERT a accompli

Cette recherche (PNAS Nexus) propose un cadre pour identifier les "révélations de chômage" dans les publications sur les réseaux sociaux à l'aide de l'IA, et pour prédire les demandes d'allocations chômage aux États-Unis jusqu'à deux semaines à l'avance. Le modèle s'appelle JoblessBERT. Il s'agit d'un classificateur Transformer de type BERT, ajusté pour détecter les déclarations de chômage. Phys.org


Il y a deux points clés.
(1) Ne pas manquer la diversité des publications : Capturer les expressions familières, les fautes de frappe et les expressions décontractées (par exemple, des formulations comme "needa job"). Par rapport à la méthode traditionnelle basée sur des règles qui vérifie la présence de 75 phrases spécifiques, JoblessBERT maintient la même précision tout en trouvant beaucoup plus de "révélations de chômage". OUP Academic


(2) Corriger les biais des réseaux sociaux pour créer un "indice" : Les réseaux sociaux ne représentent pas l'ensemble de la population. Ainsi, en utilisant les attributs estimés des utilisateurs et les estimations démographiques du recensement, les biais des contributeurs sont corrigés (post-stratification) pour créer un "indice de chômage Twitter" à intégrer dans le modèle statistique. OUP Academic


Sur quelles données le modèle a-t-il été formé ?

L'équipe de recherche a utilisé des publications publiques collectées entre janvier 2020 et décembre 2022, provenant de 315 millions d'utilisateurs basés aux États-Unis. L'échantillonnage a été étendu de manière "boule de neige" en se basant sur les relations de mention, en se concentrant principalement sur les utilisateurs dont le profil est localisé aux États-Unis. OUP Academic


De plus, JoblessBERT a été entraîné sur 8 838 publications étiquetées, et sa performance a été améliorée grâce à l'apprentissage actif (ajout prioritaire d'étiquetage pour les publications incertaines). OUP Academic


"Être bon en détection" ne suffit pas : le défi de la représentativité

Si les données des réseaux sociaux doivent être utilisées pour les politiques, le plus grand ennemi est le "biais". Ceux qui publient et ceux qui ne publient pas. L'utilisation est biaisée vers certains groupes d'âge ou régions. De plus, tous les chômeurs ne s'expriment pas forcément sur les réseaux sociaux.


La recherche aborde ce point de front, en intégrant des corrections pour aligner les estimations d'âge, de sexe et de localisation sur les statistiques démographiques. Pour l'estimation de l'âge et du sexe, un modèle d'apprentissage profond utilisant des images de profil et des métadonnées a été utilisé (avec des ajustements pour les cas non estimables). OUP Academic


C'est un point qui divise souvent sur les réseaux sociaux. Comme nous le verrons plus tard, bien que certains trouvent effrayant l'idée d'estimer les attributs à partir d'images pour améliorer la précision, d'autres défendent l'idée que l'anonymisation et l'agrégation peuvent servir un grand intérêt public.


Quel est le gain en précision ?

L'article compare d'abord la performance de la détection des révélations personnelles. Les méthodes basées sur des règles ont une précision élevée mais un rappel faible. En revanche, JoblessBERT maintient une précision élevée tout en améliorant considérablement le rappel, rapportant qu'il capte environ trois fois plus de publications pertinentes que les méthodes traditionnelles. De plus, l'élargissement des expressions permet d'augmenter le nombre d'utilisateurs détectés, contribuant ainsi à rendre l'échantillon de chômeurs plus représentatif. OUP Academic


En termes de prévisions, l'étude évalue la capacité à prédire les demandes d'allocations chômage avant leur publication (jusqu'à deux semaines à l'avance), et note une amélioration de 54,3% du RMSE par rapport aux prévisions consensuelles du secteur. OUP Academic


Ce que signifie avoir détecté à l'avance le "pic" initial de la pandémie

Cette recherche illustre de manière symbolique le bouleversement de mars 2020. La semaine suivant la déclaration de la pandémie, les demandes d'allocations chômage ont bondi d'environ 250 000 à 2,9 millions. Alors que les prévisions consensuelles ont largement sous-estimé cette augmentation, le modèle intégrant l'indice des réseaux sociaux a "ressenti" le changement et a considérablement relevé ses prévisions. Le modèle JoblessBERT a prédit 2,66 millions deux jours avant la fin de la semaine et 2,8 millions la veille de l'annonce, se rapprochant ainsi des 2,9 millions réels. OUP Academic


Ce qui est important ici, ce n'est pas que "les réseaux sociaux sont omnipotents", mais que la **"rapidité de l'information en cas de crise"** a été démontrée. Cela a plus de valeur dans les moments de rupture que dans les périodes de stabilité économique. Plus les mesures politiques (allocations supplémentaires, soutien local, renforcement des guichets, etc.) peuvent être efficaces "même avec une semaine d'avance", plus les signaux provenant des réseaux sociaux deviennent attrayants.


Pas seulement au niveau national : l'ambition de l'échelle étatique et urbaine

La douleur de l'emploi est difficile à percevoir à travers la moyenne nationale. Les structures industrielles, les loyers et les taux d'immigration varient. L'article évalue le modèle au niveau des États et des villes, démontrant le potentiel d'une surveillance infranationale. Phys.org


Si cela peut être mis en œuvre, il pourrait être possible de déterminer "dans quelle ville et quel secteur le choc se produit" plus rapidement que les statistiques officielles.


Cependant, la plus grande question est de savoir si cela ne deviendra pas une "surveillance"

Les réactions sur les réseaux sociaux soulèvent souvent la question suivante.

  • Collecter les "révélations de chômage" ne revient-il pas à suivre les personnes vulnérables ?

  • L'estimation des attributs (âge, sexe) à partir d'images ne risque-t-elle pas de mener à une identification personnelle ?

  • Le gouvernement ou les entreprises ne risquent-ils pas d'utiliser ces données "à leur avantage", pour sélectionner plutôt que soutenir ?


L'article prend en compte ces préoccupations et discute de l'accès "responsable" aux signaux anonymisés, de la collaboration avec les plateformes, et de la réglementation. En d'autres termes, il ne s'agit pas d'un état de "tout est accessible", mais d'un cadre permettant une utilisation à des fins publiques, tout en protégeant la vie privée, pour la recherche et la surveillance. OUP Academic


La dépendance aux plateformes : la faiblesse d'être centré sur Twitter (X)

Une autre critique fréquente est que cela repose sur Twitter (X). Les utilisateurs changent, et les spécifications de l'API ou l'accès peuvent fluctuer. L'article souligne qu'il s'agit d'une "démonstration sur une période et une plateforme spécifiques", et le présente comme un "cadre adaptable" plutôt qu'un outil universel. OUP Academic


Cela signifie qu'à l'avenir, il pourrait être nécessaire de le transposer à d'autres réseaux sociaux (Reddit, Threads, réseaux sociaux régionaux, etc.) ou à d'autres langues. C'est un point "intéressant pour la recherche" mais "difficile pour la mise en œuvre politique".


Réactions sur les réseaux sociaux (résumé par points fréquents)

Cette recherche a été présentée via le compte officiel de Phys.org, devenant un sujet partagé sur les réseaux sociaux. LinkedIn


Voici les réactions observées (ou susceptibles de se produire), organisées par points de discussion.


1) Éloges : "Améliorer la rapidité des statistiques est un bénéfice public"

  • "En cas de crise comme une pandémie, avancer de deux semaines est énorme"

  • "Si l'on peut détecter tôt au niveau des États ou des villes, l'aide peut arriver à temps"
    (en accord avec le point fort de la recherche sur "l'efficacité en temps de crise") OUP Academic


2) Préoccupations : "Ne transformez pas les voix des vulnérables en 'données de surveillance'"

  • "Les publications sur le chômage sont presque des SOS. Si on les collecte, il faut d'abord concevoir un système pour les relier à une aide"

  • "Il y a une résistance à l'estimation des attributs à partir des images de profil"
    (l'estimation des attributs est clairement mentionnée dans l'article) ##HTML_TAG_

← Retour à la liste d'articles

Contact |  Conditions d'utilisation |  Politique de confidentialité |  Politique des cookies |  Paramètres des cookies

© Copyright ukiyo journal - 日本と世界をつなぐ新しいニュースメディア Tous droits réservés.