Aller au contenu principal
ukiyo journal - 日本と世界をつなぐ新しいニュースメディア Logo
  • Tous les articles
  • 🗒️ S'inscrire
  • 🔑 Connexion
    • 日本語
    • English
    • 中文
    • Español
    • 한국어
    • Deutsch
    • ภาษาไทย
    • हिंदी
cookie_banner_title

cookie_banner_message Politique de confidentialité cookie_banner_and Politique des cookies cookie_banner_more_info

Paramètres des cookies

cookie_settings_description

essential_cookies

essential_cookies_description

analytics_cookies

analytics_cookies_description

marketing_cookies

marketing_cookies_description

functional_cookies

functional_cookies_description

La société X interdira l'utilisation de son contenu pour l'entraînement de l'IA ! Quel impact pour le Japon ?

La société X interdira l'utilisation de son contenu pour l'entraînement de l'IA ! Quel impact pour le Japon ?

2025年06月06日 20:18

X interdit l'utilisation de son contenu pour l'entraînement des modèles d'IA

―― Un choc et un scénario de réorganisation dans l'écosystème de l'IA générative au Japon――





1. Introduction──La fermeture soudaine des portes

Le 5 juin 2025, le réseau social X (anciennement Twitter) a modifié ses conditions d'utilisation pour interdire totalementl'utilisation par des tiers des publications sur X ou des données obtenues via l'API pour l'apprentissage ou le réglage fin de modèles de base (foundation / frontier model). TechCrunch a été le premier à le découvrir, suivi par The Verge, provoquant une agitation dans la communauté mondiale des développeurs d'IA. 



2. Décryptage des changements──“Reverse Engineering and other Restrictions”

Bien qu'une seule ligne ait été ajoutée dans la nouvelle clause "Reverse Engineering and other Restrictions", son impact est immense. Le crawling et le scraping via l'API X ne font pas exception, et les termes "à des fins de recherche" ou "à but non lucratif" sont explicitement exclus. La culture d'API ouverte qui garantissait la portabilité des données a été soudainement fermée.



3. Contexte──Acquisition par xAI et besoin d'apprentissage de "Grok"

En mars 2025, xAI dirigé par Elon Musk a acquis X pour environ 33 milliards de dollars et a mis en avant son propre LLM appelé "Grok". La société Xcontinue d'utiliser les données de la plateforme pour entraîner ses propres modèles, tout en fermant ses portes aux autres dans une stratégie de "cloisonnement". Cette approche rejoint celle de Reddit et du NY Times, qui cherchent à monopoliser les données en tant que "ressource" et à les concéder sous licence à un prix élevé.



4. Tendance mondiale──Procès Reddit et émergence du “business de la licence”

En mai 2025, Reddit a poursuivi Anthropic pour plus de 100 000 crawls, transformant les données en actifs et concluant un contrat de licence de 200 millions de dollars avec Google, tout en adoptant une attitude ferme contre l'utilisation non autorisée. Le mouvement de X accélère cette tendance mondiale de "cloisonnement du contenu".



5. Une "famine de données" sévère pour les entreprises de développement d'IA au Japon

Les performances des grands modèles de langage (LLM) dépendent de la quantité et de la diversité des données. Les données des médias sociaux japonais, qui incluent des argots, des dialectes et des sujets domestiques,sont indispensables pour entraîner des modèles en japonais. Cependant, les principales SNS nationales révisent successivement leurs conditions d'utilisation pour interdire "l'apprentissage par IA", augmentant ainsi les coûts d'acquisition et les risques juridiques. En conséquence,


  • par rapport aux grandes entreprises étrangèresles coûts d'entraînement sont plus élevés

  • risquant de prendre du retard en termes de performance des modèles

  • réduisant les opportunités d'innovation pour les start-ups



ces trois défis se profilent.



6. Sources alternatives de données──Corpus public et données internes à l'entreprise

Pour contourner les restrictions, les solutions pratiques incluent : ① l'utilisation de corpus publics de l'Institut National de la Langue Japonaise, ② des contrats payants avec des journaux et des chaînes de diffusion, ③ l'amélioration des "données propriétaires" telles que les logs de chat et les FAQ détenus par l'entreprise, et ④ la génération de données synthétiques. Cependant, les corpus publics ont des licences variées, et même en conformité avec l'**article 30-4 de la loi sur le droit d'auteur (réglementation de l'analyse de l'information)**, il est nécessaire de vérifier individuellement les clauses de réutilisation.



7. Situation actuelle des régulations──La frontière entre la loi sur le droit d'auteur et le fichier robots.txt

Au Japon, la révision de la loi sur le droit d'auteur de 2018 a rendu la "reproduction à des fins d'analyse de l'information" sujette à des restrictions de droits, mais il reste une zone grise quant à savoir si "l'apprentissage des LLM commerciaux" est concerné. De plus, l'association des journaux a publié une déclaration le 4 juin 2025, affirmant qu'il est nécessaire de respecter la volonté exprimée par le fichier "robots.txt" de refuser l'apprentissage par l'IA, et a clairement pris position en déclarant que l'apprentissage ignorant cette volonté est injuste.



8. Les publications personnelles protégées par "l'opt-out" ?

X propose une option d'opt-out permettant aux utilisateurs de "refuser l'apprentissage par Grok", mais les termes actuels interdisent totalement cela aux "tiers", tandis que les publications continuent d'être utilisées pour l'apprentissage par X elle-même, ce qui nécessite une attention particulière.



9. Réponses stratégiques des entreprises et des institutions de recherche

  1. Démarrage précoce des négociations de licence de données

  2. Inventaire des risques juridiques des ensembles de données sous contrat

  3. Mise en œuvre de la transparence de l'IA générative (traçabilité des sources)

  4. Données synthétiques et stratégie d'apprentissage de haute qualité en petit volume "stratégie de petites données"



Ce sont des réponses à court terme, et à long terme,il est nécessaire de construire une base pour développer conjointement des données ouvertes en japonais à travers l'industrie.



10. Impact sur les start-ups──Changements dans le financement et l'évaluation

Les VC ont traditionnellement mis l'accent sur la "supériorité technologique = performance du modèle", mais à l'avenir, la clé de la valeur de l'entreprise sera **"la quantité de données sécurisées sous licence légale"**. Les start-ups japonaises doivent intégrer une stratégie de données dans leurs présentations dès le début et ajuster leurs plans d'affaires pour inclure l'augmentation des coûts de capital.



11. Dilemme de la recherche académique──Science ouverte et protection de la propriété intellectuelle

Les universités et les institutions de recherche publique sont en principe dans une position de divulgation des résultats, mais lorsqu'un modèle est formé à l'aide de données d'entreprise, la divulgation des paramètres du modèle peut constituer une violation de licence.Il est essentiel de conclure un MOU avec les entreprises de fourniture de données et de formaliser les règles de distinction entre les "parties publiables" et les "parties non publiables".



12. Différence de température avec les plateformes étrangères──“Open vs. Closed”

Meta utilise massivement les données Web sous licence CC pour Llama 3, tandis que YouTube n'a pas encore clairement exprimé de restrictions sur l'apprentissage de l'IA. Aux États-Unis, la théorie du **“fair use”** offre une certaine protection, tandis que dans l'UE, l'AI Act devrait entrer en vigueur en 2026, imposant des obligations de transparence. La fermeture de X symbolise l'arrivée d'une époque où "même aux États-Unis, les données ne sont pas gratuites",et la guerre de gouvernance des données au-delà des frontièress'intensifie.



13. Position et recommandations politiques du gouvernement japonais

Le ministère de l'Économie, du Commerce et de l'Industrie inclut le respect de la volonté des fournisseurs de données dans le "Projet de lignes directrices pour l'utilisation de l'IA générative", tout en visant à assurer la compétitivité de l'industrie de l'IA. À l'avenir,


  • la lisibilité machine et la libéralisation de la réutilisation des données publiques

  • le développement de clouds partagés et de lacs de données par les universités et les institutions de recherche publiques

  • des subventions pour l'acquisition de données pour les PME et les startups



seront les trois points clés.



14. Les "données exclusives" comme avantage concurrentiel──Une nouvelle chaîne de valeur

Plus les plateformes enferment les données,plus la valeur des "données inexploitées" telles que les journaux d'activité, les données de la chaîne d'approvisionnement et les chats clients, qui dorment dans les entreprises, augmente. Les entreprises japonaises ont l'opportunité de se différencier au niveau mondial en affinant les données difficiles d'accès pour les acteurs étrangers en raison des barrières linguistiques et des pratiques commerciales, et en utilisant leur "niche mais profonde expertise" comme arme.



15. Conclusion──“La qualité et l'accès aux données” déterminent la compétitivité de l'IA

La révision des conditions d'utilisation de la société X peut sembler un simple changement de politique, mais en réalité, elle marque le début d'un nouveau chapitre dans la "bataille pour les données" qui ébranle fondamentalement l'équilibre des pouvoirs dans l'industrie de l'IA générative. Les développeurs d'IA, les entreprises et les autorités politiques japonaises doivent


  1. diversifier l'approvisionnement en données et gérer les risques juridiques

  2. construire conjointement une infrastructure de données ouvertes

  3. se différencier par la création de données exclusives



. Si ces trois piliers ne sont pas rapidement établis, la compétitivité sur le marché mondial pourrait être perdue. À l'inverse, les entreprises qui réussiront à surmonter cette crise et à réaliser une combinaison de **"données exclusives de haute qualité × modèles à haute efficacité"** seront les gagnantes de la prochaine ère de l'IA générative.




TechCrunch

  • The Verge

  • Reuters

  • Association des Journaux Japonais

  • Agence Numérique

Article de référence

a modifié ses conditions d'utilisation pour interdire l'utilisation de son contenu pour l'entraînement de modèles d'IA
Source: https://techcrunch.com/2025/06/05/x-changes-its-terms-to-bar-training-of-ai-models-using-its-content/

← Retour à la liste d'articles

Contact |  Conditions d'utilisation |  Politique de confidentialité |  Politique des cookies |  Paramètres des cookies

© Copyright ukiyo journal - 日本と世界をつなぐ新しいニュースメディア Tous droits réservés.