メインコンテンツにスキップ
ukiyo journal - 日本と世界をつなぐ新しいニュースメディア ロゴ
  • 記事一覧
  • 🗒️ 新規登録
  • 🔑 ログイン
    • English
    • 中文
    • Español
    • Français
    • 한국어
    • Deutsch
    • ภาษาไทย
    • हिंदी
クッキーの使用について

当サイトでは、サービスの向上とユーザー体験の最適化のためにクッキーを使用しています。 プライバシーポリシー および クッキーポリシー をご確認ください。

クッキー設定

クッキーの使用について詳細な設定を行うことができます。

必須クッキー

サイトの基本機能に必要なクッキーです。これらは無効にできません。

分析クッキー

サイトの使用状況を分析し、サービス向上に役立てるためのクッキーです。

マーケティングクッキー

パーソナライズされた広告を表示するためのクッキーです。

機能クッキー

ユーザー設定や言語選択などの機能を提供するクッキーです。

X社がAI訓練に自社コンテンツ使用を禁止へ!日本への影響は?

X社がAI訓練に自社コンテンツ使用を禁止へ!日本への影響は?

2025年06月05日 23:47

X社、AIモデル訓練への自社コンテンツ利用を全面禁止

――日本の生成AIエコシステムに走る衝撃と再編のシナリオ――





1. はじめに──突然の「扉の締切り」

2025年6月5日、ソーシャルネットワークX(旧Twitter)は開発者規約を改定し、第三者がX上の投稿やAPI経由で取得したデータを「基盤モデル(foundation / frontier model)の学習やファインチューニングに利用すること」を全面的に禁止しました。TechCrunchが最初に発見し、The Vergeが続報を出すと、世界中のAI開発者コミュニティは騒然となりました。 



2. 変更点を読み解く──“Reverse Engineering and other Restrictions”

新たな条文は「Reverse Engineering and other Restrictions」内に一行追記されただけですが、そのインパクトは絶大です。X APIを経由するクローリングもスクレイピングも例外ではなく、「研究目的」や「非営利目的」の文言も明示的に除外。データの可搬性を担保してきた従来の“開放的API文化”が、一夜にして封鎖へと転じました。



3. 背景──xAIによる買収と「Grok」自身の学習需要

2025年3月、イーロン・マスク率いるxAIはXを約330億ドルで買収し、「Grok」という自社LLMを表舞台に押し出しました。X社は自社モデルの訓練には引き続きプラットフォームデータを使う一方、他社には門戸を閉ざす「囲い込み戦略」へピボットした形です。この構図は、データを“資源”として独占し、高値でライセンス供与することで収益を狙うRedditやNY Timesと同じ流れに合流します。



4. 世界的潮流──Reddit訴訟と“ライセンスビジネス”の台頭

Redditは2025年5月、Anthropicを相手に「クロール回数10万超」を理由に提訴。データを資産化し、Googleとは2億ドル級のライセンス契約を結ぶ一方、無断利用には強硬姿勢を示しました。Xの動きは、こうした“コンテンツ囲い込み”の世界的潮流に拍車を掛けるものです。



5. 日本のAI開発企業に走る深刻な「データ飢饉」

大規模言語モデル(LLM)の性能はデータ量と多様性に依存します。日本語ソーシャルメディアデータは、スラング・方言・ドメスティックな話題を含むため、日本語モデルを鍛える上で不可欠です。しかし国内主要SNSでは利用規約が次々と“AI学習不可”へ改訂され、今後は取得コストも法的リスクも跳ね上がります。結果として、


  • 海外巨大企業に比べ訓練コストが割高

  • モデル性能で周回遅れになる可能性

  • ベンチャーのイノベーション機会が縮小



という三重苦が迫ります。



6. データの代替源──公開コーパスと企業内データ

制限を回避する現実解としては、①国立国語研究所の公開コーパス、②新聞・放送局との有償契約、③自社保有チャットログ・FAQなど“プロプライエタリデータ”の磨き込み、④合成データ生成、といった選択肢が挙げられます。ただし公開コーパスはライセンスが多様で、**著作権法第30条の4(情報解析規定)**に準拠しても二次利用条項を個別確認する必要があります。



7. 法制度の現在地──著作権法とrobots.txtの境界

日本では2018年改正著作権法によって「情報解析目的の複製等」は権利制限対象になりましたが、“商用LLMの学習”がこれに該当するかはグレーゾーン。加えて、新聞協会は2025年6月4日付で「robots.txtでAI学習拒否を示す意思を尊重すべき」と声明を発表し、意思表示を無視した学習は不当との立場を鮮明にしました。



8. 「オプトアウト」で守られる個人の投稿?

Xはユーザー設定で「Grokによる学習を拒否」できるオプトアウト項目を用意していますが、今回の規約は“第三者”に対する全面禁止であり、X社自身の学習には依然として投稿が利用される点に注意が必要です。



9. 企業・研究機関の戦略的対応

  1. データライセンス交渉の早期着手

  2. 契約済みデータセットの法的リスク棚卸し

  3. 生成AIの透明化(出典トレーサビリティ)実装

  4. 合成データと少量高品質学習“スモールデータ戦略”



これらは短期的対応であり、長期的には業界横断で日本語オープンデータを共同整備する基盤が求められます。



10. ベンチャーへの影響──資金調達と評価の変化

VCは従来“技術優位性=モデル性能”を重視してきましたが、今後は**「正規ライセンスで確保したデータをどれだけ保有しているか」**が企業価値の鍵になります。日本発スタートアップには、早めにデータ戦略をピッチに織り込み、資本コスト上昇を織り込んだ事業計画の修正が必要です。



11. 学術研究のジレンマ──オープンサイエンスと知財保護

大学・公共研究機関は原則として成果を公開する立場にありますが、企業データを用いてモデルを訓練した場合、モデルパラメータの公開がライセンス違反になる恐れがあります。データ提供企業とMOUを締結し、“公開可部分”と“非公開部分”の峻別ルールを明文化することが不可欠です。



12. 海外プラットフォームとの温度差──“Open vs. Closed”

MetaはLlama 3でCCライセンスのWebデータを大量利用し、YouTubeは未だ明確なAI学習制限を明示していません。米国では**“フェアユース”論**が一定の盾になる一方、EUではAI Actが2026年施行予定で、透明性義務が課されます。Xのクローズ化は「米国ですらデータが無料ではない」時代の到来を象徴しており、国境を越えたデータガバナンス戦争が本格化します。



13. 日本政府の立場と政策提言

経産省は「生成AI利活用ガイドライン(案)」で“データ提供者の意思尊重”を盛り込みつつ、AI産業競争力の確保を掲げています。今後は、


  • 公共データの機械判読可能化と二次利用自由化

  • 大学・公的研究機関による共用クラウド/データレイクの整備

  • 中小企業・スタートアップ向けデータ取得補助金



の三点がカギとなります。



14. 「独自データ」こそ競争優位──新しい価値連鎖

プラットフォーマーがデータを囲い込むほど、企業内に眠る業務ログ・サプライチェーンデータ・顧客チャットなど“未発掘データ”の価値は跳ね上がります。日本企業は、言語や商習慣の壁で海外勢がアクセスしづらいデータを磨き上げ、「ニッチだが深い専門性」を武器にグローバルで差別化を図る好機とも言えます。



15. まとめ──“データの質とアクセス”がAI競争力を決める

X社の利用規約改定は、一見すると単なるポリシー変更ですが、実際には生成AI産業のパワーバランスを根底から揺るがす「データ争奪戦」の新章の幕開けです。日本のAI開発者・企業・政策当局は、


  1. データ調達の多様化と法的リスク管理

  2. オープンデータ基盤の共同構築

  3. 独自データ創出による差別化



の三本柱を早急に整備しなければ、世界市場での競争力は失われかねません。逆に言えば、この危機を乗り越え、**「質の高い独自データ×高効率モデル」**を実現できた企業こそが、次の生成AI時代の勝者となるでしょう。




TechCrunch

  • The Verge

  • Reuters

  • 日本新聞協会

  • デジタル庁

参考記事

社、AIモデルの訓練に自社コンテンツを使用することを禁止するよう利用規約を変更
出典: https://techcrunch.com/2025/06/05/x-changes-its-terms-to-bar-training-of-ai-models-using-its-content/

← 記事一覧に戻る

お問い合わせ |  利用規約 |  プライバシーポリシー |  クッキーポリシー |  クッキー設定

© Copyright ukiyo journal - 日本と世界をつなぐ新しいニュースメディア All rights reserved.