"पब्लिक डेटा" को स्वतंत्र रूप से लिया जा सकता है? Google के मुकदमे से हिलता स्क्रैपिंग का अभ्यास

"पब्लिक डेटा" को स्वतंत्र रूप से लिया जा सकता है? Google के मुकदमे से हिलता स्क्रैपिंग का अभ्यास

"खोज परिणामों को खींचने वाला API" आखिरकार अदालत में

2025 के 19 दिसंबर (अमेरिकी समय) को, Google ने टेक्सास की डेटा स्क्रैपिंग कंपनी SerpApi पर मुकदमा दायर किया। विवाद का मुद्दा सरल दिखता है, लेकिन वास्तव में जटिल है।खोज परिणाम (SERP) को स्वचालित रूप से प्राप्त कर "API के रूप में बेचना" कार्यवाही, एक सुविधाजनक इन्फ्रास्ट्रक्चर है या खोज इंजन और प्रकाशकों के निवेश पर मुफ्त में सवारी करने वाला उपकरण है। AI युग में प्रवेश के साथ, खोज डेटा का मूल्य बढ़ गया है, जिससे लंबे समय से ग्रे ज़ोन में रहे व्यवसाय को अचानक "मुख्य मंच" पर खींच लिया गया है। The Verge



क्या हुआ?――Google के दावे का सारांश

रिपोर्टों के अनुसार, Google का दावा है कि SerpApi ने Google खोज परिणामों सहित वेब सामग्री को बड़े पैमाने पर स्क्रैप किया और ग्राहकों को पुनर्विक्रय किया। इसके अलावा, Google ने स्क्रैपिंग के खिलाफ जो तंत्र (SearchGuard) लागू किया था, उसे दरकिनार कर, मानवीय दृष्टि के रूप में दिखाकर पहुंच प्राप्त की, ऐसा आरोप लगाया गया है। The Verge


Google विशेष रूप से "खोज परिणामों में शामिल कृतियों" पर ध्यान केंद्रित कर रहा है। खोज परिणामों में लिंक और पाठ के अलावा, Knowledge Panel (ज्ञान पैनल) में दिखाई देने वाली छवियां और विभिन्न मॉड्यूल, Maps/Shopping से जुड़ी जानकारी जैसी लाइसेंस अनुबंधों पर आधारित सामग्री भी शामिल होती है। Google का दावा है कि SerpApi इन सामग्रियों को "प्राप्त → स्वरूपित → API प्रदान" करके, Google और अधिकार धारकों द्वारा वहन किए गए लागत और अधिकार संरचना को बाधित कर रहा है। Reuters


इसके अलावा, SEO उद्योग मीडिया ने बताया है कि Google ने SerpApi के मॉडल को "परजीवी" के रूप में वर्णित किया है और शिकायत में कहा है कि कृत्रिम अनुरोधों की संख्या अत्यधिक है। Search Engine Roundtable



SearchGuard क्या है: "मानवीय दृष्टि" और "स्वचालित प्राप्ति" को विभाजित करने वाली दीवार

इस कहानी के केंद्र में SearchGuard है। The Verge के अनुसार, SearchGuard को 2025 के जनवरी में लागू किया गया था और इसका उद्देश्य बिना अनुमति के स्क्रैपिंग को रोकना था। Google का दावा है कि SerpApi ने नकली ब्राउज़र और कई IP पतों का उपयोग करते हुए, मानवीय पहुंच के रूप में दिखाकर इस दीवार को पार किया। The Verge


इसके अलावा, उद्योग मीडिया के विश्लेषण में, SearchGuard को JavaScript चुनौतियों के माध्यम से "मानवीय ब्राउज़र जैसी" विशेषताओं की पुष्टि करने के लिए डिज़ाइन किया गया है, जो नियमित उपयोगकर्ताओं के लिए स्वाभाविक रूप से पार हो जाता है, जबकि बॉट्स के लिए बाधा बन सकता है। PPC Land


Google के आधिकारिक ब्लॉग पोस्ट में भी, स्टील्थ स्क्रैपर्स की क्लोकिंग, बॉटनेट जैसी भारी पहुंच, क्रॉलर नाम की धोखाधड़ी आदि के माध्यम से साइट की इच्छाओं (robots.txt आदि) की अनदेखी करने और अधिकार धारकों की पसंद को छीनने की आलोचना की गई है। पिछले एक साल में इस तरह की गतिविधियों में काफी वृद्धि हुई है, और "अंतिम उपाय के रूप में मुकदमा दायर किया गया" है। Google Blog



SerpApi कौन है और इसका उपयोग क्यों किया गया है

SerpApi को Google और Bing जैसे खोज परिणामों को प्राप्त करने और JSON आदि में स्वरूपित करने के लिए जाना जाता है, जिससे इसे ऐप्स और विश्लेषण प्लेटफार्मों में आसानी से एकीकृत किया जा सके। व्यावहारिक क्षेत्र में,

  • प्रतिस्पर्धी विश्लेषण, मूल्य और स्टॉक जांच, SERP रैंकिंग में बदलाव की निगरानी

  • निगरानी (गलत जानकारी और धोखाधड़ी साइटों का पता लगाना)

  • LLM/खोज संबंधित उत्पादों के "संदर्भ URL संग्रह"
    जैसे "खोज परिणामों को सामग्री के रूप में उपयोग करने" के उद्देश्य पहले से मौजूद थे।


और एक बड़ा कारण यह है कि Google आम जनता के लिए "खोज परिणामों के आधिकारिक API" की पेशकश नहीं करता। Ars Technica के अनुसार, SERP स्क्रैपिंग की मांग को पूरा करने के बावजूद, यह कानूनी रूप से ग्रे क्षेत्र में रहता है। Ars Technica



SerpApi का प्रतिवाद: "यह सार्वजनिक जानकारी है", "यह प्रतिस्पर्धा को खत्म करने वाला मुकदमा है"

SerpApi पूरी तरह से लड़ने के लिए तैयार है, और रिपोर्टों के अनुसार, "यह वही जानकारी प्रदान करता है जो बिना लॉगिन के ब्राउज़र में दिखाई देती है", और यह मुकदमा अगली पीढ़ी के AI, सुरक्षा, और ब्राउज़र आदि बनाने वाले "उद्यमियों" के लिए प्रतिस्पर्धा को दबाने वाला है, ऐसा दावा किया जा रहा है। Reuters


यहां पर बहस का "मूल" है।

  • क्या स्क्रीन पर दिखाई देने वाली जानकारी को स्वत: संग्रहित करना सही है?

  • क्या मात्रा और साधन (परिहार और धोखाधड़ी) के शामिल होते ही, यह अलग मुद्दा बन जाता है?

  • "खोज परिणाम पृष्ठ" के रूप में संपादित सामग्री पर कितना कॉपीराइट/संरक्षण लागू होता है?


Google "साधन (परिहार) और पैमाना (बड़े पैमाने पर)" को गंभीरता से देखता है, जबकि SerpApi "सार्वजनिक जानकारी की पहुंच" को प्राथमिकता देता है। दोनों पक्षों के विचार तकनीकी और वैचारिक रूप से भिन्न हैं। The Verge



अब क्यों?――AI ने "खोज डेटा के मूल्य" को बढ़ा दिया

इस मुकदमे पर ध्यान इसलिए है क्योंकि AI के प्रसार ने "खोज परिणाम डेटा के मूल्य" को बढ़ा दिया। Ars Technica के अनुसार, चैटबॉट्स को वेब को सारांशित करने के लिए पहले लिंक समूह (खोज परिणामों के समान सामग्री) की आवश्यकता होती है, जिससे SERP डेटा की मांग बढ़ गई है। Ars Technica


इसके अलावा, पृष्ठभूमि के रूप में, Reddit ने 2025 के अक्टूबर में Perplexity और कई स्क्रैपिंग कंपनियों (SerpApi आदि) के खिलाफ मुकदमा दायर किया, जिसमें Google की रक्षा (SearchGuard) का उल्लेख किया गया था। Ars Technica


Reuters ने यह भी बताया है कि Reddit ने Google के मुकदमे का समर्थन करने की स्थिति दिखाई है। Reuters



कानूनी मुद्दे: "DMCA का परिहार" और "कॉपीराइट और अनुबंध" मुख्य बिंदु हैं

रिपोर्टों और उद्योग विश्लेषण के आधार पर, Google के मुख्य दो मुद्दे हैं।

  1. तकनीकी सुरक्षा उपायों का परिहार (DMCA धारा 1201 के आसपास)

  2. खोज परिणामों में शामिल कृतियों और लाइसेंस सामग्री का उल्लंघन, और उपयोग की शर्तों का उल्लंघन


विशेष रूप से DMCA (तकनीकी सुरक्षा उपायों का परिहार) का मुद्दा "कॉपी-पेस्ट" से अधिक है, क्योंकि यह "सुरक्षा को पार करके पहुंच प्राप्त करने" के मुद्दे पर ध्यान केंद्रित करता है, जिससे तर्क करना आसान हो जाता है। SEO उद्योग मीडिया ने बताया है कि Google DMCA धारा 1201 के ढांचे में लड़ने की तैयारी कर रहा है और अनुरोध वृद्धि दर (अधिकतम 25,000% वृद्धि) का उल्लेख किया है। Search Engine Roundtable


यह मुकदमा 2025 के 19 दिसंबर को कैलिफोर्निया के उत्तरी जिले के संघीय जिला न्यायालय में दायर किया गया था, यह जानकारी भी न्यायालय के रिकॉर्ड में पुष्टि की जा सकती है। Justia Dockets & Filings


※यहां एक सामान्य टिप्पणी: अंतिम अवैध/वैध निर्णय अदालत की तथ्यात्मक मान्यता पर निर्भर करेगा, और वर्तमान में यह दोनों पक्षों के दावों का चरण है।



अब उद्योग का भविष्य क्या होगा? (SEO, डेटा, AI उत्पादों पर प्रभाव)

इस मुकदमे का व्यावसायिक लोगों के लिए "दूसरे किनारे की आग" नहीं होने का कारण तीन हैं।

1) "Google के खोज परिणामों का उपयोग करने वाला" व्यवसाय पुनर्गठित होगा

SERP प्राप्ति पर आधारित उपकरण और विश्लेषण कई हैं। यदि रोकथाम या कठोर निर्णय आता है, तो SERP डेटा पर निर्भर सेवाओं को अपने स्रोत को बदलना होगा या प्राप्ति विधियों को मूल रूप से पुनर्गठित करना होगा। Ars Technica


2) वैकल्पिक डेटा स्रोतों (अन्य इंडेक्स/लाइसेंस) का मूल्य बढ़ेगा

Ars Technica का सुझाव है कि यदि SERP स्क्रैपिंग कठिन हो जाती है, तो आधिकारिक API वाले अन्य इंडेक्स/खोज प्लेटफार्मों की मांग बढ़ सकती है। Ars Technica##