"पब्लिक डेटा" को स्वतंत्र रूप से लिया जा सकता है? Google के मुकदमे से हिलता स्क्रैपिंग का अभ्यास

2025年12月21日 07:55

"खोज परिणामों को खींचने वाला API" आखिरकार अदालत में

2025 के 19 दिसंबर (अमेरिकी समय) को, Google ने टेक्सास की डेटा स्क्रैपिंग कंपनी SerpApi पर मुकदमा दायर किया। विवाद का मुद्दा सरल दिखता है, लेकिन वास्तव में जटिल है।खोज परिणाम (SERP) को स्वचालित रूप से प्राप्त कर "API के रूप में बेचना" कार्यवाही, एक सुविधाजनक इन्फ्रास्ट्रक्चर है या खोज इंजन और प्रकाशकों के निवेश पर मुफ्त में सवारी करने वाला उपकरण है। AI युग में प्रवेश के साथ, खोज डेटा का मूल्य बढ़ गया है, जिससे लंबे समय से ग्रे ज़ोन में रहे व्यवसाय को अचानक "मुख्य मंच" पर खींच लिया गया है। The Verge

क्या हुआ?――Google के दावे का सारांश

रिपोर्टों के अनुसार, Google का दावा है कि SerpApi ने Google खोज परिणामों सहित वेब सामग्री को बड़े पैमाने पर स्क्रैप किया और ग्राहकों को पुनर्विक्रय किया। इसके अलावा, Google ने स्क्रैपिंग के खिलाफ जो तंत्र (SearchGuard) लागू किया था, उसे दरकिनार कर, मानवीय दृष्टि के रूप में दिखाकर पहुंच प्राप्त की, ऐसा आरोप लगाया गया है। The Verge

Google विशेष रूप से "खोज परिणामों में शामिल कृतियों" पर ध्यान केंद्रित कर रहा है। खोज परिणामों में लिंक और पाठ के अलावा, Knowledge Panel (ज्ञान पैनल) में दिखाई देने वाली छवियां और विभिन्न मॉड्यूल, Maps/Shopping से जुड़ी जानकारी जैसी लाइसेंस अनुबंधों पर आधारित सामग्री भी शामिल होती है। Google का दावा है कि SerpApi इन सामग्रियों को "प्राप्त → स्वरूपित → API प्रदान" करके, Google और अधिकार धारकों द्वारा वहन किए गए लागत और अधिकार संरचना को बाधित कर रहा है। Reuters

इसके अलावा, SEO उद्योग मीडिया ने बताया है कि Google ने SerpApi के मॉडल को "परजीवी" के रूप में वर्णित किया है और शिकायत में कहा है कि कृत्रिम अनुरोधों की संख्या अत्यधिक है। Search Engine Roundtable

SearchGuard क्या है: "मानवीय दृष्टि" और "स्वचालित प्राप्ति" को विभाजित करने वाली दीवार

इस कहानी के केंद्र में SearchGuard है। The Verge के अनुसार, SearchGuard को 2025 के जनवरी में लागू किया गया था और इसका उद्देश्य बिना अनुमति के स्क्रैपिंग को रोकना था। Google का दावा है कि SerpApi ने नकली ब्राउज़र और कई IP पतों का उपयोग करते हुए, मानवीय पहुंच के रूप में दिखाकर इस दीवार को पार किया। The Verge

इसके अलावा, उद्योग मीडिया के विश्लेषण में, SearchGuard को JavaScript चुनौतियों के माध्यम से "मानवीय ब्राउज़र जैसी" विशेषताओं की पुष्टि करने के लिए डिज़ाइन किया गया है, जो नियमित उपयोगकर्ताओं के लिए स्वाभाविक रूप से पार हो जाता है, जबकि बॉट्स के लिए बाधा बन सकता है। PPC Land

Google के आधिकारिक ब्लॉग पोस्ट में भी, स्टील्थ स्क्रैपर्स की क्लोकिंग, बॉटनेट जैसी भारी पहुंच, क्रॉलर नाम की धोखाधड़ी आदि के माध्यम से साइट की इच्छाओं (robots.txt आदि) की अनदेखी करने और अधिकार धारकों की पसंद को छीनने की आलोचना की गई है। पिछले एक साल में इस तरह की गतिविधियों में काफी वृद्धि हुई है, और "अंतिम उपाय के रूप में मुकदमा दायर किया गया" है। Google Blog

SerpApi कौन है और इसका उपयोग क्यों किया गया है

SerpApi को Google और Bing जैसे खोज परिणामों को प्राप्त करने और JSON आदि में स्वरूपित करने के लिए जाना जाता है, जिससे इसे ऐप्स और विश्लेषण प्लेटफार्मों में आसानी से एकीकृत किया जा सके। व्यावहारिक क्षेत्र में,

प्रतिस्पर्धी विश्लेषण, मूल्य और स्टॉक जांच, SERP रैंकिंग में बदलाव की निगरानी
निगरानी (गलत जानकारी और धोखाधड़ी साइटों का पता लगाना)
LLM/खोज संबंधित उत्पादों के "संदर्भ URL संग्रह"
जैसे "खोज परिणामों को सामग्री के रूप में उपयोग करने" के उद्देश्य पहले से मौजूद थे।

और एक बड़ा कारण यह है कि Google आम जनता के लिए "खोज परिणामों के आधिकारिक API" की पेशकश नहीं करता। Ars Technica के अनुसार, SERP स्क्रैपिंग की मांग को पूरा करने के बावजूद, यह कानूनी रूप से ग्रे क्षेत्र में रहता है। Ars Technica

SerpApi का प्रतिवाद: "यह सार्वजनिक जानकारी है", "यह प्रतिस्पर्धा को खत्म करने वाला मुकदमा है"

SerpApi पूरी तरह से लड़ने के लिए तैयार है, और रिपोर्टों के अनुसार, "यह वही जानकारी प्रदान करता है जो बिना लॉगिन के ब्राउज़र में दिखाई देती है", और यह मुकदमा अगली पीढ़ी के AI, सुरक्षा, और ब्राउज़र आदि बनाने वाले "उद्यमियों" के लिए प्रतिस्पर्धा को दबाने वाला है, ऐसा दावा किया जा रहा है। Reuters

यहां पर बहस का "मूल" है।

क्या स्क्रीन पर दिखाई देने वाली जानकारी को स्वत: संग्रहित करना सही है?
क्या मात्रा और साधन (परिहार और धोखाधड़ी) के शामिल होते ही, यह अलग मुद्दा बन जाता है?
"खोज परिणाम पृष्ठ" के रूप में संपादित सामग्री पर कितना कॉपीराइट/संरक्षण लागू होता है?

Google "साधन (परिहार) और पैमाना (बड़े पैमाने पर)" को गंभीरता से देखता है, जबकि SerpApi "सार्वजनिक जानकारी की पहुंच" को प्राथमिकता देता है। दोनों पक्षों के विचार तकनीकी और वैचारिक रूप से भिन्न हैं। The Verge

अब क्यों?――AI ने "खोज डेटा के मूल्य" को बढ़ा दिया

इस मुकदमे पर ध्यान इसलिए है क्योंकि AI के प्रसार ने "खोज परिणाम डेटा के मूल्य" को बढ़ा दिया। Ars Technica के अनुसार, चैटबॉट्स को वेब को सारांशित करने के लिए पहले लिंक समूह (खोज परिणामों के समान सामग्री) की आवश्यकता होती है, जिससे SERP डेटा की मांग बढ़ गई है। Ars Technica

इसके अलावा, पृष्ठभूमि के रूप में, Reddit ने 2025 के अक्टूबर में Perplexity और कई स्क्रैपिंग कंपनियों (SerpApi आदि) के खिलाफ मुकदमा दायर किया, जिसमें Google की रक्षा (SearchGuard) का उल्लेख किया गया था। Ars Technica

Reuters ने यह भी बताया है कि Reddit ने Google के मुकदमे का समर्थन करने की स्थिति दिखाई है। Reuters

कानूनी मुद्दे: "DMCA का परिहार" और "कॉपीराइट और अनुबंध" मुख्य बिंदु हैं

रिपोर्टों और उद्योग विश्लेषण के आधार पर, Google के मुख्य दो मुद्दे हैं।

तकनीकी सुरक्षा उपायों का परिहार (DMCA धारा 1201 के आसपास)
खोज परिणामों में शामिल कृतियों और लाइसेंस सामग्री का उल्लंघन, और उपयोग की शर्तों का उल्लंघन

विशेष रूप से DMCA (तकनीकी सुरक्षा उपायों का परिहार) का मुद्दा "कॉपी-पेस्ट" से अधिक है, क्योंकि यह "सुरक्षा को पार करके पहुंच प्राप्त करने" के मुद्दे पर ध्यान केंद्रित करता है, जिससे तर्क करना आसान हो जाता है। SEO उद्योग मीडिया ने बताया है कि Google DMCA धारा 1201 के ढांचे में लड़ने की तैयारी कर रहा है और अनुरोध वृद्धि दर (अधिकतम 25,000% वृद्धि) का उल्लेख किया है। Search Engine Roundtable

यह मुकदमा 2025 के 19 दिसंबर को कैलिफोर्निया के उत्तरी जिले के संघीय जिला न्यायालय में दायर किया गया था, यह जानकारी भी न्यायालय के रिकॉर्ड में पुष्टि की जा सकती है। Justia Dockets & Filings

※यहां एक सामान्य टिप्पणी: अंतिम अवैध/वैध निर्णय अदालत की तथ्यात्मक मान्यता पर निर्भर करेगा, और वर्तमान में यह दोनों पक्षों के दावों का चरण है।

अब उद्योग का भविष्य क्या होगा? (SEO, डेटा, AI उत्पादों पर प्रभाव)

इस मुकदमे का व्यावसायिक लोगों के लिए "दूसरे किनारे की आग" नहीं होने का कारण तीन हैं।

1) "Google के खोज परिणामों का उपयोग करने वाला" व्यवसाय पुनर्गठित होगा

SERP प्राप्ति पर आधारित उपकरण और विश्लेषण कई हैं। यदि रोकथाम या कठोर निर्णय आता है, तो SERP डेटा पर निर्भर सेवाओं को अपने स्रोत को बदलना होगा या प्राप्ति विधियों को मूल रूप से पुनर्गठित करना होगा। Ars Technica

2) वैकल्पिक डेटा स्रोतों (अन्य इंडेक्स/लाइसेंस) का मूल्य बढ़ेगा

Ars Technica का सुझाव है कि यदि SERP स्क्रैपिंग कठिन हो जाती है, तो आधिकारिक API वाले अन्य इंडेक्स/खोज प्लेटफार्मों की मांग बढ़ सकती है। Ars Technica##

बायडू, AI क्रांति के साथ खोज और वीडियो निर्माण में बदलाव कर रहा है! बायडू का लक्ष्य विज्ञापन के बाद का खजाना है।

Apple और Google का निर्णय क्या होगा? DeepSeek हटाने के अनुरोध से हिलता AI शीत युद्ध का अग्रिम मोर्चा

"पब्लिक डेटा" को स्वतंत्र रूप से लिया जा सकता है? Google के मुकदमे से हिलता स्क्रैपिंग का अभ्यास

"खोज परिणामों को खींचने वाला API" आखिरकार अदालत में

क्या हुआ?――Google के दावे का सारांश

SearchGuard क्या है: "मानवीय दृष्टि" और "स्वचालित प्राप्ति" को विभाजित करने वाली दीवार

SerpApi कौन है और इसका उपयोग क्यों किया गया है

SerpApi का प्रतिवाद: "यह सार्वजनिक जानकारी है", "यह प्रतिस्पर्धा को खत्म करने वाला मुकदमा है"

अब क्यों?――AI ने "खोज डेटा के मूल्य" को बढ़ा दिया

कानूनी मुद्दे: "DMCA का परिहार" और "कॉपीराइट और अनुबंध" मुख्य बिंदु हैं

अब उद्योग का भविष्य क्या होगा? (SEO, डेटा, AI उत्पादों पर प्रभाव)

1) "Google के खोज परिणामों का उपयोग करने वाला" व्यवसाय पुनर्गठित होगा

2) वैकल्पिक डेटा स्रोतों (अन्य इंडेक्स/लाइसेंस) का मूल्य बढ़ेगा

cookie_banner_title

"खोज परिणामों को खींचने वाला API" आखिरकार अदालत में

क्या हुआ?――Google के दावे का सारांश

SearchGuard क्या है: "मानवीय दृष्टि" और "स्वचालित प्राप्ति" को विभाजित करने वाली दीवार

SerpApi कौन है और इसका उपयोग क्यों किया गया है

SerpApi का प्रतिवाद: "यह सार्वजनिक जानकारी है", "यह प्रतिस्पर्धा को खत्म करने वाला मुकदमा है"

अब क्यों?――AI ने "खोज डेटा के मूल्य" को बढ़ा दिया

कानूनी मुद्दे: "DMCA का परिहार" और "कॉपीराइट और अनुबंध" मुख्य बिंदु हैं

अब उद्योग का भविष्य क्या होगा? (SEO, डेटा, AI उत्पादों पर प्रभाव)

1) "Google के खोज परिणामों का उपयोग करने वाला" व्यवसाय पुनर्गठित होगा

2) वैकल्पिक डेटा स्रोतों (अन्य इंडेक्स/लाइसेंस) का मूल्य बढ़ेगा

बायडू, AI क्रांति के साथ खोज और वीडियो निर्माण में बदलाव कर रहा है! बायडू का लक्ष्य विज्ञापन के बाद का खजाना है।

Apple और Google का निर्णय क्या होगा? DeepSeek हटाने के अनुरोध से हिलता AI शीत युद्ध का अग्रिम मोर्चा