"공개 데이터"는 자유롭게 가져가도 될까? Google 소송으로 흔들리는 스크레이핑 실무

2025年12月21日 07:54

「검색 결과를 흡수하는 API」 드디어 법정으로

2025년 12월 19일(미국 시간), Google이 텍사스주의 데이터 스크래핑 기업 SerpApi를 제소했다. 쟁점은 단순해 보이지만, 사실 복잡하다.검색 결과(SERP)를 자동으로 획득하여 “API로 판매하는” 행위는 편리한 인프라인가/검색 엔진과 출판사의 투자에 무임승차하는 장치인가. AI 시대에 들어서면서 검색 데이터의 가치가 급등한 것으로 인해, 오랫동안 그레이존에 있던 비즈니스가 한꺼번에 “공식 무대”로 끌려나온 모양새다. The Verge

무슨 일이 일어났나?――Google의 주장을 요점만 정리

보도에 따르면 Google은, SerpApi가 Google 검색 결과를 포함한 웹상의 콘텐츠를 대규모로 스크래핑하여 고객에게 재판매하고 있다고 주장한다. 또한, Google이 스크래핑 대책으로 도입한 시스템(SearchGuard)을 회피하고, 마치 인간의 열람인 것처럼 가장하여 접근했다고 고소하고 있다. The Verge

Google 측이 특히 문제시하는 것은 "검색 결과에 포함된 저작물"이다. 검색 결과에는 링크와 텍스트뿐만 아니라, Knowledge Panel(지식 패널) 등에서 나오는 이미지나 각종 모듈, Maps/Shopping에 연결된 정보 등, 라이선스 계약에 기반한 소재도 섞여 있다. Google은, SerpApi가 그것들을 “획득→정형→API 제공”함으로써, Google이나 권리자가 부담하고 있는 비용이나 권리 설계를 무너뜨리고 있다고 위치 짓는다. Reuters

또한, SEO 업계 매체는, Google이 SerpApi의 모델을 "기생적"이라고 표현하고, 인위적 요청이 방대하다고 소장에서 언급하고 있는 점도 전하고 있다. Search Engine Roundtable

SearchGuard란 무엇인가: "인간의 열람"과 "자동 획득"을 나누는 벽

이번 이야기의 중심에 있는 것이 SearchGuard다. The Verge의 정리에 따르면, SearchGuard는 2025년 1월에 전개되어, 무단 스크래핑을 막기 위한 목적으로 기능해 왔다고 한다. Google은, SerpApi가 위장 브라우저나 다수의 IP 주소를 사용하여, 인간의 접근으로 가장하여 이 벽을 넘었다고 주장한다. The Verge

또한 업계 매체의 해설에서는, SearchGuard는 JavaScript 챌린지 등으로 “인간의 브라우저 같음”을 확인하는 구조로, 정규 사용자에게는 자연스럽게 통과하는 한편, 봇에게는 장벽이 되기 쉽다는 구도가 그려지고 있다. PPC Land

Google의 공식 블로그 게시물도, 스텔스형 스크레이퍼가 클로킹, 봇넷적인 대량 접근, 크롤러 이름의 위장 등으로 사이트의 의사(robots.txt 등)를 무시하고, 권리자의 선택을 빼앗는다고 비판. 최근 1년간 이러한 행위가 크게 증가했다고 하며 “마지막 수단으로서 소송에 나섰다”는 입장이다. Google Blog

SerpApi는 누구이며, 왜 사용되어 왔는가

SerpApi는, Google이나 Bing 등의 검색 결과를 획득하여 JSON 등으로 정형화하고, 애플리케이션이나 분석 기반에 쉽게 통합할 수 있도록 하는 서비스로 알려져 있다. 실무 현장에서는,

경쟁 조사, 가격·재고 조사, SERP의 순위 변동 추적
모니터링(허위 정보·사기 사이트의 탐지)
LLM/검색계 제품의 "참조 원본 URL 수집"
등, “검색 결과를 재료로 취급하는” 용도가 예전부터 존재했다.

그리고 큰 이유는, Google이 일반 사용자에게 "검색 결과 자체의 공식 API"를 제공하지 않는 상황이다. Ars Technica는, SERP 스크래핑이 수요를 충족시키는 한편, 법적으로는 그레이가 되기 쉽다고 정리한다. Ars Technica

SerpApi의 반론: "공개 정보다", "경쟁을 억제하는 소송이다"

SerpApi 측은 전면적으로 싸울 자세로, 보도에서는 "로그인 불필요하게 브라우저에 표시되는 정보와 같은 것을 제공하고 있다"며, 이 소송은 차세대 AI나 보안, 브라우저 등을 만드는 “혁신자”에 대한 경쟁 억제라고 주장하고 있다. Reuters

여기가 논의의 “핵심”이다.

화면에 보이는 것 = 자유롭게 자동 수집해도 되는가?
양과 수단(회피·위장)이 포함된 순간에, 다른 이야기가 되는가?
“검색 결과 페이지”라는 편집물에, 어디까지 저작권/보호가 미치는가?

Google은 "수단(회피)과 규모(대량)"를 강하게 문제시하고, SerpApi는 "공개 정보에 대한 접근"을 전면에 내세운다. 양측의 주장은 기술적으로도 사상적으로도 엇갈린다. The Verge

왜 지금?――AI가 “검색 데이터의 가치”를 급등시켰다

이번 제소가 주목받는 것은, AI의 보급으로 “검색 결과 데이터의 가치”가 급등했기 때문이다. Ars Technica는, 챗봇이 웹을 요약하는 데에도, 먼저 링크군(=검색 결과에 가까운 소재)이 필요하며, 결과적으로 SERP 데이터에 대한 수요가 높아졌다고 지적한다. Ars Technica

또한 배경으로, Reddit이 2025년 10월에, Perplexity와 여러 스크래핑 기업(SerpApi 등)을 상대로 한 소송이 있었고, 그곳에서도 Google 측의 방어(SearchGuard)가 언급되었다. Ars Technica

이번 Reuters는, Reddit이 Google의 제소를 지지하는 입장을 보였다는 것도 전하고 있다. Reuters

보도·업계 해설의 범위에서 정리하면, Google이 축으로 삼는 것은 크게 두 가지다.

기술적 보호 수단의 회피(DMCA 1201조 주변)
검색 결과에 포함된 저작물·라이선스 소재의 침해, 및 이용 약관 위반

특히 DMCA(기술적 보호 수단의 회피)는, 단순한 “복사”가 아니라 "방어를 돌파하여 접근했다"는 점을 공격할 수 있어, 논점을 세우기 쉽다. SEO 업계 매체는, Google이 DMCA 1201조의 틀 안에서 싸우는 자세나, 요청 증가율(최대 25,000% 증가) 등을 소개하고 있다. Search Engine Roundtable

덧붙여, 소송은 2025년 12월 19일에 캘리포니아 북부 지구 연방 지방법원에 제기되었다는 재판 기록 정보도 확인할 수 있다. Justia Dockets & Filings

※여기는 일반론: 최종적인 불법/적법의 판단은 재판의 사실 인정에 따라 달라지며, 현 시점에서는 양측의 주장 단계다.

여기서부터 업계는 어떻게 될까? (SEO·데이터·AI 제품에의 영향)

이번 제소가, 실무자에게 “강 건너 불구경”이 아닌 이유는 세 가지가 있다.

1) "Google의 검색 결과를 재료로 하는" 비즈니스가 재편된다

SERP 획득을 전제로 한 도구나 분석은 많다. 만약 금지나 강한 판단이 나오면, SERP 데이터 의존 서비스는 조달처를 바꾸거나, 획득 방법을 근본적으로 재구성할 필요가 생긴다. Ars Technica

2) 대체 데이터 원천(타사 인덱스/라이선스)의 가치가 상승한다

Ars Technica는, SERP 스크래핑이 어려워지면, 공식적으로 API를 가진 다른 인덱스/검색 기반으로 수요가 이동할 가능성도 시사하고 있다. Ars Technica##

"공개 데이터"는 자유롭게 가져가도 될까? Google 소송으로 흔들리는 스크레이핑 실무

「검색 결과를 흡수하는 API」 드디어 법정으로

무슨 일이 일어났나?――Google의 주장을 요점만 정리

SearchGuard란 무엇인가: "인간의 열람"과 "자동 획득"을 나누는 벽

SerpApi는 누구이며, 왜 사용되어 왔는가

SerpApi의 반론: "공개 정보다", "경쟁을 억제하는 소송이다"

왜 지금?――AI가 “검색 데이터의 가치”를 급등시켰다

법률 면의 쟁점: 포인트는 "DMCA의 회피"와 "저작권·계약"

여기서부터 업계는 어떻게 될까? (SEO·데이터·AI 제품에의 영향)

1) "Google의 검색 결과를 재료로 하는" 비즈니스가 재편된다

2) 대체 데이터 원천(타사 인덱스/라이선스)의 가치가 상승한다

바이두, AI 혁명으로 검색과 동영상 생성 혁신! 바이두가 노리는 광고 이후의 금맥

위키백과는 "AI 슬롭"과 어떻게 싸우는가 — “신속 삭제”의 충격 : 품질을 지키기 위한 새로운 규칙

Apple과 Google의 결정은? DeepSeek 삭제 요청으로 흔들리는 AI 냉전 최전선

"AI 사기 2.0": 사기와 디지털 아이덴티티 범죄의 급증

Google의 AI 모드가 진화! "검색 = 작업 대행"으로 - Google AI 모드가 Deep Search와 자동 전화로 대진화

cookie_banner_title

「검색 결과를 흡수하는 API」 드디어 법정으로

무슨 일이 일어났나?――Google의 주장을 요점만 정리

SearchGuard란 무엇인가: "인간의 열람"과 "자동 획득"을 나누는 벽

SerpApi는 누구이며, 왜 사용되어 왔는가

SerpApi의 반론: "공개 정보다", "경쟁을 억제하는 소송이다"

왜 지금?――AI가 “검색 데이터의 가치”를 급등시켰다

법률 면의 쟁점: 포인트는 "DMCA의 회피"와 "저작권·계약"

여기서부터 업계는 어떻게 될까? (SEO·데이터·AI 제품에의 영향)

1) "Google의 검색 결과를 재료로 하는" 비즈니스가 재편된다

2) 대체 데이터 원천(타사 인덱스/라이선스)의 가치가 상승한다

바이두, AI 혁명으로 검색과 동영상 생성 혁신! 바이두가 노리는 광고 이후의 금맥

위키백과는 "AI 슬롭"과 어떻게 싸우는가 — “신속 삭제”의 충격 : 품질을 지키기 위한 새로운 규칙

Apple과 Google의 결정은? DeepSeek 삭제 요청으로 흔들리는 AI 냉전 최전선

"AI 사기 2.0": 사기와 디지털 아이덴티티 범죄의 급증

Google의 AI 모드가 진화! "검색 = 작업 대행"으로 - Google AI 모드가 Deep Search와 자동 전화로 대진화