¿Se puede tomar libremente "datos públicos"? La práctica del scraping se tambalea con la demanda contra Google

¿Se puede tomar libremente "datos públicos"? La práctica del scraping se tambalea con la demanda contra Google

"API para extraer resultados de búsqueda" finalmente en el tribunal

El 19 de diciembre de 2025 (hora de EE.UU.), Google demandó a la empresa de scraping de datos de Texas, SerpApi. Aunque el tema parece simple, es en realidad complejo.La acción de obtener automáticamente resultados de búsqueda (SERP) y "venderlos como API" es, ¿una infraestructura conveniente o un dispositivo que se aprovecha de la inversión de los motores de búsqueda y editores?. Con la llegada de la era de la IA, el valor de los datos de búsqueda ha aumentado, sacando a la luz un negocio que durante mucho tiempo estuvo en una zona gris. The Verge



¿Qué sucedió? — Resumen de las afirmaciones de Google

Según los informes, Google alega que SerpApi está raspando masivamente contenido de la web, incluidos los resultados de búsqueda de Google, y revendiéndolos a clientes. Además, acusa a SerpApi de eludir el sistema de protección contra scraping de Google (SearchGuard), accediendo como si fuera una visualización humana. The Verge


Lo que preocupa especialmente a Google son las "obras protegidas por derechos de autor incluidas en los resultados de búsqueda". Los resultados de búsqueda no solo contienen enlaces y texto, sino también imágenes y varios módulos que aparecen en el Panel de Conocimiento, así como información vinculada a Maps/Shopping, que se basan en contratos de licencia. Google sostiene que al "obtener→formatear→proveer como API" estos elementos, SerpApi está socavando los costos y el diseño de derechos que Google y los titulares de derechos están soportando. Reuters


Además, los medios de la industria SEO informan que Google describe el modelo de SerpApi como "parásito" y menciona en la demanda que las solicitudes artificiales son enormes. Search Engine Roundtable



¿Qué es SearchGuard? La barrera entre "visualización humana" y "obtención automática"

En el centro de esta historia está SearchGuard. Según The Verge, SearchGuard se implementó en enero de 2025 y ha funcionado con el propósito de detener el scraping no autorizado. Google alega que SerpApi utilizó navegadores falsos y múltiples direcciones IP para simular acceso humano y superar esta barrera. The Verge


Además, las explicaciones de los medios de la industria describen que SearchGuard utiliza desafíos de JavaScript para verificar la "apariencia de un navegador humano", permitiendo el paso natural a los usuarios legítimos mientras se convierte en una barrera para los bots. PPC Land


La publicación oficial del blog de Google también critica a los scrapers furtivos por ignorar la intención del sitio (como robots.txt) mediante cloaking, acceso masivo tipo botnet, falsificación de nombres de crawler, y privar a los titulares de derechos de su elección. Afirman que tales acciones han aumentado significativamente en el último año, llevando a la demanda como "último recurso". Google Blog



¿Quién es SerpApi y por qué ha sido utilizado?

SerpApi es conocido por obtener resultados de búsqueda de Google, Bing, etc., y formatearlos en JSON, haciéndolos fáciles de integrar en aplicaciones y plataformas de análisis. En el campo práctico,

  • investigación de competencia, monitoreo de precios y stock, seguimiento de cambios en el ranking de SERP

  • monitoreo (detección de desinformación y sitios fraudulentos)

  • "Recolección de URLs de referencia" para productos de LLM/búsqueda
    , han sido usos comunes de "tratar los resultados de búsqueda como material".


Y lo más importante es que Google no ofrece una "API oficial de los resultados de búsqueda" para el público. Ars Technica señala que aunque el scraping de SERP satisface la demanda, tiende a ser legalmente gris. Ars Technica



La respuesta de SerpApi: "Es información pública", "Es una demanda para eliminar la competencia"

SerpApi está dispuesto a luchar completamente, afirmando en los informes que "proporcionan la misma información que se muestra en el navegador sin necesidad de inicio de sesión", y que esta demanda es una restricción competitiva para "innovadores" que crean la próxima generación de IA, seguridad, navegadores, etc.. Reuters


Este es el "núcleo" del debate.

  • ¿Es libre de ser recolectado automáticamente porque es visible en la pantalla?

  • ¿Se convierte en otra cuestión cuando se involucran cantidad y métodos (evasión y falsificación)?

  • ¿Hasta dónde se extienden los derechos de autor/protección sobre una "página de resultados de búsqueda" como obra editada?


Google se centra en "métodos (evasión) y escala (masiva)", mientras que SerpApi destaca "acceso a información pública". Las posiciones de ambos lados difieren tanto técnica como ideológicamente. The Verge



¿Por qué ahora? — La IA ha elevado el "valor de los datos de búsqueda"

Esta demanda es notable porque la proliferación de la IA ha aumentado el "valor de los datos de resultados de búsqueda". Ars Technica señala que para que los chatbots resuman la web, primero necesitan un grupo de enlaces (material similar a los resultados de búsqueda), lo que ha incrementado la demanda de datos de SERP. Ars Technica


Además, en octubre de 2025, Reddit presentó una demanda contra Perplexity y varias empresas de scraping (incluyendo SerpApi), donde también se mencionó la defensa de Google (SearchGuard). Ars Technica


Reuters también informa que Reddit ha mostrado apoyo a la demanda de Google. Reuters



Cuestiones legales: Los puntos clave son "evasión del DMCA" y "derechos de autor y contratos"

Según los informes y análisis de la industria, Google se centra en dos aspectos principales.

  1. Evasión de medidas de protección técnica (alrededor de la sección 1201 del DMCA)

  2. Infracción de obras protegidas por derechos de autor y materiales con licencia incluidos en los resultados de búsqueda, así como violación de términos de uso


En particular, el DMCA (evasión de medidas de protección técnica) es un punto de ataque fuerte porque no se trata solo de "copiar y pegar", sino de "acceder superando la protección". Los medios de la industria SEO destacan la postura de Google de luchar bajo el marco de la sección 1201 del DMCA y mencionan el aumento de solicitudes (hasta un 25,000% más). Search Engine Roundtable


Además, se ha confirmado que la demanda fue presentada el 19 de diciembre de 2025 en el Tribunal de Distrito del Norte de California, según los registros judiciales. Justia Dockets & Filings


※Nota general: La determinación final de legalidad/ilegalidad dependerá de los hechos establecidos en el juicio, y actualmente estamos en la etapa de afirmaciones de ambas partes.



¿Qué sigue para la industria? (Impacto en SEO, datos y productos de IA)

Hay tres razones por las que esta demanda no es un "fuego lejano" para los profesionales.

1) Se reorganizará el negocio que "utiliza los resultados de búsqueda de Google como material"

Hay muchas herramientas y análisis que dependen de la obtención de SERP. Si se emite una orden de restricción o un juicio fuerte, los servicios que dependen de datos de SERP tendrán que cambiar su fuente de adquisición o reestructurar fundamentalmente sus métodos de obtención. Ars Technica


2) Aumentará el valor de las fuentes de datos alternativas (otros índices/licencias)

Ars Technica sugiere que si el scraping de SERP se vuelve más difícil, la demanda podría trasladarse a otros índices/bases de búsqueda que tengan API oficiales. Ars Technica


3) Se redefinirá el tratamiento de la "información pública" en la era de la IA

La intuición de que "lo que está publicado puede ser recolectado libremente por máquinas" es fuerte, pero en la era de la IA, la "escala de recolección" es de otro nivel. Google quiere poner un freno a esto. Por otro lado, SerpApi argumenta que restringir el acceso a datos públicos detendría la innovación. The Times of India



Reacciones en redes sociales: El debate se centra en la "doble moral"

En este caso, lo que destaca en las redes sociales y comunidades no es tanto la "ejecución de la justicia", sino más bien el problema de **"tú también lo haces"