Ciencia y Tecnología
Reddit acaba de demandar a Perplexity: el mensaje es claro, si usas mis datos sin pagar, prepara tus abogados
El modelo de negocio de Internet lleva décadas sustentándose en un pacto tácito: si algo es gratuito, el producto probablemente somos nosotros. Durante años, esa lógica se asumió sin grandes sobresaltos, pero la irrupción de la inteligencia artificial está cambiando las reglas. Las plataformas que almacenan conversaciones humanas se han convertido en minas de oro para entrenar modelos, y eso ha reabierto viejas preguntas sobre el valor de los datos. En medio de este nuevo escenario, Reddit se ha plantado con fuerza. Aunque sus millones de usuarios no reciban compensación alguna por el contenido que generan, la compañía ha dejado claro que no tolerará que otros lo usen sin pagar por ello.
La firmeza de Reddit se ha materializado en una nueva demanda presentada ante la justicia estadounidense. La compañía acusa a Perplexity AI y a tres proveedores de servicios de raspado de datos de haber eludido sus mecanismos de protección para acceder a contenido protegido por derechos de autor. En su denuncia, Reddit describe un “raspado a escala industrial” y sostiene que el objetivo de estas empresas es obtener de forma ilícita el material con el que se alimentan los motores de inteligencia artificial. Es un nuevo capítulo de una estrategia para controlar el uso de su contenido.
Un caso bastante particular. En el centro de la denuncia están Perplexity AI y tres intermediarios de raspado masivo de datos: SerpApi, Oxylabs y AWMProxy. Reddit los describe como “aspirantes a ladrones de bancos”, una metáfora con la que la compañía ilustra el intento de acceder a su contenido por vías indirectas. En lugar de firmar un acuerdo de licencia, sostiene la demanda, estas empresas habrían optado por usar servicios de terceros para recolectar publicaciones, comentarios y datos protegidos por derechos de autor. El buscador conversacional figura como cliente de “al menos uno” de esos proveedores.
El escrito judicial detalla un patrón de comportamiento que, según Reddit, se repite desde hace meses. Las empresas acusadas habrían usado métodos automatizados para extraer información de la plataforma pese a las restricciones impuestas en su archivo público. El resultado, denuncia la compañía, fue un flujo constante de publicaciones que acabaron integradas en el motor de inteligencia artificial de la demandada. Para Reddit, se trata de un raspado “a escala industrial” y con fines claramente comerciales.
La prueba que lo encendió todo. Uno de los episodios más relevantes de la denuncia es un experimento que Reddit considera clave. En mayo de 2024, la compañía ordenó a la demandada que dejara de recopilar sus datos. Sin embargo, poco después observó un incremento en las menciones de Reddit dentro del motor de respuestas de Perplexity. Para verificarlo, publicó una entrada diseñada para ser visible únicamente por Google. Según la denuncia, pocas horas más tarde el texto completo de esa publicación ya aparecía en los resultados generados por el sistema de la empresa acusada.

Perplexity no se esconde. Perplexity señaló en la propia plataforma de Reddit. En ese mensaje explicó que es una compañía “de capa de aplicación” y que “no entrena modelos de inteligencia artificial con contenido de Reddit”. “Nunca lo ha hecho”, añadía el texto. Según la empresa, esa diferencia hace imposible firmar un acuerdo de licencia como los que Reddit ha alcanzado con otras compañías. “Hace un año, tras explicar esto, Reddit insistió en que pagáramos igualmente. Ceder ante ese tipo de tácticas no es nuestra forma de hacer negocios”, concluía el comunicado.
Cuando hay acuerdo, hay dinero. La posición de Reddit frente a Perplexity contrasta con los acuerdos que ha firmado con otras tecnológicas. En febrero de 2024 amplió su colaboración con Google para permitir el acceso a su contenido mediante la API de datos, de forma estructurada y bajo licencia. Tres meses después, anunció una alianza similar con OpenAI: ChatGPT y otros productos de la compañía pueden mostrar publicaciones recientes de Reddit en sus respuestas.
Lo que aceptamos (muchas veces) sin leer. Detrás de todo este debate hay un elemento que muchos usuarios pasan por alto: los Términos de Servicio de Reddit. Al crear una cuenta, cada persona concede a la plataforma una licencia mundial, perpetua, irrevocable y sublicenciable para usar su contenido. Esa licencia permite copiar, modificar, distribuir o publicar cualquier aportación, incluso hacerla disponible a otras empresas asociadas. En el texto se especifica además que Reddit puede utilizar ese material para “entrenar modelos de inteligencia artificial y aprendizaje automático”. En otras palabras, el permiso ya está concedido.
Algo que ya vimos, y lo que todavía queda por ver. Reddit lleva tiempo trazando un patrón claro de actuación. En 2023 endureció sus condiciones de acceso a la API, lo que derivó en protestas generalizadas y en el cierre temporal de miles de comunidades. Un año más tarde, en mayo de 2024, envió una carta de cese a Perplexity por el uso no autorizado de sus datos y posteriormente presentó una demanda contra Anthropic por motivos similares. El litigio actual encaja en esa misma lógica: proteger el valor de su contenido y reforzar su control sobre quién puede utilizarlo.
El caso entre Reddit y Perplexity aún está en su fase inicial, pero sus implicaciones son evidentes. Lo que decidan los tribunales podría sentar un precedente para futuras disputas entre plataformas y desarrolladores de inteligencia artificial. De un lado está la defensa del acceso libre a la información; del otro, el derecho de las compañías a proteger el contenido generado en sus comunidades. El resultado definirá hasta dónde llega el control de las plataformas sobre el material que los usuarios comparten a diario.
Imágenes | Reddit | Xataka con Gemini 2.5 | Perplexity
En Xataka | La carrera por meter un robot humanoide en nuestra casa ha comenzado. Es una carrera absurda
–
La noticia
Reddit acaba de demandar a Perplexity: el mensaje es claro, si usas mis datos sin pagar, prepara tus abogados
fue publicada originalmente en
Xataka
por
Javier Marquez
.
El modelo de negocio de Internet lleva décadas sustentándose en un pacto tácito: si algo es gratuito, el producto probablemente somos nosotros. Durante años, esa lógica se asumió sin grandes sobresaltos, pero la irrupción de la inteligencia artificial está cambiando las reglas. Las plataformas que almacenan conversaciones humanas se han convertido en minas de oro para entrenar modelos, y eso ha reabierto viejas preguntas sobre el valor de los datos. En medio de este nuevo escenario, Reddit se ha plantado con fuerza. Aunque sus millones de usuarios no reciban compensación alguna por el contenido que generan, la compañía ha dejado claro que no tolerará que otros lo usen sin pagar por ello.La firmeza de Reddit se ha materializado en una nueva demanda presentada ante la justicia estadounidense. La compañía acusa a Perplexity AI y a tres proveedores de servicios de raspado de datos de haber eludido sus mecanismos de protección para acceder a contenido protegido por derechos de autor. En su denuncia, Reddit describe un “raspado a escala industrial” y sostiene que el objetivo de estas empresas es obtener de forma ilícita el material con el que se alimentan los motores de inteligencia artificial. Es un nuevo capítulo de una estrategia para controlar el uso de su contenido.Un caso bastante particular. En el centro de la denuncia están Perplexity AI y tres intermediarios de raspado masivo de datos: SerpApi, Oxylabs y AWMProxy. Reddit los describe como “aspirantes a ladrones de bancos”, una metáfora con la que la compañía ilustra el intento de acceder a su contenido por vías indirectas. En lugar de firmar un acuerdo de licencia, sostiene la demanda, estas empresas habrían optado por usar servicios de terceros para recolectar publicaciones, comentarios y datos protegidos por derechos de autor. El buscador conversacional figura como cliente de “al menos uno” de esos proveedores.
El escrito judicial detalla un patrón de comportamiento que, según Reddit, se repite desde hace meses. Las empresas acusadas habrían usado métodos automatizados para extraer información de la plataforma pese a las restricciones impuestas en su archivo público. El resultado, denuncia la compañía, fue un flujo constante de publicaciones que acabaron integradas en el motor de inteligencia artificial de la demandada. Para Reddit, se trata de un raspado “a escala industrial” y con fines claramente comerciales.
La prueba que lo encendió todo. Uno de los episodios más relevantes de la denuncia es un experimento que Reddit considera clave. En mayo de 2024, la compañía ordenó a la demandada que dejara de recopilar sus datos. Sin embargo, poco después observó un incremento en las menciones de Reddit dentro del motor de respuestas de Perplexity. Para verificarlo, publicó una entrada diseñada para ser visible únicamente por Google. Según la denuncia, pocas horas más tarde el texto completo de esa publicación ya aparecía en los resultados generados por el sistema de la empresa acusada.
Perplexity no se esconde. Perplexity señaló en la propia plataforma de Reddit. En ese mensaje explicó que es una compañía “de capa de aplicación” y que “no entrena modelos de inteligencia artificial con contenido de Reddit”. “Nunca lo ha hecho”, añadía el texto. Según la empresa, esa diferencia hace imposible firmar un acuerdo de licencia como los que Reddit ha alcanzado con otras compañías. “Hace un año, tras explicar esto, Reddit insistió en que pagáramos igualmente. Ceder ante ese tipo de tácticas no es nuestra forma de hacer negocios”, concluía el comunicado.Cuando hay acuerdo, hay dinero. La posición de Reddit frente a Perplexity contrasta con los acuerdos que ha firmado con otras tecnológicas. En febrero de 2024 amplió su colaboración con Google para permitir el acceso a su contenido mediante la API de datos, de forma estructurada y bajo licencia. Tres meses después, anunció una alianza similar con OpenAI: ChatGPT y otros productos de la compañía pueden mostrar publicaciones recientes de Reddit en sus respuestas.Lo que aceptamos (muchas veces) sin leer. Detrás de todo este debate hay un elemento que muchos usuarios pasan por alto: los Términos de Servicio de Reddit. Al crear una cuenta, cada persona concede a la plataforma una licencia mundial, perpetua, irrevocable y sublicenciable para usar su contenido. Esa licencia permite copiar, modificar, distribuir o publicar cualquier aportación, incluso hacerla disponible a otras empresas asociadas. En el texto se especifica además que Reddit puede utilizar ese material para “entrenar modelos de inteligencia artificial y aprendizaje automático”. En otras palabras, el permiso ya está concedido.
En Xataka
Mientras OpenAI se lleva toda la gloria mediática con ChatGPT, Alibaba ya le está comiendo clientes importantes con Qwen. El último: Airbnb
Algo que ya vimos, y lo que todavía queda por ver. Reddit lleva tiempo trazando un patrón claro de actuación. En 2023 endureció sus condiciones de acceso a la API, lo que derivó en protestas generalizadas y en el cierre temporal de miles de comunidades. Un año más tarde, en mayo de 2024, envió una carta de cese a Perplexity por el uso no autorizado de sus datos y posteriormente presentó una demanda contra Anthropic por motivos similares. El litigio actual encaja en esa misma lógica: proteger el valor de su contenido y reforzar su control sobre quién puede utilizarlo.El caso entre Reddit y Perplexity aún está en su fase inicial, pero sus implicaciones son evidentes. Lo que decidan los tribunales podría sentar un precedente para futuras disputas entre plataformas y desarrolladores de inteligencia artificial. De un lado está la defensa del acceso libre a la información; del otro, el derecho de las compañías a proteger el contenido generado en sus comunidades. El resultado definirá hasta dónde llega el control de las plataformas sobre el material que los usuarios comparten a diario.Imágenes | Reddit | Xataka con Gemini 2.5 | Perplexity En Xataka | La carrera por meter un robot humanoide en nuestra casa ha comenzado. Es una carrera absurda
– La noticia
Reddit acaba de demandar a Perplexity: el mensaje es claro, si usas mis datos sin pagar, prepara tus abogados
fue publicada originalmente en
Xataka
por
Javier Marquez
.

