Ciencia y Tecnología

Anthropic entrenó su IA con millones de libros con copyright. A un juez eso le ha parecido correctísimo (con un gran asterisco)

Published

on

<p>&NewLine; <img src&equals;"https&colon;&sol;&sol;i&period;blogs&period;es&sol;85ad05&sol;libros&sol;1024&lowbar;2000&period;jpeg" alt&equals;"Anthropic entrenó su IA con millones de libros con copyright&period; A un juez eso le ha parecido correctísimo &lpar;con un gran asterisco&rpar; ">&NewLine; <&sol;p>&NewLine;<p>Anthropic acaba de lograr una victoria legal muy importante en esa batalla legal que el mundo de la IA mantiene con el copyright y los derechos de autor desde hace años&period; La sentencia&comma; favorable a Anthropic&comma; puede sentar un gran precedente para el resto de casos en los que las empresas de IA han sido demandadas por entrenar sus modelos con obras con copyright&period; Pero ojo&comma; porque no ha sido una victoria total&period;<&sol;p>&NewLine;<p><&excl;-- BREAK 1 --><&sol;p>&NewLine;<p><strong>Antropic gana<&sol;strong>&period; En la demanda de tres autores contra Anthropic se acusó a la empresa de descargar gratuitamente millones de libros con copyright&comma; además de comprar algunos de ellos para escanearlos y digitalizarlos&period; El objetivo&colon; entrenar sus modelos de IA&period; El juez William Alsup ha dejado claro <a rel&equals;"noopener&comma; noreferrer" href&equals;"https&colon;&sol;&sol;storage&period;courtlistener&period;com&sol;recap&sol;gov&period;uscourts&period;cand&period;434709&sol;gov&period;uscourts&period;cand&period;434709&period;231&period;0&lowbar;2&period;pdf">en su sentencia<&sol;a> que &&num;8220&semi;el uso para el entrenamiento fue un uso justo&&num;8221&semi;&period; Las empresas que desarrollan modelos de IA siempre se han escudado en ese concepto del uso justo para argumentar cómo habían entrenado sus modelos con todo tipo de obras&comma; incluidas aquellas protegidas por derechos de autor&period;<&sol;p>&NewLine;<p><&excl;-- BREAK 2 --><&sol;p>&NewLine;<div class&equals;"article-asset article-asset-normal article-asset-center">&NewLine;<div class&equals;"desvio-container">&NewLine;<div class&equals;"desvio">&NewLine;<div class&equals;"desvio-figure js-desvio-figure">&NewLine; <a href&equals;"https&colon;&sol;&sol;www&period;xataka&period;com&sol;robotica-e-ia&sol;google-tiene-claro-como-va-a-entrenar-sus-modelos-ia-cogiendo-todo-que-publiquemos-internet" class&equals;"pivot-outboundlink" data-vars-post-title&equals;"Google tiene claro cómo va a entrenar sus modelos de IA&period; Cogiendo todo lo que publiquemos en internet"><br &sol;>&NewLine; <img alt&equals;"Google tiene claro cómo va a entrenar sus modelos de IA&period; Cogiendo todo lo que publiquemos en internet" width&equals;"375" height&equals;"142" src&equals;"https&colon;&sol;&sol;i&period;blogs&period;es&sol;04c92c&sol;robot1&sol;375&lowbar;142&period;jpeg"><br &sol;>&NewLine; <&sol;a>&NewLine; <&sol;div>&NewLine;<div class&equals;"desvio-summary">&NewLine;<div class&equals;"desvio-taxonomy js-desvio-taxonomy">&NewLine; <a href&equals;"https&colon;&sol;&sol;www&period;xataka&period;com&sol;robotica-e-ia&sol;google-tiene-claro-como-va-a-entrenar-sus-modelos-ia-cogiendo-todo-que-publiquemos-internet" class&equals;"desvio-taxonomy-anchor pivot-outboundlink" data-vars-post-title&equals;"Google tiene claro cómo va a entrenar sus modelos de IA&period; Cogiendo todo lo que publiquemos en internet">En Xataka<&sol;a>&NewLine; <&sol;div>&NewLine;<p> <a href&equals;"https&colon;&sol;&sol;www&period;xataka&period;com&sol;robotica-e-ia&sol;google-tiene-claro-como-va-a-entrenar-sus-modelos-ia-cogiendo-todo-que-publiquemos-internet" class&equals;"desvio-title js-desvio-title pivot-outboundlink" data-vars-post-title&equals;"Google tiene claro cómo va a entrenar sus modelos de IA&period; Cogiendo todo lo que publiquemos en internet">Google tiene claro cómo va a entrenar sus modelos de IA&period; Cogiendo todo lo que publiquemos en internet<&sol;a>&NewLine; <&sol;div>&NewLine;<&sol;p><&sol;div>&NewLine;<&sol;p><&sol;div>&NewLine;<&sol;div>&NewLine;<p><strong>Uso justo<&sol;strong>&period; Este criterio legal mantiene que se permite un uso limitado de material protegido sin necesitar el permiso del dueño de esos derechos&period; En las leyes del copyright&comma; una de las formas que tienen los jueces de determinar si ese tipo de actividad es un uso justo es la de examinar si ese uso fue &&num;8220&semi;transformador&&num;8221&semi;&period; O lo que es lo mismo&comma; si a partir de esas obras se ha creado algo nuevo&period; Para Alsup &&num;8220&semi;la tecnología en cuestión es una de las más transformadoras que muchos de nosotros veremos en nuestras vidas&&num;8221&semi;&period;<&sol;p>&NewLine;<p><&excl;-- BREAK 3 --><&sol;p>&NewLine;<p><strong>Una victoria con un gran asterisco<&sol;strong>&period; Aunque el juez indicó que ese proceso de entrenamiento era un uso justo&comma; también determinó que los autores podrían llevar a juicio a Anthropic por piratear sus obras&period; La empresa argumentó que eso estaba justificado porque era &&num;8220&semi;al menos razonablemente necesario para entrenar LLMs&&num;8221&semi;&period; Para Alsup la cuestión es precisamente que aunque acabaron comprando algunos de ellos&comma; construyó una biblioteca enorme por la que no pagó&colon;<&sol;p>&NewLine;<p><&excl;-- BREAK 4 --><&sol;p>&NewLine;<blockquote><p>&&num;8220&semi;Anthropic descargó más de siete millones de copias piratas de libros&comma; no pagó nada y conservó estas copias piratas en su biblioteca incluso después de decidir que no las utilizaría para entrenar a su IA &lpar;en absoluto o nunca más&rpar;&period; Los autores sostienen que Anthropic debería haber pagado por estas copias piratas de la biblioteca&period; Esta sentencia coincide en ello&&num;8221&semi;&period;<&sol;p><&sol;blockquote>&NewLine;<p><strong>El precedente de Thomson-Reuters<&sol;strong>&period; Hace unos meses <a class&equals;"text-outboundlink" href&equals;"https&colon;&sol;&sol;www&period;xataka&period;com&sol;robotica-e-ia&sol;empresas-ia-llevan-anos-saltandose-a-torera-copyright-acaban-sufrir-inquietante-derrota-legal" data-vars-post-title&equals;"Las empresas de IA llevan años saltándose a la torera el copyright&period; Acaban de sufrir una inquietante derrota legal " data-vars-post-url&equals;"https&colon;&sol;&sol;www&period;xataka&period;com&sol;robotica-e-ia&sol;empresas-ia-llevan-anos-saltandose-a-torera-copyright-acaban-sufrir-inquietante-derrota-legal">Thomson Reuters ganó una demanda de 2020<&sol;a> contra una startup de IA llamada Ross Intelligence&period; Según ellos&comma; la empresa había reproducido material de su división de investigación legal&comma; llamada Westlaw&period; El juez rechazó los argumentos de la defensa y declaró que el argumento de uso justo no se podía aplicar en ese caso&period; La sentencia contra Anthropic va justo en la dirección opuesta y bendice ese tipo de uso&&num;8230&semi; mientras las empresas compren las obras con las que entrenan a sus modelos&period; La empresa de IA&comma; por cierto&comma; ya había logrado <a class&equals;"text-outboundlink" href&equals;"https&colon;&sol;&sol;www&period;xataka&period;com&sol;robotica-e-ia&sol;universal-music-acaba-tropezar-su-demanda-anthropic-copyright-victoria-para-tecnologicas-ia" data-vars-post-title&equals;"Universal Music acaba de tropezar en su demanda contra Anthropic por copyright&colon; una victoria para las tecnológicas de IA" data-vars-post-url&equals;"https&colon;&sol;&sol;www&period;xataka&period;com&sol;robotica-e-ia&sol;universal-music-acaba-tropezar-su-demanda-anthropic-copyright-victoria-para-tecnologicas-ia">una pequeña victoria legal<&sol;a> en un caso previo contra Universal Music&period;<&sol;p>&NewLine;<p><&excl;-- BREAK 5 --><&sol;p>&NewLine;<div class&equals;"article-asset-video article-asset-normal">&NewLine;<div class&equals;"asset-content">&NewLine;<div class&equals;"base-asset-video">&NewLine;<div class&equals;"js-dailymotion"><&sol;div>&NewLine;<&sol;p><&sol;div>&NewLine;<&sol;p><&sol;div>&NewLine;<&sol;div>&NewLine;<p><strong>Anthropic descargó libros a destajo<&sol;strong>&period; En el juicio se desveló cómo el cofundador de Anthropic&comma; Ben Mann&comma; descargó en invierno de 2021 conjuntos de datos como <a rel&equals;"noopener&comma; noreferrer" href&equals;"https&colon;&sol;&sol;www&period;theatlantic&period;com&sol;technology&sol;archive&sol;2023&sol;09&sol;books3-database-generative-ai-training-copyright-infringement&sol;675363&sol;">el llamado Books3<&sol;a> o LibGen &lpar;<a class&equals;"text-outboundlink" href&equals;"https&colon;&sol;&sol;www&period;xataka&period;com&sol;otros&sol;pirate-bay-ciencia-no-desaparecera-facil-10tb-900-000-libros-estan-archivados-apoyo-varios-servidores-privados" data-vars-post-title&equals;'El "Pirate Bay" de la ciencia no desaparecerá tan fácil&colon; más de 10TB y 900&period;000 libros ya están archivados con el apoyo de varios servidores privados' data-vars-post-url&equals;"https&colon;&sol;&sol;www&period;xataka&period;com&sol;otros&sol;pirate-bay-ciencia-no-desaparecera-facil-10tb-900-000-libros-estan-archivados-apoyo-varios-servidores-privados">Library Genesis<&sol;a>&rpar; que no son más que gigantescas recopilaciones de libros&comma; muchos de los cuales están protegidos por los derechos de autor&period;<&sol;p>&NewLine;<p><&excl;-- BREAK 6 --><&sol;p>&NewLine;<p><strong>Meta está en las mismas<&sol;strong>&period; Todas las empresas que desarrollan modelos de IA los han entrenado con todo tipo de datos&comma; incluidas obras protegidas por derechos de autor&comma; y todas se enfrentan por tanto a una situación similar&period; <a class&equals;"text-outboundlink" href&equals;"https&colon;&sol;&sol;www&period;xataka&period;com&sol;robotica-e-ia&sol;correos-meta-revelan-que-descargo-81-7-tb-libros-copyright-via-bittorrent-para-entrenar-sus-modelos-ia" data-vars-post-title&equals;"Los correos de Meta revelan que descargó 81&comma;7 TB de libros con copyright vía BitTorrent para entrenar sus modelos de IA" data-vars-post-url&equals;"https&colon;&sol;&sol;www&period;xataka&period;com&sol;robotica-e-ia&sol;correos-meta-revelan-que-descargo-81-7-tb-libros-copyright-via-bittorrent-para-entrenar-sus-modelos-ia">Meta&comma; por ejemplo&comma; descargó 81&comma;7 TB de libros con copyright<&sol;a> vía BitTorrent para entrenar sus modelos de IA&period; Eso hace que la empresa de Mark Zuckerberg pueda acabar sufriendo un destino similar al de Anthropic&comma; que tiene ante sí un nuevo proceso judicial muy peligroso para sus finanzas&period;<&sol;p>&NewLine;<p><&excl;-- BREAK 7 --><&sol;p>&NewLine;<p><strong>Una multa potencial de miles de millones de dólares<&sol;strong>&period; Como indican en Wired&comma; la multa mínima por este tipo de violación del copyright es de 750 dólares por libro&period; Alsup indicó que la biblioteca descargada ilegalmente de Anthropic consta de al menos siete millones de libros&comma; y eso significa que la compañía se enfrenta a una multa potencialmente enorme&period; De momento no hay fecha para ese nuevo juicio&period;<&sol;p>&NewLine;<p><&excl;-- BREAK 8 --><&sol;p>&NewLine;<div class&equals;"article-asset article-asset-normal article-asset-center">&NewLine;<div class&equals;"desvio-container">&NewLine;<div class&equals;"desvio">&NewLine;<div class&equals;"desvio-figure js-desvio-figure">&NewLine; <a href&equals;"https&colon;&sol;&sol;www&period;xataka&period;com&sol;robotica-e-ia&sol;millones-personas-vuelven-a-estar-interesadas-chatgpt-problema-que-ha-conseguido-vulnerando-derechos-autor" class&equals;"pivot-outboundlink" data-vars-post-title&equals;"Millones de personas vuelven a estar interesadas en ChatGPT&period; El problema es que lo ha conseguido vulnerando derechos de autor"><br &sol;>&NewLine; <img alt&equals;"Millones de personas vuelven a estar interesadas en ChatGPT&period; El problema es que lo ha conseguido vulnerando derechos de autor" width&equals;"375" height&equals;"142" src&equals;"https&colon;&sol;&sol;i&period;blogs&period;es&sol;edae77&sol;gm93ymowqaaqdbo&sol;375&lowbar;142&period;jpeg"><br &sol;>&NewLine; <&sol;a>&NewLine; <&sol;div>&NewLine;<div class&equals;"desvio-summary">&NewLine;<div class&equals;"desvio-taxonomy js-desvio-taxonomy">&NewLine; <a href&equals;"https&colon;&sol;&sol;www&period;xataka&period;com&sol;robotica-e-ia&sol;millones-personas-vuelven-a-estar-interesadas-chatgpt-problema-que-ha-conseguido-vulnerando-derechos-autor" class&equals;"desvio-taxonomy-anchor pivot-outboundlink" data-vars-post-title&equals;"Millones de personas vuelven a estar interesadas en ChatGPT&period; El problema es que lo ha conseguido vulnerando derechos de autor">En Xataka<&sol;a>&NewLine; <&sol;div>&NewLine;<p> <a href&equals;"https&colon;&sol;&sol;www&period;xataka&period;com&sol;robotica-e-ia&sol;millones-personas-vuelven-a-estar-interesadas-chatgpt-problema-que-ha-conseguido-vulnerando-derechos-autor" class&equals;"desvio-title js-desvio-title pivot-outboundlink" data-vars-post-title&equals;"Millones de personas vuelven a estar interesadas en ChatGPT&period; El problema es que lo ha conseguido vulnerando derechos de autor">Millones de personas vuelven a estar interesadas en ChatGPT&period; El problema es que lo ha conseguido vulnerando derechos de autor<&sol;a>&NewLine; <&sol;div>&NewLine;<&sol;p><&sol;div>&NewLine;<&sol;p><&sol;div>&NewLine;<&sol;div>&NewLine;<p><strong>La interminable batalla de la IA y el copyright<&sol;strong>&period; Este es el último episodio de un culebrón del que sin duda veremos muchos más capítulos&period; Empresas como <a class&equals;"text-outboundlink" href&equals;"https&colon;&sol;&sol;www&period;xataka&period;com&sol;robotica-e-ia&sol;google-tiene-claro-como-va-a-entrenar-sus-modelos-ia-cogiendo-todo-que-publiquemos-internet" data-vars-post-title&equals;"Google tiene claro cómo va a entrenar sus modelos de IA&period; Cogiendo todo lo que publiquemos en internet" data-vars-post-url&equals;"https&colon;&sol;&sol;www&period;xataka&period;com&sol;robotica-e-ia&sol;google-tiene-claro-como-va-a-entrenar-sus-modelos-ia-cogiendo-todo-que-publiquemos-internet">Google<&sol;a>&comma; <a class&equals;"text-outboundlink" href&equals;"https&colon;&sol;&sol;www&period;xataka&period;com&sol;robotica-e-ia&sol;openai-ha-usado-millones-textos-para-entrenar-a-chatgpt-problema-que-muchos-ellos-tienen-copyright" data-vars-post-title&equals;"OpenAI ha usado millones de textos para entrenar a ChatGPT&period; El problema es que muchos de ellos tienen copyright" data-vars-post-url&equals;"https&colon;&sol;&sol;www&period;xataka&period;com&sol;robotica-e-ia&sol;openai-ha-usado-millones-textos-para-entrenar-a-chatgpt-problema-que-muchos-ellos-tienen-copyright">OpenAI<&sol;a> o <a class&equals;"text-outboundlink" href&equals;"https&colon;&sol;&sol;www&period;xataka&period;com&sol;robotica-e-ia&sol;precio-a-pagar-tener-ia-saqueo-todo-contenido-internet-perplexity-solo-ultimo-ejemplo" data-vars-post-title&equals;"El precio a pagar por tener IA es el saqueo de todo el contenido de Internet&period; Y Perplexity es solo el último ejemplo " data-vars-post-url&equals;"https&colon;&sol;&sol;www&period;xataka&period;com&sol;robotica-e-ia&sol;precio-a-pagar-tener-ia-saqueo-todo-contenido-internet-perplexity-solo-ultimo-ejemplo">Perplexity<&sol;a> han sido igual de voraces a la hora de entrenar sus modelos y han arrasado con datos públicos &lpar;y no tan públicos&rpar; en internet&period; Las demandas por violación de copyright se van acumulando&comma; y casos como el de Anthropic pueden sentar un inquietante predecente para todas ellas si no compraron los libros que usaron para entrenar sus modelos&period;<&sol;p>&NewLine;<p><&excl;-- BREAK 9 --><&sol;p>&NewLine;<p>Imagen &vert; <a rel&equals;"noopener&comma; noreferrer" href&equals;"https&colon;&sol;&sol;unsplash&period;com&sol;es&sol;fotos&sol;foto-de-estanteria-de-madera-marron-xrbbXIXAWY0">Emil Widlund<&sol;a><&sol;p>&NewLine;<p>En Xataka &vert; <a class&equals;"text-outboundlink" href&equals;"https&colon;&sol;&sol;www&period;xataka&period;com&sol;robotica-e-ia&sol;5-000-tokens-mi-blog-estan-siendo-usados-para-entrenar-ia-no-he-dado-mi-permiso" data-vars-post-title&equals;'5&period;000 "tokens" de mi blog están siendo usados para entrenar una IA&period; No he dado mi permiso ' data-vars-post-url&equals;"https&colon;&sol;&sol;www&period;xataka&period;com&sol;robotica-e-ia&sol;5-000-tokens-mi-blog-estan-siendo-usados-para-entrenar-ia-no-he-dado-mi-permiso">5&period;000 &&num;8220&semi;tokens&&num;8221&semi; de mi blog están siendo usados para entrenar una IA&period; No he dado mi permiso<&sol;a><&sol;p>&NewLine;<p> &&num;8211&semi; <br &sol;> La noticia<br &sol;>&NewLine; <a href&equals;"https&colon;&sol;&sol;www&period;xataka&period;com&sol;legislacion-y-derechos&sol;anthropic-entreno-su-ia-millones-libros-copyright-a-juez-eso-le-ha-parecido-correctisimo-gran-asterisco&quest;utm&lowbar;source&equals;feedburner&amp&semi;utm&lowbar;medium&equals;feed&amp&semi;utm&lowbar;campaign&equals;25&lowbar;Jun&lowbar;2025"><br &sol;>&NewLine; <em> Anthropic entrenó su IA con millones de libros con copyright&period; A un juez eso le ha parecido correctísimo &lpar;con un gran asterisco&rpar; <&sol;em><br &sol;>&NewLine; <&sol;a><br &sol;>&NewLine; fue publicada originalmente en<br &sol;>&NewLine; <a href&equals;"https&colon;&sol;&sol;www&period;xataka&period;com&sol;&quest;utm&lowbar;source&equals;feedburner&amp&semi;utm&lowbar;medium&equals;feed&amp&semi;utm&lowbar;campaign&equals;25&lowbar;Jun&lowbar;2025"><br &sol;>&NewLine; <strong> Xataka <&sol;strong><br &sol;>&NewLine; <&sol;a><br &sol;>&NewLine; por <a href&equals;"https&colon;&sol;&sol;www&period;xataka&period;com&sol;autor&sol;javier-pastor&quest;utm&lowbar;source&equals;feedburner&amp&semi;utm&lowbar;medium&equals;feed&amp&semi;utm&lowbar;campaign&equals;25&lowbar;Jun&lowbar;2025"><br &sol;>&NewLine; Javier Pastor<br &sol;>&NewLine; <&sol;a><br &sol;>&NewLine; &period; <&sol;p>&NewLine;<p>&ZeroWidthSpace;Anthropic acaba de lograr una victoria legal muy importante en esa batalla legal que el mundo de la IA mantiene con el copyright y los derechos de autor desde hace años&period; La sentencia&comma; favorable a Anthropic&comma; puede sentar un gran precedente para el resto de casos en los que las empresas de IA han sido demandadas por entrenar sus modelos con obras con copyright&period; Pero ojo&comma; porque no ha sido una victoria total&period;<&sol;p>&NewLine;<p>Antropic gana&period; En la demanda de tres autores contra Anthropic se acusó a la empresa de descargar gratuitamente millones de libros con copyright&comma; además de comprar algunos de ellos para escanearlos y digitalizarlos&period; El objetivo&colon; entrenar sus modelos de IA&period; El juez William Alsup ha dejado claro en su sentencia que &&num;8220&semi;el uso para el entrenamiento fue un uso justo&&num;8221&semi;&period; Las empresas que desarrollan modelos de IA siempre se han escudado en ese concepto del uso justo para argumentar cómo habían entrenado sus modelos con todo tipo de obras&comma; incluidas aquellas protegidas por derechos de autor&period;<&sol;p>&NewLine;<p> En Xataka<&sol;p>&NewLine;<p> Google tiene claro cómo va a entrenar sus modelos de IA&period; Cogiendo todo lo que publiquemos en internet<&sol;p>&NewLine;<p>Uso justo&period; Este criterio legal mantiene que se permite un uso limitado de material protegido sin necesitar el permiso del dueño de esos derechos&period; En las leyes del copyright&comma; una de las formas que tienen los jueces de determinar si ese tipo de actividad es un uso justo es la de examinar si ese uso fue &&num;8220&semi;transformador&&num;8221&semi;&period; O lo que es lo mismo&comma; si a partir de esas obras se ha creado algo nuevo&period; Para Alsup &&num;8220&semi;la tecnología en cuestión es una de las más transformadoras que muchos de nosotros veremos en nuestras vidas&&num;8221&semi;&period;<&sol;p>&NewLine;<p>Una victoria con un gran asterisco&period; Aunque el juez indicó que ese proceso de entrenamiento era un uso justo&comma; también determinó que los autores podrían llevar a juicio a Anthropic por piratear sus obras&period; La empresa argumentó que eso estaba justificado porque era &&num;8220&semi;al menos razonablemente necesario para entrenar LLMs&&num;8221&semi;&period; Para Alsup la cuestión es precisamente que aunque acabaron comprando algunos de ellos&comma; construyó una biblioteca enorme por la que no pagó&colon;<&sol;p>&NewLine;<p>&&num;8220&semi;Anthropic descargó más de siete millones de copias piratas de libros&comma; no pagó nada y conservó estas copias piratas en su biblioteca incluso después de decidir que no las utilizaría para entrenar a su IA &lpar;en absoluto o nunca más&rpar;&period; Los autores sostienen que Anthropic debería haber pagado por estas copias piratas de la biblioteca&period; Esta sentencia coincide en ello&&num;8221&semi;&period;<&sol;p>&NewLine;<p>El precedente de Thomson-Reuters&period; Hace unos meses Thomson Reuters ganó una demanda de 2020 contra una startup de IA llamada Ross Intelligence&period; Según ellos&comma; la empresa había reproducido material de su división de investigación legal&comma; llamada Westlaw&period; El juez rechazó los argumentos de la defensa y declaró que el argumento de uso justo no se podía aplicar en ese caso&period; La sentencia contra Anthropic va justo en la dirección opuesta y bendice ese tipo de uso&&num;8230&semi; mientras las empresas compren las obras con las que entrenan a sus modelos&period; La empresa de IA&comma; por cierto&comma; ya había logrado una pequeña victoria legal en un caso previo contra Universal Music&period;<&sol;p>&NewLine;<p>Anthropic descargó libros a destajo&period; En el juicio se desveló cómo el cofundador de Anthropic&comma; Ben Mann&comma; descargó en invierno de 2021 conjuntos de datos como el llamado Books3 o LibGen &lpar;Library Genesis&rpar; que no son más que gigantescas recopilaciones de libros&comma; muchos de los cuales están protegidos por los derechos de autor&period;<&sol;p>&NewLine;<p>Meta está en las mismas&period; Todas las empresas que desarrollan modelos de IA los han entrenado con todo tipo de datos&comma; incluidas obras protegidas por derechos de autor&comma; y todas se enfrentan por tanto a una situación similar&period; Meta&comma; por ejemplo&comma; descargó 81&comma;7 TB de libros con copyright vía BitTorrent para entrenar sus modelos de IA&period; Eso hace que la empresa de Mark Zuckerberg pueda acabar sufriendo un destino similar al de Anthropic&comma; que tiene ante sí un nuevo proceso judicial muy peligroso para sus finanzas&period;<&sol;p>&NewLine;<p>Una multa potencial de miles de millones de dólares&period; Como indican en Wired&comma; la multa mínima por este tipo de violación del copyright es de 750 dólares por libro&period; Alsup indicó que la biblioteca descargada ilegalmente de Anthropic consta de al menos siete millones de libros&comma; y eso significa que la compañía se enfrenta a una multa potencialmente enorme&period; De momento no hay fecha para ese nuevo juicio&period;<&sol;p>&NewLine;<p> En Xataka<&sol;p>&NewLine;<p> Millones de personas vuelven a estar interesadas en ChatGPT&period; El problema es que lo ha conseguido vulnerando derechos de autor<&sol;p>&NewLine;<p>La interminable batalla de la IA y el copyright&period; Este es el último episodio de un culebrón del que sin duda veremos muchos más capítulos&period; Empresas como Google&comma; OpenAI o Perplexity han sido igual de voraces a la hora de entrenar sus modelos y han arrasado con datos públicos &lpar;y no tan públicos&rpar; en internet&period; Las demandas por violación de copyright se van acumulando&comma; y casos como el de Anthropic pueden sentar un inquietante predecente para todas ellas si no compraron los libros que usaron para entrenar sus modelos&period;<&sol;p>&NewLine;<p>Imagen &vert; Emil Widlund<&sol;p>&NewLine;<p>En Xataka &vert; 5&period;000 &&num;8220&semi;tokens&&num;8221&semi; de mi blog están siendo usados para entrenar una IA&period; No he dado mi permiso<&sol;p>&NewLine;<p> &&num;8211&semi; La noticia<&sol;p>&NewLine;<p> Anthropic entrenó su IA con millones de libros con copyright&period; A un juez eso le ha parecido correctísimo &lpar;con un gran asterisco&rpar; <&sol;p>&NewLine;<p> fue publicada originalmente en<&sol;p>&NewLine;<p> Xataka <&sol;p>&NewLine;<p> por<br &sol;>&NewLine; Javier Pastor<&sol;p>&NewLine;<p> &period;   <&sol;p>&NewLine;<p>&ZeroWidthSpace;   <&sol;p>&NewLine;<p>&ZeroWidthSpace; <&sol;p>&NewLine;

Leave a Reply

Your email address will not be published. Required fields are marked *

Noticias Importantes

Copyright © 2017 ERM DIGITAL. powered by ERM.