Ciencia y Tecnología

Muchas IA de vídeo están aprendiendo a imitar el mundo. Y todo apunta a un “saqueo” sin precedentes de YouTube

Published

3 months ago

October 31, 2025

<p>&NewLine; <img src="https&colon;//i&period;blogs&period;es/ab5240/ia-datos-youtube-entrenamiento-1/1024&lowbar;2000&period;jpeg" alt="Muchas IA de vídeo están aprendiendo a imitar el mundo&period; Y todo apunta a un &OpenCurlyDoubleQuote;saqueo” sin precedentes de YouTube">&NewLine; </p>&NewLine;<p>Una plaza, turistas, un camarero moviéndose entre mesas, una bici que pasa al fondo o un periodista en un plató&period; Las IA de vídeo ya pueden generar escenas en un pispás&period; El resultado sorprende, pero también abre una pregunta que hasta hace poco apenas se planteaba&colon; ¿de dónde han salido todas esas imágenes que les han <strong>permitido aprender a imitar el mundo</strong>&quest; <a rel="noopener, noreferrer" href="https&colon;//www&period;theatlantic&period;com/technology/archive/2025/09/search-youtube-videos-generative-ai/684158/">Según The Atlantic</a>, parte de la respuesta apunta a millones de vídeos extraídos de plataformas como YouTube sin un consentimiento claro&period;</p>&NewLine;<p><&excl;-- BREAK 1 --></p>&NewLine;<p>La euforia por la IA generativa ha ido tan rápido que muchas preguntas se han quedado atrás&period; En apenas dos años hemos pasado de <a class="text-outboundlink" href="https&colon;//www&period;xataka&period;com/robotica-e-ia/stable-diffusion-nos-sorprendio-como-generador-imagenes-ia-sus-creadores-acaban-lanzar-stable-video-diffusion" data-vars-post-title="Stable Diffusion nos sorprendió como generador de imágenes de IA&colon; sus creadores acaban de lanzar Stable Video Diffusion " data-vars-post-url="https&colon;//www&period;xataka&period;com/robotica-e-ia/stable-diffusion-nos-sorprendio-como-generador-imagenes-ia-sus-creadores-acaban-lanzar-stable-video-diffusion">pequeños experimentos curiosos</a> <a class="text-outboundlink" href="https&colon;//www&period;xataka&period;com/robotica-e-ia/openai-acaba-presentar-sora-2-propia-app-al-estilo-tiktok-ello-se-perfila-nueva-oleada-videos-virales" data-vars-post-title="OpenAI acaba de presentar Sora 2 con app propia al estilo TikTok&period; Con ello se perfila una nueva oleada de vídeos virales" data-vars-post-url="https&colon;//www&period;xataka&period;com/robotica-e-ia/openai-acaba-presentar-sora-2-propia-app-al-estilo-tiktok-ello-se-perfila-nueva-oleada-videos-virales">a modelos que producen vídeos casi indistinguibles de los reales</a>&period; Y mientras el foco estaba en las demostraciones, otra cuestión iba ganando peso&colon; la transparencia&period; OpenAI, por ejemplo, ha explicado que Sora se entrena con datos &OpenCurlyDoubleQuote;disponibles públicamente”, pero no ha detallado cuáles&period;</p>&NewLine;<p><&excl;-- BREAK 2 --></p>&NewLine;<h2>Un entrenamiento masivo que señala a YouTube</h2>&NewLine;<p>La pieza de The Atlantic da una pista clara de lo que estaba ocurriendo entre bastidores&period; Hablamos de más de 15 millones de vídeos recopilados para entrenar modelos de IA, con una enorme cantidad <strong>procedente de YouTube</strong> sin autorización formal&period; Entre las iniciativas citadas aparecen conjuntos de datos asociados a varias compañías, diseñados para mejorar el rendimiento de los generadores de vídeo&period; Según el medio, este proceso se realizó sin avisar a los creadores que publicaron originalmente ese contenido&period;</p>&NewLine;<p><&excl;-- BREAK 3 --></p>&NewLine;<div class="article-asset-video article-asset-normal">&NewLine;<div class="asset-content">&NewLine;<div class="base-asset-video">&NewLine;<div class="js-dailymotion"></div>&NewLine;</p></div>&NewLine;</p></div>&NewLine;</div>&NewLine;<p>Uno de los aspectos más llamativos del hallazgo es el perfil del material afectado&period; No se trataba solo de vídeos anónimos o grabaciones domésticas, sino de contenidos informativos y producciones profesionales&period; El medio encontró que miles de piezas procedían de canales pertenecientes a publicaciones como The New York Times, BBC, The Guardian, The Washington Post o Al Jazeera&period; En conjunto, hablamos de un volumen enorme de periodismo que habría terminado alimentando sistemas de IA sin un acuerdo previo con sus propietarios&period;</p>&NewLine;<p><&excl;-- BREAK 4 --></p>&NewLine;<p><a class="text-outboundlink" href="https&colon;//www&period;xataka&period;com/robotica-e-ia/runway-se-adelanta-a-openai-lanza-generador-videos-gen-3-alpha-sora-se-puede-usar-navegador" data-vars-post-title="Runway se adelanta a OpenAI y lanza el generador de vídeos Gen-3 Alpha antes que Sora&colon; ya se puede usar desde el navegador" data-vars-post-url="https&colon;//www&period;xataka&period;com/robotica-e-ia/runway-se-adelanta-a-openai-lanza-generador-videos-gen-3-alpha-sora-se-puede-usar-navegador">Runway</a>, una de las empresas que más impulso ha dado al vídeo generativo, aparece señalada en los conjuntos de datos revisados&period; Según los documentos citados, sus modelos habrían aprendido con clips organizados por tipo de escena y contexto&colon; <strong>entrevistas, explicativos, piezas con gráficos, planos cocina, planos recurso</strong>&period; La idea es clara&colon; si la IA debe reproducir situaciones humanas y narrativas audiovisuales, necesita referencias reales que cubran desde gestos hasta ritmos de edición&period;</p>&NewLine;<p><&excl;-- BREAK 5 --></p>&NewLine;<div class="article-asset-image article-asset-normal article-asset-center">&NewLine;<div class="asset-content">&NewLine;<div class="caption-img ">&NewLine;<p> <img alt="Runway Video" class="centro&lowbar;sinmarco" src="https&colon;//i&period;blogs&period;es/e564e7/runway-video/450&lowbar;1000&period;jpeg"></p>&NewLine;<p> <span>Fragmentos de un vídeo generado con la herramienta de Runway</span>&NewLine; </div>&NewLine;</p></div>&NewLine;</div>&NewLine;<p>Además de Runway, la investigación menciona conjuntos de datos empleados en laboratorios de grandes plataformas tecnológicas como Meta o ByteDance en investigación y desarrollo de sus modelos&period; La dinámica era similar&colon; enormes volúmenes de vídeos recopilados en internet y compartidos entre equipos de investigación para mejorar las capacidades audiovisuales&period;</p>&NewLine;<p><&excl;-- BREAK 6 --></p>&NewLine;<p>La postura oficial de YouTube no deja demasiado margen para interpretaciones&period; <strong>Su normativa prohíbe descargar vídeos para entrenar modelos</strong>, y su CEO, Neal Mohan, <a class="text-outboundlink" href="https&colon;//www&period;xataka&period;com/robotica-e-ia/clara-infraccion-ceo-youtube-explica-que-openai-no-debe-utilizar-videos-plataforma-para-entrenar-sora" data-vars-post-title="&OpenCurlyDoubleQuote;Clara infracción”&colon; El CEO de YouTube explica por qué OpenAI no debe utilizar vídeos de la plataforma para entrenar Sora" data-vars-post-url="https&colon;//www&period;xataka&period;com/robotica-e-ia/clara-infraccion-ceo-youtube-explica-que-openai-no-debe-utilizar-videos-plataforma-para-entrenar-sora">lo ha reiterado en público</a>&period; Las expectativas de los creadores, subrayó, pasan por que sus contenidos se utilicen dentro de las reglas del servicio&period; La aparición de millones de vídeos en bases de datos para IA ha situado ese marco legal en primer plano y ha intensificado la presión sobre las plataformas involucradas en el desarrollo de modelos generativos&period;</p>&NewLine;<p><&excl;-- BREAK 7 --></p>&NewLine;<p>La reacción del sector mediático ha seguido dos caminos&period; Por un lado, compañías como Vox Media <a class="text-outboundlink" href="https&colon;//www&period;xataka&period;com/robotica-e-ia/openai-anuncia-acuerdo-prisa-le-monde-demostracion-tendencia-al-alza" data-vars-post-title="OpenAI anuncia un acuerdo con Prisa y Le Monde&period; Es la demostración de una tendencia al alza " data-vars-post-url="https&colon;//www&period;xataka&period;com/robotica-e-ia/openai-anuncia-acuerdo-prisa-le-monde-demostracion-tendencia-al-alza">o Prisa han cerrado acuerdos para licenciar su contenido a plataformas de inteligencia artificial,</a> buscando un marco claro y compensación económica&period; Por otro, algunos medios han optado por plantar cara&colon; The New York Times ha llevado a OpenAI y Microsoft a los tribunales por el uso no autorizado de sus materiales, subrayando que protegerá también el contenido que distribuye en vídeo&period;</p>&NewLine;<p><&excl;-- BREAK 8 --></p>&NewLine;<p>El terreno legal sigue siendo difuso&period; La legislación actual no estaba pensada para modelos que procesan millones de vídeos en paralelo, y los tribunales todavía están empezando a marcar líneas&period; Para algunos expertos, <strong>publicar en abierto no equivale a ceder derechos de entrenamiento</strong>, mientras que las empresas de IA defienden que la indexación y el uso de material público forman parte del avance tecnológico&period; Esa tensión, aún sin resolver, mantiene a medios y desarrolladores en un juego de equilibrio constante&period;</p>&NewLine;<p><&excl;-- BREAK 9 --></p>&NewLine;<div class="article-asset article-asset-normal article-asset-center">&NewLine;<div class="desvio-container">&NewLine;<div class="desvio">&NewLine;<div class="desvio-figure js-desvio-figure">&NewLine; <a href="https&colon;//www&period;xataka&period;com/empresas-y-economia/carrera-ia-ha-cambiado-fase-ahora-empieza-deuda" class="pivot-outboundlink" data-vars-post-title="Si creías que la burbuja de la IA era preocupante es porque no habíamos entrado en su siguiente fase&colon; deuda"><br />&NewLine; <img alt="Si creías que la burbuja de la IA era preocupante es porque no habíamos entrado en su siguiente fase&colon; deuda" width="375" height="142" src="https&colon;//i&period;blogs&period;es/8782aa/ia1200x900/375&lowbar;142&period;jpeg"><br />&NewLine; </a>&NewLine; </div>&NewLine;<div class="desvio-summary">&NewLine;<div class="desvio-taxonomy js-desvio-taxonomy">&NewLine; <a href="https&colon;//www&period;xataka&period;com/empresas-y-economia/carrera-ia-ha-cambiado-fase-ahora-empieza-deuda" class="desvio-taxonomy-anchor pivot-outboundlink" data-vars-post-title="Si creías que la burbuja de la IA era preocupante es porque no habíamos entrado en su siguiente fase&colon; deuda">En Xataka</a>&NewLine; </div>&NewLine;<p> <a href="https&colon;//www&period;xataka&period;com/empresas-y-economia/carrera-ia-ha-cambiado-fase-ahora-empieza-deuda" class="desvio-title js-desvio-title pivot-outboundlink" data-vars-post-title="Si creías que la burbuja de la IA era preocupante es porque no habíamos entrado en su siguiente fase&colon; deuda">Si creías que la burbuja de la IA era preocupante es porque no habíamos entrado en su siguiente fase&colon; deuda</a>&NewLine; </div>&NewLine;</p></div>&NewLine;</p></div>&NewLine;</div>&NewLine;<p>Lo que tenemos delante es el arranque de una conversación que va mucho más allá de la tecnología&period; El entrenamiento de modelos de IA con material disponible en internet ha sido una práctica extendida durante años, y ahora llega el momento de decidir dónde están los límites&period; Las compañías prometen acuerdos y transparencia, los medios piden garantías y los creadores reclaman control&period; La próxima etapa será tan tecnológica como política&colon; cómo se alimenta la inteligencia artificial definirá quién se beneficia de ella&period;</p>&NewLine;<p><&excl;-- BREAK 10 --></p>&NewLine;<p>Imágenes | Xataka con Gemini 2&period;5</p>&NewLine;<p>En Xataka | <a class="text-outboundlink" href="https&colon;//www&period;xataka&period;com/legislacion-y-derechos/todas-grandes-ia-han-ignorado-leyes-copyright-alucinante-que-sigue-haber-consecuencias" data-vars-post-title="Todas las grandes IA han ignorado las leyes del copyright&period; Lo alucinante es que sigue sin haber consecuencias " data-vars-post-url="https&colon;//www&period;xataka&period;com/legislacion-y-derechos/todas-grandes-ia-han-ignorado-leyes-copyright-alucinante-que-sigue-haber-consecuencias">Todas las grandes IA han ignorado las leyes del copyright&period; Lo alucinante es que sigue sin haber consecuencias</a></p>&NewLine;<p> &&num;8211&semi; <br /> La noticia<br />&NewLine; <a href="https&colon;//www&period;xataka&period;com/robotica-e-ia/muchas-ia-video-estan-aprendiendo-a-imitar-mundo-todo-apunta-a-saqueo-precedentes-youtube&quest;utm&lowbar;source=feedburner&amp&semi;utm&lowbar;medium=feed&amp&semi;utm&lowbar;campaign=31&lowbar;Oct&lowbar;2025"><br />&NewLine; <em> Muchas IA de vídeo están aprendiendo a imitar el mundo&period; Y todo apunta a un &OpenCurlyDoubleQuote;saqueo” sin precedentes de YouTube </em><br />&NewLine; </a><br />&NewLine; fue publicada originalmente en<br />&NewLine; <a href="https&colon;//www&period;xataka&period;com/&quest;utm&lowbar;source=feedburner&amp&semi;utm&lowbar;medium=feed&amp&semi;utm&lowbar;campaign=31&lowbar;Oct&lowbar;2025"><br />&NewLine; <strong> Xataka </strong><br />&NewLine; </a><br />&NewLine; por <a href="https&colon;//www&period;xataka&period;com/autor/javier-marquez&quest;utm&lowbar;source=feedburner&amp&semi;utm&lowbar;medium=feed&amp&semi;utm&lowbar;campaign=31&lowbar;Oct&lowbar;2025"><br />&NewLine; Javier Marquez<br />&NewLine; </a><br />&NewLine; &period; </p>&NewLine;<p>&ZeroWidthSpace;Una plaza, turistas, un camarero moviéndose entre mesas, una bici que pasa al fondo o un periodista en un plató&period; Las IA de vídeo ya pueden generar escenas en un pispás&period; El resultado sorprende, pero también abre una pregunta que hasta hace poco apenas se planteaba&colon; ¿de dónde han salido todas esas imágenes que les han permitido aprender a imitar el mundo&quest; Según The Atlantic, parte de la respuesta apunta a millones de vídeos extraídos de plataformas como YouTube sin un consentimiento claro&period;</p>&NewLine;<p>La euforia por la IA generativa ha ido tan rápido que muchas preguntas se han quedado atrás&period; En apenas dos años hemos pasado de pequeños experimentos curiosos a modelos que producen vídeos casi indistinguibles de los reales&period; Y mientras el foco estaba en las demostraciones, otra cuestión iba ganando peso&colon; la transparencia&period; OpenAI, por ejemplo, ha explicado que Sora se entrena con datos &OpenCurlyDoubleQuote;disponibles públicamente”, pero no ha detallado cuáles&period;</p>&NewLine;<p>Un entrenamiento masivo que señala a YouTube</p>&NewLine;<p>La pieza de The Atlantic da una pista clara de lo que estaba ocurriendo entre bastidores&period; Hablamos de más de 15 millones de vídeos recopilados para entrenar modelos de IA, con una enorme cantidad procedente de YouTube sin autorización formal&period; Entre las iniciativas citadas aparecen conjuntos de datos asociados a varias compañías, diseñados para mejorar el rendimiento de los generadores de vídeo&period; Según el medio, este proceso se realizó sin avisar a los creadores que publicaron originalmente ese contenido&period;</p>&NewLine;<p>Uno de los aspectos más llamativos del hallazgo es el perfil del material afectado&period; No se trataba solo de vídeos anónimos o grabaciones domésticas, sino de contenidos informativos y producciones profesionales&period; El medio encontró que miles de piezas procedían de canales pertenecientes a publicaciones como The New York Times, BBC, The Guardian, The Washington Post o Al Jazeera&period; En conjunto, hablamos de un volumen enorme de periodismo que habría terminado alimentando sistemas de IA sin un acuerdo previo con sus propietarios&period;</p>&NewLine;<p>Runway, una de las empresas que más impulso ha dado al vídeo generativo, aparece señalada en los conjuntos de datos revisados&period; Según los documentos citados, sus modelos habrían aprendido con clips organizados por tipo de escena y contexto&colon; entrevistas, explicativos, piezas con gráficos, planos cocina, planos recurso&period; La idea es clara&colon; si la IA debe reproducir situaciones humanas y narrativas audiovisuales, necesita referencias reales que cubran desde gestos hasta ritmos de edición&period;</p>&NewLine;<p> Fragmentos de un vídeo generado con la herramienta de Runway</p>&NewLine;<p>Además de Runway, la investigación menciona conjuntos de datos empleados en laboratorios de grandes plataformas tecnológicas como Meta o ByteDance en investigación y desarrollo de sus modelos&period; La dinámica era similar&colon; enormes volúmenes de vídeos recopilados en internet y compartidos entre equipos de investigación para mejorar las capacidades audiovisuales&period;</p>&NewLine;<p>La postura oficial de YouTube no deja demasiado margen para interpretaciones&period; Su normativa prohíbe descargar vídeos para entrenar modelos, y su CEO, Neal Mohan, lo ha reiterado en público&period; Las expectativas de los creadores, subrayó, pasan por que sus contenidos se utilicen dentro de las reglas del servicio&period; La aparición de millones de vídeos en bases de datos para IA ha situado ese marco legal en primer plano y ha intensificado la presión sobre las plataformas involucradas en el desarrollo de modelos generativos&period;</p>&NewLine;<p>La reacción del sector mediático ha seguido dos caminos&period; Por un lado, compañías como Vox Media o Prisa han cerrado acuerdos para licenciar su contenido a plataformas de inteligencia artificial, buscando un marco claro y compensación económica&period; Por otro, algunos medios han optado por plantar cara&colon; The New York Times ha llevado a OpenAI y Microsoft a los tribunales por el uso no autorizado de sus materiales, subrayando que protegerá también el contenido que distribuye en vídeo&period;</p>&NewLine;<p>El terreno legal sigue siendo difuso&period; La legislación actual no estaba pensada para modelos que procesan millones de vídeos en paralelo, y los tribunales todavía están empezando a marcar líneas&period; Para algunos expertos, publicar en abierto no equivale a ceder derechos de entrenamiento, mientras que las empresas de IA defienden que la indexación y el uso de material público forman parte del avance tecnológico&period; Esa tensión, aún sin resolver, mantiene a medios y desarrolladores en un juego de equilibrio constante&period;</p>&NewLine;<p> En Xataka</p>&NewLine;<p> Si creías que la burbuja de la IA era preocupante es porque no habíamos entrado en su siguiente fase&colon; deuda</p>&NewLine;<p>Lo que tenemos delante es el arranque de una conversación que va mucho más allá de la tecnología&period; El entrenamiento de modelos de IA con material disponible en internet ha sido una práctica extendida durante años, y ahora llega el momento de decidir dónde están los límites&period; Las compañías prometen acuerdos y transparencia, los medios piden garantías y los creadores reclaman control&period; La próxima etapa será tan tecnológica como política&colon; cómo se alimenta la inteligencia artificial definirá quién se beneficia de ella&period;</p>&NewLine;<p>Imágenes | Xataka con Gemini 2&period;5</p>&NewLine;<p>En Xataka | Todas las grandes IA han ignorado las leyes del copyright&period; Lo alucinante es que sigue sin haber consecuencias</p>&NewLine;<p> &&num;8211&semi; La noticia</p>&NewLine;<p> Muchas IA de vídeo están aprendiendo a imitar el mundo&period; Y todo apunta a un &OpenCurlyDoubleQuote;saqueo” sin precedentes de YouTube </p>&NewLine;<p> fue publicada originalmente en</p>&NewLine;<p> Xataka </p>&NewLine;<p> por<br />&NewLine; Javier Marquez</p>&NewLine;<p> &period; </p>&NewLine;<p>&ZeroWidthSpace; </p>&NewLine;<p>&ZeroWidthSpace; </p>&NewLine;

ERM Digital

Ciencia y Tecnología

Muchas IA de vídeo están aprendiendo a imitar el mundo. Y todo apunta a un “saqueo” sin precedentes de YouTube

Leave a Reply

Leave a Reply

Noticias Importantes

Leave a Reply Cancel reply

Leave a Reply

Noticias Importantes

Leave a Reply