Ciencia y Tecnología

Muchas IA de vídeo están aprendiendo a imitar el mundo. Y todo apunta a un “saqueo” sin precedentes de YouTube

Published

on

<p>&NewLine; <img src&equals;"https&colon;&sol;&sol;i&period;blogs&period;es&sol;ab5240&sol;ia-datos-youtube-entrenamiento-1&sol;1024&lowbar;2000&period;jpeg" alt&equals;"Muchas IA de vídeo están aprendiendo a imitar el mundo&period; Y todo apunta a un &OpenCurlyDoubleQuote;saqueo” sin precedentes de YouTube">&NewLine; <&sol;p>&NewLine;<p>Una plaza&comma; turistas&comma; un camarero moviéndose entre mesas&comma; una bici que pasa al fondo o un periodista en un plató&period; Las IA de vídeo ya pueden generar escenas en un pispás&period; El resultado sorprende&comma; pero también abre una pregunta que hasta hace poco apenas se planteaba&colon; ¿de dónde han salido todas esas imágenes que les han <strong>permitido aprender a imitar el mundo<&sol;strong>&quest; <a rel&equals;"noopener&comma; noreferrer" href&equals;"https&colon;&sol;&sol;www&period;theatlantic&period;com&sol;technology&sol;archive&sol;2025&sol;09&sol;search-youtube-videos-generative-ai&sol;684158&sol;">Según The Atlantic<&sol;a>&comma; parte de la respuesta apunta a millones de vídeos extraídos de plataformas como YouTube sin un consentimiento claro&period;<&sol;p>&NewLine;<p><&excl;-- BREAK 1 --><&sol;p>&NewLine;<p>La euforia por la IA generativa ha ido tan rápido que muchas preguntas se han quedado atrás&period; En apenas dos años hemos pasado de <a class&equals;"text-outboundlink" href&equals;"https&colon;&sol;&sol;www&period;xataka&period;com&sol;robotica-e-ia&sol;stable-diffusion-nos-sorprendio-como-generador-imagenes-ia-sus-creadores-acaban-lanzar-stable-video-diffusion" data-vars-post-title&equals;"Stable Diffusion nos sorprendió como generador de imágenes de IA&colon; sus creadores acaban de lanzar Stable Video Diffusion " data-vars-post-url&equals;"https&colon;&sol;&sol;www&period;xataka&period;com&sol;robotica-e-ia&sol;stable-diffusion-nos-sorprendio-como-generador-imagenes-ia-sus-creadores-acaban-lanzar-stable-video-diffusion">pequeños experimentos curiosos<&sol;a> <a class&equals;"text-outboundlink" href&equals;"https&colon;&sol;&sol;www&period;xataka&period;com&sol;robotica-e-ia&sol;openai-acaba-presentar-sora-2-propia-app-al-estilo-tiktok-ello-se-perfila-nueva-oleada-videos-virales" data-vars-post-title&equals;"OpenAI acaba de presentar Sora 2 con app propia al estilo TikTok&period; Con ello se perfila una nueva oleada de vídeos virales" data-vars-post-url&equals;"https&colon;&sol;&sol;www&period;xataka&period;com&sol;robotica-e-ia&sol;openai-acaba-presentar-sora-2-propia-app-al-estilo-tiktok-ello-se-perfila-nueva-oleada-videos-virales">a modelos que producen vídeos casi indistinguibles de los reales<&sol;a>&period; Y mientras el foco estaba en las demostraciones&comma; otra cuestión iba ganando peso&colon; la transparencia&period; OpenAI&comma; por ejemplo&comma; ha explicado que Sora se entrena con datos &OpenCurlyDoubleQuote;disponibles públicamente”&comma; pero no ha detallado cuáles&period;<&sol;p>&NewLine;<p><&excl;-- BREAK 2 --><&sol;p>&NewLine;<h2>Un entrenamiento masivo que señala a YouTube<&sol;h2>&NewLine;<p>La pieza de The Atlantic da una pista clara de lo que estaba ocurriendo entre bastidores&period; Hablamos de más de 15 millones de vídeos recopilados para entrenar modelos de IA&comma; con una enorme cantidad <strong>procedente de YouTube<&sol;strong> sin autorización formal&period; Entre las iniciativas citadas aparecen conjuntos de datos asociados a varias compañías&comma; diseñados para mejorar el rendimiento de los generadores de vídeo&period; Según el medio&comma; este proceso se realizó sin avisar a los creadores que publicaron originalmente ese contenido&period;<&sol;p>&NewLine;<p><&excl;-- BREAK 3 --><&sol;p>&NewLine;<div class&equals;"article-asset-video article-asset-normal">&NewLine;<div class&equals;"asset-content">&NewLine;<div class&equals;"base-asset-video">&NewLine;<div class&equals;"js-dailymotion"><&sol;div>&NewLine;<&sol;p><&sol;div>&NewLine;<&sol;p><&sol;div>&NewLine;<&sol;div>&NewLine;<p>Uno de los aspectos más llamativos del hallazgo es el perfil del material afectado&period; No se trataba solo de vídeos anónimos o grabaciones domésticas&comma; sino de contenidos informativos y producciones profesionales&period; El medio encontró que miles de piezas procedían de canales pertenecientes a publicaciones como The New York Times&comma; BBC&comma; The Guardian&comma; The Washington Post o Al Jazeera&period; En conjunto&comma; hablamos de un volumen enorme de periodismo que habría terminado alimentando sistemas de IA sin un acuerdo previo con sus propietarios&period;<&sol;p>&NewLine;<p><&excl;-- BREAK 4 --><&sol;p>&NewLine;<p><a class&equals;"text-outboundlink" href&equals;"https&colon;&sol;&sol;www&period;xataka&period;com&sol;robotica-e-ia&sol;runway-se-adelanta-a-openai-lanza-generador-videos-gen-3-alpha-sora-se-puede-usar-navegador" data-vars-post-title&equals;"Runway se adelanta a OpenAI y lanza el generador de vídeos Gen-3 Alpha antes que Sora&colon; ya se puede usar desde el navegador" data-vars-post-url&equals;"https&colon;&sol;&sol;www&period;xataka&period;com&sol;robotica-e-ia&sol;runway-se-adelanta-a-openai-lanza-generador-videos-gen-3-alpha-sora-se-puede-usar-navegador">Runway<&sol;a>&comma; una de las empresas que más impulso ha dado al vídeo generativo&comma; aparece señalada en los conjuntos de datos revisados&period; Según los documentos citados&comma; sus modelos habrían aprendido con clips organizados por tipo de escena y contexto&colon; <strong>entrevistas&comma; explicativos&comma; piezas con gráficos&comma; planos cocina&comma; planos recurso<&sol;strong>&period; La idea es clara&colon; si la IA debe reproducir situaciones humanas y narrativas audiovisuales&comma; necesita referencias reales que cubran desde gestos hasta ritmos de edición&period;<&sol;p>&NewLine;<p><&excl;-- BREAK 5 --><&sol;p>&NewLine;<div class&equals;"article-asset-image article-asset-normal article-asset-center">&NewLine;<div class&equals;"asset-content">&NewLine;<div class&equals;"caption-img ">&NewLine;<p> <img alt&equals;"Runway Video" class&equals;"centro&lowbar;sinmarco" src&equals;"https&colon;&sol;&sol;i&period;blogs&period;es&sol;e564e7&sol;runway-video&sol;450&lowbar;1000&period;jpeg"><&sol;p>&NewLine;<p> <span>Fragmentos de un vídeo generado con la herramienta de Runway<&sol;span>&NewLine; <&sol;div>&NewLine;<&sol;p><&sol;div>&NewLine;<&sol;div>&NewLine;<p>Además de Runway&comma; la investigación menciona conjuntos de datos empleados en laboratorios de grandes plataformas tecnológicas como Meta o ByteDance en investigación y desarrollo de sus modelos&period; La dinámica era similar&colon; enormes volúmenes de vídeos recopilados en internet y compartidos entre equipos de investigación para mejorar las capacidades audiovisuales&period;<&sol;p>&NewLine;<p><&excl;-- BREAK 6 --><&sol;p>&NewLine;<p>La postura oficial de YouTube no deja demasiado margen para interpretaciones&period; <strong>Su normativa prohíbe descargar vídeos para entrenar modelos<&sol;strong>&comma; y su CEO&comma; Neal Mohan&comma; <a class&equals;"text-outboundlink" href&equals;"https&colon;&sol;&sol;www&period;xataka&period;com&sol;robotica-e-ia&sol;clara-infraccion-ceo-youtube-explica-que-openai-no-debe-utilizar-videos-plataforma-para-entrenar-sora" data-vars-post-title&equals;"&OpenCurlyDoubleQuote;Clara infracción”&colon; El CEO de YouTube explica por qué OpenAI no debe utilizar vídeos de la plataforma para entrenar Sora" data-vars-post-url&equals;"https&colon;&sol;&sol;www&period;xataka&period;com&sol;robotica-e-ia&sol;clara-infraccion-ceo-youtube-explica-que-openai-no-debe-utilizar-videos-plataforma-para-entrenar-sora">lo ha reiterado en público<&sol;a>&period; Las expectativas de los creadores&comma; subrayó&comma; pasan por que sus contenidos se utilicen dentro de las reglas del servicio&period; La aparición de millones de vídeos en bases de datos para IA ha situado ese marco legal en primer plano y ha intensificado la presión sobre las plataformas involucradas en el desarrollo de modelos generativos&period;<&sol;p>&NewLine;<p><&excl;-- BREAK 7 --><&sol;p>&NewLine;<p>La reacción del sector mediático ha seguido dos caminos&period; Por un lado&comma; compañías como Vox Media <a class&equals;"text-outboundlink" href&equals;"https&colon;&sol;&sol;www&period;xataka&period;com&sol;robotica-e-ia&sol;openai-anuncia-acuerdo-prisa-le-monde-demostracion-tendencia-al-alza" data-vars-post-title&equals;"OpenAI anuncia un acuerdo con Prisa y Le Monde&period; Es la demostración de una tendencia al alza " data-vars-post-url&equals;"https&colon;&sol;&sol;www&period;xataka&period;com&sol;robotica-e-ia&sol;openai-anuncia-acuerdo-prisa-le-monde-demostracion-tendencia-al-alza">o Prisa han cerrado acuerdos para licenciar su contenido a plataformas de inteligencia artificial&comma;<&sol;a> buscando un marco claro y compensación económica&period; Por otro&comma; algunos medios han optado por plantar cara&colon; The New York Times ha llevado a OpenAI y Microsoft a los tribunales por el uso no autorizado de sus materiales&comma; subrayando que protegerá también el contenido que distribuye en vídeo&period;<&sol;p>&NewLine;<p><&excl;-- BREAK 8 --><&sol;p>&NewLine;<p>El terreno legal sigue siendo difuso&period; La legislación actual no estaba pensada para modelos que procesan millones de vídeos en paralelo&comma; y los tribunales todavía están empezando a marcar líneas&period; Para algunos expertos&comma; <strong>publicar en abierto no equivale a ceder derechos de entrenamiento<&sol;strong>&comma; mientras que las empresas de IA defienden que la indexación y el uso de material público forman parte del avance tecnológico&period; Esa tensión&comma; aún sin resolver&comma; mantiene a medios y desarrolladores en un juego de equilibrio constante&period;<&sol;p>&NewLine;<p><&excl;-- BREAK 9 --><&sol;p>&NewLine;<div class&equals;"article-asset article-asset-normal article-asset-center">&NewLine;<div class&equals;"desvio-container">&NewLine;<div class&equals;"desvio">&NewLine;<div class&equals;"desvio-figure js-desvio-figure">&NewLine; <a href&equals;"https&colon;&sol;&sol;www&period;xataka&period;com&sol;empresas-y-economia&sol;carrera-ia-ha-cambiado-fase-ahora-empieza-deuda" class&equals;"pivot-outboundlink" data-vars-post-title&equals;"Si creías que la burbuja de la IA era preocupante es porque no habíamos entrado en su siguiente fase&colon; deuda"><br &sol;>&NewLine; <img alt&equals;"Si creías que la burbuja de la IA era preocupante es porque no habíamos entrado en su siguiente fase&colon; deuda" width&equals;"375" height&equals;"142" src&equals;"https&colon;&sol;&sol;i&period;blogs&period;es&sol;8782aa&sol;ia1200x900&sol;375&lowbar;142&period;jpeg"><br &sol;>&NewLine; <&sol;a>&NewLine; <&sol;div>&NewLine;<div class&equals;"desvio-summary">&NewLine;<div class&equals;"desvio-taxonomy js-desvio-taxonomy">&NewLine; <a href&equals;"https&colon;&sol;&sol;www&period;xataka&period;com&sol;empresas-y-economia&sol;carrera-ia-ha-cambiado-fase-ahora-empieza-deuda" class&equals;"desvio-taxonomy-anchor pivot-outboundlink" data-vars-post-title&equals;"Si creías que la burbuja de la IA era preocupante es porque no habíamos entrado en su siguiente fase&colon; deuda">En Xataka<&sol;a>&NewLine; <&sol;div>&NewLine;<p> <a href&equals;"https&colon;&sol;&sol;www&period;xataka&period;com&sol;empresas-y-economia&sol;carrera-ia-ha-cambiado-fase-ahora-empieza-deuda" class&equals;"desvio-title js-desvio-title pivot-outboundlink" data-vars-post-title&equals;"Si creías que la burbuja de la IA era preocupante es porque no habíamos entrado en su siguiente fase&colon; deuda">Si creías que la burbuja de la IA era preocupante es porque no habíamos entrado en su siguiente fase&colon; deuda<&sol;a>&NewLine; <&sol;div>&NewLine;<&sol;p><&sol;div>&NewLine;<&sol;p><&sol;div>&NewLine;<&sol;div>&NewLine;<p>Lo que tenemos delante es el arranque de una conversación que va mucho más allá de la tecnología&period; El entrenamiento de modelos de IA con material disponible en internet ha sido una práctica extendida durante años&comma; y ahora llega el momento de decidir dónde están los límites&period; Las compañías prometen acuerdos y transparencia&comma; los medios piden garantías y los creadores reclaman control&period; La próxima etapa será tan tecnológica como política&colon; cómo se alimenta la inteligencia artificial definirá quién se beneficia de ella&period;<&sol;p>&NewLine;<p><&excl;-- BREAK 10 --><&sol;p>&NewLine;<p>Imágenes &vert; Xataka con Gemini 2&period;5<&sol;p>&NewLine;<p>En Xataka &vert; <a class&equals;"text-outboundlink" href&equals;"https&colon;&sol;&sol;www&period;xataka&period;com&sol;legislacion-y-derechos&sol;todas-grandes-ia-han-ignorado-leyes-copyright-alucinante-que-sigue-haber-consecuencias" data-vars-post-title&equals;"Todas las grandes IA han ignorado las leyes del copyright&period; Lo alucinante es que sigue sin haber consecuencias " data-vars-post-url&equals;"https&colon;&sol;&sol;www&period;xataka&period;com&sol;legislacion-y-derechos&sol;todas-grandes-ia-han-ignorado-leyes-copyright-alucinante-que-sigue-haber-consecuencias">Todas las grandes IA han ignorado las leyes del copyright&period; Lo alucinante es que sigue sin haber consecuencias<&sol;a><&sol;p>&NewLine;<p> &&num;8211&semi; <br &sol;> La noticia<br &sol;>&NewLine; <a href&equals;"https&colon;&sol;&sol;www&period;xataka&period;com&sol;robotica-e-ia&sol;muchas-ia-video-estan-aprendiendo-a-imitar-mundo-todo-apunta-a-saqueo-precedentes-youtube&quest;utm&lowbar;source&equals;feedburner&amp&semi;utm&lowbar;medium&equals;feed&amp&semi;utm&lowbar;campaign&equals;31&lowbar;Oct&lowbar;2025"><br &sol;>&NewLine; <em> Muchas IA de vídeo están aprendiendo a imitar el mundo&period; Y todo apunta a un &OpenCurlyDoubleQuote;saqueo” sin precedentes de YouTube <&sol;em><br &sol;>&NewLine; <&sol;a><br &sol;>&NewLine; fue publicada originalmente en<br &sol;>&NewLine; <a href&equals;"https&colon;&sol;&sol;www&period;xataka&period;com&sol;&quest;utm&lowbar;source&equals;feedburner&amp&semi;utm&lowbar;medium&equals;feed&amp&semi;utm&lowbar;campaign&equals;31&lowbar;Oct&lowbar;2025"><br &sol;>&NewLine; <strong> Xataka <&sol;strong><br &sol;>&NewLine; <&sol;a><br &sol;>&NewLine; por <a href&equals;"https&colon;&sol;&sol;www&period;xataka&period;com&sol;autor&sol;javier-marquez&quest;utm&lowbar;source&equals;feedburner&amp&semi;utm&lowbar;medium&equals;feed&amp&semi;utm&lowbar;campaign&equals;31&lowbar;Oct&lowbar;2025"><br &sol;>&NewLine; Javier Marquez<br &sol;>&NewLine; <&sol;a><br &sol;>&NewLine; &period; <&sol;p>&NewLine;<p>&ZeroWidthSpace;Una plaza&comma; turistas&comma; un camarero moviéndose entre mesas&comma; una bici que pasa al fondo o un periodista en un plató&period; Las IA de vídeo ya pueden generar escenas en un pispás&period; El resultado sorprende&comma; pero también abre una pregunta que hasta hace poco apenas se planteaba&colon; ¿de dónde han salido todas esas imágenes que les han permitido aprender a imitar el mundo&quest; Según The Atlantic&comma; parte de la respuesta apunta a millones de vídeos extraídos de plataformas como YouTube sin un consentimiento claro&period;<&sol;p>&NewLine;<p>La euforia por la IA generativa ha ido tan rápido que muchas preguntas se han quedado atrás&period; En apenas dos años hemos pasado de pequeños experimentos curiosos a modelos que producen vídeos casi indistinguibles de los reales&period; Y mientras el foco estaba en las demostraciones&comma; otra cuestión iba ganando peso&colon; la transparencia&period; OpenAI&comma; por ejemplo&comma; ha explicado que Sora se entrena con datos &OpenCurlyDoubleQuote;disponibles públicamente”&comma; pero no ha detallado cuáles&period;<&sol;p>&NewLine;<p>Un entrenamiento masivo que señala a YouTube<&sol;p>&NewLine;<p>La pieza de The Atlantic da una pista clara de lo que estaba ocurriendo entre bastidores&period; Hablamos de más de 15 millones de vídeos recopilados para entrenar modelos de IA&comma; con una enorme cantidad procedente de YouTube sin autorización formal&period; Entre las iniciativas citadas aparecen conjuntos de datos asociados a varias compañías&comma; diseñados para mejorar el rendimiento de los generadores de vídeo&period; Según el medio&comma; este proceso se realizó sin avisar a los creadores que publicaron originalmente ese contenido&period;<&sol;p>&NewLine;<p>Uno de los aspectos más llamativos del hallazgo es el perfil del material afectado&period; No se trataba solo de vídeos anónimos o grabaciones domésticas&comma; sino de contenidos informativos y producciones profesionales&period; El medio encontró que miles de piezas procedían de canales pertenecientes a publicaciones como The New York Times&comma; BBC&comma; The Guardian&comma; The Washington Post o Al Jazeera&period; En conjunto&comma; hablamos de un volumen enorme de periodismo que habría terminado alimentando sistemas de IA sin un acuerdo previo con sus propietarios&period;<&sol;p>&NewLine;<p>Runway&comma; una de las empresas que más impulso ha dado al vídeo generativo&comma; aparece señalada en los conjuntos de datos revisados&period; Según los documentos citados&comma; sus modelos habrían aprendido con clips organizados por tipo de escena y contexto&colon; entrevistas&comma; explicativos&comma; piezas con gráficos&comma; planos cocina&comma; planos recurso&period; La idea es clara&colon; si la IA debe reproducir situaciones humanas y narrativas audiovisuales&comma; necesita referencias reales que cubran desde gestos hasta ritmos de edición&period;<&sol;p>&NewLine;<p> Fragmentos de un vídeo generado con la herramienta de Runway<&sol;p>&NewLine;<p>Además de Runway&comma; la investigación menciona conjuntos de datos empleados en laboratorios de grandes plataformas tecnológicas como Meta o ByteDance en investigación y desarrollo de sus modelos&period; La dinámica era similar&colon; enormes volúmenes de vídeos recopilados en internet y compartidos entre equipos de investigación para mejorar las capacidades audiovisuales&period;<&sol;p>&NewLine;<p>La postura oficial de YouTube no deja demasiado margen para interpretaciones&period; Su normativa prohíbe descargar vídeos para entrenar modelos&comma; y su CEO&comma; Neal Mohan&comma; lo ha reiterado en público&period; Las expectativas de los creadores&comma; subrayó&comma; pasan por que sus contenidos se utilicen dentro de las reglas del servicio&period; La aparición de millones de vídeos en bases de datos para IA ha situado ese marco legal en primer plano y ha intensificado la presión sobre las plataformas involucradas en el desarrollo de modelos generativos&period;<&sol;p>&NewLine;<p>La reacción del sector mediático ha seguido dos caminos&period; Por un lado&comma; compañías como Vox Media o Prisa han cerrado acuerdos para licenciar su contenido a plataformas de inteligencia artificial&comma; buscando un marco claro y compensación económica&period; Por otro&comma; algunos medios han optado por plantar cara&colon; The New York Times ha llevado a OpenAI y Microsoft a los tribunales por el uso no autorizado de sus materiales&comma; subrayando que protegerá también el contenido que distribuye en vídeo&period;<&sol;p>&NewLine;<p>El terreno legal sigue siendo difuso&period; La legislación actual no estaba pensada para modelos que procesan millones de vídeos en paralelo&comma; y los tribunales todavía están empezando a marcar líneas&period; Para algunos expertos&comma; publicar en abierto no equivale a ceder derechos de entrenamiento&comma; mientras que las empresas de IA defienden que la indexación y el uso de material público forman parte del avance tecnológico&period; Esa tensión&comma; aún sin resolver&comma; mantiene a medios y desarrolladores en un juego de equilibrio constante&period;<&sol;p>&NewLine;<p> En Xataka<&sol;p>&NewLine;<p> Si creías que la burbuja de la IA era preocupante es porque no habíamos entrado en su siguiente fase&colon; deuda<&sol;p>&NewLine;<p>Lo que tenemos delante es el arranque de una conversación que va mucho más allá de la tecnología&period; El entrenamiento de modelos de IA con material disponible en internet ha sido una práctica extendida durante años&comma; y ahora llega el momento de decidir dónde están los límites&period; Las compañías prometen acuerdos y transparencia&comma; los medios piden garantías y los creadores reclaman control&period; La próxima etapa será tan tecnológica como política&colon; cómo se alimenta la inteligencia artificial definirá quién se beneficia de ella&period;<&sol;p>&NewLine;<p>Imágenes &vert; Xataka con Gemini 2&period;5<&sol;p>&NewLine;<p>En Xataka &vert; Todas las grandes IA han ignorado las leyes del copyright&period; Lo alucinante es que sigue sin haber consecuencias<&sol;p>&NewLine;<p> &&num;8211&semi; La noticia<&sol;p>&NewLine;<p> Muchas IA de vídeo están aprendiendo a imitar el mundo&period; Y todo apunta a un &OpenCurlyDoubleQuote;saqueo” sin precedentes de YouTube <&sol;p>&NewLine;<p> fue publicada originalmente en<&sol;p>&NewLine;<p> Xataka <&sol;p>&NewLine;<p> por<br &sol;>&NewLine; Javier Marquez<&sol;p>&NewLine;<p> &period;   <&sol;p>&NewLine;<p>&ZeroWidthSpace;   <&sol;p>&NewLine;<p>&ZeroWidthSpace; <&sol;p>&NewLine;

Leave a Reply

Your email address will not be published. Required fields are marked *

Noticias Importantes

Copyright © 2017 ERM DIGITAL. powered by ERM.