Ciencia y Tecnología

Tenemos un nuevo ganador en generación de imágenes con IA. Y no es estadounidense, sino chino

Published

on

<p>&NewLine; <img src&equals;"https&colon;&sol;&sol;i&period;blogs&period;es&sol;0df46f&sol;einstein2&sol;1024&lowbar;2000&period;jpeg" alt&equals;"Tenemos un nuevo ganador en generación de imágenes con IA&period; Y no es estadounidense&comma; sino chino ">&NewLine; <&sol;p>&NewLine;<&sol;p>&NewLine;<p>Tencent acaba de lanzar un nuevo modelo de IA capaz de <a class&equals;"text-outboundlink" href&equals;"https&colon;&sol;&sol;www&period;xataka&period;com&sol;basics&sol;14-herramientas-para-crear-imagenes-ia-gratis" data-vars-post-title&equals;"14 herramientas para crear imágenes con IA gratis" data-vars-post-url&equals;"https&colon;&sol;&sol;www&period;xataka&period;com&sol;basics&sol;14-herramientas-para-crear-imagenes-ia-gratis">generar imágenes a partir de un prompt de texto<&sol;a>&period; Tradicionalmente los modelos propietarios han dominado este tipo de tarea creativa&comma; pero el modelo de Tencent ha dado la sorpresa y según diversos benchmarks es capaz de generar imágenes mejor que el resto de competidores&comma; incluidos los de Google y OpenAI&period;<&sol;p>&NewLine;<p><strong>Hunyuan Image 3&period;0<&sol;strong>&period; Así se llama el nuevo modelo de Tencent&comma; que en la <a rel&equals;"noopener&comma; noreferrer" href&equals;"https&colon;&sol;&sol;lmarena&period;ai&sol;leaderboard&sol;text-to-image">clasificación de LMArena<&sol;a> de modelos más potentes para la generación de imágenes a partir de texto ha logrado superar a Gemini 2&period;5 Flash Image Preview &lpar;popularmente conocido como nano banana&rpar;&comma; además de a otros modelos propietarios como GPT-Image-1&comma; Flux-1-Kontext-Max o Qwen-Image&period; <&sol;p>&NewLine;<p><&excl;-- BREAK 1 --><&sol;p>&NewLine;<div class&equals;"article-asset-image article-asset-normal article-asset-center">&NewLine;<div class&equals;"asset-content">&NewLine;<div class&equals;"caption-img ">&NewLine;<p> <img alt&equals;"Captura De Pantalla 2025 10 06 A Las 11 45 15" class&equals;"" src&equals;"https&colon;&sol;&sol;i&period;blogs&period;es&sol;3a6123&sol;captura-de-pantalla-2025-10-06-a-las-11&period;45&period;15&sol;450&lowbar;1000&period;jpeg"><&sol;p>&NewLine;<p> <span>El modelo de imagen de Tencent ha logrado ya superar a sus competidores según los expertos de LM Arena&period;<&sol;span>&NewLine; <&sol;div>&NewLine;<&sol;p><&sol;div>&NewLine;<&sol;div>&NewLine;<p><strong>Votación a ciegas<&sol;strong>&period; Esa clasificación de LM Arena funciona mediante un sistema de votación ciega en el cual losusuarios eligen sus imágenes preferidas sin saber qué modelo los generó&period; Y según dicha votación&comma; este modelo de Tencent superó a todos sus contrincantes&comma; incluyendo al popular &&num;8220&semi;nano banana&&num;8221&semi; de Google&period; Eso sí&colon; la votación también tiene en cuenta resultados a largo plazo&comma; y el corto periodo que lleva disponible Hunyuan Image 3&period;0 hace que los resultados se califiquen como &&num;8220&semi;preliminares&&num;8221&semi; y no definitivos&period;<&sol;p>&NewLine;<p><strong>Cómo funciona<&sol;strong>&period; Los responsables de Tencent <a rel&equals;"noopener&comma; noreferrer" href&equals;"https&colon;&sol;&sol;hunyuan-image&period;com&sol;">explican en la descripción del modelo<&sol;a> cómo han utilizado una nueva arquitectura de difusión que hace uso de codificadores duales &lpar;un LLM multimodal y otro que entiende mejor los caracteres de distintos idiomas&rpar; y optimización RLHF &lpar;Reinforcement Learning from Human Feedback&comma; que refina el resultado previo&rpar; para la creación de imágenes de mayor calidad&period; El sistema hace uso además de un sistema de compresión para que todo el proceso consuma menos recursos sin pérdida de calidad&period;<&sol;p>&NewLine;<p><&excl;-- BREAK 2 --><&sol;p>&NewLine;<div class&equals;"article-asset article-asset-normal article-asset-center">&NewLine;<div class&equals;"desvio-container">&NewLine;<div class&equals;"desvio">&NewLine;<div class&equals;"desvio-figure js-desvio-figure">&NewLine; <a href&equals;"https&colon;&sol;&sol;www&period;xataka&period;com&sol;robotica-e-ia&sol;nano-banana-no-solo-gran-creador-imagenes-ia-mayor-peligro-para-photoshop-compania" class&equals;"pivot-outboundlink" data-vars-post-title&equals;"Nano Banana no es solo un gran creador de imágenes con IA&period; Es el mayor peligro para Photoshop y compañía "><br &sol;>&NewLine; <img alt&equals;"Nano Banana no es solo un gran creador de imágenes con IA&period; Es el mayor peligro para Photoshop y compañía " width&equals;"375" height&equals;"142" src&equals;"https&colon;&sol;&sol;i&period;blogs&period;es&sol;2bc5ee&sol;nano-banana&sol;375&lowbar;142&period;jpeg"><br &sol;>&NewLine; <&sol;a>&NewLine; <&sol;div>&NewLine;<div class&equals;"desvio-summary">&NewLine;<div class&equals;"desvio-taxonomy js-desvio-taxonomy">&NewLine; <a href&equals;"https&colon;&sol;&sol;www&period;xataka&period;com&sol;robotica-e-ia&sol;nano-banana-no-solo-gran-creador-imagenes-ia-mayor-peligro-para-photoshop-compania" class&equals;"desvio-taxonomy-anchor pivot-outboundlink" data-vars-post-title&equals;"Nano Banana no es solo un gran creador de imágenes con IA&period; Es el mayor peligro para Photoshop y compañía ">En Xataka<&sol;a>&NewLine; <&sol;div>&NewLine;<p> <a href&equals;"https&colon;&sol;&sol;www&period;xataka&period;com&sol;robotica-e-ia&sol;nano-banana-no-solo-gran-creador-imagenes-ia-mayor-peligro-para-photoshop-compania" class&equals;"desvio-title js-desvio-title pivot-outboundlink" data-vars-post-title&equals;"Nano Banana no es solo un gran creador de imágenes con IA&period; Es el mayor peligro para Photoshop y compañía ">Nano Banana no es solo un gran creador de imágenes con IA&period; Es el mayor peligro para Photoshop y compañía <&sol;a>&NewLine; <&sol;div>&NewLine;<&sol;p><&sol;div>&NewLine;<&sol;p><&sol;div>&NewLine;<&sol;div>&NewLine;<p><strong>Pesos abiertos y licencia comercial<&sol;strong>&period; Hunyuan Image 3&period;0 es un modelo que comparte <a rel&equals;"noopener&comma; noreferrer" href&equals;"https&colon;&sol;&sol;github&period;com&sol;Tencent-Hunyuan&sol;HunyuanImage-3&period;0">su código en GitHub<&sol;a> y que ofrece <a rel&equals;"noopener&comma; noreferrer" href&equals;"https&colon;&sol;&sol;github&period;com&sol;Tencent-Hunyuan&sol;HunyuanImage-3&period;0&sol;blob&sol;main&sol;LICENSE">una licencia<&sol;a> sorprendentemente permisiva&period; De hecho es posible hasta usarlo con fines comerciales y profesionales&period; <&sol;p>&NewLine;<p><&excl;-- BREAK 3 --><&sol;p>&NewLine;<p><strong>El precio no es del todo económico<&sol;strong>&period; Aunque el modelo se puede probar gratuitamente en el <a rel&equals;"noopener&comma; noreferrer" href&equals;"https&colon;&sol;&sol;hunyuan-image&period;com&sol;text-to-image">sitio web del proyecto<&sol;a>&comma; en nuestras pruebas solo pudimos crear una imagen &lpar;10 créditos&rpar;&period; La plataforma permite comprar créditos mensuales&colon; 8 dólares al mes permiten <a rel&equals;"noopener&comma; noreferrer" href&equals;"https&colon;&sol;&sol;hunyuan-image&period;com&sol;pricing">comprar 500 créditos<&sol;a>&comma; lo que a priori nos permitiría crear 50 imágenes de 10 créditos cada una&period; Cada una saldría a 0&comma;16 dólares&comma; cuando nano banana <a rel&equals;"noopener&comma; noreferrer" href&equals;"https&colon;&sol;&sol;ai&period;google&period;dev&sol;gemini-api&sol;docs&sol;pricing">tiene un coste<&sol;a> de 0&comma;039 dólares&comma; cuatro veces inferior aparentemente&period; Hay otras opciones para probarlo&comma; como <a rel&equals;"noopener&comma; noreferrer" href&equals;"https&colon;&sol;&sol;huggingface&period;co&sol;tencent&sol;HunyuanImage-3&period;0">los &&num;8220&semi;Spaces&&num;8221&semi; de Hugging Face<&sol;a>&period; Es también posible conseguir una clave API <a rel&equals;"noopener&comma; noreferrer" href&equals;"https&colon;&sol;&sol;cloud&period;tencent&period;com&sol;document&sol;product&sol;1772&sol;115963&num;&period;E5&period;BF&period;AB&period;E9&period;80&period;9F&period;E6&period;8E&period;A5&period;E5&period;85&period;A5">en Tencent Cloud<&sol;a> para usar el modelo localmente&period;<&sol;p>&NewLine;<p><&excl;-- BREAK 4 --><&sol;p>&NewLine;<div class&equals;"article-asset-image article-asset-normal article-asset-center">&NewLine;<div class&equals;"asset-content">&NewLine; <a rel&equals;"noopener&comma; noreferrer" href&equals;"https&colon;&sol;&sol;x&period;com&sol;TencentHunyuan&sol;status&sol;1971805621738700947"><&sol;p>&NewLine;<p> <img alt&equals;"Captura De Pantalla 2025 10 06 A Las 12 22 17" class&equals;"centro&lowbar;sinmarco" src&equals;"https&colon;&sol;&sol;i&period;blogs&period;es&sol;1c116b&sol;captura-de-pantalla-2025-10-06-a-las-12&period;22&period;17&sol;450&lowbar;1000&period;jpeg"><br &sol;>&NewLine; <&sol;a><&sol;p><&sol;div>&NewLine;<&sol;div>&NewLine;<p><strong>Gemini sigue ganando como &&num;8220&semi;editor&&num;8221&semi;<&sol;strong>&period; Aunque el modelo de Tencent es interesante y destacable&comma; nano banana sigue ganando la partida si consideramos que se ha convertido en un singular sustituto del tradicional Photoshop&period; Muchos usuarios ya no editan fotos sino que cargan una en Gemini y luego le dicen a la IA qué cambios quieren realizar en esa imagen&period; <&sol;p>&NewLine;<p><&excl;-- BREAK 5 --><&sol;p>&NewLine;<p><strong>Alibaba&comma; más conversacional<&sol;strong>&period; Aunque Hunyuan Image 3&period;0 pueda permitir algo así —de hecho <a rel&equals;"noopener&comma; noreferrer" href&equals;"https&colon;&sol;&sol;x&period;com&sol;TencentHunyuan&sol;status&sol;1971805621738700947">hay demos<&sol;a> al respecto—&comma; la interfaz está por ahora más dirigida a un único prompt para generar imágenes&comma; no a una &&num;8220&semi;conversación&&num;8221&semi; como sí permite Gemini&period; Otro de los protagonistas de este terreno es Alibaba&comma; que con Qwen-Image-Editor adopta el mismo enfoque que Google con Gemini y nano-banana&period; En ese modelo de Alibaba &&num;8220&semi;hablas&&num;8221&semi; con tu imagen para pedir cambios&comma; algo que de momento no parece que el modelo de Tencent haga tan directamente &lpar;aunque no parece difícil que lo consiga&rpar;&period;<&sol;p>&NewLine;<p><&excl;-- BREAK 6 --><&sol;p>&NewLine;<div class&equals;"article-asset-video article-asset-normal">&NewLine;<div class&equals;"asset-content">&NewLine;<div class&equals;"base-asset-video">&NewLine;<div class&equals;"js-dailymotion"><&sol;div>&NewLine;<&sol;p><&sol;div>&NewLine;<&sol;p><&sol;div>&NewLine;<&sol;div>&NewLine;<p><strong>Pero cuidado<&sol;strong>&period; Lo diferencial aquí es que la generación de imágenes&comma; que parecía estar dominada por modelos propietarios&comma; puede ser aparentemente igual de buena &lpar;o incluso superior&rpar; mediante modelos abiertos&period; Una vez más <a class&equals;"text-outboundlink" href&equals;"https&colon;&sol;&sol;www&period;xataka&period;com&sol;robotica-e-ia&sol;ser-open-source-no-decision-que-abre-brecha-china-estados-unidos-definira-futuro-ia" data-vars-post-title&equals;"China y Estados Unidos han iniciado una carrera antagónica en la IA a través de una cuestión simple&colon; ser open source o no" data-vars-post-url&equals;"https&colon;&sol;&sol;www&period;xataka&period;com&sol;robotica-e-ia&sol;ser-open-source-no-decision-que-abre-brecha-china-estados-unidos-definira-futuro-ia">la apuesta China por esa filosofía es destacable<&sol;a> y contrasta con el enfoque cerrado y propietario de la mayoría de empresas estadounidenses que desarrollan modelos de IA tanto para generar imágenes como texto &lpar;o&comma; desde luego&comma; vídeo&rpar;&period;<&sol;p>&NewLine;<p>Imagen &vert; <a rel&equals;"noopener&comma; noreferrer" href&equals;"https&colon;&sol;&sol;x&period;com&sol;TencentHunyuan&sol;status&sol;1973015014907998690&sol;photo&sol;3">Hunyuan<&sol;a><&sol;p>&NewLine;<p>En Xataka &vert; <a class&equals;"text-outboundlink" href&equals;"https&colon;&sol;&sol;www&period;xataka&period;com&sol;robotica-e-ia&sol;china-no-se-conforman-crear-robots-avanzados-compania-ha-desarrollado-cabeza-que-gesticula-como-humano" data-vars-post-title&equals;"En China no se conforman con crear robots avanzados&colon; una compañía ha desarrollado una cabeza que gesticula como un humano " data-vars-post-url&equals;"https&colon;&sol;&sol;www&period;xataka&period;com&sol;robotica-e-ia&sol;china-no-se-conforman-crear-robots-avanzados-compania-ha-desarrollado-cabeza-que-gesticula-como-humano">En China no se conforman con crear robots avanzados&colon; una compañía ha desarrollado una cabeza que gesticula como un humano<&sol;a><&sol;p>&NewLine;<p><&excl;-- BREAK 7 --><&sol;p>&NewLine;<p> &&num;8211&semi; <br &sol;> La noticia<br &sol;>&NewLine; <a href&equals;"https&colon;&sol;&sol;www&period;xataka&period;com&sol;robotica-e-ia&sol;tenemos-nuevo-ganador-generacion-imagenes-ia-no-estadounidense-sino-chino&quest;utm&lowbar;source&equals;feedburner&amp&semi;utm&lowbar;medium&equals;feed&amp&semi;utm&lowbar;campaign&equals;06&lowbar;Oct&lowbar;2025"><br &sol;>&NewLine; <em> Tenemos un nuevo ganador en generación de imágenes con IA&period; Y no es estadounidense&comma; sino chino <&sol;em><br &sol;>&NewLine; <&sol;a><br &sol;>&NewLine; fue publicada originalmente en<br &sol;>&NewLine; <a href&equals;"https&colon;&sol;&sol;www&period;xataka&period;com&sol;&quest;utm&lowbar;source&equals;feedburner&amp&semi;utm&lowbar;medium&equals;feed&amp&semi;utm&lowbar;campaign&equals;06&lowbar;Oct&lowbar;2025"><br &sol;>&NewLine; <strong> Xataka <&sol;strong><br &sol;>&NewLine; <&sol;a><br &sol;>&NewLine; por <a href&equals;"https&colon;&sol;&sol;www&period;xataka&period;com&sol;autor&sol;javier-pastor&quest;utm&lowbar;source&equals;feedburner&amp&semi;utm&lowbar;medium&equals;feed&amp&semi;utm&lowbar;campaign&equals;06&lowbar;Oct&lowbar;2025"><br &sol;>&NewLine; Javier Pastor<br &sol;>&NewLine; <&sol;a><br &sol;>&NewLine; &period; <&sol;p>&NewLine;<p>&ZeroWidthSpace;Tencent acaba de lanzar un nuevo modelo de IA capaz de generar imágenes a partir de un prompt de texto&period; Tradicionalmente los modelos propietarios han dominado este tipo de tarea creativa&comma; pero el modelo de Tencent ha dado la sorpresa y según diversos benchmarks es capaz de generar imágenes mejor que el resto de competidores&comma; incluidos los de Google y OpenAI&period;Hunyuan Image 3&period;0&period; Así se llama el nuevo modelo de Tencent&comma; que en la clasificación de LMArena de modelos más potentes para la generación de imágenes a partir de texto ha logrado superar a Gemini 2&period;5 Flash Image Preview &lpar;popularmente conocido como nano banana&rpar;&comma; además de a otros modelos propietarios como GPT-Image-1&comma; Flux-1-Kontext-Max o Qwen-Image&period; <&sol;p>&NewLine;<p> El modelo de imagen de Tencent ha logrado ya superar a sus competidores según los expertos de LM Arena&period;<&sol;p>&NewLine;<p>Votación a ciegas&period; Esa clasificación de LM Arena funciona mediante un sistema de votación ciega en el cual losusuarios eligen sus imágenes preferidas sin saber qué modelo los generó&period; Y según dicha votación&comma; este modelo de Tencent superó a todos sus contrincantes&comma; incluyendo al popular &&num;8220&semi;nano banana&&num;8221&semi; de Google&period; Eso sí&colon; la votación también tiene en cuenta resultados a largo plazo&comma; y el corto periodo que lleva disponible Hunyuan Image 3&period;0 hace que los resultados se califiquen como &&num;8220&semi;preliminares&&num;8221&semi; y no definitivos&period;Cómo funciona&period; Los responsables de Tencent explican en la descripción del modelo cómo han utilizado una nueva arquitectura de difusión que hace uso de codificadores duales &lpar;un LLM multimodal y otro que entiende mejor los caracteres de distintos idiomas&rpar; y optimización RLHF &lpar;Reinforcement Learning from Human Feedback&comma; que refina el resultado previo&rpar; para la creación de imágenes de mayor calidad&period; El sistema hace uso además de un sistema de compresión para que todo el proceso consuma menos recursos sin pérdida de calidad&period;<&sol;p>&NewLine;<p> En Xataka<&sol;p>&NewLine;<p> Nano Banana no es solo un gran creador de imágenes con IA&period; Es el mayor peligro para Photoshop y compañía <&sol;p>&NewLine;<p>Pesos abiertos y licencia comercial&period; Hunyuan Image 3&period;0 es un modelo que comparte su código en GitHub y que ofrece una licencia sorprendentemente permisiva&period; De hecho es posible hasta usarlo con fines comerciales y profesionales&period; <&sol;p>&NewLine;<p>El precio no es del todo económico&period; Aunque el modelo se puede probar gratuitamente en el sitio web del proyecto&comma; en nuestras pruebas solo pudimos crear una imagen &lpar;10 créditos&rpar;&period; La plataforma permite comprar créditos mensuales&colon; 8 dólares al mes permiten comprar 500 créditos&comma; lo que a priori nos permitiría crear 50 imágenes de 10 créditos cada una&period; Cada una saldría a 0&comma;16 dólares&comma; cuando nano banana tiene un coste de 0&comma;039 dólares&comma; cuatro veces inferior aparentemente&period; Hay otras opciones para probarlo&comma; como los &&num;8220&semi;Spaces&&num;8221&semi; de Hugging Face&period; Es también posible conseguir una clave API en Tencent Cloud para usar el modelo localmente&period;<&sol;p>&NewLine;<p>Gemini sigue ganando como &&num;8220&semi;editor&&num;8221&semi;&period; Aunque el modelo de Tencent es interesante y destacable&comma; nano banana sigue ganando la partida si consideramos que se ha convertido en un singular sustituto del tradicional Photoshop&period; Muchos usuarios ya no editan fotos sino que cargan una en Gemini y luego le dicen a la IA qué cambios quieren realizar en esa imagen&period; <&sol;p>&NewLine;<p>Alibaba&comma; más conversacional&period; Aunque Hunyuan Image 3&period;0 pueda permitir algo así —de hecho hay demos al respecto—&comma; la interfaz está por ahora más dirigida a un único prompt para generar imágenes&comma; no a una &&num;8220&semi;conversación&&num;8221&semi; como sí permite Gemini&period; Otro de los protagonistas de este terreno es Alibaba&comma; que con Qwen-Image-Editor adopta el mismo enfoque que Google con Gemini y nano-banana&period; En ese modelo de Alibaba &&num;8220&semi;hablas&&num;8221&semi; con tu imagen para pedir cambios&comma; algo que de momento no parece que el modelo de Tencent haga tan directamente &lpar;aunque no parece difícil que lo consiga&rpar;&period;<&sol;p>&NewLine;<p>Pero cuidado&period; Lo diferencial aquí es que la generación de imágenes&comma; que parecía estar dominada por modelos propietarios&comma; puede ser aparentemente igual de buena &lpar;o incluso superior&rpar; mediante modelos abiertos&period; Una vez más la apuesta China por esa filosofía es destacable y contrasta con el enfoque cerrado y propietario de la mayoría de empresas estadounidenses que desarrollan modelos de IA tanto para generar imágenes como texto &lpar;o&comma; desde luego&comma; vídeo&rpar;&period;Imagen &vert; HunyuanEn Xataka &vert; En China no se conforman con crear robots avanzados&colon; una compañía ha desarrollado una cabeza que gesticula como un humano<&sol;p>&NewLine;<p> &&num;8211&semi; La noticia<&sol;p>&NewLine;<p> Tenemos un nuevo ganador en generación de imágenes con IA&period; Y no es estadounidense&comma; sino chino <&sol;p>&NewLine;<p> fue publicada originalmente en<&sol;p>&NewLine;<p> Xataka <&sol;p>&NewLine;<p> por<br &sol;>&NewLine; Javier Pastor<&sol;p>&NewLine;<p> &period;   <&sol;p>&NewLine;<p>&ZeroWidthSpace;   <&sol;p>&NewLine;<p>&ZeroWidthSpace; <&sol;p>&NewLine;

Leave a Reply

Your email address will not be published. Required fields are marked *

Noticias Importantes

Copyright © 2017 ERM DIGITAL. powered by ERM.