Ciencia y Tecnología

El arranque de ALIA, el modelo de IA español, ha sido errático y decepcionante. Ahora sabemos por qué

Published

5 hours ago

December 28, 2025

<p>&NewLine; <img src="https&colon;//i&period;blogs&period;es/0ac875/alia-marenostrum4/1024&lowbar;2000&period;jpeg" alt="El arranque de ALIA, el modelo de IA español, ha sido errático y decepcionante&period; Ahora sabemos por qué ">&NewLine; </p>&NewLine;<p>Empecemos por lo importante&period; ALIA, el modelo de IA español, <strong>no tenía que haberse lanzado</strong><strong> cuando se lanzó</strong>&period; </p>&NewLine;<p>En Xataka hemos hablado con uno de los principales responsables de su desarrollo y eso nos ha permitido conocer y entender mucho mejor su alcance y sus objetivos, pero también por qué la (inevitable) comparación con ChatGPT no solo es injusta&colon; es inapropiada&period;</p>&NewLine;<p><&excl;-- BREAK 1 --></p>&NewLine;<p>ALIA-40b es un modelo fundacional de IA, esto es, un modelo de inteligencia artificial de gran escala entrenado con una cantidad masiva y diversa de datos, y que sirve como base para multitud de aplicaciones distintas&period; Este proyecto está coordinado por el Barcelona Supercomputing Center (<a rel="noopener, noreferrer" href="https&colon;//www&period;bsc&period;es/">BSC-CNS</a>), y aunque se ha podido beneficiar de la infraestructura del <a class="text-outboundlink" href="https&colon;//www&period;xataka&period;com/investigacion/marenostrum-5-esta-marcha-gran-salto-espana-para-estar-primera-liga-supercomputacion-mundial" data-vars-post-title="El MareNostrum 5 ya está en marcha&colon; el gran salto de España para estar en la primera liga de la supercomputación mundial" data-vars-post-url="https&colon;//www&period;xataka&period;com/investigacion/marenostrum-5-esta-marcha-gran-salto-espana-para-estar-primera-liga-supercomputacion-mundial">supercomputador MareNostrum 5</a>, incluso esa ventaja ha sido limitada&period; </p>&NewLine;<p><&excl;-- BREAK 2 --></p>&NewLine;<div class="article-asset article-asset-normal article-asset-center">&NewLine;<div class="desvio-container">&NewLine;<div class="desvio">&NewLine;<div class="desvio-figure js-desvio-figure">&NewLine; <a href="https&colon;//www&period;xataka&period;com/robotica-e-ia/asi-alia-modelo-ia-espanola-que-puede-quiere-competir-chatgpt" class="pivot-outboundlink" data-vars-post-title='"El objetivo no es competir con ChatGPT"&colon; hablamos con los creadores de ALIA, la IA 100&percnt; española, para entender su futuro'><br />&NewLine; <img alt='"El objetivo no es competir con ChatGPT"&colon; hablamos con los creadores de ALIA, la IA 100&percnt; española, para entender su futuro' width="375" height="142" src="https&colon;//i&period;blogs&period;es/8173cd/alia-1/375&lowbar;142&period;jpeg"><br />&NewLine; </a>&NewLine; </div>&NewLine;<div class="desvio-summary">&NewLine;<div class="desvio-taxonomy js-desvio-taxonomy">&NewLine; <a href="https&colon;//www&period;xataka&period;com/robotica-e-ia/asi-alia-modelo-ia-espanola-que-puede-quiere-competir-chatgpt" class="desvio-taxonomy-anchor pivot-outboundlink" data-vars-post-title='"El objetivo no es competir con ChatGPT"&colon; hablamos con los creadores de ALIA, la IA 100&percnt; española, para entender su futuro'>En Xataka</a>&NewLine; </div>&NewLine;<p> <a href="https&colon;//www&period;xataka&period;com/robotica-e-ia/asi-alia-modelo-ia-espanola-que-puede-quiere-competir-chatgpt" class="desvio-title js-desvio-title pivot-outboundlink" data-vars-post-title='"El objetivo no es competir con ChatGPT"&colon; hablamos con los creadores de ALIA, la IA 100&percnt; española, para entender su futuro'>&&num;8220&semi;El objetivo no es competir con ChatGPT&&num;8221&semi;&colon; hablamos con los creadores de ALIA, la IA 100&percnt; española, para entender su futuro</a>&NewLine; </div>&NewLine;</p></div>&NewLine;</p></div>&NewLine;</div>&NewLine;<p>Como decimos, comparar el rendimiento de <a rel="noopener, noreferrer" href="https&colon;//huggingface&period;co/BSC-LT/ALIA-40b">ALIA-40b</a> con el de modelos como GPT-5 o Gemini 3 es inapropiado, y para entenderlo todo mejor hay que entender de dónde parte el proyecto, qué objetivos tiene y cómo su desarrollo es mucho más modesto —y aun así prometedor— que el de los grandes modelos propietarios de EEUU y también el de los llamativos modelos abiertos que están apareciendo en China&period; Conozcamos más de cerca qué pasó con ALIA&&num;8230&semi; y qué esperamos que pase&period;</p>&NewLine;<p><&excl;-- BREAK 3 --></p>&NewLine;<h2>Promesas y realidades</h2>&NewLine;<p>Aquel 20 de enero de 2025, Pedro Sánchez, presidente del Gobierno de España, <a class="text-outboundlink" href="https&colon;//www&period;xataka&period;com/robotica-e-ia/pedro-sanchez-anuncia-lanzamiento-primeros-modelos-alia-asi-ia-publica-abierta-que-impulsa-estado" data-vars-post-title='Pedro Sánchez anuncia el lanzamiento de los primeros modelos de ALIA&colon; así es la IA "pública y abierta” que impulsa el Estado' data-vars-post-url="https&colon;//www&period;xataka&period;com/robotica-e-ia/pedro-sanchez-anuncia-lanzamiento-primeros-modelos-alia-asi-ia-publica-abierta-que-impulsa-estado">anunciaba el lanzamiento de ALIA</a> y todo parecía sonar bien&period; <a href="https&colon;//www&period;xataka&period;com/robotica-e-ia/pedro-sanchez-anuncia-creacion-gran-modelo-lenguaje-inteligencia-artificial-entrenado-espanol&num;comments">Ya había avisado casi un año antes</a> de esta <a class="text-outboundlink" href="https&colon;//www&period;xataka&period;com/robotica-e-ia/espana-ha-aprobado-su-estrategia-inteligencia-artificial-2024-tiene-tres-ejes-enfoque-responsable" data-vars-post-title='España ha aprobado su Estrategia de Inteligencia Artificial 2024&period; Tiene tres ejes y un enfoque "responsable" ' data-vars-post-url="https&colon;//www&period;xataka&period;com/robotica-e-ia/espana-ha-aprobado-su-estrategia-inteligencia-artificial-2024-tiene-tres-ejes-enfoque-responsable">iniciativa</a>, aunque entonces apenas dio detalles&period; <a rel="noopener, noreferrer" href="https&colon;//planderecuperacion&period;gob&period;es/noticias/Pedro-Sanchez-clausura-acto-HispanI-como-inteligencia-artificial-mejorara-nuestro-futuro-ia-prtr">Se habló</a> de la familia de modelos de IA en castellano y lenguas cooficiales &&num;8220&semi;pensados para fomentar la investigación en este campo y desarrollar soluciones tecnológicas en castellano, el cuarto idioma más hablado del mundo y el segundo más usado en Internet&&num;8221&semi;&period; </p>&NewLine;<div class="article-asset article-asset-normal article-asset-center">&NewLine;<div class="desvio-container">&NewLine;<div class="desvio">&NewLine;<div class="desvio-figure js-desvio-figure">&NewLine; <a href="https&colon;//www&period;xataka&period;com/robotica-e-ia/ia-nacional-que-simplifique-tramites-burocraticos-excelente-idea-problema-espana-puede-implementarla" class="pivot-outboundlink" data-vars-post-title='Una IA "nacional" que simplifique los trámites burocráticos es una excelente idea&period; El problema es si España puede implementarla '><br />&NewLine; <img alt='Una IA "nacional" que simplifique los trámites burocráticos es una excelente idea&period; El problema es si España puede implementarla ' width="375" height="142" src="https&colon;//i&period;blogs&period;es/e2649a/alia/375&lowbar;142&period;jpeg"><br />&NewLine; </a>&NewLine; </div>&NewLine;<div class="desvio-summary">&NewLine;<div class="desvio-taxonomy js-desvio-taxonomy">&NewLine; <a href="https&colon;//www&period;xataka&period;com/robotica-e-ia/ia-nacional-que-simplifique-tramites-burocraticos-excelente-idea-problema-espana-puede-implementarla" class="desvio-taxonomy-anchor pivot-outboundlink" data-vars-post-title='Una IA "nacional" que simplifique los trámites burocráticos es una excelente idea&period; El problema es si España puede implementarla '>En Xataka</a>&NewLine; </div>&NewLine;<p> <a href="https&colon;//www&period;xataka&period;com/robotica-e-ia/ia-nacional-que-simplifique-tramites-burocraticos-excelente-idea-problema-espana-puede-implementarla" class="desvio-title js-desvio-title pivot-outboundlink" data-vars-post-title='Una IA "nacional" que simplifique los trámites burocráticos es una excelente idea&period; El problema es si España puede implementarla '>Una IA &&num;8220&semi;nacional&&num;8221&semi; que simplifique los trámites burocráticos es una excelente idea&period; El problema es si España puede implementarla </a>&NewLine; </div>&NewLine;</p></div>&NewLine;</p></div>&NewLine;</div>&NewLine;<p>Incluso se mencionó que ya estaban en marcha proyectos para aplicar ALIA en dos proyectos piloto para la Agencia Tributaria y para una aplicación en la medicina de atención primaria&period; En la web del BSC-CNS <a rel="noopener, noreferrer" href="https&colon;//www&period;bsc&period;es/es/noticias/noticias-del-bsc/alia-la-primera-infraestructura-p&percnt;C3&percnt;BAblica-abierta-y-multiling&percnt;C3&percnt;BCe-de-ia-en-europa">se aportaron</a> algunos detalles técnicos&colon; ALIA-40b era, según los responsables de dicho organismo&colon;</p>&NewLine;<p><&excl;-- BREAK 4 --></p>&NewLine;<p>&&num;8220&semi;El modelo fundacional multilingüe público más avanzado de Europa con 40&period;000 millones de parámetros, que ha sido entrenado durante más de 8 meses en el MareNostrum 5 con 6,9 billones de tokens (palabras o fragmentos de palabras usadas en estos sistemas) en 35 lenguas europeas&period; Su versión final estará entrenada con hasta 9,2 billones de tokens&&num;8221&semi;&period;</p>&NewLine;<p><&excl;-- BREAK 5 --></p>&NewLine;<p>La realidad <strong>era algo distinta</strong>&period; De hecho, ALIA-40b fue criticado entre quienes lo probaron&period; Las pruebas de rendimiento iniciales ya mostraron cómo el rendimiento era muy pobre y <a rel="noopener, noreferrer" href="https&colon;//x&period;com/javilop/status/1881648316456345661">comparable al de Llama-2-34b</a>, un modelo Open Source que se lanzó a mediados de 2023&period; </p>&NewLine;<p><&excl;-- BREAK 6 --></p>&NewLine;<div class="article-asset-image article-asset-normal article-asset-center">&NewLine;<div class="asset-content">&NewLine;<div class="caption-img ">&NewLine;<p> <img alt="Captura De Pantalla 2025 09 17 A Las 10 23 52" class="centro&lowbar;sinmarco" src="https&colon;//i&period;blogs&period;es/5ade6c/captura-de-pantalla-2025-09-17-a-las-10&period;23&period;52/450&lowbar;1000&period;jpeg"></p>&NewLine;<p> <span>En el estudio de la UPV se puede ver como ALIA-40b, Salamandra-2b y Salamandra-7b fueron de lejos los peores en las pruebas realizadas&period;</span>&NewLine; </div>&NewLine;</p></div>&NewLine;</div>&NewLine;<p>Un <a rel="noopener, noreferrer" href="https&colon;//www&period;sciencedirect&period;com/science/article/pii/S2590123025004475">estudio posterior</a> de investigadores de la Universidad de Valencia puso a prueba esa capacidad y sus conclusiones fueron claras&period; En exámenes de matemáticas tipo test puntuó peor que el resto de LLMs, e incluso puntuó peor que si hubiera tratado de adivinar las respuestas&period; </p>&NewLine;<p><&excl;-- BREAK 7 --></p>&NewLine;<p>El mensaje fue claro&colon; ALIA estaba muy por detrás de sus competidores&period; El modelo ni siquiera forma parte de grandes comparativas de rendimiento como las de <a rel="noopener, noreferrer" href="https&colon;//llm-stats&period;com/">LLM-Stats</a>, <a rel="noopener, noreferrer" href="https&colon;//artificialanalysis&period;ai/leaderboards/models">Artificial Analysis</a> y sobre todo <a rel="noopener, noreferrer" href="https&colon;//lmarena&period;ai/leaderboard">LMArena</a> que entre sus 176 modelos no incluye el modelo español&period;</p>&NewLine;<p><&excl;-- BREAK 8 --></p>&NewLine;<h2>Un lanzamiento prematuro</h2>&NewLine;<p>Hay una razón sencilla para ese comportamiento&colon; ALIA ni siquiera estaba preparado para esas pruebas, y no lo estaba porque se lanzó de forma prematura&period; Nos lo explica <strong>Aitor González-Agirre</strong>, uno de los responsables del desarrollo de ALIA en en BSC&period;</p>&NewLine;<div class="article-asset-image article-asset-small article-asset-left">&NewLine;<div class="asset-content">&NewLine;<p> <img alt="Aitor" class="izquierda&lowbar;sinmarco" src="https&colon;//i&period;blogs&period;es/1afb7e/aitor/450&lowbar;1000&period;png"></p></div>&NewLine;</div>&NewLine;<p>Él destaca que aquel lanzamiento &&num;8220&semi;no fue una decisión técnica&&num;8221&semi;&period; A la hora de entrenar ALIA el equipo se encontró con un problema clásico&colon; tuvieron que interrumpir un proceso diseñado para ser largo mucho antes de tiempo&period; </p>&NewLine;<p><&excl;-- BREAK 9 --></p>&NewLine;<p>En el entrenamiento de modelos de IA hay un concepto llamado tasa de aprendizaje que indica la &&num;8220&semi;velocidad&&num;8221&semi; a la que el modelo aprende&period; Al principio quieres una tasa alta para aprender &&num;8220&semi;rápido&&num;8221&semi; y absorber conceptos generales, pero al final quieres una tasa muy baja que permita pulir detalles finos y asentar ese conocimiento sin romper lo aprendido&period; </p>&NewLine;<p><&excl;-- BREAK 10 --></p>&NewLine;<p>Para realizar ese entrenamiento se utiliza un planificador (<em>scheduler</em>) que le dice a la máquina —en este caso, MareNostrum 5— cómo ir cambiando esa velocidad a lo largo del tiempo, y aquí se usó un scheduler basado en coseno&colon; empieza en un pico alto, baja suavemente al principio, pero luego baja más rápidamente en el medio para aterrizar muy suavamente al final&period; </p>&NewLine;<p><&excl;-- BREAK 11 --></p>&NewLine;<p>González-Agirre indica que con ALIA tenían la intención de entrenar &&num;8220&semi;con 12 billones de tokens (12T)&&num;8221&semi;, pero la realidad es que por decisiones estratégicas pero no técnicas tuvieron que parar&period; </p>&NewLine;<p><&excl;-- BREAK 12 --></p>&NewLine;<p>&&num;8220&semi;Sabíamos que no se iba a poder hacer&&num;8221&semi;, añade&period; Aunque tuvieron acceso a MareNostrum 5 para hacer pruebas iniciales, <strong>tuvieron que lanzar el modelo cuando solo llevaban 2,3 billones de tokens</strong>&period; El scheduler aun estaba en fase de velocidad alta, no había llegado a esa fase final de refinamiento, y básicamente el modelo no estaba básicamente &&num;8220&semi;crudo&&num;8221&semi;&period;</p>&NewLine;<p><&excl;-- BREAK 13 --></p>&NewLine;<div class="article-asset-image article-asset-normal article-asset-center">&NewLine;<div class="asset-content">&NewLine;<div class="caption-img ">&NewLine;<p> <img alt="Captura De Pantalla 2025 11 24 A Las 16 44 14" class="centro&lowbar;sinmarco" src="https&colon;//i&period;blogs&period;es/6644e5/captura-de-pantalla-2025-11-24-a-las-16&period;44&period;14/450&lowbar;1000&period;jpeg"></p>&NewLine;<p> <span>La descripción de ALIA-40b en Hugging Face muestra una advertencia clara del estado del modelo, que no cuenta aún con instrucciones ni alineamiento, y que por tanto puede generar salidas inapropiadas, incorrectas o incluso inseguras&period; Sigue siendo un modelo &&num;8220&semi;crudo&&num;8221&semi; en pleno desarrollo, y hay que tomarlo como tal&period;</span>&NewLine; </div>&NewLine;</p></div>&NewLine;</div>&NewLine;<p>Hubo un problema adicional, indica este experto&period; ALIA-40B &&num;8220&semi;se lanzó como modelo preentrenado&period; No tenía instrucciones ni alineamiento ni nada&period; El modelo no era un producto final, no era ese el objetivo&&num;8221&semi;&period; Para mucha gente ALIA-40b simplemente a esas alturas debía poder contestar a nuestras preguntas de forma más o menos coherente, pero no lo hacía, y ahí entran esas diferencias tan claras de esas &&num;8220&semi;capas&&num;8221&semi; del proceso de desarrollo de un modelo de IA&colon;</p>&NewLine;<p><&excl;-- BREAK 14 --></p>&NewLine;<ul>&NewLine;<li value="1"><strong>Modelo preentrenado (</strong><strong><em>pre-trained</em></strong><strong>, la base bruta)</strong>&colon; sabe predecir qué palabra viene después de otra, pero no sabe charlar ni obedecer&period; No es capaz de saber si le estás haciendo una pregunta, y solo intenta adivinar el texto que viene a continuación&period; Las respuestas, por tanto, pueden ser totalmente incoherentes con lo que nosotros pretendíamos preguntar&period; Es un modelo &&num;8220&semi;crudo&&num;8221&semi;, casi &&num;8220&semi;salvaje&&num;8221&semi;&period; </li>&NewLine;<li value="2"><strong>Instrucciones (</strong><strong><em>Instruction Tuning</em></strong><strong>)</strong>&colon; al modelo crudo se le entrena con ejemplos específicos de pregunta-respuesta y se le enseña al modelo a ejecutar ciertas acciones&period; Cuando al modelo preentrenado le dices &&num;8220&semi;La capital de Francia es&&num;8230&semi; &&num;8220&semi;él puede completar con &&num;8220&semi;&&num;8230&semi; una ciudad bonita&&num;8221&semi;&period; Pero el modelo con instrucciones (a menudo llevan el &&num;8220&semi;apellido&&num;8221&semi; Instruct en su nombre) le enseñas que debe responder &&num;8220&semi;&&num;8230&semi; París&&num;8221&semi;&period;</li>&NewLine;<li value="3"><strong>Alineamiento (</strong><strong><em>Alignment</em></strong>)&colon; en esta capa se le añade seguridad y estilo al modelo y a menudo se aplica aprendizaje por refuerzo por retroalimentación humana&period; Aquí el modelo aprende que no debe contestar ciertas preguntas (de ahí respuestas del tpo &&num;8220&semi;No puedo ayudarte con eso&&num;8221&semi; cuando pedimos a un modelo que nos ayude a crear una bomba), y también a no ser grosero o racista, por ejemplo&period;</li>&NewLine;</ul>&NewLine;<p>ALIA-40b ni siquiera había completado su fase inicial de entrenamiento cuando se presentó, y eso hizo que aquella versión inicial no estuviese preparada para salir a escena&colon; &&num;8220&semi;solo era un modelo que completaba texto&&num;8221&semi; pero simplemente lo hacía de formas que no eran las que esperábamos&period; Aquel desconocimiento de las condiciones en las que salió provocó cierta decepción, y a esa sensación se unió otro fenómeno&colon; <a class="text-outboundlink" href="https&colon;//www&period;xataka&period;com/robotica-e-ia/chatbot-deepseek-no-imparable-china-sus-descargas-han-caido-72-rival-empieza-a-ocupar-su-lugar" data-vars-post-title='DeepSeek causó un auténtico terremoto en la IA&period; Ahora está siendo víctima de su propio "momento DeepSeek" en China' data-vars-post-url="https&colon;//www&period;xataka&period;com/robotica-e-ia/chatbot-deepseek-no-imparable-china-sus-descargas-han-caido-72-rival-empieza-a-ocupar-su-lugar">el provocado por DeepSeek</a>&period;</p>&NewLine;<p><&excl;-- BREAK 15 --></p>&NewLine;<div class="article-asset article-asset-normal article-asset-center">&NewLine;<div class="desvio-container">&NewLine;<div class="desvio">&NewLine;<div class="desvio-figure js-desvio-figure">&NewLine; <a href="https&colon;//www&period;xataka&period;com/robotica-e-ia/espana-quiere-su-propio-hugging-face-publico-problema-que-llega-tarde-a-batalla-que-tiene-ganadores" class="pivot-outboundlink" data-vars-post-title="España quiere su Hugging Face&period; Llega justo cuando la fiesta ya casi ha terminado"><br />&NewLine; <img alt="España quiere su Hugging Face&period; Llega justo cuando la fiesta ya casi ha terminado" width="375" height="142" src="https&colon;//i&period;blogs&period;es/02858f/imagen/375&lowbar;142&period;jpeg"><br />&NewLine; </a>&NewLine; </div>&NewLine;<div class="desvio-summary">&NewLine;<div class="desvio-taxonomy js-desvio-taxonomy">&NewLine; <a href="https&colon;//www&period;xataka&period;com/robotica-e-ia/espana-quiere-su-propio-hugging-face-publico-problema-que-llega-tarde-a-batalla-que-tiene-ganadores" class="desvio-taxonomy-anchor pivot-outboundlink" data-vars-post-title="España quiere su Hugging Face&period; Llega justo cuando la fiesta ya casi ha terminado">En Xataka</a>&NewLine; </div>&NewLine;<p> <a href="https&colon;//www&period;xataka&period;com/robotica-e-ia/espana-quiere-su-propio-hugging-face-publico-problema-que-llega-tarde-a-batalla-que-tiene-ganadores" class="desvio-title js-desvio-title pivot-outboundlink" data-vars-post-title="España quiere su Hugging Face&period; Llega justo cuando la fiesta ya casi ha terminado">España quiere su Hugging Face&period; Llega justo cuando la fiesta ya casi ha terminado</a>&NewLine; </div>&NewLine;</p></div>&NewLine;</p></div>&NewLine;</div>&NewLine;<p>Meses después esa fase inicial sí está completada, y González-Agirre indica que el comportamiento actual del modelo es mucho mejor&period; Al compararlo con el modelo suizo Apertus-8b, y con variantes de Qwen y Llama-3 afirma que &&num;8220&semi;es el mejor de los modelos en euskera, y el segundo en catalán y gallego&&num;8221&semi;&period; De hecho la ventana de contexto del modelo actual se ha ampliado a 160K tokens (160&period;000), cuando inicialmente se le criticó mucho que fuera de tan solo 4K, pero como dice este ingeniero &&num;8220&semi;no se podía entrenar para más&&num;8221&semi; en aquel momento&period;</p>&NewLine;<p><&excl;-- BREAK 16 --></p>&NewLine;<h2>Un camino plagado de obstáculos</h2>&NewLine;<p>A partir de aquí el camino se allana un poco, y según este experto para final de año quieren &&num;8220&semi;tener un modelo que tenga instrucciones y que responda como nosotros queremos&&num;8221&semi;, pero aquí se enfrentan a obstáculos importantes&period;</p>&NewLine;<p><&excl;-- BREAK 17 --></p>&NewLine;<div class="article-asset-video article-asset-normal">&NewLine;<div class="asset-content">&NewLine;<div class="base-asset-video">&NewLine;<div class="js-dailymotion"></div>&NewLine;</p></div>&NewLine;</p></div>&NewLine;</div>&NewLine;<p>Probablemente uno de los más importantes está en el conjunto de datos al que pueden acceder para entrenar el modelo&period; Aquí González-Agirre explica la dicotomía&colon;</p>&NewLine;<p><&excl;-- BREAK 18 --></p>&NewLine;<blockquote><p>&&num;8220&semi;Hay muchas cosas que mejorar, pero también muchas restricciones de conjuntos de datos (datasets) que tenemos que respetar&period; <strong>Si eres una tecnológica con más abogados que Disney puedes hacer otras cosas</strong>, pero nosotros no usamos datos con copyright y tampoco usamos datos generados por Llama o GPT o por modelos que no permiten usar sus salidas&&num;8221&semi;&period;</p></blockquote>&NewLine;<p>De hecho, entre los conjuntos de datos utilizados para entrenar ALIA estaba <a rel="noopener, noreferrer" href="https&colon;//commoncrawl&period;org/">Common Crawl</a>, un repositorio en el que hay todo tipo de contenidos de internet que se usan sin pagar licencias&period; Fuentes citadas <a rel="noopener, noreferrer" href="https&colon;//elpais&period;com/tecnologia/2025-09-17/la-ia-espanola-se-entreno-con-obras-obtenidas-sin-el-permiso-de-sus-autores&period;html">en El País</a> indicaron recientemente que ese entrenamiento se amparó en la normativa vigente y &&num;8220&semi;en una serie de excepciones para hacer minería de datos&&num;8221&semi;&period; Los autores pueden prohibir que se usen sus obras, pero deben seguir &&num;8220&semi;un complejo proceso&&num;8221&semi; para evitarlo&period; </p>&NewLine;<p>En el desarrollo de ALIA tienen muy en cuenta esos requisitos y de hecho tienen que regenerar esos conjuntos de datos para evitar que se incumplan cualquiera de los términos especificados&period; </p>&NewLine;<p><&excl;-- BREAK 19 --></p>&NewLine;<p>El mundo ya ha asumido que los modelos de IA <a class="text-outboundlink" href="https&colon;//www&period;xataka&period;com/robotica-e-ia/precio-a-pagar-tener-ia-saqueo-todo-contenido-internet-perplexity-solo-ultimo-ejemplo" data-vars-post-title="El precio a pagar por tener IA es el saqueo de todo el contenido de Internet&period; Y Perplexity es solo el último ejemplo " data-vars-post-url="https&colon;//www&period;xataka&period;com/robotica-e-ia/precio-a-pagar-tener-ia-saqueo-todo-contenido-internet-perplexity-solo-ultimo-ejemplo">han saqueado internet para su entrenamiento</a>, y casi siempre <a class="text-outboundlink" href="https&colon;//www&period;xataka&period;com/legislacion-y-derechos/todas-grandes-ia-han-ignorado-leyes-copyright-alucinante-que-sigue-haber-consecuencias" data-vars-post-title="Todas las grandes IA han ignorado las leyes del copyright&period; Lo alucinante es que sigue sin haber consecuencias " data-vars-post-url="https&colon;//www&period;xataka&period;com/legislacion-y-derechos/todas-grandes-ia-han-ignorado-leyes-copyright-alucinante-que-sigue-haber-consecuencias">sin pedir permiso o sin pagar</a> por los contenidos con los que se han entrenado&period; Eso ha dado lugar a un sinfín de demandas, y también ha hecho que algunas empresas de IA lleguen a acuerdos extrajudiciales con los poseedores de esos derechos&period; Es lo que pasó hace unos meses con Anthropic, que <a rel="noopener, noreferrer" href="https&colon;//arstechnica&period;com/tech-policy/2025/09/first-of-its-kind-ai-settlement-anthropic-to-pay-authors-1-5-billion/">firmó uno de esos acuerdos</a> con un grupo de autores, a los que pagará unos 1&period;500 millones de dólares&period; Otras han seguido ese camino, pero no desde luego el desarrollo del BSC-CNS, que se enfrentó a otra dificultad&colon; la capacidad de cómputo disponible&period;</p>&NewLine;<p><&excl;-- BREAK 20 --></p>&NewLine;<div class="article-asset article-asset-normal article-asset-center">&NewLine;<div class="desvio-container">&NewLine;<div class="desvio">&NewLine;<div class="desvio-figure js-desvio-figure">&NewLine; <a href="https&colon;//www&period;xataka&period;com/empresas-y-economia/europa-tenemos-problema-estamos-siendo-japon-siglo-xxi" class="pivot-outboundlink" data-vars-post-title="En Europa tenemos un problema&colon; nos estamos convirtiendo en la Japón del siglo XXI"><br />&NewLine; <img alt="En Europa tenemos un problema&colon; nos estamos convirtiendo en la Japón del siglo XXI" width="375" height="142" src="https&colon;//i&period;blogs&period;es/bff7f3/europa-japon/375&lowbar;142&period;jpeg"><br />&NewLine; </a>&NewLine; </div>&NewLine;<div class="desvio-summary">&NewLine;<div class="desvio-taxonomy js-desvio-taxonomy">&NewLine; <a href="https&colon;//www&period;xataka&period;com/empresas-y-economia/europa-tenemos-problema-estamos-siendo-japon-siglo-xxi" class="desvio-taxonomy-anchor pivot-outboundlink" data-vars-post-title="En Europa tenemos un problema&colon; nos estamos convirtiendo en la Japón del siglo XXI">En Xataka</a>&NewLine; </div>&NewLine;<p> <a href="https&colon;//www&period;xataka&period;com/empresas-y-economia/europa-tenemos-problema-estamos-siendo-japon-siglo-xxi" class="desvio-title js-desvio-title pivot-outboundlink" data-vars-post-title="En Europa tenemos un problema&colon; nos estamos convirtiendo en la Japón del siglo XXI">En Europa tenemos un problema&colon; nos estamos convirtiendo en la Japón del siglo XXI</a>&NewLine; </div>&NewLine;</p></div>&NewLine;</p></div>&NewLine;</div>&NewLine;<p>Dicho acceso se ha ido reduciendo de forma notable con el tiempo&period; Marta Villegas, del equipo de desarrollo de ALIA, ya nos habló de ello <a class="text-outboundlink" href="https&colon;//www&period;xataka&period;com/robotica-e-ia/asi-alia-modelo-ia-espanola-que-puede-quiere-competir-chatgpt" data-vars-post-title='"El objetivo no es competir con ChatGPT"&colon; hablamos con los creadores de ALIA, la IA 100&percnt; española, para entender su futuro' data-vars-post-url="https&colon;//www&period;xataka&period;com/robotica-e-ia/asi-alia-modelo-ia-espanola-que-puede-quiere-competir-chatgpt">en nuestra entrevista en enero</a>&period; Aunque durante un breve espacio de tiempo tuvieron acceso a 512 de los 1&period;120 nodos especializados del supercomputador, se usaron 256 nodos durante bastantes meses y desde septiembre están usando 128 nodos, &&num;8220&semi;que son muchos&&num;8221&semi;&period;</p>&NewLine;<p><&excl;-- BREAK 21 --></p>&NewLine;<p>Esa cifra ahora se ha reducido a 16 nodos dedicados, lo que impide hacer pretraining&period; Aun así, explica, &&num;8220&semi;también es cierto que en estos momentos estamos trabajando en una parte menos intensiva&&num;8221&semi;, pero esa limitación inicial también hacía imposible compararse con otros gigantes&colon; &&num;8220&semi;Con ChatGPT hicieron centenares de versiones distintas y se quedaron con la buena&&num;8221&semi;, pero ALIA solo se pudo entrenar una vez&period;</p>&NewLine;<p><&excl;-- BREAK 22 --></p>&NewLine;<p>Hay otro problemón importante para que ALIA pueda avanzar, y es que como explica González-Agirre, <strong>&&num;8220&semi;no tenemos inferencia&&num;8221&semi;</strong>&period; Es decir, no hay una app o un sitio web o plataforma tipo chat&period;alia&period;es que permita probar el modelo de IA en directo, como ocurre con ChatGPT, Gemini, Claude o cualquiera de sus competidores, incluso de modelos (relativamente) abiertos <a rel="noopener, noreferrer" href="https&colon;//chat&period;mistral&period;ai/chat">como Mistral</a>&period;</p>&NewLine;<p><&excl;-- BREAK 23 --></p>&NewLine;<h2>&&num;8220&semi;Quien no tenga coche, que al menos pueda ir en autobús&&num;8221&semi;</h2>&NewLine;<p>Ese es otro obstáculo más porque, destaca nuestro protagonista, &&num;8220&semi;no tenemos datos de los prompts que está usando la gente, de cómo usa el modelo, de esos pulgares hacia arriba y hacia abajo&&num;8221&semi;&period;</p>&NewLine;<div class="article-asset-image article-asset-normal article-asset-center">&NewLine;<div class="asset-content">&NewLine;<div class="caption-img ">&NewLine; <a rel="noopener, noreferrer" href="https&colon;//huggingface&period;co/BSC-LT/models"></p>&NewLine;<p> <img alt="Captura De Pantalla 2025 11 26 A Las 16 38 56" class="centro&lowbar;sinmarco" src="https&colon;//i&period;blogs&period;es/399fdb/captura-de-pantalla-2025-11-26-a-las-16&period;38&period;56/450&lowbar;1000&period;jpeg"><br />&NewLine; </a></p>&NewLine;<p> <span>En Hugging Face se puede consultar cómo las actualizaciones son frecuentes en este proyecto&colon; aparecen nuevos modelos cada pocas semanas&&num;8230&semi; o días&period;</span>&NewLine; </div>&NewLine;</p></div>&NewLine;</div>&NewLine;<p>Esa infrmación le da muchas pistas a las grandes tecnológicas de si sus modelos están cumpliendo con las expectativas de los usuarios o no&period; Aquí añadía además algo importante&colon;</p>&NewLine;<p><&excl;-- BREAK 24 --></p>&NewLine;<blockquote><p>&&num;8220&semi;Hay opciones de tener inferencia y centros de datos&period; <a class="text-outboundlink" href="https&colon;//www&period;xataka&period;com/ordenadores/europa-iba-a-remolque-supercomputadores-ahora-tiene-dos-cinco-potentes-mundo" data-vars-post-title="Europa iba a remolque en supercomputadores&period; Ahora ya tiene dos de los cinco más potentes del mundo " data-vars-post-url="https&colon;//www&period;xataka&period;com/ordenadores/europa-iba-a-remolque-supercomputadores-ahora-tiene-dos-cinco-potentes-mundo">Están Jupiter, Leonardo o Lumi, por ejemplo</a>, pero falta voluntad política&period; Esto es una alternativa pública, la necesitamos y no podemos dejar algo así en manos privadas&&num;8221&semi;&period; </p></blockquote>&NewLine;<p>Para él que existan modelos comerciales y cerrados es normal y totalmente respetable, pero la analogía en su opinión es clara&period; Esto es como los coches privados y los autobuses&colon; <strong>&&num;8220&semi;quien no tenga coche, que al menos pueda ir en autobús&&num;8221&semi;</strong>&period; Esa es sin duda la razón de ser de un modelo que no pretende competir con ChatGPT o Gemini&period; González-Agirre señala que </p>&NewLine;<blockquote><p>&&num;8220&semi;Lo que pretendemos es que sea bueno en los idiomas cooficiales, que sea mejor que otros modelos, y lo siguiente es que esté alineado con nuestros valores y cultura&period; Que no sea un modelo de otro idioma hablando español&period; Que no pase como en los modelos chinos, <a class="text-outboundlink" href="https&colon;//www&period;xataka&period;com/robotica-e-ia/china-iba-a-zaga-ia-no-para-lanzar-modelos-cada-vez-avanzados-muy-socialistas" data-vars-post-title="China iba a la zaga en IA, pero no para de lanzar modelos cada vez más avanzados&period; Y muy socialistas" data-vars-post-url="https&colon;//www&period;xataka&period;com/robotica-e-ia/china-iba-a-zaga-ia-no-para-lanzar-modelos-cada-vez-avanzados-muy-socialistas">que no pueden contestar algunas cosas</a>&period; Que podamos defender que no tiene sesgos ni de género, ni de raza, ni de edad, y que haya trazabilidad y transparencia completa&&num;8221&semi;&period;</p></blockquote>&NewLine;<p>Y aquí también destaca que en su equipo y en España &&num;8220&semi;hay gente muy, muy buena, y que aprende mucho, pero me gustaría que esta gente tuviera recursos para quedarse aquí y contribuyese al tejido de España y Europa&&num;8221&semi;&period; </p>&NewLine;<div class="article-asset article-asset-normal article-asset-center">&NewLine;<div class="desvio-container">&NewLine;<div class="desvio">&NewLine;<div class="desvio-figure js-desvio-figure">&NewLine; <a href="https&colon;//www&period;xataka&period;com/legislacion-y-derechos/espana-no-absoluto-puntera-ia-tenemos-agencia-regulatoria-80-empleados-no-sabemos-muy-bien-que-van-a-regular" class="pivot-outboundlink" data-vars-post-title="España no es en absoluto puntera en IA, pero ya tenemos una agencia regulatoria con 80 empleados&period; No sabemos muy bien qué van a regular "><br />&NewLine; <img alt="España no es en absoluto puntera en IA, pero ya tenemos una agencia regulatoria con 80 empleados&period; No sabemos muy bien qué van a regular " width="375" height="142" src="https&colon;//i&period;blogs&period;es/7d0838/aesia3/375&lowbar;142&period;jpeg"><br />&NewLine; </a>&NewLine; </div>&NewLine;<div class="desvio-summary">&NewLine;<div class="desvio-taxonomy js-desvio-taxonomy">&NewLine; <a href="https&colon;//www&period;xataka&period;com/legislacion-y-derechos/espana-no-absoluto-puntera-ia-tenemos-agencia-regulatoria-80-empleados-no-sabemos-muy-bien-que-van-a-regular" class="desvio-taxonomy-anchor pivot-outboundlink" data-vars-post-title="España no es en absoluto puntera en IA, pero ya tenemos una agencia regulatoria con 80 empleados&period; No sabemos muy bien qué van a regular ">En Xataka</a>&NewLine; </div>&NewLine;<p> <a href="https&colon;//www&period;xataka&period;com/legislacion-y-derechos/espana-no-absoluto-puntera-ia-tenemos-agencia-regulatoria-80-empleados-no-sabemos-muy-bien-que-van-a-regular" class="desvio-title js-desvio-title pivot-outboundlink" data-vars-post-title="España no es en absoluto puntera en IA, pero ya tenemos una agencia regulatoria con 80 empleados&period; No sabemos muy bien qué van a regular ">España no es en absoluto puntera en IA, pero ya tenemos una agencia regulatoria con 80 empleados&period; No sabemos muy bien qué van a regular </a>&NewLine; </div>&NewLine;</p></div>&NewLine;</p></div>&NewLine;</div>&NewLine;<p>ALIA se enfrenta también a una competencia feroz por parte de los modelos (más o menos) abiertos que llegan de China, y aunque González-Agirre admite que &&num;8220&semi;tienen unos modelos muy buenos y eficientes, pero no tan baratos como ellos dicen&&num;8221&semi;, añade que &&num;8220&semi;prefiero usar un modelo soberano que sé cómo está hecho&&num;8221&semi;&period; En ALIA la transparencia es completa, y además hacen uso de una licencia Apache que precisamente defiende ese enfoque abierto&period; </p>&NewLine;<p><&excl;-- BREAK 25 --></p>&NewLine;<p>El futuro inmediato de estos modelos es prometedor&period; &&num;8220&semi;A finales de año tendremos versiones muy usables del modelo con un rendimiento parecido a modelos de su tamaño&&num;8221&semi;, pero tendrán que trabajar también con su equipo Red Team —que intenta hacer &&num;8220&semi;jailbreak&&num;8221&semi; de ALIA para evitar que genere cosas que no debe&period; </p>&NewLine;<p><&excl;-- BREAK 26 --></p>&NewLine;<div class="article-asset-video article-asset-normal">&NewLine;<div class="asset-content">&NewLine;<div class="base-asset-video">&NewLine;<div class="js-dailymotion"></div>&NewLine;</p></div>&NewLine;</p></div>&NewLine;</div>&NewLine;<p>A partir de ahí, el objetivo es el de lograr versiones de ALIA que tengan capacidades de razonamiento, agénticas y que también sea capaz de realizar llamadas a herramientas, como algunos de sus competidores comerciales&period; El camino será probablemente mucho más difícil que el de las grandes empresas que no paran de lanzar novedades <strong>sin pedir ni permiso ni perdón</strong>, pero el resultado, esperemos, valdrá la pena&period;</p>&NewLine;<p><&excl;-- BREAK 27 --></p>&NewLine;<p>En Xataka | <a class="text-outboundlink" href="https&colon;//www&period;xataka&period;com/robotica-e-ia/espana-e-ibm-se-alian-para-crear-chatbots-que-hablen-gallego-euskera-catalan-hay-monton-incognitas" data-vars-post-title="España ha firmado un acuerdo con IBM para chatbots de IA en euskera, gallego y catalán&period; El problema es que ya existen" data-vars-post-url="https&colon;//www&period;xataka&period;com/robotica-e-ia/espana-e-ibm-se-alian-para-crear-chatbots-que-hablen-gallego-euskera-catalan-hay-monton-incognitas">España ha firmado un acuerdo con IBM para chatbots de IA en euskera, gallego y catalán&period; El problema es que ya existen</a></p>&NewLine;<p> &&num;8211&semi; <br /> La noticia<br />&NewLine; <a href="https&colon;//www&period;xataka&period;com/robotica-e-ia/arranque-alia-modelo-ia-espanol-ha-sido-erratico-decepcionante-ahora-sabemos-que&quest;utm&lowbar;source=feedburner&amp&semi;utm&lowbar;medium=feed&amp&semi;utm&lowbar;campaign=28&lowbar;Dec&lowbar;2025"><br />&NewLine; <em> El arranque de ALIA, el modelo de IA español, ha sido errático y decepcionante&period; Ahora sabemos por qué </em><br />&NewLine; </a><br />&NewLine; fue publicada originalmente en<br />&NewLine; <a href="https&colon;//www&period;xataka&period;com/&quest;utm&lowbar;source=feedburner&amp&semi;utm&lowbar;medium=feed&amp&semi;utm&lowbar;campaign=28&lowbar;Dec&lowbar;2025"><br />&NewLine; <strong> Xataka </strong><br />&NewLine; </a><br />&NewLine; por <a href="https&colon;//www&period;xataka&period;com/autor/javier-pastor&quest;utm&lowbar;source=feedburner&amp&semi;utm&lowbar;medium=feed&amp&semi;utm&lowbar;campaign=28&lowbar;Dec&lowbar;2025"><br />&NewLine; Javier Pastor<br />&NewLine; </a><br />&NewLine; &period; </p>&NewLine;<p>&ZeroWidthSpace;Empecemos por lo importante&period; ALIA, el modelo de IA español, no tenía que haberse lanzado cuando se lanzó&period; </p>&NewLine;<p>En Xataka hemos hablado con uno de los principales responsables de su desarrollo y eso nos ha permitido conocer y entender mucho mejor su alcance y sus objetivos, pero también por qué la (inevitable) comparación con ChatGPT no solo es injusta&colon; es inapropiada&period;</p>&NewLine;<p>ALIA-40b es un modelo fundacional de IA, esto es, un modelo de inteligencia artificial de gran escala entrenado con una cantidad masiva y diversa de datos, y que sirve como base para multitud de aplicaciones distintas&period; Este proyecto está coordinado por el Barcelona Supercomputing Center (BSC-CNS), y aunque se ha podido beneficiar de la infraestructura del supercomputador MareNostrum 5, incluso esa ventaja ha sido limitada&period; </p>&NewLine;<p> En Xataka</p>&NewLine;<p> &&num;8220&semi;El objetivo no es competir con ChatGPT&&num;8221&semi;&colon; hablamos con los creadores de ALIA, la IA 100&percnt; española, para entender su futuro</p>&NewLine;<p>Como decimos, comparar el rendimiento de ALIA-40b con el de modelos como GPT-5 o Gemini 3 es inapropiado, y para entenderlo todo mejor hay que entender de dónde parte el proyecto, qué objetivos tiene y cómo su desarrollo es mucho más modesto —y aun así prometedor— que el de los grandes modelos propietarios de EEUU y también el de los llamativos modelos abiertos que están apareciendo en China&period; Conozcamos más de cerca qué pasó con ALIA&&num;8230&semi; y qué esperamos que pase&period;</p>&NewLine;<p>Promesas y realidadesAquel 20 de enero de 2025, Pedro Sánchez, presidente del Gobierno de España, anunciaba el lanzamiento de ALIA y todo parecía sonar bien&period; Ya había avisado casi un año antes de esta iniciativa, aunque entonces apenas dio detalles&period; Se habló de la familia de modelos de IA en castellano y lenguas cooficiales &&num;8220&semi;pensados para fomentar la investigación en este campo y desarrollar soluciones tecnológicas en castellano, el cuarto idioma más hablado del mundo y el segundo más usado en Internet&&num;8221&semi;&period; </p>&NewLine;<p> En Xataka</p>&NewLine;<p> Una IA &&num;8220&semi;nacional&&num;8221&semi; que simplifique los trámites burocráticos es una excelente idea&period; El problema es si España puede implementarla </p>&NewLine;<p>Incluso se mencionó que ya estaban en marcha proyectos para aplicar ALIA en dos proyectos piloto para la Agencia Tributaria y para una aplicación en la medicina de atención primaria&period; En la web del BSC-CNS se aportaron algunos detalles técnicos&colon; ALIA-40b era, según los responsables de dicho organismo&colon;</p>&NewLine;<p>&&num;8220&semi;El modelo fundacional multilingüe público más avanzado de Europa con 40&period;000 millones de parámetros, que ha sido entrenado durante más de 8 meses en el MareNostrum 5 con 6,9 billones de tokens (palabras o fragmentos de palabras usadas en estos sistemas) en 35 lenguas europeas&period; Su versión final estará entrenada con hasta 9,2 billones de tokens&&num;8221&semi;&period;</p>&NewLine;<p>La realidad era algo distinta&period; De hecho, ALIA-40b fue criticado entre quienes lo probaron&period; Las pruebas de rendimiento iniciales ya mostraron cómo el rendimiento era muy pobre y comparable al de Llama-2-34b, un modelo Open Source que se lanzó a mediados de 2023&period; </p>&NewLine;<p> En el estudio de la UPV se puede ver como ALIA-40b, Salamandra-2b y Salamandra-7b fueron de lejos los peores en las pruebas realizadas&period;</p>&NewLine;<p>Un estudio posterior de investigadores de la Universidad de Valencia puso a prueba esa capacidad y sus conclusiones fueron claras&period; En exámenes de matemáticas tipo test puntuó peor que el resto de LLMs, e incluso puntuó peor que si hubiera tratado de adivinar las respuestas&period; </p>&NewLine;<p>El mensaje fue claro&colon; ALIA estaba muy por detrás de sus competidores&period; El modelo ni siquiera forma parte de grandes comparativas de rendimiento como las de LLM-Stats, Artificial Analysis y sobre todo LMArena que entre sus 176 modelos no incluye el modelo español&period;</p>&NewLine;<p>Un lanzamiento prematuroHay una razón sencilla para ese comportamiento&colon; ALIA ni siquiera estaba preparado para esas pruebas, y no lo estaba porque se lanzó de forma prematura&period; Nos lo explica Aitor González-Agirre, uno de los responsables del desarrollo de ALIA en en BSC&period;</p>&NewLine;<p>Él destaca que aquel lanzamiento &&num;8220&semi;no fue una decisión técnica&&num;8221&semi;&period; A la hora de entrenar ALIA el equipo se encontró con un problema clásico&colon; tuvieron que interrumpir un proceso diseñado para ser largo mucho antes de tiempo&period; </p>&NewLine;<p>En el entrenamiento de modelos de IA hay un concepto llamado tasa de aprendizaje que indica la &&num;8220&semi;velocidad&&num;8221&semi; a la que el modelo aprende&period; Al principio quieres una tasa alta para aprender &&num;8220&semi;rápido&&num;8221&semi; y absorber conceptos generales, pero al final quieres una tasa muy baja que permita pulir detalles finos y asentar ese conocimiento sin romper lo aprendido&period; </p>&NewLine;<p>Para realizar ese entrenamiento se utiliza un planificador (scheduler) que le dice a la máquina —en este caso, MareNostrum 5— cómo ir cambiando esa velocidad a lo largo del tiempo, y aquí se usó un scheduler basado en coseno&colon; empieza en un pico alto, baja suavemente al principio, pero luego baja más rápidamente en el medio para aterrizar muy suavamente al final&period; </p>&NewLine;<p>González-Agirre indica que con ALIA tenían la intención de entrenar &&num;8220&semi;con 12 billones de tokens (12T)&&num;8221&semi;, pero la realidad es que por decisiones estratégicas pero no técnicas tuvieron que parar&period; </p>&NewLine;<p>&&num;8220&semi;Sabíamos que no se iba a poder hacer&&num;8221&semi;, añade&period; Aunque tuvieron acceso a MareNostrum 5 para hacer pruebas iniciales, tuvieron que lanzar el modelo cuando solo llevaban 2,3 billones de tokens&period; El scheduler aun estaba en fase de velocidad alta, no había llegado a esa fase final de refinamiento, y básicamente el modelo no estaba básicamente &&num;8220&semi;crudo&&num;8221&semi;&period;</p>&NewLine;<p> La descripción de ALIA-40b en Hugging Face muestra una advertencia clara del estado del modelo, que no cuenta aún con instrucciones ni alineamiento, y que por tanto puede generar salidas inapropiadas, incorrectas o incluso inseguras&period; Sigue siendo un modelo &&num;8220&semi;crudo&&num;8221&semi; en pleno desarrollo, y hay que tomarlo como tal&period;</p>&NewLine;<p>Hubo un problema adicional, indica este experto&period; ALIA-40B &&num;8220&semi;se lanzó como modelo preentrenado&period; No tenía instrucciones ni alineamiento ni nada&period; El modelo no era un producto final, no era ese el objetivo&&num;8221&semi;&period; Para mucha gente ALIA-40b simplemente a esas alturas debía poder contestar a nuestras preguntas de forma más o menos coherente, pero no lo hacía, y ahí entran esas diferencias tan claras de esas &&num;8220&semi;capas&&num;8221&semi; del proceso de desarrollo de un modelo de IA&colon;<br />&NewLine;Modelo preentrenado (pre-trained, la base bruta)&colon; sabe predecir qué palabra viene después de otra, pero no sabe charlar ni obedecer&period; No es capaz de saber si le estás haciendo una pregunta, y solo intenta adivinar el texto que viene a continuación&period; Las respuestas, por tanto, pueden ser totalmente incoherentes con lo que nosotros pretendíamos preguntar&period; Es un modelo &&num;8220&semi;crudo&&num;8221&semi;, casi &&num;8220&semi;salvaje&&num;8221&semi;&period; Instrucciones (Instruction Tuning)&colon; al modelo crudo se le entrena con ejemplos específicos de pregunta-respuesta y se le enseña al modelo a ejecutar ciertas acciones&period; Cuando al modelo preentrenado le dices &&num;8220&semi;La capital de Francia es&&num;8230&semi; &&num;8220&semi;él puede completar con &&num;8220&semi;&&num;8230&semi; una ciudad bonita&&num;8221&semi;&period; Pero el modelo con instrucciones (a menudo llevan el &&num;8220&semi;apellido&&num;8221&semi; Instruct en su nombre) le enseñas que debe responder &&num;8220&semi;&&num;8230&semi; París&&num;8221&semi;&period;Alineamiento (Alignment)&colon; en esta capa se le añade seguridad y estilo al modelo y a menudo se aplica aprendizaje por refuerzo por retroalimentación humana&period; Aquí el modelo aprende que no debe contestar ciertas preguntas (de ahí respuestas del tpo &&num;8220&semi;No puedo ayudarte con eso&&num;8221&semi; cuando pedimos a un modelo que nos ayude a crear una bomba), y también a no ser grosero o racista, por ejemplo&period;<br />&NewLine;ALIA-40b ni siquiera había completado su fase inicial de entrenamiento cuando se presentó, y eso hizo que aquella versión inicial no estuviese preparada para salir a escena&colon; &&num;8220&semi;solo era un modelo que completaba texto&&num;8221&semi; pero simplemente lo hacía de formas que no eran las que esperábamos&period; Aquel desconocimiento de las condiciones en las que salió provocó cierta decepción, y a esa sensación se unió otro fenómeno&colon; el provocado por DeepSeek&period;</p>&NewLine;<p> En Xataka</p>&NewLine;<p> España quiere su Hugging Face&period; Llega justo cuando la fiesta ya casi ha terminado</p>&NewLine;<p>Meses después esa fase inicial sí está completada, y González-Agirre indica que el comportamiento actual del modelo es mucho mejor&period; Al compararlo con el modelo suizo Apertus-8b, y con variantes de Qwen y Llama-3 afirma que &&num;8220&semi;es el mejor de los modelos en euskera, y el segundo en catalán y gallego&&num;8221&semi;&period; De hecho la ventana de contexto del modelo actual se ha ampliado a 160K tokens (160&period;000), cuando inicialmente se le criticó mucho que fuera de tan solo 4K, pero como dice este ingeniero &&num;8220&semi;no se podía entrenar para más&&num;8221&semi; en aquel momento&period;<br />&NewLine;Un camino plagado de obstáculos<br />&NewLine;A partir de aquí el camino se allana un poco, y según este experto para final de año quieren &&num;8220&semi;tener un modelo que tenga instrucciones y que responda como nosotros queremos&&num;8221&semi;, pero aquí se enfrentan a obstáculos importantes&period;</p>&NewLine;<p>Probablemente uno de los más importantes está en el conjunto de datos al que pueden acceder para entrenar el modelo&period; Aquí González-Agirre explica la dicotomía&colon;</p>&NewLine;<p>&&num;8220&semi;Hay muchas cosas que mejorar, pero también muchas restricciones de conjuntos de datos (datasets) que tenemos que respetar&period; Si eres una tecnológica con más abogados que Disney puedes hacer otras cosas, pero nosotros no usamos datos con copyright y tampoco usamos datos generados por Llama o GPT o por modelos que no permiten usar sus salidas&&num;8221&semi;&period;De hecho, entre los conjuntos de datos utilizados para entrenar ALIA estaba Common Crawl, un repositorio en el que hay todo tipo de contenidos de internet que se usan sin pagar licencias&period; Fuentes citadas en El País indicaron recientemente que ese entrenamiento se amparó en la normativa vigente y &&num;8220&semi;en una serie de excepciones para hacer minería de datos&&num;8221&semi;&period; Los autores pueden prohibir que se usen sus obras, pero deben seguir &&num;8220&semi;un complejo proceso&&num;8221&semi; para evitarlo&period; </p>&NewLine;<p>En el desarrollo de ALIA tienen muy en cuenta esos requisitos y de hecho tienen que regenerar esos conjuntos de datos para evitar que se incumplan cualquiera de los términos especificados&period; </p>&NewLine;<p>El mundo ya ha asumido que los modelos de IA han saqueado internet para su entrenamiento, y casi siempre sin pedir permiso o sin pagar por los contenidos con los que se han entrenado&period; Eso ha dado lugar a un sinfín de demandas, y también ha hecho que algunas empresas de IA lleguen a acuerdos extrajudiciales con los poseedores de esos derechos&period; Es lo que pasó hace unos meses con Anthropic, que firmó uno de esos acuerdos con un grupo de autores, a los que pagará unos 1&period;500 millones de dólares&period; Otras han seguido ese camino, pero no desde luego el desarrollo del BSC-CNS, que se enfrentó a otra dificultad&colon; la capacidad de cómputo disponible&period;</p>&NewLine;<p> En Xataka</p>&NewLine;<p> En Europa tenemos un problema&colon; nos estamos convirtiendo en la Japón del siglo XXI</p>&NewLine;<p>Dicho acceso se ha ido reduciendo de forma notable con el tiempo&period; Marta Villegas, del equipo de desarrollo de ALIA, ya nos habló de ello en nuestra entrevista en enero&period; Aunque durante un breve espacio de tiempo tuvieron acceso a 512 de los 1&period;120 nodos especializados del supercomputador, se usaron 256 nodos durante bastantes meses y desde septiembre están usando 128 nodos, &&num;8220&semi;que son muchos&&num;8221&semi;&period;</p>&NewLine;<p>Esa cifra ahora se ha reducido a 16 nodos dedicados, lo que impide hacer pretraining&period; Aun así, explica, &&num;8220&semi;también es cierto que en estos momentos estamos trabajando en una parte menos intensiva&&num;8221&semi;, pero esa limitación inicial también hacía imposible compararse con otros gigantes&colon; &&num;8220&semi;Con ChatGPT hicieron centenares de versiones distintas y se quedaron con la buena&&num;8221&semi;, pero ALIA solo se pudo entrenar una vez&period;</p>&NewLine;<p>Hay otro problemón importante para que ALIA pueda avanzar, y es que como explica González-Agirre, &&num;8220&semi;no tenemos inferencia&&num;8221&semi;&period; Es decir, no hay una app o un sitio web o plataforma tipo chat&period;alia&period;es que permita probar el modelo de IA en directo, como ocurre con ChatGPT, Gemini, Claude o cualquiera de sus competidores, incluso de modelos (relativamente) abiertos como Mistral&period;</p>&NewLine;<p>&&num;8220&semi;Quien no tenga coche, que al menos pueda ir en autobús&&num;8221&semi;Ese es otro obstáculo más porque, destaca nuestro protagonista, &&num;8220&semi;no tenemos datos de los prompts que está usando la gente, de cómo usa el modelo, de esos pulgares hacia arriba y hacia abajo&&num;8221&semi;&period;</p>&NewLine;<p> En Hugging Face se puede consultar cómo las actualizaciones son frecuentes en este proyecto&colon; aparecen nuevos modelos cada pocas semanas&&num;8230&semi; o días&period;</p>&NewLine;<p>Esa infrmación le da muchas pistas a las grandes tecnológicas de si sus modelos están cumpliendo con las expectativas de los usuarios o no&period; Aquí añadía además algo importante&colon;</p>&NewLine;<p>&&num;8220&semi;Hay opciones de tener inferencia y centros de datos&period; Están Jupiter, Leonardo o Lumi, por ejemplo, pero falta voluntad política&period; Esto es una alternativa pública, la necesitamos y no podemos dejar algo así en manos privadas&&num;8221&semi;&period; Para él que existan modelos comerciales y cerrados es normal y totalmente respetable, pero la analogía en su opinión es clara&period; Esto es como los coches privados y los autobuses&colon; &&num;8220&semi;quien no tenga coche, que al menos pueda ir en autobús&&num;8221&semi;&period; Esa es sin duda la razón de ser de un modelo que no pretende competir con ChatGPT o Gemini&period; González-Agirre señala que </p>&NewLine;<p>&&num;8220&semi;Lo que pretendemos es que sea bueno en los idiomas cooficiales, que sea mejor que otros modelos, y lo siguiente es que esté alineado con nuestros valores y cultura&period; Que no sea un modelo de otro idioma hablando español&period; Que no pase como en los modelos chinos, que no pueden contestar algunas cosas&period; Que podamos defender que no tiene sesgos ni de género, ni de raza, ni de edad, y que haya trazabilidad y transparencia completa&&num;8221&semi;&period;Y aquí también destaca que en su equipo y en España &&num;8220&semi;hay gente muy, muy buena, y que aprende mucho, pero me gustaría que esta gente tuviera recursos para quedarse aquí y contribuyese al tejido de España y Europa&&num;8221&semi;&period; </p>&NewLine;<p> En Xataka</p>&NewLine;<p> España no es en absoluto puntera en IA, pero ya tenemos una agencia regulatoria con 80 empleados&period; No sabemos muy bien qué van a regular </p>&NewLine;<p>ALIA se enfrenta también a una competencia feroz por parte de los modelos (más o menos) abiertos que llegan de China, y aunque González-Agirre admite que &&num;8220&semi;tienen unos modelos muy buenos y eficientes, pero no tan baratos como ellos dicen&&num;8221&semi;, añade que &&num;8220&semi;prefiero usar un modelo soberano que sé cómo está hecho&&num;8221&semi;&period; En ALIA la transparencia es completa, y además hacen uso de una licencia Apache que precisamente defiende ese enfoque abierto&period; </p>&NewLine;<p>El futuro inmediato de estos modelos es prometedor&period; &&num;8220&semi;A finales de año tendremos versiones muy usables del modelo con un rendimiento parecido a modelos de su tamaño&&num;8221&semi;, pero tendrán que trabajar también con su equipo Red Team —que intenta hacer &&num;8220&semi;jailbreak&&num;8221&semi; de ALIA para evitar que genere cosas que no debe&period; </p>&NewLine;<p>A partir de ahí, el objetivo es el de lograr versiones de ALIA que tengan capacidades de razonamiento, agénticas y que también sea capaz de realizar llamadas a herramientas, como algunos de sus competidores comerciales&period; El camino será probablemente mucho más difícil que el de las grandes empresas que no paran de lanzar novedades sin pedir ni permiso ni perdón, pero el resultado, esperemos, valdrá la pena&period;<br />&NewLine;En Xataka | España ha firmado un acuerdo con IBM para chatbots de IA en euskera, gallego y catalán&period; El problema es que ya existen</p>&NewLine;<p> &&num;8211&semi; La noticia</p>&NewLine;<p> El arranque de ALIA, el modelo de IA español, ha sido errático y decepcionante&period; Ahora sabemos por qué </p>&NewLine;<p> fue publicada originalmente en</p>&NewLine;<p> Xataka </p>&NewLine;<p> por<br />&NewLine; Javier Pastor</p>&NewLine;<p> &period; </p>&NewLine;<p>&ZeroWidthSpace; </p>&NewLine;<p>&ZeroWidthSpace; </p>&NewLine;

ERM Digital

Ciencia y Tecnología

El arranque de ALIA, el modelo de IA español, ha sido errático y decepcionante. Ahora sabemos por qué

Leave a Reply

Leave a Reply

Noticias Importantes

Leave a Reply Cancel reply

Leave a Reply

Noticias Importantes

Leave a Reply