Ciencia y Tecnología

Google ha logrado que la IA consuma hasta seis veces menos memoria. Micron, Samsung y SK Hynix lo están pagando muy caro

Published

6 horas ago

30 de marzo de 2026

user

&NewLine; <img src="https&colon;//i&period;blogs&period;es/66f0b7/memorias/1024&lowbar;2000&period;jpeg" alt="Google ha logrado que la IA consuma hasta seis veces menos memoria&period; Micron, Samsung y SK Hynix lo están pagando muy caro">&NewLine; &NewLine;Llevamos <a class="text-outboundlink" href="https&colon;//www&period;xataka&period;com/moviles/crisis-ram-esta-a-punto-acabar-smartphone-barato-ia-ha-secuestrado-chips-que-hacian-posible" data-vars-post-title='"No es un apretón temporal, es un tsunami"&colon; estamos viendo en vivo y en directo cómo desaparece el smartphone barato' data-vars-post-url="https&colon;//www&period;xataka&period;com/moviles/crisis-ram-esta-a-punto-acabar-smartphone-barato-ia-ha-secuestrado-chips-que-hacian-posible">meses</a> envueltos en la <a class="text-outboundlink" href="https&colon;//www&period;xataka&period;com/componentes/que-precio-ram-este-nubes-tiene-ganador-samsung-ha-triplicado-sus-beneficios" data-vars-post-title="El disparatado precio de las memorias RAM son malas noticias para todo el mundo&period; Excepto para Samsung" data-vars-post-url="https&colon;//www&period;xataka&period;com/componentes/que-precio-ram-este-nubes-tiene-ganador-samsung-ha-triplicado-sus-beneficios">crisis de la memoria</a>, pero quizás haya una salida&period; La semana pasada Google Research <a rel="noopener, noreferrer" href="https&colon;//research&period;google/blog/turboquant-redefining-ai-efficiency-with-extreme-compression/&quest;utm&lowbar;source=twitter&amp&semi;utm&lowbar;medium=social&amp&semi;utm&lowbar;campaign=social&lowbar;post&amp&semi;utm&lowbar;content=gr-acct">publicó un estudio</a> en el que desvelaba una técnica llamada TurboQuant&period; Se trata de un algoritmo de compresión capaz de comprimir la memoria de trabajo de los modelos de IA hasta seis veces sin pérdida apreciable de calidad o rendimiento&period; Fantásticas noticias para los usuarios finales, que ven una luz al final del túnel, pero terribles para los fabricantes, a los que <a class="text-outboundlink" href="https&colon;//www&period;xataka&period;com/empresas-y-economia/micron-sabia-que-crisis-memoria-ram-le-iba-a-venir-fenomenal-realidad-le-ha-ido-mejor" data-vars-post-title="En la crisis global de la RAM, Micron está descubriendo algo&colon; cuanto peor para todos, mejor para sus cuentas" data-vars-post-url="https&colon;//www&period;xataka&period;com/empresas-y-economia/micron-sabia-que-crisis-memoria-ram-le-iba-a-venir-fenomenal-realidad-le-ha-ido-mejor">se les puede acabar esta época dorada</a>&period;&NewLine;<&excl;-- BREAK 1 -->&NewLine;Expliquemos qué es eso del KV cache&period; Para entender TurboQuant hay que entender qué es esa memoria que logra comprimir&period; Cuando un modelo de lenguaje <a class="text-outboundlink" href="https&colon;//www&period;xataka&period;com/robotica-e-ia/he-probado-nuevos-modelos-openai-ha-sido-pequena-odisea-premio-tengo-chatgpt-local" data-vars-post-title="He probado los nuevos modelos de OpenAI&period; Ha sido una pequeña odisea con premio&colon; tengo un ChatGPT en local" data-vars-post-url="https&colon;//www&period;xataka&period;com/robotica-e-ia/he-probado-nuevos-modelos-openai-ha-sido-pequena-odisea-premio-tengo-chatgpt-local">procesa una conversación larga</a>, necesita recordar el contexto&period; Cada token que se procesa queda almacenado en la llamada KV cache, una especie de memoria de trabajo que crece a medida que conversamos&period; Cuanto más larga es la conversación, más memoria necesita el modelo&period; &NewLine;<&excl;-- BREAK 2 -->&NewLine;Comprimiendo que es gerundio&period; Es uno de los principales cuellos de botella en la etapa de inferencia de IA (es decir, cuando usamos los modelos), y un de los motivos por los que los centros de datos <a class="text-outboundlink" href="https&colon;//www&period;xataka&period;com/componentes/plena-crisis-memoria-ram-samsung-da-salto-su-memoria-hbm4-no-buenas-noticias-para-bolsillo" data-vars-post-title="En plena crisis de la memoria RAM, Samsung da un salto con su memoria HBM4&period; No implica buenas noticias para el bolsillo" data-vars-post-url="https&colon;//www&period;xataka&period;com/componentes/plena-crisis-memoria-ram-samsung-da-salto-su-memoria-hbm4-no-buenas-noticias-para-bolsillo">necesitan tanta memoria RAM o HBM</a>&period; TurboQuant hace uso de un método de cuantización vectorial a esa caché para lograr comprimirla manteniendo la precisión del modelo&period;&NewLine;<&excl;-- BREAK 3 -->&NewLine;<div class="article-asset-image article-asset-small article-asset-center">&NewLine;<div class="asset-content">&NewLine; <a rel="noopener, noreferrer" href="https&colon;//x&period;com/whyshivang/status/2036874449354711249">&NewLine; <img alt="Captura De Pantalla 2026 03 30 A Las 8 50 54" class="centro&lowbar;sinmarco" src="https&colon;//i&period;blogs&period;es/6c811d/captura-de-pantalla-2026-03-30-a-las-8&period;50&period;54/450&lowbar;1000&period;jpeg"> &NewLine; </a></div>&NewLine;</div>&NewLine;Pied Piper&period; Nada más aparecer este estudio de Google comenzaron las analogías <a class="text-outboundlink" href="https&colon;//www&period;xataka&period;com/cine-y-tv/lo-mejor-de-silicon-valley-es-que-las-fases-de-una-startup-se-parecen-a-lo-que-cuentan-lo-peor-tambien-es-eso" data-vars-post-title="Lo mejor de 'Silicon Valley' es que las fases de una startup se parecen a lo que cuentan&period; Lo peor también es eso" data-vars-post-url="https&colon;//www&period;xataka&period;com/cine-y-tv/lo-mejor-de-silicon-valley-es-que-las-fases-de-una-startup-se-parecen-a-lo-que-cuentan-lo-peor-tambien-es-eso">con la trama de la serie 'Silicon Valley'</a>&period; En ella la startup ficticia de la trama lograba desarrollar un algoritmo de compresión llamado Pied Piper extraordinariamente eficiente que amenazaba con revolucionar la industria tecnológica&period; Estos días en las redes sociales aparecieron múltiples referencias a la serie, que ya había sido referenciada como visionaria por reflejar lo que está pasando con una exactitud espectacular aun cuando la serie era una comedia&period; &NewLine;<&excl;-- BREAK 4 -->&NewLine;Seis veces menos memoria&period; El paper de Google Research afirma que este método es capaz de reducir la KV cache seis veces sin diferencia apreciable en el rendimiento en conversaciones largas&period; Los investigadores presentarán sus resultados en un evento el mes que viene y explicarán los dos métodos que permiten ponerla en práctica&period; Si confirman lo que ya han adelantado, las implicaciones son enormes&colon; menos memoria para inferencia significa que los centros de datos pueden hacer lo mismo con mucho menos hardware/memoria&period;&NewLine;<div class="article-asset-video article-asset-normal">&NewLine;<div class="asset-content">&NewLine;<div class="base-asset-video">&NewLine;<div class="js-dailymotion"></div>&NewLine;</div>&NewLine;</div>&NewLine;</div>&NewLine;El momento DeepSeek de Google&period; El descubrimiento ha hecho que algunos analistas califiquen esto como el "momento DeepSeek" de Google&period; Hace un año la startup china DeepSeek lanzó un modelo de IA que competía con los mejores pero que había costado mucho menos desarrollar&period; Eso sacudió la industria, y ahora volvemos a un logro técnico que apunta a lo mismo&period; En IA hacer lo mismo con menos es crucial, dado los ingentes recursos que necesita esta tecnología&period; <a rel="noopener, noreferrer" href="https&colon;//www&period;reddit&period;com/r/LocalLLM/comments/1s6edoi/turboquant&lowbar;implementation/">Hay quienes</a> ya <a rel="noopener, noreferrer" href="https&colon;//x&period;com/iotcoi/status/2036755007131853254">han hecho</a> pruebas <a rel="noopener, noreferrer" href="https&colon;//x&period;com/dejanseo/status/2036697911262908912">preliminares</a> con TurboQuant y han confirmado que efectivamente el método funciona&period;&NewLine;<&excl;-- BREAK 5 -->&NewLine;Micron, Samsung y SK Hynix lo pagan caro&period; El impacto de esta técnica puede ser enorme, y eso ya se ha empezado a notar en las valoraciones de las acciones en bolsa de los fabricantes de memorias DRAM y HBM&period; Empresas como Micron, Samsung, SK Hynix, SanDisk o Kioxia cayeron de forma notable la semana pasada desde sus recientes máximos&period; El 18 de marzo rondaba los 471 dólares, y hoy sus acciones están a 357 dólares, lo que supone una asombrosa caída del 24,2&percnt;&period; Lo mismo ha pasado con el resto de fabricantes, que ya estaban cayendo desde esa fecha, pero que se han acelerado en esa caída con el lanzamiento de TurboQuant&period;&NewLine;<div class="article-asset-rich-content article-asset-normal">&NewLine;<div class="asset-content"></div>&NewLine;</div>&NewLine;Pero&period; La técnica se puede aplicar teóricamente solo a la fase de inferencia, pero la fase de entrenamiento de modelos de IA no se ve afectada por esta técnica de compresión&period; Así pues, durante la fase de entrenamiento se seguirán necesitando cantidades ingentes de memoria&period; Además <a class="text-outboundlink" href="https&colon;//www&period;xataka&period;com/componentes/seagate-nos-advierte-que-memorias-seguiran-subiendo-precio-ia-este-auge-hay-algo-que-nos-preocupa" data-vars-post-title="Si esperabas una bajada del precio de la RAM este año, la guerra de Irán tiene un mensaje para ti&colon; olvídate" data-vars-post-url="https&colon;//www&period;xataka&period;com/componentes/seagate-nos-advierte-que-memorias-seguiran-subiendo-precio-ia-este-auge-hay-algo-que-nos-preocupa">tendremos que esperar</a> a que las empresas de IA efectivamente comiencen a aplicar dicho sistema si se confirma que funciona, y será entonces cuando podamos ver <a class="text-outboundlink" href="https&colon;//www&period;xataka&period;com/componentes/panico-tecnologicas-quedarse-chips-ha-roto-mercado-memoria-ram-fabricantes-han-dicho-basta" data-vars-post-title='Los fabricantes de RAM se han cansado de que las tecnológicas compren "por si acaso"&period; Así que se han puesto serias' data-vars-post-url="https&colon;//www&period;xataka&period;com/componentes/panico-tecnologicas-quedarse-chips-ha-roto-mercado-memoria-ram-fabricantes-han-dicho-basta">el impacto real</a>&period; Teóricamente esto dará mucho margen de maniobra a las grandes tecnológicas, que podrán reducir aún más los precios por tokens, pero está por ver si lo hacen&period;&NewLine;<&excl;-- BREAK 6 -->&NewLine;<div class="article-asset-image article-asset-normal article-asset-center">&NewLine;<div class="asset-content">&NewLine; <img alt="Captura De Pantalla 2026 03 30 A Las 9 39 58" class="centro&lowbar;sinmarco" src="https&colon;//i&period;blogs&period;es/057323/captura-de-pantalla-2026-03-30-a-las-9&period;39&period;58/450&lowbar;1000&period;jpeg"></div>&NewLine;</div>&NewLine;Las memorias RAM bajan de precio&period; El impacto de TurboQuant ha sido también claro en los precios de los módulos de memoria, que han bajado de forma apreciable en precio&period; Por ejemplo, los módulos Corsair Vengeance DDR5 32 GB 6000MHz (2x16GB) estaban a 489,59 euros en Amazon hasta hace unas semanas según CamelCamelCamel, pero ahora mismo están a 339,89 euros, una rebaja notable&period; Es cierto que no todos los componentes están bajando igual, pero efectivamente sí hay casos en los que las rebajas parecen estar produciéndose&period;&NewLine;<&excl;-- BREAK 7 -->&NewLine;En Xataka | <a class="text-outboundlink" href="https&colon;//www&period;xataka&period;com/componentes/mercado-ram-totalmente-destruido-valve-tiene-mensaje-para-crear-steam-machine-ayuda" data-vars-post-title="La crisis de la RAM se está llevando por delante todos los planes de Valve con su Steam Machine" data-vars-post-url="https&colon;//www&period;xataka&period;com/componentes/mercado-ram-totalmente-destruido-valve-tiene-mensaje-para-crear-steam-machine-ayuda">La crisis de la RAM se está llevando por delante todos los planes de Valve con su Steam Machine</a>&NewLine; &&num;8211&semi; La noticia &NewLine; <a href="https&colon;//www&period;xataka&period;com/robotica-e-ia/google-ha-logrado-que-ia-consuma-seis-veces-memoria-micron-samsung-sk-hynix-estan-pagando-muy-caro&quest;utm&lowbar;source=feedburner&amp&semi;utm&lowbar;medium=feed&amp&semi;utm&lowbar;campaign=30&lowbar;Mar&lowbar;2026"> &NewLine; Google ha logrado que la IA consuma hasta seis veces menos memoria&period; Micron, Samsung y SK Hynix lo están pagando muy caro &NewLine; </a> &NewLine; fue publicada originalmente en &NewLine; <a href="https&colon;//www&period;xataka&period;com/&quest;utm&lowbar;source=feedburner&amp&semi;utm&lowbar;medium=feed&amp&semi;utm&lowbar;campaign=30&lowbar;Mar&lowbar;2026"> &NewLine; Xataka &NewLine; </a> &NewLine; por <a href="https&colon;//www&period;xataka&period;com/autor/javier-pastor&quest;utm&lowbar;source=feedburner&amp&semi;utm&lowbar;medium=feed&amp&semi;utm&lowbar;campaign=30&lowbar;Mar&lowbar;2026"> &NewLine; Javier Pastor &NewLine; </a> &NewLine; &period; &NewLine; Llevamos meses envueltos en la crisis de la memoria, pero quizás haya una salida&period; La semana pasada Google Research publicó un estudio en el que desvelaba una técnica llamada TurboQuant&period; Se trata de un algoritmo de compresión capaz de comprimir la memoria de trabajo de los modelos de IA hasta seis veces sin pérdida apreciable de calidad o rendimiento&period; Fantásticas noticias para los usuarios finales, que ven una luz al final del túnel, pero terribles para los fabricantes, a los que se les puede acabar esta época dorada&period;&NewLine;Expliquemos qué es eso del KV cache&period; Para entender TurboQuant hay que entender qué es esa memoria que logra comprimir&period; Cuando un modelo de lenguaje procesa una conversación larga, necesita recordar el contexto&period; Cada token que se procesa queda almacenado en la llamada KV cache, una especie de memoria de trabajo que crece a medida que conversamos&period; Cuanto más larga es la conversación, más memoria necesita el modelo&period; &NewLine;Comprimiendo que es gerundio&period; Es uno de los principales cuellos de botella en la etapa de inferencia de IA (es decir, cuando usamos los modelos), y un de los motivos por los que los centros de datos necesitan tanta memoria RAM o HBM&period; TurboQuant hace uso de un método de cuantización vectorial a esa caché para lograr comprimirla manteniendo la precisión del modelo&period;&NewLine;Pied Piper&period; Nada más aparecer este estudio de Google comenzaron las analogías con la trama de la serie 'Silicon Valley'&period; En ella la startup ficticia de la trama lograba desarrollar un algoritmo de compresión llamado Pied Piper extraordinariamente eficiente que amenazaba con revolucionar la industria tecnológica&period; Estos días en las redes sociales aparecieron múltiples referencias a la serie, que ya había sido referenciada como visionaria por reflejar lo que está pasando con una exactitud espectacular aun cuando la serie era una comedia&period; &NewLine;Seis veces menos memoria&period; El paper de Google Research afirma que este método es capaz de reducir la KV cache seis veces sin diferencia apreciable en el rendimiento en conversaciones largas&period; Los investigadores presentarán sus resultados en un evento el mes que viene y explicarán los dos métodos que permiten ponerla en práctica&period; Si confirman lo que ya han adelantado, las implicaciones son enormes&colon; menos memoria para inferencia significa que los centros de datos pueden hacer lo mismo con mucho menos hardware/memoria&period;&NewLine;El momento DeepSeek de Google&period; El descubrimiento ha hecho que algunos analistas califiquen esto como el "momento DeepSeek" de Google&period; Hace un año la startup china DeepSeek lanzó un modelo de IA que competía con los mejores pero que había costado mucho menos desarrollar&period; Eso sacudió la industria, y ahora volvemos a un logro técnico que apunta a lo mismo&period; En IA hacer lo mismo con menos es crucial, dado los ingentes recursos que necesita esta tecnología&period; Hay quienes ya han hecho pruebas preliminares con TurboQuant y han confirmado que efectivamente el método funciona&period; &NewLine;Micron, Samsung y SK Hynix lo pagan caro&period; El impacto de esta técnica puede ser enorme, y eso ya se ha empezado a notar en las valoraciones de las acciones en bolsa de los fabricantes de memorias DRAM y HBM&period; Empresas como Micron, Samsung, SK Hynix, SanDisk o Kioxia cayeron de forma notable la semana pasada desde sus recientes máximos&period; El 18 de marzo rondaba los 471 dólares, y hoy sus acciones están a 357 dólares, lo que supone una asombrosa caída del 24,2&percnt;&period; Lo mismo ha pasado con el resto de fabricantes, que ya estaban cayendo desde esa fecha, pero que se han acelerado en esa caída con el lanzamiento de TurboQuant&period;&NewLine;Pero&period; La técnica se puede aplicar teóricamente solo a la fase de inferencia, pero la fase de entrenamiento de modelos de IA no se ve afectada por esta técnica de compresión&period; Así pues, durante la fase de entrenamiento se seguirán necesitando cantidades ingentes de memoria&period; Además tendremos que esperar a que las empresas de IA efectivamente comiencen a aplicar dicho sistema si se confirma que funciona, y será entonces cuando podamos ver el impacto real&period; Teóricamente esto dará mucho margen de maniobra a las grandes tecnológicas, que podrán reducir aún más los precios por tokens, pero está por ver si lo hacen&period;&NewLine;Las memorias RAM bajan de precio&period; El impacto de TurboQuant ha sido también claro en los precios de los módulos de memoria, que han bajado de forma apreciable en precio&period; Por ejemplo, los módulos Corsair Vengeance DDR5 32 GB 6000MHz (2x16GB) estaban a 489,59 euros en Amazon hasta hace unas semanas según CamelCamelCamel, pero ahora mismo están a 339,89 euros, una rebaja notable&period; Es cierto que no todos los componentes están bajando igual, pero efectivamente sí hay casos en los que las rebajas parecen estar produciéndose&period;&NewLine;En Xataka | La crisis de la RAM se está llevando por delante todos los planes de Valve con su Steam Machine&NewLine; &&num;8211&semi; La noticia&NewLine; Google ha logrado que la IA consuma hasta seis veces menos memoria&period; Micron, Samsung y SK Hynix lo están pagando muy caro &NewLine; fue publicada originalmente en&NewLine; Xataka &NewLine; por &NewLine; Javier Pastor&NewLine; &period; &NewLine;

ermdigital

Ciencia y Tecnología

Google ha logrado que la IA consuma hasta seis veces menos memoria. Micron, Samsung y SK Hynix lo están pagando muy caro

Leave a Reply

Leave a Reply

Trending

Leave a Reply Cancelar la respuesta

Leave a Reply

Trending

Leave a Reply