Ciencia y Tecnología
La gran pregunta que afronta GPT 5.2 no es si es mejor o peor que sus antecesores: es si sale más barato
<p>
 <img src="https://i.blogs.es/d8354b/openai1-copia-2/1024_2000.jpeg" alt="La gran pregunta que afronta GPT 5.2 no es si es mejor o peor que sus antecesores: es si sale más barato ">
 </p>
<p>En 2019 a un <a class="text-outboundlink" href="https://www.xataka.com/robotica-e-ia/fundador-uno-benchmarks-ia-prestigiosos-mundo-tiene-nueva-startup-objetivo-mente-iag" data-vars-post-title="El fundador de uno de los benchmarks de IA más prestigiosos del mundo tiene una nueva startup. Y un objetivo en mente: la IAG " data-vars-post-url="https://www.xataka.com/robotica-e-ia/fundador-uno-benchmarks-ia-prestigiosos-mundo-tiene-nueva-startup-objetivo-mente-iag">joven investigador</a> llamado François Chollet <a class="text-outboundlink" href="https://www.xataka.com/robotica-e-ia/arc-agi-test-facil-para-humanos-durisimo-para-ias-pregunta-sirve-realmente-para-medir-hemos-llegado-a-agi" data-vars-post-title="Si la pregunta es si la IA es ya tan buena como la inteligencia humana, la respuesta es: resuelve este puzzle" data-vars-post-url="https://www.xataka.com/robotica-e-ia/arc-agi-test-facil-para-humanos-durisimo-para-ias-pregunta-sirve-realmente-para-medir-hemos-llegado-a-agi">se le ocurrió crear un benchmark para IA</a>. La idea era como poco rarita, porque en 2019 no había prácticamente nada con lo que probar ese benchmark. <strong>En realidad Chollet se adelantó al futuro</strong>, porque aun faltaban tres años para que apareciera ChatGPT y se iniciara la fiebre por la IA. </p>
<p><!-- BREAK 1 --></p>
<p>Luego llegarían más y más benchmarks sintéticos para medir el rendimiento de las IAs, pero ARC-AGI era un benchmark distinto. Mientras que en muchos otros benchmarks la capacidad de memorización del modelo es crucial, aquí se ponía a prueba la capacidad de pensamiento abstracto y generalización de la IA.</p>
<p><!-- BREAK 2 --></p>
<div class="article-asset article-asset-normal article-asset-center">
<div class="desvio-container">
<div class="desvio">
<div class="desvio-figure js-desvio-figure">
 <a href="https://www.xataka.com/robotica-e-ia/ia-se-estan-volviendo-muy-listas-crear-pruebas-para-ponerlas-aprietos-esta-siendo-cada-vez-dificil" class="pivot-outboundlink" data-vars-post-title="Las IA se están volviendo muy listas. Y crear pruebas para ponerlas en aprietos está siendo cada vez más difícil "><br />
 <img alt="Las IA se están volviendo muy listas. Y crear pruebas para ponerlas en aprietos está siendo cada vez más difícil " width="375" height="142" src="https://i.blogs.es/3519a3/robot-examen/375_142.jpeg"><br />
 </a>
 </div>
<div class="desvio-summary">
<div class="desvio-taxonomy js-desvio-taxonomy">
 <a href="https://www.xataka.com/robotica-e-ia/ia-se-estan-volviendo-muy-listas-crear-pruebas-para-ponerlas-aprietos-esta-siendo-cada-vez-dificil" class="desvio-taxonomy-anchor pivot-outboundlink" data-vars-post-title="Las IA se están volviendo muy listas. Y crear pruebas para ponerlas en aprietos está siendo cada vez más difícil ">En Xataka</a>
 </div>
<p> <a href="https://www.xataka.com/robotica-e-ia/ia-se-estan-volviendo-muy-listas-crear-pruebas-para-ponerlas-aprietos-esta-siendo-cada-vez-dificil" class="desvio-title js-desvio-title pivot-outboundlink" data-vars-post-title="Las IA se están volviendo muy listas. Y crear pruebas para ponerlas en aprietos está siendo cada vez más difícil ">Las IA se están volviendo muy listas. Y crear pruebas para ponerlas en aprietos está siendo cada vez más difícil </a>
 </div>
</p></div>
</p></div>
</div>
<p>Los problemas propuestos en ARC-AGI y su sucesor, ARC-AGI 2, constan en gran medida de puzzles visuales que son relativamente fáciles de resolver por los seres humanos, pero que hasta ahora <a class="text-outboundlink" href="https://www.xataka.com/inteligencia-artificial/paradoja-moravec-que-inteligencia-artificial-hace-facil-dificil-viceversa" data-vars-post-title="La paradoja de Moravec: por qué la inteligencia artificial hace fácil lo difícil (y viceversa)" data-vars-post-url="https://www.xataka.com/inteligencia-artificial/paradoja-moravec-que-inteligencia-artificial-hace-facil-dificil-viceversa">eran casi imposibles para las máquinas</a>. En los últimos dos años hemos ido viendo no obstante cómo los modelos de IA iban mejorando en comprensión abstracta y generalización, y poco a poco resolvieron más y más puzzles de ARC-AGI. ¿El problema?</p>
<p><!-- BREAK 3 --></p>
<p>Gastaban un dineral para hacerlo. </p>
<p>Y ahí es donde entra GPT-5.2.</p>
<h2>La IA puede resolver casi todo. La pregunta es cuánto cuesta hacerlo</h2>
<p>El año pasado o3-preview logró resolver el 87% de ARC-AGI 1. El hito fue tan llamativo que hasta los propios responsables del benchmark <a rel="noopener, noreferrer" href="https://arcprize.org/blog/oai-o3-pub-breakthrough">publicaron un anuncio al respecto</a>. Para lograrlo, eso sí, o3-preview ejecutó 100 tareas con un coste total de 456.000 dólares: <strong>cada una costó 4.560 dólares</strong>. </p>
<div class="article-asset-image article-asset-large article-asset-center">
<div class="asset-content">
<div class="caption-img ">
<p> <img alt="Arc Prize Leaderboard" class="" src="https://i.blogs.es/1b0f6a/arc-prize-leaderboard/450_1000.png"></p>
<p> <span>Fuente: ARC-AGI Prize</span>
 </div>
</p></div>
</div>
<p>Ayer se publicó GPT-5.2, la última versión del modelo fundacional de IA de OpenAI. Su rendimiento en otros benchmarks era excepcional, pero lo que realmente llama la atención es cómo se comportó en ARC-AGI 1. No por lograr resolver un 90,5% de los problemas con GPT-5.2 Pro (X-High), no, sino por cuánto costó cada tarea. </p>
<p><!-- BREAK 4 --></p>
<p>La cifra: <strong>11,65 dólares por tarea</strong>. <a rel="noopener, noreferrer" href="https://openai.com/es-ES/index/introducing-gpt-5-2/">390 veces menos</a> que hace un año.</p>
<p>De hecho una versión aún más barata, GPT-5.2 (X-High) logró un 86,2% con un coste de tan solo 0,96 dólares por tarea. Alucinante.</p>
<div class="article-asset-image article-asset-large article-asset-center">
<div class="asset-content">
<div class="caption-img ">
<p> <img alt="Arc Agi 2prize Leaderboard" class="" src="https://i.blogs.es/f2410c/arc-agi-2prize-leaderboard/450_1000.png"></p>
<p> <span>ARC-AGI 2 sigue siendo un desafío para la mayoría de modelos, pero GPT-5.2 ha dado otro salto de calidad excepcional. Fuente: ARC-AGI Prize.</span>
 </div>
</p></div>
</div>
<p>Chollet y su equipo sabían que la IA acabaría superando su test ARC-AGI tarde o temprano, así que <a rel="noopener, noreferrer" href="https://arcprize.org/blog/announcing-arc-agi-2-and-arc-prize-2025">en marzo de 2025</a> publicaron ARC-AGI 2, la segunda versión de su benchmark, para ponérselo aún más difícil a las máquinas. Ese test es aún un verdadero desafío para la mayoría de modelos, que hasta ahora apenas habían resuelto un 38% de los problemas en el mejor de los casos (Claude Opus 4.5). </p>
<p><!-- BREAK 5 --></p>
<p>GPT-5.2 <a rel="noopener, noreferrer" href="https://x.com/arcprize/status/1999182732845547795">ha logrado resolver</a> casi el 55%. Es un salto colosal.</p>
<p>Y de nuevo, con un coste realmente sorprendente de 15,72 dólares por tarea. La tendencia es clara: la IA no solo está volviéndose mejor, <strong>sino que es cada vez más barata</strong>. </p>
<p><!-- BREAK 6 --></p>
<p>Eso son buenas noticias para todos, porque equilibran esa ya clara percepción de que el escalado no funciona tanto como en el pasado. Los saltos en rendimiento no son tan llamativos —aunque estas pruebas con ARC-AGI desmontan ese argumento—, pero sí lo son los saltos en cuanto a coste. </p>
<p><!-- BREAK 7 --></p>
<div class="article-asset-video article-asset-normal">
<div class="asset-content">
<div class="base-asset-video">
<div class="js-dailymotion"></div>
</p></div>
</p></div>
</div>
<p>La carrera de la IA parece haber alcanzado un punto de inflexión. La verdadera pregunta no es si la IA logrará resolver un problema, sino cuánto costará resolverlo. Y la evolución de GPT-5.2 parece demostrar claramente algo crucial: que la IA cada vez resuelve más cosas a menor precio. </p>
<p><!-- BREAK 8 --></p>
<p>Eso es además algo crítico para una OpenAI que <a class="text-outboundlink" href="https://www.xataka.com/robotica-e-ia/openai-va-a-tener-que-pagar-fortuna-obligaciones-crediticias-2026-no-esta-nada-claro-que-logre-pagarlas" data-vars-post-title="OpenAI tiene que pagar deudas de 400.000 millones de dólares en 2026. Nadie tiene ni la más remota idea de cómo va a pagarlos" data-vars-post-url="https://www.xataka.com/robotica-e-ia/openai-va-a-tener-que-pagar-fortuna-obligaciones-crediticias-2026-no-esta-nada-claro-que-logre-pagarlas">está en una situación económica delicada</a>. Ahora que estamos más en una especie de meseta en cuanto a ganancias en rendimiento, <strong>lograr ser más baratos y eficientes es clave</strong> para el futuro de la empresa. Y parece que GPT-5.2, además de una respuesta a Gemini 3 Pro, es un paso claro en esa dirección.</p>
<p><!-- BREAK 9 --></p>
<p>En Xataka | <a class="text-outboundlink" href="https://www.xataka.com/empresas-y-economia/hay-carrera-que-anthropic-le-va-a-ganar-partida-a-openai-ser-rentable" data-vars-post-title="OpenAI va por delante de Anthropic en todos los aspectos de la IA excepto en el más importante: sobrevivir" data-vars-post-url="https://www.xataka.com/empresas-y-economia/hay-carrera-que-anthropic-le-va-a-ganar-partida-a-openai-ser-rentable">Hay una carrera en la que Anthropic le está ganando la partida a OpenAI: en la de ser rentable</a></p>
<p> &#8211; <br /> La noticia<br />
 <a href="https://www.xataka.com/robotica-e-ia/gran-pregunta-que-afronta-gpt-5-2-no-mejor-peor-que-sus-antecesores-sale-barato?utm_source=feedburner&;utm_medium=feed&;utm_campaign=14_Dec_2025"><br />
 <em> La gran pregunta que afronta GPT 5.2 no es si es mejor o peor que sus antecesores: es si sale más barato </em><br />
 </a><br />
 fue publicada originalmente en<br />
 <a href="https://www.xataka.com/?utm_source=feedburner&;utm_medium=feed&;utm_campaign=14_Dec_2025"><br />
 <strong> Xataka </strong><br />
 </a><br />
 por <a href="https://www.xataka.com/autor/javier-pastor?utm_source=feedburner&;utm_medium=feed&;utm_campaign=14_Dec_2025"><br />
 Javier Pastor<br />
 </a><br />
 . </p>
<p>​En 2019 a un joven investigador llamado François Chollet se le ocurrió crear un benchmark para IA. La idea era como poco rarita, porque en 2019 no había prácticamente nada con lo que probar ese benchmark. En realidad Chollet se adelantó al futuro, porque aun faltaban tres años para que apareciera ChatGPT y se iniciara la fiebre por la IA. </p>
<p>Luego llegarían más y más benchmarks sintéticos para medir el rendimiento de las IAs, pero ARC-AGI era un benchmark distinto. Mientras que en muchos otros benchmarks la capacidad de memorización del modelo es crucial, aquí se ponía a prueba la capacidad de pensamiento abstracto y generalización de la IA.</p>
<p> En Xataka</p>
<p> Las IA se están volviendo muy listas. Y crear pruebas para ponerlas en aprietos está siendo cada vez más difícil </p>
<p>Los problemas propuestos en ARC-AGI y su sucesor, ARC-AGI 2, constan en gran medida de puzzles visuales que son relativamente fáciles de resolver por los seres humanos, pero que hasta ahora eran casi imposibles para las máquinas. En los últimos dos años hemos ido viendo no obstante cómo los modelos de IA iban mejorando en comprensión abstracta y generalización, y poco a poco resolvieron más y más puzzles de ARC-AGI. ¿El problema?</p>
<p>Gastaban un dineral para hacerlo. </p>
<p>Y ahí es donde entra GPT-5.2.</p>
<p>La IA puede resolver casi todo. La pregunta es cuánto cuesta hacerloEl año pasado o3-preview logró resolver el 87% de ARC-AGI 1. El hito fue tan llamativo que hasta los propios responsables del benchmark publicaron un anuncio al respecto. Para lograrlo, eso sí, o3-preview ejecutó 100 tareas con un coste total de 456.000 dólares: cada una costó 4.560 dólares. </p>
<p> Fuente: ARC-AGI Prize</p>
<p>Ayer se publicó GPT-5.2, la última versión del modelo fundacional de IA de OpenAI. Su rendimiento en otros benchmarks era excepcional, pero lo que realmente llama la atención es cómo se comportó en ARC-AGI 1. No por lograr resolver un 90,5% de los problemas con GPT-5.2 Pro (X-High), no, sino por cuánto costó cada tarea. </p>
<p>La cifra: 11,65 dólares por tarea. 390 veces menos que hace un año.</p>
<p>De hecho una versión aún más barata, GPT-5.2 (X-High) logró un 86,2% con un coste de tan solo 0,96 dólares por tarea. Alucinante.</p>
<p> ARC-AGI 2 sigue siendo un desafío para la mayoría de modelos, pero GPT-5.2 ha dado otro salto de calidad excepcional. Fuente: ARC-AGI Prize.</p>
<p>Chollet y su equipo sabían que la IA acabaría superando su test ARC-AGI tarde o temprano, así que en marzo de 2025 publicaron ARC-AGI 2, la segunda versión de su benchmark, para ponérselo aún más difícil a las máquinas. Ese test es aún un verdadero desafío para la mayoría de modelos, que hasta ahora apenas habían resuelto un 38% de los problemas en el mejor de los casos (Claude Opus 4.5). </p>
<p>GPT-5.2 ha logrado resolver casi el 55%. Es un salto colosal.</p>
<p>Y de nuevo, con un coste realmente sorprendente de 15,72 dólares por tarea. La tendencia es clara: la IA no solo está volviéndose mejor, sino que es cada vez más barata. </p>
<p>Eso son buenas noticias para todos, porque equilibran esa ya clara percepción de que el escalado no funciona tanto como en el pasado. Los saltos en rendimiento no son tan llamativos —aunque estas pruebas con ARC-AGI desmontan ese argumento—, pero sí lo son los saltos en cuanto a coste. </p>
<p>La carrera de la IA parece haber alcanzado un punto de inflexión. La verdadera pregunta no es si la IA logrará resolver un problema, sino cuánto costará resolverlo. Y la evolución de GPT-5.2 parece demostrar claramente algo crucial: que la IA cada vez resuelve más cosas a menor precio. </p>
<p>Eso es además algo crítico para una OpenAI que está en una situación económica delicada. Ahora que estamos más en una especie de meseta en cuanto a ganancias en rendimiento, lograr ser más baratos y eficientes es clave para el futuro de la empresa. Y parece que GPT-5.2, además de una respuesta a Gemini 3 Pro, es un paso claro en esa dirección.</p>
<p>En Xataka | Hay una carrera en la que Anthropic le está ganando la partida a OpenAI: en la de ser rentable</p>
<p> &#8211; La noticia</p>
<p> La gran pregunta que afronta GPT 5.2 no es si es mejor o peor que sus antecesores: es si sale más barato </p>
<p> fue publicada originalmente en</p>
<p> Xataka </p>
<p> por<br />
 Javier Pastor</p>
<p> . </p>
<p>​ </p>
<p>​ </p>