Ciencia y Tecnología

La gran pregunta que afronta GPT 5.2 no es si es mejor o peor que sus antecesores: es si sale más barato

Published

1 month ago

December 14, 2025

<p>&NewLine; <img src="https&colon;//i&period;blogs&period;es/d8354b/openai1-copia-2/1024&lowbar;2000&period;jpeg" alt="La gran pregunta que afronta GPT 5&period;2 no es si es mejor o peor que sus antecesores&colon; es si sale más barato ">&NewLine; </p>&NewLine;<p>En 2019 a un <a class="text-outboundlink" href="https&colon;//www&period;xataka&period;com/robotica-e-ia/fundador-uno-benchmarks-ia-prestigiosos-mundo-tiene-nueva-startup-objetivo-mente-iag" data-vars-post-title="El fundador de uno de los benchmarks de IA más prestigiosos del mundo tiene una nueva startup&period; Y un objetivo en mente&colon; la IAG " data-vars-post-url="https&colon;//www&period;xataka&period;com/robotica-e-ia/fundador-uno-benchmarks-ia-prestigiosos-mundo-tiene-nueva-startup-objetivo-mente-iag">joven investigador</a> llamado François Chollet <a class="text-outboundlink" href="https&colon;//www&period;xataka&period;com/robotica-e-ia/arc-agi-test-facil-para-humanos-durisimo-para-ias-pregunta-sirve-realmente-para-medir-hemos-llegado-a-agi" data-vars-post-title="Si la pregunta es si la IA es ya tan buena como la inteligencia humana, la respuesta es&colon; resuelve este puzzle" data-vars-post-url="https&colon;//www&period;xataka&period;com/robotica-e-ia/arc-agi-test-facil-para-humanos-durisimo-para-ias-pregunta-sirve-realmente-para-medir-hemos-llegado-a-agi">se le ocurrió crear un benchmark para IA</a>&period; La idea era como poco rarita, porque en 2019 no había prácticamente nada con lo que probar ese benchmark&period; <strong>En realidad Chollet se adelantó al futuro</strong>, porque aun faltaban tres años para que apareciera ChatGPT y se iniciara la fiebre por la IA&period; </p>&NewLine;<p><&excl;-- BREAK 1 --></p>&NewLine;<p>Luego llegarían más y más benchmarks sintéticos para medir el rendimiento de las IAs, pero ARC-AGI era un benchmark distinto&period; Mientras que en muchos otros benchmarks la capacidad de memorización del modelo es crucial, aquí se ponía a prueba la capacidad de pensamiento abstracto y generalización de la IA&period;</p>&NewLine;<p><&excl;-- BREAK 2 --></p>&NewLine;<div class="article-asset article-asset-normal article-asset-center">&NewLine;<div class="desvio-container">&NewLine;<div class="desvio">&NewLine;<div class="desvio-figure js-desvio-figure">&NewLine; <a href="https&colon;//www&period;xataka&period;com/robotica-e-ia/ia-se-estan-volviendo-muy-listas-crear-pruebas-para-ponerlas-aprietos-esta-siendo-cada-vez-dificil" class="pivot-outboundlink" data-vars-post-title="Las IA se están volviendo muy listas&period; Y crear pruebas para ponerlas en aprietos está siendo cada vez más difícil "><br />&NewLine; <img alt="Las IA se están volviendo muy listas&period; Y crear pruebas para ponerlas en aprietos está siendo cada vez más difícil " width="375" height="142" src="https&colon;//i&period;blogs&period;es/3519a3/robot-examen/375&lowbar;142&period;jpeg"><br />&NewLine; </a>&NewLine; </div>&NewLine;<div class="desvio-summary">&NewLine;<div class="desvio-taxonomy js-desvio-taxonomy">&NewLine; <a href="https&colon;//www&period;xataka&period;com/robotica-e-ia/ia-se-estan-volviendo-muy-listas-crear-pruebas-para-ponerlas-aprietos-esta-siendo-cada-vez-dificil" class="desvio-taxonomy-anchor pivot-outboundlink" data-vars-post-title="Las IA se están volviendo muy listas&period; Y crear pruebas para ponerlas en aprietos está siendo cada vez más difícil ">En Xataka</a>&NewLine; </div>&NewLine;<p> <a href="https&colon;//www&period;xataka&period;com/robotica-e-ia/ia-se-estan-volviendo-muy-listas-crear-pruebas-para-ponerlas-aprietos-esta-siendo-cada-vez-dificil" class="desvio-title js-desvio-title pivot-outboundlink" data-vars-post-title="Las IA se están volviendo muy listas&period; Y crear pruebas para ponerlas en aprietos está siendo cada vez más difícil ">Las IA se están volviendo muy listas&period; Y crear pruebas para ponerlas en aprietos está siendo cada vez más difícil </a>&NewLine; </div>&NewLine;</p></div>&NewLine;</p></div>&NewLine;</div>&NewLine;<p>Los problemas propuestos en ARC-AGI y su sucesor, ARC-AGI 2, constan en gran medida de puzzles visuales que son relativamente fáciles de resolver por los seres humanos, pero que hasta ahora <a class="text-outboundlink" href="https&colon;//www&period;xataka&period;com/inteligencia-artificial/paradoja-moravec-que-inteligencia-artificial-hace-facil-dificil-viceversa" data-vars-post-title="La paradoja de Moravec&colon; por qué la inteligencia artificial hace fácil lo difícil (y viceversa)" data-vars-post-url="https&colon;//www&period;xataka&period;com/inteligencia-artificial/paradoja-moravec-que-inteligencia-artificial-hace-facil-dificil-viceversa">eran casi imposibles para las máquinas</a>&period; En los últimos dos años hemos ido viendo no obstante cómo los modelos de IA iban mejorando en comprensión abstracta y generalización, y poco a poco resolvieron más y más puzzles de ARC-AGI&period; ¿El problema&quest;</p>&NewLine;<p><&excl;-- BREAK 3 --></p>&NewLine;<p>Gastaban un dineral para hacerlo&period; </p>&NewLine;<p>Y ahí es donde entra GPT-5&period;2&period;</p>&NewLine;<h2>La IA puede resolver casi todo&period; La pregunta es cuánto cuesta hacerlo</h2>&NewLine;<p>El año pasado o3-preview logró resolver el 87&percnt; de ARC-AGI 1&period; El hito fue tan llamativo que hasta los propios responsables del benchmark <a rel="noopener, noreferrer" href="https&colon;//arcprize&period;org/blog/oai-o3-pub-breakthrough">publicaron un anuncio al respecto</a>&period; Para lograrlo, eso sí, o3-preview ejecutó 100 tareas con un coste total de 456&period;000 dólares&colon; <strong>cada una costó 4&period;560 dólares</strong>&period; </p>&NewLine;<div class="article-asset-image article-asset-large article-asset-center">&NewLine;<div class="asset-content">&NewLine;<div class="caption-img ">&NewLine;<p> <img alt="Arc Prize Leaderboard" class="" src="https&colon;//i&period;blogs&period;es/1b0f6a/arc-prize-leaderboard/450&lowbar;1000&period;png"></p>&NewLine;<p> <span>Fuente&colon; ARC-AGI Prize</span>&NewLine; </div>&NewLine;</p></div>&NewLine;</div>&NewLine;<p>Ayer se publicó GPT-5&period;2, la última versión del modelo fundacional de IA de OpenAI&period; Su rendimiento en otros benchmarks era excepcional, pero lo que realmente llama la atención es cómo se comportó en ARC-AGI 1&period; No por lograr resolver un 90,5&percnt; de los problemas con GPT-5&period;2 Pro (X-High), no, sino por cuánto costó cada tarea&period; </p>&NewLine;<p><&excl;-- BREAK 4 --></p>&NewLine;<p>La cifra&colon; <strong>11,65 dólares por tarea</strong>&period; <a rel="noopener, noreferrer" href="https&colon;//openai&period;com/es-ES/index/introducing-gpt-5-2/">390 veces menos</a> que hace un año&period;</p>&NewLine;<p>De hecho una versión aún más barata, GPT-5&period;2 (X-High) logró un 86,2&percnt; con un coste de tan solo 0,96 dólares por tarea&period; Alucinante&period;</p>&NewLine;<div class="article-asset-image article-asset-large article-asset-center">&NewLine;<div class="asset-content">&NewLine;<div class="caption-img ">&NewLine;<p> <img alt="Arc Agi 2prize Leaderboard" class="" src="https&colon;//i&period;blogs&period;es/f2410c/arc-agi-2prize-leaderboard/450&lowbar;1000&period;png"></p>&NewLine;<p> <span>ARC-AGI 2 sigue siendo un desafío para la mayoría de modelos, pero GPT-5&period;2 ha dado otro salto de calidad excepcional&period; Fuente&colon; ARC-AGI Prize&period;</span>&NewLine; </div>&NewLine;</p></div>&NewLine;</div>&NewLine;<p>Chollet y su equipo sabían que la IA acabaría superando su test ARC-AGI tarde o temprano, así que <a rel="noopener, noreferrer" href="https&colon;//arcprize&period;org/blog/announcing-arc-agi-2-and-arc-prize-2025">en marzo de 2025</a> publicaron ARC-AGI 2, la segunda versión de su benchmark, para ponérselo aún más difícil a las máquinas&period; Ese test es aún un verdadero desafío para la mayoría de modelos, que hasta ahora apenas habían resuelto un 38&percnt; de los problemas en el mejor de los casos (Claude Opus 4&period;5)&period; </p>&NewLine;<p><&excl;-- BREAK 5 --></p>&NewLine;<p>GPT-5&period;2 <a rel="noopener, noreferrer" href="https&colon;//x&period;com/arcprize/status/1999182732845547795">ha logrado resolver</a> casi el 55&percnt;&period; Es un salto colosal&period;</p>&NewLine;<p>Y de nuevo, con un coste realmente sorprendente de 15,72 dólares por tarea&period; La tendencia es clara&colon; la IA no solo está volviéndose mejor, <strong>sino que es cada vez más barata</strong>&period; </p>&NewLine;<p><&excl;-- BREAK 6 --></p>&NewLine;<p>Eso son buenas noticias para todos, porque equilibran esa ya clara percepción de que el escalado no funciona tanto como en el pasado&period; Los saltos en rendimiento no son tan llamativos —aunque estas pruebas con ARC-AGI desmontan ese argumento—, pero sí lo son los saltos en cuanto a coste&period; </p>&NewLine;<p><&excl;-- BREAK 7 --></p>&NewLine;<div class="article-asset-video article-asset-normal">&NewLine;<div class="asset-content">&NewLine;<div class="base-asset-video">&NewLine;<div class="js-dailymotion"></div>&NewLine;</p></div>&NewLine;</p></div>&NewLine;</div>&NewLine;<p>La carrera de la IA parece haber alcanzado un punto de inflexión&period; La verdadera pregunta no es si la IA logrará resolver un problema, sino cuánto costará resolverlo&period; Y la evolución de GPT-5&period;2 parece demostrar claramente algo crucial&colon; que la IA cada vez resuelve más cosas a menor precio&period; </p>&NewLine;<p><&excl;-- BREAK 8 --></p>&NewLine;<p>Eso es además algo crítico para una OpenAI que <a class="text-outboundlink" href="https&colon;//www&period;xataka&period;com/robotica-e-ia/openai-va-a-tener-que-pagar-fortuna-obligaciones-crediticias-2026-no-esta-nada-claro-que-logre-pagarlas" data-vars-post-title="OpenAI tiene que pagar deudas de 400&period;000 millones de dólares en 2026&period; Nadie tiene ni la más remota idea de cómo va a pagarlos" data-vars-post-url="https&colon;//www&period;xataka&period;com/robotica-e-ia/openai-va-a-tener-que-pagar-fortuna-obligaciones-crediticias-2026-no-esta-nada-claro-que-logre-pagarlas">está en una situación económica delicada</a>&period; Ahora que estamos más en una especie de meseta en cuanto a ganancias en rendimiento, <strong>lograr ser más baratos y eficientes es clave</strong> para el futuro de la empresa&period; Y parece que GPT-5&period;2, además de una respuesta a Gemini 3 Pro, es un paso claro en esa dirección&period;</p>&NewLine;<p><&excl;-- BREAK 9 --></p>&NewLine;<p>En Xataka | <a class="text-outboundlink" href="https&colon;//www&period;xataka&period;com/empresas-y-economia/hay-carrera-que-anthropic-le-va-a-ganar-partida-a-openai-ser-rentable" data-vars-post-title="OpenAI va por delante de Anthropic en todos los aspectos de la IA excepto en el más importante&colon; sobrevivir" data-vars-post-url="https&colon;//www&period;xataka&period;com/empresas-y-economia/hay-carrera-que-anthropic-le-va-a-ganar-partida-a-openai-ser-rentable">Hay una carrera en la que Anthropic le está ganando la partida a OpenAI&colon; en la de ser rentable</a></p>&NewLine;<p> &&num;8211&semi; <br /> La noticia<br />&NewLine; <a href="https&colon;//www&period;xataka&period;com/robotica-e-ia/gran-pregunta-que-afronta-gpt-5-2-no-mejor-peor-que-sus-antecesores-sale-barato&quest;utm&lowbar;source=feedburner&amp&semi;utm&lowbar;medium=feed&amp&semi;utm&lowbar;campaign=14&lowbar;Dec&lowbar;2025"><br />&NewLine; <em> La gran pregunta que afronta GPT 5&period;2 no es si es mejor o peor que sus antecesores&colon; es si sale más barato </em><br />&NewLine; </a><br />&NewLine; fue publicada originalmente en<br />&NewLine; <a href="https&colon;//www&period;xataka&period;com/&quest;utm&lowbar;source=feedburner&amp&semi;utm&lowbar;medium=feed&amp&semi;utm&lowbar;campaign=14&lowbar;Dec&lowbar;2025"><br />&NewLine; <strong> Xataka </strong><br />&NewLine; </a><br />&NewLine; por <a href="https&colon;//www&period;xataka&period;com/autor/javier-pastor&quest;utm&lowbar;source=feedburner&amp&semi;utm&lowbar;medium=feed&amp&semi;utm&lowbar;campaign=14&lowbar;Dec&lowbar;2025"><br />&NewLine; Javier Pastor<br />&NewLine; </a><br />&NewLine; &period; </p>&NewLine;<p>&ZeroWidthSpace;En 2019 a un joven investigador llamado François Chollet se le ocurrió crear un benchmark para IA&period; La idea era como poco rarita, porque en 2019 no había prácticamente nada con lo que probar ese benchmark&period; En realidad Chollet se adelantó al futuro, porque aun faltaban tres años para que apareciera ChatGPT y se iniciara la fiebre por la IA&period; </p>&NewLine;<p>Luego llegarían más y más benchmarks sintéticos para medir el rendimiento de las IAs, pero ARC-AGI era un benchmark distinto&period; Mientras que en muchos otros benchmarks la capacidad de memorización del modelo es crucial, aquí se ponía a prueba la capacidad de pensamiento abstracto y generalización de la IA&period;</p>&NewLine;<p> En Xataka</p>&NewLine;<p> Las IA se están volviendo muy listas&period; Y crear pruebas para ponerlas en aprietos está siendo cada vez más difícil </p>&NewLine;<p>Los problemas propuestos en ARC-AGI y su sucesor, ARC-AGI 2, constan en gran medida de puzzles visuales que son relativamente fáciles de resolver por los seres humanos, pero que hasta ahora eran casi imposibles para las máquinas&period; En los últimos dos años hemos ido viendo no obstante cómo los modelos de IA iban mejorando en comprensión abstracta y generalización, y poco a poco resolvieron más y más puzzles de ARC-AGI&period; ¿El problema&quest;</p>&NewLine;<p>Gastaban un dineral para hacerlo&period; </p>&NewLine;<p>Y ahí es donde entra GPT-5&period;2&period;</p>&NewLine;<p>La IA puede resolver casi todo&period; La pregunta es cuánto cuesta hacerloEl año pasado o3-preview logró resolver el 87&percnt; de ARC-AGI 1&period; El hito fue tan llamativo que hasta los propios responsables del benchmark publicaron un anuncio al respecto&period; Para lograrlo, eso sí, o3-preview ejecutó 100 tareas con un coste total de 456&period;000 dólares&colon; cada una costó 4&period;560 dólares&period; </p>&NewLine;<p> Fuente&colon; ARC-AGI Prize</p>&NewLine;<p>Ayer se publicó GPT-5&period;2, la última versión del modelo fundacional de IA de OpenAI&period; Su rendimiento en otros benchmarks era excepcional, pero lo que realmente llama la atención es cómo se comportó en ARC-AGI 1&period; No por lograr resolver un 90,5&percnt; de los problemas con GPT-5&period;2 Pro (X-High), no, sino por cuánto costó cada tarea&period; </p>&NewLine;<p>La cifra&colon; 11,65 dólares por tarea&period; 390 veces menos que hace un año&period;</p>&NewLine;<p>De hecho una versión aún más barata, GPT-5&period;2 (X-High) logró un 86,2&percnt; con un coste de tan solo 0,96 dólares por tarea&period; Alucinante&period;</p>&NewLine;<p> ARC-AGI 2 sigue siendo un desafío para la mayoría de modelos, pero GPT-5&period;2 ha dado otro salto de calidad excepcional&period; Fuente&colon; ARC-AGI Prize&period;</p>&NewLine;<p>Chollet y su equipo sabían que la IA acabaría superando su test ARC-AGI tarde o temprano, así que en marzo de 2025 publicaron ARC-AGI 2, la segunda versión de su benchmark, para ponérselo aún más difícil a las máquinas&period; Ese test es aún un verdadero desafío para la mayoría de modelos, que hasta ahora apenas habían resuelto un 38&percnt; de los problemas en el mejor de los casos (Claude Opus 4&period;5)&period; </p>&NewLine;<p>GPT-5&period;2 ha logrado resolver casi el 55&percnt;&period; Es un salto colosal&period;</p>&NewLine;<p>Y de nuevo, con un coste realmente sorprendente de 15,72 dólares por tarea&period; La tendencia es clara&colon; la IA no solo está volviéndose mejor, sino que es cada vez más barata&period; </p>&NewLine;<p>Eso son buenas noticias para todos, porque equilibran esa ya clara percepción de que el escalado no funciona tanto como en el pasado&period; Los saltos en rendimiento no son tan llamativos —aunque estas pruebas con ARC-AGI desmontan ese argumento—, pero sí lo son los saltos en cuanto a coste&period; </p>&NewLine;<p>La carrera de la IA parece haber alcanzado un punto de inflexión&period; La verdadera pregunta no es si la IA logrará resolver un problema, sino cuánto costará resolverlo&period; Y la evolución de GPT-5&period;2 parece demostrar claramente algo crucial&colon; que la IA cada vez resuelve más cosas a menor precio&period; </p>&NewLine;<p>Eso es además algo crítico para una OpenAI que está en una situación económica delicada&period; Ahora que estamos más en una especie de meseta en cuanto a ganancias en rendimiento, lograr ser más baratos y eficientes es clave para el futuro de la empresa&period; Y parece que GPT-5&period;2, además de una respuesta a Gemini 3 Pro, es un paso claro en esa dirección&period;</p>&NewLine;<p>En Xataka | Hay una carrera en la que Anthropic le está ganando la partida a OpenAI&colon; en la de ser rentable</p>&NewLine;<p> &&num;8211&semi; La noticia</p>&NewLine;<p> La gran pregunta que afronta GPT 5&period;2 no es si es mejor o peor que sus antecesores&colon; es si sale más barato </p>&NewLine;<p> fue publicada originalmente en</p>&NewLine;<p> Xataka </p>&NewLine;<p> por<br />&NewLine; Javier Pastor</p>&NewLine;<p> &period; </p>&NewLine;<p>&ZeroWidthSpace; </p>&NewLine;<p>&ZeroWidthSpace; </p>&NewLine;

ERM Digital

Ciencia y Tecnología

La gran pregunta que afronta GPT 5.2 no es si es mejor o peor que sus antecesores: es si sale más barato

Leave a Reply

Leave a Reply

Noticias Importantes

Leave a Reply Cancel reply

Leave a Reply

Noticias Importantes

Leave a Reply