Ciencia y Tecnología
La gran pregunta que afronta GPT 5.2 no es si es mejor o peor que sus antecesores: es si sale más barato
En 2019 a un joven investigador llamado François Chollet se le ocurrió crear un benchmark para IA. La idea era como poco rarita, porque en 2019 no había prácticamente nada con lo que probar ese benchmark. En realidad Chollet se adelantó al futuro, porque aun faltaban tres años para que apareciera ChatGPT y se iniciara la fiebre por la IA.
Luego llegarían más y más benchmarks sintéticos para medir el rendimiento de las IAs, pero ARC-AGI era un benchmark distinto. Mientras que en muchos otros benchmarks la capacidad de memorización del modelo es crucial, aquí se ponía a prueba la capacidad de pensamiento abstracto y generalización de la IA.
Los problemas propuestos en ARC-AGI y su sucesor, ARC-AGI 2, constan en gran medida de puzzles visuales que son relativamente fáciles de resolver por los seres humanos, pero que hasta ahora eran casi imposibles para las máquinas. En los últimos dos años hemos ido viendo no obstante cómo los modelos de IA iban mejorando en comprensión abstracta y generalización, y poco a poco resolvieron más y más puzzles de ARC-AGI. ¿El problema?
Gastaban un dineral para hacerlo.
Y ahí es donde entra GPT-5.2.
La IA puede resolver casi todo. La pregunta es cuánto cuesta hacerlo
El año pasado o3-preview logró resolver el 87% de ARC-AGI 1. El hito fue tan llamativo que hasta los propios responsables del benchmark publicaron un anuncio al respecto. Para lograrlo, eso sí, o3-preview ejecutó 100 tareas con un coste total de 456.000 dólares: cada una costó 4.560 dólares.

Fuente: ARC-AGI Prize
Ayer se publicó GPT-5.2, la última versión del modelo fundacional de IA de OpenAI. Su rendimiento en otros benchmarks era excepcional, pero lo que realmente llama la atención es cómo se comportó en ARC-AGI 1. No por lograr resolver un 90,5% de los problemas con GPT-5.2 Pro (X-High), no, sino por cuánto costó cada tarea.
La cifra: 11,65 dólares por tarea. 390 veces menos que hace un año.
De hecho una versión aún más barata, GPT-5.2 (X-High) logró un 86,2% con un coste de tan solo 0,96 dólares por tarea. Alucinante.

ARC-AGI 2 sigue siendo un desafío para la mayoría de modelos, pero GPT-5.2 ha dado otro salto de calidad excepcional. Fuente: ARC-AGI Prize.
Chollet y su equipo sabían que la IA acabaría superando su test ARC-AGI tarde o temprano, así que en marzo de 2025 publicaron ARC-AGI 2, la segunda versión de su benchmark, para ponérselo aún más difícil a las máquinas. Ese test es aún un verdadero desafío para la mayoría de modelos, que hasta ahora apenas habían resuelto un 38% de los problemas en el mejor de los casos (Claude Opus 4.5).
GPT-5.2 ha logrado resolver casi el 55%. Es un salto colosal.
Y de nuevo, con un coste realmente sorprendente de 15,72 dólares por tarea. La tendencia es clara: la IA no solo está volviéndose mejor, sino que es cada vez más barata.
Eso son buenas noticias para todos, porque equilibran esa ya clara percepción de que el escalado no funciona tanto como en el pasado. Los saltos en rendimiento no son tan llamativos —aunque estas pruebas con ARC-AGI desmontan ese argumento—, pero sí lo son los saltos en cuanto a coste.
La carrera de la IA parece haber alcanzado un punto de inflexión. La verdadera pregunta no es si la IA logrará resolver un problema, sino cuánto costará resolverlo. Y la evolución de GPT-5.2 parece demostrar claramente algo crucial: que la IA cada vez resuelve más cosas a menor precio.
Eso es además algo crítico para una OpenAI que está en una situación económica delicada. Ahora que estamos más en una especie de meseta en cuanto a ganancias en rendimiento, lograr ser más baratos y eficientes es clave para el futuro de la empresa. Y parece que GPT-5.2, además de una respuesta a Gemini 3 Pro, es un paso claro en esa dirección.
En Xataka | Hay una carrera en la que Anthropic le está ganando la partida a OpenAI: en la de ser rentable
–
La noticia
La gran pregunta que afronta GPT 5.2 no es si es mejor o peor que sus antecesores: es si sale más barato
fue publicada originalmente en
Xataka
por
Javier Pastor
.
En 2019 a un joven investigador llamado François Chollet se le ocurrió crear un benchmark para IA. La idea era como poco rarita, porque en 2019 no había prácticamente nada con lo que probar ese benchmark. En realidad Chollet se adelantó al futuro, porque aun faltaban tres años para que apareciera ChatGPT y se iniciara la fiebre por la IA.
Luego llegarían más y más benchmarks sintéticos para medir el rendimiento de las IAs, pero ARC-AGI era un benchmark distinto. Mientras que en muchos otros benchmarks la capacidad de memorización del modelo es crucial, aquí se ponía a prueba la capacidad de pensamiento abstracto y generalización de la IA.
En Xataka
Las IA se están volviendo muy listas. Y crear pruebas para ponerlas en aprietos está siendo cada vez más difícil
Los problemas propuestos en ARC-AGI y su sucesor, ARC-AGI 2, constan en gran medida de puzzles visuales que son relativamente fáciles de resolver por los seres humanos, pero que hasta ahora eran casi imposibles para las máquinas. En los últimos dos años hemos ido viendo no obstante cómo los modelos de IA iban mejorando en comprensión abstracta y generalización, y poco a poco resolvieron más y más puzzles de ARC-AGI. ¿El problema?
Gastaban un dineral para hacerlo.
Y ahí es donde entra GPT-5.2.
La IA puede resolver casi todo. La pregunta es cuánto cuesta hacerloEl año pasado o3-preview logró resolver el 87% de ARC-AGI 1. El hito fue tan llamativo que hasta los propios responsables del benchmark publicaron un anuncio al respecto. Para lograrlo, eso sí, o3-preview ejecutó 100 tareas con un coste total de 456.000 dólares: cada una costó 4.560 dólares.
Fuente: ARC-AGI Prize
Ayer se publicó GPT-5.2, la última versión del modelo fundacional de IA de OpenAI. Su rendimiento en otros benchmarks era excepcional, pero lo que realmente llama la atención es cómo se comportó en ARC-AGI 1. No por lograr resolver un 90,5% de los problemas con GPT-5.2 Pro (X-High), no, sino por cuánto costó cada tarea.
La cifra: 11,65 dólares por tarea. 390 veces menos que hace un año.
De hecho una versión aún más barata, GPT-5.2 (X-High) logró un 86,2% con un coste de tan solo 0,96 dólares por tarea. Alucinante.
ARC-AGI 2 sigue siendo un desafío para la mayoría de modelos, pero GPT-5.2 ha dado otro salto de calidad excepcional. Fuente: ARC-AGI Prize.
Chollet y su equipo sabían que la IA acabaría superando su test ARC-AGI tarde o temprano, así que en marzo de 2025 publicaron ARC-AGI 2, la segunda versión de su benchmark, para ponérselo aún más difícil a las máquinas. Ese test es aún un verdadero desafío para la mayoría de modelos, que hasta ahora apenas habían resuelto un 38% de los problemas en el mejor de los casos (Claude Opus 4.5).
GPT-5.2 ha logrado resolver casi el 55%. Es un salto colosal.
Y de nuevo, con un coste realmente sorprendente de 15,72 dólares por tarea. La tendencia es clara: la IA no solo está volviéndose mejor, sino que es cada vez más barata.
Eso son buenas noticias para todos, porque equilibran esa ya clara percepción de que el escalado no funciona tanto como en el pasado. Los saltos en rendimiento no son tan llamativos —aunque estas pruebas con ARC-AGI desmontan ese argumento—, pero sí lo son los saltos en cuanto a coste.
La carrera de la IA parece haber alcanzado un punto de inflexión. La verdadera pregunta no es si la IA logrará resolver un problema, sino cuánto costará resolverlo. Y la evolución de GPT-5.2 parece demostrar claramente algo crucial: que la IA cada vez resuelve más cosas a menor precio.
Eso es además algo crítico para una OpenAI que está en una situación económica delicada. Ahora que estamos más en una especie de meseta en cuanto a ganancias en rendimiento, lograr ser más baratos y eficientes es clave para el futuro de la empresa. Y parece que GPT-5.2, además de una respuesta a Gemini 3 Pro, es un paso claro en esa dirección.
En Xataka | Hay una carrera en la que Anthropic le está ganando la partida a OpenAI: en la de ser rentable
– La noticia
La gran pregunta que afronta GPT 5.2 no es si es mejor o peor que sus antecesores: es si sale más barato
fue publicada originalmente en
Xataka
por
Javier Pastor
.

