Ciencia y Tecnología

La gran pregunta que afronta GPT 5.2 no es si es mejor o peor que sus antecesores: es si sale más barato

Published

1 month ago

December 14, 2025

La gran pregunta que afronta GPT 5.2 no es si es mejor o peor que sus antecesores: es si sale más barato

En 2019 a un joven investigador llamado François Chollet se le ocurrió crear un benchmark para IA. La idea era como poco rarita, porque en 2019 no había prácticamente nada con lo que probar ese benchmark. En realidad Chollet se adelantó al futuro, porque aun faltaban tres años para que apareciera ChatGPT y se iniciara la fiebre por la IA.

Luego llegarían más y más benchmarks sintéticos para medir el rendimiento de las IAs, pero ARC-AGI era un benchmark distinto. Mientras que en muchos otros benchmarks la capacidad de memorización del modelo es crucial, aquí se ponía a prueba la capacidad de pensamiento abstracto y generalización de la IA.

En Xataka

Las IA se están volviendo muy listas. Y crear pruebas para ponerlas en aprietos está siendo cada vez más difícil

Los problemas propuestos en ARC-AGI y su sucesor, ARC-AGI 2, constan en gran medida de puzzles visuales que son relativamente fáciles de resolver por los seres humanos, pero que hasta ahora eran casi imposibles para las máquinas. En los últimos dos años hemos ido viendo no obstante cómo los modelos de IA iban mejorando en comprensión abstracta y generalización, y poco a poco resolvieron más y más puzzles de ARC-AGI. ¿El problema?

Gastaban un dineral para hacerlo.

Y ahí es donde entra GPT-5.2.

La IA puede resolver casi todo. La pregunta es cuánto cuesta hacerlo

El año pasado o3-preview logró resolver el 87% de ARC-AGI 1. El hito fue tan llamativo que hasta los propios responsables del benchmark publicaron un anuncio al respecto. Para lograrlo, eso sí, o3-preview ejecutó 100 tareas con un coste total de 456.000 dólares: cada una costó 4.560 dólares.

Arc Prize Leaderboard

Fuente: ARC-AGI Prize

Ayer se publicó GPT-5.2, la última versión del modelo fundacional de IA de OpenAI. Su rendimiento en otros benchmarks era excepcional, pero lo que realmente llama la atención es cómo se comportó en ARC-AGI 1. No por lograr resolver un 90,5% de los problemas con GPT-5.2 Pro (X-High), no, sino por cuánto costó cada tarea.

La cifra: 11,65 dólares por tarea. 390 veces menos que hace un año.

De hecho una versión aún más barata, GPT-5.2 (X-High) logró un 86,2% con un coste de tan solo 0,96 dólares por tarea. Alucinante.

Arc Agi 2prize Leaderboard

ARC-AGI 2 sigue siendo un desafío para la mayoría de modelos, pero GPT-5.2 ha dado otro salto de calidad excepcional. Fuente: ARC-AGI Prize.

Chollet y su equipo sabían que la IA acabaría superando su test ARC-AGI tarde o temprano, así que en marzo de 2025 publicaron ARC-AGI 2, la segunda versión de su benchmark, para ponérselo aún más difícil a las máquinas. Ese test es aún un verdadero desafío para la mayoría de modelos, que hasta ahora apenas habían resuelto un 38% de los problemas en el mejor de los casos (Claude Opus 4.5).

GPT-5.2 ha logrado resolver casi el 55%. Es un salto colosal.

Y de nuevo, con un coste realmente sorprendente de 15,72 dólares por tarea. La tendencia es clara: la IA no solo está volviéndose mejor, sino que es cada vez más barata.

Eso son buenas noticias para todos, porque equilibran esa ya clara percepción de que el escalado no funciona tanto como en el pasado. Los saltos en rendimiento no son tan llamativos —aunque estas pruebas con ARC-AGI desmontan ese argumento—, pero sí lo son los saltos en cuanto a coste.

La carrera de la IA parece haber alcanzado un punto de inflexión. La verdadera pregunta no es si la IA logrará resolver un problema, sino cuánto costará resolverlo. Y la evolución de GPT-5.2 parece demostrar claramente algo crucial: que la IA cada vez resuelve más cosas a menor precio.

Eso es además algo crítico para una OpenAI que está en una situación económica delicada. Ahora que estamos más en una especie de meseta en cuanto a ganancias en rendimiento, lograr ser más baratos y eficientes es clave para el futuro de la empresa. Y parece que GPT-5.2, además de una respuesta a Gemini 3 Pro, es un paso claro en esa dirección.

En Xataka | Hay una carrera en la que Anthropic le está ganando la partida a OpenAI: en la de ser rentable

–
La noticia

La gran pregunta que afronta GPT 5.2 no es si es mejor o peor que sus antecesores: es si sale más barato

fue publicada originalmente en

Xataka

por
Javier Pastor

.

En 2019 a un joven investigador llamado François Chollet se le ocurrió crear un benchmark para IA. La idea era como poco rarita, porque en 2019 no había prácticamente nada con lo que probar ese benchmark. En realidad Chollet se adelantó al futuro, porque aun faltaban tres años para que apareciera ChatGPT y se iniciara la fiebre por la IA.

En Xataka

Las IA se están volviendo muy listas. Y crear pruebas para ponerlas en aprietos está siendo cada vez más difícil

Gastaban un dineral para hacerlo.

Y ahí es donde entra GPT-5.2.

La IA puede resolver casi todo. La pregunta es cuánto cuesta hacerloEl año pasado o3-preview logró resolver el 87% de ARC-AGI 1. El hito fue tan llamativo que hasta los propios responsables del benchmark publicaron un anuncio al respecto. Para lograrlo, eso sí, o3-preview ejecutó 100 tareas con un coste total de 456.000 dólares: cada una costó 4.560 dólares.

Fuente: ARC-AGI Prize

La cifra: 11,65 dólares por tarea. 390 veces menos que hace un año.

De hecho una versión aún más barata, GPT-5.2 (X-High) logró un 86,2% con un coste de tan solo 0,96 dólares por tarea. Alucinante.

ARC-AGI 2 sigue siendo un desafío para la mayoría de modelos, pero GPT-5.2 ha dado otro salto de calidad excepcional. Fuente: ARC-AGI Prize.

GPT-5.2 ha logrado resolver casi el 55%. Es un salto colosal.

Y de nuevo, con un coste realmente sorprendente de 15,72 dólares por tarea. La tendencia es clara: la IA no solo está volviéndose mejor, sino que es cada vez más barata.

Eso es además algo crítico para una OpenAI que está en una situación económica delicada. Ahora que estamos más en una especie de meseta en cuanto a ganancias en rendimiento, lograr ser más baratos y eficientes es clave para el futuro de la empresa. Y parece que GPT-5.2, además de una respuesta a Gemini 3 Pro, es un paso claro en esa dirección.

En Xataka | Hay una carrera en la que Anthropic le está ganando la partida a OpenAI: en la de ser rentable

– La noticia

La gran pregunta que afronta GPT 5.2 no es si es mejor o peor que sus antecesores: es si sale más barato

fue publicada originalmente en

Xataka

por
Javier Pastor

ERM Digital

La gran pregunta que afronta GPT 5.2 no es si es mejor o peor que sus antecesores: es si sale más barato

Ciencia y Tecnología

La gran pregunta que afronta GPT 5.2 no es si es mejor o peor que sus antecesores: es si sale más barato

La IA puede resolver casi todo. La pregunta es cuánto cuesta hacerlo

Leave a Reply
Cancel reply

Leave a Reply

“Imposible” que EE.UU. adquiera Groenlandia, dice Rasmussen

Julio Iglesias contrata a un abogado para hacer frente a las acusaciones de abusos sexuales

Diputadas sostienen reunión estratégica con mandos militares en la región El Valle

Button comparte los mejores momentos de su carrera y sus F1 favoritos

Button juntaría a Russell y Verstappen en Mercedes: “¡Me encantaría verlo!”

Michael Flores lidera la tabla de posiciones en La Casa de Alofoke 2

Alcaldesa Carolina Mejía recibe valoración del Diputado Aníbal Díaz por la recuperación de espacios públicos

Carolina Mejía muestra hitos de su gestión al frente de Santo Domingo

Generación Z: “Del estallido social al tablero Geopolítico”

ERM Digital

La gran pregunta que afronta GPT 5.2 no es si es mejor o peor que sus antecesores: es si sale más barato

La IA puede resolver casi todo. La pregunta es cuánto cuesta hacerlo

You may like

Leave a Reply Cancel reply

Leave a Reply

“Imposible” que EE.UU. adquiera Groenlandia, dice Rasmussen

Julio Iglesias contrata a un abogado para hacer frente a las acusaciones de abusos sexuales

Diputadas sostienen reunión estratégica con mandos militares en la región El Valle

Button comparte los mejores momentos de su carrera y sus F1 favoritos

Button juntaría a Russell y Verstappen en Mercedes: “¡Me encantaría verlo!”

Michael Flores lidera la tabla de posiciones en La Casa de Alofoke 2

Alcaldesa Carolina Mejía recibe valoración del Diputado Aníbal Díaz por la recuperación de espacios públicos

Carolina Mejía muestra hitos de su gestión al frente de Santo Domingo

Generación Z: “Del estallido social al tablero Geopolítico”

Leave a Reply
Cancel reply