Ciencia y Tecnología
Creíamos que ChatGPT era solo un chatbot muy capaz. OpenAI acaba de convertirlo en algo muy distinto: un agente de verdad

Llevamos mucho tiempo hablando de agentes de inteligencia artificial, pero OpenAI acaba de convertir esa conversación en algo mucho más tangible. La compañía ha presentado ChatGPT Agent, una función que convierte su popular asistente en algo más autónomo: ahora es capaz de ejecutar tareas complejas usando un ordenador virtual, con herramientas que le permiten navegar, programar o incluso tomar decisiones.
De Operator a Agent. A principios de año presentó Operator, una herramienta que permitía a ChatGPT interactuar con páginas web. Luego llegó Deep Research, enfocada en redactar informes largos a partir de múltiples fuentes. La idea de fondo estaba clara: ir más allá de la conversación y acercarse a tareas reales. Lo que se ha presentado hoy es algo así como una herramienta que unifica todos estos avances anteriores.
Durante la demostración, los responsables del proyecto plantearon una situación cotidiana: organizar un viaje para asistir a una boda. El agente fue capaz de entender el contexto, buscar hoteles, proponer regalos, tener en cuenta el clima, el código de vestimenta e incluso recordar que había que comprar un traje. Lo hizo analizando el mensaje, accediendo a la web y actuando paso a paso, como lo haría una persona. La diferencia es que todo ocurrió dentro de ChatGPT, sin necesidad de alternar pestañas ni dar instrucciones una a una.
Un ordenador virtual para la IA. La clave está en que el agente no se limita a responder texto: opera dentro de una especie de ordenador virtual al que OpenAI le ha dado acceso. Puede usar un navegador de texto para leer páginas rápidamente, un navegador visual para interactuar con botones y formularios, e incluso un terminal para ejecutar comandos, generar código y manipular archivos. También puede trabajar con hojas de cálculo, presentaciones, y acceder a servicios como Google Drive, Calendar o GitHub si el usuario lo autoriza.
¿Qué hay bajo el capó? El modelo que impulsa ChatGPT Agent (desarrollado específicamente para esta función, aunque sin nombre oficial) fue entrenado con tareas complejas que requerían combinar múltiples herramientas. OpenAI utilizó aprendizaje por refuerzo, el mismo enfoque que ya emplea en sus modelos de razonamiento, para enseñarle a elegir cuándo usar el navegador, el terminal o una API. La idea fue desarrollar una solución capaz de decidir con precisión cómo actuar en función de cada objetivo.
En desarrollo.
Imágenes | OpenAI
–
La noticia
Creíamos que ChatGPT era solo un chatbot muy capaz. OpenAI acaba de convertirlo en algo muy distinto: un agente de verdad
fue publicada originalmente en
Xataka
por
Javier Marquez
.
Llevamos mucho tiempo hablando de agentes de inteligencia artificial, pero OpenAI acaba de convertir esa conversación en algo mucho más tangible. La compañía ha presentado ChatGPT Agent, una función que convierte su popular asistente en algo más autónomo: ahora es capaz de ejecutar tareas complejas usando un ordenador virtual, con herramientas que le permiten navegar, programar o incluso tomar decisiones.
De Operator a Agent. A principios de año presentó Operator, una herramienta que permitía a ChatGPT interactuar con páginas web. Luego llegó Deep Research, enfocada en redactar informes largos a partir de múltiples fuentes. La idea de fondo estaba clara: ir más allá de la conversación y acercarse a tareas reales. Lo que se ha presentado hoy es algo así como una herramienta que unifica todos estos avances anteriores.
Durante la demostración, los responsables del proyecto plantearon una situación cotidiana: organizar un viaje para asistir a una boda. El agente fue capaz de entender el contexto, buscar hoteles, proponer regalos, tener en cuenta el clima, el código de vestimenta e incluso recordar que había que comprar un traje. Lo hizo analizando el mensaje, accediendo a la web y actuando paso a paso, como lo haría una persona. La diferencia es que todo ocurrió dentro de ChatGPT, sin necesidad de alternar pestañas ni dar instrucciones una a una.
Un ordenador virtual para la IA. La clave está en que el agente no se limita a responder texto: opera dentro de una especie de ordenador virtual al que OpenAI le ha dado acceso. Puede usar un navegador de texto para leer páginas rápidamente, un navegador visual para interactuar con botones y formularios, e incluso un terminal para ejecutar comandos, generar código y manipular archivos. También puede trabajar con hojas de cálculo, presentaciones, y acceder a servicios como Google Drive, Calendar o GitHub si el usuario lo autoriza.
¿Qué hay bajo el capó? El modelo que impulsa ChatGPT Agent (desarrollado específicamente para esta función, aunque sin nombre oficial) fue entrenado con tareas complejas que requerían combinar múltiples herramientas. OpenAI utilizó aprendizaje por refuerzo, el mismo enfoque que ya emplea en sus modelos de razonamiento, para enseñarle a elegir cuándo usar el navegador, el terminal o una API. La idea fue desarrollar una solución capaz de decidir con precisión cómo actuar en función de cada objetivo.
En desarrollo.
Imágenes | OpenAI
En Xataka | Meta tiene tanta prisa por liderar la IA que ha hecho algo insólito: está construyendo un centro de datos en carpas
– La noticia
Creíamos que ChatGPT era solo un chatbot muy capaz. OpenAI acaba de convertirlo en algo muy distinto: un agente de verdad
fue publicada originalmente en
Xataka
por
Javier Marquez
.