De Ultimo Minuto
Microsoft desarrolla la IA que les falta a la mayoría de robots: la capacidad de decidir bien
<p>La <strong>robótica</strong> avanza rápidamente, pero la mayoría de los robots sigue enfrentando una limitación fundamental: la dificultad para <strong>tomar decisiones</strong> precisas sobre qué acción realizar y dónde llevarla a cabo. <strong>Microsoft</strong>, junto a un consorcio de investigadores académicos, ha presentado un nuevo estándar, <strong>GroundedPlanBench</strong>, que busca resolver este desafío y acercar la inteligencia artificial de los robots a la toma de decisiones eficiente y contextualizada.</p>
<p>En los sistemas robóticos convencionales, el proceso de decisión se divide en <strong>dos etapas</strong>. Primero, un modelo de visión y lenguaje genera un plan en lenguaje natural. Después, otro sistema traduce ese plan en acciones físicas. Este enfoque fragmentado provoca errores frecuentes, ya que la desconexión entre el plan y la ejecución permite que las equivocaciones en una etapa se trasladen a la siguiente.</p>
<p>Errores típicos incluyen <strong>confusiones sobre qué objeto manipular</strong> o la invención de pasos innecesarios. Por ejemplo, si se le pide a un robot descartar vasos de papel, puede no identificar correctamente cuál vaso debe recoger o incluso realizar acciones no solicitadas. Estas fallas se agravan en entornos desordenados, donde los objetos son similares o numerosos.</p>
<h5 class="wp-block-heading"><strong>Recomendamos leer:<a href="https://deultimominuto.net/tecnologia/openai-cerrara-sora-su-plataforma/">OpenAI cerrará Sora, su plataforma de generación de videos con IA</a></strong></h5>
<h2 class="wp-block-heading"><strong>GroundedPlanBench: un nuevo estándar para mejorar la toma de decisiones</strong></h2>
<p>Para enfrentar este desafío, <strong>Microsoft y sus socios</strong> han desarrollado <strong>GroundedPlanBench</strong>, un sistema que evalúa si los modelos de IA pueden planificar tareas y, al mismo tiempo, identificar con precisión dónde debe realizarse cada acción.</p>
<p>A diferencia de los sistemas tradicionales que solo utilizan texto, este estándar <strong>vincula cada acción a una ubicación específica en una imagen</strong>. Acciones como agarrar, colocar, abrir o cerrar se asocian a objetos o posiciones determinadas, obligando a la IA a conectar la decisión con el entorno físico real.</p>
<p>El benchmark incluye <strong>más de mil tareas</strong> basadas en interacciones reales de robots. Algunas instrucciones son directas, como colocar una cuchara en un plato, mientras que otras son abiertas, como ordenar una mesa. Esta variedad es crucial, ya que los robots suelen fallar cuando las indicaciones no son lo suficientemente claras.</p>
<p>En uno de los experimentos, un robot debía colocar <strong>cuatro servilletas en un sofá</strong>. La falta de especificidad en la instrucción hizo que el sistema repitiera la acción sobre la misma servilleta, incluso con descripciones aparentemente más precisas como “servilleta superior izquierda”. Esto evidencia que el lenguaje ambiguo sigue representando un obstáculo para la ejecución fiable de tareas complejas.</p>
<h2 class="wp-block-heading"><strong>Aprendizaje basado en tareas reales</strong></h2>
<p>Para mejorar la capacidad de decisión, el equipo desarrolló un método de entrenamiento denominado <strong>Video-to-Spatially Grounded Planning (V2GP)</strong>. Este sistema analiza videos de robots realizando tareas, detecta las interacciones con objetos, identifica dichos objetos y rastrea sus ubicaciones, generando así planes estructurados que vinculan cada acción con un punto específico.</p>
<p>Mediante este enfoque, los investigadores generaron <strong>más de 40.000 planes “arraigados”</strong>, que van desde acciones simples hasta secuencias complejas de hasta 26 pasos. Los modelos entrenados con este método demostraron una mejor capacidad para elegir acciones adecuadas y asociarlas con los objetos correctos, además de reducir errores repetitivos como actuar varias veces sobre el mismo elemento.</p>
<h2 class="wp-block-heading"><strong>Un cambio de paradigma para la robótica</strong></h2>
<p>Pese a los avances, los retos persisten, especialmente en tareas largas y con instrucciones indirectas. Los investigadores advierten que los modelos deben ser capaces de razonar sobre <strong>secuencias extensas</strong> y mantener la coherencia a lo largo de múltiples pasos. Al comparar el nuevo enfoque con los sistemas tradicionales, se observó que estos últimos tienden a asignar <strong>múltiples acciones al mismo objeto o lugar</strong>, sobre todo cuando las órdenes son ambiguas.</p>
<p>La <strong>integración de planificación y localización</strong> en un único proceso reduce estos desajustes y permite decisiones más precisas. El equipo de Microsoft sugiere que futuras investigaciones podrían combinar este método con modelos predictivos capaces de anticipar las consecuencias de cada acción, lo que ayudaría a los robots a evitar errores en tiempo real.</p>
<h5 class="wp-block-heading"><strong>También puedes leer:<a href="https://deultimominuto.net/tecnologia/un-proyecto-europeo-definira/">Un proyecto europeo definirá un código ético de la IA en la educación y políticas públicas</a></strong></h5>
<p>Las conclusiones del estudio apuntan a una dirección clara para el futuro de la robótica: los sistemas que consideran de manera conjunta la <strong>acción y la ubicación</strong> tienen más probabilidades de operar con éxito en ambientes reales. Esta innovación representa un <strong>paso clave</strong> para que los robots puedan decidir y actuar de manera fiable en tareas cotidianas, acercándolos a una verdadera inteligencia artificial aplicada.</p>
<figure class="wp-block-gallery has-nested-images columns-default is-cropped wp-block-gallery-1 is-layout-flex wp-block-gallery-is-layout-flex">
<figure class="wp-block-image size-large"><img width="992" height="681" data-id="631643" src="https://deultimominuto.net/wp-content/uploads/2026/03/FP3SV4PNMZGODPHEORFSY7EHUM.avif" alt="Microsoft desarrolla la IA que les falta a la mayoría de robots: la capacidad de decidir bien - Noticias de hoy en República Dominicana | De Último Minuto" class="wp-image-631643" title="Microsoft desarrolla la IA que les falta a la mayoría de robots: la capacidad de decidir bien | 1 |"></figure>
<figure class="wp-block-image size-large"><img width="992" height="554" data-id="631644" src="https://deultimominuto.net/wp-content/uploads/2026/03/3WCM6YREBRGT5KYZQNKC26XICU.avif" alt="Microsoft desarrolla la IA que les falta a la mayoría de robots: la capacidad de decidir bien - Noticias de hoy en República Dominicana | De Último Minuto" class="wp-image-631644" title="Microsoft desarrolla la IA que les falta a la mayoría de robots: la capacidad de decidir bien | 2 |"></figure>
<figure class="wp-block-image size-large"><img width="992" height="661" data-id="631645" src="https://deultimominuto.net/wp-content/uploads/2026/03/PCYRFCDOZFFNXD7DLIOXIDBI4A.avif" alt="Microsoft desarrolla la IA que les falta a la mayoría de robots: la capacidad de decidir bien - Noticias de hoy en República Dominicana | De Último Minuto" class="wp-image-631645" title="Microsoft desarrolla la IA que les falta a la mayoría de robots: la capacidad de decidir bien | 3 |"></figure>
</figure>
<p>​El nuevo sistema ayuda a reducir errores típicos de los robots en tareas cotidianas y ambientes desordenados Tecnología, IA, Microsoft </p>