Ciencia y Tecnología
Claude Sonnet 4.6 promete hacer trámites por ti. Ahora tiene el reto de su vida: lidiar con las webs de la administración española
La última actualización de Claude no se anuncia como “más inteligente”: se anuncia como un agente que actúa. Sonnet 4.6 no solo razona, también navega webs, rellena formularios y completa trámites con el ratón y el teclado, como haría una persona. Es un salto cualitativo en lo que la IA puede hacer por ti, y no para ti.
La demostración elegida por Anthropic fue un ejemplo estupendo: un usuario renovando la matrícula de su coche en la web del equivalente americano a la DGT. Parece una web sencilla, funcional y bien diseñada. Queremos ver cómo le iría con la Sede Electrónica de la Agencia Tributaria.
El contexto. Claude ya había dado un gran salto este mes con la llegada de Opus 4.6 hace apenas dos semanas. Sonnet 4.6 es la versión intermedia, la que usan la mayoría de usuarios, incluyendo los del plan gratuito, y Anthropic la ha transformado en algo más que un chatbot mejorado: sus puntuaciones en OSWorld, el benchmark estándar para medir el uso de ordenadores por IA, han crecido de forma sostenida durante dieciséis meses.
La empresa afirma que tareas que antes requerían su modelo más potente (Opus 4.5 y 4.6) ahora las resuelve Sonnet 4.6, al mismo precio de siempre.
Entre líneas. Hay una estrategia de mercado muy clara aquí. Anthropic acaba de cerrar una ronda de 30.000 millones de dólares y emitió su primer anuncio en la Super Bowl tirando una pullita a OpenAI. Ahora democratiza capacidades agénticas en su plan gratuito. El objetivo no es solo captar a desarrolladores: es llegar al usuario de a pie y cambiar su relación cotidiana con la IA.
Cuando los chatbots empezaron a tener memoria, nuestra forma de interactuar con ellos cambió. Pasaron de herramientas a relaciones. Cuando empiecen a hacer cosas por nosotros de verdad, como reservar citas, rellenar impresos o gestionar papeleos infernales, el cambio será de otra magnitud.
Sí, pero. El reto técnico y cultural es enorme. La IA que navega ordenadores es vulnerable a ataques de prompt injection: instrucciones maliciosas ocultas en páginas web que pueden secuestrar al agente.
Anthropic ha mejorado la resistencia de Sonnet 4.6 en este punto, pero el problema no está resuelto. Y eso sin entrar en el ecosistema de webs gubernamentales europeas, donde la experiencia de usuario ya supone un reto para nosotros los humanos.
La gran pregunta. ¿Cuándo una demo brutal deja de ser una demo brutal y se convierte en algo que cualquiera usa para gestionar su declaración de la renta? Esa distancia, entre la promesa del agente y la realidad de la burocracia digital, es donde se va a jugar la partida de verdad, más allá del hype.
En Xataka | Qué es Claude Cowork, cómo funciona, y qué cosas puedes hacer con este asistente de IA en tu ordenador
Imagen destacada | Anthropic, Xataka
–
La noticia
Claude Sonnet 4.6 promete hacer trámites por ti. Ahora tiene el reto de su vida: lidiar con las webs de la administración española
fue publicada originalmente en
Xataka
por
Javier Lacort
.
La última actualización de Claude no se anuncia como “más inteligente”: se anuncia como un agente que actúa. Sonnet 4.6 no solo razona, también navega webs, rellena formularios y completa trámites con el ratón y el teclado, como haría una persona. Es un salto cualitativo en lo que la IA puede hacer por ti, y no para ti.
La demostración elegida por Anthropic fue un ejemplo estupendo: un usuario renovando la matrícula de su coche en la web del equivalente americano a la DGT. Parece una web sencilla, funcional y bien diseñada. Queremos ver cómo le iría con la Sede Electrónica de la Agencia Tributaria.
El contexto. Claude ya había dado un gran salto este mes con la llegada de Opus 4.6 hace apenas dos semanas. Sonnet 4.6 es la versión intermedia, la que usan la mayoría de usuarios, incluyendo los del plan gratuito, y Anthropic la ha transformado en algo más que un chatbot mejorado: sus puntuaciones en OSWorld, el benchmark estándar para medir el uso de ordenadores por IA, han crecido de forma sostenida durante dieciséis meses.
La empresa afirma que tareas que antes requerían su modelo más potente (Opus 4.5 y 4.6) ahora las resuelve Sonnet 4.6, al mismo precio de siempre.
En Xataka
Anthropic te va a cobrar seis veces más por algo que solo va dos veces más rápido: es el síntoma de una brecha problemática
Entre líneas. Hay una estrategia de mercado muy clara aquí. Anthropic acaba de cerrar una ronda de 30.000 millones de dólares y emitió su primer anuncio en la Super Bowl tirando una pullita a OpenAI. Ahora democratiza capacidades agénticas en su plan gratuito. El objetivo no es solo captar a desarrolladores: es llegar al usuario de a pie y cambiar su relación cotidiana con la IA.
Cuando los chatbots empezaron a tener memoria, nuestra forma de interactuar con ellos cambió. Pasaron de herramientas a relaciones. Cuando empiecen a hacer cosas por nosotros de verdad, como reservar citas, rellenar impresos o gestionar papeleos infernales, el cambio será de otra magnitud.
Sí, pero. El reto técnico y cultural es enorme. La IA que navega ordenadores es vulnerable a ataques de prompt injection: instrucciones maliciosas ocultas en páginas web que pueden secuestrar al agente.
Anthropic ha mejorado la resistencia de Sonnet 4.6 en este punto, pero el problema no está resuelto. Y eso sin entrar en el ecosistema de webs gubernamentales europeas, donde la experiencia de usuario ya supone un reto para nosotros los humanos.
La gran pregunta. ¿Cuándo una demo brutal deja de ser una demo brutal y se convierte en algo que cualquiera usa para gestionar su declaración de la renta? Esa distancia, entre la promesa del agente y la realidad de la burocracia digital, es donde se va a jugar la partida de verdad, más allá del hype.
En Xataka | Qué es Claude Cowork, cómo funciona, y qué cosas puedes hacer con este asistente de IA en tu ordenador
Imagen destacada | Anthropic, Xataka
– La noticia
Claude Sonnet 4.6 promete hacer trámites por ti. Ahora tiene el reto de su vida: lidiar con las webs de la administración española
fue publicada originalmente en
Xataka
por
Javier Lacort
.

