Connect with us

Ciencia y Tecnología

Anthropic presenta Claude Opus 4.5: seguramente es el mejor modelo para programar, pero sigue teniendo un gran problema

Published

on

Anthropic presenta Claude Opus 4.5: seguramente es el mejor modelo para programar, pero sigue teniendo un gran problema

Anthropic ha anunciado Claude Opus 4.5, su modelo de IA más avanzado hasta la fecha. La empresa afirma que es el mejor del mundo para programación, agentes inteligentes y uso informático, superando a GPT-5.1 Codex-Max de OpenAI y Gemini 3 Pro de Google.

Ha llegado además unos días después que ambos así como de Grok 4.1.

La panorámica general. El nuevo modelo ha logrado un 80,9% de precisión en SWE-Bench Verified, el benchmark de referencia para evaluar capacidades de ingeniería de software.

Anthropic también lo ha sometido a su propia prueba de contratación para ingenieros –notablemente difícil, con límite de dos horas– y el modelo ha superado a todos los candidatos humanos que la hicieron.

Por qué es importante. Este lanzamiento consolida a Anthropic como líder en herramientas de IA para programación. Incluso Meta utiliza Claude para su asistente interno de código Devmate, pese a competir directamente con la empresa en otros terrenos.

Las mejoras no se limitan al código. Opus 4.5 destaca en:

  • Creación de documentos, hojas de cálculo y presentaciones profesionales.
  • Tareas de investigación profunda con múltiples fuentes.
  • Razonamiento visual y matemático avanzado.
  • Gestión de equipos de subagentes para sistemas multiagente complejos.

En cifras. Además, Anthropic ha reducido drásticamente el precio de su API: de 15/75 dólares por millón de tokens de entrada/salida a 5/25 dólares. Y el modelo es más eficiente que sus predecesores:

  • En modo de esfuerzo medio, iguala el rendimiento de Sonnet 4.5 pero consume un 76% menos de tokens.
  • En modo alto, supera a Sonnet 4.5 en 4,3 puntos porcentuales usando un 48% menos de tokens.

El contexto. La empresa ha introducido ese parámetro de “esfuerzo” (bajo, medio, alto) que permite a los desarrolladores controlar cuánto tiempo y tokens invierte el modelo en resolver un problema. Es una tendencia que OpenAI también ha adoptado en sus últimos modelos, buscando eficiencia sin sacrificar calidad.

En detalle. Junto al modelo, Anthropic ha actualizado su plataforma de desarrollo y sus aplicaciones para consumidores:

  • Claude Code mejora su modo de planificación: hace preguntas aclaratorias antes de crear un archivo editable con el plan de ejecución. Como lo visto con los Deep Research de turno.
  • Claude for Chrome ya está disponible para todos los usuarios Max (en torno a 100 y 200 dólares al mes en función de los límites), permitiendo que la IA gestione tareas en múltiples pestañas del navegador.
  • Claude for Excel se abre a usuarios Max, Team y Enterprise, con soporte para gráficos, tablas dinámicas y carga de archivos.
  • Conversaciones infinitas: las charlas largas ya no se topan con límites de ventana de contexto gracias a resúmenes automáticos.

Sí, pero. El gran problema de Opus 4.5 y de Claude en general es su límite de uso. Incluso para suscriptores Pro y Max del primer tier, los tokens se agotan rápidamente. Tardan cinco horas en reiniciarse desde el primer mensaje enviado. El modelo Opus, al ser el más potente, es también el que más rápido consume las cuotas.

Esto es la principal vía de frustraciones para los usuarios que pagan 20 o incluso 100 dólares al mes. Anthropic ha aumentado ligeramente los límites para Max y Team Premium, pero la experiencia sigue lejos de lo esperado en un servicio de esta categoría.

Entre líneas. El lanzamiento de Opus 4.5 restaura el equilibrio en la familia de modelos de Anthropic. Durante los últimos dos meses, Sonnet 4.5 estaba superando al antiguo Opus 4.1, dejando pocas razones para usar el modelo más caro. Ahora, con tres modelos claramente diferenciados (Haiku, Sonnet y Opus), cada uno tiene un propósito específico en cuanto a coste, velocidad y capacidad.

Y ahora qué. Anthropic sigue una estrategia clara: posicionarse como el proveedor premium para profesionales del conocimiento y desarrolladores, compitiendo directamente con OpenAI y Google en el terreno donde más importa la precisión y la confiabilidad.

Pero si no resuelve el problema de los límites de uso, corre el riesgo de frustrar precisamente a los usuarios que más valor podrían obtener del modelo.

En Xataka | La IA está transformando la relación que tenemos con nuestras propias ideas: ya no creamos, solo nos “editamos”

Imagen destacada | Anthropic


La noticia

Anthropic presenta Claude Opus 4.5: seguramente es el mejor modelo para programar, pero sigue teniendo un gran problema

fue publicada originalmente en

Xataka

por
Javier Lacort

.

​Anthropic ha anunciado Claude Opus 4.5, su modelo de IA más avanzado hasta la fecha. La empresa afirma que es el mejor del mundo para programación, agentes inteligentes y uso informático, superando a GPT-5.1 Codex-Max de OpenAI y Gemini 3 Pro de Google.
Ha llegado además unos días después que ambos así como de Grok 4.1.
La panorámica general. El nuevo modelo ha logrado un 80,9% de precisión en SWE-Bench Verified, el benchmark de referencia para evaluar capacidades de ingeniería de software.
Anthropic también lo ha sometido a su propia prueba de contratación para ingenieros –notablemente difícil, con límite de dos horas– y el modelo ha superado a todos los candidatos humanos que la hicieron.
Por qué es importante. Este lanzamiento consolida a Anthropic como líder en herramientas de IA para programación. Incluso Meta utiliza Claude para su asistente interno de código Devmate, pese a competir directamente con la empresa en otros terrenos.
Las mejoras no se limitan al código. Opus 4.5 destaca en:
Creación de documentos, hojas de cálculo y presentaciones profesionales.Tareas de investigación profunda con múltiples fuentes.Razonamiento visual y matemático avanzado.Gestión de equipos de subagentes para sistemas multiagente complejos.

En Xataka

OpenAI va por delante de Anthropic en todos los aspectos de la IA excepto en el más importante: sobrevivir

En cifras. Además, Anthropic ha reducido drásticamente el precio de su API: de 15/75 dólares por millón de tokens de entrada/salida a 5/25 dólares. Y el modelo es más eficiente que sus predecesores:
En modo de esfuerzo medio, iguala el rendimiento de Sonnet 4.5 pero consume un 76% menos de tokens.En modo alto, supera a Sonnet 4.5 en 4,3 puntos porcentuales usando un 48% menos de tokens.
El contexto. La empresa ha introducido ese parámetro de “esfuerzo” (bajo, medio, alto) que permite a los desarrolladores controlar cuánto tiempo y tokens invierte el modelo en resolver un problema. Es una tendencia que OpenAI también ha adoptado en sus últimos modelos, buscando eficiencia sin sacrificar calidad.
En detalle. Junto al modelo, Anthropic ha actualizado su plataforma de desarrollo y sus aplicaciones para consumidores:
Claude Code mejora su modo de planificación: hace preguntas aclaratorias antes de crear un archivo editable con el plan de ejecución. Como lo visto con los Deep Research de turno.Claude for Chrome ya está disponible para todos los usuarios Max (en torno a 100 y 200 dólares al mes en función de los límites), permitiendo que la IA gestione tareas en múltiples pestañas del navegador.Claude for Excel se abre a usuarios Max, Team y Enterprise, con soporte para gráficos, tablas dinámicas y carga de archivos.Conversaciones infinitas: las charlas largas ya no se topan con límites de ventana de contexto gracias a resúmenes automáticos.
Sí, pero. El gran problema de Opus 4.5 y de Claude en general es su límite de uso. Incluso para suscriptores Pro y Max del primer tier, los tokens se agotan rápidamente. Tardan cinco horas en reiniciarse desde el primer mensaje enviado. El modelo Opus, al ser el más potente, es también el que más rápido consume las cuotas.
Esto es la principal vía de frustraciones para los usuarios que pagan 20 o incluso 100 dólares al mes. Anthropic ha aumentado ligeramente los límites para Max y Team Premium, pero la experiencia sigue lejos de lo esperado en un servicio de esta categoría.

Entre líneas. El lanzamiento de Opus 4.5 restaura el equilibrio en la familia de modelos de Anthropic. Durante los últimos dos meses, Sonnet 4.5 estaba superando al antiguo Opus 4.1, dejando pocas razones para usar el modelo más caro. Ahora, con tres modelos claramente diferenciados (Haiku, Sonnet y Opus), cada uno tiene un propósito específico en cuanto a coste, velocidad y capacidad.
Y ahora qué. Anthropic sigue una estrategia clara: posicionarse como el proveedor premium para profesionales del conocimiento y desarrolladores, compitiendo directamente con OpenAI y Google en el terreno donde más importa la precisión y la confiabilidad.
Pero si no resuelve el problema de los límites de uso, corre el riesgo de frustrar precisamente a los usuarios que más valor podrían obtener del modelo.
En Xataka | La IA está transformando la relación que tenemos con nuestras propias ideas: ya no creamos, solo nos “editamos”
Imagen destacada | Anthropic

– La noticia

Anthropic presenta Claude Opus 4.5: seguramente es el mejor modelo para programar, pero sigue teniendo un gran problema

fue publicada originalmente en

Xataka

por
Javier Lacort

.   

​   

​ 

Continue Reading
Click to comment

Leave a Reply

Your email address will not be published. Required fields are marked *