Ciencia y Tecnología

Anthropic dice que Claude Mythos es demasiado potente para hacerlo público. La pregunta es si esto no es más que un "que viene el lobo"

Published

on

<p>&NewLine; <img src&equals;"https&colon;&sol;&sol;i&period;blogs&period;es&sol;3d4590&sol;mythos-rendimiento&sol;1024&lowbar;2000&period;jpeg" alt&equals;'Anthropic dice que Claude Mythos es demasiado potente para hacerlo público&period; La pregunta es si esto no es más que un "que viene el lobo" '>&NewLine; <&sol;p>&NewLine;<p><a href&equals;"https&colon;&sol;&sol;www&period;xataka&period;com&sol;robotica-e-ia&sol;claude-mythos-modelo-ia-potente-que-da-miedo-asi-que-anthropic-ha-decidido-que-no-vas-a-poder-usarlo&num;mrfhud&equals;true">Claude Mythos Preview<&sol;a> es el mejor modelo de IA jamás creado&period; No lo decimos nosotros&comma; lo dice Anthropic&comma; pero es que casi nadie más puede decirlo porque solo un selecto grupo de empresas tiene acceso a dicho modelo&period; <a class&equals;"text-outboundlink" href&equals;"https&colon;&sol;&sol;www&period;xataka&period;com&sol;robotica-e-ia&sol;claude-mythos-da-miedo-sabe-bien-ingeniero-que-comia-sandwich-parque-cuando-recibio-terrorifico-email-esta-ia" data-vars-post-title&equals;"Un trabajador de Anthropic estaba merendando cuando recibió un mail que jamás debería haber recibido&colon; era Mythos" data-vars-post-url&equals;"https&colon;&sol;&sol;www&period;xataka&period;com&sol;robotica-e-ia&sol;claude-mythos-da-miedo-sabe-bien-ingeniero-que-comia-sandwich-parque-cuando-recibio-terrorifico-email-esta-ia">Las capacidades del modelo en materia de ciberseguridad parecen ser asombrosas<&sol;a>&comma; pero cada vez más expertos afirman que aunque Mythos es mejor que sus predecesores&comma; no es el salto revolucionario que parece plantear Anthropic&period; ¿Es esa forma de lanzar el modelo tan solo una forma efectiva de crear <em>hype<&sol;em>&quest;<&sol;p>&NewLine;<p><&excl;-- BREAK 1 --><&sol;p>&NewLine;<p><strong>Cuidado con el discurso de Anthropic<&sol;strong>&period; El conocido emprendedor y analista Gary Marcus daba recientemente <a rel&equals;"noopener&comma; noreferrer" href&equals;"https&colon;&sol;&sol;garymarcus&period;substack&period;com&sol;p&sol;three-reasons-to-think-that-the-claude">tres razones<&sol;a> por las que según él el lanzamiento de Mythos no es tan revolucionario como Anthropic quiere hacernos ver&period; Citaba <a rel&equals;"noopener&comma; noreferrer" href&equals;"https&colon;&sol;&sol;x&period;com&sol;philogroves&sol;status&sol;2042195139477557499">tuits de ingenieros software<&sol;a> y expertos en ciberseguridad que ponían en duda las afirmaciones de Anthropic&period; La empresa publicó un estudio sobre las capacidades de Claude Mythos Preview que parecía convertirlo en una herramienta extraordinaria para el ámbito de la ciberseguridad&comma; pero que al mismo tiempo eran tan potente que podía ser muy peligrosa de caer en malas manos&period;<&sol;p>&NewLine;<p><&excl;-- BREAK 2 --><&sol;p>&NewLine;<div class&equals;"article-asset-image article-asset-normal article-asset-center">&NewLine;<div class&equals;"asset-content">&NewLine; <a rel&equals;"noopener&comma; noreferrer" href&equals;"https&colon;&sol;&sol;x&period;com&sol;gum1h0x&sol;status&sol;2041917868158202022"><&sol;p>&NewLine;<p> <img alt&equals;"Captura De Pantalla 2026 04 10 A Las 11 54 47" class&equals;"centro&lowbar;sinmarco" src&equals;"https&colon;&sol;&sol;i&period;blogs&period;es&sol;715d04&sol;captura-de-pantalla-2026-04-10-a-las-11&period;54&period;47&sol;450&lowbar;1000&period;jpeg"><br &sol;>&NewLine; <&sol;a><&sol;p><&sol;div>&NewLine;<&sol;div>&NewLine;<p><strong>¿No es para tanto&quest;<&sol;strong> Entre los  logros de Claude Mythos&comma; Anthropic destacó cómo había encontrado vulnerabilidades en Firefox 147&period; Pero en realidad muchos de los fallos eran básicamente variaciones de los dos mismos bugs&period; Si los elikminabas de la ecuación&comma; la tasa de efectividad de Mythos para encontrar nuevos exploits bajaba mucho&comma; incluso por debajo de Opus 4&period;6&period; Anthropic no ocultaba ese hecho&comma; desde luego&comma; pero hace que por ejemplo dicha capacidad no parezca tan llamativa&period; Un usuario de X <a rel&equals;"noopener&comma; noreferrer" href&equals;"https&colon;&sol;&sol;x&period;com&sol;gum1h0x&sol;status&sol;2041917868158202022">criticaba también<&sol;a> el uso de Cybench como benchmark de ciberseguridad cuando Opus 4&period;6 casi lo superaba casi totalmente&period; Para él la elección de algunas de las pruebas de Anthropic era discutible por no ser ningún reto para los modelos actuales&period;<&sol;p>&NewLine;<p><&excl;-- BREAK 3 --><&sol;p>&NewLine;<div class&equals;"article-asset-image article-asset-normal article-asset-center">&NewLine;<div class&equals;"asset-content">&NewLine;<p> <img alt&equals;"Captura De Pantalla 2026 04 10 A Las 11 11 06" class&equals;"centro&lowbar;sinmarco" src&equals;"https&colon;&sol;&sol;i&period;blogs&period;es&sol;bb4b67&sol;captura-de-pantalla-2026-04-10-a-las-11&period;11&period;06&sol;450&lowbar;1000&period;jpeg"><&sol;p><&sol;div>&NewLine;<&sol;div>&NewLine;<p><strong>Otros modelos pueden hacer lo mismo<&sol;strong>&period; El cofundador y CEO de Hugging Face&comma; Clement Delangue&comma; afirmaba que Mythos no era para tanto&period; Su argumento&colon; ellos habían usado modelos abiertos pequeños y baratos&comma; habían aislado el código relevante de algunos ejemplos de las vulnerabilidades encontradas por Mythos y <a rel&equals;"noopener&comma; noreferrer" href&equals;"https&colon;&sol;&sol;aisle&period;com&sol;blog&sol;ai-cybersecurity-after-mythos-the-jagged-frontier">encontraron los mismos problemas<&sol;a> que ya había detectado el modelo de Anthropic&period; <&sol;p>&NewLine;<p><&excl;-- BREAK 4 --><&sol;p>&NewLine;<div class&equals;"article-asset-image article-asset-normal article-asset-center">&NewLine;<div class&equals;"asset-content">&NewLine;<div class&equals;"caption-img ">&NewLine;<p> <img alt&equals;"Captura De Pantalla 2026 04 10 A Las 12 11 18" class&equals;"centro&lowbar;sinmarco" src&equals;"https&colon;&sol;&sol;i&period;blogs&period;es&sol;7c1d9c&sol;captura-de-pantalla-2026-04-10-a-las-12&period;11&period;18&sol;450&lowbar;1000&period;jpeg"><&sol;p>&NewLine;<p> <span>Según el índice Epoch Capabilities Index que mide la capacidad de modelos de IA conjugando varios benchmarks&comma; el salto que ha dado Mythos es llamativo y "se sale" de la línea progresiva de sus predecesores&period; Fuente&colon; Anthropic&period;<&sol;span>&NewLine; <&sol;div>&NewLine;<&sol;p><&sol;div>&NewLine;<&sol;div>&NewLine;<p><strong>Sesgo del observador<&sol;strong>&period; Pero aquí hay que señalar que en esos análisis sabían dónde mirar porque Mythos ya había encontrado esos problemas&period; Estamos ante el sesgo del observador&comma; y de hecho en el documento de Hugging Face se deja claro que incluso le dieron pistas específicas como "considera el desbordamiento de enteros"&rpar; para que encontrara esos fallos&period; Y sobre esta observación&comma; otra&colon; en Hugging Face no dicen que un modelo pequeño pueda sustituir a Mythos por sí solo&comma; pero que  sí puede ser muy bueno dándole el fragmento de código adecuado&period; Mythos parece más capaz para fallos de seguridad complejos a ciegas&comma; pero es que es un modelo enorme y por eso tiene esa mayor capacidad&period; O lo que es lo mismo&colon; Mythos es mejor porque tiene el tamaño&comma; diseño y recursos para serlo&period;<&sol;p>&NewLine;<p><&excl;-- BREAK 5 --><&sol;p>&NewLine;<div class&equals;"article-asset-image article-asset-normal article-asset-center">&NewLine;<div class&equals;"asset-content">&NewLine; <a rel&equals;"noopener&comma; noreferrer" href&equals;"https&colon;&sol;&sol;x&period;com&sol;MarioBalukcic&sol;status&sol;2041997400806432951"><&sol;p>&NewLine;<p> <img alt&equals;"Captura De Pantalla 2026 04 10 A Las 11 31 00" class&equals;"centro&lowbar;sinmarco" src&equals;"https&colon;&sol;&sol;i&period;blogs&period;es&sol;64e38b&sol;captura-de-pantalla-2026-04-10-a-las-11&period;31&period;00&sol;450&lowbar;1000&period;jpeg"><br &sol;>&NewLine; <&sol;a><&sol;p><&sol;div>&NewLine;<&sol;div>&NewLine;<p><strong>¿Miedo&comma; incertidumbre&comma; duda&quest;<&sol;strong> El lenguaje utilizado por Anthropic en este anuncio podría ser considerado hasta cierto punto un uso claro del FUD &lpar;"Fear&comma; Uncertainty&comma; Doubt" -&gt&semi; "Miedo&comma; Incertidumbre&comma; Duda"&rpar; como técnica de marketing&period; Es un recurso que se ha visto en el pasado&comma; y por ejemplo OpenAI ya dijo en 2019 —años antes del lanzamiento de ChatGPT— que <a rel&equals;"noopener&comma; noreferrer" href&equals;"https&colon;&sol;&sol;www&period;theguardian&period;com&sol;technology&sol;2019&sol;feb&sol;14&sol;elon-musk-backed-ai-writes-convincing-news-fiction">GPT-2 era demasiado peligroso para un lanzamiento público<&sol;a>&period; Obviamente no lo era&comma; pero eso desde luego sirvió para crear expectación sobre la verdadera capacidad del modelo&period;<&sol;p>&NewLine;<p><&excl;-- BREAK 6 --><&sol;p>&NewLine;<div class&equals;"article-asset-image article-asset-normal article-asset-center">&NewLine;<div class&equals;"asset-content">&NewLine; <a rel&equals;"noopener&comma; noreferrer" href&equals;"https&colon;&sol;&sol;x&period;com&sol;ramez&sol;status&sol;2041946766598402459"><&sol;p>&NewLine;<p> <img alt&equals;"Captura De Pantalla 2026 04 10 A Las 11 50 09" class&equals;"centro&lowbar;sinmarco" src&equals;"https&colon;&sol;&sol;i&period;blogs&period;es&sol;036b4e&sol;captura-de-pantalla-2026-04-10-a-las-11&period;50&period;09&sol;450&lowbar;1000&period;jpeg"><br &sol;>&NewLine; <&sol;a><&sol;p><&sol;div>&NewLine;<&sol;div>&NewLine;<p><strong>Es mejor&comma; pero quizás no sea revolucionario<&sol;strong>&period; Los resultados de los benchmarks que Anthropic publicó ya dejaban claro que aunque hay saltos muy notables en algunas pruebas&comma; en otras la evolución es mucho menos llamativa&period; Claude Mythos no era el mejor en todo&comma; y ahora aparecen analistas que contrastan esos datos con otras métricas&period; Por ejemplo&comma; con el Epoch Capabilities Index &lpar;ECI&rpar; de Epoch AI&comma; la startup que tiene <a class&equals;"text-outboundlink" href&equals;"https&colon;&sol;&sol;www&period;xataka&period;com&sol;robotica-e-ia&sol;no-sabemos-que-miden-exactamente-benchmarks-ia-asi-que-hemos-hablado-espanol-que-ha-creado-uno-dificiles" data-vars-post-title&equals;"No sabemos qué miden los benchmarks de IA&period; Así que hemos hablado con el español que ha creado uno de los más difíciles" data-vars-post-url&equals;"https&colon;&sol;&sol;www&period;xataka&period;com&sol;robotica-e-ia&sol;no-sabemos-que-miden-exactamente-benchmarks-ia-asi-que-hemos-hablado-espanol-que-ha-creado-uno-dificiles">uno de los benchmarks más reputados<&sol;a> de la industria&period; Y según dicho índice&comma; Claude Mythos está por encima de sus rivales&comma; <a rel&equals;"noopener&comma; noreferrer" href&equals;"https&colon;&sol;&sol;x&period;com&sol;ramez&sol;status&sol;2041946766598402459">pero no por mucho<&sol;a>&period;<&sol;p>&NewLine;<p><&excl;-- BREAK 7 --><&sol;p>&NewLine;<div class&equals;"article-asset-video article-asset-normal">&NewLine;<div class&equals;"asset-content">&NewLine;<div class&equals;"base-asset-video">&NewLine;<div class&equals;"js-dailymotion"><&sol;div>&NewLine;<&sol;p><&sol;div>&NewLine;<&sol;p><&sol;div>&NewLine;<&sol;div>&NewLine;<p><strong>Que viene el lobo<&sol;strong>&period; Lo cierto es que el lanzamiento de Claude Mythos Preview ha sido realmente llamativa y los documentos que acompañaron a ese documento nos habla de un modelo de IA realmente capaz&period; El problema es que es imposible verificarlo porque solo unas pocas empresas tienen acceso a él y pueden probarlo&period; Sin esa disponibilidad pública lo único que podemos hacer es fiarnos &lpar;o no&rpar; de lo que nos dice Anthropic&comma; y esa es la cuestión&colon; que no está claro que debamos hacerlo&period; A la empresa le interesa que compremos ese discurso&comma; obviamente&comma; pero sin un análisis independiente resulta imposible verificar esas afirmaciones&period;<&sol;p>&NewLine;<p><&excl;-- BREAK 8 --><&sol;p>&NewLine;<p>En Xataka &vert; <a class&equals;"text-outboundlink" href&equals;"https&colon;&sol;&sol;www&period;xataka&period;com&sol;robotica-e-ia&sol;anthropic-se-ha-convertido-nina-bonita-ia-se-ha-buscado-socio-para-garantizar-su-futuro-no-que-pensabamos" data-vars-post-title&equals;"Anthropic se ha convertido en la niña bonita de la IA y se ha buscado un socio para garantizar su futuro&period; No es el que pensábamos " data-vars-post-url&equals;"https&colon;&sol;&sol;www&period;xataka&period;com&sol;robotica-e-ia&sol;anthropic-se-ha-convertido-nina-bonita-ia-se-ha-buscado-socio-para-garantizar-su-futuro-no-que-pensabamos">Anthropic se ha convertido en la niña bonita de la IA y se ha buscado un socio para garantizar su futuro&period; No es el que pensábamos<&sol;a><&sol;p>&NewLine;<p> &&num;8211&semi; <br &sol;> La noticia<br &sol;>&NewLine; <a href&equals;"https&colon;&sol;&sol;www&period;xataka&period;com&sol;robotica-e-ia&sol;anthropic-dice-que-claude-mythos-demasiado-potente-para-hacerlo-publico-pregunta-esto-no-que-que-viene-lobo&quest;utm&lowbar;source&equals;feedburner&amp&semi;utm&lowbar;medium&equals;feed&amp&semi;utm&lowbar;campaign&equals;10&lowbar;Apr&lowbar;2026"><br &sol;>&NewLine; <em> Anthropic dice que Claude Mythos es demasiado potente para hacerlo público&period; La pregunta es si esto no es más que un "que viene el lobo" <&sol;em><br &sol;>&NewLine; <&sol;a><br &sol;>&NewLine; fue publicada originalmente en<br &sol;>&NewLine; <a href&equals;"https&colon;&sol;&sol;www&period;xataka&period;com&sol;&quest;utm&lowbar;source&equals;feedburner&amp&semi;utm&lowbar;medium&equals;feed&amp&semi;utm&lowbar;campaign&equals;10&lowbar;Apr&lowbar;2026"><br &sol;>&NewLine; <strong> Xataka <&sol;strong><br &sol;>&NewLine; <&sol;a><br &sol;>&NewLine; por <a href&equals;"https&colon;&sol;&sol;www&period;xataka&period;com&sol;autor&sol;javier-pastor&quest;utm&lowbar;source&equals;feedburner&amp&semi;utm&lowbar;medium&equals;feed&amp&semi;utm&lowbar;campaign&equals;10&lowbar;Apr&lowbar;2026"><br &sol;>&NewLine; Javier Pastor<br &sol;>&NewLine; <&sol;a><br &sol;>&NewLine; &period; <&sol;p>&NewLine;<p> Claude Mythos Preview es el mejor modelo de IA jamás creado&period; No lo decimos nosotros&comma; lo dice Anthropic&comma; pero es que casi nadie más puede decirlo porque solo un selecto grupo de empresas tiene acceso a dicho modelo&period; Las capacidades del modelo en materia de ciberseguridad parecen ser asombrosas&comma; pero cada vez más expertos afirman que aunque Mythos es mejor que sus predecesores&comma; no es el salto revolucionario que parece plantear Anthropic&period; ¿Es esa forma de lanzar el modelo tan solo una forma efectiva de crear hype&quest;<&sol;p>&NewLine;<p>Cuidado con el discurso de Anthropic&period; El conocido emprendedor y analista Gary Marcus daba recientemente tres razones por las que según él el lanzamiento de Mythos no es tan revolucionario como Anthropic quiere hacernos ver&period; Citaba tuits de ingenieros software y expertos en ciberseguridad que ponían en duda las afirmaciones de Anthropic&period; La empresa publicó un estudio sobre las capacidades de Claude Mythos Preview que parecía convertirlo en una herramienta extraordinaria para el ámbito de la ciberseguridad&comma; pero que al mismo tiempo eran tan potente que podía ser muy peligrosa de caer en malas manos&period;<&sol;p>&NewLine;<p>¿No es para tanto&quest; Entre los  logros de Claude Mythos&comma; Anthropic destacó cómo había encontrado vulnerabilidades en Firefox 147&period; Pero en realidad muchos de los fallos eran básicamente variaciones de los dos mismos bugs&period; Si los elikminabas de la ecuación&comma; la tasa de efectividad de Mythos para encontrar nuevos exploits bajaba mucho&comma; incluso por debajo de Opus 4&period;6&period; Anthropic no ocultaba ese hecho&comma; desde luego&comma; pero hace que por ejemplo dicha capacidad no parezca tan llamativa&period; Un usuario de X criticaba también el uso de Cybench como benchmark de ciberseguridad cuando Opus 4&period;6 casi lo superaba casi totalmente&period; Para él la elección de algunas de las pruebas de Anthropic era discutible por no ser ningún reto para los modelos actuales&period;<&sol;p>&NewLine;<p>Otros modelos pueden hacer lo mismo&period; El cofundador y CEO de Hugging Face&comma; Clement Delangue&comma; afirmaba que Mythos no era para tanto&period; Su argumento&colon; ellos habían usado modelos abiertos pequeños y baratos&comma; habían aislado el código relevante de algunos ejemplos de las vulnerabilidades encontradas por Mythos y encontraron los mismos problemas que ya había detectado el modelo de Anthropic&period; <&sol;p>&NewLine;<p> Según el índice Epoch Capabilities Index que mide la capacidad de modelos de IA conjugando varios benchmarks&comma; el salto que ha dado Mythos es llamativo y "se sale" de la línea progresiva de sus predecesores&period; Fuente&colon; Anthropic&period;<&sol;p>&NewLine;<p>Sesgo del observador&period; Pero aquí hay que señalar que en esos análisis sabían dónde mirar porque Mythos ya había encontrado esos problemas&period; Estamos ante el sesgo del observador&comma; y de hecho en el documento de Hugging Face se deja claro que incluso le dieron pistas específicas como "considera el desbordamiento de enteros"&rpar; para que encontrara esos fallos&period; Y sobre esta observación&comma; otra&colon; en Hugging Face no dicen que un modelo pequeño pueda sustituir a Mythos por sí solo&comma; pero que  sí puede ser muy bueno dándole el fragmento de código adecuado&period; Mythos parece más capaz para fallos de seguridad complejos a ciegas&comma; pero es que es un modelo enorme y por eso tiene esa mayor capacidad&period; O lo que es lo mismo&colon; Mythos es mejor porque tiene el tamaño&comma; diseño y recursos para serlo&period;<&sol;p>&NewLine;<p>¿Miedo&comma; incertidumbre&comma; duda&quest; El lenguaje utilizado por Anthropic en este anuncio podría ser considerado hasta cierto punto un uso claro del FUD &lpar;"Fear&comma; Uncertainty&comma; Doubt" -&gt&semi; "Miedo&comma; Incertidumbre&comma; Duda"&rpar; como técnica de marketing&period; Es un recurso que se ha visto en el pasado&comma; y por ejemplo OpenAI ya dijo en 2019 —años antes del lanzamiento de ChatGPT— que GPT-2 era demasiado peligroso para un lanzamiento público&period; Obviamente no lo era&comma; pero eso desde luego sirvió para crear expectación sobre la verdadera capacidad del modelo&period;<&sol;p>&NewLine;<p>Es mejor&comma; pero quizás no sea revolucionario&period; Los resultados de los benchmarks que Anthropic publicó ya dejaban claro que aunque hay saltos muy notables en algunas pruebas&comma; en otras la evolución es mucho menos llamativa&period; Claude Mythos no era el mejor en todo&comma; y ahora aparecen analistas que contrastan esos datos con otras métricas&period; Por ejemplo&comma; con el Epoch Capabilities Index &lpar;ECI&rpar; de Epoch AI&comma; la startup que tiene uno de los benchmarks más reputados de la industria&period; Y según dicho índice&comma; Claude Mythos está por encima de sus rivales&comma; pero no por mucho&period;<&sol;p>&NewLine;<p>Que viene el lobo&period; Lo cierto es que el lanzamiento de Claude Mythos Preview ha sido realmente llamativa y los documentos que acompañaron a ese documento nos habla de un modelo de IA realmente capaz&period; El problema es que es imposible verificarlo porque solo unas pocas empresas tienen acceso a él y pueden probarlo&period; Sin esa disponibilidad pública lo único que podemos hacer es fiarnos &lpar;o no&rpar; de lo que nos dice Anthropic&comma; y esa es la cuestión&colon; que no está claro que debamos hacerlo&period; A la empresa le interesa que compremos ese discurso&comma; obviamente&comma; pero sin un análisis independiente resulta imposible verificar esas afirmaciones&period;<br &sol;>&NewLine;En Xataka &vert; Anthropic se ha convertido en la niña bonita de la IA y se ha buscado un socio para garantizar su futuro&period; No es el que pensábamos<&sol;p>&NewLine;<p> &&num;8211&semi; La noticia<&sol;p>&NewLine;<p> Anthropic dice que Claude Mythos es demasiado potente para hacerlo público&period; La pregunta es si esto no es más que un "que viene el lobo" <&sol;p>&NewLine;<p> fue publicada originalmente en<&sol;p>&NewLine;<p> Xataka <&sol;p>&NewLine;<p> por<br &sol;>&NewLine; Javier Pastor<&sol;p>&NewLine;<p> &period;   <&sol;p>&NewLine;

Leave a Reply

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *

Trending

Copyright 2025 ERM Digital. Todos los derechos reservados.