Ciencia y Tecnología

Anthropic dice que Claude Mythos es demasiado potente para hacerlo público. La pregunta es si esto no es más que un "que viene el lobo"

Published

4 horas ago

10 de abril de 2026

user

<p>&NewLine; <img src="https&colon;//i&period;blogs&period;es/3d4590/mythos-rendimiento/1024&lowbar;2000&period;jpeg" alt='Anthropic dice que Claude Mythos es demasiado potente para hacerlo público&period; La pregunta es si esto no es más que un "que viene el lobo" '>&NewLine; </p>&NewLine;<p><a href="https&colon;//www&period;xataka&period;com/robotica-e-ia/claude-mythos-modelo-ia-potente-que-da-miedo-asi-que-anthropic-ha-decidido-que-no-vas-a-poder-usarlo&num;mrfhud=true">Claude Mythos Preview</a> es el mejor modelo de IA jamás creado&period; No lo decimos nosotros, lo dice Anthropic, pero es que casi nadie más puede decirlo porque solo un selecto grupo de empresas tiene acceso a dicho modelo&period; <a class="text-outboundlink" href="https&colon;//www&period;xataka&period;com/robotica-e-ia/claude-mythos-da-miedo-sabe-bien-ingeniero-que-comia-sandwich-parque-cuando-recibio-terrorifico-email-esta-ia" data-vars-post-title="Un trabajador de Anthropic estaba merendando cuando recibió un mail que jamás debería haber recibido&colon; era Mythos" data-vars-post-url="https&colon;//www&period;xataka&period;com/robotica-e-ia/claude-mythos-da-miedo-sabe-bien-ingeniero-que-comia-sandwich-parque-cuando-recibio-terrorifico-email-esta-ia">Las capacidades del modelo en materia de ciberseguridad parecen ser asombrosas</a>, pero cada vez más expertos afirman que aunque Mythos es mejor que sus predecesores, no es el salto revolucionario que parece plantear Anthropic&period; ¿Es esa forma de lanzar el modelo tan solo una forma efectiva de crear <em>hype</em>&quest;</p>&NewLine;<p><&excl;-- BREAK 1 --></p>&NewLine;<p><strong>Cuidado con el discurso de Anthropic</strong>&period; El conocido emprendedor y analista Gary Marcus daba recientemente <a rel="noopener, noreferrer" href="https&colon;//garymarcus&period;substack&period;com/p/three-reasons-to-think-that-the-claude">tres razones</a> por las que según él el lanzamiento de Mythos no es tan revolucionario como Anthropic quiere hacernos ver&period; Citaba <a rel="noopener, noreferrer" href="https&colon;//x&period;com/philogroves/status/2042195139477557499">tuits de ingenieros software</a> y expertos en ciberseguridad que ponían en duda las afirmaciones de Anthropic&period; La empresa publicó un estudio sobre las capacidades de Claude Mythos Preview que parecía convertirlo en una herramienta extraordinaria para el ámbito de la ciberseguridad, pero que al mismo tiempo eran tan potente que podía ser muy peligrosa de caer en malas manos&period;</p>&NewLine;<p><&excl;-- BREAK 2 --></p>&NewLine;<div class="article-asset-image article-asset-normal article-asset-center">&NewLine;<div class="asset-content">&NewLine; <a rel="noopener, noreferrer" href="https&colon;//x&period;com/gum1h0x/status/2041917868158202022"></p>&NewLine;<p> <img alt="Captura De Pantalla 2026 04 10 A Las 11 54 47" class="centro&lowbar;sinmarco" src="https&colon;//i&period;blogs&period;es/715d04/captura-de-pantalla-2026-04-10-a-las-11&period;54&period;47/450&lowbar;1000&period;jpeg"><br />&NewLine; </a></p></div>&NewLine;</div>&NewLine;<p><strong>¿No es para tanto&quest;</strong> Entre los logros de Claude Mythos, Anthropic destacó cómo había encontrado vulnerabilidades en Firefox 147&period; Pero en realidad muchos de los fallos eran básicamente variaciones de los dos mismos bugs&period; Si los elikminabas de la ecuación, la tasa de efectividad de Mythos para encontrar nuevos exploits bajaba mucho, incluso por debajo de Opus 4&period;6&period; Anthropic no ocultaba ese hecho, desde luego, pero hace que por ejemplo dicha capacidad no parezca tan llamativa&period; Un usuario de X <a rel="noopener, noreferrer" href="https&colon;//x&period;com/gum1h0x/status/2041917868158202022">criticaba también</a> el uso de Cybench como benchmark de ciberseguridad cuando Opus 4&period;6 casi lo superaba casi totalmente&period; Para él la elección de algunas de las pruebas de Anthropic era discutible por no ser ningún reto para los modelos actuales&period;</p>&NewLine;<p><&excl;-- BREAK 3 --></p>&NewLine;<div class="article-asset-image article-asset-normal article-asset-center">&NewLine;<div class="asset-content">&NewLine;<p> <img alt="Captura De Pantalla 2026 04 10 A Las 11 11 06" class="centro&lowbar;sinmarco" src="https&colon;//i&period;blogs&period;es/bb4b67/captura-de-pantalla-2026-04-10-a-las-11&period;11&period;06/450&lowbar;1000&period;jpeg"></p></div>&NewLine;</div>&NewLine;<p><strong>Otros modelos pueden hacer lo mismo</strong>&period; El cofundador y CEO de Hugging Face, Clement Delangue, afirmaba que Mythos no era para tanto&period; Su argumento&colon; ellos habían usado modelos abiertos pequeños y baratos, habían aislado el código relevante de algunos ejemplos de las vulnerabilidades encontradas por Mythos y <a rel="noopener, noreferrer" href="https&colon;//aisle&period;com/blog/ai-cybersecurity-after-mythos-the-jagged-frontier">encontraron los mismos problemas</a> que ya había detectado el modelo de Anthropic&period; </p>&NewLine;<p><&excl;-- BREAK 4 --></p>&NewLine;<div class="article-asset-image article-asset-normal article-asset-center">&NewLine;<div class="asset-content">&NewLine;<div class="caption-img ">&NewLine;<p> <img alt="Captura De Pantalla 2026 04 10 A Las 12 11 18" class="centro&lowbar;sinmarco" src="https&colon;//i&period;blogs&period;es/7c1d9c/captura-de-pantalla-2026-04-10-a-las-12&period;11&period;18/450&lowbar;1000&period;jpeg"></p>&NewLine;<p> <span>Según el índice Epoch Capabilities Index que mide la capacidad de modelos de IA conjugando varios benchmarks, el salto que ha dado Mythos es llamativo y "se sale" de la línea progresiva de sus predecesores&period; Fuente&colon; Anthropic&period;</span>&NewLine; </div>&NewLine;</p></div>&NewLine;</div>&NewLine;<p><strong>Sesgo del observador</strong>&period; Pero aquí hay que señalar que en esos análisis sabían dónde mirar porque Mythos ya había encontrado esos problemas&period; Estamos ante el sesgo del observador, y de hecho en el documento de Hugging Face se deja claro que incluso le dieron pistas específicas como "considera el desbordamiento de enteros") para que encontrara esos fallos&period; Y sobre esta observación, otra&colon; en Hugging Face no dicen que un modelo pequeño pueda sustituir a Mythos por sí solo, pero que sí puede ser muy bueno dándole el fragmento de código adecuado&period; Mythos parece más capaz para fallos de seguridad complejos a ciegas, pero es que es un modelo enorme y por eso tiene esa mayor capacidad&period; O lo que es lo mismo&colon; Mythos es mejor porque tiene el tamaño, diseño y recursos para serlo&period;</p>&NewLine;<p><&excl;-- BREAK 5 --></p>&NewLine;<div class="article-asset-image article-asset-normal article-asset-center">&NewLine;<div class="asset-content">&NewLine; <a rel="noopener, noreferrer" href="https&colon;//x&period;com/MarioBalukcic/status/2041997400806432951"></p>&NewLine;<p> <img alt="Captura De Pantalla 2026 04 10 A Las 11 31 00" class="centro&lowbar;sinmarco" src="https&colon;//i&period;blogs&period;es/64e38b/captura-de-pantalla-2026-04-10-a-las-11&period;31&period;00/450&lowbar;1000&period;jpeg"><br />&NewLine; </a></p></div>&NewLine;</div>&NewLine;<p><strong>¿Miedo, incertidumbre, duda&quest;</strong> El lenguaje utilizado por Anthropic en este anuncio podría ser considerado hasta cierto punto un uso claro del FUD ("Fear, Uncertainty, Doubt" -&gt&semi; "Miedo, Incertidumbre, Duda") como técnica de marketing&period; Es un recurso que se ha visto en el pasado, y por ejemplo OpenAI ya dijo en 2019 —años antes del lanzamiento de ChatGPT— que <a rel="noopener, noreferrer" href="https&colon;//www&period;theguardian&period;com/technology/2019/feb/14/elon-musk-backed-ai-writes-convincing-news-fiction">GPT-2 era demasiado peligroso para un lanzamiento público</a>&period; Obviamente no lo era, pero eso desde luego sirvió para crear expectación sobre la verdadera capacidad del modelo&period;</p>&NewLine;<p><&excl;-- BREAK 6 --></p>&NewLine;<div class="article-asset-image article-asset-normal article-asset-center">&NewLine;<div class="asset-content">&NewLine; <a rel="noopener, noreferrer" href="https&colon;//x&period;com/ramez/status/2041946766598402459"></p>&NewLine;<p> <img alt="Captura De Pantalla 2026 04 10 A Las 11 50 09" class="centro&lowbar;sinmarco" src="https&colon;//i&period;blogs&period;es/036b4e/captura-de-pantalla-2026-04-10-a-las-11&period;50&period;09/450&lowbar;1000&period;jpeg"><br />&NewLine; </a></p></div>&NewLine;</div>&NewLine;<p><strong>Es mejor, pero quizás no sea revolucionario</strong>&period; Los resultados de los benchmarks que Anthropic publicó ya dejaban claro que aunque hay saltos muy notables en algunas pruebas, en otras la evolución es mucho menos llamativa&period; Claude Mythos no era el mejor en todo, y ahora aparecen analistas que contrastan esos datos con otras métricas&period; Por ejemplo, con el Epoch Capabilities Index (ECI) de Epoch AI, la startup que tiene <a class="text-outboundlink" href="https&colon;//www&period;xataka&period;com/robotica-e-ia/no-sabemos-que-miden-exactamente-benchmarks-ia-asi-que-hemos-hablado-espanol-que-ha-creado-uno-dificiles" data-vars-post-title="No sabemos qué miden los benchmarks de IA&period; Así que hemos hablado con el español que ha creado uno de los más difíciles" data-vars-post-url="https&colon;//www&period;xataka&period;com/robotica-e-ia/no-sabemos-que-miden-exactamente-benchmarks-ia-asi-que-hemos-hablado-espanol-que-ha-creado-uno-dificiles">uno de los benchmarks más reputados</a> de la industria&period; Y según dicho índice, Claude Mythos está por encima de sus rivales, <a rel="noopener, noreferrer" href="https&colon;//x&period;com/ramez/status/2041946766598402459">pero no por mucho</a>&period;</p>&NewLine;<p><&excl;-- BREAK 7 --></p>&NewLine;<div class="article-asset-video article-asset-normal">&NewLine;<div class="asset-content">&NewLine;<div class="base-asset-video">&NewLine;<div class="js-dailymotion"></div>&NewLine;</p></div>&NewLine;</p></div>&NewLine;</div>&NewLine;<p><strong>Que viene el lobo</strong>&period; Lo cierto es que el lanzamiento de Claude Mythos Preview ha sido realmente llamativa y los documentos que acompañaron a ese documento nos habla de un modelo de IA realmente capaz&period; El problema es que es imposible verificarlo porque solo unas pocas empresas tienen acceso a él y pueden probarlo&period; Sin esa disponibilidad pública lo único que podemos hacer es fiarnos (o no) de lo que nos dice Anthropic, y esa es la cuestión&colon; que no está claro que debamos hacerlo&period; A la empresa le interesa que compremos ese discurso, obviamente, pero sin un análisis independiente resulta imposible verificar esas afirmaciones&period;</p>&NewLine;<p><&excl;-- BREAK 8 --></p>&NewLine;<p>En Xataka | <a class="text-outboundlink" href="https&colon;//www&period;xataka&period;com/robotica-e-ia/anthropic-se-ha-convertido-nina-bonita-ia-se-ha-buscado-socio-para-garantizar-su-futuro-no-que-pensabamos" data-vars-post-title="Anthropic se ha convertido en la niña bonita de la IA y se ha buscado un socio para garantizar su futuro&period; No es el que pensábamos " data-vars-post-url="https&colon;//www&period;xataka&period;com/robotica-e-ia/anthropic-se-ha-convertido-nina-bonita-ia-se-ha-buscado-socio-para-garantizar-su-futuro-no-que-pensabamos">Anthropic se ha convertido en la niña bonita de la IA y se ha buscado un socio para garantizar su futuro&period; No es el que pensábamos</a></p>&NewLine;<p> &&num;8211&semi; <br /> La noticia<br />&NewLine; <a href="https&colon;//www&period;xataka&period;com/robotica-e-ia/anthropic-dice-que-claude-mythos-demasiado-potente-para-hacerlo-publico-pregunta-esto-no-que-que-viene-lobo&quest;utm&lowbar;source=feedburner&amp&semi;utm&lowbar;medium=feed&amp&semi;utm&lowbar;campaign=10&lowbar;Apr&lowbar;2026"><br />&NewLine; <em> Anthropic dice que Claude Mythos es demasiado potente para hacerlo público&period; La pregunta es si esto no es más que un "que viene el lobo" </em><br />&NewLine; </a><br />&NewLine; fue publicada originalmente en<br />&NewLine; <a href="https&colon;//www&period;xataka&period;com/&quest;utm&lowbar;source=feedburner&amp&semi;utm&lowbar;medium=feed&amp&semi;utm&lowbar;campaign=10&lowbar;Apr&lowbar;2026"><br />&NewLine; <strong> Xataka </strong><br />&NewLine; </a><br />&NewLine; por <a href="https&colon;//www&period;xataka&period;com/autor/javier-pastor&quest;utm&lowbar;source=feedburner&amp&semi;utm&lowbar;medium=feed&amp&semi;utm&lowbar;campaign=10&lowbar;Apr&lowbar;2026"><br />&NewLine; Javier Pastor<br />&NewLine; </a><br />&NewLine; &period; </p>&NewLine;<p> Claude Mythos Preview es el mejor modelo de IA jamás creado&period; No lo decimos nosotros, lo dice Anthropic, pero es que casi nadie más puede decirlo porque solo un selecto grupo de empresas tiene acceso a dicho modelo&period; Las capacidades del modelo en materia de ciberseguridad parecen ser asombrosas, pero cada vez más expertos afirman que aunque Mythos es mejor que sus predecesores, no es el salto revolucionario que parece plantear Anthropic&period; ¿Es esa forma de lanzar el modelo tan solo una forma efectiva de crear hype&quest;</p>&NewLine;<p>Cuidado con el discurso de Anthropic&period; El conocido emprendedor y analista Gary Marcus daba recientemente tres razones por las que según él el lanzamiento de Mythos no es tan revolucionario como Anthropic quiere hacernos ver&period; Citaba tuits de ingenieros software y expertos en ciberseguridad que ponían en duda las afirmaciones de Anthropic&period; La empresa publicó un estudio sobre las capacidades de Claude Mythos Preview que parecía convertirlo en una herramienta extraordinaria para el ámbito de la ciberseguridad, pero que al mismo tiempo eran tan potente que podía ser muy peligrosa de caer en malas manos&period;</p>&NewLine;<p>¿No es para tanto&quest; Entre los logros de Claude Mythos, Anthropic destacó cómo había encontrado vulnerabilidades en Firefox 147&period; Pero en realidad muchos de los fallos eran básicamente variaciones de los dos mismos bugs&period; Si los elikminabas de la ecuación, la tasa de efectividad de Mythos para encontrar nuevos exploits bajaba mucho, incluso por debajo de Opus 4&period;6&period; Anthropic no ocultaba ese hecho, desde luego, pero hace que por ejemplo dicha capacidad no parezca tan llamativa&period; Un usuario de X criticaba también el uso de Cybench como benchmark de ciberseguridad cuando Opus 4&period;6 casi lo superaba casi totalmente&period; Para él la elección de algunas de las pruebas de Anthropic era discutible por no ser ningún reto para los modelos actuales&period;</p>&NewLine;<p>Otros modelos pueden hacer lo mismo&period; El cofundador y CEO de Hugging Face, Clement Delangue, afirmaba que Mythos no era para tanto&period; Su argumento&colon; ellos habían usado modelos abiertos pequeños y baratos, habían aislado el código relevante de algunos ejemplos de las vulnerabilidades encontradas por Mythos y encontraron los mismos problemas que ya había detectado el modelo de Anthropic&period; </p>&NewLine;<p> Según el índice Epoch Capabilities Index que mide la capacidad de modelos de IA conjugando varios benchmarks, el salto que ha dado Mythos es llamativo y "se sale" de la línea progresiva de sus predecesores&period; Fuente&colon; Anthropic&period;</p>&NewLine;<p>Sesgo del observador&period; Pero aquí hay que señalar que en esos análisis sabían dónde mirar porque Mythos ya había encontrado esos problemas&period; Estamos ante el sesgo del observador, y de hecho en el documento de Hugging Face se deja claro que incluso le dieron pistas específicas como "considera el desbordamiento de enteros") para que encontrara esos fallos&period; Y sobre esta observación, otra&colon; en Hugging Face no dicen que un modelo pequeño pueda sustituir a Mythos por sí solo, pero que sí puede ser muy bueno dándole el fragmento de código adecuado&period; Mythos parece más capaz para fallos de seguridad complejos a ciegas, pero es que es un modelo enorme y por eso tiene esa mayor capacidad&period; O lo que es lo mismo&colon; Mythos es mejor porque tiene el tamaño, diseño y recursos para serlo&period;</p>&NewLine;<p>¿Miedo, incertidumbre, duda&quest; El lenguaje utilizado por Anthropic en este anuncio podría ser considerado hasta cierto punto un uso claro del FUD ("Fear, Uncertainty, Doubt" -&gt&semi; "Miedo, Incertidumbre, Duda") como técnica de marketing&period; Es un recurso que se ha visto en el pasado, y por ejemplo OpenAI ya dijo en 2019 —años antes del lanzamiento de ChatGPT— que GPT-2 era demasiado peligroso para un lanzamiento público&period; Obviamente no lo era, pero eso desde luego sirvió para crear expectación sobre la verdadera capacidad del modelo&period;</p>&NewLine;<p>Es mejor, pero quizás no sea revolucionario&period; Los resultados de los benchmarks que Anthropic publicó ya dejaban claro que aunque hay saltos muy notables en algunas pruebas, en otras la evolución es mucho menos llamativa&period; Claude Mythos no era el mejor en todo, y ahora aparecen analistas que contrastan esos datos con otras métricas&period; Por ejemplo, con el Epoch Capabilities Index (ECI) de Epoch AI, la startup que tiene uno de los benchmarks más reputados de la industria&period; Y según dicho índice, Claude Mythos está por encima de sus rivales, pero no por mucho&period;</p>&NewLine;<p>Que viene el lobo&period; Lo cierto es que el lanzamiento de Claude Mythos Preview ha sido realmente llamativa y los documentos que acompañaron a ese documento nos habla de un modelo de IA realmente capaz&period; El problema es que es imposible verificarlo porque solo unas pocas empresas tienen acceso a él y pueden probarlo&period; Sin esa disponibilidad pública lo único que podemos hacer es fiarnos (o no) de lo que nos dice Anthropic, y esa es la cuestión&colon; que no está claro que debamos hacerlo&period; A la empresa le interesa que compremos ese discurso, obviamente, pero sin un análisis independiente resulta imposible verificar esas afirmaciones&period;<br />&NewLine;En Xataka | Anthropic se ha convertido en la niña bonita de la IA y se ha buscado un socio para garantizar su futuro&period; No es el que pensábamos</p>&NewLine;<p> &&num;8211&semi; La noticia</p>&NewLine;<p> Anthropic dice que Claude Mythos es demasiado potente para hacerlo público&period; La pregunta es si esto no es más que un "que viene el lobo" </p>&NewLine;<p> fue publicada originalmente en</p>&NewLine;<p> Xataka </p>&NewLine;<p> por<br />&NewLine; Javier Pastor</p>&NewLine;<p> &period; </p>&NewLine;

ermdigital

Ciencia y Tecnología

Anthropic dice que Claude Mythos es demasiado potente para hacerlo público. La pregunta es si esto no es más que un "que viene el lobo"

Leave a Reply

Leave a Reply

Trending

Leave a Reply Cancelar la respuesta

Leave a Reply

Trending

Leave a Reply