Ciencia y Tecnología

Han secuestrado agentes de Anthropic, Google y Microsoft por el bien de la ciencia. Las tres empresas acabaron pagando

Published

4 horas ago

17 de abril de 2026

user

<p>&NewLine; <img src="https&colon;//i&period;blogs&period;es/82d438/hacker-portada/1024&lowbar;2000&period;jpeg" alt="Han secuestrado agentes de Anthropic, Google y Microsoft por el bien de la ciencia&period; Las tres empresas acabaron pagando ">&NewLine; </p>&NewLine;<p>En algunos equipos de desarrollo ya se está volviendo habitual apoyarse en <a class="text-outboundlink" href="https&colon;//www&period;xataka&period;com/basics/ai-agents-agentes-ia-que-componentes-que-tipos-existen-inteligencia-artificial" data-vars-post-title="AI Agents o Agentes de IA&colon; qué son, componentes y qué tipos existen en la inteligencia artificial" data-vars-post-url="https&colon;//www&period;xataka&period;com/basics/ai-agents-agentes-ia-que-componentes-que-tipos-existen-inteligencia-artificial">agentes de inteligencia artificial</a> para revisar incidencias, analizar cambios en el código y moverse por tareas que antes quedaban en manos humanas&period; El problema aparece cuando esos sistemas no solo leen información que puede venir de fuera, sino que además operan en espacios donde conviven <strong>claves, tokens y permisos sensibles</strong>&period; Eso es lo que pone sobre la mesa una investigación reciente&colon; no estamos simplemente ante una herramienta útil que puede equivocarse, sino ante una arquitectura que también puede volverse peligrosa si se despliega sin límites muy claros&period;</p>&NewLine;<p><&excl;-- BREAK 1 --></p>&NewLine;<p>La alarma la ha encendido <a rel="noopener, noreferrer" href="https&colon;//oddguan&period;com/">Aonan Guan</a> y los investigadores de Johns Hopkins Zhengyu Liu y Gavin Zhong tras demostrar ataques contra tres agentes desplegados en la mencionada plataforma&colon; Claude Code Security Review, de Anthropic, Gemini CLI Action, de Google, y GitHub Copilot Agent, una herramienta de GitHub bajo Microsoft&period; <a rel="noopener, noreferrer" href="https&colon;//oddguan&period;com/blog/comment-and-control-prompt-injection-credential-theft-claude-code-gemini-cli-github-copilot/">Según su documentación,</a> los fallos fueron comunicados de forma coordinada y acabaron en recompensas económicas pagadas por las compañías, pero lo relevante es que apuntan a un problema más amplio&period;</p>&NewLine;<h2>Así lograron torcer a los agentes desde dentro</h2>&NewLine;<p>El nombre que Guan le pone al hallazgo ayuda bastante a entender de qué va todo esto&colon; &OpenCurlyDoubleQuote;Comment and Control”&period; La idea es sencilla de explicar, aunque el fondo no lo sea tanto&period; En vez de montar una infraestructura externa para dirigir el ataque, el propio GitHub hace de canal de entrada y de salida&colon; el atacante <strong>deja la instrucción en un título</strong>, una incidencia o un comentario, el agente la procesa como si formara parte del trabajo normal y el resultado termina reapareciendo dentro de ese mismo entorno&period; Todo queda en casa, y precisamente ahí está la clave del problema&period;</p>&NewLine;<p><&excl;-- BREAK 2 --></p>&NewLine;<div class="article-asset-video article-asset-normal">&NewLine;<div class="asset-content">&NewLine;<div class="base-asset-video">&NewLine;<div class="js-dailymotion"></div>&NewLine;</p></div>&NewLine;</p></div>&NewLine;</div>&NewLine;<p>Y ese &OpenCurlyDoubleQuote;todo queda en casa” no es un detalle menor, sino la base de lo que describe la investigación&period; Los tres agentes comparten una lógica muy parecida&colon; leen contenido normal de GitHub, lo incorporan como contexto de trabajo y, a partir de ahí, ejecutan acciones dentro de flujos automatizados&period; El choque aparece porque ese mismo espacio no solo contiene texto enviado por terceros, sino también herramientas, permisos y secretos que el agente necesita para operar&period;</p>&NewLine;<p><&excl;-- BREAK 3 --></p>&NewLine;<p>El primer caso que detalla Guan afecta a Claude Code Security Review, una acción de GitHub de Anthropic pensada para revisar cambios de código y buscar posibles fallos de seguridad&period; Hasta aquí, todo entra dentro de lo esperable&period; El problema, según explica el investigador, es que bastaba con introducir instrucciones maliciosas en el título de una <em>pull request</em>, que es la solicitud que alguien envía para proponer cambios en un proyecto, para que <strong>el agente ejecutara comandos</strong> y devolviera el resultado como si formara parte de su revisión&period; Después, el equipo logró ir un paso más allá y demostrar que también podía extraer credenciales del entorno&period;</p>&NewLine;<p>Lo interesante es que el mismo esquema también apareció en los otros dos servicios, aunque con matices&period; En Google, Gemini CLI Action podía ser empujado a revelar la GEMINI&lowbar;API&lowbar;KEY a partir de instrucciones coladas en una incidencia y en sus comentarios&semi; en GitHub Copilot Agent, la variante era todavía más preocupante, porque el ataque se escondía en un comentario HTML que una persona no veía en pantalla, pero el agente sí procesaba cuando otra persona lo asignaba al caso&period; En ambos escenarios, el fondo volvía a ser el mismo&colon; contenido aparentemente normal que acababa torciendo el comportamiento del sistema hasta exponer credenciales o información sensible dentro del propio GitHub&period;</p>&NewLine;<p><&excl;-- BREAK 4 --></p>&NewLine;<div class="article-asset-image article-asset-normal article-asset-center">&NewLine;<div class="asset-content">&NewLine;<p> <img alt="Claude Code Api Key Leak" class="centro&lowbar;sinmarco" src="https&colon;//i&period;blogs&period;es/1e1f8b/claude-code-api-key-leak/450&lowbar;1000&period;png"></p></div>&NewLine;</div>&NewLine;<p>Guan asegura que el patrón permitió filtrar claves de API, tokens de GitHub y otros secretos expuestos en el entorno donde corría el agente, es decir, justo las credenciales que luego pueden abrir la puerta a acciones bastante más delicadas&period; ¿A quién afecta esto&quest; Sobre todo a repositorios que ejecutan agentes en <strong>GitHub Actions</strong> sobre contenido enviado por colaboradores no fiables y, además, les dan acceso a secretos o herramientas potentes&period; El propio investigador matiza que el riesgo depende mucho de la configuración&colon; por defecto GitHub no expone secretos a las <em>pull requests</em> desde <em>forks</em>, pero sí existen despliegues que abren esa puerta&period;</p>&NewLine;<p><&excl;-- BREAK 5 --></p>&NewLine;<p>Y aquí aparece otra capa del asunto, menos técnica pero igual de importante&period; <a rel="noopener, noreferrer" href="https&colon;//www&period;theregister&period;com/2026/04/15/claude&lowbar;gemini&lowbar;copilot&lowbar;agents&lowbar;hijacked/">Según publicó The Register</a>, Anthropic, Google y GitHub acabaron pagando recompensas por los hallazgos, pero ninguna de las tres había publicado avisos públicos ni asignado <a rel="noopener, noreferrer" href="https&colon;//www&period;redhat&period;com/en/topics/security/what-is-cve">CVE</a> en el momento de esa información&period; Guan fue bastante claro al respecto&colon; dijo saber &OpenCurlyDoubleQuote;con certeza” que algunos usuarios seguían anclados a versiones vulnerables y advirtió de que, sin una comunicación visible, muchos podían no enterarse nunca de que estaban expuestos o incluso siendo atacados&period; Así que aunque hubo mitigaciones y cambios en documentación o en el tratamiento interno de los reportes, no existó un aviso público equivalente para todos los posibles afectados&period;</p>&NewLine;<ul>&NewLine;<li>Anthropic resolvió el caso el 25 de noviembre de 2025 y pagó 100 dólares</li>&NewLine;<li>Google recompensó el hallazgo el 20 de enero de 2026 con 1&period;337 dólares</li>&NewLine;<li>GitHub cerró el caso el 9 de marzo de 2026 con un pago de 500 dólares</li>&NewLine;</ul>&NewLine;<p>Lo que vuelve este caso especialmente delicado es que GitHub no parece el final del camino, sino más bien el primer escaparate visible&period; Guan sostiene que el mismo patrón probablemente puede reproducirse en otros agentes que trabajan con herramientas y secretos dentro de flujos automáticos, y ahí menciona <strong>desde bots conectados a Slack hasta agentes de Jira</strong>, correo o automatización de despliegues&period; La lógica vuelve a ser la misma&colon; si el sistema tiene que leer contenido externo para hacer su trabajo y, además, cuenta con acceso suficiente para actuar, el terreno queda abonado para que alguien intente torcerlo desde dentro&period;</p>&NewLine;<p><&excl;-- BREAK 6 --></p>&NewLine;<div class="article-asset article-asset-normal article-asset-center">&NewLine;<div class="desvio-container">&NewLine;<div class="desvio">&NewLine;<div class="desvio-figure js-desvio-figure">&NewLine; <a href="https&colon;//www&period;xataka&period;com/seguridad/cada-cuanto-debemos-cambiar-todas-nuestras-contrasenas-tres-expertos-ciberseguridad" class="pivot-outboundlink" data-vars-post-title="Cada cuánto debemos cambiar TODAS nuestras contraseñas según tres expertos en ciberseguridad"><br />&NewLine; <img alt="Cada cuánto debemos cambiar TODAS nuestras contraseñas según tres expertos en ciberseguridad" width="375" height="142" src="https&colon;//i&period;blogs&period;es/c6d2d1/contrasena-portada1/375&lowbar;142&period;jpeg"><br />&NewLine; </a>&NewLine; </div>&NewLine;<div class="desvio-summary">&NewLine;<div class="desvio-taxonomy js-desvio-taxonomy">&NewLine; <a href="https&colon;//www&period;xataka&period;com/seguridad/cada-cuanto-debemos-cambiar-todas-nuestras-contrasenas-tres-expertos-ciberseguridad" class="desvio-taxonomy-anchor pivot-outboundlink" data-vars-post-title="Cada cuánto debemos cambiar TODAS nuestras contraseñas según tres expertos en ciberseguridad">En Xataka</a>&NewLine; </div>&NewLine;<p> <a href="https&colon;//www&period;xataka&period;com/seguridad/cada-cuanto-debemos-cambiar-todas-nuestras-contrasenas-tres-expertos-ciberseguridad" class="desvio-title js-desvio-title pivot-outboundlink" data-vars-post-title="Cada cuánto debemos cambiar TODAS nuestras contraseñas según tres expertos en ciberseguridad">Cada cuánto debemos cambiar TODAS nuestras contraseñas según tres expertos en ciberseguridad</a>&NewLine; </div>&NewLine;</p></div>&NewLine;</p></div>&NewLine;</div>&NewLine;<p>La conclusión a la que llega Guan no pasa por vender una solución mágica, sino por volver a una idea bastante clásica en seguridad&colon; dar a cada sistema solo lo imprescindible para hacer su trabajo&period; Si un agente revisa código, no debería tener acceso a herramientas o secretos que no necesita&semi; si se limita a resumir incidencias, tampoco tendría sentido que pudiera escribir en GitHub o tocar credenciales sensibles&period; Por eso insiste en pensar estos despliegues con lógica de mínimo privilegio y listas de permisos muy cerradas&period;</p>&NewLine;<p><&excl;-- BREAK 7 --></p>&NewLine;<p>Imágenes | DC Studio | Aonan Guan</p>&NewLine;<p>En Xataka | <a class="text-outboundlink" href="https&colon;//www&period;xataka&period;com/robotica-e-ia/eeuu-ha-nombrado-tenientes-coroneles-a-directivos-meta-palantir-openai-tenemos-muchas-preguntas" data-vars-post-title="La IA es crucial para el ejército de EEUU&period; Así que está nombrando tenientes generales a líderes de OpenAI y Palantir" data-vars-post-url="https&colon;//www&period;xataka&period;com/robotica-e-ia/eeuu-ha-nombrado-tenientes-coroneles-a-directivos-meta-palantir-openai-tenemos-muchas-preguntas">La IA es crucial para el ejército de EEUU&period; Así que está nombrando tenientes generales a líderes de OpenAI y Palantir</a></p>&NewLine;<p> &&num;8211&semi; <br /> La noticia<br />&NewLine; <a href="https&colon;//www&period;xataka&period;com/seguridad/han-secuestrado-agentes-anthropic-google-microsoft-bien-ciencia-tres-empresas-acabaron-pagando&quest;utm&lowbar;source=feedburner&amp&semi;utm&lowbar;medium=feed&amp&semi;utm&lowbar;campaign=17&lowbar;Apr&lowbar;2026"><br />&NewLine; <em> Han secuestrado agentes de Anthropic, Google y Microsoft por el bien de la ciencia&period; Las tres empresas acabaron pagando </em><br />&NewLine; </a><br />&NewLine; fue publicada originalmente en<br />&NewLine; <a href="https&colon;//www&period;xataka&period;com/&quest;utm&lowbar;source=feedburner&amp&semi;utm&lowbar;medium=feed&amp&semi;utm&lowbar;campaign=17&lowbar;Apr&lowbar;2026"><br />&NewLine; <strong> Xataka </strong><br />&NewLine; </a><br />&NewLine; por <a href="https&colon;//www&period;xataka&period;com/autor/javier-marquez&quest;utm&lowbar;source=feedburner&amp&semi;utm&lowbar;medium=feed&amp&semi;utm&lowbar;campaign=17&lowbar;Apr&lowbar;2026"><br />&NewLine; Javier Marquez<br />&NewLine; </a><br />&NewLine; &period; </p>&NewLine;<p> En algunos equipos de desarrollo ya se está volviendo habitual apoyarse en agentes de inteligencia artificial para revisar incidencias, analizar cambios en el código y moverse por tareas que antes quedaban en manos humanas&period; El problema aparece cuando esos sistemas no solo leen información que puede venir de fuera, sino que además operan en espacios donde conviven claves, tokens y permisos sensibles&period; Eso es lo que pone sobre la mesa una investigación reciente&colon; no estamos simplemente ante una herramienta útil que puede equivocarse, sino ante una arquitectura que también puede volverse peligrosa si se despliega sin límites muy claros&period;<br />&NewLine;La alarma la ha encendido Aonan Guan y los investigadores de Johns Hopkins Zhengyu Liu y Gavin Zhong tras demostrar ataques contra tres agentes desplegados en la mencionada plataforma&colon; Claude Code Security Review, de Anthropic, Gemini CLI Action, de Google, y GitHub Copilot Agent, una herramienta de GitHub bajo Microsoft&period; Según su documentación, los fallos fueron comunicados de forma coordinada y acabaron en recompensas económicas pagadas por las compañías, pero lo relevante es que apuntan a un problema más amplio&period;<br />&NewLine;Así lograron torcer a los agentes desde dentro<br />&NewLine;El nombre que Guan le pone al hallazgo ayuda bastante a entender de qué va todo esto&colon; &OpenCurlyDoubleQuote;Comment and Control”&period; La idea es sencilla de explicar, aunque el fondo no lo sea tanto&period; En vez de montar una infraestructura externa para dirigir el ataque, el propio GitHub hace de canal de entrada y de salida&colon; el atacante deja la instrucción en un título, una incidencia o un comentario, el agente la procesa como si formara parte del trabajo normal y el resultado termina reapareciendo dentro de ese mismo entorno&period; Todo queda en casa, y precisamente ahí está la clave del problema&period;</p>&NewLine;<p>Y ese &OpenCurlyDoubleQuote;todo queda en casa” no es un detalle menor, sino la base de lo que describe la investigación&period; Los tres agentes comparten una lógica muy parecida&colon; leen contenido normal de GitHub, lo incorporan como contexto de trabajo y, a partir de ahí, ejecutan acciones dentro de flujos automatizados&period; El choque aparece porque ese mismo espacio no solo contiene texto enviado por terceros, sino también herramientas, permisos y secretos que el agente necesita para operar&period;<br />&NewLine;El primer caso que detalla Guan afecta a Claude Code Security Review, una acción de GitHub de Anthropic pensada para revisar cambios de código y buscar posibles fallos de seguridad&period; Hasta aquí, todo entra dentro de lo esperable&period; El problema, según explica el investigador, es que bastaba con introducir instrucciones maliciosas en el título de una pull request, que es la solicitud que alguien envía para proponer cambios en un proyecto, para que el agente ejecutara comandos y devolviera el resultado como si formara parte de su revisión&period; Después, el equipo logró ir un paso más allá y demostrar que también podía extraer credenciales del entorno&period;<br />&NewLine;Lo interesante es que el mismo esquema también apareció en los otros dos servicios, aunque con matices&period; En Google, Gemini CLI Action podía ser empujado a revelar la GEMINI&lowbar;API&lowbar;KEY a partir de instrucciones coladas en una incidencia y en sus comentarios&semi; en GitHub Copilot Agent, la variante era todavía más preocupante, porque el ataque se escondía en un comentario HTML que una persona no veía en pantalla, pero el agente sí procesaba cuando otra persona lo asignaba al caso&period; En ambos escenarios, el fondo volvía a ser el mismo&colon; contenido aparentemente normal que acababa torciendo el comportamiento del sistema hasta exponer credenciales o información sensible dentro del propio GitHub&period;</p>&NewLine;<p>Guan asegura que el patrón permitió filtrar claves de API, tokens de GitHub y otros secretos expuestos en el entorno donde corría el agente, es decir, justo las credenciales que luego pueden abrir la puerta a acciones bastante más delicadas&period; ¿A quién afecta esto&quest; Sobre todo a repositorios que ejecutan agentes en GitHub Actions sobre contenido enviado por colaboradores no fiables y, además, les dan acceso a secretos o herramientas potentes&period; El propio investigador matiza que el riesgo depende mucho de la configuración&colon; por defecto GitHub no expone secretos a las pull requests desde forks, pero sí existen despliegues que abren esa puerta&period;<br />&NewLine;Y aquí aparece otra capa del asunto, menos técnica pero igual de importante&period; Según publicó The Register, Anthropic, Google y GitHub acabaron pagando recompensas por los hallazgos, pero ninguna de las tres había publicado avisos públicos ni asignado CVE en el momento de esa información&period; Guan fue bastante claro al respecto&colon; dijo saber &OpenCurlyDoubleQuote;con certeza” que algunos usuarios seguían anclados a versiones vulnerables y advirtió de que, sin una comunicación visible, muchos podían no enterarse nunca de que estaban expuestos o incluso siendo atacados&period; Así que aunque hubo mitigaciones y cambios en documentación o en el tratamiento interno de los reportes, no existó un aviso público equivalente para todos los posibles afectados&period;<br />&NewLine;Anthropic resolvió el caso el 25 de noviembre de 2025 y pagó 100 dólaresGoogle recompensó el hallazgo el 20 de enero de 2026 con 1&period;337 dólaresGitHub cerró el caso el 9 de marzo de 2026 con un pago de 500 dólares<br />&NewLine;Lo que vuelve este caso especialmente delicado es que GitHub no parece el final del camino, sino más bien el primer escaparate visible&period; Guan sostiene que el mismo patrón probablemente puede reproducirse en otros agentes que trabajan con herramientas y secretos dentro de flujos automáticos, y ahí menciona desde bots conectados a Slack hasta agentes de Jira, correo o automatización de despliegues&period; La lógica vuelve a ser la misma&colon; si el sistema tiene que leer contenido externo para hacer su trabajo y, además, cuenta con acceso suficiente para actuar, el terreno queda abonado para que alguien intente torcerlo desde dentro&period;</p>&NewLine;<p> En Xataka</p>&NewLine;<p> Cada cuánto debemos cambiar TODAS nuestras contraseñas según tres expertos en ciberseguridad</p>&NewLine;<p>La conclusión a la que llega Guan no pasa por vender una solución mágica, sino por volver a una idea bastante clásica en seguridad&colon; dar a cada sistema solo lo imprescindible para hacer su trabajo&period; Si un agente revisa código, no debería tener acceso a herramientas o secretos que no necesita&semi; si se limita a resumir incidencias, tampoco tendría sentido que pudiera escribir en GitHub o tocar credenciales sensibles&period; Por eso insiste en pensar estos despliegues con lógica de mínimo privilegio y listas de permisos muy cerradas&period;<br />&NewLine;Imágenes | DC Studio | Aonan Guan<br />&NewLine;En Xataka | La IA es crucial para el ejército de EEUU&period; Así que está nombrando tenientes generales a líderes de OpenAI y Palantir</p>&NewLine;<p> &&num;8211&semi; La noticia</p>&NewLine;<p> Han secuestrado agentes de Anthropic, Google y Microsoft por el bien de la ciencia&period; Las tres empresas acabaron pagando </p>&NewLine;<p> fue publicada originalmente en</p>&NewLine;<p> Xataka </p>&NewLine;<p> por<br />&NewLine; Javier Marquez</p>&NewLine;<p> &period; </p>&NewLine;

ermdigital

Ciencia y Tecnología

Han secuestrado agentes de Anthropic, Google y Microsoft por el bien de la ciencia. Las tres empresas acabaron pagando

Leave a Reply

Leave a Reply

Trending

Leave a Reply Cancelar la respuesta

Leave a Reply

Trending

Leave a Reply