{"id":18042,"date":"2026-04-15T08:39:00","date_gmt":"2026-04-15T12:39:00","guid":{"rendered":"https:\/\/ermdigital.com\/index.php\/2026\/04\/15\/estudio-informacion-medica-de-los-chatbots-falla-mas-de-lo-que-parece\/"},"modified":"2026-04-15T08:39:00","modified_gmt":"2026-04-15T12:39:00","slug":"estudio-informacion-medica-de-los-chatbots-falla-mas-de-lo-que-parece","status":"publish","type":"post","link":"https:\/\/ermdigital.com\/index.php\/2026\/04\/15\/estudio-informacion-medica-de-los-chatbots-falla-mas-de-lo-que-parece\/","title":{"rendered":"Estudio: informaci\u00f3n m\u00e9dica de los chatbots falla m\u00e1s de lo que parece"},"content":{"rendered":"<p>Una cantidad considerable de la <a class=\"internal-link\" href=\"https:\/\/www.dw.com\/es\/trampas-de-salud-en-tiktok-malos-consejos-en-la-red\/a-71817571\">informaci\u00f3n m\u00e9dica<\/a> proporcionada por cinco <a class=\"internal-link\" href=\"https:\/\/www.dw.com\/es\/la-ia-es-complaciente-pero-los-chatbots-no-son-tus-amigos\/a-76570115\">chatbots<\/a> populares es inexacta e incompleta, y la mitad de las respuestas a preguntas claras basadas en la evidencia son 'algo' o 'muy' problem\u00e1ticas, se\u00f1ala <a rel=\"noopener follow\" target=\"_blank\" class=\"external-link\" href=\"https:\/\/bmjopen.bmj.com\/content\/16\/4\/e112695\" title=\"Enlace externo \u2014 un estudio que publica BMJ Open.\">un estudio que publica<em> BMJ Open.<\/em><\/a><\/p>\n<p>Los investigadores del Instituto Lundquist para la Innovaci\u00f3n Biom\u00e9dica (EE. UU.) advierten de que el despliegue continuado de estos chatbots sin una labor de educaci\u00f3n p\u00fablica ni supervisi\u00f3n corre el riesgo de amplificar la desinformaci\u00f3n.\u00a0<\/p>\n<p>Esta preocupaci\u00f3n coincide con <a rel=\"noopener follow\" target=\"_blank\" class=\"external-link\" href=\"https:\/\/jamanetwork.com\/journals\/jamanetworkopen\/fullarticle\/2847679\" title=\"Enlace externo \u2014 otro estudio reciente publicado en JAMA Network Open,\">otro estudio reciente publicado en<em> JAMA Network Open,<\/em><\/a> que tras evaluar 21 modelos avanzados en casos cl\u00ednicos concluye que <a class=\"internal-link\" href=\"https:\/\/www.dw.com\/es\/inteligencia-artificial-ia\/t-63771882\">la inteligencia artificial (IA)<\/a> a\u00fan no est\u00e1 preparada para tomar decisiones m\u00e9dicas de forma aut\u00f3noma, sin supervisi\u00f3n profesional constante.<\/p>\n<h2><strong>Cinco chatbots de IA bajo la lupa <\/strong><\/h2>\n<p>El equipo del Instituto Lundquist analiz\u00f3 en febrero de 2025 el nivel de precisi\u00f3n que ofrec\u00edan en \u00e1mbitos de la salud y la medicina cinco <a class=\"internal-link\" href=\"https:\/\/www.dw.com\/es\/los-chatbots-de-ia-son-muy-poco-confiables-y-producen-desinformaci%C3%B3n-revela-amplio-estudio\/a-74459215\">chatbots de IA generativa<\/a> populares y de acceso p\u00fablico: Gemini (Google); DeepSeek (High-Flyer); Meta AI (Meta); ChatGPT (OpenAI); y Grok (xAI).<\/p>\n<p>A cada uno se le plantearon diez preguntas abiertas y cerradas en cada una de cinco categor\u00edas: <a class=\"internal-link\" href=\"https:\/\/www.dw.com\/es\/c%C3%A1ncer\/t-65353002\">c\u00e1ncer,<\/a> vacunas, c\u00e9lulas madre, nutrici\u00f3n y rendimiento deportivo.<\/p>\n<p>Las preguntas se dise\u00f1aron para asemejarse a consultas m\u00e9dicas y de salud habituales en busca de informaci\u00f3n y se desarrollaron para 'poner a prueba' los modelos en cuanto a desinformaci\u00f3n o consejos contraindicados.<\/p>\n<figure class=\"placeholder-image master_landscape big\"><img decoding=\"async\" data-format=\"MASTER_LANDSCAPE\" data-id=\"76792118\" data-url=\"https:\/\/static.dw.com\/image\/76792118_$formatId.jpg\" data-aspect-ratio=\"16\/9\" alt=\"Grok gener\u00f3 el mayor n\u00famero de respuestas muy problem\u00e1ticas en el estudio del Instituto Lundquist.\" src=\"image\/gif;base64,R0lGODlhAQABAAAAACH5BAEKAAEALAAAAAABAAEAAAICTAEAOw==\" \/><figcaption class=\"img-caption\">Grok gener\u00f3 el mayor n\u00famero de respuestas muy problem\u00e1ticas en el estudio del Instituto Lundquist.<small class=\"copyright\">Imagen: Jonathan Raa\/NurPhoto\/picture alliance<\/small><\/figcaption><\/figure>\n<h2><strong>La mitad de las respuestas, problem\u00e1ticas <\/strong><\/h2>\n<p>La mitad (50 %) de las respuestas resultaron problem\u00e1ticas: el 30 % eran algo problem\u00e1ticas y el 20 %, muy problem\u00e1ticas, seg\u00fan la revista.<\/p>\n<p>Aunque la calidad de las respuestas no vari\u00f3 significativamente entre los chatbots, Grok gener\u00f3 \"un n\u00famero significativamente mayor\" de respuestas muy problem\u00e1ticas de lo que cabr\u00eda esperar (29\/50; 58 %), mientras que Gemini tuvo el menor n\u00famero de muy problem\u00e1ticas y el mayor de no problem\u00e1ticas.<\/p>\n<p>Las respuestas se clasificaron como 'no problem\u00e1ticas', 'algo problem\u00e1ticas' o 'muy problem\u00e1ticas', utilizando criterios objetivos predefinidos.<\/p>\n<p>Se consider\u00f3 que era problem\u00e1tica cuando pod\u00eda llevar a los usuarios sin conocimientos especializados a seguir un tratamiento potencialmente ineficaz o a sufrir da\u00f1os si se aplicaba sin orientaci\u00f3n profesional.<\/p>\n<p>Los chatbots obtuvieron mejores resultados en los \u00e1mbitos de <a class=\"internal-link\" href=\"https:\/\/www.dw.com\/es\/cient%C3%ADficos-prueban-vacuna-universal-que-promete-enfrenta-la-gripe-covid-y-alergias-al-mismo-tiempo\/a-76096462\">las vacunas<\/a> y el c\u00e1ncer, y peores en los de las <a class=\"internal-link\" href=\"https:\/\/www.dw.com\/es\/vuelos-espaciales-aceleran-envejecimiento-de-c%C3%A9lulas-madre\/a-73897013\">c\u00e9lulas madre,<\/a> el rendimiento deportivo y <a class=\"internal-link\" href=\"https:\/\/www.dw.com\/es\/fibra-prote%C3%ADna-y-una-trampa-oculta-lo-que-los-expertos-advierten-sobre-la-moda-maxxing\/a-76693448\">la nutrici\u00f3n.<\/a>La informaci\u00f3n se evalu\u00f3 en funci\u00f3n de su precisi\u00f3n y exhaustividad y se prest\u00f3 especial atenci\u00f3n a si un chatbot presentaba un falso equilibrio entre afirmaciones con base cient\u00edfica y sin ella, independientemente de la solidez de las pruebas.<\/p>\n<p>Cada respuesta se calific\u00f3 tambi\u00e9n en funci\u00f3n de su legibilidad, desde si estaba redactada en un ingl\u00e9s sencillo y claro hasta si utilizaba un lenguaje acad\u00e9mico y dif\u00edcil.<\/p>\n<h2><strong>Preguntas abiertas y referencias deficientes <\/strong><\/h2>\n<p>El tipo de pregunta influy\u00f3 en los resultados. As\u00ed, las abiertas generaron 40 respuestas muy problem\u00e1ticas (significativamente m\u00e1s de lo esperado) y 51 no problem\u00e1ticas (significativamente menos de lo esperado). En el caso de las preguntas cerradas ocurri\u00f3 lo contrario, indica BMJ Open.<\/p>\n<p>Las preguntas cerradas exig\u00edan a los chatbots que proporcionaran respuestas predefinidas, a menudo con una \u00fanica respuesta correcta, que se ajustaran al consenso cient\u00edfico. Las abiertas sol\u00edan exigir que generaran m\u00faltiples respuestas en forma de lista.<\/p>\n<p>Seg\u00fan el estudio de JAMA Network Open, esta dificultad ante preguntas abiertas conecta con un hallazgo clave: los modelos de lenguaje suelen fallar en las primeras fases del razonamiento cl\u00ednico, especialmente cuando disponen de poca informaci\u00f3n o deben proponer diagn\u00f3sticos diferenciales. En concreto, la investigaci\u00f3n encontr\u00f3 que estos sistemas fallan en m\u00e1s del 80 % de los casos al elaborar diagn\u00f3sticos diferenciales, una etapa clave del proceso m\u00e9dico.<\/p>\n<figure class=\"placeholder-image master_landscape big\"><img decoding=\"async\" data-format=\"MASTER_LANDSCAPE\" data-id=\"72575818\" data-url=\"https:\/\/static.dw.com\/image\/72575818_$formatId.jpg\" data-aspect-ratio=\"16\/9\" alt=\"Los expertos advirtieron que los chatbots de IA no pueden sustituir el criterio m\u00e9dico profesional.\" src=\"image\/gif;base64,R0lGODlhAQABAAAAACH5BAEKAAEALAAAAAABAAEAAAICTAEAOw==\" \/><figcaption class=\"img-caption\">Los expertos advirtieron que los chatbots de IA no pueden sustituir el criterio m\u00e9dico profesional.<small class=\"copyright\">Imagen: Jonathan Raa\/Sipa USA\/picture alliance<\/small><\/figcaption><\/figure>\n<p>En cuanto el estudio del Instituto Lundquist, en el proceso solo hubo dos casos en los que se negaron a responder, ambos por parte de Meta AI, en respuesta a consultas sobre esteroides anab\u00f3licos y <a class=\"internal-link\" href=\"https:\/\/www.dw.com\/es\/ensayan-tecnolog%C3%ADa-de-ultrasonidos-para-tratar-el-c%C3%A1ncer-de-p%C3%A1ncreas\/a-71012176\">tratamientos alternativos contra el c\u00e1ncer.<\/a><\/p>\n<p>En general, la calidad de las referencias fue deficiente, con una puntuaci\u00f3n media de exhaustividad del 40 % y todas las puntuaciones de legibilidad se calificaron como 'dif\u00edciles', con una complejidad equivalente a la adecuada para un titulado universitario.<\/p>\n<p>Los investigadores reconocen que solo evaluaron cinco chatbots y que la IA comercial est\u00e1 evolucionando r\u00e1pidamente, por lo que sus conclusiones podr\u00edan no ser universalmente aplicables.<\/p>\n<p>Adem\u00e1s, no todas las consultas del mundo real son deliberadamente de confrontaci\u00f3n, un enfoque que adoptaron y que podr\u00eda haber exagerado la prevalencia de contenidos problem\u00e1ticos.<\/p>\n<p>En el estudio de de JAMA Network Open se mostr\u00f3, por ejemplo, que cuando los sistemas reciben toda la informaci\u00f3n cl\u00ednica relevante pueden alcanzar diagn\u00f3sticos correctos en m\u00e1s del 90 % de los casos, aunque su desempe\u00f1o sigue siendo inconsistente en etapas intermedias del proceso.<\/p>\n<h2><strong>IA m\u00e9dica: herramienta de apoyo, no sustituto <\/strong><\/h2>\n<p>A pesar de los aciertos, los hallazgos sobre la precisi\u00f3n cient\u00edfica, la calidad de las referencias y la legibilidad de las respuestas \"ponen de relieve importantes limitaciones de comportamiento y la necesidad de reevaluar c\u00f3mo se utilizan los chatbots con IA en la comunicaci\u00f3n sanitaria y m\u00e9dica dirigida al p\u00fablico\", apuntan los autores.<\/p>\n<p>Los chatbots, por defecto, no acceden a datos en tiempo real, sino que generan respuestas deduciendo patrones estad\u00edsticos a partir de sus datos de entrenamiento y prediciendo secuencias de palabras probables. \"No razonan ni sopesan las pruebas, ni son capaces de emitir juicios \u00e9ticos o basados en valores\", explican. En este sentido, los expertos insisten en que su papel actual es el de herramienta de apoyo que puede complementar \u2013pero no sustituir\u2013 el criterio m\u00e9dico humano.<\/p>\n<p>FEW (EFE, <em>BMJ Open, JAMA Network Open<\/em>)<\/p>\n<p>\u00a0<\/p>\n","protected":false},"excerpt":{"rendered":"<p>Una cantidad considerable de la informaci\u00f3n m\u00e9dica proporcionada por cinco chatbots populares es inexacta e incompleta, y la mitad de las respuestas a preguntas claras basadas en la evidencia son 'algo' o 'muy' problem\u00e1ticas, se\u00f1ala un estudio que publica BMJ Open. Los investigadores del Instituto Lundquist para la Innovaci\u00f3n Biom\u00e9dica (EE. UU.) advierten de que [&hellip;]<\/p>\n","protected":false},"author":1,"featured_media":18043,"comment_status":"open","ping_status":"open","sticky":false,"template":"","format":"standard","meta":{"amp_status":"","footnotes":""},"categories":[6],"tags":[],"class_list":["post-18042","post","type-post","status-publish","format-standard","has-post-thumbnail","hentry","category-ciencia-y-tecnologia"],"_links":{"self":[{"href":"https:\/\/ermdigital.com\/index.php\/wp-json\/wp\/v2\/posts\/18042","targetHints":{"allow":["GET"]}}],"collection":[{"href":"https:\/\/ermdigital.com\/index.php\/wp-json\/wp\/v2\/posts"}],"about":[{"href":"https:\/\/ermdigital.com\/index.php\/wp-json\/wp\/v2\/types\/post"}],"author":[{"embeddable":true,"href":"https:\/\/ermdigital.com\/index.php\/wp-json\/wp\/v2\/users\/1"}],"replies":[{"embeddable":true,"href":"https:\/\/ermdigital.com\/index.php\/wp-json\/wp\/v2\/comments?post=18042"}],"version-history":[{"count":0,"href":"https:\/\/ermdigital.com\/index.php\/wp-json\/wp\/v2\/posts\/18042\/revisions"}],"wp:featuredmedia":[{"embeddable":true,"href":"https:\/\/ermdigital.com\/index.php\/wp-json\/wp\/v2\/media\/18043"}],"wp:attachment":[{"href":"https:\/\/ermdigital.com\/index.php\/wp-json\/wp\/v2\/media?parent=18042"}],"wp:term":[{"taxonomy":"category","embeddable":true,"href":"https:\/\/ermdigital.com\/index.php\/wp-json\/wp\/v2\/categories?post=18042"},{"taxonomy":"post_tag","embeddable":true,"href":"https:\/\/ermdigital.com\/index.php\/wp-json\/wp\/v2\/tags?post=18042"}],"curies":[{"name":"wp","href":"https:\/\/api.w.org\/{rel}","templated":true}]}}