Ciencia y Tecnología

La IA resuelve ecuaciones y pica código, pero sigue bloqueándose con los PDF: la explicación evidencia sus límites

Published

on

<p>&NewLine; <img src&equals;"https&colon;&sol;&sol;i&period;blogs&period;es&sol;613819&sol;pdf-ia-portada&sol;1024&lowbar;2000&period;jpeg" alt&equals;"La IA resuelve ecuaciones y pica código&comma; pero sigue bloqueándose con los PDF&colon; la explicación evidencia sus límites">&NewLine; <&sol;p>&NewLine;<p>Probablemente te haya pasado&period; Subes un PDF a un chatbot de inteligencia artificial con la esperanza de que te resuma un informe&comma; te extraiga una tabla o te encuentre un dato concreto en cuestión de segundos&period; Y&comma; a veces&comma; lo consigue&period; Pero otras&comma; el resultado es desconcertante&colon; columnas mezcladas&comma; notas al pie incrustadas en mitad del texto&comma; tablas convertidas en un bloque ilegible o respuestas que no reflejan fielmente lo que pone el documento&period; La paradoja es evidente&period; <a class&equals;"text-outboundlink" href&equals;"https&colon;&sol;&sol;www&period;xataka&period;com&sol;robotica-e-ia&sol;oro-historico-ia-olimpiada-matematicas-nos-prepara-para-algo-muy-grande-fin-problemas-matematicos-solucion" data-vars-post-title&equals;'La llegada de la IA a las matemáticas va más allá de una "revolución"&colon; está llegando a donde los matemáticos humanos no soñaron' data-vars-post-url&equals;"https&colon;&sol;&sol;www&period;xataka&period;com&sol;robotica-e-ia&sol;oro-historico-ia-olimpiada-matematicas-nos-prepara-para-algo-muy-grande-fin-problemas-matematicos-solucion">Sistemas que ya demuestran avances claros en matemáticas<&sol;a> <a class&equals;"text-outboundlink" href&equals;"https&colon;&sol;&sol;www&period;xataka&period;com&sol;robotica-e-ia&sol;claude-code-esta-siendo-gran-favorito-programadores-que-firma-4-todo-que-se-sube-a-github" data-vars-post-title&equals;"Claude Code está siendo el gran favorito entre los programadores&period; Tanto que ya firma el 4&percnt; de todo lo que se sube a GitHub " data-vars-post-url&equals;"https&colon;&sol;&sol;www&period;xataka&period;com&sol;robotica-e-ia&sol;claude-code-esta-siendo-gran-favorito-programadores-que-firma-4-todo-que-se-sube-a-github">y programación<&sol;a> siguen tropezando con algo tan cotidiano como un PDF&period; Y ahí hay más que un simple fallo puntual&period;<&sol;p>&NewLine;<p><&excl;-- BREAK 1 --><&sol;p>&NewLine;<p><strong>Cambio de mentalidad<&sol;strong>&period; Aunque para nosotros sea un documento con párrafos&comma; títulos y tablas bien definidos&comma; para el sistema que lo procesa la situación puede ser muy distinta&period; El PDF es&comma; ante todo&comma; una forma de describir visualmente cómo debe representarse una página&period; Y cuando un chatbot como <a class&equals;"text-outboundlink" href&equals;"https&colon;&sol;&sol;www&period;xataka&period;com&sol;basics&sol;google-gemini-que-como-funciona-diferencias-gpt-cuando-podras-usar-este-modelo-inteligencia-artificial" data-vars-post-title&equals;"Google Gemini&colon; qué es&comma; cómo funciona&comma; diferencias con GPT y cuándo podrás usar este modelo de inteligencia artificial" data-vars-post-url&equals;"https&colon;&sol;&sol;www&period;xataka&period;com&sol;basics&sol;google-gemini-que-como-funciona-diferencias-gpt-cuando-podras-usar-este-modelo-inteligencia-artificial">Gemini<&sol;a> o <a class&equals;"text-outboundlink" href&equals;"https&colon;&sol;&sol;www&period;xataka&period;com&sol;basics&sol;chatgpt-que-como-usarlo-que-puedes-hacer-este-chat-inteligencia-artificial" data-vars-post-title&equals;"ChatGPT&colon; qué es&comma; cómo usarlo y qué puedes hacer con este chat de inteligencia artificial" data-vars-post-url&equals;"https&colon;&sol;&sol;www&period;xataka&period;com&sol;basics&sol;chatgpt-que-como-usarlo-que-puedes-hacer-este-chat-inteligencia-artificial">ChatGPT<&sol;a> intenta trabajar con él&comma; no siempre accede a una estructura ordenada&comma; sino a un conjunto de instrucciones gráficas que primero debe reconstruir antes de poder responder con coherencia&period; Y esa diferencia se entiende mejor cuando miramos cómo &OpenCurlyDoubleQuote;guarda” la información un PDF&period;<&sol;p>&NewLine;<p><&excl;-- BREAK 2 --><&sol;p>&NewLine;<p><strong>Cómo organiza realmente la información&period;<&sol;strong> A diferencia de una página web&comma; donde el contenido sigue un orden lógico definido en el código&comma; un PDF puede almacenar el texto como fragmentos independientes colocados en posiciones concretas de la página&period; Muchas veces&comma; el archivo conserva coordenadas e instrucciones de colocación&comma; <a rel&equals;"noopener&comma; noreferrer" href&equals;"https&colon;&sol;&sol;arxiv&period;org&sol;html&sol;2412&period;02592v2">pero no necesariamente relaciones explícitas entre una frase y la siguiente<&sol;a>&period; Eso implica que el orden en el que &OpenCurlyDoubleQuote;aparece” el texto al extraerlo no siempre coincide con el orden en que lo leemos&period; Si el documento incluye varias columnas&comma; cuadros o elementos superpuestos&comma; el sistema debe deducir cómo encajan entre sí&period; Y esa deducción no siempre es trivial&period;<&sol;p>&NewLine;<p><&excl;-- BREAK 3 --><&sol;p>&NewLine;<div class&equals;"article-asset-video article-asset-normal">&NewLine;<div class&equals;"asset-content">&NewLine;<div class&equals;"base-asset-video">&NewLine;<div class&equals;"js-dailymotion"><&sol;div>&NewLine;<&sol;p><&sol;div>&NewLine;<&sol;p><&sol;div>&NewLine;<&sol;div>&NewLine;<p><strong>Lo que ocurre con HTML<&sol;strong>&period; En una página web&comma; el contenido está organizado <a rel&equals;"noopener&comma; noreferrer" href&equals;"https&colon;&sol;&sol;www&period;w3&period;org&sol;TR&sol;WCAG20-TECHS&sol;G115&period;html">en una jerarquía explícita<&sol;a>&colon; hay etiquetas que indican qué es un título&comma; qué es un párrafo&comma; qué es una tabla y cómo se relacionan entre sí esos elementos&period; Esa estructura forma parte del propio archivo y facilita que otros sistemas lo lean&comma; lo indexen y lo procesen&period; En un PDF&comma; como hemos visto&comma; esa capa semántica puede no existir o no estar claramente definida&period; Por eso&comma; en la práctica&comma; extraer información de una web tiende a ser un proceso más predecible&comma; mientras que hacerlo desde un PDF es todo más complicado&period;<&sol;p>&NewLine;<p><&excl;-- BREAK 4 --><&sol;p>&NewLine;<p><strong>Entonces&comma; ¿qué pasa con el OCR&quest;<&sol;strong> Es la primera solución que viene a la cabeza&period; Si el problema es que el texto no está bien estructurado o incluso está &OpenCurlyDoubleQuote;dibujado” como una imagen&comma; el reconocimiento óptico de caracteres debería convertirlo en algo legible para la máquina&period; Y en parte lo hace&period; El OCR se usa desde hace décadas para transformar imágenes de palabras en texto&comma; pero convertir una imagen en texto no equivale a reconstruir la lógica del documento&period; Cuando hay elementos variados&comma; el sistema puede reconocer cada palabra sin saber exactamente cómo encajan entre sí&period; El resultado no es un fallo en la lectura de caracteres&comma; sino en la organización de la información&period;<&sol;p>&NewLine;<div class&equals;"article-asset article-asset-normal article-asset-center">&NewLine;<div class&equals;"desvio-container">&NewLine;<div class&equals;"desvio">&NewLine;<div class&equals;"desvio-figure js-desvio-figure">&NewLine; <a href&equals;"https&colon;&sol;&sol;www&period;xataka&period;com&sol;empresas-y-economia&sol;anthropic-ha-abandonado-su-principio-importante-no-pausara-modelos-peligrosos-competencia-saca-antes" class&equals;"pivot-outboundlink" data-vars-post-title&equals;"Dario Amodei fundó Anthropic porque OpenAI no se tomaba en serio los riesgos de la IA&period; Ahora va a ceder a esos riesgos"><br &sol;>&NewLine; <img alt&equals;"Dario Amodei fundó Anthropic porque OpenAI no se tomaba en serio los riesgos de la IA&period; Ahora va a ceder a esos riesgos" width&equals;"375" height&equals;"142" src&equals;"https&colon;&sol;&sol;i&period;blogs&period;es&sol;ac488e&sol;anthropic-destacada&sol;375&lowbar;142&period;jpeg"><br &sol;>&NewLine; <&sol;a>&NewLine; <&sol;div>&NewLine;<div class&equals;"desvio-summary">&NewLine;<div class&equals;"desvio-taxonomy js-desvio-taxonomy">&NewLine; <a href&equals;"https&colon;&sol;&sol;www&period;xataka&period;com&sol;empresas-y-economia&sol;anthropic-ha-abandonado-su-principio-importante-no-pausara-modelos-peligrosos-competencia-saca-antes" class&equals;"desvio-taxonomy-anchor pivot-outboundlink" data-vars-post-title&equals;"Dario Amodei fundó Anthropic porque OpenAI no se tomaba en serio los riesgos de la IA&period; Ahora va a ceder a esos riesgos">En Xataka<&sol;a>&NewLine; <&sol;div>&NewLine;<p> <a href&equals;"https&colon;&sol;&sol;www&period;xataka&period;com&sol;empresas-y-economia&sol;anthropic-ha-abandonado-su-principio-importante-no-pausara-modelos-peligrosos-competencia-saca-antes" class&equals;"desvio-title js-desvio-title pivot-outboundlink" data-vars-post-title&equals;"Dario Amodei fundó Anthropic porque OpenAI no se tomaba en serio los riesgos de la IA&period; Ahora va a ceder a esos riesgos">Dario Amodei fundó Anthropic porque OpenAI no se tomaba en serio los riesgos de la IA&period; Ahora va a ceder a esos riesgos<&sol;a>&NewLine; <&sol;div>&NewLine;<&sol;p><&sol;div>&NewLine;<&sol;p><&sol;div>&NewLine;<&sol;div>&NewLine;<p><strong>¿Por qué no abandonamos el PDF&quest;<&sol;strong> La respuesta es más pragmática que tecnológica&period; <a rel&equals;"noopener&comma; noreferrer" href&equals;"https&colon;&sol;&sol;www&period;theverge&period;com&sol;ai-artificial-intelligence&sol;882891&sol;ai-pdf-parsing-failure">Como recoge The Verge<&sol;a> citando al responsable de la <a rel&equals;"noopener&comma; noreferrer" href&equals;"https&colon;&sol;&sol;pdfa&period;org&sol;">PDF Association<&sol;a>&comma; el formato se consolidó precisamente porque permite que un documento se vea igual hoy que dentro de diez o veinte años&comma; independientemente del dispositivo o el software con el que se abra&period; Una página web puede cambiar según el navegador&comma; una hoja editable puede modificarse o sobrescribirse&comma; pero un PDF mantiene su apariencia y su integridad visual&period; Esa estabilidad es precisamente lo que necesitan abogados&comma; ingenieros&comma; administraciones públicas y cualquier organización que deba conservar registros fiables&period; El reto no es sustituir el formato&comma; sino aprender a interpretarlo mejor&period;<&sol;p>&NewLine;<p><&excl;-- BREAK 5 --><&sol;p>&NewLine;<p>Imágenes &vert; Xataka con Nano Bana<&sol;p>&NewLine;<p>En Xataka &vert; <a class&equals;"text-outboundlink" href&equals;"https&colon;&sol;&sol;www&period;xataka&period;com&sol;robotica-e-ia&sol;tres-ias-jugaron-a-juegos-guerra-95-casos-usaron-armas-nucleares-ninguna-se-rindio-jamas" data-vars-post-title&equals;"Tres IA se enfrentaron en 'Juegos de Guerra'&period; El 95&percnt; de ellas recurrió a las armas nucleares y ninguna se rindió jamás" data-vars-post-url&equals;"https&colon;&sol;&sol;www&period;xataka&period;com&sol;robotica-e-ia&sol;tres-ias-jugaron-a-juegos-guerra-95-casos-usaron-armas-nucleares-ninguna-se-rindio-jamas">Tres IA se enfrentaron en &&num;8216&semi;Juegos de Guerra&&num;8217&semi;&period; El 95&percnt; de ellas recurrió a las armas nucleares y ninguna se rindió jamás<&sol;a><&sol;p>&NewLine;<p> &&num;8211&semi; <br &sol;> La noticia<br &sol;>&NewLine; <a href&equals;"https&colon;&sol;&sol;www&period;xataka&period;com&sol;robotica-e-ia&sol;ia-resuelve-ecuaciones-pica-codigo-sigue-bloqueandose-pdf-explicacion-evidencia-sus-limites&quest;utm&lowbar;source&equals;feedburner&amp&semi;utm&lowbar;medium&equals;feed&amp&semi;utm&lowbar;campaign&equals;26&lowbar;Feb&lowbar;2026"><br &sol;>&NewLine; <em> La IA resuelve ecuaciones y pica código&comma; pero sigue bloqueándose con los PDF&colon; la explicación evidencia sus límites <&sol;em><br &sol;>&NewLine; <&sol;a><br &sol;>&NewLine; fue publicada originalmente en<br &sol;>&NewLine; <a href&equals;"https&colon;&sol;&sol;www&period;xataka&period;com&sol;&quest;utm&lowbar;source&equals;feedburner&amp&semi;utm&lowbar;medium&equals;feed&amp&semi;utm&lowbar;campaign&equals;26&lowbar;Feb&lowbar;2026"><br &sol;>&NewLine; <strong> Xataka <&sol;strong><br &sol;>&NewLine; <&sol;a><br &sol;>&NewLine; por <a href&equals;"https&colon;&sol;&sol;www&period;xataka&period;com&sol;autor&sol;javier-marquez&quest;utm&lowbar;source&equals;feedburner&amp&semi;utm&lowbar;medium&equals;feed&amp&semi;utm&lowbar;campaign&equals;26&lowbar;Feb&lowbar;2026"><br &sol;>&NewLine; Javier Marquez<br &sol;>&NewLine; <&sol;a><br &sol;>&NewLine; &period; <&sol;p>&NewLine;<p>&ZeroWidthSpace;Probablemente te haya pasado&period; Subes un PDF a un chatbot de inteligencia artificial con la esperanza de que te resuma un informe&comma; te extraiga una tabla o te encuentre un dato concreto en cuestión de segundos&period; Y&comma; a veces&comma; lo consigue&period; Pero otras&comma; el resultado es desconcertante&colon; columnas mezcladas&comma; notas al pie incrustadas en mitad del texto&comma; tablas convertidas en un bloque ilegible o respuestas que no reflejan fielmente lo que pone el documento&period; La paradoja es evidente&period; Sistemas que ya demuestran avances claros en matemáticas y programación siguen tropezando con algo tan cotidiano como un PDF&period; Y ahí hay más que un simple fallo puntual&period;<&sol;p>&NewLine;<p>Cambio de mentalidad&period; Aunque para nosotros sea un documento con párrafos&comma; títulos y tablas bien definidos&comma; para el sistema que lo procesa la situación puede ser muy distinta&period; El PDF es&comma; ante todo&comma; una forma de describir visualmente cómo debe representarse una página&period; Y cuando un chatbot como Gemini o ChatGPT intenta trabajar con él&comma; no siempre accede a una estructura ordenada&comma; sino a un conjunto de instrucciones gráficas que primero debe reconstruir antes de poder responder con coherencia&period; Y esa diferencia se entiende mejor cuando miramos cómo &OpenCurlyDoubleQuote;guarda” la información un PDF&period;<&sol;p>&NewLine;<p>Cómo organiza realmente la información&period; A diferencia de una página web&comma; donde el contenido sigue un orden lógico definido en el código&comma; un PDF puede almacenar el texto como fragmentos independientes colocados en posiciones concretas de la página&period; Muchas veces&comma; el archivo conserva coordenadas e instrucciones de colocación&comma; pero no necesariamente relaciones explícitas entre una frase y la siguiente&period; Eso implica que el orden en el que &OpenCurlyDoubleQuote;aparece” el texto al extraerlo no siempre coincide con el orden en que lo leemos&period; Si el documento incluye varias columnas&comma; cuadros o elementos superpuestos&comma; el sistema debe deducir cómo encajan entre sí&period; Y esa deducción no siempre es trivial&period;<&sol;p>&NewLine;<p>Lo que ocurre con HTML&period; En una página web&comma; el contenido está organizado en una jerarquía explícita&colon; hay etiquetas que indican qué es un título&comma; qué es un párrafo&comma; qué es una tabla y cómo se relacionan entre sí esos elementos&period; Esa estructura forma parte del propio archivo y facilita que otros sistemas lo lean&comma; lo indexen y lo procesen&period; En un PDF&comma; como hemos visto&comma; esa capa semántica puede no existir o no estar claramente definida&period; Por eso&comma; en la práctica&comma; extraer información de una web tiende a ser un proceso más predecible&comma; mientras que hacerlo desde un PDF es todo más complicado&period;<br &sol;>&NewLine;Entonces&comma; ¿qué pasa con el OCR&quest; Es la primera solución que viene a la cabeza&period; Si el problema es que el texto no está bien estructurado o incluso está &OpenCurlyDoubleQuote;dibujado” como una imagen&comma; el reconocimiento óptico de caracteres debería convertirlo en algo legible para la máquina&period; Y en parte lo hace&period; El OCR se usa desde hace décadas para transformar imágenes de palabras en texto&comma; pero convertir una imagen en texto no equivale a reconstruir la lógica del documento&period; Cuando hay elementos variados&comma; el sistema puede reconocer cada palabra sin saber exactamente cómo encajan entre sí&period; El resultado no es un fallo en la lectura de caracteres&comma; sino en la organización de la información&period;<&sol;p>&NewLine;<p> En Xataka<&sol;p>&NewLine;<p> Dario Amodei fundó Anthropic porque OpenAI no se tomaba en serio los riesgos de la IA&period; Ahora va a ceder a esos riesgos<&sol;p>&NewLine;<p>¿Por qué no abandonamos el PDF&quest; La respuesta es más pragmática que tecnológica&period; Como recoge The Verge citando al responsable de la PDF Association&comma; el formato se consolidó precisamente porque permite que un documento se vea igual hoy que dentro de diez o veinte años&comma; independientemente del dispositivo o el software con el que se abra&period; Una página web puede cambiar según el navegador&comma; una hoja editable puede modificarse o sobrescribirse&comma; pero un PDF mantiene su apariencia y su integridad visual&period; Esa estabilidad es precisamente lo que necesitan abogados&comma; ingenieros&comma; administraciones públicas y cualquier organización que deba conservar registros fiables&period; El reto no es sustituir el formato&comma; sino aprender a interpretarlo mejor&period;<br &sol;>&NewLine;Imágenes &vert; Xataka con Nano Bana<br &sol;>&NewLine;En Xataka &vert; Tres IA se enfrentaron en &&num;8216&semi;Juegos de Guerra&&num;8217&semi;&period; El 95&percnt; de ellas recurrió a las armas nucleares y ninguna se rindió jamás<&sol;p>&NewLine;<p> &&num;8211&semi; La noticia<&sol;p>&NewLine;<p> La IA resuelve ecuaciones y pica código&comma; pero sigue bloqueándose con los PDF&colon; la explicación evidencia sus límites <&sol;p>&NewLine;<p> fue publicada originalmente en<&sol;p>&NewLine;<p> Xataka <&sol;p>&NewLine;<p> por<br &sol;>&NewLine; Javier Marquez<&sol;p>&NewLine;<p> &period;   <&sol;p>&NewLine;<p>&ZeroWidthSpace;   <&sol;p>&NewLine;<p>&ZeroWidthSpace; <&sol;p>&NewLine;

Leave a Reply

Your email address will not be published. Required fields are marked *

Noticias Importantes

Copyright © 2017 ERM DIGITAL. powered by ERM.