Ciencia y Tecnología

La IA resuelve ecuaciones y pica código, pero sigue bloqueándose con los PDF: la explicación evidencia sus límites

Published

4 hours ago

February 26, 2026

<p>&NewLine; <img src="https&colon;//i&period;blogs&period;es/613819/pdf-ia-portada/1024&lowbar;2000&period;jpeg" alt="La IA resuelve ecuaciones y pica código, pero sigue bloqueándose con los PDF&colon; la explicación evidencia sus límites">&NewLine; </p>&NewLine;<p>Probablemente te haya pasado&period; Subes un PDF a un chatbot de inteligencia artificial con la esperanza de que te resuma un informe, te extraiga una tabla o te encuentre un dato concreto en cuestión de segundos&period; Y, a veces, lo consigue&period; Pero otras, el resultado es desconcertante&colon; columnas mezcladas, notas al pie incrustadas en mitad del texto, tablas convertidas en un bloque ilegible o respuestas que no reflejan fielmente lo que pone el documento&period; La paradoja es evidente&period; <a class="text-outboundlink" href="https&colon;//www&period;xataka&period;com/robotica-e-ia/oro-historico-ia-olimpiada-matematicas-nos-prepara-para-algo-muy-grande-fin-problemas-matematicos-solucion" data-vars-post-title='La llegada de la IA a las matemáticas va más allá de una "revolución"&colon; está llegando a donde los matemáticos humanos no soñaron' data-vars-post-url="https&colon;//www&period;xataka&period;com/robotica-e-ia/oro-historico-ia-olimpiada-matematicas-nos-prepara-para-algo-muy-grande-fin-problemas-matematicos-solucion">Sistemas que ya demuestran avances claros en matemáticas</a> <a class="text-outboundlink" href="https&colon;//www&period;xataka&period;com/robotica-e-ia/claude-code-esta-siendo-gran-favorito-programadores-que-firma-4-todo-que-se-sube-a-github" data-vars-post-title="Claude Code está siendo el gran favorito entre los programadores&period; Tanto que ya firma el 4&percnt; de todo lo que se sube a GitHub " data-vars-post-url="https&colon;//www&period;xataka&period;com/robotica-e-ia/claude-code-esta-siendo-gran-favorito-programadores-que-firma-4-todo-que-se-sube-a-github">y programación</a> siguen tropezando con algo tan cotidiano como un PDF&period; Y ahí hay más que un simple fallo puntual&period;</p>&NewLine;<p><&excl;-- BREAK 1 --></p>&NewLine;<p><strong>Cambio de mentalidad</strong>&period; Aunque para nosotros sea un documento con párrafos, títulos y tablas bien definidos, para el sistema que lo procesa la situación puede ser muy distinta&period; El PDF es, ante todo, una forma de describir visualmente cómo debe representarse una página&period; Y cuando un chatbot como <a class="text-outboundlink" href="https&colon;//www&period;xataka&period;com/basics/google-gemini-que-como-funciona-diferencias-gpt-cuando-podras-usar-este-modelo-inteligencia-artificial" data-vars-post-title="Google Gemini&colon; qué es, cómo funciona, diferencias con GPT y cuándo podrás usar este modelo de inteligencia artificial" data-vars-post-url="https&colon;//www&period;xataka&period;com/basics/google-gemini-que-como-funciona-diferencias-gpt-cuando-podras-usar-este-modelo-inteligencia-artificial">Gemini</a> o <a class="text-outboundlink" href="https&colon;//www&period;xataka&period;com/basics/chatgpt-que-como-usarlo-que-puedes-hacer-este-chat-inteligencia-artificial" data-vars-post-title="ChatGPT&colon; qué es, cómo usarlo y qué puedes hacer con este chat de inteligencia artificial" data-vars-post-url="https&colon;//www&period;xataka&period;com/basics/chatgpt-que-como-usarlo-que-puedes-hacer-este-chat-inteligencia-artificial">ChatGPT</a> intenta trabajar con él, no siempre accede a una estructura ordenada, sino a un conjunto de instrucciones gráficas que primero debe reconstruir antes de poder responder con coherencia&period; Y esa diferencia se entiende mejor cuando miramos cómo &OpenCurlyDoubleQuote;guarda” la información un PDF&period;</p>&NewLine;<p><&excl;-- BREAK 2 --></p>&NewLine;<p><strong>Cómo organiza realmente la información&period;</strong> A diferencia de una página web, donde el contenido sigue un orden lógico definido en el código, un PDF puede almacenar el texto como fragmentos independientes colocados en posiciones concretas de la página&period; Muchas veces, el archivo conserva coordenadas e instrucciones de colocación, <a rel="noopener, noreferrer" href="https&colon;//arxiv&period;org/html/2412&period;02592v2">pero no necesariamente relaciones explícitas entre una frase y la siguiente</a>&period; Eso implica que el orden en el que &OpenCurlyDoubleQuote;aparece” el texto al extraerlo no siempre coincide con el orden en que lo leemos&period; Si el documento incluye varias columnas, cuadros o elementos superpuestos, el sistema debe deducir cómo encajan entre sí&period; Y esa deducción no siempre es trivial&period;</p>&NewLine;<p><&excl;-- BREAK 3 --></p>&NewLine;<div class="article-asset-video article-asset-normal">&NewLine;<div class="asset-content">&NewLine;<div class="base-asset-video">&NewLine;<div class="js-dailymotion"></div>&NewLine;</p></div>&NewLine;</p></div>&NewLine;</div>&NewLine;<p><strong>Lo que ocurre con HTML</strong>&period; En una página web, el contenido está organizado <a rel="noopener, noreferrer" href="https&colon;//www&period;w3&period;org/TR/WCAG20-TECHS/G115&period;html">en una jerarquía explícita</a>&colon; hay etiquetas que indican qué es un título, qué es un párrafo, qué es una tabla y cómo se relacionan entre sí esos elementos&period; Esa estructura forma parte del propio archivo y facilita que otros sistemas lo lean, lo indexen y lo procesen&period; En un PDF, como hemos visto, esa capa semántica puede no existir o no estar claramente definida&period; Por eso, en la práctica, extraer información de una web tiende a ser un proceso más predecible, mientras que hacerlo desde un PDF es todo más complicado&period;</p>&NewLine;<p><&excl;-- BREAK 4 --></p>&NewLine;<p><strong>Entonces, ¿qué pasa con el OCR&quest;</strong> Es la primera solución que viene a la cabeza&period; Si el problema es que el texto no está bien estructurado o incluso está &OpenCurlyDoubleQuote;dibujado” como una imagen, el reconocimiento óptico de caracteres debería convertirlo en algo legible para la máquina&period; Y en parte lo hace&period; El OCR se usa desde hace décadas para transformar imágenes de palabras en texto, pero convertir una imagen en texto no equivale a reconstruir la lógica del documento&period; Cuando hay elementos variados, el sistema puede reconocer cada palabra sin saber exactamente cómo encajan entre sí&period; El resultado no es un fallo en la lectura de caracteres, sino en la organización de la información&period;</p>&NewLine;<div class="article-asset article-asset-normal article-asset-center">&NewLine;<div class="desvio-container">&NewLine;<div class="desvio">&NewLine;<div class="desvio-figure js-desvio-figure">&NewLine; <a href="https&colon;//www&period;xataka&period;com/empresas-y-economia/anthropic-ha-abandonado-su-principio-importante-no-pausara-modelos-peligrosos-competencia-saca-antes" class="pivot-outboundlink" data-vars-post-title="Dario Amodei fundó Anthropic porque OpenAI no se tomaba en serio los riesgos de la IA&period; Ahora va a ceder a esos riesgos"><br />&NewLine; <img alt="Dario Amodei fundó Anthropic porque OpenAI no se tomaba en serio los riesgos de la IA&period; Ahora va a ceder a esos riesgos" width="375" height="142" src="https&colon;//i&period;blogs&period;es/ac488e/anthropic-destacada/375&lowbar;142&period;jpeg"><br />&NewLine; </a>&NewLine; </div>&NewLine;<div class="desvio-summary">&NewLine;<div class="desvio-taxonomy js-desvio-taxonomy">&NewLine; <a href="https&colon;//www&period;xataka&period;com/empresas-y-economia/anthropic-ha-abandonado-su-principio-importante-no-pausara-modelos-peligrosos-competencia-saca-antes" class="desvio-taxonomy-anchor pivot-outboundlink" data-vars-post-title="Dario Amodei fundó Anthropic porque OpenAI no se tomaba en serio los riesgos de la IA&period; Ahora va a ceder a esos riesgos">En Xataka</a>&NewLine; </div>&NewLine;<p> <a href="https&colon;//www&period;xataka&period;com/empresas-y-economia/anthropic-ha-abandonado-su-principio-importante-no-pausara-modelos-peligrosos-competencia-saca-antes" class="desvio-title js-desvio-title pivot-outboundlink" data-vars-post-title="Dario Amodei fundó Anthropic porque OpenAI no se tomaba en serio los riesgos de la IA&period; Ahora va a ceder a esos riesgos">Dario Amodei fundó Anthropic porque OpenAI no se tomaba en serio los riesgos de la IA&period; Ahora va a ceder a esos riesgos</a>&NewLine; </div>&NewLine;</p></div>&NewLine;</p></div>&NewLine;</div>&NewLine;<p><strong>¿Por qué no abandonamos el PDF&quest;</strong> La respuesta es más pragmática que tecnológica&period; <a rel="noopener, noreferrer" href="https&colon;//www&period;theverge&period;com/ai-artificial-intelligence/882891/ai-pdf-parsing-failure">Como recoge The Verge</a> citando al responsable de la <a rel="noopener, noreferrer" href="https&colon;//pdfa&period;org/">PDF Association</a>, el formato se consolidó precisamente porque permite que un documento se vea igual hoy que dentro de diez o veinte años, independientemente del dispositivo o el software con el que se abra&period; Una página web puede cambiar según el navegador, una hoja editable puede modificarse o sobrescribirse, pero un PDF mantiene su apariencia y su integridad visual&period; Esa estabilidad es precisamente lo que necesitan abogados, ingenieros, administraciones públicas y cualquier organización que deba conservar registros fiables&period; El reto no es sustituir el formato, sino aprender a interpretarlo mejor&period;</p>&NewLine;<p><&excl;-- BREAK 5 --></p>&NewLine;<p>Imágenes | Xataka con Nano Bana</p>&NewLine;<p>En Xataka | <a class="text-outboundlink" href="https&colon;//www&period;xataka&period;com/robotica-e-ia/tres-ias-jugaron-a-juegos-guerra-95-casos-usaron-armas-nucleares-ninguna-se-rindio-jamas" data-vars-post-title="Tres IA se enfrentaron en 'Juegos de Guerra'&period; El 95&percnt; de ellas recurrió a las armas nucleares y ninguna se rindió jamás" data-vars-post-url="https&colon;//www&period;xataka&period;com/robotica-e-ia/tres-ias-jugaron-a-juegos-guerra-95-casos-usaron-armas-nucleares-ninguna-se-rindio-jamas">Tres IA se enfrentaron en &&num;8216&semi;Juegos de Guerra&&num;8217&semi;&period; El 95&percnt; de ellas recurrió a las armas nucleares y ninguna se rindió jamás</a></p>&NewLine;<p> &&num;8211&semi; <br /> La noticia<br />&NewLine; <a href="https&colon;//www&period;xataka&period;com/robotica-e-ia/ia-resuelve-ecuaciones-pica-codigo-sigue-bloqueandose-pdf-explicacion-evidencia-sus-limites&quest;utm&lowbar;source=feedburner&amp&semi;utm&lowbar;medium=feed&amp&semi;utm&lowbar;campaign=26&lowbar;Feb&lowbar;2026"><br />&NewLine; <em> La IA resuelve ecuaciones y pica código, pero sigue bloqueándose con los PDF&colon; la explicación evidencia sus límites </em><br />&NewLine; </a><br />&NewLine; fue publicada originalmente en<br />&NewLine; <a href="https&colon;//www&period;xataka&period;com/&quest;utm&lowbar;source=feedburner&amp&semi;utm&lowbar;medium=feed&amp&semi;utm&lowbar;campaign=26&lowbar;Feb&lowbar;2026"><br />&NewLine; <strong> Xataka </strong><br />&NewLine; </a><br />&NewLine; por <a href="https&colon;//www&period;xataka&period;com/autor/javier-marquez&quest;utm&lowbar;source=feedburner&amp&semi;utm&lowbar;medium=feed&amp&semi;utm&lowbar;campaign=26&lowbar;Feb&lowbar;2026"><br />&NewLine; Javier Marquez<br />&NewLine; </a><br />&NewLine; &period; </p>&NewLine;<p>&ZeroWidthSpace;Probablemente te haya pasado&period; Subes un PDF a un chatbot de inteligencia artificial con la esperanza de que te resuma un informe, te extraiga una tabla o te encuentre un dato concreto en cuestión de segundos&period; Y, a veces, lo consigue&period; Pero otras, el resultado es desconcertante&colon; columnas mezcladas, notas al pie incrustadas en mitad del texto, tablas convertidas en un bloque ilegible o respuestas que no reflejan fielmente lo que pone el documento&period; La paradoja es evidente&period; Sistemas que ya demuestran avances claros en matemáticas y programación siguen tropezando con algo tan cotidiano como un PDF&period; Y ahí hay más que un simple fallo puntual&period;</p>&NewLine;<p>Cambio de mentalidad&period; Aunque para nosotros sea un documento con párrafos, títulos y tablas bien definidos, para el sistema que lo procesa la situación puede ser muy distinta&period; El PDF es, ante todo, una forma de describir visualmente cómo debe representarse una página&period; Y cuando un chatbot como Gemini o ChatGPT intenta trabajar con él, no siempre accede a una estructura ordenada, sino a un conjunto de instrucciones gráficas que primero debe reconstruir antes de poder responder con coherencia&period; Y esa diferencia se entiende mejor cuando miramos cómo &OpenCurlyDoubleQuote;guarda” la información un PDF&period;</p>&NewLine;<p>Cómo organiza realmente la información&period; A diferencia de una página web, donde el contenido sigue un orden lógico definido en el código, un PDF puede almacenar el texto como fragmentos independientes colocados en posiciones concretas de la página&period; Muchas veces, el archivo conserva coordenadas e instrucciones de colocación, pero no necesariamente relaciones explícitas entre una frase y la siguiente&period; Eso implica que el orden en el que &OpenCurlyDoubleQuote;aparece” el texto al extraerlo no siempre coincide con el orden en que lo leemos&period; Si el documento incluye varias columnas, cuadros o elementos superpuestos, el sistema debe deducir cómo encajan entre sí&period; Y esa deducción no siempre es trivial&period;</p>&NewLine;<p>Lo que ocurre con HTML&period; En una página web, el contenido está organizado en una jerarquía explícita&colon; hay etiquetas que indican qué es un título, qué es un párrafo, qué es una tabla y cómo se relacionan entre sí esos elementos&period; Esa estructura forma parte del propio archivo y facilita que otros sistemas lo lean, lo indexen y lo procesen&period; En un PDF, como hemos visto, esa capa semántica puede no existir o no estar claramente definida&period; Por eso, en la práctica, extraer información de una web tiende a ser un proceso más predecible, mientras que hacerlo desde un PDF es todo más complicado&period;<br />&NewLine;Entonces, ¿qué pasa con el OCR&quest; Es la primera solución que viene a la cabeza&period; Si el problema es que el texto no está bien estructurado o incluso está &OpenCurlyDoubleQuote;dibujado” como una imagen, el reconocimiento óptico de caracteres debería convertirlo en algo legible para la máquina&period; Y en parte lo hace&period; El OCR se usa desde hace décadas para transformar imágenes de palabras en texto, pero convertir una imagen en texto no equivale a reconstruir la lógica del documento&period; Cuando hay elementos variados, el sistema puede reconocer cada palabra sin saber exactamente cómo encajan entre sí&period; El resultado no es un fallo en la lectura de caracteres, sino en la organización de la información&period;</p>&NewLine;<p> En Xataka</p>&NewLine;<p> Dario Amodei fundó Anthropic porque OpenAI no se tomaba en serio los riesgos de la IA&period; Ahora va a ceder a esos riesgos</p>&NewLine;<p>¿Por qué no abandonamos el PDF&quest; La respuesta es más pragmática que tecnológica&period; Como recoge The Verge citando al responsable de la PDF Association, el formato se consolidó precisamente porque permite que un documento se vea igual hoy que dentro de diez o veinte años, independientemente del dispositivo o el software con el que se abra&period; Una página web puede cambiar según el navegador, una hoja editable puede modificarse o sobrescribirse, pero un PDF mantiene su apariencia y su integridad visual&period; Esa estabilidad es precisamente lo que necesitan abogados, ingenieros, administraciones públicas y cualquier organización que deba conservar registros fiables&period; El reto no es sustituir el formato, sino aprender a interpretarlo mejor&period;<br />&NewLine;Imágenes | Xataka con Nano Bana<br />&NewLine;En Xataka | Tres IA se enfrentaron en &&num;8216&semi;Juegos de Guerra&&num;8217&semi;&period; El 95&percnt; de ellas recurrió a las armas nucleares y ninguna se rindió jamás</p>&NewLine;<p> &&num;8211&semi; La noticia</p>&NewLine;<p> La IA resuelve ecuaciones y pica código, pero sigue bloqueándose con los PDF&colon; la explicación evidencia sus límites </p>&NewLine;<p> fue publicada originalmente en</p>&NewLine;<p> Xataka </p>&NewLine;<p> por<br />&NewLine; Javier Marquez</p>&NewLine;<p> &period; </p>&NewLine;<p>&ZeroWidthSpace; </p>&NewLine;<p>&ZeroWidthSpace; </p>&NewLine;

ERM Digital

Ciencia y Tecnología

La IA resuelve ecuaciones y pica código, pero sigue bloqueándose con los PDF: la explicación evidencia sus límites

Leave a Reply

Leave a Reply

Noticias Importantes

Leave a Reply Cancel reply

Leave a Reply

Noticias Importantes

Leave a Reply