Maccesible

 

De PDF a HTML o a Texto

Alberto Molinos Cervera molinos@jazzfree.com

Los problemas de accesibilidad del formato PDF

Las dificultades de accesibilidad de este formato para las personas con discapacidad visual o con dificultades en el aprendizaje son: las ventanas de los documentos PDF son muy complejas, contienen barras de herramientas, de botones, de enlaces, etc. así como otros elementos que dificultan su manejo (múltiples barras de desplazamiento, por ejemplo); y el contenido de los documentos PDF puede ser tan inaccesible como una página web mal diseñada. Por si fuera poco el programa Acrobat Reader es complicado de usar con el . Por todo ello vamos a dar unas recetas para convertir los documentos PDF en otros de formato Texto o HTML, que podrán abrirse con SimpleText oBBEdit Lite y con cualquier navegador, respectivamente.

La conversión

Para convertir los documentos PDF en Texto o HTML tenemos tres posibilidades:

  1. Pegar el texto en un documento de texto (esta opción no sirve para convertir el PDF en HTML).

  2. Usar el servicio de conversión de Adobe o del Trace Center.

  3. Utilizar el Kit de Accesibilidad del Acrobat Reader (emulando a un PC).

Podemos descargar el acrobat reader desde la web de Adobe.

A. Pegar el texto en un documento de texto

Esta opción es la más sencilla pero con ella no se puede obtener directamente documentos HTML.

Los pasos son los siguientes:

  1. Abrir el documento PDF con el Acrobat Reader.

  2. Seleccionar la opción Contínua en el menú Ver. Esta opción se puede dejar por defecto usando las Preferencias del menú Edición.

  3. Activar, si no lo está ya, el modo Texto (pulsando en un botón con una T dentro.

  4. Escoger Seleccionar todo del menú Edición.

  5. Seleccionar Copiar del menú Edición.

  6. Abrir o crear un documento de texto

  7. Pegar el contenido del Portapapeles en el documento de texto.

El único inconveniente de este sistema es que añade un retorno de carro al final de cada línea del documento PDF, lo que lo hace difícil de editar.

B. Usar el servicio de conversión de Adobe o del Trace Center

Tanto el Departamento de Accesibilidad de Adobe como el Trace Center de la Universidad de Wisconsin-Madison disponen de un servicio a través del correo electrónico de conversión de documentos PDF.

Para utilizar este servicio debemos adjuntar el documento PDF a un mensaje y enviarlo a una de las siguientes direcciones, segun queramos obtener el resultado en Texto o en HTML:

pdf2txt@adobe.com o pdf2txt@sun.trace.wisc.edu

pdf2html@adobe.com o pdf2html@sun.trace.wisc.edu

El resultado consiste en un mensaje en cuyo cuerpo se encuentra el contenido del archivo PDF convertido al formato deseado por lo que para finalizar la operación debemos guardar el mensaje en forma de fichero.

En ambos casos en la conversión se añaden algunos retornos de carro dentro de los párrafos que no deberían haberse añadido, si optamos por obtener un fichero Texto los caracteres por encima del ASCII 127 (acentos, etc.) son los de Windows por lo que necesitaremos una utilidad de conversión de textocomo el TEXT <-> .TXT Converter, gratuito, se puede descargar de la web de moose factory, para pasarlos a la tabla del Mac.

Las cuatro direcciones tienen un comportamiento diferente según el programa de correo y la codificación que usemos para enviar el fichero PDF, en las pruebas que hemos hecho conseguimos convertir el documento utilizando Eudora con codificación AppleSingle o BinHex, Outlook Express con codificación AppleDouble o Netscape. Con el Entourage o el Mail del Mac OS X no pudimos obtener resultados positivos.

C. Utilizar el Kit de Accesibilidad del Acrobat Reader

Es la alternativa más compleja pues necesitamos emular un PC y tener instalada la versión para Windows del Acrobat Reader 4.0 con el Kit de Accesibilidad o el Acrobat Reader 5.0.

Los pasos son los siguientes:

  1. Arrancar el emulador de PC.

  2. Abrir el documento con el Acrobat Reader.

  3. Pulsar Control-F4.

  4. Seleccionar el destino y el tipo de fichero en el cuadro de diálogo Guardar como.

Dependiendo del tipo de archivo que escojamos obtendremos mayor o menor fidelidad en el texto, el tipo Texto obtiene el máximo parecido con el original de todos los métodos, en cambio el HTML añade algunos retornos de carro y la tabla de caracteres ASCII no coincide ni con la de Mac ni con las de PC habituales por lo que no se consiguen ni los acentos ni otros caracteres.

Valid HTML 4.01!


pie

Volver a Planeta Mac