miércoles, 11 de septiembre de 2013

¿TIFF o PDF? ¿Qué formato de salida elegir en proyectos de digitalización?

En el post anterior hicimos un overview de los dos formatos reyes de salida en proyectos de digitalización (TIFF y PDF) y captura de documentos. Ya sabemos que estos son los dos tipos de archivos más usados en proyectos de digitalización y sus principales características. Pero cuando escaneamos documentos en papel ¿cuál es el formato que más nos conviene?

Existen varios criterios a tener en cuenta:

  • Conservación:  PDF/A, gracias al estándar (ISO 19005-1:2005) es la mejor opción a la hora de garantizar la longevidad de los ficheros digitalizados.


  • Tamaño: Los PDFs normales son un formato de menor tamaño que los TIFF. Esto sin embargo, cambia en lo referente a PDF/A, ya que este trae embebidos los archivos de fuentes dentro del documento, lo que incrementa su tamaño. En cuanto a los PDFs tipo imagen, el tamaño va a depender de la compresión que se utilice para la imagen envuelta en el fichero PDF. En relación a los PDFs "Searcheables", estos suelen ser alrededor de un 10% más grandes que la imagen equivalente. Conclusión, en general , los PDFs suelen ser un formato más "ligero", pero es necesario considerar la clase de PDF con la que vamos a trabajar antes de sacar conclusiones.

  • Capacidad de búsqueda dentro del contenido: De nuevo tenemos al PDF como ganador, ya que el formato TIFF se creó para almacenar imágenes y no texto. Microsoft ha desarrollado un formato de TIFF "searchable" pero no estamos hablando de un estándar. Para poder buscar en el texto de una imagen TIFF, necesariamente necesitamos la aplicación de OCR y que el texto extraído se almacene en algún otro soporte (base de datos u otro fichero).

  • Seguridad: El formato PDF permite restringir el acceso mediante contraseñas y otros mecanismos, al contrario que TIFF.

  • Multiplataforma: Ambos tipos son perfectamente reconocidos por los sistemas operativos UNIX y Windows.

  • Metadatos: Ambos sistemas permiten almacenar metadatos, sin embargo, el sistema de PDF es más sofisticado ya que permite embeber metadatos en formato XML en los ficheros PDF.

  • Texto enriquecido: De nuevo el ganador es PDF, que permite incluir enlaces, anotaciones, marcas, etiquetas y otros elementos en el contenido del fichero.

  • Accesibilidad: PDF, al contrario que TIFF, permite la operación de tecnologías de ayuda  a las personas con discapacidad. Por ejemplo, un lector de pantalla puede leer un PDF. Con TIFF esto no es posible.

  • Calidad de presentación y visualización: Ambos formatos pueden servir bien a estos propósitos, sin embargo, TIFF y PDF de tipo imagen están sujetos a las restricciones de la resolución de la imagen. En este caso, PDF normal es la mejor opción. Existen múltiples aplicaciones para visualizar ambos tipos, aunque los de PDF están más extendidos. En cuanto a la visualización on-line, ninguno de los dos formatos está soportado de forma nativa por los navegadores web, aunque la mayoría de ellos están integrados con Adobe Reader para solucionar este aspecto. En relación a los navegadores web, el formato PDF si que brinda la posibilidad de optimizar el contenido para web.

Sin duda, si atendemos a todos estos criterios, el formato a elegir sería PDF, sin embargo, no todos estos criterios tienen el mismo peso en todos los proyectos, por lo que habría que realizar un análisis en cada caso. Aún si decidimos que PDF es la mejor de nuestras opciones, tendríamos a su vez que decidir dentro de los formatos PDF cuál es el que más nos conviene.

Nota: Buena parte de la información contenida en este post ha sido tomada del documento "TIFF versus PDF for Document Storage".



2 comentarios:

  1. Hola: Hace unos días puse aquí un comentario al respecto, más bien largo, pero veo que no ha sido publicado ¿por qué?
    Saludos,
    Javier

    ResponderEliminar
  2. Javier hola,Los comentarios se publican de forma automática
    (sin aprobación previa). Debe haber sido algún problema de conexión que
    tuviste en ese momento (o que no estabas logeado en Disqus en ese momento). ¡Es una pena! Te invito a que reenvíes el comentario.

    ResponderEliminar

AddThis