Aquellos lectores que han trabajado en proyectos de digitalización saben que es imposible escanear documento por documento en entornos con grandes volúmenes de documentación para digitalizar. Los escáneres son cada vez más potentes y rápidos, algunos tienen opciones de auto-alimentación y los de altos volúmenes de producción más modernos, pueden procesar más de 100 páginas por minuto.

Los escáneres son más rápidos hoy en día, pero no más inteligentes. No pueden distinguir dónde empieza un documento y termina el otro, o cuando ha pasado de digitalizar el expediente 2013-A899 al 2013-A900. Aquí es dónde aparece el software de captura de documentos.
¿Cómo se consigue pues separar los documentos que se escanean en conjunto?
Básicamente existen 3 métodos:
- Separación por códigos de barra: Consiste en pegar códigos de barras en los documentos antes de ser digitalizados. Los códigos de barras marcan los límites entre los documentos o expedientes que deben ser separados.
- Separación por páginas en blanco: Entre expediente o expediente, o documento y documento, se incluyen páginas en blanco como separador durante el proceso de digitalización.
- Separación inteligente de lotes de documentos: Los métodos anteriores son costosos. Alguien tiene que dedicarse a imprimir y pegar códigos de barras o a meter hojas blancas en los lotes de documentos en la fase pre-digitalización. Esto es lo que la separación inteligente trata de eliminar. Gracias al análisis de la estructura de los documento y de su texto, los sistemas inteligentes de captura son capaces de identificar dónde un documento empieza y dónde termina. Estos sistemas requieren entrenamiento; esto quiere decir, que cada vez que se hace una identificación y separación de documentos, el sistema va aprendiendo y refinándose.
Espero que os sea de utilidad :-)

No hay comentarios:
Publicar un comentario