miércoles, 3 de agosto de 2016

Cómo dividir lotes de documentos con Athento SE

Cómo dividir lotes de documentos con Athento SE

Como vimos en el artículo Métodos de separación de lotes de documentos escaneados, hoy en día los escáneres permiten digitalizar grandes cantidades de documentos en poco tiempo. 

Sin embargo, se trate de documentos en papel escaneados o de documentos creados de forma digital, cuando creamos lotes de documentos, lo normal es querer almacenarlos como documentos independientes a los que poder acceder, consultar o extraer datos de forma individual. 

Un ejemplo muy frecuente de esta necesidad de dividir lotes de documentos o fragmentar PDFs lo tienen empresas u organismos públicos que trabajan con expedientes, de forma que cada expediente contiene diferentes tipos de documentos y una vez que se digitaliza el expediente, necesitan poder acceder a cada uno de esos documentos en lugar de a un único fichero.

Otros ejemplos frecuentes:

  • dividir paquetes de facturas
  • dividir paquetes de notas de entrega
  • dividir paquetes de currícua (CVs)
  • división de expedientes de trámites de vehículos
  • división de expedientes de personal

Para esto, el software de captura de documentos resulta clave. Hoy vamos a contaros cómo dividir lotes de documentos con Athento SE. 

Dividir lotes de documentos con Athento SE paso a paso

Athento SE permite dividir paquetes de documentos o lotes almacenados en un único archivo PDF de forma que se pueden separar como documentos distintos. 

El archivo PDF puede contener bien muchos documentos de un mismo tipo (facturas de un mismo proveedor, contratos de clientes de un mismo producto, etc. ) o bien, muchos documentos de diferentes tipos (facturas de distintos proveedores mezcladas con albaranes y notas de entrega, contratos de clientes de diferentes productos, etc.). 

Athento SE divide los documentos haciendo uso de su funcionalidad de clasificación de documentos ya que es capaz de clasificar documentos completos y también por páginas. Para este caso concreto que vemos hoy de división de lotes, usará la funcionalidad de clasificación por página como vamos a ver más adelante. 

Los pasos para dividir los lotes de documentos con Athento SE son los siguientes: 

1. Crear los tipos documentales en los que vamos a dividir el archivo PDF

El primer paso que debemos llevar a cabo es crear los tipos documentales que hay incluidos en el archivo PDF. Esto quiere decir que si en el archivo PDF tenemos un único tipo de documento (facturas de un mismo proveedor, por ejemplo), crearemos un único tipo documental. Y si, por ejemplo, tenemos varios tipos de documentos (facturas de distintos proveedores o notas de entrega o contratos, etc.), crearemos todos esos tipos documentales o al menos los tipos documentales para los documentos que queremos que se separen de forma automática en archivos individuales.

La clasificación por página permite que se entrene el software Athento SE para que sea capaz de reconocer la primera página de cada tipo documental, de modo que en el caso de la división de archivos PDF, cada vez que Athento SE reconozca un tipo documental en una página, dividirá el archivo PDF en esa posición hasta que encuentre y reconozca un nuevo tipo documental.

Por ejemplo, Athento SE identifica la primera página del contrato con un cliente y sabe que se trata de ese tipo de documento, pues sigue leyendo el documento hasta que encuentra otra primera página de contrato con clientes y es entonces cuando divide el archivo PDF. 

Si aún no sabes cómo crear un tipo documental, te será de ayuda el tutorial cerca de Cómo clasificar un documento de forma automática


2. Indicar que esos tipos documentales que hemos creado se utilizarán en la clasificación por página

Desde el back-end de la plataforma, debemos indicar que los tipos documentales que hemos creado se utilizarán para la clasificación por página de un archivo/documento. Sigue la siguiente ruta: Doctypes -> Document types como en la siguiente imagen:

clasificación de documentos por página Athento SE
Athento SE: Document types

En Document types buscamos los tipos documentales que queremos utilizar. Debemos activar la opción "Forpages" en aquellos tipos documentales para los que vayamos a utilizar la clasificación por página y hacer click en "Save".

clasificación de documentos por página Athento SE
Athento SE: Select Forpages

3. Activar en Athento SE la operación de clasificación por página

El siguiente paso, será activar la operación que permite la clasificación por página en la plataforma. Para ello, desde las "Settings" de la serie, iremos a "Document Operations" y activaremos la operación "Pages Classifier by Fuzzy Text Similarity" como en la siguiente imagen, asegurándonos de que el parámetro "Pages" tiene como valor "1".

clasificación de documentos por página Athento SE
Athento SE: Pages-classifier

4. Probar a clasificar las páginas de un PDF

Si ejecutamos la operación de clasificación desde la vista del documento (con "Complete Analysis" o mediante el botón propio de la operación), veremos algo como en la siguiente imagen, donde a la derecha, podemos ver como Athento SE ha hecho la clasificación página a página del documento:

clasificación de documentos por página Athento SE
Athento SE: Clasificación por página
Es importante que una vez que ya tenemos la clasificación funcionando borremos el documento con el que hayamos estado trabajando puesto que necesitamos que las páginas se vuelvan a clasificar para su división.

5. Configurar la división por tipo documental

El siguiente paso es activar la operación que realizará la división. Desde las "Settings" de la Serie, activaremos la operación "Split per pages" o "División de documentos por tipo documental de páginas clasificadas". Esta operación, de forma automática, generará una Serie llamada "Splits" a la que serán enviados los nuevos archivos PDF producto de la división.

clasificación de documentos por página Athento SE
Athento SE: Splits per pages

6. Probar la división de lotes de documentos

El último paso será comprobar que la división por lotes funciona. Para ello, subiremos un nuevo documento y lo procesaremos a través del botón "Complete Analysis". Una vez que se procese el archivo, desde la lista de documentos deberemos de ver algo como la siguiente imagen:

clasificación de documentos por página Athento SE
Athento SE: División por lotes satisfactoria :)
El resultado de la división de lotes de documentos será tantos archivos extras como páginas haya clasificado Athento SE dentro del archivo PDF. Estos nuevos archivos generados, indicarán en su nombre, por un lado, el nombre del fichero original y, por otro, las páginas de ese fichero que lo componen.

Prueba ahora Athento SE de forma gratuita y comienza a clasificar tus documentos de forma inteligente, fácil e intuitiva.


Prueba 30 días gratis Athento

No hay comentarios:

Publicar un comentario en la entrada

AddThis