martes, 6 de agosto de 2013

¿Cómo Athento clasifica documentos y extrae sus datos?

Algunos de vosotros ya conocéis la funcionalidad de captura de documentos de Athento. También os hemos contado que muy pronto estará disponible la versión 2.0 de nuestro Capture. Pero para aquellos que sois nuevos con la plataforma, queremos explicaros cómo funciona Athento.

Básicamente, Athento funciona mediante la definición de modelos. Un modelo es un tipo de documento e indica a Athento varias cosas:

  • La apariencia física de un documento y de su contenido.
  • Los metadatos que deben extraerse de un tipo de documentos.
Definir un modelo en Athento hace posible que:
  • Athento pueda identificar que un documento que se sube al sistema es de un determinado tipo, por ejemplo una "factura de Amazon".
  • Athento pueda extraer los metadatos que fueron indicados como datos a extraer para ese determinado tipo de documentos. Por ejemplo, el importe.
Entonces, antes de comenzar a clasificar documentos y extraer datos de ellos es necesario que creemos modelos.Crear un modelo es definir para cierta clase o tipología de documentos las siguientes características:



  • Datos Básicos: Un nombre y, lo más importante, un documento de ejemplo que Athento puede utilizar para saber cuál es la apariencia física de ese tipo de documentos (layout, colores, umbrales, etc.). 
  • Palabras clave (Expresiones regulares): Son expresiones, palabras, números o conjuntos de términos que  aparecen juntos normalmente en un documento de esta tipología.
  • Procesamiento de texto: Indica expresiones que nos ayudarán a encontrar metadatos dentro del texto de los documentos para que sean extraídos. 
  • Plantilla de extracción: Es una plantilla que define la ubicación física (coordenadas) de los metadatos dentro de un documento  para que el OCR pueda extraerlos.
Crear modelos es muy fácil en Athento. Para saber cómo se crea un modelo os invito a consultar el Athento Documentation Center, concretamente, la entrada "Cómo crear un nuevo modelo en Athento".

 Contáctanos ahora! Podemos ayudarte y mejorar el Software de Gestión Documental de tu empresa, facilitando la eficiencia y las búsquedas así como los procesos de gestión de documentos y captura.


No hay comentarios:

Publicar un comentario en la entrada

AddThis