Algunos de vosotros ya conocéis la funcionalidad de captura de documentos de Athento. También os hemos contado que muy pronto estará disponible la versión 2.0 de nuestro Capture. Pero para aquellos que sois nuevos con la plataforma, queremos explicaros cómo funciona Athento.
Básicamente, Athento funciona mediante la definición de modelos. Un modelo es un tipo de documento e indica a Athento varias cosas:
- La apariencia física de un documento y de su contenido.
- Los metadatos que deben extraerse de un tipo de documentos.
Definir un modelo en Athento hace posible que:
- Athento pueda identificar que un documento que se sube al sistema es de un determinado tipo, por ejemplo una "factura de Amazon".
- Athento pueda extraer los metadatos que fueron indicados como datos a extraer para ese determinado tipo de documentos. Por ejemplo, el importe.
Entonces, antes de comenzar a clasificar documentos y extraer datos de ellos es necesario que creemos modelos.Crear un modelo es definir para cierta clase o tipología de documentos las siguientes características:
- Datos Básicos: Un nombre y, lo más importante, un documento de ejemplo que Athento puede utilizar para saber cuál es la apariencia física de ese tipo de documentos (layout, colores, umbrales, etc.).
- Palabras clave (Expresiones regulares): Son expresiones, palabras, números o conjuntos de términos que aparecen juntos normalmente en un documento de esta tipología.
- Procesamiento de texto: Indica expresiones que nos ayudarán a encontrar metadatos dentro del texto de los documentos para que sean extraídos.
- Plantilla de extracción: Es una plantilla que define la ubicación física (coordenadas) de los metadatos dentro de un documento para que el OCR pueda extraerlos.
Crear modelos es muy fácil en Athento. Para saber cómo se crea un modelo os invito a consultar el Athento Documentation Center, concretamente, la entrada "Cómo crear un nuevo modelo en Athento".

No hay comentarios:
Publicar un comentario