miércoles, 5 de marzo de 2014

Extracción de datos multi-página

Los últimos días hemos estado trabajando en nueva funcionalidad y mejoras a la parte de extracción de datos del módulo de captura de Athento. La semana pasada os presentamos la funcionalidad que permitía traer datos  de una base de datos a partir de un metadato extraído del contenido de un documento. En esta ocasión, la funcionalidad que queremos presentaros es que ahora, con Athento, podemos definir metadatos a extraer  en documentos que tienen más de una página.

Esta funcionalidad aplica para los metadatos que se extraen mediante OCR Zonal, es decir, para aquellos que sabemos que siempre van a aparecer en la misma posición.

Vamos a ver unas capturas de pantalla de la extracción multipágina. En esta primera captura de pantalla, se muestra cómo se ha definido el metadato "Application Date" en la primera página de un documento de dos páginas.



A continuación, vemos cómo en el mismo modelo, ya estamos en la página dos y podemos definir el metadato "Immunity From Prosecution".



Esperamos que os sea de utilidad :-)

No hay comentarios:

Publicar un comentario en la entrada

AddThis