miércoles, 15 de octubre de 2014

Obtener metadatos de fuentes externas con Athento

Existen muchas ocasiones en las que necesitamos datos que no están presentes en los documentos, o que la tarea de extraerlos adquiere más precisión si se toman de una base de datos, o aplicación externa.

Para esos datos, Athento cuenta con una funcionalidad que permite obtener una fila de un fichero CSV, basándose en la coincidencia del valor de una columna en el fichero y un metadato extraído del texto del documento.

A continuación, vamos a ver cómo este proceso funciona.

Por un lado, tenemos un documento (una factura de teléfono) del que vamos a extraer un par de metadatos:

  • CIF/VAT/ROOT o número de identificación fiscal
  • Total de la factura
  • Periodo de facturación.
Estos metadatos serán extraídos del texto de la factura.

Por otro lado, tenemos un fichero CSV (Comma Separated Value) que contiene una serie de registros o filas. Las columnas del CSV son:

  • CIF/VAT/ROOT 
  • RAZON SOCIAL 
  • DIRECCION 
  • CONTACTO
  • TELEFONO EMAIL
Como veis, en ambos casos, contamos con un metadato en común: CIF/VAT/ROOT .

Lo que sucederá en el vídeo, es que el Smart Engine de Athento buscará el valor del metadato CIF/VAT/ROOT  que ha extraído de la factura de teléfono en la columna CIF/VAT/ROOT  del fichero CSV. Una vez que encuentre la coincidencia, relacionará los datos de la fila con el fichero físico de la factura.

El procesamiento del fichero CSV lo hacemos desde el backend del SE de Athento:
  1. Creamos un CSV File que incluye el fichero, el carácter separador de los datos, y la columna clave.
  2. Acto seguido le decimos a Athento que procese ese fichero y que guarde en su base de datos las filas del CSV o registers.
  3. A continuación, le decimos a Athento que extraiga los valores para la columna clave y que lo guarde como Id1, que será el campo con el que hará el matching.
  4. Finalmente, le damos a Athento la orden "Match Metadata" que significa que encuentre la coincidencia entre un metadato extraído del texto y una fila del CSV.
Estos procedimientos pueden ser ejecutados de forma transparente para el usuario, pero así podemos mostraros la forma en la que trabaja el sistema.

La última parte de la demostración, enseña cómo desde el front-end de Athento le pedimos que nos muestre los registros desde la propia factura.

Esperamos que os ayuda gustado esta funcionalidad de captura de documentos de Athento.



Importación de Metadatos Desde Bases de Datos Externas from Athento on Vimeo.


No hay comentarios:

Publicar un comentario en la entrada

AddThis