viernes, 15 de enero de 2016

Validación automática de metadatos extraidos


 En el artículo de hoy vamos a ver un Caso de Uso acerca de cómo validar documentos automáticamente con la premisa de que sus metadatos sean correctos. Recordemos que la extracción y validación automática de datos de documentos se realiza con el módulo de captura de documentos de Athento: Athento Smart Engine (Athento SE).

Como ejemplo, vamos considerar una factura con un único metadato: el CIF -número de identificación fiscal para las empresas en España-. Si este metadato cumple con un determinado formato (una letra al principio y ocho números), se validará de forma automática y a su vez se validará la factura al completo. 

Validación de un Metadato

En primer lugar, tenemos que activar la operación "Metadata Autovalidation" (Autovalidación de metadatos). Podemos activar esta operación desde la configuración de la serie, en el menú Administration (Administración).


A continuación, en Settings (Ajustes) seleccionamos la pestaña "Document Operations" (Operaciones con Documentos). 
Continuamos buscando la operación "Metadata Autovalidation" dentro de las Operaciones Desactivadas (Disable Operations). 

Para activarla pulsamos este botón:

Una vez que la operación esté activa, ya aparecerá en las Operaciones Activas (Enable Operations). 
El siguiente paso será configurar la condición de validación para el metadato. En el ejemplo que estamos siguiendo, lo que vamos a utilizar para la validación es una condición que evalúa que el metadato cumpla con un determinado patrón: 


Para definir la condición, debemos ir a la Definición del Metadato (Metadata Definition) que se identifica con este icono: 

Desde la Definición del Metadato, iremos a la sección Opciones de Validación (Validation Options) y en el campo "Autovalidation" (Autovalidación) podremos definir la condición que el metadato ha de cumplir para que se valide de forma automática. 


Las funciones de Python re.compile() y .match() nos van a permitir saber si el metadato cumple con una expresión regular o patrón. En re.compile() indicamos la expresión regular, y en .match() indicamos el valor del metadato -metadata.value-. 


En el caso concreto de un CIF, si el número se compone de una letra mayúscula y 8 dígitos numércicos, la condición se evalúa como verdadera y el metadato se muestra en color verde. Sin embargo, en caso contrario se mostrará en color rojo como en el siguiente ejemplo: 


  • Color verde = el metadato cumple con el patrón y está autovalidado
  • Color rojo =  el metadato NO cumple con el patrón.

De esta forma, los usuarios sabrán a simple vista cuándo el metadato se ha validado de forma automática. 

Validación de un documento

En el caso de las facturas del ejemplo que estamos siguiendo, sólo tenemos que extraer el CIF, por tanto, si el CIF extraído cumple con el patrón indicado,  la factura entera se validará.  Podríamos configurar la validación automática para tener en cuenta varios metadatos, pero para este ejemplo sólo hemos utilizado uno.

Para configurar esa autovalidación, se necesita una operación en la serie capaz de cambiar el estado del documento. Necesitamos que el nuevo estado de la factura después del proceso automático de validación sea "Validado".

Para la versión 4.10. este tipo de operación aún no se encuentra disponible para instalación en el "Upgrade Center" (Centro de Actualización), de forma que es necesario hacer la instancia desde el backend. Para hacerlo, iremos a Operations-> Process Operations.


Para crear una nueva operación utilizaremos el botón "Add process operation": 


Una vez en el formulario, otorgamos un nombre a nuestra operación y rellenamos los parámetros que detallamos a continuación. 




El resultado que tendremos es que en el listado de documentos -después de procesar las facturas-, las facturas en las que el CIF de haya extraído con el formato indicado -una letra mayúscula y 8 números-, aparecerán como validadas: 


Podéis encontrar más detalles sobre cómo realizar esta validación en: https://athento.atlassian.net/wiki/pages/viewpage.action?pageId=37093402



Prueba 30 días gratis Athento

No hay comentarios:

Publicar un comentario en la entrada

AddThis