lunes, 1 de febrero de 2016

Utilizando varios métodos de extracción para un mismo metadato

A veces, no conseguimos extraer siempre el valor de un metadato con el mismo método. En estos casos, se requiere utilizar varias técnicas para extraer el valor del metadato del máximo de documentos posible.

Vamos a ver un ejemplo de cómo “Definir varios métodos de extracción para el valor de un metadato” que se ha publicado en el Documentation Center de Athento.

En el caso del ejemplo, en algunas muestras de órdenes de fabricación el metadato “Código Cliente” se saca mejor mediante OCR zonal, pero en otros casos, funciona mejor buscar el metadato indicando dos expresiones entre las cuales se encuentra el código del cliente.

En Athento Smart Engine -Athento SE- existe la posibilidad de definir varios métodos de extracción automática de datos para conseguir extraer el valor de un metadato.

¿Cómo hacerlo?


Tendremos que crear un metadato en Athento SE por cada uno de los métodos a utilizar.

En el caso del ejemplo, habrá que crear dos metadatos:
  • Código de Cliente (utiliza start y end words).




  • Código de Cliente OCR Zonal (para extraer el dato mediante OCR zonal si el primer método falla).




Una vez que hemos definido todos los métodos de los que nos podremos ayudar para extraer el dato, es necesario crear un metadato extra que se va a quedar con alguno de los metadatos que no esté vacío. Esto lo hacemos definiendo una expresión dinámica (dynamic expression). Esta expresión dinámica simplemente indica al sistema que se quede con un valor o el otro. La expresión sería la siguiente:

fil.gmv('metadatatype-A') or fil.gmv('metadatatype-A')


¡Listo! :) Recuerda que puedes hacer esto y mucho más con la captura de documentos de Athento.


Crea tu cuenta freemium de captura de documentos

No hay comentarios:

Publicar un comentario en la entrada

AddThis