jueves, 5 de septiembre de 2013

Validación de datos y calidad de la información obtenida en procesos de captura

Normalmente cuando hablamos de software de captura, funcionalidades como la clasificación  de documentos o la extracción de datos de documentos son las atracciones estrella. Esto es normal, ya que son las dos funcionalidades que permiten a las empresas obtener información que de otra forma estaría inaccesible en sus documentos. 

La precisión de los resultados de estos procesos está sujeta a múltiples factores que no se limitan sólo a la potencia y calidad del software, por ejemplo, la calidad de los documentos que tienen que ser procesados. En muchos casos estos documentos son imágenes escaneadas de fotocopias de fotocopias y tienen tan poca calidad que el ojo humano también tiene problemas tratando de leer la información. En estas condiciones, las máquinas y tecnologías existentes no pueden hacer mucho más que el ojo humano.  No obtener información, u obtener información imprecisa tiene como consecuencia que los sistemas que están esperando esa información trabajen sobre errores. Por ejemplo, en el caso de facturas, si los datos extraídos son incorrectos -digamos que se extrae como total de la factura un total de 500 euros cuando en realidad era un total de 600- nuestro software de contabilidad contabilizará una cantidad errónea. Aquí es dónde aparece la importancia de la validación de datos, ya sea manual o automática.

Validar la información obtenida por el software de captura es una forma de garantizar la calidad de la misma antes de enviarla a nutrir otros sistemas.


Opciones de Validación de Datos en software de Captura:

  • Notificación de aquellos documentos en los que la extracción o clasificación de datos está por debajo del umbral de seguridad de acierto: En otras palabras, si el sistema no está 99% seguro de la extracción o clasificación de un documento, debería notificarlo.
  • Ayudas de previsualización del documento: Poder realizar zoom sobre el documento en el momento de la revisión nos ayuda a localizar e identificar los datos en las imágenes escaneadas.
  • Validación Manual: Posibilidad de corregir los datos erróneos obtenidos por el sistema. Esta corrección la hacen los usuarios.
  • Validación Automática:  Esta opción permite la conexión del sistema con bases de datos en las que ya se encuentra la información extraída para corroborar que los datos se corresponden. Por ejemplo, si se extrae el nombre de un paciente de una analítica, el sistema puede buscar el nombre del paciente en el sistema de información hospitalario, comprobar que existe y comprobar otros datos asociados como el número de la seguridad social, etc.

En el caso de la versión 2.0 de Athento, el sistema ofrece vistas de validación para los documentos procesados, estas vistas permiten corregir los datos erróneos o que no han podido ser extraídos. Además, permiten visualizar el documento mediante ayudas de tipo zoom-in (una lupa) que permite a las personas encargadas de validar los datos una mayor visibilidad de los mismos.




No hay comentarios:

Publicar un comentario

AddThis