miércoles, 11 de noviembre de 2015

Los Retos de la Banca en Gestión Documental (Parte 2)



En la primera parte de este artículo, veíamos algunas de las características de los procesos de concepción de préstamos o de tarjetas de crédito, que las convertían en retos de negocio y retos tecnológicos:
  • Proceso que se lleva a cabo fuera de las instalaciones bancarias.
  • Volumen importante de documentación (+10 millones de documentos al año).
  • Documentos recibidos por distintos canales (escaneados, como fotografías, por email, desde aplicaciones web, etc.).

En esta segunda parte, nos alejamos un poco de la problemática del negocio para introducirnos en la problemática tecnológica. ¿Qué es posible hacer hoy en día para resolver los retos del negocio? ¿Dónde tendremos que evolucionar?
“Las soluciones tecnológicas que nos permiten la captura del documento en formato digital reducen de forma considerable el tiempo en que los datos llegan a las agencias o al banco y reducen los costes de logística”

Las soluciones tecnológicas que nos permiten la captura del documento en formato digital (formularios web, captura desde dispositivos móviles, digitalización desde el punto de venta) reducen de forma considerable el tiempo en que los datos llegan a las agencias o al banco y reducen los costes de logística. De hecho, implementando estos métodos, se puede reducir el tiempo de aprobación del expediente a 2 días desde la captación del cliente hasta la aprobación del crédito o tarjeta por parte del banco, lo que es una cifra muy buena considerando la duración del proceso en papel que de media se tarda unos 20 días.
“Capturando en digital los documentos desde el punto de venta es posible reducir los tiempos de aprobación de créditos o tarjetas de 20 a 2 días”

Sin embargo, aquí aparece un segundo reto en este tipo de procesos. La información de la solicitud debe ser contrastada contra la información de los documentos que la soportan. Por ejemplo, el número de DNI que aparece en la solicitud debe ser consistente con el número de DNI que aparece en el documento de identidad. Esta revisión o validación de datos se ha llevado a cabo tradicionalmente por personas y está expuesta a los riesgos que tienen las tareas repetitivas llevadas a cabo por humanos: errores por cansancio, por omisión, etc. Además, una validación manual supone un tiempo que para el proceso podría ser totalmente prescindible. 
“La revisión o validación de datos o documentos se ha llevado acabo tradicionalmente por personas, resultando costosa en materia de tiempos y errores, además de ser una labor tediosa para los trabajadores de la banca”

Este problema aún no está totalmente resuelto en la industria, pero tecnologías de extracción del texto de imágenes juegan el papel crucial en esta fase. Para conseguir validaciones automáticas, es decir, que los ordenadores comprueben en lugar de las personas si hay consistencia de datos o si los datos son veraces, etc., se requiere que el contenido de los documentos (imágenes escaneadas o captadas como fotografías desde dispositivos móviles) sea legible por las máquinas. 

Esta lectura representa sus propios retos informáticos. No porque no existan tecnologías capaces de leer texto dentro de imágenes, que de hecho existen y son conocidas como OCR/ICR, sino por la naturaleza de los documentos utilizados en banca.
“El primer reto informático es de la identificación de tipos documentales por parte de los ordenadores”

El primer reto informático es el de la identificación de tipos documentales o clasificación de documentos. Esto se debe a que para que la máquina sepa exactamente de donde debe leer los datos, debe saber con qué tipo de documento está tratando. El reconocimiento automático de documentos puede resolverse mediante la vía del procesamiento de imagen o mediante la vía del procesamiento del texto. Qué vía se aplique dependerá de la naturaleza de los documentos. Por ejemplo, en el caso de Athento, software del que somos orgullosos padres ;), se puede aplicar procesamiento de la imagen para documentos que pueden ser identificados por logotipos o por los colores que predominan en él. En otros casos, Athento usa algoritmos de procesamiento de texto que le permite definir patrones textuales para reconocer el documento, o algoritmos que miden la similitud entre dos textos comparados.
“El siguiente reto, y quizás el más complejo, es el de la extracción de datos concretos de los documentos”

El siguiente reto tecnológico y quizás el más complejo en todo el proceso, es el de la extracción o lectura de datos de imágenes. Un ejemplo claro de este reto tecnológico al que nos enfrentamos es el de la lectura de imágenes de DNIs. Incluso si hilamos más fino, la problemática es totalmente distinta en DNIs escaneados que en DNIs capturados desde dispositivos móviles.

Los DNIs son documentos que por cuestiones de seguridad incluyen múltiples elementos (marcas de agua, hologramas) que dificultan la lectura que el OCR puede hacer de los datos. Además, son documentos que suelen cambiar con el tiempo, haciendo que los mecanismos de extracción que servían en un tipo ya no sirvan en otro. Los DNIs escaneados requieren de la aplicación de diferentes algoritmos de procesamiento de imagen para despejar el camino del OCR y que éste pueda hacer una lectura lo más acertada posible. Otro problema con DNIs escaneados suele ser la calidad. En ocasiones, los clientes facilitan fotocopias escaneadas de sus documentos en condiciones tan paupérrimas que ni siquiera para el ojo humano es posible su lectura. En estos casos, por ejemplo, las tecnologías deben “decidir” aplicar métodos de extracción a través de la MRZ (Machine Readable Zone). Como veis, los supuestos son múltiples y las máquinas deben “aprender” a identificar cada casuística para así aplicar los diferentes algoritmos que son necesarios para conseguir la extracción del texto.
“Los supuestos de extracción de datos son múltiples y las máquinas tienen el reto de aprender a identificar diferentes casuísticas para aplicar diferentes algoritmos según las características de los documentos”

En el caso de los DNIs captados como fotos mediante dispositivos móviles, esta es una casuística extra, que como mencionaba anteriormente, tiene sus propios retos. Por ejemplo, en las imágenes de DNIs captadas como fotos, el DNI debe ser aislado del fondo de la imagen para poder ser procesado. Así mismo, debe corregirse la perspectiva generada por la cámara y la imagen debe ser normalizada para corregir problemas típicos de fotografías: desenfoque, exceso o falta de luz, contraste, brillo, etc. Vemos pues, que se requiere procesamiento de las imágenes a distintos niveles.
“El último reto a destacar es el de la prevención del fraude en contratos de crédito”

Una vez resulto el tema de la extracción de datos, que nos permite comparar y revisar documentos de forma automática, queda un reto más en partes posteriores del proceso. Este reto, es el de la prevención del fraude en los contratos. Una vez se envían los contratos en papel al cliente para su firma (en caso de que no se hayan implementado mecanismos de firma digital), el banco debe asegurarse de que el contrato que recibe por parte del cliente es una copia idéntica al que le envió a éste. Una de las soluciones propuestas a esta problemática tiene que ver con la lectura de códigos de barras o QR, ya que éstos son más complejos de alterar que los textos de las imágenes. Se necesita pues, tecnología capaz de leer y comparar los códigos de la copia del banco y de la copia firmada devuelta por el cliente.

Como veis, en la actualidad ya disponemos de tecnología capaz de hacer frente a estos retos de la banca. Sin embargo, dicha tecnología aún tiene mucho margen de mejora:
  • Necesita facilitar la configuración de diversos tipos documentales en materia de extracción y clasificación.
  • Debe mejorar los resultados de extracción en ciertos tipos documentales como los DNIs que tienen tan diversas calidades y que vienen de distintos tipos de captura.
  • Debe aprender de forma autónoma para decidir en cada situación los métodos que permitan mayor nivel de acierto.
  • Debe dar respuestas más rápidas aunque el consumo de recurso de máquina sea tan alto por las volumetrías y por la cantidad de información que debe obtenerse de los documentos durante el procesamiento de imagen y de texto.
  • Debe caminar hacia la eliminación completa de la intervención de personas en materia de validación de datos, etc.

Nosotros que conocemos la problemática a fondo, sólo podemos emocionarnos al ver los avances y los cambios que significan para el cliente la implementación de este tipo de tecnologías. Es muy motivante escuchar de boca del cliente que has reducido el tiempo de resolución de su proceso de aprobación de expedientes de crédito en un 90%. Pero también es muy motivante hacer software con tantos retos tecnológicos y tanta investigación por delante. Es especialmente motivante saber que aún se puede hacer mejor lo que haces.

Fin.

Descarga el caso de éxito de ICOGAM y descubre cómo digitalizar de forma inteligente

No hay comentarios:

Publicar un comentario en la entrada

AddThis