martes, 5 de noviembre de 2013

Reconocimiento de letra manuscrita: Estado del Arte de las tecnologías ICR

Hoy vamos a hablar un poco sobre una de las tecnologías de captura de documentos: las tecnologías ICR (Intelligent Character Recognition). El software ICR que han sido creado para convertir a texto legible por ordenadores la letra escrita por humanos (de su puño y letra :-) ).

Esta es una tecnología menos avanzada que el OCR, con muchas más dificultades y con peores resultados. El grado de dificultad de leer letra manuscrita, ni siquiera se nos escapa a nosotros los humanos, o ¿quién no ha tratado de descifrar el contenido de una prescripción médica?

Sin embargo, esta tecnología parece estar avanzando. Algunas firmas como Parascript hablan de que algunos sistemas ICRs pueden alcanzar una lectura de hasta el 95% del texto manuscrito con una tasa de error del 2%. 

Pero, ¿cuál ha sido la evolución de las soluciones a la hora de leer letra manuscrita en documentos y convertirla en información digital?

  1. La primera solución que se nos ocurrió a los humanos fue tener personas que leyesen la información digitada en papel y que la pasaran a ordenador ellos mismos. Este sistema todavía es usado en administraciones públicas, hospitales, bancos, instituciones educativas, etc. Sobra decir que esta solución al ser manual es costosa, pero soluciona un problema mucho más grave para las empresas que es la de la recuperación de la información.
  2. Luego pasamos a utilizar casillas en los documentos para obligar a las personas a escribir en un determinado espacio como se puede observar en la imagen del ejemplo.
    Esto se debía a que los ICRs del momento no podían reconocer las letras si estas se tocaban las unas con las otras.
  3. Luego se nos ocurrió imprimir en "drop-out ink" los documentos (colores pasteles la mayoría de ellos que impiden la lectura del OCR). Con esto se lograba que el ICR sólo leyese los caracteres manuscritos sin ruido añadido. Según Imerge Consulting, esta solución podía por sí misma eliminar el 60% de los trabajadores dedicados a  picar datos (digitar). Hasta este momento, los ICRs trabajaban identificando letra por letra (casilla a casilla), pero lo que en la industria se busca es un "criterio de usabilidad" a nivel de campo, o lo que es lo mismo, que la palabra o frase completa está correcta y tenga sentido.
  4. Pero la realidad es que no vivimos en un mundo donde las personas escriban siempre entre casillas. Es por ello que las tecnologías ICR se vienen esforzando durante los últimos años en texto escrito de manera libre. Al no estar constreñidas las letras entre casillas, nos enfrentamos a un sinnúmero de problemas más, por ejemplo, que el ancho de las letras varía, que las letras se tocan las unas a las otras etc. Nuevo algoritmos están siendo utilizados en la actualidad, algunos de ellos lo que hacen es comparar los caracteres manuscritos contra una inmensa base de datos de imágenes, se analizan los trazos, patrones lingüísticos, etc. Con todo ello, los resultados siguen estando por debajo de lo que hemos conseguido con tecnologías OCR. Los defensores del uso de ICR, afirman que cualquier porcentaje de acierto que se logre constituye un ahorro de mano de obra. Lo cierto es que aspectos como la lectura de las letra cursiva, aún sigue sin haber sistema que pueda resolverlos.

No hay comentarios:

Publicar un comentario en la entrada

AddThis