Según la Wikipedia, son aplicaciones dirigidas a la digitalización de textos. Identifican automáticamente símbolos o caracteres que pertenecen a un determinado alfabeto, a partir de una imagen para almacenarla en forma de datos con los que podremos interactuar mediante un programa de edición de texto o similar.
Aquí os presentamos un vídeo, que si una imagen vale más que mil palabras, tenemos que sacar la calculadora para estimar su valor ;-)
Por supuesto, "interactuar mediante un programa de edición de texto" tiene muchas implicaciones:
-Poder buscar documentos dentro de nuestra intranet, gestor documental o ECM corporativos, haciendo una búsqueda full text, osea buscando en el interior del documento.
-Poder pasar el documento (en formato TIFF, JPG, PDF sin indexar, PNG o cualquier otro formato imagen) a formato Word (.doc), Open Office (.odt) o cualquier otro formato editable que elijamos, para poder editar y mejorar el texto.
Y también tiene algunas implicaciones propias en el entorno de Gestión Documental Inteligente que nos movemos desde Yerbabuena:
-Podemos metadatar de manera automática, ya que podemos razonar sobre el contenido de los documentos.
-Podemos iniciar un flujo de trabajo (workflow) de revisión, aprobación etc. basándonos en el contenido del documento (otra vez porque gracias
-Podemos mejorar el resultado de cualquier software OCR mediante ICR, osea tenemos la capacidad de inferir, de forma automática, el contenido de una palabra que pueda no haberse escaneado correctamente ya que el papel estaba doblado en una esquina, la tinta en papel estaba borrada o cualquier otra cosa.
Existen soluciones privativas como Kofax, Abby y otras muchas, integrables con ECM.
Como siempre, la ventaja de nuestro OCR es que se basa en código abierto (open source), con lo que la ventaja en precio es mucho mayor, sin perder en la potencia tecnológica y ganando sobre todo en libertad: puedes elegir que otra empresa evolucione el software que te suministramos, si así lo crees necesario, sin ningún tipo de limitación.
Además, estas soluciones propietarias escalan en precio de forma muy alta: habitualmente compras licencias por usuario, con lo que si tu organización tiene 2.000 usuarios, multiplicas por 2.000 el coste de cada licencia, con los descuentos por volumen correspondiente.
En el caso de nuestro módulo de OCR, el coste es único por implantación. Cobramos por el motor del coche, nos da igual que vayas a llevar el coche siempre lleno o vacío, ahí no nos metemos.
Evidentemente, y en cuanto la organización tiene cierto tamaño, el coste pasa a ser de una fracción del coste de los Sistemas OCR privativos, sin pérdidas en fiabilidad (al contrario, las soluciones privativas no incorporan tecnología semántica para hacer OCR inteligente, o ICR).
Puedes ver más vídeos en el canal de Youtube de Yerbabuena Software.

Recuerdo, allá por los 90, cómo alucinábamos con este tipo de software que rara vez funcionaba. Sobre todo con aquellos scanners -de mano- de la época que regalaban su propio OCR. Uf, tediosa curva de aprendizaje y nula UX tenía aquello.
ResponderEliminarMe ha gustado mucho encontrar este artículo y me encanta saber que estáis teniendo iniciativas tan buenas y repletas de posibilidades.
Gracias por el comentario "mediomelón".
ResponderEliminarPor supuesto este tipo de soluciones han evolucionado y ya están mucho más estables.
Abrazos!
Qué motor OCR estáis usando?
ResponderEliminarSin mirarlo, yo diría que ocropus (¿con tesseract o es una versión más reciente?), o cuneiform. Son los más conocidos en software libre.
ResponderEliminar