martes, 17 de enero de 2012

Clasificando documentos con una tasa out-of-the-box del 80,85%

“Con una tasa de acierto out-of-the-box del 80,85% en clasificación automática de documentos Athento consigue digitalizar historias clínicas en un importante hospital del país. Esta es una tasa muy elevada, considerando que el sistema no tuvo entrenamiento previo ”

Durante el pasado diciembre estuvimos realizando pruebas sobre Athento en un importante hospital de Andalucía. El objetivo era demostrar el desempeño de Athento en la digitalización de historias clínicas. Los resultados han sido muy buenos. En una mañana, se instaló Athento y se procedió a digitalizar un conjunto de historias clínicas. Vamos a describir un poco las características de las pruebas.
Se tomó una muestra de 12 historias clínicas. Estas historias clínicas (H.C en adelante) contaban con más de 20 tipos documentales distintos, pero para las pruebas se tomaron sólo 8 tipos distintos de documentos:
  • Consentimientos informados
  • Analíticas (distintos tipos)
  • Informes (naturaleza diversa)
  • Informe de Urgencias
  • Observaciones acerca del Curso Clínico
  • Hoja de estadística Clínica
  • Informe de alta
  • Gráfica diaria
Los documentos que componían las H.C se encontraban en diversas condiciones y calidades. Athento consiguió clasificar correctamente 76 documentos de 94.
Los sistemas de reconocimiento y clasificación de documentos como el que tiene Athento requieren de un periodo de entrenamiento del sistema para alcanzar su máxima tasa de acierto, que en el caso de Athento se encuentra en el 98%. Por entrenamiento podemos entender un periodo clasificando documentos de manera que el sistema vaya refinando su capacidad de identificación de documentos. El aspecto más destacable de la prueba, es que sin este periodo de entrenamiento, Athento (en frío, por llamarlo de alguna manera) ha conseguido una tasa de acierto muy alta.
Para clasificar un documento, Athento lleva a cabo el siguiente proceso:




Athento analiza la estructura de la imagen y la asocia a un tipo de documento por sus características, posteriormente aplica el OCR para convertir el texto de la imagen en texto real que luego analiza semánticamente buscando patrones que puedan pertenecer a determinado tipo documental. A estas alturas del proceso Athento ya se encuentra listo para discernir el tipo de documento que ha sido capturado; pero todo este proceso ya os lo explicaremos con más detalle ¡en otro post!


Contáctanos ahora!
Podemos ayudarte y mejorar la gestión documental de tu empresa.
Descarga este white paper gratuito y aprende sobre gestión documental en la nube

No hay comentarios:

Publicar un comentario

AddThis