lunes, 23 de enero de 2012

Integración De Aplicaciones De Negocio Con El Gestor Documental


Son muchas las aplicaciones en las empresas que generan o requieren documentos ¿Cómo hacer para que todas las aplicaciones de negocio accedan y almacenen los documentos en un mismo lugar?


Cuando el equipo de desarrollo de Yerbabuena emprendió la tarea del desarrollo de Athento, una de las principales preocupaciones fue que el desarrollo de los componentes se hiciera siguiendo estándares que facilitaran integraciones con otras aplicaciones, ya fueran otros gestores documentales (para lo que se decidió implementar el estándar CMIS) u otras aplicaciones.

Abrir la posibilidad de interconectar Athento con otros sistemas era el primer paso, pero la segunda preocupación era reducir al máximo la necesidad de grandes desarrollos para lograr la conexión con otros sistemas.

Cuando se quiere conectar una aplicación de negocio con un gestor documental, las empresas se ven obligadas a realizar modificaciones tanto en el gestor como en las aplicaciones, de modo que se preparen ambos extremos del canal para poder comunicarse. El problema de los desarrollos no sólo es el tiempo y el dinero que consumen, sino que se encuentran sujetos a las versiones actuales de los sistemas. Una nueva versión del gestor y puede que el desarrollo que lo preparaba para conectarse con la aplicación de facturas quede inservible.

Al implementar el estándar CMIS, Athento soluciona una parte de la problemática, la del extremo del gestor. Athento se integra con el gestor documental (llámese Alfresco, Nuxeo, OpenText o cualquier otro que implemente CMIS) de manera que no haya que realizar modificaciones en él para prepararlo para la comunicación con las aplicaciones. Pero aún queda la parte de ajustar las aplicaciones (el otro extremo de la comunicación). En este punto, Athento evita de nuevo que se tengan que hacer modificaciones en el software. Para que esto sea posible, Athento Manager, es una capa que gestiona la comunicación de Athento con otras aplicaciones y gestores mediante la implementación de servicios.





Athento Manager implementa pues servicios de salida que permiten a Athento actuar sobre el repositorio documental y servicios de entrada que ayuden a las aplicaciones a consultar los documentos en el gestor. Podemos entender estos servicios como los canales de comunicación entre Athento y repositorio o Athento y aplicaciones. Así por ejemplo, si Athento necesita crear carpetas o documentos dentro de Alfresco utiliza su conector de salida de CMIS para crearlos. Y si la aplicación de facturas necesita consultar una factura de un cliente, Athento utiliza su conector de entrada REST para devolverle una representación de esa factura.


Los conectores para las aplicaciones los puede desarrollar el departamento técnico de la empresa, o los técnicos de Yerbabuena u cualquiera que sepa hacerlo, lo importante aquí es que nos olvidamos de hacer un desarrollo dentro de cada nuevo gestor, o cada vez que el repositorio cambie de versión, o uno por cada aplicación que necesite consultar documentos.





Con estos argumentos nos sentimos tranquilos al decir que Athento es una aplicación altamente interoperable.






Contáctanos ahora!
Podemos ayudarte y mejorar la gestión documental de tu empresa. Descarga este white paper gratuito y aprende sobre gestión documental en la nube

martes, 17 de enero de 2012

Clasificando documentos con una tasa out-of-the-box del 80,85%

“Con una tasa de acierto out-of-the-box del 80,85% en clasificación automática de documentos Athento consigue digitalizar historias clínicas en un importante hospital del país. Esta es una tasa muy elevada, considerando que el sistema no tuvo entrenamiento previo ”

Durante el pasado diciembre estuvimos realizando pruebas sobre Athento en un importante hospital de Andalucía. El objetivo era demostrar el desempeño de Athento en la digitalización de historias clínicas. Los resultados han sido muy buenos. En una mañana, se instaló Athento y se procedió a digitalizar un conjunto de historias clínicas. Vamos a describir un poco las características de las pruebas.
Se tomó una muestra de 12 historias clínicas. Estas historias clínicas (H.C en adelante) contaban con más de 20 tipos documentales distintos, pero para las pruebas se tomaron sólo 8 tipos distintos de documentos:
  • Consentimientos informados
  • Analíticas (distintos tipos)
  • Informes (naturaleza diversa)
  • Informe de Urgencias
  • Observaciones acerca del Curso Clínico
  • Hoja de estadística Clínica
  • Informe de alta
  • Gráfica diaria
Los documentos que componían las H.C se encontraban en diversas condiciones y calidades. Athento consiguió clasificar correctamente 76 documentos de 94.
Los sistemas de reconocimiento y clasificación de documentos como el que tiene Athento requieren de un periodo de entrenamiento del sistema para alcanzar su máxima tasa de acierto, que en el caso de Athento se encuentra en el 98%. Por entrenamiento podemos entender un periodo clasificando documentos de manera que el sistema vaya refinando su capacidad de identificación de documentos. El aspecto más destacable de la prueba, es que sin este periodo de entrenamiento, Athento (en frío, por llamarlo de alguna manera) ha conseguido una tasa de acierto muy alta.
Para clasificar un documento, Athento lleva a cabo el siguiente proceso:




Athento analiza la estructura de la imagen y la asocia a un tipo de documento por sus características, posteriormente aplica el OCR para convertir el texto de la imagen en texto real que luego analiza semánticamente buscando patrones que puedan pertenecer a determinado tipo documental. A estas alturas del proceso Athento ya se encuentra listo para discernir el tipo de documento que ha sido capturado; pero todo este proceso ya os lo explicaremos con más detalle ¡en otro post!


Contáctanos ahora!
Podemos ayudarte y mejorar la gestión documental de tu empresa.
Descarga este white paper gratuito y aprende sobre gestión documental en la nube

lunes, 9 de enero de 2012

¿Por qué aplicar Semántica a la Gestión Documental?


"La Semántica comienza a vislumbrarse como la aliada de la gestión documental para hacer frente a la sobre población digital que vivimos"



Hoy en día trabajamos y compartimos toda clase de información digital. Buscamos cuanto necesitamos en internet, tenemos información disponible por doquier. Con tanta información comienza a ser más difícil cada vez más encontrar lo que estamos buscando. Según un estudio de McAfee en 10 países distintos y con una muestra de 3000 usuarios de las nuevas tecnologías, en promedio cada una de esas personas tiene 2777 archivos digitales almacenados en al menos un dispositivo.

Si multiplicamos esta cifra por ejemplo por los empleados de una empresa de 50 trabajadores, ya tenemos un volumen de 138850 ficheros. Los sistemas DMS o ECM nos ayudan a mantenerlos organizados, a no perderlos, a deshacernos del papel, pero la verdad, cada vez se hace más difícil encontrar de manera rápida aquello que necesitamos, y peor, cada vez es más difícil sacar provecho de la información contenida en los documentos de las empresas, pues son tantos que es difícil construir conocimiento a partir de ellos.

Tampoco es fácil hoy en día encontrar un documento o archivo usando los datos tradicionales por los cuales lo identificamos, como su nombre, autor o fecha de creación, pues estos no son precisamente datos que las personas recordemos con precisión.

Es para ayudarnos a solventar todas estas dificultades que aparece la semántica. Definiendo descripciones sobre documentos o entidades como personas, empresas, países, o simplemente, cualquier dato relevante dentro de los documentos, y consiguiendo asociar dichos documentos porque comparten esas entidades o contenido similar, podemos mejorar drásticamente los mecanismos que tenemos para recuperar documentos o encontrar información acerca de algo que necesitemos.



Vamos a verlo con un ejemplo, en la siguiente imagen se pueden ver dos mecanismos distintos para encontrar un documento. 
La imagen de la derecha es un formulario tradicional que nos pide que recordemos datos precisos, como título, descripción o rango de fechas de creación. En la parte derecha vemos una nube de tags. Si pinchamos en un término de esa nube de tags iremos a un conjunto de documentos cuyo contenido se encuentra relacionado con dicho término. 
¿Cuál método es más efectivo? Bueno, depende de si sabemos con precisión todos los datos del documento, lo malo es que no siempre sabemos todos esos datos de nuestros 2777 archivos en promedio por persona. ¿Cuál método es más rápido? Un clic siempre va a ser más rápido, por supuesto, que rellenar un formulario. 
Pero el secreto no está en el mecanismo de búsqueda utilizado, eso no es un ejemplo de semántica, la mayoría de sistemas gestores de documentos nos ofrecen la posibilidad de etiquetar documentos; la diferencia viene cuando es el propio sistema el que logra entender el contenido de los documentos e identificar en él la información que es relevante, para luego, relacionar todos aquellos documentos que tratan sobre ese mismo contenido. Ahí está la semántica, cuando el sistema logra entender que un documento trata sobre innovación y que debe agruparlo con otros que también tratan el tema.



La semántica pues, en este ejemplo concreto, nos ahorra trabajo como tener que pensar cuales son las palabras que resumen el contenido del documento y nos ayuda a encontrar más rápido aquellos otros documentos que también podríamos querer revisar porque tratan la misma temática.
Este es sólo un ejemplo de semántica aplicado a la gestión documental (Autotagging en Athento iDM), pero comienzan a desarrollarse otras muchas aplicaciones que poco a poco irán consiguiendo que nos sea menos complicado movernos entre tanta información.


Contáctanos ahora! Podemos ayudarte y mejorar la gestión documental de tu empresa.
Descarga este white paper gratuito y aprende sobre gestión documental en la nube

AddThis