martes, 14 de noviembre de 2017

¿Por qué implementar procesos de negocio en un gestor documental?

¿Cuál es el valor de las empresas a la hora de implementar procesos de negocio en un gestor documental? Los procesos de negocio giran en torno a documentos y contenidos, un flujo de trabajo permite adquirir el control sobre los procesos y los documentos que los conforman.

Relación entre documentos y procesos de negocio

Si nos detenemos a pensar en los procesos de negocio, nos daríamos cuenta de que casi todos ellos giran en torno a documentos, expedientes u otras formas de contenido.

Por ejemplo, si somos una aseguradora, nuestro proceso de gestión de siniestros empieza con una reclamación de un cliente (documento) que da origen a un expediente de siniestro (expediente) y que deberá resolverse con una resolución del expediente (documento).

Si somos un banco que vende tarjetas de crédito, nuestro proceso empieza con una solicitud de tarjeta de crédito que nos hace un cliente (documento), que da lugar a un expediente de análisis de riesgo crediticio (expediente) y que se resolverá con una respuesta a un cliente (documento) y una tarjeta de crédito.
Desde el inicio al final del proceso, lo que estamos haciendo es: gestionando documentos.

Para garantizar que esa gestión sea homogénea, estandarizada y que cumpla con unos plazos, podemos utilizar flujos documentales, circuitos de aprobación, flujos de trabajo o como quiera que queramos llamarlos.

¿Qué es un flujo de trabajo?

Un flujo de trabajo documental, es un sistema utilizado para producir, rastrear, editar, almacenar y administrar documentos asociados con un proceso de negocio. Este sistema facilita el manejo del proceso en sí, así como de los documentos generados en cada etapa de un proceso de negocio, evitando demoras y también, ayudando a detectar los cuellos de botella que afectan la productividad.

Un software de gestión documental permite la creación de flujos de trabajo que ayudan a optimizar este proceso. El proceso se divide en actividades, con responsables claros y cuyo cumplimiento se registra en el gestor documental con sus plazos y cumplimientos.

Llevar un proceso en digital permite un procesamiento más eficiente. Los documentos en papel se reducen a un mínimo o se eliminan, lo que mejora la fiabilidad del proceso y disminuye las ineficacias asociadas al uso de este medio, con su consiguiente ahorro en tiempo y dinero. No olvidemos que, mediante un software de gestión documental se puede editar, aprobar, archivar y transmitir un documento por medios puramente digitales. Los usuarios pueden ver los documentos que están en cola para su revisión, o seguir la ruta de un documento que los involucre. Es fácil ver el estado de un documento o expediente, y en qué etapa se encuentra.

Los usuarios también pueden saber cuánto trabajo les resta por hacer y la dirección puede realizar un seguimiento de los pasos dentro del flujo de trabajo. Se pueden definir alertas para que un usuario sepa que debe realizar un trabajo, o para que un responsable sea notificado si se completó algún paso específico del flujo de trabajo (o mejor aún, si ese paso se está demorando, de tal manera que se pueda asistir para una solución).

Un software de gestión documental permite generar mecanismos de control y alertas muy elaborados, por lo que el nivel de detalle en el control del flujo de trabajo puede ser muy simple, o tan complejo como sea necesario.



Los mayores beneficios asociados a la implementación de un flujo de trabajo documental son:
  • Seguimiento y control del proceso desde el momento 0
  • Capacidad de generar reportes sobre el estado de los expedientes o documentos
  • Eliminar los retrasos asociados a la circulación del papel
  • Permiten establecer plazos concretos de las actividades y seguir su cumplimiento
  • Normalización del proceso y reglas de juego claras
  • Un repositorio central donde se almacenan todos los documentos importantes.
  • Un sistema seguro, donde solo las personas autorizadas pueden acceder a sus documentos relacionados.
  • Flexibilidad para acomodarse a distintos tipos de negocios.
  • Acceso fácil a elementos que los empleados necesitan para realizar su tarea de una forma eficiente.

¿Por qué implementar procesos de negocio en un gestor documental ?

A medida que las organizaciones optimizan sus procesos internos para transformar su negocio, crece la necesidad de controlar los flujos de trabajo documental que respaldan las operaciones de la empresa. Las aplicaciones basadas en la nube y los dispositivos móviles han ampliado los medios en que los interesados en acceder a la información de la empresa pretenden hacerlo. Los formatos y los canales electrónicos se diversifican cada vez más y las organizaciones deben saber administrar el contenido que llega a través de todos estos canales.

El papel sigue jugando un rol importante en los flujos de trabajo documental y no parece que vaya a desaparecer en los próximos años. Pero sabemos que la búsqueda de información en documentos impresos demanda mucho tiempo y esfuerzo. La integración de esta información a un sistema en nuestra empresa habitualmente requiere una acción manual.

La confiabilidad y seguridad del documento también se ve afectada. En estudios recientes más de un tercio de los líderes empresariales consultados indicaron que tiene problemas con contratos a los que les faltan datos o tienen firmas equivocadas. Casi la mitad (46%) no están seguros de tener copias de sus contratos. Más de la mitad (51%) menciona tener problemas con documentos que están traspapelados o perdidos.

Este escenario señala la ventaja de implementar procesos de negocio en un gestor documental. Esto no solo trae aparejados ahorros asociados a la impresión en papel. También permite la reducción del tiempo empleado en las transacciones entre los distintos estados del flujo de trabajo o la reducción de penalidades pagadas por retraso o incumplimiento. Colabora en el aumento de la productividad de los empleados, disminuyendo los errores. Los flujos de trabajo son más fáciles de rastrear, lo que facilita tareas de auditoría. Todo esto se suma a la ventaja competitiva de una organización.

Pero más allá de todo esto, es importante volver a señalar que la razón más importante para implementar procesos de negocio en un gestor documental, es porque los documentos son el insumo más importante de los procesos, y constituyen también en la mayoría de los casos, parte del resultado de los éstos.

¿Cómo implementar procesos de negocio en un gestor documental?

  1. Debemos utilizar la evaluación previa para identificar casos de uso donde el impacto negativo sea mayor (en costos, tiempo, eficiencia), para solucionar en una primera instancia. Es decir, los procesos en los que estamos perdiendo dinero y que necesitamos mejorar.
  2. Se debe evaluar el proceso existente para obtener una buena compresión del mismo, identificando los cuellos de botella y las excepciones al flujo regular.
  3. Debemos desarrollar una estrategia para atacar el (los) caso(s) identificado(s). Se puede arrancar con una prueba piloto en algún punto específico del flujo de trabajo, para demostrar y evaluar los beneficios potenciales.
Todo este proceso de transformación debe ir acompañado de una capacitación a las partes interesadas y de los dirigentes. Es importante que este plan se presente en un contexto más amplio que simplemente "convertir papel en medios digitales". Se deben considerar los beneficios en función de las nuevas tecnologías existentes que permiten impulsar modelos comerciales completamente nuevos. Reemplazar tecnología sin cambiar procesos no es una verdadera transformación.


Descarga nuestro ebook: Cómo cumplir el nuevo reglamento europeo de protección de datos

martes, 7 de noviembre de 2017

Apache Chemistry cmislib 0.6.0

Nueva versión de la librería CMIS de Apache Chemistry para Python
CMIS (Content Management Interoperability Services) es un estándar que define un conjunto de modelos para interactuar con repositorios y sistemas de gestión documental y ECM. CMIS funciona en una capa independiente a los sistemas ECM y sus APIs (interfaces de programación). El estándar no establece reglas respecto a cómo se deben implementar las funcionalidades del sistema de gestión de contenidos empresariales ni obliga a que las mismas estén disponibles a través de su interface. Más bien pretende definir un conjunto de capacidades genéricas y un conjunto de servicios disponibles para poder aprovecharlos.

CMIS provee una interface de programación neutral e independiente del lenguaje y plataformas utilizados y es lo suficientemente flexible como para interactuar con distintos tipos de repositorios. Su importancia para el ECM y los ContentServices es equivalente a lo que SQL representó para las bases de datos relacionales.
Entre las características principales de CMIS, podemos mencionar:
  • Basado en el contenido e independiente del repositorio empleado.
  • Acceso a contenido distribuido. La mayoría de las empresas tiene su contenido almacenado en múltiples repositorios distribuidos. CMIS posibilita el desarrollo de aplicaciones que puedan aprovechar el acceso a esta mezcla heterogénea de repositorios.
  • Capacidad para mejorar los servicios de consulta online. Disponemos de mucha información personal en linea (servicios, banca electrónica, etc), y cada una con su propia interface de acceso y sistema de validación. Si toda esa información estuviera disponible como repositorio compatible con CMIS, se podría disponer de un mecanismo de autenticación unificado, de tal manera que se podría acceder a todos los servicios con una sola validación.
Por su parte,Apache Chemistry es un conjunto de librerías de código abierto desarrollada por la Apache Software Foundation, que implementan la especificación del estándar CMIS. Apache Chemistry incluye un framework basado en Java (OpenCMIS), librerías para implementar programas cliente en varios lenguajes (java, python, php, etc) y algunas herramientas adicionales para desarrollar aplicaciones.

Apache Chemistry cmislib es la librería de Python útil para desarrollar programas cliente que utilicen este estándar. Proporciona una API que permite interactuar con repositorios que cumplen con las recomendaciones CMIS, tal es el caso del software de gestión documental de Athento.
La librería tiene ciertas características que le proveen gran flexibilidad:
  • Los desarrolladores que utilizan la librería pueden trabajar con objetos de dominio CMIS sin tener que preocuparse por como está implementado el servidor.
  • La librería utiliza ReSTful AtomPub binding, mecanismo basado en AtomPub para trabajar con uno o más repositorios de contenido. También utiliza Browser binding.
  • La librería cumple de manera bastante precisa con el estandar CMIS.
Recientemente se ha liberado una nueva versión de la librería, concretamente, la 0.6.0. La principal novedad de la librería es el soporte para el binding con el navegador. Esto básicamente significa que podemos utilizar aplicaciones JavaScript desde el navegador de los usuarios para acceder a los datos almacenados en un repositorio CMIS. Esto hace posible por ejemplo que podamos crear documentos en un repositorio CMIS desde un formulario HTML.

Hasta esta versión, cmislib utilizaba Atom Pub binding, que sigue estando disponible, pero que podrá ser reemplazada por el browser binding por aquellos que buscan un rendimiento superior, ya que formularios HTML y JSON aportan mayor performance normalmente que la implementación basada en XML de Atom Pub.

La nueva release también ofrece un gran número de corrección de bugs que los usuarios de la misma encontrarán de utilidad.

Para cerrar esta entrada, nos gustaría destacar que el uso de estándares de código abierto es clave para disponer de una mayor flexibilidad entre las herramientas que utilizamos en nuestra organización. El software de gestión documental de Athento es un ejemplo de ello.


Prueba 30 días gratis Athento

lunes, 30 de octubre de 2017

Cuenta atrás para el GDPR


Pronto entrará en vigor el nuevo reglamento europeo de protección de datos. ¿Estamos listos para afrontarlo?
Es inminente la entrada en vigor de GDPR en Europa. La fecha de entrada en vigencia es el 25 de mayo de 2018 y para ese día las empresas deberán estar listas para cumplir la nueva normativa. Las consecuencias del incumplimiento pueden oscilar entre el 4% de los ingresos de la compañía o 20 millones de euros en concepto de multas.

Sin embargo, muchas organizaciones aún no han implementado los procesos y tecnologías adecuadas y necesarias para amoldarse a esta nueva regulación sobre la privacidad de la información personal. Los casos de ransomware o leakware han aumentado en estos dos últimos años, con graves consecuencias para la economía y el prestigio de sus víctimas. ¿Estamos preparados para disminuir el impacto de este tipo de ataques a nuestras empresas, y para cumplir la GDPR?

GDPR es la normativa sobre protección de datos más estricta del mundo. Ha sido diseñada para que el individuo tenga el mayor control posible sobre sus datos personales: como se procesan, utilizan y almacenan. Esto tiene especial impacto no solo en organizaciones multinacionales con acceso a información personal de los ciudadanos europeos, sino también en las empresas. Un 90% de los documentos corporativos contienen algún tipo de información de carácter personal, ya sea de clientes, empleados o terceros.


Por este motivo, el software de gestión documental utilizado en un empresa es clave para cumplir con la normativa de protección de datos personales y privacidad. El software que usemos para almacenar nuestros documentos debe garantizar la protección de los datos personales de los individuos y ayudarnos en la gestión de los derechos de los individuos y nuestras obligaciones como tenedores de datos.

Las funcionalidades disponibles en el software de gestión documental deben incluir las solicitudes de los usuarios, como el "derecho al olvido", así como la capacidad de calificar la información de acuerdo a los niveles de privacidad y confidencialidad. También debe darnos las herramientas para asegurarnos de que podamos notificar cualquier incidente a la autoridad competente dentro de las primeras 72 horas de producido el hecho.

Es importante considerar el realizar un análisis del estado de situación para determinar si nuestra empresa y nuestro software de gestión documental están preparados para cumplimentar la norma GDPR. Este análisis debería incluir los siguientes pasos:
  • Analizar a fondo la situación actual de gestión de los datos personales. Es importante definir los datos entrantes y salientes de la empresa: qué información está almacenada, como se procesa, quién accede a ella, etc. Esto incluye los intercambios con proveedores, socios y agencias gubernamentales, que también deberían cumplir con la GDPR.
  • Definir qué datos son innecesarios. No acumule datos porque si. Cada dato almacenado debe tener su razón de ser ahora y no debería ser almacenado por un potencial uso futuro. Esto reducirá la responsabilidad y la carga de trabajo sobre los mismos.
  • Identifique aquellas interacciones con el cliente que requieran su permiso, o que debieran ser notificadas. Se debe trabajar en unos términos que cumplan con los requisitos de la norma y a la vez no sean complicados de entender. Esos documentos deben estar fácilmente disponibles para el cliente.
  • Identificar otros actores implicados. El cumplimiento de la norma se extingue si algún eslabón en nuestra cadena de acceso a la información no la está cumpliendo. Las reglas de eliminación de datos personales se aplica a toda la cadena. Como parte del cumplimiento, debemos notificar a terceros que acceden a nuestros datos, para la correspondiente eliminación de su lado.
  • Definir correctamente el "derecho al acceso". Este es un aspecto que incluye varias facetas. Nuestros clientes no solo deben saber que tienen derecho a obtener una copia de sus datos, sino que se debe establecer el mecanismo mediante el cual el cliente podrá hacerlo. Esta es una tarea en conjunto para el área de tecnología y el área de legales. El gestor documental va a ser clave en este aspecto.
  • Desarrollar un proceso de notificación de violación. GDPR requiere que notifiquemos al organismo de protección de datos correspondiente cuando existe la posibilidad de que datos de usuarios hayan sido accedidos de manera no autorizada. La regulación especifica una ventana de 72 horas. Se deberán definir los procesos y mecanismos para realizar esta notificación, y los textos y mensajes que serán enviados. Un flujo de trabajo específico para la gestión de estas incidencias es una herramienta tecnológica que puede servir.
  • Contrate especialistas adicionales si es necesario. O bien asigne la tarea a alguien de la empresa. Pero la transición debe tener un responsable. La norma contempla la figura del "Oficial de protección de datos" (DPO).
Queda poco margen en términos de tiempo para adecuarse a la normativa, pero con las herramientas adecuadas, se puede conseguir una transición rápida. El análisis de situación debe ser encarado por etapas manejables para llegar a buen puerto, de tal manera que la transición sea lo menos traumática posible.


Descarga nuestro ebook: Cómo cumplir el nuevo reglamento europeo de protección de datos

lunes, 23 de octubre de 2017

El presente y futuro de la gestión documental es el cloud

El uso de sistemas ECM basados en la nube soluciona los problemas de escalabilidad de los sistemas ECM locales. El presente y futuro de la gestión documental es el cloud por la reducción de costes, facilidades de crecimiento e interconexión que el cloud provee.
De entre todas las soluciones de gestión documental existentes en la actualidad, aquellas basadas en la nube comienzan a sacar ventaja sobre las demás. Por su bajo costo relativo y su capacidad para realizar procesamiento de alto rendimiento sobre la enorme cantidad de datos producidos por las empresas, la nube se presenta como la solución más efectiva para almacenar todo el contenido que producen las múltiples aplicaciones de una organización.

El presente y futuro de la gestión documental es el cloud. Sustentamos esta afirmación en que existen varios puntos en los que las aplicaciones de Content Services (ECM) o Gestión Documental están ganando la guerra a las viejas soluciones on premise. Veamos algunas:

APIs Abiertas

Todo el contenido generado por las diferentes aplicaciones debe ser capaz de ser integrado para que no sean solo "cúmulos" o "silos" de información separados entre sí. Para que esto sea posible, el criterio más razonable es utilizar software de gestión con interfaces de programación (APIs por sus siglas en inglés) abiertas.

Históricamente, la mayoría de los sistemas ECM utilizados en sitio han proveído APIs cerradas. Esto ha llevado a que las empresas tuvieran que hacer uso de interfaces de usuario súper customizadas o interfaces desarrolladas totalmente a medida.

El cloud está cambiando esto, ofreciendo no sólo APIs abiertas, sino también potentes, bien documentadas y con herramientas como Playgrounds que permiten un uso ágil y facilitan su entendimiento.

Con las aplicaciones en la nube, estamos asistiendo a una época en la que los usuarios no necesariamente tienen que trabajar con la interfaz de usuario del gestor documental, porque para ellos es transparente, ya que pueden continuar trabajando con sus aplicaciones de negocio, sin tener que acceder directamente al sistema de gestión documental. Las APIs hacen que sean las propias aplicaciones, de forma transparente al usuario, las que creen y consulten documentos en el gestor documental.

Las APIs abiertas son la mejor solución para manejar grandes volúmenes de información producida por distintas aplicaciones. Una API bien documentada permite acceder a la información del ECM y transformarla en una base de datos de contenidos útil para su procesamiento.

La escalabilidad de los sistemas ECM

Los sistemas ECM instalados en sitio tienen muchas limitaciones en materia de escalabilidad. Uno de los desafíos radica en la complejidad creciente de todas las capas de software necesarias para que el sistema funcione y se ejecute sin inconvenientes en el centro de datos de la organización. Esta no suele ser una tarea sencilla como para delegarla a un administrador de sistemas sin experiencia suficiente en ese tipo de escenarios.

La situación se complica aún más cuando debemos expandir el cluster. Esta suele ser una tarea compleja, aunque la teoría diga lo contrario. Esto se aplica tanto a la base de datos como a la infraestructura de almacenamiento.

Hablamos pues de un coste alto a nivel de los equipos de trabajo. Costes ligados al tiempo dedicado al mantenimiento, gestión y planificación de la infraestructura. Así mismo, hablamos de un coste de oportunidad, porque el tiempo que emplea el equipo en estas labores, deja de utilizarse en otras que aportan más valor a la organización.

Los sistemas basados en la nube facilitan escalar. En poco tiempo, o incluso de forma casi automática, podemos escalar nuestro sistema a demanda, pagando sólo por el coste de lo que se utilice.
De igual manera, la nube nos permite decrecer sin perder dinero en inversiones tecnológicas. Una posibilidad casi imposible en el mundo on premise.

Alternativas en la nube

Usar un sistema en la nube es posible mediante dos vías: adquiriendo un software que podamos instalar en una infraestructura cloud nosotros mismos, o contratarlo como servicio (SaaS).

En el primer caso, podemos implementar lo que ya estemos usando en Amazon, Azure o cualquier otro servicio. Muchos vendedores de sistemas ECM incluyen paquetes listos para ser utilizados en la nube. Este esquema NO nos evita todos los problemas de escalamiento local, pero sin duda mejora bastante las complicaciones. Sin embargo, con esta opción, debemos ser conscientes de que nuestro equipo técnico tendrá que seguir asumiendo las tareas de planificación, gestión y mantenimiento (en este caso, sólo del software).

La otra opción es SaaS. Esta alternativa soluciona las cuestiones de escalamiento y descarga por completo a nuestro equipo de la planificación, gestión y mantenimiento del software e infraestructura asociados al ECM. En este caso, podremos dedicar a nuestro equipo por ejemplo a labores de integración entre las aplicaciones de negocio y el gestor documental.

En conclusión, creemos que el presente y futuro de la gestión documental es el cloud porque la nube nos ofrece posibilidades a las que no teníamos acceso con los viejos sistemas on premise, liberándonos de costes y de tareas en las que no somos expertos, así mismo, permitiéndonos contar con sistemas ECM interconectados de forma natural con nuestro sistema de información corporativo.


Descarga nuestro ebook: Cómo cumplir el nuevo reglamento europeo de protección de datos

miércoles, 18 de octubre de 2017

Etiquetado Semántico en Box.com con Athento


A continuación vamos a conocer cómo es posible utilizar la app de Athento en Box.com para etiquetar documentos de forma automática. Sigue con nosotros el tutorial de etiquetado semántico en box.com
Box.com es una de las compañías mas grandes dentro del intercambio, almacenamiento y colaboración con archivos en la nube. De acuerdo con el Cuadrante Mágico de Gartner, Box continúa siendo un líder en el mercado de la Colaboración en 2017, avalado por sus más de 74.000 clientes corporativos.

Uno de los retos más frecuentes que encuentran los usuarios que trabajan en aplicaciones de FileSharing, es el control sobre la organización de documentos.

Hoy vamos a mostrarles cómo es posible -y de forma automática- lograr una organización y categorización virtual mediante etiquetas generadas por la app de Athento en Box.

Etiquetado Semántico

Las tecnologías semánticas, en un lenguaje muy simple, lo que buscan es encontrar significado dentro de un determinado conjunto de datos. Si trasladamos la aplicación de las tecnologías semánticas al mundo de los documentos y, concretamente, al etiquetado semántico, el objeto es que estas tecnologías sean capaces de "entender" de qué se trata el texto del documento y devolver una serie de conceptos o entidades que describen ese texto. Es decir, la tecnología nos va a decir de qué trata el documento sin que tengamos que leerlo nosotros.

Hasta aquí la aplicación semántica. Luego, tenemos la potencia de una funcionalidad muy simple pero útil: las etiquetas. Las etiquetas, nos ayudan a acceder a todos los documentos que comparten dichas etiquetas. Si el etiquetado ha sido semántico, diremos que nos permiten acceder a todos los documentos cuyo contenido hace referencia a los mismos conceptos o entidades.

Es decir, creamos un orden virtual, desligado de una estructura física de carpetas, que nos permite acceder a los documentos cuyo significado está relacionado o que comparten entidades (nombres de personas, compañías, ciudades, temáticas, etc.)

Vamos a continuación a explicar paso a paso cómo hacer etiquetado semántico en box.com con Athento.

Tutorial: Etiquetado semántico de Athento en Box

Puedes seguir paso a paso este tutorial para hacer etiquetado semántico en box.com gracias a la aplicación de Athento. Lo único que necesitas es tener una cuenta en Box, gratuita o de pago. Una vez tengas tu cuenta, solo debes continuar con los siguientes pasos para hacer un etiquetado semántico de forma automática con Athento en Box.

1. Instalar aplicación: Para ello, dentro de las aplicaciones de Box, busca “Athento”. Esta opción se encuentra en tu menú de usuario, en la esquina superior derecha de la pantalla. En aplicaciones, puedes poner "Athento" en el buscador. Cuando la encontremos, hay que agregarla desde el panel izquierdo y luego elegir la opción de aceptar.


2. Subir documento: Si ya eres usuario de Box y tienes tus documentos allí, no hace falta que subas ningún documento nuevo. Si te has hecho una cuenta de Box para probar el etiquetado semántico de Athento, debes ir al panel de documentos y subir un documento nuevo. Puedes hacerlo arrastrándolo desde el escritorio a la web o desde la opción “Cargar” en el panel de la esquina. Importante, el etiquetado automático en su versión gratuita sólo está disponible para archivos PDF.


3. Analizar el documento con la app de Athento: Ubicamos el archivo y seleccionamos la opción de 3 puntos suspensivos “más opciones”, que aparece a la derecha del nombre del archivo. En las opciones que aparecen vamos hasta “Integraciones” y luego seleccionamos “Athento Semantic Tagging”. Por último, aceptamos y esperamos el resultado.


4. Esperar los resultados: Espera a que Athento extraiga el texto del documento (OCR) y luego aplique su tecnología semántica. Cuando el resultado esté listo, verás un mensaje verde en la parte superior de la pantalla. Las nuevas etiquetas, podrás verlas debajo del nombre del documento.



Hacer etiquetado semántico en box.com es bastante fácil, como has podido ver en este tutorial. Para clientes con necesidades más complejas, Athento puede activar ontologías específicas (relacionadas con su negocio), así como analizar de forma masiva los documentos.

Caso de Uso: Clasificación Automática de Documentos Legales

lunes, 16 de octubre de 2017

Cómo la captura de documentos puede aportar control documental


En la actualidad, la sobreabundancia de datos a disposición de las empresas pareciera no tener fin. Las estrategias adoptadas a partir del big data permiten sacar distancia sobre la competencia. La información disponible es inmensa, y la mayor parte de ella es aprovechable.

Un ejemplo de cómo el volumen de información crece con el tiempo podemos encontrarlo en el área de salud. En los Estados Unidos de América, se estima que por cada hora de paciente tratado, se utilizan 30 minutos para trabajo administrativo, facturación, emisión de recetas, papeleo en general,etc.

Pero ¿cómo hacemos para mantener un orden en este aparente caos de información y datos?

El primer paso es disponer de toda la información en un formato digital, para que sea útil y analizable. De nada sirve acumular información en papeles que no puedan ser procesables por algoritmos automatizados. Pero no hablamos sólo de tener los documentos y demás activos en digital. Tener información que describa nuestros contenidos digitales es igual de importante. Hablamos por ejemplo de metadatos. Los metadatos pueden obtenerse, o bien exigiendo a las personas que sigan una política de indexación y de descripción de los documentos, o bien mediante captura automática de datos.

Una vez superada esta primera etapa de digitalización y captura de documentos, el siguiente paso es lograr que toda esa información esté disponible para aquellas personas que la necesitan, ya sea para su labor operativa o para tomar decisiones a partir de ella. Esto en realidad también forma parte de la captura de documentos, y podemos llamarlo distribución de la información. Un ejemplo clásico de distribución, una vez digitalizada o capturada la información digital, es el MailRoom digital. La correspondencia y documentación entrante es distribuida a lo largo de la organización por medios electrónicos, de manera que llega más rápido a sus receptores y con toda trazabilidad de ese viaje al interior de la compañía. Pero la información no debe sólo llegar a personas, necesitamos también que sea capaz de llegar a las aplicaciones de negocio que la procesan y que permiten a las personas tomar decisiones estratégicas de negocio u operativas.

La toma de decisiones a partir de información capturada exige que la captura de datos sea cada vez más voluminosa, pero también que sea cada vez más inteligente. No es suficiente con escanear un papel. Debemos intentar obtener información más precisa a partir de lo que se está escaneando. No es suficiente con obtener la información de la cabecera en una factura. También interesa, por ejemplo, capturar el detalle de los ítems de cada factura emitida, para poder realizar un mejor control de los consumos al interior de la organización.

Para lograr este nivel de detalle y este alto nivel de granularidad en la información, no se puede depender de sistemas de captura de información anticuados. En una organización típica, las fuentes y los formatos de este tipo de información son variados: realimentación de nuestros clientes, de los trabajadores de campo, correo, email, fax, página web, etc. La mayoría de las empresas no están preparadas para gestionar adecuadamente esa información desde su fuente original hacia sus sistemas informatizados, y finalmente hacia el personal que debe tomar decisiones con estos datos. ¿Cómo hacemos por ejemplo para que toda la información necesaria llegue a nuestro ERP o a nuestro software de Gestión de Personas? ¿Cómo conseguimos hacer analítica de datos si no tenemos los datos? Nuestras aplicaciones necesitan información, y esa información no puede llegarles si no tenemos en pie mecanismos para obtenerla. Si decidimos que van a ser las personas las encargadas de obtener dicha información, habremos de considerar altos costes. Es aquí en dónde la captura de documentos y captura automatizada de datos cobra un valor extra.

¿Qué sucede cuando nuestros mecanismos de obtención de información son deficientes?. Las consecuencias negativas son diversas:
  • Altos costos laborales.
  • Perdemos agilidad empresarial. No se puede ver claramente la información que está ingresando a nuestra organización.
  • Dependencia exclusiva a reaccionar a las tendencias en los pedidos de los clientes, y en función de las ventas.
  • Mayores quejas en los clientes, ya que no se suelen identificar los problemas en la cadena de producción hasta que es demasiado tarde.
  • Inventarios lentos.
  • Retraso en los pagos, multas, demora en los plazos de entrega.
Si solucionamos la gestión de la captura de información, se pueden evitar estos problemas.
El desafío que enfrentan las organizaciones que reciben documentación a través de múltiples canales de distribución no es solo por el uso del papel como medio principal para manejar documentos. El principal problema sigue siendo el manejo apropiado de esos documentos a través de canales internos de distribución. Si nuestra solución se apoya en un sistema de captura de documentos anticuado, estamos en problemas.

Lo que se requiere, es una tecnología inteligente que obtenga los documentos que llegan por medio de cualquiera de los canales de entrada, y que permita extraer la información que necesitamos. Esta tecnología debe permitir la clasificación de los documentos, de tal manera que podamos evitar el post-procesamiento y ordenamiento manual posterior. Debe permitir también la revisión y validación de la información obtenida contra registros obtenidos por otros medios, para confirmar que es fiable. Y todo esto debe ser almacenado en registros digitales procesables.

Los siguientes pasos deben ser tenidos en cuenta si se quiere optimizar el control sobre los distintos caminos de obtención de información en nuestra organización:
  1. Obtención de datos. Es el comienzo del proceso. Las organizaciones reciben documentos a través de métodos variados. Debemos estar preparados para recibir documentos a través de todos estos canales de entrega.
  2. Extracción. El siguiente paso es extraer la información y esto hace referencia no solo al proceso de reconocimiento óptico de caracteres (OCR). Debemos ser capaces de utilizar múltiples técnicas de extracción para obtener el total de información necesaria para los procesos empresariales.
  3. Clasificación. Una vez que disponemos de la información, deberemos aplicar reglas de negocio que nos indiquen qué tipo de documentos son y el camino que deben seguir dentro de los canales internos de distribución para que llegue a las manos apropiadas o las aplicaciones que los necesitan.
  4. Validación. Una vez que se han extraído los datos, hay que asegurarse de que sean correctos. Debemos contrastar esa información con cualquier registro previo relacionado que ya tengamos disponible en nuestro sistema.
  5. Conexión. Necesitamos conectar esa información con procesos y usuarios que la requieren para manejar el negocio.
En conclusión, la captura de documentos es un paso fundamental para una correcta gestión documental. La variedad de información disponible a través de múltiples canales exige que nuestra organización disponga de los medios adecuados para su procesamiento veloz.

Descarga nuestro whitepaper: División de Lotes de Documentos

martes, 10 de octubre de 2017

Razones para usar MongoDB como base de datos del Gestor Documental


En este artículo exploraremos las ventajas de usar bases de datos NoSQL como MongoDB para almacenar datos y documentos
MongoDB es, actualmente, una de las base de datos NoSQL más populares. A diferencia de las bases de dato relacionales, los datos no son almacenados en tablas, sino que se utilizan archivos planos en formato JSON (JavaScript Object Notation), que es un estándar muy difundido entre un gran número de aplicaciones en la actualidad. Esto permite que la integración entre MongoDB y estas aplicaciones sea mucho más sencilla.

El término NoSQL hace referencia a "Not only SQL". Esto significa que NoSQL no utiliza un modelo relacional, y esto es útil cuando las estructuras de los datos que utilizamos pueden variar. Es posible hacer cambios de los esquemas sin tener que parar la base de datos. Las bases NoSQL pueden adaptarse a proyectos reales más fácilmente que un modelo entidad-relación.
Además tiene una estructura descentralizada, lo que le permite utilizar esquemas distribuídos. Esta característica lo vuelve fácilmente escalable. La escalabilidad es horizontal: se pueden utilizar más máquinas con menor capacidad de cálculo, en vez de tener que recurrir a una única máquina más poderosa. La elección de una base NoSQL es más razonable si no contamos con un gran presupuesto para equipos.

Otra de las ventajas, es que en una base de datos NoSQL, las consultas para grandes cantidades de datos están optimizadas. Para que os hagáis una idea, Facebook, Twitter, Reddit o Foursquare usan bases de datos NoSQL.

En cuanto a las limitaciones de NoSQL, las bases NoSQL no ofrecen un control tan estricto sobre la atomicidad de las transacciones. Esto es una ventaja significativa en las bases de datos relacionales. La atomicidad, es lo que permite realizar una operación completa que involucra varias tablas, sin que haya modificaciones en el medio, antes de que finalice la transacción de manera completa. Es decir, o se realiza toda la transacción o no se realiza. Por ejemplo, la atomicidad se encarga de que en una transferencia bancaria, la transacción no quede hecha a medias, sino que si el dinero se ingresa en una cuenta, debe salir de la otra. Si bien esta cualidad impacta en el rendimiento de la base de datos, la atomicidad es lo que mantiene la integridad en los datos y, eventualmente, permite realizar un rollback ordenado, si hiciere falta. Las bases de datos NoSQL en cambio soportan una consistencia eventual de los datos.

El modelo relacional ya tiene más de 40 años de uso, así que la evolución de los productos y las herramientas de bases de datos relacionales poseen una gran maduración. Las bases NoSQL aún no están del todo estandarizadas, así que cada una de ellas posee características propias en cuanto a las consultas y no necesariamente mantienen compatibilidad con las instrucciones SQL. Sin embargo, el hecho de que hoy en día se tenga que lidiar con cantidades de datos tan grandes, abren un extenso panorama para estos repositorios de datos. NoSQL es una buena opción para aquellas empresas que detectan problemas de desempeño y escalabilidad o costes debido a grandes volumenes de datos.

Uso en Sistemas de Gestión Documental

En un sistema de gestión documental, con grandes volúmenes de documentos y altos números de transacciones de consulta, escritura o actualización, la utilización de un esquema NoSQL es mucho más eficiente.

Las bases relacionales exigen que se defina un esquema, que no es más que una estructura descrita en algún lenguaje formal interpretado por el motor de la base de datos y que describe el esqueleto de las tablas existentes y su interrelación. Esto introduce una limitación, ya que los metadatos de los documentos almacenados estarán restringidos al tipo de datos definido en este esquema. Esta limitación no existe en una base NoSQL.

Además, dentro de cada tabla se deben definir restricciones en cuanto a las filas y columnas, así como el tipo de dato que se puede almacenar en cada columna. Con NoSQL, basado en el tipo de dato, la definición de esta restricción son automatizadas, disminuyendo los tiempos empleados para el desarrollo.
El alto rendimiento y la alta escalabilidad de MongoDB lo hace ideal para un sistema de este tipo. Además de proveer una estructura de documento JSON, soporta un esquema dinámico llamado BSON. En una base relacional, los archivos pueden ser almacenados como tipos de datos BLOB (binary large objects), que tienen un tamaño máximo aproximado de 4.25 Gbytes, lo que indica un límite al tamaño máximo del documento almacenado. MongoDB, si bien soporta un tamaño máximo de 16Mbytes para un documento, puede superarse esa limitación si se utiliza GridFS, que divide el archivo en pedazos para poder almacenarlo, permitiendo que el tamaño total sea virtualmente ilimitado.

También posee una característica denominada "sharding", que es lo que permite balancear carga entre servidores, al asignar distintos datos a cada uno de ellos,y de esa manera se reparte la tarea de consultas e inserción de datos. No es necesario un mapeo o transformación entre los objetos de la aplicación y los objetos en la base de datos. Utiliza memoria interna para almacenar el conjunto de trabajo, lo que posibilita un acceso más rápido a los datos. MongoDB soporta consultas dinámicas utilizando un poderoso lenguaje de consultas basado en documentos.

Estas características generales convierten a MongoDB en el mecanismo de base de datos más adecuado para utilizarse en un sistema de gestión documental.

Descarga nuestro ebook: Cómo cumplir el nuevo reglamento europeo de protección de datos

miércoles, 4 de octubre de 2017

Cómo dar cumplimiento al nuevo Reglamento General de Protección de Datos de la UE

La gestión documental como elemento clave a la hora de cumplir con la nueva regulación de protección de datos en Europa

Muchos equipos de IT no son conscientes aún de la importancia de la gestión documental para cumplir con el nuevo Reglamento General de Protección de Datos de la UE que entrará en vigor el próximo mes de mayo de 2018.

Un 90% de los documentos corporativos contienen algún tipo de información de carácter personal, ya sea de clientes, empleados o terceros. Es por esto, que los gestores documentales se convierten en elementos clave a la hora de cumplir la normativa de protección de datos personales y privacidad. El software que usemos para almacenar nuestros documentos debe garantizar la protección de los datos personales de las personas.

En este informe gratuito que nuestros consultores han diseñado, veremos cómo mediante la tecnología es posible tomar las medidas exigidas por la nueva regulación para proteger datos personales. Así mismo, comentaremos las novedades del reglamento: derecho al olvido, cambios en la obtención del consentimiento, auditoria, controles sobre las transferencias internacionales de datos, etc.
Las secciones de este whitepaper son:
  1. Nuevo Reglamento General de Protección de Datos de la UE
    1. ¿Qué organizaciones estarán sujetas a esta nueva normativa?
    2. Mi negocio no está en la UE ¿tengo que cumplir con GDPR?
    3. ¿Qué ocurrirá si no se da cumplimiento al ReglamentoGeneral de Protección de Datos de la UE?
    4. ¿Qué se entiende por datos de carácter personal?
    5. Novedades de la normativa
  2. El software de Gestión Documental ayuda al cumplimiento de la GDPR
Este informe es gratuito y te servirá para ponerte al día sobre los ajustes que se deberían llevar a cabo para adaptarse a la nueva normativa. Recuerda también que puedes probar Athento, el software inteligente de gestión documental.



Descarga nuestro ebook: Cómo cumplir el nuevo reglamento europeo de protección de datos

AddThis