viernes, 30 de agosto de 2013

Glosario de Gestión Documental - Letra U

GLOSARIO
Letra U.

Ubicuidad
Desde hace ya algunos años, cuando los "móviles tradicionales" empezaron a dejar paso a los "smartphones" y a las tabletas, como el iPhone o el iPad, aumentó exponencialmente el número de aplicaciones para estos dispositivos, y muchas aplicaciones que tradicionalmente habían sido de escritorio, saltaron también al mundo portable, sobre todo desde que llegó el 3G y el usuario tiene conexión permanente a internet.

Es desde ese momento que se comenzó a hablar del término "ubicuidad", para referirse a la posibilidad que brindaban muchas de estas aplicaciones para estar disponibles para el usuario cuando éste quisiera y dónde este quisiera.

Así, en Gestión Documental, productos como Athento Touch pueden proporcionar a sus usuarios acceso a todos sus documentos, estén donde estén, y desde el dispositivo que quieran: ordenador de sobremesa, portátil, tableta, smartphone, o ¡incluso en una mesa digital!

Este concepto también aplica al software de Gestión Documental y al de File Sharing que permiten a las personas acceder a sus documentos sin limitaciones físicas o temporales, siempre que se tenga una conexión a internet y un dispositivo que pueda usarla.

Unidad documental
El concepto de "unidad documental" hace referencia a una unión de documentos, que en conjunto son necesarios para generar una acción administrativa. En algunos ámbitos a esta unidad documental se la denomina expediente.

La unidad documental puede ser simple, si los documentos són de un único tipo documental, o compleja si en la misma unidad hay documentos de diferentes tipologías documentales.

Usabilidad
Este término es importante, no sólo en Gestión Documental, ni en software, sino en el desarrollo de cualquier producto: es la facilidad con la que un usuario puede manejar e interactuar con una determinada herramienta o aplicación.

En el ámbito de la Gestión Documental, la usabilidad puede medirse según un sinfín de factores:

ÍNDICE DE NAVEGACIÓN

Letra A. Glosario de Gestión DocumentalLetra B. Glosario de Gestión Documental
Letra C. Glosario de Gestión DocumentalLetra D. Glosario de Gestión Documental
Letra E. Glosario de Gestión DocumentalLetra F. Glosario de Gestión Documental
Letra G. Glosario de Gestión DocumentalLetra I. Glosario de Gestión Documental
Letra J. Glosario de Gestión Documental Letra L. Glosario de Gestión Documental 
Letra M. Glosario de Gestión DocumentalLetra N. Glosario de Gestión Documental
Letra O. Glosario de Gestión DocumentalLetra P. Glosario de Gestión Documental
Letra R. Glosario de Gestión DocumentalLetra S. Glosario de Gestión Documental
Letra T. Glosario de Gestión Documental


 Contáctanos ahora! Podemos ayudarte y mejorar el Software de Gestión Documental de tu empresa, facilitando la eficiencia y las búsquedas así como los procesos de gestión de documentos y captura.



miércoles, 28 de agosto de 2013

Remisión de documentos administrativos de forma electrónica en las Administraciones Públicas

La Diputación de Málaga es uno de nuestros clientes más queridos y antiguos. Se caracteriza por ser un organismo moderno, siempre buscando la eficiencia administrativa y  mejorar la cobertura y servicio a los municipios malagueños.

En otras ocasiones os hemos contado cómo la Diputación de Málaga ofrece la gestión documental de Athento como servicio (SaaS) a sus municipios, junto con otras herramientas de gestión importantísimas para los ayuntamientos a los que da cobertura. Hoy, queremos hacer eco de una nota de prensa reciente de la Diputación en la que se menciona a enVIA -que es el nombre interno que en la diputación le han dado al módulo de Athento para la gestión de comunicaciones electrónicas-. Este módulo de gestión documental, permite que los documentos que se manejan al interior del organismo público se distribuyan de forma electrónica, manteniendo el control sobre la recepción de los mismos y evitando el uso del papel. 

Athento permite el envío de comunicaciones con y sin documentos adjuntos que son firmados de forma electrónica antes de su envío, además, permite saber cuando una comunicación ha sido leída. En este post podéis encontrar más información sobre esta funcionalidad de Athento para las Administraciones Públicas. Gracias a este módulo de Athento es posible cubrir el ciclo de vida completo de las comunicaciones que se hacen al interior y exterior de este tipo de organismos.


 Contáctanos ahora! Podemos ayudarte y mejorar el Software de Gestión Documental de tu empresa, facilitando la eficiencia y las búsquedas así como los procesos de gestión de documentos y captura.

martes, 27 de agosto de 2013

La localización de los documentos en proyectos de digitalización

Cuando trabajamos en proyectos de digitalización en empresas o instituciones grandes, es posible que nos encontremos con que la documentación a digitalizar no se encuentra en una única ubicación geográfica. La localización de los documentos a digitalizar es crucial para determinar los costes del proyecto y la distribución de los recursos humanos y tecnológicos.

Cuando los documentos se encuentran en distintas localizaciones, las empresas deben decidir si los documentos han de procesarse en una ubicación centralizada o en aquellos lugares en donde se genera. El caso más claro es el de los bancos. Un banco puede decidir si enviar a la oficina matriz todos los documentos que se generan en las distintas sucursales, o si cada sucursal debe procesar sus documentos, cómo han de llevarse hasta el centro de procesamiento -en papel o ya en formato electrónico-, etc. Las opciones que tienen las empresas son varias:

  • Captura distribuida: La captura distribuida implica que los documentos son escaneados y procesados en el punto de origen -en el caso de los bancos, en cada sucursal- . Este sistema permite ahorrar costes relacionados con el transporte de la documentación. Además, es muy frecuente que los proyectos de captura distribuida no impliquen empleados dedicados exclusivamente a la tarea de escanear documentos. Estos procesos no suelen requerir siempre  tecnologías de separación de lotes de documentos, ya que la digitalización de los documentos no suele realizarse de un solo golpe, sino de manera distribuida y conforme se van generando los documentos. Ahora, dependiendo del software de captura de documentos que elijamos, esto puede salir algo costoso. Pensemos que no estamos hablando de un programa de captura de documentos web-based, sino de un programa de escritorio. Esto supone que tengamos que tener un programa de captura en al menos una CPU  cada uno de los puntos desde los que vamos a digitalizar. Muchos de los proveedores de software de captura cobran por CPU, lo que significaría unos costes elevados del proyecto. Los sistemas de captura web-based, que se albergan en un servidor (propio o de un proveedor cloud), permiten que mediante conexión web se pueda acceder al sistema desde distintos puntos y que la carga de trabajo se distribuya en diferentes puntos. Puede que por cuestiones de volumen de trabajo se necesiten varias instancias del software funcionando, pero nunca tantas como en el caso de las aplicaciones de escritorio.
  • Captura centralizada: Las empresas que quieren llevar a cabo proyectos de digitalización centralizados, escogen uno o varios pocos puntos geográficos en los que se procesará el total de la documentación que se ha generado en todos los distintos centros de trabajo (sucursales, oficinas, etc.). Estos centros de digitalización centralizados, albergan el software y las personas dedicadas al proceso de digitalización. La digitalización de documentos se hace de forma masiva dado los volúmenes de documentos, por lo que suele requerirse personas dedicadas a los escáneres, a los mecanismos responsables de la separación de lotes de documentos, de la validación de la información capturada, etc. Además, implica que se tengan que asumir costes de transporte si la documentación se envía en papel al centro de digitalización o que se busque un mecanismo para hacer llegar la documentación en formato electrónico al centro (Escanear a CDs por ejemplo). Los defensores de este tipo de digitalización, defienden que es más económico tener y mantener un sólo centro de procesamiento (menos escáneres, menos instancias de software, etc.).



Tipo Pros Contras
Centralizada Ideal si sabemos que todos los documentos van a llegar a un único punto geográfico.
Alta calidad de documentos ya que la digitalización se hace siguiente procedimientos y buenas prácticas por un único equipo humano.
Posibilidad de pérdida de la información en transporte de documentos.
Tardamos en tener la información disponible varios días (esperar a que llegue al centro de digitalización y que se procese).
Requiere más mano de obra, lo que compromete la seguridad de la información.
Distribuida Rapidez en el acceso a la documentación.
Ahorro en costes de transporte y mano de obra.
Previene posibles pérdidas de documentación derivadas del transporte de la misma.
Requiere mucha más flexibilidad, escalabilidad y control.
El sistema debe garantizar alta disponibilidad.
La calidad de los documentos puede no ser tan alta como el los proyectos centralizados.


De cualquier manera, las empresas deben evaluar sus procesos de trabajo y condiciones particulares antes de definir qué método de digitalización les resulta más benéfico. Incluso, muchas proyectos de digitalización manejan soluciones híbridas que combinan captura centralizada con distribuida.


 Contáctanos ahora! Podemos ayudarte y mejorar el Software de Gestión Documental de tu empresa, facilitando la eficiencia y las búsquedas así como los procesos de gestión de documentos y captura.

lunes, 26 de agosto de 2013

El mercado de la Colaboración sobre Documentos

El pasado Julio, Forrester publicó uno de sus informes, esta vez, estudiando el escenario de las aplicaciones de File-Sync y Sharing. Según este informe, los trabajadores de la información a nivel mundial que usaban aplicaciones de File-Sync y Sharing en 2010, han pasado del 5% en 2010 al 25% en la actualidad. No hay duda que este tema merece la atención de todos los que nos dedicamos al mercado de la gestión de documentos. De hecho, hace un par de semanas empezamos nuestro propio estudio que con vuestra ayuda pronto culminaremos.

Este estudio nos deja otros datos de interés que compartimos hoy con vosotros:

Razones determinantes a la hora de escoger uno de estos servicios:

  • Facilidad de uso
  • Fiabilidad
  • Relación con el proveedor
  • Precio
  • Seguridad
Principales preocupaciones de las empresas en cuanto al uso de estos productos:

  • Modalidad del servicio (en cloud o on-premise)
  • Esperar a que los grandes proveedores ofrezcan la misma funcionalidad e irse de forma provisional con otros más pequeños pero con más funcionalidad o qué hacer.
  • Coste vs Funcionalidad.
Principales players en el mercado:

  • Box  (líder)
  • EMC (líder)
  • IBM  (líder)
  • DropBox
  • Alfresco (Buen desempeño)
  • WatchDox(Buen desempeño)
  • Microsoft(Buen desempeño)
  • AirWatch(Buen desempeño)
  • Accellion(Buen desempeño)
  • Dropbox (Popular entre los consumidores)
  • Google Drive (Popular entre los consumidores)

Nosotros entretanto, seguimos tratando de averiguar cómo podemos mejorar la experiencia y trabajo de los usuarios de estas aplicaciones.  No te olvides de colaborar con tu respuesta.


 Contáctanos ahora! Podemos ayudarte y mejorar el Software de Gestión Documental de tu empresa, facilitando la eficiencia y las búsquedas así como los procesos de gestión de documentos y captura.





jueves, 22 de agosto de 2013

Respuestas a tus preguntas sobre Athento

Durante los últimos meses hemos estado haciendo esfuerzos grandes para que desarrolladores y usuarios de Athento cuenten con toda la ayuda que puedan necesitar cuando trabajen con Athento. Nuestro primer paso fue abrir al público el Athento Documentation Center, lugar en el que desarrolladores, administradores de sistemas y usuarios en general pueden encontrar toda la documentación sobre Athento

Ahora, es el turno de habilitar un espacio en el que las dudas de la comunidad puedan ser resueltas. Athento Answers es un espacio para hacer preguntas sobre el funcionamiento de Athento, preguntar sobre dudas en materia de desarrollo, despliegues, integraciones, y cualquier cosa de utilidad para la comunidad de Athento. Para hacer preguntas tendréis que registraros, aunque podréis consultar las preguntas y respuestas existentes sin necesidad de registro.

Os animamos a que saquéis provecho de todo el material que Athento pone a vuestra disposición :-)


Podéis seguir todas las actualizaciones del Athento Documentation Center y del Athento Answers a través de la cuenta de Athento de Twitter: @athento


 Contáctanos ahora! Podemos ayudarte y mejorar el Software de Gestión Documental de tu empresa, facilitando la eficiencia y las búsquedas así como los procesos de gestión de documentos y captura.

miércoles, 21 de agosto de 2013

Hablando sobre alternativas a SharePoint

Aquí tenemos un tema que, sencillamente, genera controversia. Un tema candente sin duda, porque a pesar de sus +7 millones de usuarios cada año, si buscamos en Google Trends por “SharePoint Alternatives” (aplicación que mide el interés a través del tiempo en la búsquedas en Internet) descubrimos que desde 2011 dicho interés no desciende de 50 puntos.



Parece que todos estamos divididos. Los proveedores del sector ECM nos vemos en la disyuntiva de alinearnos con SharePoint o declararles la guerra, y para los usuarios no parece diferente.

Entonces, ¿hay alternativas o no a SharePoint?

Bueno, para los que llegáis a este blog buscando respuestas a esta pregunta os diré que sí, pero que depende de qué estamos hablando. SharePoint no es sólo una plataforma de Enterprise Content Management, no es sólo un Content Management System, ni tampoco sólo un soporte para redes sociales. El problema es que SharePoint es muchas cosas a la vez; así que si hablamos de alternativas, las respuestas cambiarán dependiendo de cuál es la parte de SharePoint que no nos gusta.
Si buscamos una alternativa desde el punto de vista más global posible, diría que Alfresco es la solución que más se acerca a SharePoint. Los servicios de contenidos web de Alfresco permiten la generación de material para la web aceptable y, además, permiten la integración con CMSs puros como Drupal y también Liferay. Pero si lo que queremos es sólo mejorar esta parte de SharePoint, a lo mejor no hay que dejar de trabajar con SharePoint sino buscar una alternativa en sus integraciones. En este post, por ejemplo, hay interesantes opciones para complementar SharePoint en materia de Content Management Systems. Gracias al “CMIS power” estas integraciones son cada vez más frecuentes. Si hablamos estrictamente de Enterprise Content Management, Alfresco es una opción perfectamente considerable y más económica, aunque -como hemos comentado en el post “Alfresco y Nuxeo, las grandes Alternativas a SharePoint”- también hay otras opciones bastante potentes y mucho más asequibles que el propio Alfresco.
Por último, si hablamos de una herramienta neta de colaboración, aquí es quizás en dónde SharePoint lleva ventaja. No ya sólo por sus características propias, sino por sus movidas estratégicas como la adquisición de Yammer y por su compatibilidad con otras herramientas fantásticas de Microsoft como IM an Expert que dan verdadero sentido al valor de las redes sociales en los ambientes de trabajo. Alfresco te brinda las herramientas de colaboración más centradas en document management (integración con suits de oficina como Microsoft u otras herramientas de colaboración on-line sobre documentos como Google Drive) y en web content management (foros, wikis, FAQs, comentarios, notificaciones, feeds, blogs, etc.). Nuxeo también te brinda posibilidades similares. Aquí habría que pensar en qué sentido queremos una alternativa para la colaboración en SharePoint, a lo mejor lo que se necesita es más una plataforma de Enterprise Social Networking de las que hay un montón disponibles y algunas como Elgg que son Open Source (aunque esta en concreto nos brinda buenas posibilidades, customizarla puede ser a pain in the neck).

Nota: Siempre en este tipo de post me gusta dejar claro que Athento no entra en esta guerra, ni somos pro-SharePoint ni estamos en contra de él. El valor de Athento está en entender los documentos, que no es el negocio de SharePoint. Nos dedicamos a extraer información de valor de los documentos mediante la captura inteligente de documentos, lo que no es otra cosa que un valor añadido para cualquier empresa, use SharePoint o no. De hecho, ya os hemos contado de que Athento es perfectamente compatible con SharePoint.


 Contáctanos ahora! Podemos ayudarte y mejorar el Software de Gestión Documental de tu empresa, facilitando la eficiencia y las búsquedas así como los procesos de gestión de documentos y captura.

martes, 20 de agosto de 2013

Tipos de proyectos de digitalización

Existen dos clases fundamentales de proyectos de digitalización. Estas clases surgen en relación al destino que van a tener los documentos que serán convertidos a formato digital. A continuación explicamos brevemente estas dos clases de proyectos:

  • Digitalización para archivo: Se trata de escanear documentos que serán enviados a repositorios para su conservación a largo plazo. El propósito fundamental de este tipo de proyectos es el almacenamiento en digital, ya sea por propósitos de accesibilidad de la información o preservación de la misma. En este clase de proyectos de digitalización los documentos implicados pueden ser documentos antiguos o documentos con los que se trabaja en el día a día. Estos son los proyectos más básicos de digitalización y suelen tener un ROI menos claro, pero ser abordan debido a la necesidad de satisfacer las dificultades de consulta que implica tener documentos en papel, o al deseo de liberarse de los costos asociados a almacenamiento. Normalmente, estos procesos no implican extracción de datos, ya que el centro mismo del proyecto es únicamente la conversión a formato digital y almacenamiento; no obstante, pueden incluir al menos la aplicación de OCR para facilitar la búsqueda de información en el futuro. Ejemplo: una biblioteca que quiere digitalizar sus colecciones, o un hospital que quiere digitalizar historias clínicas antiguas pero que seguirá trabajando en papel.

  • Digitalización de procesos de negocio: Estos proyectos tienen un ROI bastante más claro para las empresas, ya que implican la automatización de tareas que normalmente llevan a cabo personas. A parte de la conversión de los documentos a formato digital, estos proyectos buscan obtener información de los mismos para nutrir procesos de la empresa. Suelen llevar aparejados flujos de trabajo. Un ejemplo claro de estos proyectos podría ser la gestión de viáticos. Una factura de compra de un billete de tren es escaneada, el sistema la reconoce y extrae datos como por ejemplo el nombre del trabajador que usó el billete y el importe. Una vez extraídos, estos datos son enviados al programa que la empresa utilice para aprobar el reembolso del importe del billete de tren. Estos proyectos requieren de software avanzado de captura de documentos  y de integraciones con varias de las aplicaciones software de negocio que utilizan las empresas.



 Contáctanos ahora! Podemos ayudarte y mejorar el Software de Gestión Documental de tu empresa, facilitando la eficiencia y las búsquedas así como los procesos de gestión de documentos y captura.



lunes, 19 de agosto de 2013

Análisis de JBoss 6.1.0EAP (7.2AS)

JBoss se encuentra en la versión 6.1.0 EAP (Alpha+) tras la liberación
de 7.1.1 AS. 
Es importante señalar que JBoss ha realizado algunos ajustes a su política de versionado desde la release de la versión 7.1.1 AS (community) a la siguiente 6.1.0 EAP (Enterprise). Estos cambios, aunque confusos para los desarrolladores, están justificados en que la versión Community se quedaba muy por detrás de las necesidades de las aplicaciones que se están desarrollando en la actualidad y  JBoss tiene interés en mejorar su servicio. Según RedHat, la versión 6.1.0 EAP cuenta con mucha más calidad a pesar de encontrarse en estado Alfa. También hay que anotar que esta versión tiene una licencia LGPL y que debería coincidir con la versión 7.2.0AS, ya ignorada en adelante.

A continuación, destacamos los pros y los contras de esta versión.
Nota: Esta evaluación de aspectos positivos y negativos se basa en la versión 7+ (coincidente con 6.1.0 EAP con errores resueltos).

Pros de JBoss  6.1.0 EAP
  • Certificado en Java EE 6 (5.1 usa Java EE 5 y 6.0 usa Java EE6 no certificado).
  • Arranque hasta 10 veces más rápido que versiones anteriores.
  • Mejor sistema de administración. Consola de comandos nueva.
  • Usa menos recursos. Gestiona mejor la memoria en despliegue de aplicaciones.
  • Configuración más sencilla tanto en la configuración de aplicación con la central del middleware.
  • Destacable: (OSGI) Diseño más modularizado. Aislamiento a nivel de aplicación para el uso de librerías globales. (Load classes on demand). Despliegues mucho más sencillos.
  • Destacable: Despliegue de JBoss Seam 3 + CDI + Weld (Actualmente Seam 2).
  • Genial: Incluye JSF2 (Actualmente JSF1).
Contras de JBoss  6.1.0 EAP  
  • Problemas de rendimiento de EJB compartido entre servidores.
  • Problemas de rendimiento y saturación en el uso de EJB en el lado del cliente y el servidor.
  • Uso de servicios globales innecesarios en despliegue lo cual reduce el rendimiento, memoria y espacio en disco.

Conclusiones
  • La migración a la versión 6.1.0EAP (7.2AS) tendría muchos más beneficios que problemas generalmente para el despliegue, y el propio uso de librerías y API mucho más avanzadas, contando con JSF + SEAM mejorados fundamentalmente.
  • La modularización permite a los despliegues ser más sencillos de configurar que hasta el momento con lo cual ganaríamos en rendimiento.
  • El uso a nivel de administración es mucho más sencillo de controlar para los administradores de sistemas.
  • Con respecto al uso de EJB de alta capacidad debemos prestar atención a su rendimiento, teniendo en cuenta que la versión 6.1.0EAP ha corregido muchísimos Bugs. 

Este análisis ha sido realizado por  nuestro increíble Head of R&D. Victor Sánchez @victors. @athento.

Cualquier pregunta que tengáis, podéis hacerla a través del blog o a través de twitter

Si habéis encontrado este post de utilidad, no olvidéis compartirlo con la comunidad (Clic para twitear).





 Contáctanos ahora! Podemos ayudarte y mejorar el Software de Gestión Documental de tu empresa, facilitando la eficiencia y las búsquedas así como los procesos de gestión de documentos y captura.

viernes, 16 de agosto de 2013

Métodos de separación de lotes de documentos escaneados

Aquellos lectores que han trabajado en proyectos de digitalización saben que es imposible escanear documento por documento en entornos con grandes volúmenes de documentación para digitalizar. Los escáneres son cada vez más potentes y rápidos, algunos tienen opciones de auto-alimentación y los de altos volúmenes de producción más modernos, pueden procesar más de 100 páginas por minuto.

Una cosa es cómo escaneamos los documentos, y otra cosa es ,por supuesto, cómo queremos almacenarlos. Lo más probable es que si escaneo 10.000 facturas en un lote, no quiera guardarlas como un único fichero. Este problema es mucho más patente para las empresas o instituciones que trabajan con expedientes. Normalmente, se escanean lotes de expedientes y cada expediente contiene un set de distintos documentos. En estos casos, una vez digitalizados los documentos interesa que se pueda seguir accediendo a todos los documentos que forman parte del mismo expediente. 

Los escáneres son más rápidos hoy en día, pero no más inteligentes. No pueden distinguir dónde empieza un documento y termina el otro, o cuando ha pasado de digitalizar  el expediente 2013-A899 al 2013-A900. Aquí es dónde aparece el software de captura de documentos.

¿Cómo se consigue pues separar los documentos que se escanean en conjunto?

Básicamente existen 3 métodos:

  • Separación por códigos de barra: Consiste en pegar códigos de barras en los documentos antes de ser digitalizados. Los códigos de barras marcan los límites entre los documentos o expedientes que deben ser separados.
  • Separación por páginas en blanco: Entre expediente o expediente, o documento y documento, se incluyen páginas en blanco como separador durante el proceso de digitalización.
  • Separación inteligente de lotes de documentos: Los métodos anteriores son costosos. Alguien tiene que dedicarse a imprimir y pegar códigos de barras o a meter hojas blancas en los lotes de documentos en la fase pre-digitalización. Esto es lo que la separación inteligente trata de eliminar. Gracias al análisis de la estructura de los documento y de su texto, los sistemas inteligentes de captura son capaces de identificar dónde un documento empieza y dónde termina. Estos sistemas requieren entrenamiento; esto quiere decir, que cada vez que se hace una identificación y separación de documentos, el sistema va aprendiendo y refinándose.
Sobra decir que Athento es capaz de realizar separación inteligente de lotes! En este caso de éxito que os podéis descargar de forma gratuita, aprenderéis más sobre cómo funciona la separación de lotes de documentos.

Espero que os sea de utilidad :-)


 Contáctanos ahora! Podemos ayudarte y mejorar el Software de Gestión Documental de tu empresa, facilitando la eficiencia y las búsquedas así como los procesos de gestión de documentos y captura.





miércoles, 14 de agosto de 2013

Extracción de metadatos mediante códigos de barras o QR

Algunas empresas han decidido trabajar la extracción de datos de sus documentos mediante la utilización de códigos de barras o códigos QR. Al igual que en la clasificación de documentos, el uso de códigos es una de las tecnologías más simples  en el software de captura de documentos disponible. Con su uso, las aplicaciones de captura no tienen que buscar datos dentro del contenido de los documentos, ya que les basta "leer" la información incluida en el código.

  • Ventajas:  Extracción de datos más rápida. Además, muchas aplicaciones empresariales como ERPs permiten la generación de códigos de barras cada vez que se crean documentos nuevos, lo que puede facilitar la adopción de este tipo de mecanismo de extracción de datos.
  • Desventajas: Puede no ser costoso cuando los documentos a tratar son generados por fuera de nuestra empresa, ya que implican un proceso manual de generación de códigos de barras y pegado de este en los documentos antes de llevar a cabo el proceso de digitalización.
La recomendación, como siempre, es analizar la documentación de la que se pretende extraer los datos y la carga de trabajo que significará el uso de códigos de barras o QRs.

De cualquier manera, para las empresas que ya trabajan con códigos, Athento les permite su procesamiento.

Trabajando con códigos de barra y QR en Athento

Para que Athento extraiga la información de un código, es necesario definir un metadato asociado, o lo que es lo mismo, indicar qué dato es el que queremos extraer. Esto se lleva a cabo durante la creación de modelos. (Menú Modelos, subapartado Metadatos).



Los metadatos, en Athento 2.0, pueden ser de tipo texto (Athento tiene que buscarlos en el contenido del documento) o de tipo código (han sido insertados en un código de barras o QR). Los pasos para la definición de un metadato tipo código son sencillos:

  1. Definir un metadato tipo código: En "Modelos>Metadatos" indicas como tipo del metadato "código" y defines un nombre para el metadato. No hace falta indicar ningún otro dato para los metadatos de tipo código.



  2. Definir la ubicación del código de barras: Durante la definición de la plantilla definimos la localización del código de barras en los documentos ("Modelos>Definir plantilla"). La definición de la ubicación del código permite al sistema omitir códigos que no quieran ser leídos y aumentar la precisión de la lectura.


Athento ya está listo para procesar códigos de barras o QR en tus documentos! :-)

Puedes ver aquí los formatos de códigos de barras y QR soportados por Athento.

Prueba 30 días gratis Athento


martes, 13 de agosto de 2013

¿Por qué extraer datos de documentos?

Una de las claves de un proceso inteligente de la captura de documentos es la extracción de datos. La extracción de datos, significa que mediante software avanzado de captura, parte o toda la información contenida en los documentos es leída y guardada para ser utilizada en otros propósitos. Pero, porqué las empresas se toman el trabajo de extraer información de los documentos, ¿qué pueden hacer con ella?

A continuación, vamos a hablar de algunos usos que, según la AIIM, las empresas dan a la captura de datos.

  • Indexación: Se trata de hacer más accesible los documentos o lo que es lo mismo, facilitar la recuperación y búsqueda de la información. Indexar el contenido de un documento, significa que podamos buscarlo en adelante por palabras incluidas en su cuerpo. Indexar sus metadatos significa que podamos buscar los documentos por los distintos valores que estos metadatos puedan tomar. Esta es la razón por la que la mayoría de las empresas captura datos de sus documentos.

  • Para utilizar la información en procesos de negocio:  Uno de los ejemplo más claros por los que las empresas extraen información de los documentos, es para que ésta sea utilizada como entrada en procedimientos de cuentas por pagar, contabilización de cheques, etc. Los ejemplo son infinitos, pensemos por ejemplo, en que muchos comerciales tienen información de sus clientes en tarjetas de visita, pero que las empresas requieren que esa información esté disponible para todo el equipo en un CRM y no en un tarjetero, en este caso, la información de los clientes podría ser extraída de las tarjetas y enviadas a una aplicación como Sugar CRM.
En la siguiente imagen, podéis ver usos más concretos que las empresas dan a la información que consiguen extraer de sus documentos.



Tomado del white paper de la AIIM "Forms Processing- user experiences of text and handwriting recognition (OCR/ICR)-".


 Contáctanos ahora! Podemos ayudarte y mejorar el Software de Gestión Documental de tu empresa, facilitando la eficiencia y las búsquedas así como los procesos de gestión de documentos y captura.



lunes, 12 de agosto de 2013

¿Cómo usan las empresas las aplicaciones de File-Sharing o Storage?

Desde hace unos años, la aparición de aplicaciones de File-Sharing o Storage han aparecido para solucionar aspectos del trabajo con documentos como:

  • La accesibilidad.
  • La necesidad de compartir ficheros y trabajar en equipo con otras personas.
  • La necesidad de sincronización ante el aumento de dispositivos por persona.

A mi juicio, estas son las 3 principales razones por las que aplicaciones como Dropbox, Box.net, SugarSync o Google Drive se han hecho tan populares entre los usuarios en general y en las empresas.

Pero hay muchas cosas que aún no sabemos sobre el uso de este tipo de aplicaciones, ¿cuáles son los principales problemas que tienen los usuarios a la hora de trabajar con ellas? ¿Están realmente extendidas en el mundo empresarial? ¿Cómo podrían ser estas aplicaciones de mayor utilidad? ¿En la mente de los usuarios, estas aplicaciones reemplazan el software de gestión documental o Enterprise Content Management?

Estas son algunas de las preguntas que pretendemos responder mediante una pequeña encuesta de menos de dos minutos. Como siempre, cuando tengamos los resultados, los compartiremos en forma de infografía como lo hemos hecho en anteriores ocasiones (Ver infografía sobre búsquedas en gestores documentales y plataformas ECM). Esperamos vuestra colaboración :-)
 

viernes, 9 de agosto de 2013

Glosario de Gestión Documental - Letra T

GLOSARIO
Letra T.

Taxonomía
El término taxonomía se refiere de una manera muy general, a la ciencia de la organización basándose en la semántica de los elementos a organizar. Son esquemas de clasificación que hacen más fácil identificar categorías o grupos dentro de un conjunto de objetos.

En Gestión Documental, la taxonomía se emplea en la organización de los documentos, de manera que sea más fácil navegar entre grandes cantidades de documentos gracias a que estos se encuentran clasificados en grupos o cetegorías. 

Template Creator
Template Creator es una herramienta gráfica de Athento para la definición de campos de extracción de datos en documentos. El uso de esta herramienta permite al usuario definir las coordenadas en las que se debe encontrar siempre un metadato en un tipo de documento concreto.

Por ejemplo, si todas las facturas que genera una empresa tienen siempre el campo "CIF" del comprador en el mismo lugar, podemos definir un campo con Template Creator sobre el número de "CIF", asociándolo al metadato "CIF del comprador". Así, cada vez que dicha empresa digitalice una factura, automáticamente se extraerá ese metadato.

De esta manera, la extracción de metadatos de documentos es mucho más fácil.

Tesseract OCR
Tesseract OCR, o símplemente Tesseract, es un motor de  OCR (Optical Character Recognition)  desarrollado bajo la filosofía de software libre. Actualmente es uno de los mejor considerados por su precisión y se encuentra en la versión 3.02.

Originalmente fue desarrollado por Hewlett Packard, que tras diez años sin soporte ni desarrollo decidió liberarlo como código libre, en el año 2006. Desde entonces, Google ha patrocinado su desarrollo, que lo han llevado a cabo desarrolladores de código libre.

Tesseract puede leer una gran variedad de formatos de imagen (todos los más extendidos y la mayoría de los menos conocidos) y convertirlos a texto en más de 60 idiomas.

Pero este motor de OCR no es útil sólo por sus funcionalides, sino también por ser multiplataforma: está disponible para Linux, Windows y Mac OSX, y además puede ser compilado para otras plataformas como Android o iOS (iPhone).

Los motores OCR son un elemento de importancia capital en los proyectos de digitalización y captura de documentos.


Tipo documental
El concepto de "tipo documental" o "tipología documental" es bastante amplio.

Por un lado podemos hablar de los tipos documentales que se emplean para la clasificación de documentos en la empresa o en la industria, que van desde modelo XXX, formulario de reclamaciones o solicitud de baja del servicio, a documentos como facturas o albaranes, cada uno con unas características específicas, y con unos datos concretos que lo diferencian de los demás.

Pero de manera mucho más general se puede hablar de tipo documental para referirnos a la estructura del documento: si está estructurado, semiestructurado o no estructurado.

En la primera clasificación encontraríamos documentos que siempre tienen el mismo formato y contienen los mismos datos, por lo que es fácil crear plantillas de extracción y definir los metadatos a extraer de los mismos.

Los documentos semiestructurados son aquellos en los que, a pesar de que sabemos que siempre tienen que contener algunos datos concretos, como en el caso de una factura, que siempre contendrá un CIF, un IVA, un importe y datos del cliente, no siempre ocupan el mismo lugar estos datos. Cada empresa los organiza de una manera diferente, e incluso algunas empresas no siempre emiten las facturas con el mismo formato.

El último caso es el de los documentos desestructurados. Son el peor tipo desde todos los aspectos: no se sabe exáctamente qué datos vamos a encontrar en ellos, ni exáctamente en qué posición, por lo que no son los más recomendables para estar bien organizados.

Si te interesa este tema, puedes seguir leyendo sobre él en este post de Verónica Meza sobre Tipos Documentales Y Extracción de Datos.

Athento Touch
Athento Touch es una interfaz táctil que permite trabajar desde dispositivos móviles con documentos almacendos en software ECM como Alfresco, Nuxeo u OpenText.

Esta herramienta se puede utilizar en dispositivos táctiles como teléfonos móviles, tablets, ipads, o mesas táctiles.

La gran ventaja de este software es su manejabilidad, puesto que permite al usuario trabajar de una manera muy intuitiva con sus documentos, ampliándolos o reduciéndolos, organizándolos o incluso apilándolos. También se pueden previsualizar, o abrirlos en modo de lectura.

Pero como una imagen dice más que mil palabras, a continuación podéis ver un vídeo en el que se muestra Athento Touch en funcionamiento. En él se pueden ver algunas funcionalidades más de las comentadas anteriormente.


Athento Touch (with Alfresco) from Athento on Vimeo.

ÍNDICE DE NAVEGACIÓN

Letra A. Glosario de Gestión DocumentalLetra B. Glosario de Gestión Documental
Letra C. Glosario de Gestión DocumentalLetra D. Glosario de Gestión Documental
Letra E. Glosario de Gestión DocumentalLetra F. Glosario de Gestión Documental
Letra G. Glosario de Gestión DocumentalLetra I. Glosario de Gestión Documental
Letra J. Glosario de Gestión Documental Letra L. Glosario de Gestión Documental 
Letra M. Glosario de Gestión DocumentalLetra N. Glosario de Gestión Documental
Letra O. Glosario de Gestión DocumentalLetra P. Glosario de Gestión Documental
Letra R. Glosario de Gestión DocumentalLetra S. Glosario de Gestión Documental



 Contáctanos ahora! Podemos ayudarte y mejorar el Software de Gestión Documental de tu empresa, facilitando la eficiencia y las búsquedas así como los procesos de gestión de documentos y captura.





jueves, 8 de agosto de 2013

Ciclo de Vida de Captura en Athento

Cuando hablamos de ciclo de vida de documentos o de contenidos en general, estamos hablando de que éstos están sujetos siempre a un proceso (o evolución) con estados reconocibles, predecibles y que se repiten.  Este término es familiar dentro de las aplicaciones de Gestión Documental o plataformas Enterprise Content Management en general. Pero las aplicaciones de captura también trabajan con ciclos de vida para los documentos que procesan. 

En el caso de Athento, cada vez que subimos un documento a la aplicación para que sea autoclasificado y sus datos extraídos, estos avanzan por un ciclo de vida de dos etapas:

  • En revisión: Este es el estado que adquieren los documentos cuando se suben al sistema y el que tienen durante su procesamiento. Básicamente, este estado hace referencia a que aún la información obtenida por Athento (tipo de documento deducido y metadatos extraídos) no ha sido certificada como correcta por una persona.
  • Validado: Este es el estado que adquiere un documento cuando una persona revisa la información obtenida por Athento y la da como válida. Es el estado final que obtienen los documentos en Athento.

El estado  de un documento se puede ver desde el listado de documentos.

Para más información sobre el ciclo de vida de captura de los documentos en Athento puedes visitar nuestro Athento Documentation Center.

En el vídeo que sigue, podéis ver cómo se lleva a cabo el paso entre estados cuando trabajamos con documentos en nuestro software de captura.


Procesando documentos en Athento from Athento on Vimeo.

 Contáctanos ahora! Podemos ayudarte y mejorar el Software de Gestión Documental de tu empresa, facilitando la eficiencia y las búsquedas así como los procesos de gestión de documentos y captura.


martes, 6 de agosto de 2013

¿Cómo Athento clasifica documentos y extrae sus datos?

Algunos de vosotros ya conocéis la funcionalidad de captura de documentos de Athento. También os hemos contado que muy pronto estará disponible la versión 2.0 de nuestro Capture. Pero para aquellos que sois nuevos con la plataforma, queremos explicaros cómo funciona Athento.

Básicamente, Athento funciona mediante la definición de modelos. Un modelo es un tipo de documento e indica a Athento varias cosas:

  • La apariencia física de un documento y de su contenido.
  • Los metadatos que deben extraerse de un tipo de documentos.
Definir un modelo en Athento hace posible que:
  • Athento pueda identificar que un documento que se sube al sistema es de un determinado tipo, por ejemplo una "factura de Amazon".
  • Athento pueda extraer los metadatos que fueron indicados como datos a extraer para ese determinado tipo de documentos. Por ejemplo, el importe.
Entonces, antes de comenzar a clasificar documentos y extraer datos de ellos es necesario que creemos modelos.Crear un modelo es definir para cierta clase o tipología de documentos las siguientes características:



  • Datos Básicos: Un nombre y, lo más importante, un documento de ejemplo que Athento puede utilizar para saber cuál es la apariencia física de ese tipo de documentos (layout, colores, umbrales, etc.). 
  • Palabras clave (Expresiones regulares): Son expresiones, palabras, números o conjuntos de términos que  aparecen juntos normalmente en un documento de esta tipología.
  • Procesamiento de texto: Indica expresiones que nos ayudarán a encontrar metadatos dentro del texto de los documentos para que sean extraídos. 
  • Plantilla de extracción: Es una plantilla que define la ubicación física (coordenadas) de los metadatos dentro de un documento  para que el OCR pueda extraerlos.
Crear modelos es muy fácil en Athento. Para saber cómo se crea un modelo os invito a consultar el Athento Documentation Center, concretamente, la entrada "Cómo crear un nuevo modelo en Athento".

 Contáctanos ahora! Podemos ayudarte y mejorar el Software de Gestión Documental de tu empresa, facilitando la eficiencia y las búsquedas así como los procesos de gestión de documentos y captura.


lunes, 5 de agosto de 2013

¿Por qué Código Abierto en Gestión Documental?

La primera respuesta que se podría dar a esta cuestión es porque facilita las cosas. En su estado actual, el sector de la gestión documental, aun contando con soluciones privativas como SharePoint o Documentum, está cada vez más integrado por soluciones open source que mediante un componente de interoperabilidad logran compartir recursos con otras aplicaciones ya existentes (libres o propietarias) facilitando la realización de transacciones en colaboración a las empresas y permitiendo ahorrar costes de desarrollo a los programadores.

Algunos defensores del software propietario valoran su estabilidad y la seguridad que supone el que siempre haya detrás una empresa concreta para responder las consultas que surjan con su uso. Pero nada más lejos de la realidad, porque en el ámbito de la gestión documental tiene más valor que las soluciones sean escalables y personalizables según las necesidades de cada empresa y, por otro lado, los programas propietarios raramente incluyen condiciones de servicio y cuando lo hacen son en la mayoría de las casos puramente testimoniales. El modelo de negocio que emplea el software propietario está basado en la certeza de que un gran número de usuarios tienen idénticas necesidades, aunque este no es el caso de las empresas que implantan soluciones de gestión documental, cada una con su propia realidad e intereses. Lo que si puede ser útil y práctico es la creación de soluciones de gestión documental pensadas para sectores concretos. No obstante, esta práctica, desde la óptica del movimiento open source, distará mucho del sentido generalista de un modelo de producción cuya principal línea de rentabilidad consiste en la venta de licencias de uso, lo cual favorece al productor y no piensa en la satisfacción de cada cliente. Los consumidores de software privativo, como Microsoft Office o Adobe Acrobat, no suelen tener necesidad de adaptaciones concretas del programa, algo que si suele ocurrirles a las empresas interesadas en utilizar gestión documental.

Para poder satisfacer las necesidades de cada una de las empresas, lo más adecuado es apostar por el software de código abierto, el cual tiene grandes ventajas. Siguiendo a algunos evangelistas de las soluciones de código abierto, las empresas optan por software open source porque el acceso libre al código fuente les permite escalar sus aplicaciones ellos mismos y así mantener el control sobre el crecimiento sin depender exclusivamente de la empresa creadora original. Además, la posibilidad de incorporar herramientas abiertas en el programa garantiza que siempre se mantenga actualizada en términos de funcionalidad. De otra manera sería muchísimo más difícil ya que habría que desarrollar desde cero cada uno de los componentes del producto.

El uso del código abierto añade un componente de innovación (gracias a la contribución de la comunidad) en el área de gestión de la información de la empresa, además de una mayor flexibilidad (al contar con la posibilidad del uso de funcionalidades de otras aplicaciones) y un ahorro considerable en los costes de soporte, derivados de los reducidos costes de producción previos.

Contrariamente a los que algunos escépticos puedan pensar, la mayor accesibilidad de las soluciones no deriva en una falta de calidad. Este tipo de software está siendo empleado en el sector bancario, en proyectos espaciales y en grandes empresas para procesos de gestión que requieren un alto rendimiento.

A nivel técnico, la adaptación que la gran mayoría de las soluciones han realizado ofreciendo su utilización soportada en la nube, hace que el uso de tecnología open source sea la opción más interesante, sobre todo por cuestiones de compatibilidad tecnológica. Al margen de una gran parte de los servidores que se usan en el mundo estén administrados con versiones de Linux y de que muchas tecnologías de la web sean libres (como PHP o CSS), debe existir cierto clima de libertad que favorezca la creación de soluciones adaptables a cada caso concreto, con posibilidades de compartir funcionalidades mediante interoperabilidad (gracias al estándar CMIS) y con una API accesible que permita nuevas integraciones y desarrollos futuros.

Quisiera terminar con algo que me parece importante. El contexto de la sociedad de la información con la nube y los proyectos de cloud computing como protagonistas, es un entorno de cooperación y de conocimiento compartido en el que la colaboración entre profesionales y entre máquinas, aplicaciones y objetos digitales es vital para garantizar la supervivencia de los negocios. En mi opinión, el software privativo, con su modelo restrictivo de producción y de obtención de rentabilidad queda fuera de este ambiente en el que destacan las aplicaciones escalables, la venta de software como servicio, las contribuciones de la comunidad gracias al acceso a las APIs y los modelos más comprensivos con las posibilidades de inversión de las empresas como el pago por uso.

La clave está en parte en la normativa reguladora, responsable de la apertura o cerrazón de uno u otro modelo. Si optamos por el software de código abierto encontraremos entre sus licencias alguna que finalmente nos haga dar con la forma de integrar la solución con otras aplicaciones y aunque algunas de ellas sean de software propietario (como por ejemplo el uso de Microsoft Office para la edición de documentos o la posibilidad de comunicarse con SharePoint) no se tratará de un instrumento legal austero destinado a velar por la exclusividad. Por el contrario, en el caso del software propietario, normalmente protegido por leyes de propiedad intelectual, la apertura ni es posible ni se considera legal y las aportaciones de la comunidad son inexistentes por lo que el componente de innovación queda reducido al que la propia empresa productora pueda aportar por sí misma.

Esta forma de pensar resulta contraria al espíritu libre y abierto de la web y no permite un aprovechamiento eficiente de las tecnologías existentes ni del potencial creativo de otras personas. La gestión documental se despliega en las empresas como un complejo sistema de información que incluye varios procesos interrelacionados entre sí como la captura documental, la recuperación de información y el uso de funcionalidades de aplicaciones producidas por terceros, además del soporte instalado en nube que es ventajoso para empresas con escasa infraestructura tecnológica. El funcionamiento de todos estos componentes que se unen en un mismo sistema depende de muchos actores en origen (el fabricante del escáner, el programador del repositorio principal, el creador de la aplicación de gestión de facturas, etc). Mediante el estándar de interoperabilidad CMIS se puede conseguir que el sistema integre todo lo necesario y el uso de licencias de código abierto nos facilita tener la actitud necesaria para admitir la integración de tecnologías de ahora y las que puedan venir en el futuro. Mientras que esto no sería admisible ni tan siquiera legalmente posible si produjéramos software privativo de gestión documental, además de que la gran inversión en infraestructura y horas de programación que supondría tampoco estaría garantizando a priori una mayor obtención de rentabilidad.


Acerca del Autor
 
Este artículo tiene como autor a Adrián Macías, Director-Gerente de Dokumentalistas.com, un espacio con recursos para los profesionales de la información y la documentación.







 Contáctanos ahora! Podemos ayudarte y mejorar el Software de Gestión Documental de tu empresa, facilitando la eficiencia y las búsquedas así como los procesos de gestión de documentos y captura.

AddThis