lunes, 30 de septiembre de 2013

¿Tengo que cambiar mi gestor documental cuando sólo quiero Athento para digitalización? [FAQs]

¡Hola a tod@s!
A raíz de la gran cantidad de preguntas que recibimos en el webinar y que por cuestión de tiempo se quedaron sin resolver, hemos decidido abrir una nueva sección del blog dedicada a resolver preguntas. En adelante, los posts que veáis que llevan la coletilla "[FAQs]" en el título, corresponden a este tipo de entradas.

Hoy vamos a empezar por una pregunta muy interesante que nos hizo desde Perú Marisol Eduardo de Stracon GyM.

¿Tengo que cambiar mi gestor documental cuando sólo quiero Athento para digitalización?
La respuesta es no. Athento es gestión documental inteligente, por lo que nuestro objetivo es ofrecer una solución que cubra de forma completa las necesidades de ECM y gestión documental de las empresas, pero comprendemos que en las empresas, el sistema completo de gestión de documentos no se implementa todo de una sóla vez, sino que se va creciendo según la necesidad de la empresa. Por ejemplo, no todas las empresas necesitan desde el comienzo Records Management, sino que la necesidad surge en algún momento de su existencia.

¿Qué es lo que ofrece Athento entonces?

  • Módulos completamente integrados que cubren distintas fases de la vida de nuestros documentos.
En el webinar vimos primero la parte de Athento que brinda captura inteligente y que puede evolucionar un proyecto de digitalización.  Pero luego vimos el gestor documental, en el que se almacenan ya clasificados y con sus metadatos los documentos de los que hemos extraído información. Nuestra funcionalidad de gestión de documentos es el módulo ECM, que es opcional y que sólo significa un pequeño sobrecargo en el precio de Athento. Podéis ver las características del módulo de ECM desde nuestra web.

¿Pero y si yo yo ya tengo un gestor documental?
  • Athento puede ayudarte con tu proyecto de digitalización sin que tengas que cambiar tu gestor documental.
La mayoría de los gestores documentales potentes del mercado (Alfresco, Nuxeo, SharePoint. OpenText, Documentum, etc.) han implementado el estándar CMIS, lo que permite que puedan compartir información entre los diferentes sistemas de Content Management. Athento también tiene una completa implementación del estándar que le permite interoperar con cualquiera de estos gestores documentales. Además, Athento tiene su propia API y web services que aumentan su capacidad de comunicación con otros sitemas.

Espero haber respondido tu pregunta en detalle Marisol, y que muchos otros usuarios encuentren esta información de utilidad.


viernes, 27 de septiembre de 2013

Sobre el webinar de ayer

¡Buenos días!
No queríamos terminar la semana sin agradeceros la increíble asistencia de ayer al webinar, vuestras preguntas y el habernos regalado una hora y media fantástica. Nos sentimos halagados de que nos hayáis hecho alargar el webinar de 45 minutos a una hora y media resolviendo vuestras dudas e inquietudes.

Hubo muchas preguntas en el chat que se quedaron sin responder ayer, pero lo que vamos a hacer es que vamos a resolverlas a través del blog y a través del Athento Answers, pues no nos gusta que os quedéis con dudas :-).

También quiero disculparme con todos aquellos usuarios que al final se quedaron sin poder asistir al webinar. Completamos el aforo súper rápido y muchos os habéis inscrito a última hora o no os han llegado los datos como en el caso del Sr. Herman Finseth, a quien pido mis más sinceras disculpas. Pero no os preocupéis, el día 8 de octubre tendremos el próximo webinar. Ya os podéis ir inscribiendo a través de Tecnowebinars para que no os quedéis sin plaza.

Por último, informaros que en breve tendremos disponibles los vídeos del webinar, por si alguien no puede esperar hasta el 8 de octubre :-)

Muchas gracias de nuevo a todos y ¡feliz fin de semana!

jueves, 26 de septiembre de 2013

Yerbabuena Software libera más de 20 plugins para Nuxeo, la plataforma Open Source de Enterprise Content Management

Madrid, 26 de Septiembre de 2013.- Yerbabuena Software, la empresa creadora de Athento -software inteligente de captura y gestión de documentos- libera más de una veintena de plugins que incorporan funcionalidad a Nuxeo

Yerbabuena anuncia que pone a disposición de la comunidad de Nuxeo una veintena de plugins que añaden o mejoran la funcionalidad de este software. Nuxeo es una de las plataformas Open Source más importantes en el mercado del Enterprise Content Management en la actualidad, gracias a sus clientes en más de 145 países.

La mayoría de los módulos liberados por Yerbabuena Software proporcionan funcionalidad de captura, como por ejemplo, el plugin AFM de monitorización de carpetas -Hot Folder- para la importación masiva y automática de documentos desde carpetas, o el plugin OCR que permite incorporar un motor de OCR a Nuxeo. Estos plugins son fruto de la andadura de esta empresa que ahora cuenta con su propio producto de captura y gestión de documentos -Athento-, pero que también es parte activa de la comunidad de desarrolladores de Nuxeo.

Además de características de captura, estos plugins dotan a Nuxeo de otra funcionalidad no menos atractiva, como la de la integración con Google Docs, que permite la edición on-line desde Google Drive de los documentos almacenados en Nuxeo. También han sido liberados varios plugins de firma digital, como el de la integración con CryptoSign Server de Realsec, que permite la firma digital de documentos mediante firmas almacenadas en un servidor de firmas.

Los plugins liberados por Yerbabuena Software están disponibles para distintas versiones de Nuxeo y pueden ser descargados desde el repositorio de la compañía.

 “En Yerbabuena Software tenemos un gran aprecio por la comunidad de desarrolladores de Nuxeo, de la que nosotros también formamos parte. Con la liberación de estos plugins pretendemos contribuir a ella así como a los millones de usuarios de Nuxeo en el mundo que quieran añadir funcionalidad a sus plataformas ECM”- Comenta José Luis de la Rosa- CEO de Yerbabuena Software.

Con una fulgurante trayectoria en el desarrollo de software, que con sólo 8 años de experiencia le permite ser partner de grandes proveedores de software ECM como Nuxeo y Alfresco, Yerbabuena Software se concentra hoy en día en el desarrollo de su propio producto de captura y gestión documental, compatible con las mencionadas plataformas así como también con SharePoint, Open-Text y Documentum. De hecho, hace apenas una semana, Yerbabuena anunció el lanzamiento de la versión 2.0 beta de Athento que puede ser probada y descargada desde la web de su producto.

Sobre Yerbabuena Software:
Yerbabuena Software de origen andaluz, está formada por un amplio grupo de expertos en software de gestión documental y actualmente, cuenta con sedes en España y Sillicon Valley (California), además de importantes acuerdos de partnership en países como España, Argentina, Chile, Perú, Colombia y México. Su producto Athento, es el encargado de gestionar la documentación de empresas como grupo DIA, BNP Paribas o Leroy Merlin.


miércoles, 25 de septiembre de 2013

Autenticación en Athento mediante OAuth

OAuth es un protocolo de autenticación para aplicaciones web y aplicaciones móviles. Este protocolo abierto permite a los usuarios contar con sus credenciales para hacer login en distintas aplicaciones sin tener que darlas en cada aplicación. 
Facebook, LinkedIn, DropBox o Google son algunas de las aplicaciones o proveedores que permiten a los usuarios hacer uso de este tipo de autenticación.


Gracias a que Athento ya puede hacer uso del protocolo OAuth, es posible tener un botón en Nuxeo (u otro ECM) que permita acceder a Nuxeo mediante el usuario almacenado en Athento. Estamos trabajando además en que muy pronto podáis tener un login desde Dropbox.  Por lo pronto, la infraestructura técnica ya está disponible. Podéis consultar la documentación de cómo hacer login en Athento a través de OAuth en nuestro Documentation Center.


martes, 24 de septiembre de 2013

Novedades Webinar Athento 2.0 beta- 26 Sept

Hola a tod@s.
A quienes no os habéis inscrito a través de Tecnowebinar a nuestro webinar, sino a través de invitaciones que desde Athento os hicimos llegar vía e-mail, o a través de nuestra web, os informamos de que en el transcurso de esta mañana os deben haber llegado los detalles de acceso y confirmación del registro en el webinar. Por favor, si no la habéis recibido, no dudéis en poneros en contacto con nosotros a través de e-mail, la web o redes sociales.


También nos han estado preguntando por el horario del webinar en distintas localizaciones:

  • España (Península): 5:30 P.M
  • España (Canarias): 4.30 P.M 
  • México/General: 10:30 A.M 
  • Perú (Lima): 10:30 A.M 
  • Argentina (Buenos Aires): 12:30 P.M
  • Venezuela (Caracas): 11:00 A.M
  • Colombia: 10:30 A.M
  • Chile (Santiago de Chile): 12:30 P.M

¡Todavía estáis a tiempo de registraros!



Descargar la hoja de funcionalidad clave de gestión documental con Athento ¡Registrarme ahora para el webinar!

Nueva Release: Athento 2.3.32 beta


Ayer os dejamos sin post, pero no estábamos ociosos, estábamos ocupándonos de liberar una nueva versión de Athento. Ya tenéis pues disponible esta nueva versión que es totalmente descargable desde nuestra web.


Las novedades de esta versión son:

Fallos Corregidos

  • Corrección de la traducción al inglés de la interfaz.
  • Corrección del parseo de algunas palabras y líneas de la librería  HOCRExtractor.
  • Problemas con el desajustes en el layout de la interfaz en pantallas de gran resolución.
  • Se cambió la librería de anotaciones (la encargada de generar las coordenadas para la aplicación del OCR zonal) por una más precisa.
 Nueva Funcionalidad

  • Nueva disposición de la parte administrativa
  • Nuevas páginas informando de los servicios operativos y su configuración.
  • Exportación a CSV de los metadatos de los documentos.
  • Links de ayuda accesibles desde la interfaz. 
  • CMIS path (para conectar con repositorios) está ahora disponible desde el properties. 
  • Monitorización de carpetas mediante Athento Schedule que te permite programar actividades (Cron) de monitorización. La monitorización de carpetas puede activarse o desactivarse mediante botón en la interfaz.  
  • Nuevo sistema de monitorización de directorio usando protocolo CMIS.
  • Implantación del sistema de gestión de documentos mediante correo electrónico ACM.
  • Implantación del servicio de extracción de campos para documentos oficiales usando aplicación Android.
  • Implantación del servicio de Autotagging para Box.
  • Nuevas páginas de error (500 y 404).
  • Creación de nuevos tipos de elementos para los modelos.
    1. Texto Zonal (Anotaciones) *
    2. Imagen  - Crop de una imagen. *
    3. Texto - Extracción de información usando expresiones regulares.
    4. Código - Extracción y decodificación de códigos de barra y QR.
Podéis descargaros la nueva release. Además, en nuestro Documentation Center encontraréis la información necesaria para llevar a cabo el proceso de instalación de la plataforma.

Registro de Entrada con Athento ¡Descargar Athento!

jueves, 19 de septiembre de 2013

Primeras reacciones de los usuarios de Athento 2.0 beta

"He echado un vistazo al producto y en mi opinión todo está muy bien. Campos precisos, interfaz clara y con alta usabilidad (requisito indispensable para el acceso de cualquier tipo de usuario), la funcionalidad me parece que es bastante alta, ya que al ser de fácil comprensión, el producto puede ser rápidamente incorporado al trabajo de la empresa sea cual sea su cometido. Sobre la parte documental, destaco que me parece interesante contar con un campo de "palabras clave" para que sea el usuario quien elija la forma más rápida de indizar sus propios documentos y de esta manera hacerlos fácilmente recuperables.En resumen, ¡muy buen trabajo!"
Fátima Barquero Sánchez
Documentalista en TVE
Perfil LinkedIn

En noviembre presentaremos la versión 3.0 de Athento

Como ya sabéis, ayer presentamos una versión de beta de Athento 2.0. La idea con esta versión es conseguir un feedback rápido de los usuarios para incorporar mejoras y funcionalidades importantes para ellos de cara a la versión 3.0.

Aprovechamos para dar gracias a todos los usuarios y lectores por el interés que estáis teniendo en la aplicación y os pedimos disculpas porque debido al aluvión de solicitudes de demos que hemos tenido, hemos experimentado por momentos algunas dificultades técnicas.

Siguiendo con el tema de la versión 3.0,  los usuarios de Alfresco van a tener 'buenas nuevas' y la integración con Box se ampliará -no sólo permitirá el uso del autoetiquetado semántico-, además de que se ampliará la parte de semántica con el uso de ontologías.  

La versión 3.0 la presentaremos en vivo y en directo en varios eventos de gestión documental y captura de documentos.

Or recordamos también que dentro de una semana tendremos webinar de Athento en español en el que podréis aprender cómo usar @athento de la mano de uno de nuestros expertos.



miércoles, 18 de septiembre de 2013

Athento lanza su versión 2.0 beta para añadir inteligencia a los procesos de captura y gestión de documentos

Madrid, 18 de Septiembre de 2013 .- Athento, el software inteligente de gestión de documentos, anuncia hoy su versión 2.0 beta.

La versión 2.0 de Athento ofrece características avanzadas de captura y gestión documental como la auto-clasificación y la extracción de información de documentos mediante la aplicación de potentes algoritmos de análisis de texto e imagen. Esta versión 2.0 incorpora soporte para Machine Learning, así como una versión mejorada de su auto etiquetado semántico de documentos que ya estaba disponible desde Box.net

Otra de las apuestas de Athento con esta versión es una interfaz ligera, amigable y rápida, que permite configurar casi el 100% del proceso de captura desde el front-end. Una API y una serie de web services que incrementan las capacidades de integración de la herramienta y que permiten incluso la captura y procesamiento móvil, completan los platos fuertes de esta versión beta.

 “Athento combina su inteligencia, facilidad de uso, precisión y potencia para dar respuesta a las necesidades de las empresas que no están satisfechas con el software actual disponible en el mercado. Este producto significará para ellas ahorros gracias a la automatización de procesos y contar con un producto flexible pero potente de gestión documental inteligente.”- Comenta José Luis de la Rosa- CEO de Yerbabuena Software, la creadora de Athento.

La versión 2.0 beta de Athento podrá ser probada desde hoy a través de su web y se prevé que en noviembre de paso a la versión 3.0, que se presentará en varios eventos internacionales de ECM. El objetivo de hacer pública una beta de la versión 2.0 es recibir feedback de los usuarios, conocer sus opiniones, necesidades y que estos tengan un papel activo en el diseño del roadmap de Athento.

Athento es producto novedoso que se ha abierto paso de la mano de grandes players del mercado ECM como Nuxeo y Alfresco. De hecho, uno de los principales atractivos de este software ha sido siempre su apuesta por la interoperabilidad. Athento cuenta con conectores CMIS que le permiten trabajar con plataformas ECM como las mencionadas, pero también con SharePoint, OpenText o Documentum. Su nueva versión ofrece carga de documentos también desde DropBox y otros mecanismos como captura desde correo electrónico y hot folders. 


Sobre Yerbabuena Software: 

Yerbabuena Software está formada por un amplio grupo de expertos en software de gestión documental y actualmente, cuenta con sedes en España y Sillicon Valley (California), además de importantes acuerdos de partnership en países como España, Argentina, Chile, Perú, Colombia y México. Su producto Athento, es el encargado de gestionar la documentación de empresas como la grupo DIA, BNP Paribas o Leroy Merlin.


martes, 17 de septiembre de 2013

Webinar: 3 pasos para digitalizar con éxito

Fecha: 26 de Septiembre 2013
Hora: 17:30 horas (Madrid) / 17:30 (CEST,GMT+2) / 10:30 - 11:45 (GMT-5)
Comprueba la hora en tu país desde aquí.


Dentro de pocos días realizaremos un webinar de captura y gestión documental inteligentes. La temática del webinar se centrará en cómo conseguir que un proyecto de digitalización se convierta en un éxito. Para ello, os mostraremos en acción nuestra nueva versión de Athento cuyo lanzamiento es inminente.

Las 3 claves que se tratarán en el webinar serán:
  1. Clasificación automática de documentos
  2. Extracción Automática de documentos
  3. Automatización de procesos mediante la información obtenida de documentos.

La asistencia es totalmente gratuita y las razones por las que deberías asistir son las siguientes:

  • Verás en tiempo real cómo Athento clasifica y extrae información de documentos. 
  • Aprenderás cómo usar esa información para automatizar procesos
  • Porque el 14% de las empresas están extremadamente insatisfechas con el software de digitalización del mercado. 


La persona encargada de explicarnos los secretos de un proyecto de digitalización exitoso es Miguel Ángel Zafra. Miguel Ángel es Sales Engineer en Yerbabuena Software. Este Ingeniero Informático de formación, cuenta con 7 años de experiencia en el mercado europeo de Gestión Documental y ha ejercido de consultor técnico en diversos macroproyectos de Gestión Documental y Captura de Documentos.

lunes, 16 de septiembre de 2013

Athento llega a Colombia de la mano de Digitex

Durante el último trimestre de 2012, Yerbabuena Software llevó a cabo la primera implantación de Athento en Colombia, operación que se realizó en una de las filiales del Grupo Digitex en el país Sudamericano.

Ahora, gracias al éxito de aquel proyecto, Grupo Digitex y Yerbabuena Software han decidido convertirse en partners estratégicos, ofreciendo a las empresas colombianas servicios técnicos especializados de consultoría sobre el software de digitalización, gestión documental, y captura inteligente de documentos Athento, de Yerbabuena Software, que quedará integrado en el propio portafolio de soluciones
de Digitex.

Nuestro CEO, José Luis de la Rosa, afirma que "nuestro acuerdo con Digitex es muy importante porque permite a las empresas colombianas y de otros países contar con el respaldo y la experiencia de una compañía tan sólida como Digitex cuando decidan mejorar la eficiencia de sus procesos de gestión documental con Athento."

Por su parte, Asier Peña Zarraga, Director Corporativo de Estrategia y Desarrollo de Negocio de Digitex ha manifestado que “para Digitex la alianza con Yerbabuena Software es estratégica y nos permitirá atender la creciente demanda de Gestión Documental con soluciones que se adaptan a las necesidades de los clientes como Athento.”

El compromiso entre Yerbabuena Software y Digitex se hará oficial del 16 al 19 de septiembre, con la presentación en Colombia de la versión de Athento 2.0 beta, coincidiendo con el lanzamiento internacional de esta versión del software, que ofrece funcionalidades avanzadas de auto-clasificación de documentos y extracción de datos.

El Grupo Digitex es una consultora BPO internacional cuyas infraestructuras alcanzan 10.000 posiciones de operación en 7 países distintos. Digitex Cuenta con más de 20 años de experiencia y 15.000 trabajadores que le permiten ayudar a grandes multinacionales líderes de sus sectores, a diseñar, operar y optimizar sus procesos de negocio, aumentando la calidad y prolongando el ciclo de vida de los clientes, dentro de un escenario de eficiencia.

Ésta no es la primera vez que Yerbabuena Software lleva a cabo un proyecto de gestión documental en el contienente americano, de hecho ya cuenta con experiencias de éxito en México, Chile y Perú y con importantes partners locales en otros países como Argentina. - “La apuesta de Yerbabuena Software es, sin duda, llevar al continente americano verdaderas soluciones de negocio para empresas que necesitan mejorar su eficiencia, adquirir más control sobre su documentación o explotar el conocimiento embebido en sus documentos" - asegura José Luis.

jueves, 12 de septiembre de 2013

Análisis de las soluciones de captura disponibles en el mercado

Este verano emprendimos un estudio sobre las soluciones de captura disponibles en el mercado, preguntando a quienes más saben del tema, las empresas dedicadas a la digitalización y BPOs. El estudio no lo hemos cerrado aún, pero hoy quería adelantaros algunos datos interesantes que está dejando:
  • Sólo el 20% de las empresas están completamente satisfechas con su software de digitalización. 
  • El 75% cambiaría su software por uno más fácil de usar
  • El 50% cambiaría su software por uno más fácil de integrar.
  • El 57% se ha gastado dinero en desarrollos posteriores a la compra.



El estudio continua abierto. Una vez se cierre, compartiremos los resultados del estudio en forma de infografía. Os invitamos a participar a aquellos que trabajáis en este mercado y que sois quienes mejor conocéis el sector.


miércoles, 11 de septiembre de 2013

¿TIFF o PDF? ¿Qué formato de salida elegir en proyectos de digitalización?

En el post anterior hicimos un overview de los dos formatos reyes de salida en proyectos de digitalización (TIFF y PDF) y captura de documentos. Ya sabemos que estos son los dos tipos de archivos más usados en proyectos de digitalización y sus principales características. Pero cuando escaneamos documentos en papel ¿cuál es el formato que más nos conviene?

Existen varios criterios a tener en cuenta:

  • Conservación:  PDF/A, gracias al estándar (ISO 19005-1:2005) es la mejor opción a la hora de garantizar la longevidad de los ficheros digitalizados.


  • Tamaño: Los PDFs normales son un formato de menor tamaño que los TIFF. Esto sin embargo, cambia en lo referente a PDF/A, ya que este trae embebidos los archivos de fuentes dentro del documento, lo que incrementa su tamaño. En cuanto a los PDFs tipo imagen, el tamaño va a depender de la compresión que se utilice para la imagen envuelta en el fichero PDF. En relación a los PDFs "Searcheables", estos suelen ser alrededor de un 10% más grandes que la imagen equivalente. Conclusión, en general , los PDFs suelen ser un formato más "ligero", pero es necesario considerar la clase de PDF con la que vamos a trabajar antes de sacar conclusiones.

  • Capacidad de búsqueda dentro del contenido: De nuevo tenemos al PDF como ganador, ya que el formato TIFF se creó para almacenar imágenes y no texto. Microsoft ha desarrollado un formato de TIFF "searchable" pero no estamos hablando de un estándar. Para poder buscar en el texto de una imagen TIFF, necesariamente necesitamos la aplicación de OCR y que el texto extraído se almacene en algún otro soporte (base de datos u otro fichero).

  • Seguridad: El formato PDF permite restringir el acceso mediante contraseñas y otros mecanismos, al contrario que TIFF.

  • Multiplataforma: Ambos tipos son perfectamente reconocidos por los sistemas operativos UNIX y Windows.

  • Metadatos: Ambos sistemas permiten almacenar metadatos, sin embargo, el sistema de PDF es más sofisticado ya que permite embeber metadatos en formato XML en los ficheros PDF.

  • Texto enriquecido: De nuevo el ganador es PDF, que permite incluir enlaces, anotaciones, marcas, etiquetas y otros elementos en el contenido del fichero.

  • Accesibilidad: PDF, al contrario que TIFF, permite la operación de tecnologías de ayuda  a las personas con discapacidad. Por ejemplo, un lector de pantalla puede leer un PDF. Con TIFF esto no es posible.

  • Calidad de presentación y visualización: Ambos formatos pueden servir bien a estos propósitos, sin embargo, TIFF y PDF de tipo imagen están sujetos a las restricciones de la resolución de la imagen. En este caso, PDF normal es la mejor opción. Existen múltiples aplicaciones para visualizar ambos tipos, aunque los de PDF están más extendidos. En cuanto a la visualización on-line, ninguno de los dos formatos está soportado de forma nativa por los navegadores web, aunque la mayoría de ellos están integrados con Adobe Reader para solucionar este aspecto. En relación a los navegadores web, el formato PDF si que brinda la posibilidad de optimizar el contenido para web.

Sin duda, si atendemos a todos estos criterios, el formato a elegir sería PDF, sin embargo, no todos estos criterios tienen el mismo peso en todos los proyectos, por lo que habría que realizar un análisis en cada caso. Aún si decidimos que PDF es la mejor de nuestras opciones, tendríamos a su vez que decidir dentro de los formatos PDF cuál es el que más nos conviene.

Nota: Buena parte de la información contenida en este post ha sido tomada del documento "TIFF versus PDF for Document Storage".



martes, 10 de septiembre de 2013

Mejores formatos de salida para la digitalización de documentos

En proyectos de captura de documentos -ya sean de digitalización de documentos en papel o captura con dispositivos móviles- es importante escoger un formato de fichero que tras el escaneo de documentos que nos permita conservar los documentos con la mayor calidad e información posible. En ese sentido, tenemos 2 formatos reyes:

  • TIFF (Tagged Information File Format): Estos ficheros tienen la extensión .tif o .tiff. Es un invento de Adobe que ya cuenta con 27 años de existencia. Fue creado con el objetivo de que existiera un formato estándar para la digitalización de documentos. TIFF es quizás la mejor opción para preservación de imágenes por múltiples motivos (soporta 1 página o múltiples, soporta toda clase de codificación de color y numerosos algoritmos de compresión de imagen), aunque también tiene un gran defecto, su peso. Compartir imágenes TIFF no parece la mejor solución, pero las soluciones de captura o de gestión documental ofrecen opciones de conversión de TIFF a otros formatos mucho más portables.

  • PDF (Portable Document Format): Formato estándar abierto,
    convertido en estándar internacional por la ISO. Es otro de los inventos de Adobe, que aunque un poco más joven, se encuentra mucho más extendido que el TIFF. En orden de garantizar la supervivencia y conservación de los formatos PDF, existe la ISO 32000 que indica a los desarrolladores de software que produce, lee u opera con ficheros PDF las características que estos deben tener. PDF soporta documentos de varias páginas, y su principal baza es que permite la visualización del fichero de forma independiente al entorno tecnológico en el que fue creado o en el que está siendo consultado (es multiplataforma).  Existen muchas clases de PDFs, los dos grupos más importantes son los PDF normales y los PDF imágenes. Los PDF normales -True PDF- incluyen texto formateado, lo que permite a los usuarios realizar búsquedas dentro de su contenido o copiar y pegar texto. El segundo grupo es el de los PDF imágenes -Wrapped PDF-, que consisten en un formato PDF que envuelve una imagen, generalmente en formato TIFF. Al ser imágenes envueltas en un formato PDF, no es posible realizar búsquedas en ellos o copiar o pegar su texto. En este grupo de PDFs la aplicación del software OCR es vital para poder indexar el contenido del fichero, realizar búsquedas o extraer datos. Existe un tercer grupo, llamado en inglés "Searcheable" (algo así como "que se puede buscar"). Este tipo de PDF es un PDF tipo imagen pero al que se le añade una capa con el texto del documento. Esta capa es generada por un motor de OCR y permite todas las posibilidades de un PDF normal.
En un futuro post os explicaremos cuando elegir un formato u otro, hoy sólo hemos querido señalar cuales son los formatos más usados a la hora de emprender un proyecto de digitalización.

jueves, 5 de septiembre de 2013

Validación de datos y calidad de la información obtenida en procesos de captura

Normalmente cuando hablamos de software de captura, funcionalidades como la clasificación  de documentos o la extracción de datos de documentos son las atracciones estrella. Esto es normal, ya que son las dos funcionalidades que permiten a las empresas obtener información que de otra forma estaría inaccesible en sus documentos. 

La precisión de los resultados de estos procesos está sujeta a múltiples factores que no se limitan sólo a la potencia y calidad del software, por ejemplo, la calidad de los documentos que tienen que ser procesados. En muchos casos estos documentos son imágenes escaneadas de fotocopias de fotocopias y tienen tan poca calidad que el ojo humano también tiene problemas tratando de leer la información. En estas condiciones, las máquinas y tecnologías existentes no pueden hacer mucho más que el ojo humano.  No obtener información, u obtener información imprecisa tiene como consecuencia que los sistemas que están esperando esa información trabajen sobre errores. Por ejemplo, en el caso de facturas, si los datos extraídos son incorrectos -digamos que se extrae como total de la factura un total de 500 euros cuando en realidad era un total de 600- nuestro software de contabilidad contabilizará una cantidad errónea. Aquí es dónde aparece la importancia de la validación de datos, ya sea manual o automática.

Validar la información obtenida por el software de captura es una forma de garantizar la calidad de la misma antes de enviarla a nutrir otros sistemas.


Opciones de Validación de Datos en software de Captura:

  • Notificación de aquellos documentos en los que la extracción o clasificación de datos está por debajo del umbral de seguridad de acierto: En otras palabras, si el sistema no está 99% seguro de la extracción o clasificación de un documento, debería notificarlo.
  • Ayudas de previsualización del documento: Poder realizar zoom sobre el documento en el momento de la revisión nos ayuda a localizar e identificar los datos en las imágenes escaneadas.
  • Validación Manual: Posibilidad de corregir los datos erróneos obtenidos por el sistema. Esta corrección la hacen los usuarios.
  • Validación Automática:  Esta opción permite la conexión del sistema con bases de datos en las que ya se encuentra la información extraída para corroborar que los datos se corresponden. Por ejemplo, si se extrae el nombre de un paciente de una analítica, el sistema puede buscar el nombre del paciente en el sistema de información hospitalario, comprobar que existe y comprobar otros datos asociados como el número de la seguridad social, etc.

En el caso de la versión 2.0 de Athento, el sistema ofrece vistas de validación para los documentos procesados, estas vistas permiten corregir los datos erróneos o que no han podido ser extraídos. Además, permiten visualizar el documento mediante ayudas de tipo zoom-in (una lupa) que permite a las personas encargadas de validar los datos una mayor visibilidad de los mismos.




miércoles, 4 de septiembre de 2013

Buenas prácticas: 4 claves para reducir el uso del papel en la empresa

Muchos profesionales han dado su guerra con el papel por perdida. Es cierto que llevamos demasiados años hablando de la oficina sin papel pero que esta sigue siendo una realidad esquiva. Tal vez, la mejor estrategia es ir poco a poco, cambiando pequeñas cosas que permitan a nuestros trabajadores del conocimiento realizar sus labores en digital de manera progresiva:

  1. Extiende el concepto de la oficina sin papel a
    todo nivel:
    Analiza dónde se originan los documentos o cómo puedes contribuir a que ese proceso se haga directamente en digital. No mires a tu empresa como un lugar o lugares físicos bien delimitados, considera que donde quiera que haya alguien de tu compañía trabajando (por ejemplo tu personal de ventas o de distribución) está tu empresa.

  2. Realiza una definición conceptual de cuales son tus principales tipos documentales y la información que de ellos te interesa: Suele ocurrir que para un mismo tipo documental, por ejemplo las facturas, estéis manejando diferentes metadatos en cada subtipo. En el caso de las facturas, por ejemplo, para cada proveedor estáis manejando metadatos distintos, aunque en teoría todas son facturas y deberían tenerse en cuenta los mismos metadatos. Esto dificulta los proyectos de digitalización y extracción de datos y, probablemente, os quita tiempo averiguando información que no vais a usar de forma posterior.

  3. Identifica los procesos claves para empezar: No vayas a por todos tus procesos inmediatamente. Es una utopía pensar que hoy estamos trabajando con documentos en papel y a partir de mañana no vamos a ver un sólo papel en nuestras instalaciones. Empieza por esos procesos que tienen un hard ROI (ROI directo), es decir, aquellos en los que vas a ver resultados medibles y no sólo sensaciones  o beneficios difícil de cuantificar con la reducción de riesgos. Obtener mejoras de tiempo de respuesta a clientes, por ejemplo, es un beneficio cuantificable que puede servir de evangelizador a lo largo de todos los departamentos.

  4. Políticas claras y explícitas: ¿Qué imprimir? ¿hasta qué volumen? restricciones de retención de documentos, plan de almacenamiento (lista de documentos que deben necesariamente almacenarse en papel y lista de aquellos que pueden conservarse en digital, cómo se van a almacenar, etc.). Estas políticas deben implicar la cargos concretos que sean responsables de seguir el cumplimiento de las políticas y de su difusión a todo el personal.

martes, 3 de septiembre de 2013

Workflows, BPM y Case Management

El interés de las empresas por automatizar procesos no es nuevo. Workflows, BPM y Case Management. Vamos a definirlos de forma rápida.
De hecho, el análisis de procesos es un campo bastante desarrollado, lleno de terminología y conceptos que en muchos casos suelen ser utilizados de forma indistinta cuando en la realidad, estamos hablando de cosas distintas. Este es el caso de estos 3 términos:

  • Workflows: También conocido como routing. Son los flujos de trabajo más básicos y se caracterizan no sólo por su sencillez -son bastante lineares-, sino porque las tareas que componen el proceso no cambian. Un ejemplo de estos flujos, son aquellos que revisión y aprobación que traen incorporadas las plataformas ECM y gestores documentales. El uso de estos workflows, aunque sencillos, puede resultar de mucho provecho para las empresas, que obtienen mayor control sobre su documentación y la información que estos contienen.


  • BPM: Estas siglas corresponden a Business Process Management. Estos procesos se caracterizan por ser predecibles, pero también por que son mucho más complejos que los del grupo anterior. No suelen ser lineares, sino que se ramifican en distintos caminos según distintas condiciones. Pueden implicar mayor flexibilidad, por ejemplo, en el caso de que se cumplan ciertas condiciones, tareas del proceso pueden ser omitidas o las personas encargadas pueden variar según las distintas situaciones. Automatizar este tipo de procesos, requiere análisis del proceso y en la mayoría de los casos una reingeniería del mismo. La principal ventaja de automatizar estos procesos es definitivamente la mejora en los tiempos en los que se resuelven los procesos.


  • Case Management: Se refiere a procesos no predecibles. En estos procesos generalmente hay envuelto uno o varios trabajadores del conocimiento, quienes tienen que tomar decisiones sobre qué procedimiento es el adecuado o incluso, llegan a modificar el proceso según ciertos casos. Las decisiones que llevan a cabo los trabajadores del conocimiento, están sujetas a guías explícitas, restricciones y pueden necesitar del apoyo de otros actores.

En los 3 casos, un elemento fundamental para la automatización de procesos es contar con la información adecuada. Por ejemplo, el reconocimiento automático de un tipo de documento que nos llega por correo, nos permitiría iniciar de forma automática un flujo de trabajo de revisión. Extraer la fecha de una reclamación nos permitiría darle prioridad a documentos que van a sobrepasar el plazo de respuesta que tenemos y extraer el nombre del cliente que está poniendo la reclamación o su localización, nos permitiría ponerlo en contacto con un profesional u otro. Toda esta información está en los documentos, el problema es que obtenerla de forma manual es un proceso lento y costoso. La solución a este problema la aporta el software de captura de documentos con su funcionalidad de extracción de metadatos e identificación y clasificación de documentos.

lunes, 2 de septiembre de 2013

Athento 2.0 cada vez más cerca

Nos encanta comenzar septiembre con buenas noticias. Como ya os hemos venido adelantando, este mes estrenamos versión de nuestro Athento, con más y más funcionalidad inteligente de captura de documentos.

La versión 2.0 es una versión fast-track, ya que según las previsiones de nuestros ingenieros, para principios de noviembre liberaremos la versión 3.0. De esta manera, queremos consolidar nuestro compromiso de ofrecer un software a la altura de las necesidades actuales de nuestros clientes. 

Entre las nuevas funcionalidades de la versión 2.0 están:
También os adelanto que vamos a tener disponible en esta nueva versión una integración con uno de los principales proveedores de File-Sharing (con el que la mayoría de vosotros seguro que trabajáis :-) )y que por fin tendremos  disponible -incluida nuestra demo- la nueva interfaz de Athento. No quiero arruinar la sorpresa, pero también hemos trabajado en la capacidad de aprender de Athento ;-)

Por último os recuerdo que la comunidad de Athento tiene nuevos recursos disponibles:


Os mantendremos informados!!!

AddThis