Voy a compartir también con vosotros las principales novedades de esta nueva versión:
Ahora es posible extraer el texto de documentos Word
Ya podéis obtener el texto de un fichero con extensión .doc o .docx. para trabajar con él.
Integración del autoetiquetado de Athento con Apache Stanbol
Apache Stanbol va a hacer posible que los usuarios suban sus propias ontologías o vocabularios para que sean usados en el proceso de asignación automática de etiquetas a un documento. Este es un avance más en la funcionalidad semántica de Athento.
Clonación de Tipos Documentales
Ahora es posible reaprovechar el trabajo de otros y copiar un tipo documental con su configuración de clasificación y de extracción de datos para utilizarlo. Esto en un futuro muy próximo nos va a permitir ofreceros una librería de tipos documentales que podáis aprovechar para vuestros proyectos.
Enviar el OCR completo de un documento a Alfresco o Nuxeo por CMIS
Antes sólo era posible el envío del OCR de una página concreta, ahora es posible enviar el texto completo del documento a cualquier gestor documental que implente CMIS.

No hay comentarios:
Publicar un comentario