martes, 2 de mayo de 2017

Preguntas y Respuestas sobre Semántica y Athento


La Gestión Semántica de Contenidos es un concepto íntimamente ligado a Athento desde sus inicios. El propio concepto en sí es bastante amplio ya que en realidad estamos hablando, desde un punto de vista genérico, de la aplicación de Tecnologías Semánticas (técnicas y metodologías procedentes de lo que dio en llamarse la Web Semántica) al mundo de la Gestión Documental. En este contexto, surgen multitud de casos de uso y posibilidades que nos llevan a una pregunta esencial:

¿En qué consisten las capacidades semánticas de Athento?

Athento utiliza las Tecnologías Semánticas con un objetivo principal: intentar comprender los documentos que gestiona. Para la mayoría de los Gestores Documentales del mercado, los documentos son cajas negras de texto a los que se le asocia una serie de metadatos. Sin embargo, los documentos de cualquier organización encierran un conocimiento de negocio esencial, conocimiento que, en la era del Big Data, puede ser analizado e interpretado con facilidad, pero para ello debe ser procesable por máquinas. Las capacidades semánticas de Athento van precisamente en la línea de estructurar el contenido de los documentos y convertirlo en un formato estructurado y susceptible de ser analizado por procesos automáticos.

Para ello, cuenta con dos funcionalidades esenciales, en las que hace uso de distintas tecnologías semánticas:

  • Es capaz de identificar entidades o conceptos de una Base de Conocimiento instanciada a partir de cualquier modelo ontológico dentro del contenido textual de los documentos. Es decir, identifica menciones a entidades de una ontología, anotando los documentos mediante una relación semántica entre la entidad y el propio documento. Posteriormente, puede usar esta relación y las relaciones entre esas entidades y otras en la ontología para inferir más conocimiento sobre los documentos.
  • Tanto estas anotaciones semánticas como el resto de metadatos clásicos gestionados por Athento, pueden ser expresados mediante triples RDF (Sujeto-Predicado-Objeto) y almacenados en los llamados Triple Stores, permitiendo consultas posteriores con SPARQL, el lenguaje de consultas para bases de datos semánticas. En este sentido, si estamos usando una Base de Conocimiento almacenada en un Triple Store para identificar entidades, las relaciones entre los documentos y estas entidades también formarían parte del mismo Triple Store, quedando el repositorio contextualizado y permitiendo realizar consultas SPARQL que involucren a documentos y entidades.  


Con respecto a estas funcionalidades, hace unos días, un lead de nuestra web nos hizo algunas preguntas bastante interesantes que nos permiten además entrar en más detalles técnicos:

1. ¿Cómo se cargan ontologías en Athento?

El producto cuenta con un editor sencillo de vocabularios semánticos que permite a los usuarios de forma muy intuitiva crear una jerarquía de conceptos (típicamente un Thesauro) y asignarle a cada uno de ellos una serie de etiquetas y propiedades que pueden usarse posteriormente para distintos casos de uso, como por ejemplo, el nombrado etiquetado semántico o reconocimiento de entidades. Esta herramienta de edición de vocabularios maneja internamente los conceptos o entidades en nuestro propio sistema.

Athento también puede trabajar con Bases de Conocimiento externas o ya existentes de dos formas distintas.
  • Pueden indexarse en un BackEnd especializado para etiquetado semántico. En este caso, la ontología puede usarse para reconocimiento de entidades en texto y los conceptos/entidades pueden consultarse a partir de una API REST, pero no a través de un Endpoint SPARQL.
  • Pueden cargarse en un TripleStore externo, ofreciendo las funcionalidades típicas de estas bases de datos, principalmente consultas SPARQL, de forma totalmente integrada en Athento.

2. ¿Se pueden administrar ontologías de forma nativa en Athento?

Si se hace uso de la herramienta de edición de Athento, sí. Si hablamos de una ontología externa ya existente, la administración debe hacerse en el Triple Store seleccionado para la carga. 

3. Una vez incorporadas las ontologías en Athento, ¿Se puede de forma nativa establecer patrones sobre tales ontologías?

El uso de inducciones y razonamiento debe hacerse en el Triple Store.

4. ¿Soporta Athento ontologías en esquema OWL y RDF? 

Ambos formatos son soportados

5.  ¿La “nube de tags” de Athento está compuesta por elementos ontológicos precargados?

Los tags pueden ser de varios tipos, tanto semánticos, consistentes en nubes de entidades de una ontología que se detectan en los textos de los documentos, como léxicos, consistiendo en términos o palabras en los textos de gran relevancia y/o frecuencia.

7. Una vez la ontología cargada, ¿puedo hacer consultas semánticas tipo SPARQL? 

Athento no es un Triple Store y por tanto directamente no soporta SPARQL. Sin embargo, se integra con cualquier Triple Store al que puede delegar la consultas. De hecho, todo el conocimiento que se extrae de los documentos en forma de metadatos pueden volcarse en formato RDF en el Triple Store incluyendo las relaciones con entidades, quedando el repositorio totalmente contextualizado a nivel semántico.


8. ¿Athento ofrece algún mecanismo que permita enriquecer la ontología cargada (poblar la ontología de forma automática en lo que se refiere a valores, en el contexto del esquema entidad-atributo-valor de RDF)?

Athento puede volcar de forma sencilla su conocimiento en RDF y almacenarlo en una base de datos semántica o Triple Store. Por conocimiento entendemos todas las entidades que se manejan internamente en el sistema, principalmente Usuarios + Documentos + Metadatos



Prueba 30 días gratis Athento

No hay comentarios:

Publicar un comentario

AddThis