Inicia sesión


Entrevista

«Las administraciones están tomando conciencia de la importancia de la Web Semántica»

PC Actual ha hablado con Juan Antonio Pastor Sánchez, experto de la Facultad de Comunicación y Documentación de la Universidad de Murcia, que también es autor del libro Tecnologías de la Web Semántica, sobre la web 3.0, su estado actual y su previsible futuro.

¿Cómo definiría la web semántica (o las tecnologías que la hacen posible) a una persona que no está muy versada en estos temas?

Juan Antonio Pastor Sánchez

En un principio la Web se diseñó para publicar, compartir y relacionar páginas destinadas a su consulta y lectura por parte de personas. Sin embargo, la web Semántica está pensada para que las aplicaciones informáticas de todo tipo puedan intercambiar y procesar automáticamente datos que describen el contenido de información de todo tipo, utilizando para ello un conjunto de modelos, estándares y tecnologías para su almacenamiento, definición de relaciones y obtención de nuevos datos a partir de los ya existentes.

¿Qué posibilidades proporciona la Web 3.0 frente a la Internet que conocemos hoy en día?

Ofrece mayor potencia a la hora de buscar información o acceder a la misma. Pero lo fundamental es la capacidad para integrar recursos de información gestionados por diferentes organizaciones. Por ejemplo: la posibilidad de buscar un documento en múltiples catálogos de diferentes bibliotecas o servicios de información con una única consulta, calcular la ruta más óptima entre dos ciudades utilizando diferentes medios de transporte, interconexión de distintas administraciones públicas para facilitar la aportación de documentación del ciudadano o intercambio inmediato de datos clínicos sobre un paciente entre centros de diferentes sistemas sanitarios. También es posible realizar búsquedas más precisas: conocer qué películas se proyectan en un radio de 2.000 metros de nuestro domicilio en un determinado intervalo horario. Las posibles aplicaciones son innumerables.

¿Cuáles son las tecnologías clave para conseguir una Internet verdaderamente inteligente y en qué consisten?

Las tecnologías clave son RDF, OWL y SPARQL. RDF es un modelo de datos que permite describir todo tipo de recursos de información. Su función es muy similar al del modelo relacional de bases de datos como MS-Access, Oracle o MySQL. La información se almacena en forma de tripletas de tipo sujeto-predicado-objeto. Es un modelo muy flexible y es el corazón de la Web Semántica. Con RDF es posible definir todo tipo de vocabularios que indican el modo en el que describir los recursos. Además es posible utilizar múltiples vocabularios RDF de forma que podamos reutilizar el trabajo realizado por otros desarrolladores que ya han utilizado RDF para crear un determinado vocabulario.

Cuando se desea describir una estructura lógica sobre el modo en el que se relacionan dichos recursos (clases, subclases, propiedades, restricciones, etc) se utiliza RDF Schema y OWL. SPARQL es un lenguaje de consulta para conjuntos de datos RDF, su función es similar al lenguaje de consulta SQL utilizado en las bases de datos relacionales. Estas tecnologías permiten crear sistemas escalables y modulares que se pueden adaptar a todo tipo de proyectos, desde los más sencillos que se limitan a describir recursos hasta los más complejos que pueden aplicar OWL para definir la lógica de relaciones y ejecutar inferencias para descubrir nuevos datos.

¿Qué proyectos destacables se están desarrollando actualmente en el campo de la Web Semántica?

Existen múltiples proyectos y servicios relacionados con la Web Semántica, aunque tal vez el más representativo sea DBpedia: un proyecto colaborativo y abierto cuya principal característica es el marcado semántico de Wikipedia mediante una ontología OWL. También son muy comunes las aplicaciones para construir vocabularios temáticos, como la lista de encabezamientos de materia de la Biblioteca del Congreso de Estados Unidos o las del Ministerio de Cultura que se aplica en nuestra Biblioteca Nacional.

Servicios como Kasabi (kasabi.com) o Freebase (freebase.com) permiten que cualquier usuario, de forma gratuita, pueda incorporar datos a la esfera de la Web Semántica. La iniciativa Open Government Data en el campo de la administración electrónica tiene como objetivo difundir, por parte de las administraciones públicas, datos públicos mediante tecnologías de la Web Semántica para su reutilización por parte de particulares y empresas y crear nuevos modelos de negocio. Un ejemplo de esto es Opening Up Government del Reino Unido.

Kasabi

¿Es muy complicado y caro indexar una página de Internet para que pueda ser aprovechada por la tecnología que hace posible la Web Semántica?

Hoy día las tecnologías y estándares de la Web Semántica están muy extendidos, lo que unido a que se utilizan sistemas de gestión de contenidos permite insertar información semántica en las propias páginas HTML/XHTML, que en un principio están creadas para su lectura o consulta por parte de personas. De este modo, una aplicación informática podría extraer información semántica de estas páginas. Para ello también existen tecnologías relacionadas con la Web Semántica, como son los microdatos (para HTML 5) y RDFa (para XHTML).

Los avances de los grandes buscadores serán vitales para el desarrollo de la Web Semántica. ¿Hasta qué punto se están implicando estas firmas en el desarrollo de la web semántica?

Para estas empresas la Web Semántica es un punto estratégico en su desarrollo y evolución. Por poner un ejemplo: el proyecto Schema.org es una iniciativa conjunta de Google, Yahoo! y Bing (Microsoft) para insertar información semántica mediante microdatos en páginas que utilicen HTML 5. Se busca de este modo crear servicios de búsqueda semántica o mejorar la eficiencia de los motores de búsqueda actuales en base a la obtención de resultados más precisos.

Schema.org


Zona de comentarios

comments powered by Disqus
0 comentarios

Si quieres opinar, tienes que estar registrado.

¡Regístrate!Disfruta de todas las ventajas de pertenecer al Club PCA

Y, si ya eres socio, identifícate