Entrevista

«La llegada de la Web Semántica no tiene fecha realista»

Web Semántica

La Red está a reventar de información, pero seguimos sin sacarle todo el partido posible. Los buscadores todavía dejan mucho que desear a la hora de responder mejor a las necesidades de los internautas. Sin embargo, la Web Semántica podría cambiar las cosas.

Para intentar arrojar algo de luz sobre esta solución de futuro, hemos preguntado a Lluís Codina, profesor en la Universidad Pompeu Fabra y que ha escrito un libro específico, junto a varios autores, sobre esta materia («Web Semántica y sistemas de información documental»).

PC Actual: El concepto de Web Semántica parece bastante esquivo. ¿Cómo definiría la Web Semántica (o las tecnologías que la hacen posible) a una persona que no está muy familiarizada con estos conceptos?

Lluís Codina: La Web Semántica (en adelante, WS) consiste en un conjunto de normas y especificaciones técnicas destinadas a tratar la información de manera que ésta sea más fácil de interpretar por programas de ordenador. Por ejemplo, para que un buscador pueda entender mejor de qué trata una página web.

Pero también para que una aplicación, por ejemplo, un sistema de información, pueda tomar datos de procedencia diversa o incluso creados por organismos distintos y unirlos en una respuesta unificada para el usuario, en lugar de darle la lista separada de documentos y fuentes.

Web Semántica defecto

PCA: ¿Qué posibilidades proporciona la Web 3.0 frente a la Internet que conocemos hoy en día?

L.C.: Estas denominaciones son arbitrarias, debido a que se puede considerar que la Web 3.0 ya está entre nosotros, de manera que esas posibilidades ya las tenemos en algunos de los servicios que usamos ahora.

La Web 3.0 se suele identificar con una mejor relación entre aplicaciones y datos. Por este motivo, algunas de las últimas aplicaciones vinculadas con mapas e informaciones geográficas de los buscadores como Google o Bing se pueden considerar Web 3.0. También la realidad aumentada de los smartphones y tablets o los agregadores de noticias como Flipboard, Zite o Pulse.

PCA: ¿Cuáles son las tecnologías clave para conseguir una Internet verdaderamente inteligente y, brevemente, qué hace cada una? Vemos que se habla mucho de los lenguajes RDF, OWL o SPARCQL.

L.C.: Las tecnologías clave son el lenguaje XML para marcar contenidos, y los lenguajes de metadatos y de representación de la información, como RDF y OWL.

Lluís Codina

PCA: A día de hoy ¿Qué proyectos existen en el campo de la Web Semántica?

L.C.: Hay una página del W3C (el organismo que promueve la WS) que informa de algunos proyectos concretos, pero muchos no se pueden experimentar de forma abierta o fácil. Lo que más se parecería a la WS y que se puede experimentar fácilmente son los sistemas de agregación de datos o el sistema de obtención de respuestas (no de documentos) denominado Wolfram Alpha.

Algunos creemos que actualmente no hay ningún gran servicio de acceso público o acceso abierto que corresponda al 100 por cien con la WS. Hay tecnologías relacionadas, proyectos de laboratorio, prototipos, etc., pequeñas iniciativas que, tal vez más adelante, se harán conocidas, pero nada que el ciudadano normal pueda utilizar como usa hoy en día, por ejemplo, una red social o un correo electrónico y decir, «¡ah!, claro, ahora veo la diferencia». Lo cierto es que no hay nada comparable... todavía.

PCA: ¿Es muy complicado y caro indexar una página de Internet para que pueda ser aprovechada por la tecnología que hace posible la WS?

L.C.: Para páginas de nueva creación, si se configura adecuadamente el sistema de gestión de contenidos, no debería ser más caro. En cambio, reconvertir las páginas anteriores en el caso de sitios con miles o decenas de miles de páginas puede tener un precio prohibitivo, pero depende de cada caso, habría que estudiar cada uno.

PCA: Los avances de los grandes buscadores, sobre todo Google, pero también Yahoo! o Microsoft, serán vitales para el desarrollo de la WS. ¿Hasta qué punto se están implicando estas firmas en el desarrollo de esta materia?

L.C.: No están muy implicadas con el proyecto oficial (el que promueve el W3C), aunque supongo que sí tienen un ojo puesto por si acaso. Naturalmente, sí utilizan tecnologías «sueltas» propias de la WS, como los lenguajes XML y RDF y algunos formatos de metadatos.

Web Semántica defecto 2

PCA: Se dice que la WS o la aplicación de Inteligencia Artificial a Internet supone la revolución 3.0 de la Red. Sin embargo, tenemos la impresión de que todo está en ciernes y de que solo hay pequeñas aventuras académicas y empresariales. ¿Es así? ¿En qué punto estamos de esta evolución y para cuando una Internet realmente inteligente?

L.C.: No se espera para mañana, ni para pasado mañana. Una web inteligente en un sentido apropiado de la palabra no tiene fecha realista. Siempre que se ha dado una fecha, aunque haya sido a veinte años vista, se ha incumplido. En los años 40 se creía que sería en los 60; en los 60 se decía que sería en los 80, y así sucesivamente. Y aún estamos esperando.

PCA: ¿Qué tanto por ciento de Internet puede ser peinado por robots que hagan una lectura inteligente de los datos? Algunas informaciones aseguran que menos de un 5% de las páginas han adoptado RFD.

L.C.: No conozco esas estadísticas, pero me parece realista que solamente haya un porcentaje minúsculo de páginas que incorporen metadatos en RDF o de informaciones expresads en RDF. Por otro lado, tal vez sea suficiente con un porcentaje pequeño. Hay mucha información redundante en la Web, y mucha de interés ridículo, así que puede que un porcentaje pequeño (aunque no sé cuál) sea suficiente.

Otra cosa es saber qué hacen los buscadores generalistas con esos datos codificados en RDF, y parece que no resulta muy diferente a lo que hacen con las páginas que no lo incorporan.

PCA: ¿Cuáles son los obstáculos para que las páginas de Internet migren a la WS? ¿Hay problemas tecnológicos, falta de inversión, falta de estándares…?

L.C.: Varios de los señalados. Una empresa tiene pocos o ningún incentivo a corto plazo para poner contenidos codificados con metadatos del tipo RDF o de algún lenguaje emparentado como RDFa. Pero lo más importante es que no ha llegado todavía ninguna aplicación o tecnología rompedora, como las redes sociales en su momento. El resultado es que falla todo lo demás, empezando por la inversión.

Lo que no faltan, desde luego, son estándares. De hecho, el W3C ha desarrollado una auténtica sopa de letras de estándares, por lo que se ha convertido en un trabajo a tiempo completo seguirlos. Además, no son nada fáciles de entender, por alguna razón les encanta hacerlos muy muy abstractos y crípticos, siguiendo una jerga muy difícil de descifrar, pero esto ya es otra historia.

Web Semántica defecto 3

PCA: Buscadores como Ask.com o Yahoo Answers, donde el usuario hace preguntas con un lenguaje humano, ¿son un paso intermedio entre la Web 2.0 y la 3.0?

L.C.: Se puede considerar que sí. Yo añadiría aquí a Wolfram Alpha.

PCA: ¿Qué tiene que ver el concepto de Linked Open Data con el de WS?

L.C.: Es una derivación realista del proyecto original de la WS, aunque la idea sea más antigua. Como el intento original de hacer una web inteligente ha fracasado, aunque no exista ningún reconocimiento oficial de ello, en los últimos años se ha apostado, de forma muy adecuada a mi entender, por proyectos de iteroperabilidad e interconexión de datos.

Para ello, tienen que diseñarse estándares para que las empresas y organismos que lo deseen, y tengan la posibilidad de hacerlo, puedan poner sus repositorios de datos en un formato que sea interoperable, utilizable y explotable por aplicaciones de terceros.

Creo que es de los mejor que ha dado de sí el proyecto de la WS, junto con el impulso a la investigación en muchos temas clave, como los metadatos y la representación de la información mediante sistemas compartidos, aunque el ciudadano aún no pueda apreciar sus beneficios directos.


Zona de comentarios

<
comments powered by Disqus
2 comentarios

  1. Avatar

    No se dice que "va a reventar" sino "que está a reventar de información" que no es lo mismo. En cuanto a tu comentario sobre lo obsoleto de la información, no se puede aplicar a todo lo que hay en Internet, por la sencilla razón de que hay información que no es caduca en sí misma, por lo tanto, ese criterio de que toda información debe tener un tiempo de vigencia no es aplicable en general.

    botijsa
    01/04/2012

    • votos: 0, karma: +10

  2. Avatar

    En el articulo dice que va a reventar ya lo creo lo que si tendrian que estipular en las redes que todos los articulos publicados tendrian un vencimiento de un año pasado este se tendrian que borrar automaticamente eso deberia figurar en un contrato al publicarse, y estariamos libres de articulos viejos con varios años de antiguedad que ya no sirven para nada.

    elsapocantor
    15/03/2012

    • votos: 1, karma: +5

Si quieres opinar, tienes que estar registrado.

¡Regístrate!Disfruta de todas las ventajas de pertenecer al Club PCA

Y, si ya eres socio, identifícate