W3C

El W3C establece un puente entre HTML/Microformatos y la Web Semántica

GRDDL permite la reutilización eficaz y la integración de datos del contenido web

Contacto para América y Australia --
Janet Daly, <janet@w3.org>, +1.617.253.5884 o +1.617.253.2613
Contacto para Europa, África y Oriente Medio --
Marie-Claire Forgue, <mcf@w3.org>, +33.492.38.75.94
Contacto para Asia --
Yasuyuki Hirakawa <chibao@w3.org>, +81.466.49.1170

(También disponible en inglés, francés y japonés. Traducciones en otros idiomas)


http://www.w3.org --11 de septiembre de 2007 -- Hoy, el Consorcio World Wide Web ha establecido un importante nexo de unión entre las comunidades de la Web Semántica y la de los microformatos. Gracias a GRDDL (pronunciado como "griddle"), o "Espigar Descripciones de Recursos de Dialectos de Lenguajes", el software puede extraer de forma automática información de páginas web estructuradas para integrarla en la Web Semántica. Aquellos que normalmente muestran datos estructurados con microformatos en XHTML pueden incrementar el valor de sus datos conectándolos a la Web Semántica, a muy bajo coste.

"A veces, una sola línea de código puede suponer una gran diferencia", comenta Tim Berners-Lee, Director del W3C. "Así como las hojas de estilo hacen que las páginas web sean más fáciles de leer para los usuarios, el GRDDL hace que las páginas web, las etiquetas de microformatos, los documentos XML, y la información, en general, sean más fáciles de leer para las aplicaciones de la Web Semántica, creando nuevas posibilidades y favoreciendo la reutilización creativa de la información."

Introducir datos en la web y extraerlos: ¿cómo se hace en la actualidad?

Un aspecto de los desarrollos recientes que se viene llamando "Web 2.0" incluye aplicaciones basadas en la combinación de varios tipos de datos distribuidos por la Web ("mashups"). Algunas comunidades activas e innovadoras en la Web tienen el objetivo de compartir datos como, por ejemplo, calendarios electrónicos, contactos e información de geoposicionamiento. Estas comunidades han desarrollado diversas tecnologías y prácticas sociales que satisfacen estas necesidades. Por ejemplo, los motores de búsqueda han tenido gran éxito utilizando métodos estadísticos, mientras que la gente que comparte fotos considera útil etiquetar sus fotografías manualmente con etiquetas de texto cortas. La mayor parte de esta labor puede realizarse a través de los "microformatos". Los microformatos son conjuntos de formatos de datos abiertos y simples, desarrollados sobre estándares ya existentes, ampliamente adoptados, incluyendo HTML, CSS y XML.

Esta oleada de actividad se relaciona directamente con la esencia de la Web Semántica. Las comunidades de Web Semántica siempre han intentado mejorar la calidad y la disponibilidad de los datos en la Web, con el fin de dinamizar su integración y de optimizar la diversidad de las aplicaciones, que pueden crecer al mismo ritmo que la Web y permitir mashups aún más eficaces. El conjunto de estándares web compatibles con este trabajo se conoce como la pila de Web Semántica. Las bases de la pila de Web Semántica cumplen los requisitos formales de algunas aplicaciones como la gestión de extractos bancarios o la combinación de volúmenes de datos médicos.

Cada forma distinta de "extraer tus datos" tiene su papel. Pero ¿por qué contentarse sólo con una vía cuando puedes beneficiarte de más de una, y a bajo coste? Dado que los usuarios de microformatos disponen de más usos de los necesarios para la modelación de datos, o validación, ¿cómo pueden beneficiarse de los datos existentes en aplicaciones más formales?

Un puente entre las aplicaciones web flexibles y la Web Semántica

GRDDL es el puente que permite convertir datos expresados en formato XML (como XHTML) en datos de Web Semántica. Con GRDDL, los desarrolladores transforman los datos que desean compartir en un formato que puede ser utilizado y transformado nuevamente para apliciones más rigurosas.

Los Casos de uso de GRDDL ayudan a comprender su utilidad en diferentes escenarios reales como puede ser la organización de reuniones, la comparación de información de diferentes vendedores antes de hacer una compra, y la extracción de información de wikis para facilitar el aprendizaje en línea. Una vez que los datos son parte de la Web Semántica, pueden ser combinados con otros datos (por ejemplo, desde una base de datos relacional) para la realización de búsquedas, inferencias y conversiones a otros formatos.

El Grupo de Trabajo ha realizado un informe acerca de su implementación, y Miembros del W3C han declarado su apoyo a GRDDL adoptando una serie de compromisos de implementación tanto en sitios web como en sus productos.

Los Casos de uso de GRDDL, que también se publican hoy, describen casos de uso de los agentes de software con soporte para GRDDL. Este Grupo de Trabajo ha desarrollado, también, un servicio GRDDL que le permite al usuario introducir un archivo GRDDL y extraer los datos importantes.

Sobre el Consorcio World Wide Web [W3C]

El Consorcio World Wide Web (W3C) es un consorcio internacional donde las Organizaciones Miembro, el personal a tiempo completo y el público en general, trabajan conjuntamente para desarrollar estándares Web. El W3C lleva a cabo su misión a través de la creación de estándares Web y pautas diseñadas para garantizar el crecimiento de la Web a largo plazo. Hasta la fecha, más de 400 organizaciones son Miembros del Consorcio. El W3C está gestionado conjuntamente por el Laboratorio de Ciencias de la Computación e Inteligencia Artificial del MIT (MIT CSAIL) en los Estados Unidos, el Consorcio Europeo para la Investigación en Informática y Matemáticas (ERCIM) en Francia y la Universidad de Keio, en Japón. Y cuenta con numerosas Oficinas en todo el mundo. Para obtener más información visite http://www.w3.org/