W3C

El W3C expone los datos en la Web con SPARQL

Tecnología potente para consultas distribuidas y diversidad de datos

Contacto para América y Australia --
Ian Jacobs, <ij@w3.org>, +1.718.260.9447 o +1.617.253.2613
Contacto para Europa, África y Oriente Medio --
Marie-Claire Forgue, <mcf@w3.org>, +33.492.38.75.94
Contacto para Asia --
Yasuyuki Hirakawa <chibao@w3.org>, +81.466.49.1170

(También disponible en inglés, francés y japonés. Traducciones en otros idiomas)



http://www.w3.org/ -- 15 Enero 2008 -- El W3C ha anunciado hoy la publicación de SPARQL, la clave estándar para exponer los datos en la Web Semántica. Con la tecnología de consulta SPARQL, pronunciado "sparkle", las personas pueden centrarse en lo que quieren conocer, sin tener en cuenta la tecnología de la base de datos o el formato utilizado para almacenar esos datos. Debido a que las consultas SPARQL expresan objetivos de alto nivel, es fácil extenderlos a orígenes de datos inesperados, o incluso transferirlos a nuevas aplicaciones.

"Pretender usar la Web Semántica sin SPARQL es como pretender usar una base de datos relacional sin SQL," explicó Tim Berners-Lee, Director del W3C. "SPARQL hace posible consultar información desde bases de datos y otros orígenes de datos en sus estados primitivos a través de la Web."

Ya hay 14 implementaciones conocidas de SPARQL, muchas de ellas de código abierto.

SPARQL supera las limitaciones de los lenguajes de consulta tradicionales de búsquedas locales y formatos sencillos

Existen muchos lenguajes de consulta con éxito, incluyendo estándares como SQL y XQuery, que estaban diseñados originariamente para consultas limitadas a un producto, formato, o tipo de información sencillo, en almacén de datos local. Tradicionalmente, ha sido necesario formular las mismas consultas de alto nivel de forma diferente, dependiendo de la aplicación o del convenio específico elegido para la base de datos relacional. Además, en las consultas de varios orígenes de datos ha sido necesario realizar declaraciones lógicas para combinar los resultados. Estas limitaciones han impuesto mayores costes de desarrollo y han creado barreras a la hora de incorporar nuevos orígenes de datos.

El objetivo de la Web Semántica es permitir a las personas compartir, combinar y reutilizar los datos de forma global. SPARQL ha sido diseñado para un uso a escala de la Web, así permite hacer consultas sobre orígenes de datos distribuidos, independientemente del formato. Es más sencillo crear una consulta sencilla a través de diferentes almacenes de datos que crear varias consultas, además de tener un coste menor y de ofrecer unos resultados mejores.

Debido a que SPARQL no está ligado a un formato de base de datos específico, puede ser utilizado para beneficiarse de la nueva ola de los datos de la Web 2.0 y de la composición de estos con otros recursos de la Web Semántica en las aplicaciones. Además, debido a que los orígenes de datos dispares pueden no tener el mismo formato o compartir las mismas propiedades, SPARQL ha sido diseñado para consultar datos que no son uniformes.

SPARQL convierte el acceso a los datos en un Servicio Web

La combinación del lenguaje de consulta y el protocolo SPARQL crea un servicio Web en su sentido más puro; ejecutándose sobre HTTP o SOAP, ofrece un servicio Web estándar para cualquiera que realice una pregunta.

"SPARQL se centra en que consultar los modelos de datos ahorra tiempo para los desarrolladores; no hay necesidad de crear pequeños servicios Web para recuperar diferentes aspectos del estado de un sistema," explicó Lee Feigenbaum, Director del Grupo de Trabajo de Acceso de Datos RDF. "Esto permite al usuario de un 'endpoint' SPARQL preguntar cualquier cuestión -- es como considerar que podrían diseñar su propia interfaz en lugar de tener que trabajar con un conjunto de servicios fijo y limitado."

La especificación de SPARQL define un lenguaje de consulta y un protocolo, y trabaja con el resto de las tecnologías esenciales del W3C de la Web Semántica: Infraestructura de Descripción de Recursos (RDF) para la representación de datos; RDF Schema; Lenguaje de Ontologías Web (OWL) para construcción de vocabularios; y Deducción de Descripciones de Recursos desde Dialectos de Lenguajes (GRDDL), para la extracción automática de datos de la Web Semántica desde documentos. SPARQL también usa otros estándares del W3C existentes en las implementaciones de servicios Web, como Lenguaje de Descripción de Servicios Web (WSDL).

El Grupo de Trabajo del W3C de Acceso a Datos incluye a los líderes en la industria de tecnología de bases de datos y aplicaciones Web

El Grupo de Trabajo de Acceso a Datos RDF del W3C ha producido tres Recomendaciones de SPARQL publicadas hoy: el Lenguaje de Consulta SPARQL para RDF, el Protocolo SPARQL para RDF, y el Formato XML de Resultados de Consultas SPARQL. El Grupo de Trabajo incluye a expertos invitados y participantes de Agfa-Gevaert N. V.; Asemantics S.R.L.; Clark & Parsia LLC; Cleveland Clinic; Eindhoven University of Technology; Free University of Bozen-Bolzano; Garlik; HP; IBM Corporation; Matsushita Electric Industrial Co., Ltd. (MEI); Nippon Telegraph & Telephone Corp. (NTT); OpenLink Software; Oracle; y Profium, Ltd. La página de los testimonios de SPARQL contienen comentarios de apoyo y compromisos de implementación de estas nuevas Recomendaciones.

El W3C continua mejorando la relación entre la Web Semántica y las bases de datos tradicionales; vea el informe del Taller del W3C sobre Acceso RDF a bases de datos relacionales, celebrado en Octubre de 2007.

Sobre el Consorcio World Wide Web [W3C]

El Consorcio World Wide Web (W3C) es un consorcio internacional donde las Organizaciones Miembro, el personal a tiempo completo y el público en general, trabajan conjuntamente para desarrollar estándares Web. El W3C lleva a cabo su misión a través de la creación de estándares Web y pautas diseñadas para garantizar el crecimiento de la Web a largo plazo. Hasta la fecha, más de 400 organizaciones son Miembros del Consorcio. El W3C está gestionado conjuntamente por el Laboratorio de Ciencias de la Computación e Inteligencia Artificial del MIT (MIT CSAIL) en los Estados Unidos, el Consorcio Europeo para la Investigación en Informática y Matemáticas (ERCIM) en Francia y la Universidad de Keio, en Japón, y cuenta, adem├ís con Oficinas en todo el mundo. Para obtener más información visite http://www.w3.org/