W3C

El Consorcio World Wide Web publica SSML 1.0 como Recomendación del W3C

El Habla Sintetizada de Alta Calidad refuerza la Infraestructura de Interfaz del Habla

Contacto para América y Australia --
Karen Myers, <karen@w3.org>, +1.617.253.5884 ó +1.978.502.6218
Contacto para Europa --
Marie-Claire Forgue, <mcf@w3.org>, +33.492.38.75.94
Contacto para Asia --
Yasuyuki Hirakawa <yasuyuki@w3.org>, +81.466.49.1170

(También disponible en francés y japonés)

Hay testimonios disponibles.


http://www.w3.org/ -- 8 de Septiembre de 2004 -- En un esfuerzo por fortalecer la voz de la Web, el Consorcio World Wide Web (W3C) ha publicado el Lenguaje de Marcado de Síntesis del Habla (SSML) 1.0 como Recomendación del W3C. SSML 1.0, una especificación esencial en la Infraestructura de Interfaz del Habla del W3C, mejora la función desempeñada por el habla sintetizada de alta calidad en las interacciones Web. Diseñadores de aplicaciones para telefonía móvil, asistentes digitales personales (PDAs), y un grupo de tecnologías emergentes, usan SSML 1.0 para controlar tanto grano fino como grueso en aspectos importantes del habla sintética, incluyendo pronunciación, volumen y tono. SSML 1.0, al igual que otras Recomendaciones del W3C, VoiceXML 2.0 y la Especificación de Gramática de Reconocimiento del Habla (SRGS), publicada por el Grupo de Trabajo del W3C del Navegador por Voz, está desarrollado para ser integrado con otras tecnologías Web y promover la interoperabilidad a través de diferentes plataformas de síntesis.

"Estoy muy satisfecho con el progreso que el Grupo de Trabajo del Navegador por Voz ha realizado al proporcionar un acceso mejorado a los servicios telefónicos a través del uso de tecnologías Web", declaró Tim Berners-Lee, director del W3C, quien dará un discurso en la Conferencia SpeechTEK. Además añade, "Actualmente, las empresas pueden ofrecer a los usuarios acceso Web a través del teléfono y también a través de ordenadores personales".

La Infraestructura de Interfaz del Habla — una colección de especificaciones para desarrollar aplicaciones de voz para la Web y pensada para los dos millones de teléfonos móviles y líneas telefónicas fijas — permitirá, a un gran número de usuarios, utilizar cualquier teléfono para interactuar con servicios Web a través del teclado, comandos hablados, escucha de habla grabada, habla sintética y música.

Una Recomendación del Consorcio World Wide Web (W3C) es entendida, tanto por la industria como por la comunidad Web en general, como un estándar Web. Cada Recomendación es una especificación estable desarrollada por un Grupo de Trabajo del W3C y revisada por los Miembros del W3C. Las Recomendaciones promocionan la interoperabilidad de las tecnologías Web mediante la comunicación expresa del consenso de la industria construido por el Grupo de Trabajo.

Un vocabulario enriquecido

Uno de los principales retos para fortalecer la voz de la Web y que promueve SSML, es la pronunciación. Por ejemplo, ¿cómo se pronuncia "1/2"? La especificación SSML 1.0, utiliza este simple ejemplo para mostrar algunos de los desafíos que surgen al transformar texto en habla sintetizada con sentido. Sin contexto adicional es muy difícil determinar el significado de ese "1/2". Podría significar "un medio", "el uno de Febrero" o "uno divido por dos". SSML 1.0 elimina este tipo de ambigüedad. El vocabulario SSML permite un control a nivel de palabra, fonema e incluso frecuencia de los datos de salida para satisfacer un amplio grupo de escenarios de aplicación y requisitos de diseño.

"SSML, usando como base los trabajos más actuales realizados en habla sintética, proporciona a los desarrolladores de aplicaciones una herramienta flexible y potente para generar una combinación de alta calidad de habla sintética y grabada, como parte de servicios interactivos de respuesta de voz", señaló Dave Raggett, presidente de la Actividad del W3C sobre navegadores por voz y Miembro W3C de Canon. Además añadió, "SSML permite a aquellos usuarios con problemas auditivos y del habla, acceder a los servicios Web a través de teléfonos con texto. Adicionalmente, SSML no sólo tiene un gran futuro con VoiceXML, si no también con otros estándares que están apareciendo en lo referente a interacción multimodal ".

Al igual que XHTML, SSML es un lenguaje de etiquetado basado en el ampliamente difundido estándar XML. El contenido SSML puede aparecer sólo o ser incluido en otro contenido XML para mejorar su interpretación como habla sintética. Naturalmente, SSML se adapta perfectamente a VoiceXML cuando se utiliza para crear una aplicación de respuesta de voz.

SSML 1.0 también está diseñado para otras formas de integración Web. El Grupo de Trabajo del Navegador por Voz trabajó intensamente con otros grupos del W3C para asegurar que el diseño de SSML 1.0 fuera coherente con los principios de accesibilidad, internacionalización y con la arquitectura en general de la Web. Una aplicación importante de SSML implica "teléfonos con texto", utilizados por usuarios con problemas auditivos. El mismo contenido puede mostrarse también como comandos hablados a través de un teléfono normal. SSML 1.0 es también coherente con trabajos anteriores del W3C en lo referente a la descripción de pronunciación con Hojas de Estilo en Cascada (CSS). El Grupo de Trabajo del W3C está desarrollando un módulo de habla en CSS3 para la representación de documentos XML con motores de habla basados en SSML.

Adopción temprana

El Grupo de Trabajo del W3C ha tenido éxito particularmente a la hora de asegurar la adopción de su especificación antes de ser declarada Recomendación. Una prueba (tratada en el informe de implementación de SSML, de Julio de 2004) ha ayudado a garantizar un comportamiento coherente y de calidad entre las numerosas implementaciones de SSML 1.0. Las empresas que implementaron SSML 1.0 y que están participando en el Grupo de Trabajo son: Aspect Communications, France Telecom, Hewlett-Packard, IBM, Loquendo, Microsoft, MITRE, Nuance Communications, SAP, ScanSoft, Sun Microsystems, VoiceGenie Technologies, Voxeo y Voxpilot.

El Grupo de Trabajo se centrará ahora en lo que queda de la Infraestructura del Habla. "Después de VoiceXML 2.0 y la Especificación de Gramática de Reconocimiento de Voz (SRGS), SSML es el tercer lenguaje de la Infraestructura de Interfaz del Habla del W3C que se convierte en una Recomendación del W3C", dijo Jim Larson, Director de entrada/salida avanzada de datos humanos, para Intel y también uno de los coordinadores del Grupo del Trabajo del Navegador por Voz del W3C. "Estamos trabajando para completar el trabajo en otros lenguajes de la Infraestructura de Interfaz del Habla del W3C, incluyendo VoiceXML 2.1, Interpretación Semántica y el Lenguaje de Marcado Extensible de Controlador Telefónico (CCXML)."

El Grupo de Trabajo está entre los más activos y extensos grupos en el W3C. Entre sus participantes se incluyen: Aspect Communications, BeVocal, Brooktrout Technology, Canon, Comverse Technology, Convedia, Electronic Data Systems, France Telecom, Genesys Telecommunications Laboratories, HeyAnita, Hitachi, Hewlett-Packard, IBM, Intel, IWA-HWG, Korea Association of Information and Telecommunication, Loquendo, Microsoft, MITRE, Mitsubishi Electric, Motorola, Nokia, Nuance Communications, Openstream, SAP, ScanSoft, Siemens, Sun Microsystems, Syntellect, Tellme Networks, Verascape, Vocalocity, VoiceGenie Technologies, Voxeo y Voxpilot.

Sobre el Consorcio World Wide Web (W3C)

El W3C fue creado para guiar la Web hacia su potencial máximo mediante el desarrollo de protocolos comunes que promuevan su evolución y garanticen su interactividad. Se trata de un consorcio de la industria internacional gestionado conjuntamente por el Laboratorio de Ciencia Computacional e Inteligencia Artificial del MIT (MIT CSAIL) en EEUU, el Consorcio Europeo para la Investigación en Informática y Matemáticas (ERCIM) con sede en Francia y la Universidad Keio en Japón. Los Servicios proporcionados por el Consorcio incluyen un almacén de información sobre el World Wide Web para desarrolladores y usuarios, y varios prototipos y aplicaciones de ejemplo para demostrar el uso de estas nuevas tecnologías. Hasta la fecha, cerca de 400 organizaciones son miembros del Consorcio. Para obtener más información visite http://www.w3.org.