A cargo del Dr. Rubén San Segundo Hernández. Universidad Politécnica de Madrid.
Presentación
En esta charla se describe la realización y los principales resultados del proyecto que tiene como título: Desarrollo de un sistema de traducción de voz a lengua de signos española para un servicio público de atención personal Exp Nº: PAV-070000-2007-567. Este proyecto ha sido financiado por el Plan Avanza y la Fundación ONCE.
Tendrá lugar el miércoles 25 de noviembre de 2009, a las 18:00 en la sala de grados de la Escuela Politécnica Superior de la Universidad de Alcalá:
Conferencia
El objetivo principal de este proyecto ha sido el diseño, desarrollo y evaluación de un sistema avanzado de comunicación entre una persona oyente y una persona sorda. Este sistema está formado por dos módulos principales:
- Un módulo de traducción de voz a LSE (Lengua de Signos Española). Este módulo está formado por un reconocedor de voz (que decodifica la señal de voz en palabras), un sistema de traducción entre lenguas (que traduce la secuencia de palabras obtenidas del reconocedor en una secuencia de signos especificados en glosas), y finalmente, un sistema de representación de signos basado en un agente animado virtual.
- Un módulo capaz de generar voz en español a partir de una secuencia de signos especificada en alguno de los estándares de signo-escritura existentes. Este módulo también está formado por tres submódulos: una interfaz visual avanzada donde las personas sordas pueden especificar una secuencia de signos, un sistema capaz de traducir una secuencia de signos en una secuencia de palabras en Español, y finalmente, un sistema de conversión de texto a voz para generar la voz en Español.
El sistema avanzado de comunicación desarrollado se ha diseñado para dos dominios de aplicación concretos: renovación del Documento Nacional de Identidad (DNI) y renovación del carné de conducir.
Para la implementación del sistema de traducción entre lenguas se han desarrollado y combinado varias estrategias de traducción:
- Traducción basada en ejemplos
- Traducción basada en reglas de experto
- Traducción estadística.
Durante la presentación se mostrarán los trabajos y algunos de los experimentos realizados en el desarrollo del módulo de traducción.
Los principales resultados del proyecto han sido los siguientes:
- Una arquitectura software de traducción de voz a LSE y viceversa.
- Dos demostradores que permiten la traducción de voz a LSE aplicados a traducir las frases de un funcionario en servicios públicos de atención personal.
- Dos demostradores que permiten la traducción de LSE escrita a voz aplicados a traducir las preguntas que un usuario sordo podría realizar en los servicios públicos considerados.
- Un entorno de edición para la generación de signos con un agente animado. Dicho entorno permite la traducción de un signo (representado en alguno de los estándares de signo-escritura considerados) a los movimientos del agente animado. Este entorno incorpora un sistema de conversión entre los dos estándares de signoescritura: SEA (Sistema de Escritura Alfabética) y HamNoSys (estándar propuesto desde la Universidad de Hamburgo)
Los principales contenidos multimedia generados:
- Un corpus paralelo con las frases en castellano y su traducción en LSE. Además se incluyen vídeos grabados para cada una de las frases con el fin de especificar los signos concretos en LSE.
- Generación de una base de datos de contenidos multimedia con las descripciones, características, significado y animación de los signos correspondientes a los servicios públicos de atención abordados en este proyecto: renovación del DNI y del carné de conducir.
Resumen del historial de Rubén San Segundo Hernández:
Rubén San-Segundo es Ingeniero de Telecomunicación por la Universidad Politécnica de Madrid desde 1997 y Doctor Ingeniero por esta misma Universidad desde 2002 (Sobresaliente Cum Laude). Desde 1997 hasta 2001, Rubén estuvo becado por el Ministerio de Educación (beca FPU) para realizar su tesis doctoral en el Grupo de Tecnología del Habla (GTH). Durante este tiempo, su labor de investigación estuvo centrada el reconocimiento automático del habla, estimación de medidas de confianza, comprensión de lenguaje natural, y el diseño del gestor de diálogo para aplicaciones de voz.
Durante 1999 y 2000, Rubén hizo dos estancias de verano en el Center of Spoken Language Research (CSLR) en la Universidad de Colorado (Boulder), como estudiante visitante. Durante estas estancias, trabajó en la obtención de medidas de confianza en el sistema CU Communicator
Desde septiembre de 2001 hasta febrero de 2003, Rubén trabajó en la División de Tecnología del Habla de Telefónica I+D. Durante este período, trabajó en la estimación de confianza para reconocimiento de voz, modelado acústico, y participó en el diseño de varios servicios.
Desde marzo de 2003 a marzo de 2004, Rubén trabajó en el Departamento de Sistemas Electrónicos y Control en la EUITT de UPM.
Actualmente, Rubén es profesor en el Departamento de Ingeniería Electrónica en ETSIT de UPM y es miembro del Grupo de Tecnología del Habla. Rubén es coordinador de la Red Temática en Tecnologías del Habla e ISCA Liaison representative en el SIG-IL (Grupo Especial de Interés en Lenguas Ibéricas). Actualmente, su labor investigadora se centra en el diseño y desarrollo de sistemas de traducción de voz a LSE y viceversa.