Geintra

Departamento de electronica Universidad de Alcala

Líneas de investigación

Accede a información sobre la estructura de la actividad investigadora de Geintra.

Trabaja con nosotros

Accede a nuestra oferta actual de becas, tesis doctorales, contratos y trabajos fin de carrera.

Contacta con el grupo

Si desea contactar con nosotros, puede usar varios medios.

    Estudio, implementación y evaluación de un sistema de seguimiento de múltiples locutores usando fusión audiovisual

    TítuloEstudio, implementación y evaluación de un sistema de seguimiento de múltiples locutores usando fusión audiovisual
    Tipo de publicaciónMaster Thesis
    Año de publicación2010
    Thesis Advisor(s)Marron, M, Macias-Guarasa, J
    AutoresSanabria-Macias, F
    Idioma de publicaciónSpanish
    Institución

    University of Alcala

    School

    Escuela Politecnica Superior

    Grado

    Máster Universitario en Sistemas Electrónicos Avanzados. Sistemas Inteligentes.

    Departamento académicoDepartment of Electronics
    Number of volumes1 vol.
    Páginas98
    Fecha de publicación09/2010
    Palabras claveDetección de Actividad Acústica, Detección de Rostros, Filtrado de Partículas., fusión audiovisual, Seguimineto de Personas
    Lugar de publicaciónAlcala de Henares
    Resumen

    En este trabajo se ha diseñado, implementado y evaluado un sistema de seguimiento de locutor usando fusión audiovisual. La información de audio y vídeo es obtenida a partir de arrays de micrófonos y cámaras de vídeo situados en el entorno. El sistema está compuesto por dos bloques que extraen información de audio y vídeo y esta información es mezclada en un plano de ocupación, paralelo y a una altura ``h'' del suelo. Un filtro de partículas modela la dinámica de dicha mezcla, obteniendose finalmente la localización estimada del locutor en cada instante de tiempo. Como bloque de audio se implementa un algoritmo de detección de actividad acústica por sectores (volúmenes cónicos alrededor de cada array). Posteriormente, se busca en el interior de las intersecciones de los sectores activos de todos los arrays y el plano de ocupación, la región de máxima potencia acústica, usando el algoritmo Steered Response Power. El bloque de visión detecta rostros humanos en las imágenes de las cámaras de video, con una versión multi-pose del algoritmo Viola and Jones. Las proyecciones de dichas detecciones sobre el plano de ocupación, son combinadas con operadociones lógicas. El sistema fue evaluado usando la base de datos AV16.3.

    Tipo de trabajoMaster
    AdjuntoTamaño
    20100927-TM-Final-FrankSanabria.pdf1.77 MB