Geintra

Departamento de electronica

Universidad de Alcala

Líneas de investigación

Accede a información sobre la estructura de la actividad investigadora de Geintra.

Más información

Trabaja con nosotros

Accede a nuestra oferta actual de becas, tesis doctorales, contratos y trabajos fin de carrera.

Más información

Contacta con el grupo

Si desea contactar con nosotros, puede usar varios medios.

Más información

Estudio, implementación y evaluación de un sistema de seguimiento de múltiples locutores usando fusión audiovisual

Título	Estudio, implementación y evaluación de un sistema de seguimiento de múltiples locutores usando fusión audiovisual
Tipo de publicación	Master Thesis
Año de publicación	2010
Thesis Advisor(s)	Marron, M, Macias-Guarasa, J
Autores	Sanabria-Macias, F
Idioma de publicación	Spanish
Institución	University of Alcala
School	Escuela Politecnica Superior
Grado	Máster Universitario en Sistemas Electrónicos Avanzados. Sistemas Inteligentes.
Departamento académico	Department of Electronics
Number of volumes	1 vol.
Páginas	98
Fecha de publicación	09/2010
Palabras clave	Detección de Actividad Acústica, Detección de Rostros, Filtrado de Partículas., fusión audiovisual, Seguimineto de Personas
Lugar de publicación	Alcala de Henares
Resumen	En este trabajo se ha diseñado, implementado y evaluado un sistema de seguimiento de locutor usando fusión audiovisual. La información de audio y vídeo es obtenida a partir de arrays de micrófonos y cámaras de vídeo situados en el entorno. El sistema está compuesto por dos bloques que extraen información de audio y vídeo y esta información es mezclada en un plano de ocupación, paralelo y a una altura ``h'' del suelo. Un filtro de partículas modela la dinámica de dicha mezcla, obteniendose finalmente la localización estimada del locutor en cada instante de tiempo. Como bloque de audio se implementa un algoritmo de detección de actividad acústica por sectores (volúmenes cónicos alrededor de cada array). Posteriormente, se busca en el interior de las intersecciones de los sectores activos de todos los arrays y el plano de ocupación, la región de máxima potencia acústica, usando el algoritmo Steered Response Power. El bloque de visión detecta rostros humanos en las imágenes de las cámaras de video, con una versión multi-pose del algoritmo Viola and Jones. Las proyecciones de dichas detecciones sobre el plano de ocupación, son combinadas con operadociones lógicas. El sistema fue evaluado usando la base de datos AV16.3.
Tipo de trabajo	Master

Adjunto	Tamaño
20100927-TM-Final-FrankSanabria.pdf	1.77 MB

Inicie sesión para enviar comentarios
Google Académico
BibTex
RIS
XML

Geintra © 2008-2024

Nota Legal - Mapa del sitio

Diseño web por Hazhistoria