Se presenta un método general para la detección, de forma no invasiva, de la postura corporal de varias personas a partir de la información capturada por múltiples cámaras. Se sigue una filosofía basada en el entrenamiento previo de un modelo articulado y posterior seguimiento. La principal aportación es la posibilidad de detectar varias personas simultáneamente. Se utiliza un modelo articulado para definir las posturas que puede adoptar una persona. Mediante bases de datos de captura de movimiento se selecciona un conjunto de clases o actividades predefinidas. El entrenamiento reduce la complejidad del modelo articulado a partir de técnicas no lineales de reducción de dimensionalidad. Así, las diferentes actividades de una persona quedan definidas de manera compacta por un conjunto de valores de baja dimensionalidad. Posteriormente, un filtro de partículas mixto (estados discretos y continuos) es utilizado para detectar la postura y el tipo de movimiento simultáneamente. Las hipótesis resultantes, seleccionadas automáticamente a partir de la distribución de partículas, son refinadas usando un optimizador no lineal que hace uso de funciones ‘a priori’ del tipo de movimiento entrenado. La propuesta se ha evaluado con un método simple pero estándar, basado en la comparación de volúmenes cilíndricos articulados con volúmenes del cuerpo humano, extraidos automáticamente a partir de las imágenes. Se consigue una precisión cercana a trabajos del estado del arte que no tienen en cuenta a más de una persona y ofrece un marco de trabajo flexible para futuras investigaciones.
This work presents a general framework for tracking simultaneously the body posturas of multiple people from nonintrusive visual sensors. The method is based on a trainingthen-tracking philosophy, with the main addition of being able to handle more than just one person. We train the body postura from labelled motion capture datasets. The training process is based on popular non-linear dimensionality reduction techniques. Then, a mixed, discrete and continuous state particle filter is used to simultaneously detect the postura and the kind of motion performed by each of the human bodies. The resulting hypotheses, automatically selected from the particle distribution, are then refined using non-linear optimization methods with statistical priors. The whole framework is tested using a simple but standard method based on comparing articulated cylindrical models with SfS volumes, taken from several cameras. Our accuracy in public available datasets is near to the state-ofthe-art works that do not take into account multiple people in the problem.
Bartoli et al., 2010, Bernardo et al., 1992, Bottino and Laurentini, 2001, Chu et al., 2003, Doucet, 1997, Gall et al., 2010a, Gall et al., 2009, Gall et al., 2010b, Grochow et al., 2004, Isard and Blake, 1998, Lawrence, 2005, Liu et al., 2011, Marquardt, 1963, Shotton et al., 2011, Sigal et al., 2010, Urtasun, 2006, Wang et al., 2006 and Williams, 1998.