Este trabajo presenta un framework para el desarrollo de sistemas activos de reconocimiento de objetos de forma libre. El framework propuesto aborda el problema de incertidumbre presente en los sistemas de reconocimiento de objetos basados en visión monocular mediante un modelo heurístico que permite usar cualquier tipo de vector de características para representar la información de las vistas. De esta manera, se pueden emplear vectores de características que estimen la pose del objeto con mayor precisión que en los tradicionales sistemas estocásticos. La estrategia empleada para el desarrollo del sistema de reconocimiento activo propuesto se basa en agrupar las vistas de los objetos de la base de datos en clusters y, a partir del estudio de la información contenida en ellos, desarrollar de manera eficiente las tareas de clasificación, selección de las posiciones del sensor y el cálculo de la evidencia. El algoritmo de clasificación emplea una máquina de soporte vectorial (SVM) dotando al sistema de reconocimiento de robustez ante pequeñas deformaciones en la apariencia de los objetos por ruido, cambios de iluminación, variaciones en el punto de vista etc. Para la estimación de las posiciones del sensor se utiliza una D-Sphere con el objetivo de reducir la incertidumbre empleando el menor número de movimientos. Además, cada cluster es modelado como una D-Sphere lo que permite de manera off-line evaluar las diferencias de apariencia, entre objetos ambiguos, según el punto de vista desde el que se les observe . Este método ha sido experimentado en un entorno real con un robot manipulador dotado de una webcam en su efector final.
This paper presents a framework for the development of active systems for object recognition. The proposed framework addresses the problem of uncertainty in object recognition based on monocular vision using a heuristic model that allow the implementation of the shape recognition stage by means of feature vectors without stochactic properties (PCA). The strategy employed to develop the proposed active recognition system is based on grouping the views of the objects in the database and clusters. From the study of the information contained in the cluster are efficiently developed the classification task, selection of sensor positions and calculation of the evidence. The classification algorithm uses a support vector machine (SVM) model to provide robustness to small deformations in the appearance of objects by noise, lighting changes, variations in the point of view. The sensor planing stage, which aims to reduce uncertainty using a minimum number of sensor movements, is based on the D-Sphere model. Each cluster is represented by a D-Sphere which allows, in an off-line process, to evaluate the uncertainty between objects hypothesis. This method has been tested in a real environment with a robot equipped with a webcam on the end-effector.
Abdi and Williams, 2010, Borotschnig et al., 1999, Bramao et al., 2011, Campbell and Flynn, 2001, Cristianini and Shawe-Taylor, 2010, Deinzer et al., 2006, Deinzer et al., 2003, Flusser, 2000, González et al., 2012, González et al., 2004, González et al., 2008a, González et al., 2008b, Gremban and Ikeuchi, 1994, Hu, 1962, Janoos, 2006, Kanungo et al., 2002, Kopp-Borotschnig et al., 2000, Kovacic et al., 1998, Kragic and Christensen, 2002, Liu and Tsai, 1990, Rai and Singh, 2010, Roy et al., 2004, Sahack, 1999, Sipe and Casasent, 2002, Steinwart and Christmann, 2008, Springer Publishing Company and Incorporated., 2011, Yuan and Street, 2007, Zahn and Roskies, 1972 and Zitová and Flusser, 2003.