Thesis: Reconocimiento de modelo corporal a través de estímulos táctiles auto-generados en robot humanoide iCub
Date
Authors
Journal Title
Journal ISSN
Volume Title
Publisher
Abstract
El reconocimiento del propio cuerpo a través del sentido del tacto es una habilidad fundamental en seres humanos, pero poco explorada en robótica humanoide. Esta tesis propone un enfoque bioinspirado para que un robot humanoide, específicamente el iCub, construya un modelo de su torso mediante autoexploración táctil utilizando su propio dedo pulgar como efector. Para ello, se hace uso de un algoritmo de meta-aprendizaje basado en plasticidad Hebbiana, optimizado mediante el algoritmo libre de gradientes Evolution Strategies (ES), que permite a redes neuronales aprender dinámicamente reglas de exploración durante el experimento. A su vez, se integra un modelo de superficie mediante Procesos Gaussianos (GP) para estimar la forma del torso y proporcionar una señal de recompensa intrínseca basada en la reducción de incertidumbre del modelo. Los experimentos se realizaron en un entorno simulado con el simulador Gazebo y el middleware YARP, replicando las condiciones del robot físico. Aunque la hipótesis principal no fue confirmada en su totalidad, los resultados obtenidos evidencian las capacidades del enfoque propuesto y permiten identificar mejoras metodológicas para futuras investigaciones, especialmente en la incorporación de información espacial a la señal de recompensa.
Body awareness through touch is a fundamental human ability, but one that remains largely unexplored in humanoid robotics. This thesis proposes a bio-inspired approach for a humanoid robot, specifically the iCub, to construct a model of its torso through tactile self-exploration using its own thumb as an effector. This is achieved using a meta-learning algorithm based on Hebbian plasticity, optimized with the gradient-free Evolution Strategies (ES) algorithm, which allows neural networks to dynamically learn exploration rules during the experiment. A surface model is then integrated using Gaussian Processes (GP) to estimate the torso's shape and provide an intrinsic reward signal based on the model's uncertainty reduction. The experiments were conducted in a simulated environment using the Gazebo simulator and the YARP middleware, replicating the conditions of the physical robot. Although the main hypothesis was not fully confirmed, the results obtained demonstrate the capabilities of the proposed approach and allow for the identification of methodological improvements for future research, especially in the incorporation of spatial information into the reward signal.
