Tesis: Navegación autónoma de un robot de almacén mediante aprendizaje por refuerzo
jose.zh@tuxtla.tecnm.mx Researchgate Scholar Google
Resumen: En este trabajo se propone diseñar y e implementar un algoritmo de control de un robot móvil autónomo, contribuyendo a solucionar hasta un determinado nivel el problema de picking en almacenes. Se considera como base un robot con accionamiento diferencial con actuador para manipular estantes, sistema de energía mediante baterías de litio y sistemas básicos de percepción. Algunos retos importantes en la propuesta, es la actualización de la electrónica de potencia del vehículo en relación con los drivers de los motores e implementación de sensores inteligentes. El sistema será desarrollado en ROS (Robotic Operating System) para controlar el Robot e implementar el algoritmo de navegación. La aportación principal consistirá en el diseño del algoritmo de navegación autónoma, combinando técnicas de aprendizaje por refuerzo, sistemas de percepción redundantes y el conocimiento disponible de su modelo dinámico. Con esto, el robot será capaz de mapear con rapidez, precisión y seguridad su entorno para evitar obstáculos fijos y móviles, adaptándose a cambios en tiempo real en el ambiente sobre el cual se desplaza. El aprendizaje por refuerzo para la navegación autónoma en entornos dinámicos es un proceso en el que se espera que el vehículo aprenda a navegar de forma óptima a partir de la experimentación y retroalimentación. En este proceso se definirá un objetivo o tarea a realizar y se calculará la secuencia de acciones (movimientos) o decisiones que el vehículo debe tomar para alcanzar ese objetivo. Cada acción o decisión es evaluada en tiempo real y se le asigna una recompensa o penalización considerando su impacto en el logro del objetivo. A medida que el vehículo autónomo experimenta y aprende, su comportamiento evolucionará para maximizar las recompensas y minimizar las penalizaciones. Se espera que, con el tiempo, el vehículo autónomo aprenda a tomar decisiones más efectivas, basado en el equilibrio de la explotación y exploración que realiza agente en el proceso de aprendizaje por refuerzo.
Nuestra Ubicación |
Contáctanos |
Siguenos en nuestras Redes Sociales |
---|---|---|
Carretera Panamericana Km. 1080, C.P. 29050, Apartado Postal: 599 |
Copyright © Posgrados en Ciencias en Ingeniería Instituto Tecnológico de Tuxtla Gutiérrez All Rights Reserved