• Document: SIMULACIÓN DE LA NAVEGACIÓN DE LOS ROBOTS MÓVILES MEDIANTE ALGORITMOS DE APRENDIZAJE POR REFUERZO PARA FINES DOCENTES.
  • Size: 371.98 KB
  • Uploaded: 2019-02-13 22:05:33
  • Status: Successfully converted


Some snippets from your converted document:

TCA2013 1 SIMULACIÓN DE LA NAVEGACIÓN DE LOS ROBOTS MÓVILES MEDIANTE ALGORITMOS DE APRENDIZAJE POR REFUERZO PARA FINES DOCENTES. Autor: Armando Plasencia Salgueiro Instituto de Cibernética, Matemática y Física (ICIMAF), Agencia de Energía Nuclear (AENTA). Calle 15 N0 551 e/ C y D, Vedado, Plaza de la Revolución, Ciudad de La Habana, Cuba, teléfono 832-0319 C.E.: armando@icimaf.cu Resumen— Como apoyo al curso de “Aprendizaje automático” fundamental en la navegación de los robots móviles. Estos de la Maestría de Cibernética Aplicada se propone una práctica deberán ser capaces de adaptar sus habilidades de forma que de laboratorio sobre Aprendizaje por refuerzo, consistente en la puedan reaccionar adecuadamente en un medio externo simulación de la navegación de un robot utilizando el algoritmo complejo, desconocido y dinámico. Un buen método para de Q-learning. Para ello se brinda la concepción, los fundamentos alcanzar este objetivo es el aprendizaje por refuerzo (RL) teóricos del aprendizaje por refuerzo y se propone la simulación del Robot RICIMAF desarrollado en el Instituto de Cibernética, debido a que no es necesario el conocimiento completo del Matemática y Física con un simulador de Robótica. Así se logra entorno y permite al robot aprender en línea. una mejor comprensión del tema de Aprendizaje por refuerzo El aprendizaje automático es un término tomado del estudio durante la docencia del curso. del aprendizaje de los animales y también está relacionado con la teoría de los autómatas de aprendizaje de control automático. El aprendizaje automático puede ser utilizado para Palabras Clave — Robótica, aprendizaje por refuerzo, conocer las salidas desconocidas deseadas al dotar a los robots algoritmo Q-learning, práctica de laboratorio. autónomos de una evaluación adecuada de su accionamiento y también puede ser utilizado para realizar el aprendizaje en línea de los robots. El aprendizaje en línea y la adaptación son I. INTRODUCCIÓN características deseables para cualquier algoritmo de En la Maestría “Cibernética Aplicada”, mención Minería de aprendizaje de un robot que opera en entornos cambiantes y no Datos, se imparte el curso “Aprendizaje Automático”. Uno de estructurados donde los robots exploran su entorno para los temas a impartir es el de los algoritmos de Aprendizaje por recolectar suficientes ejemplos y adquirir la experiencia refuerzo, sin embargo, a pesar de su fácil comprensión necesaria. En un medio exterior complejo, este requiere intuitiva, se hace difícil el que los fundamentos de los mismos realizar un aprendizaje en línea mediante la interacción con el sean asimilados en su concepción teórica y práctica por mundo real. carecer de una práctica de laboratorio que permita diseñar y En este artículo se describirán los fundamentos y la ejecutar los mismos en un ejemplo práctico. Las búsquedas metodología para la práctica de laboratorio consistente en el realizadas en Internet de prácticas en cursos similares no han desarrollo de una red neuronal basada en una arquitectura de arrojado resultados satisfactorios. aprendizaje por refuerzo y su aplicación para el aprendizaje de Una de las aplicaciones más generalizadas de los algoritmos la evasión de obstáculos. La estructura del artículo es la de aprendizaje por refuerzo es la navegación de robots móviles siguiente, primero se dan los fundamentos y la concepción del autónomos. Si bien es cierto que la navegación de robots aprendizaje por refuerzo, posteriormente se describe la reales con el empleo de estos algoritmos es un proceso costoso arquitectura de una red neuronal de aprendizaje por refuerzo por la necesidad de realizar muchas iteraciones para obtener (RLNN) y la tarea de evasión de obstáculos basada en esa una salida adecuada existen las herramientas de simulación arquitectura. Finalmente se proponen las herramientas para adecuadas que permiten ejecutar estos algoritmos con realizar la simulación y los resultados esperados acorde con la resultados cercanos a los reales y

Recently converted files (publicly available):