Estudio de la planificación de trayectorias en entornos dinámicos para manipuladores industriales mediante aprendizaje por refuerzo

dc.contributor.advisorTellaeche Iglesias, Alberto
dc.contributor.advisorVazquez, Juan-Ignacio
dc.contributor.authorFidalgo Astorquia, Ignacio
dc.contributor.otherFacultad de Ingeniería
dc.date.accessioned2026-03-18T11:24:12Z
dc.date.available2026-03-18T11:24:12Z
dc.date.issued2025-12-19
dc.description.abstractEsta tesis estudia cómo los robots industriales pueden aprender a planificar sus movimientos de manera más autónoma y eficiente. El trabajo se centra en los manipuladores, que son brazos robóticos diseñados para realizar tareas de precisión en entornos industriales, y explora nuevas formas de generar trayectorias de movimiento que les permitan alcanzar objetivos de manera segura y flexible. A lo largo de la investigación se revisan primero las bases del problema: cómo se describen los movimientos de un robot, qué limitaciones físicas y geométricas condicionan su comportamiento, y qué métodos se han utilizado tradicionalmente para calcular trayectorias. Estos métodos clásicos, aunque probados y fiables, muestran limitaciones cuando se aplican en entornos dinámicos, cambiantes o poco estructurados, como ocurre en la industria moderna. La propuesta de la tesis consiste en aprovechar técnicas de aprendizaje automático que permiten a los robots adquirir experiencia en simulaciones antes de enfrentarse a situaciones reales. De este modo, el robot no depende únicamente de algoritmos programados de antemano, sino que puede aprender a moverse a partir de la práctica acumulada. Para lograrlo, se ha diseñado un proceso que combina entrenamiento en entornos virtuales, incorporación de ejemplos provenientes de métodos tradicionales y una estrategia de aprendizaje progresivo, en la que el robot comienza con tareas sencillas y avanza hacia retos más complejos. Los resultados muestran que este enfoque permite obtener movimientos más consistentes y seguros, que además pueden ejecutarse en robots reales sin necesidad de largos tiempos de ajuste. En las pruebas realizadas, el sistema ha demostrado no solo ser capaz de alcanzar los objetivos planteados, sino también de adaptarse mejor que los métodos clásicos cuando se introducen restricciones adicionales o cuando los objetivos cambian de posición. Las principales aportaciones de la tesis incluyen: una metodología de aprendizaje que acelera la adquisición de habilidades de planificación, un proceso de validación que asegura que las trayectorias aprendidas son seguras y viables en robots reales, y una comparación detallada que evidencia las ventajas de este enfoque frente a los planificadores más utilizados en la industria. Finalmente, se plantean posibles líneas de investigación futura. Entre ellas destacan la posibilidad de transferir el conocimiento adquirido a diferentes robots y entornos sin necesidad de volver a entrenar desde cero, la integración con técnicas de optimización que permitan movimientos aún más precisos, y la exploración de sistemas multimodales en los que convivan distintas estrategias de planificación para aprovechar lo mejor de cada una.es
dc.identifier.urihttps://hdl.handle.net/20.500.14454/5508
dc.language.isospa
dc.publisherUniversidad de Deusto
dc.subjectCiencias Tecnológicas
dc.subjectTecnología electrónica
dc.subjectTecnología de la instrumentación
dc.subjectTecnología de la automatización
dc.titleEstudio de la planificación de trayectorias en entornos dinámicos para manipuladores industriales mediante aprendizaje por refuerzoes
dc.typedoctoral thesis
Archivos
Bloque original
Mostrando 1 - 1 de 1
Cargando...
Miniatura
Nombre:
fidalgo_estudio_2025.pdf
Tamaño:
4.54 MB
Formato:
Adobe Portable Document Format
Colecciones