Estudio de la planificación de trayectorias en entornos dinámicos para manipuladores industriales mediante aprendizaje por refuerzo

Fidalgo Astorquia, Ignacio

Estudio de la planificación de trayectorias en entornos dinámicos para manipuladores industriales mediante aprendizaje por refuerzo

dc.contributor.advisor	Tellaeche Iglesias, Alberto
dc.contributor.advisor	Vazquez, Juan-Ignacio
dc.contributor.author	Fidalgo Astorquia, Ignacio
dc.contributor.other	Facultad de Ingeniería
dc.date.accessioned	2026-03-18T11:24:12Z
dc.date.available	2026-03-18T11:24:12Z
dc.date.issued	2025-12-19
dc.description.abstract	Esta tesis estudia cómo los robots industriales pueden aprender a planificar sus movimientos de manera más autónoma y eficiente. El trabajo se centra en los manipuladores, que son brazos robóticos diseñados para realizar tareas de precisión en entornos industriales, y explora nuevas formas de generar trayectorias de movimiento que les permitan alcanzar objetivos de manera segura y flexible. A lo largo de la investigación se revisan primero las bases del problema: cómo se describen los movimientos de un robot, qué limitaciones físicas y geométricas condicionan su comportamiento, y qué métodos se han utilizado tradicionalmente para calcular trayectorias. Estos métodos clásicos, aunque probados y fiables, muestran limitaciones cuando se aplican en entornos dinámicos, cambiantes o poco estructurados, como ocurre en la industria moderna. La propuesta de la tesis consiste en aprovechar técnicas de aprendizaje automático que permiten a los robots adquirir experiencia en simulaciones antes de enfrentarse a situaciones reales. De este modo, el robot no depende únicamente de algoritmos programados de antemano, sino que puede aprender a moverse a partir de la práctica acumulada. Para lograrlo, se ha diseñado un proceso que combina entrenamiento en entornos virtuales, incorporación de ejemplos provenientes de métodos tradicionales y una estrategia de aprendizaje progresivo, en la que el robot comienza con tareas sencillas y avanza hacia retos más complejos. Los resultados muestran que este enfoque permite obtener movimientos más consistentes y seguros, que además pueden ejecutarse en robots reales sin necesidad de largos tiempos de ajuste. En las pruebas realizadas, el sistema ha demostrado no solo ser capaz de alcanzar los objetivos planteados, sino también de adaptarse mejor que los métodos clásicos cuando se introducen restricciones adicionales o cuando los objetivos cambian de posición. Las principales aportaciones de la tesis incluyen: una metodología de aprendizaje que acelera la adquisición de habilidades de planificación, un proceso de validación que asegura que las trayectorias aprendidas son seguras y viables en robots reales, y una comparación detallada que evidencia las ventajas de este enfoque frente a los planificadores más utilizados en la industria. Finalmente, se plantean posibles líneas de investigación futura. Entre ellas destacan la posibilidad de transferir el conocimiento adquirido a diferentes robots y entornos sin necesidad de volver a entrenar desde cero, la integración con técnicas de optimización que permitan movimientos aún más precisos, y la exploración de sistemas multimodales en los que convivan distintas estrategias de planificación para aprovechar lo mejor de cada una.	es
dc.identifier.uri	https://hdl.handle.net/20.500.14454/5508
dc.language.iso	spa
dc.publisher	Universidad de Deusto
dc.subject	Ciencias Tecnológicas
dc.subject	Tecnología electrónica
dc.subject	Tecnología de la instrumentación
dc.subject	Tecnología de la automatización
dc.title	Estudio de la planificación de trayectorias en entornos dinámicos para manipuladores industriales mediante aprendizaje por refuerzo	es
dc.type	doctoral thesis

Archivos

Bloque original

Mostrando 1 - 1 de 1

Nombre:: fidalgo_estudio_2025.pdf
Tamaño:: 4.54 MB
Formato:: Adobe Portable Document Format

Descargar

Colecciones

Tesis doctorales