Thesis: Modelo multi-agente basado en aprendizaje reforzado profundo aplicado al problema de predespacho de unidades en sistemas hidrotérmicos
datacite.subject.fos | Engineering and technology::Electrical engineering, Electronic engineering, Information engineering::Electrical and electronic engineering | |
datacite.subject.fos | Natural sciences::Computer and information sciences::Computer sciences | |
datacite.subject.fos | Natural sciences::Mathematics::Applied mathematics | |
datacite.subject.fos | Engineering and technology::Environmental engineering | |
dc.contributor.department | Departamento de Ingeniería Eléctrica | |
dc.contributor.guia | Gil Sagas, Esteban Manuel | |
dc.coverage.spatial | Campus Casa Central Valparaíso | |
dc.creator | Guerra Núñez, Philip Hernán | |
dc.date.accessioned | 2025-01-20T18:45:42Z | |
dc.date.available | 2025-01-20T18:45:42Z | |
dc.date.issued | 2023-08 | |
dc.description.abstract | Este trabajo presenta una metodología para reducir el espacio de soluciones y acelerar los cálculos para el problema de predespacho de unidades (Unit Commitment, UC) en sistemas hidrotérmicos con un horizonte de tiempo de 168 horas badados en programación lineal entera mixta (Mixed-integer linear programming, MILP). La metodología branch-and-bound en problemas de UC basado en MILP enfrenta múltiples desafíos debido al aumento en el ciclaje de unidades a medida que los sistemas eléctricos reducen su huella de carbono. Con la metodología propuesta se mejora el rendimiento de los solvers aplicados al problema UC basado en MILP mediante el uso de cálculos offline y online. El modelo offline entrena un modelo multi-agente basado en aprendizaje reforzado profundo (Multi-agent deep reinforcement learning, MADRL) utilizando datos históricos de operación del sistema eléctrico para predecir el estado de encendido/apagado de unidades térmicas seleccionadas. El modelo online utiliza las soluciones binarias obtenidas por el modelo offline para resolver un problema de UC con un espacio de soluciones reducido. El enfoque multi-agente, basados en redes neuronales artificiales (Artificial Neural Networks, ANN) con una arquitectura de Red Convolucional Temporal (Temporal Convolutional Network, TCN), agrupa unidades que se encuentran en la misma región. Se utiliza una función de recompensa acumulativa compartida para ajustar simultáneamente los diferentes pesos de las ANNs durante la fase de aprendizaje. La efectividad del método propuesto se demuestra utilizando datos reales de operación del sistema eléctrico chileno, logrando tiempos de cálculo significativamente más bajos y un error que se encuentra dentro del margen de integralidad del solver. | es |
dc.description.abstract | This work presents a methodology to reduce the solution space and accelerate computations for the Unit Commitment (UC) problem in hydrothermal systems with a 168-hour time horizon, based on Mixed-Integer Linear Programming (MILP). The branch-and-bound methodology in MILP-based UC problems faces multiple challenges due to increased unit cycling as power systems reduce their carbon footprint. The proposed methodology improves the performance of solvers applied to the MILP-based UC problem through the use of both offline and online computations. The offline model trains a multi-agent model based on deep reinforcement learning (Multi-Agent Deep Reinforcement Learning, MADRL) using historical power system operation data to predict the on/off status of selected thermal units. The online model uses the binary solutions obtained by the offline model to solve a UC problem with a reduced solution space. The multi-agent approach, based on Artificial Neural Networks (ANNs) with a Temporal Convolutional Network (TCN) architecture, groups units located in the same region. A shared cumulative reward function is used to simultaneously adjust the different ANN weights during the learning phase. The effectiveness of the proposed method is demonstrated using real operational data from the Chilean power system, achieving significantly lower computation times and an error within the integrality margin of the solver. | en_US |
dc.description.degree | Magíster en Ciencias de la Ingeniería Eléctrica | |
dc.description.sponsorship | Proyecto Basal FB0008 (AC3E) | |
dc.description.sponsorship | Fondecyt Regular 1231892 | |
dc.driver | info:eu-repo/semantics/masterThesis | |
dc.format.extent | 45 páginas | |
dc.identifier.doi | 10.71959/av9z-k005 | |
dc.identifier.uri | https://cris.usm.cl/handle/123456789/2303 | |
dc.identifier.uri | https://doi.org/10.71959/av9z-k005 | |
dc.language.iso | es | |
dc.publisher | Universidad Técnica Federico Santa María | |
dc.rights | Attribution-NonCommercial 4.0 International | en |
dc.rights.uri | http://creativecommons.org/licenses/by-nc/4.0/ | |
dc.subject | predespacho de unidades | |
dc.subject | programación lineal entera mixta | |
dc.subject | aprendizaje por refuerzo profundo | |
dc.subject | redes neuronales artificiales | |
dc.subject | sistemas hidrotérmicos | |
dc.subject | unit commitment | |
dc.subject | mixed-integer linear programming | |
dc.subject | deep reinforcement learning | |
dc.subject | artificial neural networks | |
dc.subject | hydrothermal systems | |
dc.subject.ods | 7 Energía asequible y no contaminante | |
dc.subject.ods | 9 Industria, innovación e infraestructura | |
dc.subject.ods | 13 Acción por el clima | |
dc.subject.ods | 12 Producción y consumo responsables | |
dc.title | Modelo multi-agente basado en aprendizaje reforzado profundo aplicado al problema de predespacho de unidades en sistemas hidrotérmicos | |
dspace.entity.type | Tesis |