Thesis: Representaciones homogéneas, heterogéneas y mixtas para la estimación de potencial fotovoltaico urbano en Santiago
Date
Journal Title
Journal ISSN
Volume Title
Publisher
Abstract
Los inminentes problemas asociados al cambio climático han acelerado los esfuerzos para lograr una pronta transición energética hacia fuentes renovables. Por ende, la estimación precisa y a gran escala del potencial de generación de distintas energías renovables toma una nueva importancia en el proceso de toma de decisiones y políticas públicas. La estimación fotovoltaica sobre las zonas urbanas es particularmente complicada dada la influencia de las oclusiones del sol por edificaciones adyacentes, la disponibilidad incierta de áreas favorables para las instalaciones y la ausencia de datos apropiados públicamente disponibles y confiables. El Ministerio de Energía ha generado una base de datos del potencial fotovoltaico urbano de Santiago, que puede utilizarse para efectos de aprendizaje. Más aún, una segunda base de datos, obtenida desde el Servicio de Impuestos Internos, presenta descriptores de las edificaciones presentes en el territorio nacional, entre otras, el número de pisos o la superficie total construida. Esto permite consolidar una base de datos a nivel de manzana, la cual presenta una lista de edificios con sus respectivos descriptores y el potencial fotovoltaico, en términos del área favorable, de esta. Con estos datos se puede realizar aprendizaje automático para modelar la relación entre las características de las manzanas y su potencial. Esta prometedora aproximación tiene, sin embargo, una dificultad adicional: distintos registros (i.e. manzanas) tienen distinto número de edificaciones, y por ende distinta dimensionalidad. Esto requiere por lo tanto un manejo particular de los datos, los cuales tienen largo variable. En el presente proyecto se propone aprovechar la capacidad de las redes convolucionales uno dimensionales de aprender patrones sobre secuencias de datos para realizar el aprendizaje sobre representaciones secuenciales de los datos disponibles. Más aún, se propone utilizar los datos tanto en la representación habitual "homogénea" (distintas posiciones de la secuencia corresponden a distintas instancias del mismo tipo de dato), como "heterogéneas" (distintas posiciones corresponden a distintos tipos de datos, en nuestro caso, distintos atributos de las edificaciones), como una tercera representación "mixta", inicialmente homogénea seguida de heterogénea. Además, esto permitirá igualmente a la red aprender representaciones convolucionales significativas de los datos. Si bien estas innovadoras representaciones heterogénea y mixta no permiten mejorar significativamente los resultados del estado del arte homogéneo, si se aprecian diferencias en los costos computacionales asociados, siendo la representación heterogénea significativamente menos costosa en tiempos de entrenamiento y predicción que la representación estándar homogénea. Esto se evidencia igualmente en el aprendizaje realizado sobre las representaciones intermedias, donde la representación heterogénea aprendida logra desempeños similares utilizando órdenes de magnitud menos dimensiones que las otras representaciones.
The looming challenges associated with climate change have accelerated efforts to achieve a swift energy transition to renewable sources. Therefore, accurate, large-scale estimation of the generation potential of various renewable energy sources has taken on new importance in the decision-making process and public policy. Photovoltaic potential estimation in urban areas is particularly complex given the influence of solar shading by adjacent buildings, the uncertain availability of suitable areas for installations, and the lack of appropriate, publicly available, and reliable data. The Ministry of Energy has created a database of Santiago's urban photovoltaic potential, which can be used for learning purposes. Furthermore, a second database, obtained from the Internal Revenue Service, presents descriptors of buildings throughout the country, including the number of floors and total built area. This allows for the consolidation of a block-level database, which presents a list of buildings with their respective descriptors and the photovoltaic potential, in terms of the suitable area, of each block. With this data, machine learning can be used to model the relationship between block characteristics and their potential. This promising approach, however, has an additional challenge: different records (i.e., blocks) have different numbers of buildings, and therefore different dimensionality. This necessitates specific data handling, as the data sets vary in length. This project proposes leveraging the ability of one-dimensional convolutional neural networks to learn patterns from data sequences to learn from sequential representations of the available data. Furthermore, it proposes using the data in the usual "homogeneous" representation (different positions in the sequence correspond to different instances of the same data type), as well as "heterogeneous" representations (different positions correspond to different data types, in our case, different building attributes), and a third "mixed" representation, initially homogeneous followed by heterogeneous. This will also allow the network to learn meaningful convolutional representations of the data. While these innovative heterogeneous and mixed representations do not significantly improve upon the results of the homogeneous state-of-the-art model, differences in associated computational costs are noticeable. The heterogeneous representation is significantly less expensive in terms of training and prediction time than the standard homogeneous representation. This is also evident in the learning performed on the intermediate representations, where the learned heterogeneous representation achieves similar performance using orders of magnitude fewer dimensions than the other representations.
