Thesis:
Deep Learning Semi-supervised Strategy for Gamma/Hadron Classification of Imaging Atmospheric Cherenkov Telescope Events

Loading...
Thumbnail Image

Date

2022-07

Journal Title

Journal ISSN

Volume Title

Publisher

Abstract

En este trabajo se exploró una alternativa semi-supervisada de aprendizaje que permitiera al sistema de captación de imágenes de Cherenkov Telescope Array Observatory detectar eventos producidos por rayos gamma y distinguirlos de los —mucho más frecuentes— producidos por protones. Como herramienta, se utilizó una red neuronal convolucional, donde se validó la estrategia de Cyclical Learning Rate, lo que permitió un entrenamiento más rápido. Además, se presentó la oportunidad de estudiar el espacio latente de la red entrenada y correlacionarlo con la estrategia convencional de parámetros de Hillas para, de cierta manera, poder comparar lo que estaba aprendiendo la red en el aspecto de clasificación y analizar si tiene sentido con lo que se conoce del fenómeno físico y sus estudios. Adicionalmente, podemos compararlo con los parámetros físicos de Hillas, lo cual —al ser la estrategia convencional— está bastante validado. Debido a que el observatorio no está disponible aún, solo es posible entrenar los algoritmos con imágenes simuladas, por lo que, una vez que se presenten los datos reales, no hay mucha certeza de cómo se comportarán. Por este motivo, se propone una estrategia semi-supervisada que permite entrenar el modelo con datos simulados y etiquetados para luego mejorar las predicciones del modelo con datos simulados no etiquetados. Esto se considera el trabajo preliminar para una mejor integración de los datos reales. Los resultados muestran que este algoritmo es un atractivo candidato para aprovechar los datos reales no etiquetados. Nuestro modelo fue capaz de seguir aprendiendo a partir de datos nunca antes vistos y de manera no supervisada; sin embargo, debe motivarse la investigación en la integración de los datos reales. Adicionalmente, la exploración del espacio latente indicó que es una metodología atractiva para la exploración de CNN y su relación con los datos, su morfología y la tarea en cuestión.


This work explored a semi-supervised learning alternative that would allow the Cherenkov Telescope Array Observatory's imaging system to detect gamma-ray events and distinguish them from the much more frequent proton events. A convolutional neural network was used as the tool, and the Cyclical Learning Rate strategy was validated, enabling faster training. Furthermore, the opportunity arose to study the latent space of the trained network and correlate it with the conventional Hillas parameter strategy. This allowed for a comparison of the network's classification learning and an analysis of its consistency with existing knowledge of the physical phenomenon and related studies. Additionally, the results can be compared with Hillas' physical parameters, which, being the conventional strategy, are well-validated. Since the observatory is not yet operational, the algorithms can only be trained with simulated images. Therefore, once real data becomes available, there is little certainty about how the algorithms will perform. For this reason, a semi-supervised strategy is proposed that allows the model to be trained with labeled simulated data and then improved with unlabeled simulated data. This is considered preliminary work for better integration with real data. The results show that this algorithm is an attractive candidate for leveraging unlabeled real data. Our model was able to continue learning from previously unseen data in an unsupervised manner; however, further research into real data integration should be encouraged. Additionally, latent space exploration indicated that this is an attractive methodology for exploring CNNs and their relationship to the data, its morphology, and the task at hand.

Description

Keywords

DEEP LEARNING, SELF-SUPERVISED, CHERENKOV, CLASSIFICATION, HIGH-ENERGY ASTRONOMY, CONVOLUTIONAL

Citation