Thesis: Redes Generativas Adversarias Hiperbólicas
Date
Authors
Journal Title
Journal ISSN
Volume Title
Publisher
Abstract
Recientemente, los espacios hiperbólicos en el contexto de Deep Learning no euclidiano han ganado popularidad debido a su capacidad para representar datos jerárquicos. Este trabajo propone que es posible aprovechar la característica jerárquica presente en las imágenes mediante el uso de redes neuronales hiperbólicas en arquitecturas de redes generativas adversarias (GAN), lo cual mejorará el proceso de generación. En este estudio, se prueban diferentes configuraciones que utilizan capas hiperbólicas feedforward en las arquitecturas GAN, CGAN y WGAN, en lo que llamamos HGAN, HCGAN y HWGAN, respectivamente. Luego se dispone a utilizar capas neuronales hiperbólicas en la arquitectura StyleGAN2, que es una GAN donde la red generadora se fundamenta en conceptos de transferencia de estilos. El generador de la StyleGAN y StyleGAN2, a diferencia de las otras arquitecturas GAN estándar, consta de dos redes neuronales. Una de ellas es la red de mapeo de estilo f, cuya función es generar una representación vectorial de las características de alto nivel de la imagen. Por ende, se implementa una versión hiperbólica de la red de mapeo para explotar la jerarquía intrínseca de la información de alto nivel de la imagen a generar. En general, la GAN hiperbólica o HGAN depende de cómo estén distribuidas las capas neuronales hiperbólicas en la red y de la curvatura del espacio. De esta forma, para cada arquitectura GAN propuesta se logran mejores resultados en su versión hiperbólica propuesta que en su contraparte euclidiana. Todas las arquitecturas HGAN se miden utilizando las métricas de Inception Score (IS) y Fréchet Inception Distance (FID), y se prueban con el conjunto de datos MNIST para las arquitecturas HGAN, HWGAN y HCGAN, y CIFAR-10 para la arquitectura StyleGAN2 con mapeo hiperbólico.
Recently, hyperbolic spaces in the non‑Euclidean deep learning context have gained popularity due to their ability to represent hierarchical data. In this work, it is proposed that it is possible to take advantage of the hierarchical characteristic present in images by using neural networks with hyperbolic layers in adversarial generative network (GAN) architectures, which improves the generation process. In this study, different configurations using feedforward hyperbolic layers are tested in GAN, CGAN, and WGAN architectures, in what we call HGAN, HCGAN, and HWGAN, respectively. It is then proposed to use hyperbolic neural layers in the StyleGAN2 architecture, a GAN in which the generator network is based on style transfer concepts. The StyleGAN and StyleGAN2 generator, unlike other standard GAN architectures, consists of two neural networks. One of them is the style mapping network f, whose function is to generate a vector representation of the image’s high-level features. Therefore, a hyperbolic version of the mapping network is implemented to exploit the intrinsic hierarchy of the image’s high-level information to be generated. In general, the hyperbolic GAN or HGAN depends on how the hyperbolic neural layers are distributed in the network and on the curvature of the space. In this way, for each proposed GAN architecture, better results are achieved in its hyperbolic version than in its Euclidean counterpart. All HGAN architectures are evaluated using the Inception Score (IS) and Fréchet Inception Distance (FID) metrics, and tested on the MNIST dataset for the HGAN, HWGAN and HCGAN architectures, and on CIFAR‑10 for the StyleGAN2 architecture with hyperbolic mapping.
