Thesis:
Ajustando la similaridad intra-modal en un entrenamiento cross-modal basado en tripletas

Loading...
Thumbnail Image

Date

2024

Journal Title

Journal ISSN

Volume Title

Publisher

Universidad Técnica Federico Santa María

Abstract

Content-Based Image Retrieval (CBIR) es un técnica que permite ingresar como consulta una imagen, y recuperar las imágenes visualmente más parecidas a la con sulta en una base de datos. Una técnica relaciona es el Cross-modal retrieval (CMR), este permite consultar en una modalidad (ej: texto) y recuperar información en otra modalidad (ej: imágenes). Con el rápido crecimiento del contenido multimedia, CBIR y CMR se han convertido en tecnologías esenciales para construir sistemas de infor mación en varios dominios, como: social networks, online retail, remote sensing , y medicine.


Content-Based Image Retrieval (CBIR) is a technique that allows you to enter an image as a query, and retrieve the images that are most visually similar to the query in a database. A related technique is Cross-modal retrieval (CMR), which allows querying in one modality (e.g. text) and retrieving information in another modality (e.g. images). With the rapid growth of multimedia content, CBIR and CMR have become essential technologies for building information systems in various domains, such as: social networks, online retail, remote sensing, and medicine

Description

Keywords

information retrieval, triplet loss, multimodal

Citation