Thesis: Clustering y Diversidad en Sistemas de Recomendación Top-N
Date
Authors
Journal Title
Journal ISSN
Volume Title
Publisher
Abstract
Los sistemas de recomendación ayudan a tomar decisiones frente a grandes volúmenes de información. El filtrado colaborativo (CF), especialmente el user-based CF (UBCF), es una técnica ampliamente usada, aunque enfrenta problemas de escalabilidad en grandes conjuntos de datos. Para mejorar su eficiencia, el enfoque clustering-based CF restringe la búsqueda a grupos de usuarios, pero puede afectar la calidad de las recomendaciones. Esta tesis propone un enfoque híbrido que combina UBCF y clustering-based CF, utilizando una función de distancia basada en prototipos para calcular vecindarios. El método aprovecha la estructura global de los clusters para mejorar la estimación de similitudes entre usuarios y productos. Los experimentos con datos de benchmark muestran que la propuesta es competitiva frente a métodos del estado del arte. Además, se plantean nuevas métricas para evaluar novedad y diversidad, demostrando que el enfoque basado en clustering puede mejorar la diversidad en las recomendaciones.
Recommender systems help users make decisions when faced with large volumes of information. Collaborative filtering (CF), particularly user-based CF (UBCF), is a widely used technique, though it struggles with scalability in large datasets. To improve efficiency, clustering-based CF limits the search to user groups, which can impact recommendation quality. This thesis proposes a hybrid approach that combines UBCF and clustering-based CF by introducing a prototype-based distance function for neighborhood computation. The method leverages the global structure of clusters to enhance similarity estimation between users and items. Experiments using benchmark datasets show that the proposed approach is competitive with state-of-the-art methods. Furthermore, new metrics are introduced to evaluate novelty and diversity, demonstrating that the clustering-based approach can improve recommendation diversity.