DSpace logo

Por favor, use este identificador para citar o enlazar este ítem: https://repositorio.uide.edu.ec/handle/37000/7835
Título : Análisis Comparativo de Algoritmos de Agrupamiento para Identificar Patrones de Opinión en Redes Sociales: Estudio de Tweets en Español
Autor : Frank Paladines, Shirley Maribel
Garcia Ortiz, Joselin Sofia
Pineda Fernandez De Cordova, Pedro José
Polanco Franco, Juan Fernando
Lopez Alejandro, Cortes (tutor)
Palabras clave : AGRUPAMIENTO;DBSCAN;KMEANS;TENDENCIAS TEMÁTICAS
Fecha de publicación : 2024
Editorial : QUITO/UIDE/2024
Citación : Frank Paladines, Shirley Maribel; Garcia Ortiz, Joselin Sofia; Pineda Fernandez De Cordova, Pedro José; Polanco Franco, Juan Fernando. (2024). Análisis Comparativo de Algoritmos de Agrupamiento para Identificar Patrones de Opinión en Redes Sociales: Estudio de Tweets en Español. Maestría en Ciencia de Datos y Maquinas de aprendizaje. UIDE. Quito. 91 p.
Resumen : Este trabajo presenta un análisis exhaustivo de técnicas de agrupamiento aplicadas a datos textuales, con el objetivo de identificar tendencias temáticas relevantes. Se evaluaron tres algoritmos de clustering (KMeans, DBSCAN y Agglomerative Clustering) en combinación con dos representaciones vectoriales: TF-IDF y Word2Vec. Los resultados muestran que KMeans con Word2Vec sobresale como la metodología más efectiva, logrando clústeres bien definidos con alta cohesión interna y baja superposición. El estudio también identifica limitaciones en la implementación, como el consumo elevado de memoria RAM, y propone pasos futuros para mejorar los resultados, incluyendo la limpieza más profunda del corpus y el uso de algoritmos avanzados. Estas conclusiones son relevantes para aplicaciones como campañas de marketing político, donde la identificación de tendencias temáticas es crucial para la toma de decisiones estratégicas. This study provides a comprehensive analysis of clustering techniques applied to textual data to identify relevant thematic trends. Three clustering algorithms (KMeans, DBSCAN, and Agglomerative Clustering) were evaluated using two vector representations: TF-IDF and Word2Vec. Results indicate that KMeans with Word2Vec outperforms other methods, achieving well-defined clusters with high internal cohesion and low overlap. The study also highlights implementation limitations, such as high memory usage, and suggests future improvements, including deeper corpus cleaning and advanced algorithms. These findings are particularly relevant for applications like political marketing campaigns, where thematic trend identification is critical for strategic decision-making.
URI : https://repositorio.uide.edu.ec/handle/37000/7835
Aparece en las colecciones: Tesis - Maestría - en Ciencia de Datos y Máquinas de Aprendizaje

Ficheros en este ítem:
Fichero Descripción Tamaño Formato  
UIDE-Q-TCDM-2024-04.pdfTESIS A TEXTO COMPLETO2.36 MBAdobe PDFVisualizar/Abrir


Los ítems de DSpace están protegidos por copyright, con todos los derechos reservados, a menos que se indique lo contrario.