
Por favor, use este identificador para citar o enlazar este ítem:
https://repositorio.uide.edu.ec/handle/37000/7835
Título : | Análisis Comparativo de Algoritmos de Agrupamiento para Identificar Patrones de Opinión en Redes Sociales: Estudio de Tweets en Español |
Autor : | Frank Paladines, Shirley Maribel Garcia Ortiz, Joselin Sofia Pineda Fernandez De Cordova, Pedro José Polanco Franco, Juan Fernando Lopez Alejandro, Cortes (tutor) |
Palabras clave : | AGRUPAMIENTO;DBSCAN;KMEANS;TENDENCIAS TEMÁTICAS |
Fecha de publicación : | 2024 |
Editorial : | QUITO/UIDE/2024 |
Citación : | Frank Paladines, Shirley Maribel; Garcia Ortiz, Joselin Sofia; Pineda Fernandez De Cordova, Pedro José; Polanco Franco, Juan Fernando. (2024). Análisis Comparativo de Algoritmos de Agrupamiento para Identificar Patrones de Opinión en Redes Sociales: Estudio de Tweets en Español. Maestría en Ciencia de Datos y Maquinas de aprendizaje. UIDE. Quito. 91 p. |
Resumen : | Este trabajo presenta un análisis exhaustivo de técnicas de agrupamiento aplicadas a datos textuales, con el objetivo de identificar tendencias temáticas relevantes. Se evaluaron tres algoritmos de clustering (KMeans, DBSCAN y Agglomerative Clustering) en combinación con dos representaciones vectoriales: TF-IDF y Word2Vec. Los resultados muestran que KMeans con Word2Vec sobresale como la metodología más efectiva, logrando clústeres bien definidos con alta cohesión interna y baja superposición. El estudio también identifica limitaciones en la implementación, como el consumo elevado de memoria RAM, y propone pasos futuros para mejorar los resultados, incluyendo la limpieza más profunda del corpus y el uso de algoritmos avanzados. Estas conclusiones son relevantes para aplicaciones como campañas de marketing político, donde la identificación de tendencias temáticas es crucial para la toma de decisiones estratégicas. This study provides a comprehensive analysis of clustering techniques applied to textual data to identify relevant thematic trends. Three clustering algorithms (KMeans, DBSCAN, and Agglomerative Clustering) were evaluated using two vector representations: TF-IDF and Word2Vec. Results indicate that KMeans with Word2Vec outperforms other methods, achieving well-defined clusters with high internal cohesion and low overlap. The study also highlights implementation limitations, such as high memory usage, and suggests future improvements, including deeper corpus cleaning and advanced algorithms. These findings are particularly relevant for applications like political marketing campaigns, where thematic trend identification is critical for strategic decision-making. |
URI : | https://repositorio.uide.edu.ec/handle/37000/7835 |
Aparece en las colecciones: | Tesis - Maestría - en Ciencia de Datos y Máquinas de Aprendizaje |
Ficheros en este ítem:
Fichero | Descripción | Tamaño | Formato | |
---|---|---|---|---|
UIDE-Q-TCDM-2024-04.pdf | TESIS A TEXTO COMPLETO | 2.36 MB | Adobe PDF | Visualizar/Abrir |
Los ítems de DSpace están protegidos por copyright, con todos los derechos reservados, a menos que se indique lo contrario.