DSpace logo

Por favor, use este identificador para citar o enlazar este ítem: https://repositorio.uide.edu.ec/handle/37000/7839
Título : Minería de Textos en Resúmenes de Artículos Científicos para Identificar Tendencias de Investigación
Autor : Barrionuevo Portero, Jonathan Andrés
Guzman Neira, Carlos Luis
Molina Miranda, Nicole Lucia
Salazar Robles, Diego Fernando
Cortés, Alejandro (tutor)
Reyes, Iván (tutor)
Palabras clave : MINERÍA DE TEXTOS;ARTICULOS CIENTÍFICOS;MODELADO DE TÓPICOS;TURISMO SOSTENIBLE
Fecha de publicación : 2024
Editorial : QUITO/UIDE/2024
Citación : Barrionuevo Portero, Jonathan Andrés; Guzman Neira, Carlos Luis; Molina Miranda, Nicole Lucia; Salazar Robles, Diego Fernando. (2024). Minería de Textos en Resúmenes de Artículos Científicos para Identificar Tendencias de Investigación. Maestría en Ciencia de Datos y Maquinas. UIDE. Quito. 92 p.
Resumen : El presente estudio pivota sobre la aplicación de técnicas avanzadas de minería de textos para analizar artículos científicos en el ámbito del turismo con la intención de identificar aquellos patrones que pudieran surgir en torno ade los temas de investigación en lo que va del siglo XXI.Dentro de un entorno dockerizado (optimizado para la ejecución de análisis) configurado con herramientas como CUDA, PyTorch y bibliotecas de procesamiento del lenguaje natural (NLP) se desarrolló un cuaderno de Jupyter para realizar la recopilación, preprocesamiento y análisis de resúmenes académicos. Este enfoque permitió identificar temas de relevancia creciente como la sostenibilidad, el turismo inteligente y el análisis de datos, como temas de tendencia dentro del ámbito del turismo, proporcionando una visión integral del panorama investigativo en este campo.La metodología empleada incluye el modelado de temas con Latent Dirichlet Allocation (LDA), que fue utilizado para crear y clasificar los artículos científicos analizados. Asimismo, se realizó un análisis riguroso de métricas como la perplejidad y la coherencia (UMASS y C_V) para optimizar el número de temas y garantizar su coherencia semántica. Este proceso permitió agrupar y etiquetar artículos, identificando patrones clave en el turismo. Adicionalmente, el modelo entrenado, soportado por redes neuronales LSTM, se diseñó con la idea de apoyar la clasificación y al análisis de rasgos temáticos de los artículos revisados, a través de la provisión de un modelo pre-entrenado que permita la identificación de estructuras relevantes en los datos analizados y contribuir al desarrollo de futuros entrenamientos...This study focuses on the application of advanced text mining techniques to analyze scientific articles in the tourism field, aiming to identify patterns in research topics throughout the 21st century.Developed within a dockerized environment configured with tools such as CUDA, PyTorch, and natural language processing (NLP) libraries, a Jupyter notebook was created to perform the collection, preprocessing, and analysis of academic abstracts. This approach identified increasingly relevant topics such as sustainability, smart tourism, and data analytics as trending themes within the tourism field, providing a comprehensive overview of the research landscape in this domain.The methodology includes topic modeling with Latent Dirichlet Allocation (LDA), which was utilized to create and classify the analyzed scientific articles. A rigorous analysisof metrics such as perplexity and coherence (UMASS and C_V) was conducted to optimize the number of topics and ensure semantic consistency. This process enabled the grouping and labeling of articles, identifying key patterns in tourism research. Additionally, the trained model, supported by LSTM neural networks, was designed to assist in the classification and analysis of reviewed articles, providing a pre-trained model that facilitates the identification of relevant patterns in the analyzed data and in future training sessions...
URI : https://repositorio.uide.edu.ec/handle/37000/7839
Aparece en las colecciones: Tesis - Maestría - en Ciencia de Datos y Máquinas de Aprendizaje

Ficheros en este ítem:
Fichero Descripción Tamaño Formato  
UIDE-Q-TCDM-2024-08.pdfTESIS A TEXTO COMPLETO1.82 MBAdobe PDFVisualizar/Abrir


Los ítems de DSpace están protegidos por copyright, con todos los derechos reservados, a menos que se indique lo contrario.