DSpace logo

Please use this identifier to cite or link to this item: https://repositorio.uide.edu.ec/handle/37000/7839
Full metadata record
DC FieldValueLanguage
dc.contributor.authorBarrionuevo Portero, Jonathan Andrés-
dc.contributor.authorGuzman Neira, Carlos Luis-
dc.contributor.authorMolina Miranda, Nicole Lucia-
dc.contributor.authorSalazar Robles, Diego Fernando-
dc.contributor.authorCortés, Alejandro (tutor)-
dc.contributor.authorReyes, Iván (tutor)-
dc.date.accessioned2025-02-06T19:16:47Z-
dc.date.available2025-02-06T19:16:47Z-
dc.date.issued2024-
dc.identifier.citationBarrionuevo Portero, Jonathan Andrés; Guzman Neira, Carlos Luis; Molina Miranda, Nicole Lucia; Salazar Robles, Diego Fernando. (2024). Minería de Textos en Resúmenes de Artículos Científicos para Identificar Tendencias de Investigación. Maestría en Ciencia de Datos y Maquinas. UIDE. Quito. 92 p.es
dc.identifier.otherUIDE-Q-TCDM-2024-08-
dc.identifier.urihttps://repositorio.uide.edu.ec/handle/37000/7839-
dc.description.abstractEl presente estudio pivota sobre la aplicación de técnicas avanzadas de minería de textos para analizar artículos científicos en el ámbito del turismo con la intención de identificar aquellos patrones que pudieran surgir en torno ade los temas de investigación en lo que va del siglo XXI.Dentro de un entorno dockerizado (optimizado para la ejecución de análisis) configurado con herramientas como CUDA, PyTorch y bibliotecas de procesamiento del lenguaje natural (NLP) se desarrolló un cuaderno de Jupyter para realizar la recopilación, preprocesamiento y análisis de resúmenes académicos. Este enfoque permitió identificar temas de relevancia creciente como la sostenibilidad, el turismo inteligente y el análisis de datos, como temas de tendencia dentro del ámbito del turismo, proporcionando una visión integral del panorama investigativo en este campo.La metodología empleada incluye el modelado de temas con Latent Dirichlet Allocation (LDA), que fue utilizado para crear y clasificar los artículos científicos analizados. Asimismo, se realizó un análisis riguroso de métricas como la perplejidad y la coherencia (UMASS y C_V) para optimizar el número de temas y garantizar su coherencia semántica. Este proceso permitió agrupar y etiquetar artículos, identificando patrones clave en el turismo. Adicionalmente, el modelo entrenado, soportado por redes neuronales LSTM, se diseñó con la idea de apoyar la clasificación y al análisis de rasgos temáticos de los artículos revisados, a través de la provisión de un modelo pre-entrenado que permita la identificación de estructuras relevantes en los datos analizados y contribuir al desarrollo de futuros entrenamientos...This study focuses on the application of advanced text mining techniques to analyze scientific articles in the tourism field, aiming to identify patterns in research topics throughout the 21st century.Developed within a dockerized environment configured with tools such as CUDA, PyTorch, and natural language processing (NLP) libraries, a Jupyter notebook was created to perform the collection, preprocessing, and analysis of academic abstracts. This approach identified increasingly relevant topics such as sustainability, smart tourism, and data analytics as trending themes within the tourism field, providing a comprehensive overview of the research landscape in this domain.The methodology includes topic modeling with Latent Dirichlet Allocation (LDA), which was utilized to create and classify the analyzed scientific articles. A rigorous analysisof metrics such as perplexity and coherence (UMASS and C_V) was conducted to optimize the number of topics and ensure semantic consistency. This process enabled the grouping and labeling of articles, identifying key patterns in tourism research. Additionally, the trained model, supported by LSTM neural networks, was designed to assist in the classification and analysis of reviewed articles, providing a pre-trained model that facilitates the identification of relevant patterns in the analyzed data and in future training sessions...es
dc.language.isoeses
dc.publisherQUITO/UIDE/2024es
dc.rightsopenAccesses
dc.subjectMINERÍA DE TEXTOSes
dc.subjectARTICULOS CIENTÍFICOSes
dc.subjectMODELADO DE TÓPICOSes
dc.subjectTURISMO SOSTENIBLEes
dc.titleMinería de Textos en Resúmenes de Artículos Científicos para Identificar Tendencias de Investigaciónes
dc.typeThesises
Appears in Collections:Tesis - Maestría - en Ciencia de Datos y Máquinas de Aprendizaje

Files in This Item:
File Description SizeFormat 
UIDE-Q-TCDM-2024-08.pdfTESIS A TEXTO COMPLETO1.82 MBAdobe PDFView/Open


Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.