
Por favor, use este identificador para citar o enlazar este ítem:
https://repositorio.uide.edu.ec/handle/37000/7839
Título : | Minería de Textos en Resúmenes de Artículos Científicos para Identificar Tendencias de Investigación |
Autor : | Barrionuevo Portero, Jonathan Andrés Guzman Neira, Carlos Luis Molina Miranda, Nicole Lucia Salazar Robles, Diego Fernando Cortés, Alejandro (tutor) Reyes, Iván (tutor) |
Palabras clave : | MINERÍA DE TEXTOS;ARTICULOS CIENTÍFICOS;MODELADO DE TÓPICOS;TURISMO SOSTENIBLE |
Fecha de publicación : | 2024 |
Editorial : | QUITO/UIDE/2024 |
Citación : | Barrionuevo Portero, Jonathan Andrés; Guzman Neira, Carlos Luis; Molina Miranda, Nicole Lucia; Salazar Robles, Diego Fernando. (2024). Minería de Textos en Resúmenes de Artículos Científicos para Identificar Tendencias de Investigación. Maestría en Ciencia de Datos y Maquinas. UIDE. Quito. 92 p. |
Resumen : | El presente estudio pivota sobre la aplicación de técnicas avanzadas de minería de textos para analizar artículos científicos en el ámbito del turismo con la intención de identificar aquellos patrones que pudieran surgir en torno ade los temas de investigación en lo que va del siglo XXI.Dentro de un entorno dockerizado (optimizado para la ejecución de análisis) configurado con herramientas como CUDA, PyTorch y bibliotecas de procesamiento del lenguaje natural (NLP) se desarrolló un cuaderno de Jupyter para realizar la recopilación, preprocesamiento y análisis de resúmenes académicos. Este enfoque permitió identificar temas de relevancia creciente como la sostenibilidad, el turismo inteligente y el análisis de datos, como temas de tendencia dentro del ámbito del turismo, proporcionando una visión integral del panorama investigativo en este campo.La metodología empleada incluye el modelado de temas con Latent Dirichlet Allocation (LDA), que fue utilizado para crear y clasificar los artículos científicos analizados. Asimismo, se realizó un análisis riguroso de métricas como la perplejidad y la coherencia (UMASS y C_V) para optimizar el número de temas y garantizar su coherencia semántica. Este proceso permitió agrupar y etiquetar artículos, identificando patrones clave en el turismo. Adicionalmente, el modelo entrenado, soportado por redes neuronales LSTM, se diseñó con la idea de apoyar la clasificación y al análisis de rasgos temáticos de los artículos revisados, a través de la provisión de un modelo pre-entrenado que permita la identificación de estructuras relevantes en los datos analizados y contribuir al desarrollo de futuros entrenamientos...This study focuses on the application of advanced text mining techniques to analyze scientific articles in the tourism field, aiming to identify patterns in research topics throughout the 21st century.Developed within a dockerized environment configured with tools such as CUDA, PyTorch, and natural language processing (NLP) libraries, a Jupyter notebook was created to perform the collection, preprocessing, and analysis of academic abstracts. This approach identified increasingly relevant topics such as sustainability, smart tourism, and data analytics as trending themes within the tourism field, providing a comprehensive overview of the research landscape in this domain.The methodology includes topic modeling with Latent Dirichlet Allocation (LDA), which was utilized to create and classify the analyzed scientific articles. A rigorous analysisof metrics such as perplexity and coherence (UMASS and C_V) was conducted to optimize the number of topics and ensure semantic consistency. This process enabled the grouping and labeling of articles, identifying key patterns in tourism research. Additionally, the trained model, supported by LSTM neural networks, was designed to assist in the classification and analysis of reviewed articles, providing a pre-trained model that facilitates the identification of relevant patterns in the analyzed data and in future training sessions... |
URI : | https://repositorio.uide.edu.ec/handle/37000/7839 |
Aparece en las colecciones: | Tesis - Maestría - en Ciencia de Datos y Máquinas de Aprendizaje |
Ficheros en este ítem:
Fichero | Descripción | Tamaño | Formato | |
---|---|---|---|---|
UIDE-Q-TCDM-2024-08.pdf | TESIS A TEXTO COMPLETO | 1.82 MB | Adobe PDF | Visualizar/Abrir |
Los ítems de DSpace están protegidos por copyright, con todos los derechos reservados, a menos que se indique lo contrario.