Diseño de un modelo de detección de datos duplicados mediante procesamiento del lenguaje natural para optimizar la eficiencia en la gestión de datos de un laboratorio farmacéutico

Gómez Sánchez, María Doménica; Herrera Herrera, Darío Hernán; Pavón Domínguez, Cristina Elizabeth; Quispe Tirado, Jacqueline Vanessa; Vizcaíno, Paulina (tutor)

Please use this identifier to cite or link to this item: https://repositorio.uide.edu.ec/handle/37000/6514

Title:	Diseño de un modelo de detección de datos duplicados mediante procesamiento del lenguaje natural para optimizar la eficiencia en la gestión de datos de un laboratorio farmacéutico
Authors:	Gómez Sánchez, María Doménica Herrera Herrera, Darío Hernán Pavón Domínguez, Cristina Elizabeth Quispe Tirado, Jacqueline Vanessa Vizcaíno, Paulina (tutor)
Keywords:	MODELO DE DETECCIÓN DE DATOS;LENGUAJE NATURAL;EFICIENCIA;GESTIÓN DE DATOS
Issue Date:	2023
Publisher:	QUITO/UIDE/2023
Citation:	Gómez Sánchez, María Doménica; Herrera Herrera, Darío Hernán; Pavón Domínguez, Cristina Elizabeth; Quispe Tirado, Jacqueline Vanessa. (2023). Diseño de un modelo de detección de datos duplicados mediante procesamiento del lenguaje natural para optimizar la eficiencia en la gestión de datos de un laboratorio farmacéutico. UIDE. Quito. 139 p.
Abstract:	El propÛsito de este proyecto es optimizar el proceso de detecciÛn de datos duplicados y enriquecer la calidad de la informaciÛn en las bases de datos de un Laboratorio FarmacÈutico. Se propone el diseÒo de un modelo de lenguaje natural que verifique autom·ticamente la existencia de duplicados, lo que contribuir· a reducir la acumulaciÛn de informaciÛn errÛnea, asignaciones repetidas de presupuestos y gastos operativos, asÌ como a acelerar el procesamiento y verificaciÛn de datos. El trabajo se organiza en seis capÌtulos. El primero contextualiza el problema, presenta la justificaciÛn, los objetivos y el alcance del proyecto. El segundo capÌtulo proporciona un marco teÛrico detallado que abarca los conceptos clave de NLP, inteligencia artificial y bases de datos. En el tercer capÌtulo se detallan los algoritmos y tÈcnicas avanzadas de inteligencia artificial utilizados. El cuarto capÌtulo aborda el desarrollo y los resultados obtenidos, destacando que el Modelo de Fuzzywuzzy - token sort ratio demostró ser eficaz en la detección exitosa de datos médicos nuevos y duplicados. En el quinto capítulo refleja los resultados esperados tras la implementación del modelo, evidenciando mejoras significativas en la precisión y eficiencia de detección de duplicados, así como en la optimización de recursos y tiempos de procesamiento. El ˙último capítulo concluye que la implementación de este modelo no solo incremento la eficiencia operativa y redujo los riesgos y costos asociados con datos duplicados, sino que también, mejor considerablemente la experiencia del usuario al proporcionar resultados ms precisos y relevantes. La adopción de este modelo de NLP refleja la disposición de la empresa para mantenerse a la vanguardia de la evolución tecnológica, asegurando una gestiÛn de datos m·s efectiva y una toma de decisiones informada en un entorno empresarial din·mico.
URI:	https://repositorio.uide.edu.ec/handle/37000/6514
Appears in Collections:	Tesis - Maestría - Sistemas de Información

Files in This Item:

File	Description	Size	Format
UIDE-Q-TMSIG-2023-12.pdf	TESIS A TEXTO COMPLETO	9.5 MB	Adobe PDF	View/Open

Show full item record