Por favor, use este identificador para citar o enlazar este ítem:
https://repositorio.uide.edu.ec/handle/37000/6514
Título : | Diseño de un modelo de detección de datos duplicados mediante procesamiento del lenguaje natural para optimizar la eficiencia en la gestión de datos de un laboratorio farmacéutico |
Autor : | Gómez Sánchez, María Doménica Herrera Herrera, Darío Hernán Pavón Domínguez, Cristina Elizabeth Quispe Tirado, Jacqueline Vanessa Vizcaíno, Paulina (tutor) |
Palabras clave : | MODELO DE DETECCIÓN DE DATOS;LENGUAJE NATURAL;EFICIENCIA;GESTIÓN DE DATOS |
Fecha de publicación : | 2023 |
Editorial : | QUITO/UIDE/2023 |
Citación : | Gómez Sánchez, María Doménica; Herrera Herrera, Darío Hernán; Pavón Domínguez, Cristina Elizabeth; Quispe Tirado, Jacqueline Vanessa. (2023). Diseño de un modelo de detección de datos duplicados mediante procesamiento del lenguaje natural para optimizar la eficiencia en la gestión de datos de un laboratorio farmacéutico. UIDE. Quito. 139 p. |
Resumen : | El propÛsito de este proyecto es optimizar el proceso de detecciÛn de datos duplicados y enriquecer la calidad de la informaciÛn en las bases de datos de un Laboratorio FarmacÈutico. Se propone el diseÒo de un modelo de lenguaje natural que verifique autom·ticamente la existencia de duplicados, lo que contribuir· a reducir la acumulaciÛn de informaciÛn errÛnea, asignaciones repetidas de presupuestos y gastos operativos, asÌ como a acelerar el procesamiento y verificaciÛn de datos. El trabajo se organiza en seis capÌtulos. El primero contextualiza el problema, presenta la justificaciÛn, los objetivos y el alcance del proyecto. El segundo capÌtulo proporciona un marco teÛrico detallado que abarca los conceptos clave de NLP, inteligencia artificial y bases de datos. En el tercer capÌtulo se detallan los algoritmos y tÈcnicas avanzadas de inteligencia artificial utilizados. El cuarto capÌtulo aborda el desarrollo y los resultados obtenidos, destacando que el Modelo de Fuzzywuzzy - token sort ratio demostró ser eficaz en la detección exitosa de datos médicos nuevos y duplicados. En el quinto capítulo refleja los resultados esperados tras la implementación del modelo, evidenciando mejoras significativas en la precisión y eficiencia de detección de duplicados, así como en la optimización de recursos y tiempos de procesamiento. El ˙último capítulo concluye que la implementación de este modelo no solo incremento la eficiencia operativa y redujo los riesgos y costos asociados con datos duplicados, sino que también, mejor considerablemente la experiencia del usuario al proporcionar resultados ms precisos y relevantes. La adopción de este modelo de NLP refleja la disposición de la empresa para mantenerse a la vanguardia de la evolución tecnológica, asegurando una gestiÛn de datos m·s efectiva y una toma de decisiones informada en un entorno empresarial din·mico. |
URI : | https://repositorio.uide.edu.ec/handle/37000/6514 |
Aparece en las colecciones: | Tesis - Maestría - Sistemas de Información Gerencial |
Ficheros en este ítem:
Fichero | Descripción | Tamaño | Formato | |
---|---|---|---|---|
UIDE-Q-TMSIG-2023-12.pdf | TESIS A TEXTO COMPLETO | 9.5 MB | Adobe PDF | Visualizar/Abrir |
Los ítems de DSpace están protegidos por copyright, con todos los derechos reservados, a menos que se indique lo contrario.