DSpace logo

Por favor, use este identificador para citar o enlazar este ítem: https://repositorio.uide.edu.ec/handle/37000/4662
Título : Análisis del comportamiento de clientesen empresas e-commerce, mendiante el desarrollo de un modelo distribuido de clustering utilizando la plataforma databricks community edition con pyspark
Autor : Avalos Serrano, Irina
Palabras clave : APRENDIZAJE AUTOMÁTICO;SEGMENTACIÓN;PYSPARK;COMERCIO ELECTRÓNICO
Fecha de publicación : 2021
Editorial : QUITO/UIDE/2021
Citación : Avalos Serrano, Irina. (2021). Análisis del comportamiento de clientesen empresas e-commerce, mendiante el desarrollo de un modelo distribuido de clustering utilizando la plataforma databricks community edition con pyspark. Facultad de Ciencias de la Seguridad y Gestión de Riesgos. UIDE. Quito. 89p.
Resumen : El crecimiento constante del comercio electrónico ha hecho que muchas empresas se enfrenten al manejo y análisis de una gran cantidad de datos, que les permita tomar decisiones oportunas para ser más competitivas, aplicando estrategias basadas en las preferencias del cliente. Este proyecto se enfoca en la segmentación de productos de una empresa minorista de e-commerce, donde se identifican las características de los productos preferidos por los usuarios. Se ha utilizado la metodología CRISP-DM, como guía para el desarrollo del modelo, la misma que consta de seis etapas iterativas que son: Comprensión del Negocio, Comprensión de los Datos, Preparación de los Datos, Modelado, Evaluación y Despliegue. Se desarrollaron tres modelos distribuidos de segmentación, utilizando el componente MLlib de PySpark, paralos algoritmos:K-means, Bisecting k-means y Gaussian Mixture. Como resultado se obtuvieron cuatro segmentos: Diamante, Oro, Plata y Bronce de acuerdo con la cantidad de likes y precio del producto. The continued increase of e-commerce has made many companies face the management and analysis of big data, which allows them to make timely decisions to be more competitive, applying strategies based on customers preferences. This project focuses on the segmentation of products of an e-commerce retail company, for identified the best characteristics of the products preferred. CRISP-DM methodology has been used as a guide for the development of the model, which consists of six iterative steps: Understanding Business, Understanding Data, Data Preparation, Modeling, Evaluation and Deployment. Three distributed segmentation models were developed, using theMLlib component of PySpark, for the algorithms: K-means, Bisecting k-means and Gaussian Mixture. As a result, they were found four segments: Diamond, Gold, Silver and Bronze according to the number of likes and price of the product.
URI : https://repositorio.uide.edu.ec/handle/37000/4662
Aparece en las colecciones: Maestría-Gestión de Riesgos y Emergencias

Ficheros en este ítem:
Fichero Descripción Tamaño Formato  
T-UIDE-0167.pdfCONFIDENCIAL267.04 kBAdobe PDFVisualizar/Abrir


Los ítems de DSpace están protegidos por copyright, con todos los derechos reservados, a menos que se indique lo contrario.