DSpace logo

Please use this identifier to cite or link to this item: https://repositorio.uide.edu.ec/handle/37000/4662
Title: Análisis del comportamiento de clientesen empresas e-commerce, mendiante el desarrollo de un modelo distribuido de clustering utilizando la plataforma databricks community edition con pyspark
Authors: Avalos Serrano, Irina
Keywords: APRENDIZAJE AUTOMÁTICO;SEGMENTACIÓN;PYSPARK;COMERCIO ELECTRÓNICO
Issue Date: 2021
Publisher: QUITO/UIDE/2021
Citation: Avalos Serrano, Irina. (2021). Análisis del comportamiento de clientesen empresas e-commerce, mendiante el desarrollo de un modelo distribuido de clustering utilizando la plataforma databricks community edition con pyspark. Facultad de Ciencias de la Seguridad y Gestión de Riesgos. UIDE. Quito. 89p.
Abstract: El crecimiento constante del comercio electrónico ha hecho que muchas empresas se enfrenten al manejo y análisis de una gran cantidad de datos, que les permita tomar decisiones oportunas para ser más competitivas, aplicando estrategias basadas en las preferencias del cliente. Este proyecto se enfoca en la segmentación de productos de una empresa minorista de e-commerce, donde se identifican las características de los productos preferidos por los usuarios. Se ha utilizado la metodología CRISP-DM, como guía para el desarrollo del modelo, la misma que consta de seis etapas iterativas que son: Comprensión del Negocio, Comprensión de los Datos, Preparación de los Datos, Modelado, Evaluación y Despliegue. Se desarrollaron tres modelos distribuidos de segmentación, utilizando el componente MLlib de PySpark, paralos algoritmos:K-means, Bisecting k-means y Gaussian Mixture. Como resultado se obtuvieron cuatro segmentos: Diamante, Oro, Plata y Bronce de acuerdo con la cantidad de likes y precio del producto. The continued increase of e-commerce has made many companies face the management and analysis of big data, which allows them to make timely decisions to be more competitive, applying strategies based on customers preferences. This project focuses on the segmentation of products of an e-commerce retail company, for identified the best characteristics of the products preferred. CRISP-DM methodology has been used as a guide for the development of the model, which consists of six iterative steps: Understanding Business, Understanding Data, Data Preparation, Modeling, Evaluation and Deployment. Three distributed segmentation models were developed, using theMLlib component of PySpark, for the algorithms: K-means, Bisecting k-means and Gaussian Mixture. As a result, they were found four segments: Diamond, Gold, Silver and Bronze according to the number of likes and price of the product.
URI: https://repositorio.uide.edu.ec/handle/37000/4662
Appears in Collections:Maestría-Gestión de Riesgos y Emergencias

Files in This Item:
File Description SizeFormat 
T-UIDE-0167.pdfCONFIDENCIAL267.04 kBAdobe PDFView/Open


Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.