tecnologia

A Peruvian machine learning model for E-commerce product matching in South America, Spain and Portugal

2025

Descarga

El rápido crecimiento del comercio electrónico en América Latina, impulsado por el aumento de la adopción digital entre las generaciones más jóvenes y acelerado por la pandemia de COVID-19, ha transformado la forma en que las empresas interactúan con los consumidores. Solo en Perú, el número de compradores en línea aumentó en un 131 % entre 2019 y 2021. Sin embargo, la falta de un identificador global estandarizado de productos continúa dificultando la comparación de productos entre plataformas, debilitando el Momento Cero de la Verdad (ZMOT) y reduciendo la capacidad de los consumidores para tomar decisiones informadas de compra. Para abordar este desafío, este estudio propone un modelo de clasificación de productos multimodal que combina procesamiento de lenguaje natural y análisis de imágenes para identificar y emparejar productos similares en tiendas minoristas en línea. El modelo aprovecha incrustaciones textuales y características visuales para superar las inconsistencias en las descripciones y nombres de productos, particularmente en el mercado peruano. Se recopiló un conjunto de datos de listados de productos locales, utilizado para entrenar y evaluar múltiples clasificadores, alcanzando el modelo XGBoost una precisión del 92,7 % y una puntuación F1 del 93,6 %. Más allá del rendimiento local, el modelo fue probado en otros mercados sudamericanos, incluidos Argentina, Brasil, Chile y Colombia, demostrando robustez frente a diferencias lingüísticas y culturales. El sistema propuesto permite una mejor búsqueda de productos, comparación de precios y monitoreo de la competencia, ofreciendo beneficios prácticos tanto para consumidores como para empresas. En última instancia, este trabajo contribuye al avance de la infraestructura del comercio electrónico en los mercados emergentes y apoya una toma de decisiones más informada y eficiente en diversos ecosistemas minoristas.

Copyright 2019 - Centro de Investigación de la Universidad del Pacífico