Analysez les ventes d'une librairie avec R ou Python
Analyse des ventes d’une librairie omnicanale avec R ou Python : étude des indicateurs commerciaux et du comportement client en ligne afin de formuler des recommandations stratégiques pour le CODIR.
Mission
En tant que Data Analyst pour la librairie en ligne Lapage, j'ai été chargé de réaliser un bilan complet de l'activité deux ans après le lancement du site e-commerce. La mission consistait à transformer les données de transactions en indicateurs de performance (KPI) pour le comité de direction (CODIR) et à mener une étude approfondie sur le comportement des clients afin d'orienter la stratégie commerciale et marketing.
Comment avez-vous procédé ?
1. Analyse de la performance commerciale : J'ai d'abord structuré l'analyse autour du chiffre d'affaires et de sa dynamique temporelle.
- Dynamique des ventes : Calcul et visualisation de l'évolution du CA à l'aide d'une moyenne mobile pour lisser les variations quotidiennes et identifier les tendances de fond.
- Segmentation Produits : Identification des "Tops" et des "Flops" par catégorie pour optimiser le catalogue.
- Analyse de la concentration : Utilisation de la courbe de Lorenz et de l'indice de Gini pour mesurer la répartition du chiffre d'affaires entre les clients et identifier la dépendance éventuelle aux gros acheteurs (B2B).
2. Étude des comportements clients et corrélations : En collaboration avec l'équipe Business Intelligence, j'ai exploré cinq hypothèses majeures pour comprendre les facteurs influençant les achats :
- Analyse démographique : Étude de l'impact de l'âge et du genre sur les catégories de livres achetés.
- Comportement d'achat : Analyse des liens entre l'âge des clients et leur fréquence d'achat, le montant total dépensé et la taille du panier moyen.
3. Méthodologie Statistique : Pour valider ces corrélations, j'ai appliqué une rigueur scientifique en choisissant les tests statistiques adaptés à la nature des variables :
- Variables quantitatives vs quantitatives : Utilisation du coefficient de corrélation de Pearson ou de Spearman (ex: âge vs montant des achats).
- Variables qualitatives vs qualitatives : Test du Chi-deux ($\chi^2$) pour analyser la dépendance entre le genre et les catégories de livres.
- Variables quantitatives vs qualitatives : Analyse de variance (ANOVA) ou test de Kruskal-Wallis (ex: âge vs catégorie).
4. Synthèse stratégique et Posture de Conseil : Le projet a abouti à un support de présentation de 15 minutes destiné au CODIR. L'enjeu était de vulgariser des concepts techniques complexes (moyenne mobile, p-value, coefficient de corrélation) en recommandations actionnables pour décider de nouvelles offres ou d'ajustements de prix.
Livrables réalisés
- Notebook Jupyter (Python) : Script complet incluant le nettoyage des données, les jointures entre les fichiers clients, produits et ventes, ainsi que tous les calculs statistiques et graphiques.
- Support de présentation stratégique : Rapport synthétique mettant en avant les chiffres clés, les profils clients types et les conclusions sur les corrélations observées. Consultables ici : https://github.com/GaelleHenaf/OC_DA9---Analysez_les_ventes_dune_librairie-avec_Python
Résultats Clés
- Identification des tendances saisonnières via la moyenne mobile.
- Validation statistique de l'influence de l'âge sur certaines catégories de lecture, permettant un ciblage marketing plus précis.
- Mesure précise de la contribution des clients B2B au chiffre d'affaires global.