21/02/2026

KNIME Analytics Platform (ETL & Workflow) Tableau Software Excel/CSV

Analysez des indicateurs de l'égalité femmes/hommes en respect du RGPD

Automatisation d’un diagnostic d’égalité femmes-hommes via KNIME : préparation et anonymisation des données RH (RGPD), calcul d’indicateurs clés, génération d’un fichier exploitable et présentation du score avec recommandations stratégiques.

Mission

En tant que Data Analyst pour un cabinet de conseil de 150 salariés, j'ai été chargé d'automatiser le calcul et le diagnostic de l'index d'égalité femmes-hommes. La mission consistait à transformer des données brutes issues du SIRH en un rapport transparent et conforme, destiné à être présenté en plénière. L'enjeu majeur était de construire un processus industriel et reproductible tout en garantissant une anonymisation stricte des données personnelles conformément au RGPD.


Comment avez-vous procédé ?

1. Collecte et sécurisation des données (Conformité RGPD) : La première étape a consisté à importer les fichiers RH fragmentés dans KNIME. Pour respecter les principes de minimisation et de protection des données du RGPD, j'ai mis en place un filtrage rigoureux : suppression des données inutiles (état civil, nombre d'enfants) et anonymisation des identifiants salariés. J'ai veillé à ce que la finalité de la collecte soit strictement limitée au diagnostic de l'égalité professionnelle.

2. Construction du Workflow ETL sous KNIME : J'ai développé un workflow complet pour automatiser la préparation des données :

  • Nettoyage : Gestion des doublons, des valeurs manquantes et des valeurs aberrantes.
  • Agrégation et Calculs : Harmonisation des salaires en équivalent temps plein (ETP) pour permettre une comparaison juste entre les sexes.
  • Standardisation : Export d'un fichier .csv parfaitement structuré, prêt pour une exploitation ultérieure dans des outils comme Tableau Software.

3. Analyse des indicateurs clés (Diagnostic) : J'ai sélectionné et généré des visualisations pour les indicateurs majeurs de l'index, notamment :

  • L'écart de rémunération moyenne (révélant un écart de 2% en défaveur des femmes).
  • Les taux d'augmentations (8% d'écart en faveur des femmes) et de promotions.
  • Le taux de retour de congé maternité (100% de conformité sur les augmentations dues).
  • La parité dans les dix plus hautes rémunérations (7 hommes pour 3 femmes).

4. Synthèse et Recommandations stratégiques : Le projet a abouti à un score global de l'index de 88/100. Malgré une performance solide, j'ai formulé des recommandations concrètes pour le CODIR, telles que le renforcement de la mixité dans les postes de direction et un suivi plus fin des grilles salariales par service pour réduire les derniers écarts résiduels.


Livrables réalisés

  • Workflow KNIME (.knwf) : Un processus automatisé, commenté et documenté pour une reproduction annuelle sans erreur technique.
  • Fichier de données préparé (.csv) : Base de données propre, anonymisée et prête à l'emploi.
  • Support de présentation (PDF/Gamma) : Présentation pédagogique de 15 slides vulgarisant la méthodologie data-driven et exposant les résultats de manière transparente pour l'ensemble des collaborateurs. Consultables ici : https://github.com/GaelleHenaf/OC_DA8---Analyse_de_lindex_degalite_professionnelle_F_H_avec_KNIME

Résultats Clés

  • Automatisation complète du calcul de l'index annuel.
  • Garantie de conformité réglementaire (RGPD) sur l'ensemble de la chaîne de traitement.
  • Score d'entreprise de 88/100 avec un plan d'action ciblé pour atteindre l'équité totale.

Made with and by Gaëlle.