Devenez un Expert Data Analyst certifié en 6 mois et transformez les données en décisions stratégiques !
Maîtrisez Excel Avancé, Power BI, SQL, R, Stata et Python – les outils les plus recherchés du marché.
3 mois de formation intensive + 3 mois de stage pratique à distance pour faire de vous un professionnel complet, capable d’analyser, modéliser et valoriser les données comme un véritable expert.
3. Section “Le problème”
Aujourd’hui, les entreprises croulent sous les données, mais manquent cruellement de profils capables de les transformer en informations exploitables.
– Les décideurs recherchent des experts en data analysis capables de donner du sens aux chiffres, d’optimiser les performances et d’orienter les stratégies.
– Pourtant, la majorité des candidats ne maîtrisent pas les bons outils ni les approches modernes d’analyse.
4. Section “La solution : la formation Expert Data Analyst”
Nous avons conçu une formation pratique, progressive et certifiante pour vous permettre de :
-
Dominer les outils d’analyse les plus puissants : Excel Avancé, Power BI, SQL, R, Stata, Python ;
-
Construire des tableaux de bord automatisés et des rapports dynamiques ;
-
Analyser des bases de données massives et en tirer des insights clairs ;
-
Répondre efficacement aux besoins réels des entreprises (finance, santé, marketing, ONG, etc.) ;
-
Développer une carrière internationale dans l’un des métiers les plus porteurs du numérique.

Ce que vous aller apprendre:
-
Maîtriser les fondamentaux de l’analyse de données
Comprendre en profondeur les concepts clés : types de données, techniques de nettoyage, préparation, structuration et visualisation. Vous saurez transformer des données brutes en informations exploitables. -
Utiliser avec aisance les outils d’analyse les plus puissants
Devenez opérationnel sur Excel avancé, Power BI, SQL, R, Stata et Python, les logiciels incontournables pour manipuler, visualiser et interpréter efficacement les données dans un cadre professionnel. -
Développer une véritable expertise statistique
Apprenez à appliquer les méthodes d’analyse statistique pour identifier des tendances, établir des corrélations, et produire des insights à forte valeur ajoutée pour la prise de décision. -
Transformer les données en décisions stratégiques
Découvrez comment formuler des recommandations concrètes issues de vos analyses afin d’éclairer les choix stratégiques des dirigeants et décideurs. -
Comprendre les enjeux du Big Data
Initiez-vous aux défis et opportunités liés à la gestion de grandes volumétries de données, et découvrez les approches modernes d’analyse à l’ère du Big Data. -
Interpréter et communiquer efficacement les résultats
Développez vos compétences en storytelling data pour présenter des résultats clairs, visuels et convaincants, même à des audiences non techniques. -
Découvrir l’analyse prédictive et la modélisation
Apprenez à anticiper les tendances futures grâce aux techniques de modélisation statistique et d’analyse prédictive appliquées à des cas réels. -
Promouvoir une culture “data-driven” dans votre organisation
Devenez un acteur du changement en favorisant la prise de décision basée sur les données, et contribuez à instaurer une culture de l’analyse et de la performance dans votre entreprise.
- LE PUBLIC CIBLE
Les personnes ayant les profils suivants peuvent prendre part à la formation :
- Les mathématiciens, les Chercheurs, Statisticiens, économistes et Sociologues ;
- Les Planificateurs, Responsables et Charger de suivi et évaluation ;
- Les professionnels œuvrant dans les domaines d’études, de recherche, d’analyse de données, d’enquêtes ou des sondages intéressés par ces compétences ;
- Les Responsables de cabinet de sondage ou d’enquête en quête de nouvel outil de collecte d’informations
- Les étudiants et les sans-emplois ;
- Les responsables commerciaux
- Toute autre personne œuvrant dans la collecte des données
- Méthodologie
Notre méthodologie repose sur une approche participative, pratique et interactive. Cet atelier associe des présentations sur PowerPoint combinées aux exercices pratiques courte permettant une application immédiate des différents modules dans un premier temps. Ces applications séquentielles seront suivies d’études de cas qui seront traités individuellement ou en groupe pour permettre aux participant(e)s de poser des questions et ainsi, favoriser le partage d’expériences entre l’ensemble des acteurs.
Matériel
Les participants doivent posséder un Ordinateur Portable ou de Bureau avec les
Configuration recommandée : Processeur rapide (Intel i5 ou supérieur), au moins 8 Go de RAM, un disque SSD de préférence.
Systèmes d’exploitation : Windows, macOS, ou Linux selon les outils utilisés.
Logiciels installés (les logiciels seront fournis par le cabinet) : Excel, R, Python, SQL, Power BI, statat
- LES MODULES DE LA FORMATION
Première section : Excel appliquer data analyse
Introduction
- Qu’est-ce que la Data analyse ?
- Les outils disponibles pour la data analyse
- La pertinence d’Excel dans un contexte Big data
Module 1 : Remise à niveau sur Excel
Module 2 : Préparation à l’analyse
- Introduction à l’exploration de données
- Définition des colonnes
- Se poser des questions sur le jeu de données
- Corrections
Module 4 : Statistique descriptive
- Préparation des données – énoncé
- Préparation des données – Corrections
Module 5 : Analyse univariée des variables
- Les types de variables
- Les valeurs extrêmes
- Les valeurs manquantes
- Le mode
- La moyenne et la médiane
- Les quartiles
- Les indicateurs de dispersions
- Faire un récapitulatif global d’une colonne
- Le plugin analysis toolpack
- Analyse des variables qualitatives
Module 6 : Exploration de données
- Les filtres
- Les tris
- Les mises en forme conditionnelles
- Astuce : les filtres avancés
Module 7 : Les corrélations –
- Le concept de corrélation
- Le coefficient de corrélation
- Analyse de corrélation dans Excel
- Les matrices de corrélation
- Corrections exercice
Module 8 : Le data Modeling
- Utilisation de fonctions imbriquées
- Les différents types de fonctions
- Les fonctions de manipulations de texte
- Les fonctions de manipulations de dates
- Les fonctions conditionnelles
- Les fonctions de recherche
- Les fonctions de gestion des erreurs
Module 9 : Le rapport de corrélation
- Le concept de rapport de corrélation
- Calculer le rapport de corrélation
- Corrections exercice
Module 10 : Travaux pratique : analyse de données d’une entreprise
Deuxième section : Power BI
Introduction
- Installation de Power BI Desktop
- Informations concernant les bases de données
- Avant de commencer la formation
Module 1 : Transformer et nettoyer vos données à l’aide de Microsoft Power Query : partie
- Introduction à Microsoft Power Query
- Mes premières transformations de données
- Remplir des cellules vides
- Pivoter des colonnes
- Séparer des données de mes colonnes
- Combiner des colonnes à l’aide de conditions
- La suppression rapide de colonnes
- Combiner des bases de données
- Ordonner des dates
- Trouver l’année de naissance
- Classification des âges par groupe
Module 2 : Transformer et nettoyer vos données à l’aide de Microsoft Power Query : partie
- La séparation de données contenant des virgules
- Nouvelle source versus entrer des données
- Combiner plusieurs fichiers Excel
- Contrôler la qualité de mes données
- Changer la source des données
- Créer des colonnes à l’aide d’une suite logique
- Les colonnes conditionnelles versus la fonction de remplacement des valeurs
- Utiliser la référence versus la duplication d’une base de données
- Importation d’une base Excel sur SQL Server puis Power BI
- Déterminer la provenance des données
- Un exemple de web scraping (importation de données depuis un site internet)
Module 3 : Le langage DAX dans Microsoft Power BI : première partie
- Introduction et définition DAX
- Mesures versus colonnes calculées
- Le contexte de filtre dans DAX : première partie
- Le contexte de filtre dans DAX : deuxième partie
- La fonction Calculate : première partie
- La fonction Calculate : deuxième partie
- La fonction SUM et SUMX
- La fonction Sameperiodlastyear dans DAX
Module 4 : Le langage DAX dans Microsoft Power BI : seconde partie
Les fonctions « time intelligence » : première partie
Les fonctions « time intelligence » : deuxième partie
La fonction Previousmonth
La fonction RANKX : première partie
La fonction RANKX : deuxième partie
La fonction Keepfilters
La fonction Summarize
Les variables dans DAX
La fonction Selectedvalue : première partie
La fonction Selectedvalue : deuxième partie
Les moyennes mobiles dans DAX
La fonction AVERAGE et AVERAGEX
Module 5 : La création de visuels dans Microsoft Power BI Desktop
- La création de visuels dans Microsoft Power BI Desktop
- Construction d’un premier visuel dans Power BI
- Mon premier tableau dans Power BI
- Les différences entre tables et matrices
- Quelques modifications sur un visuel de type Matrice : Partie 1
- modifications sur un visuel de type Matrice : Partie 2
- Quelques modifications sur un visuel de type Matrice : Partie 3
- Mise en forme conditionnelle dans Power BI : partie 1
- Mise en forme conditionnelle dans Power BI : partie 2
Module 6 : La création de visuels complexes dans Power BI Desktop
- Mon Histogramme complexe sur Power BI : Partie 1
- Mon Histogramme complexe sur Power BI : Partie 2
- Mon Histogramme complexe sur Power BI : Partie 3
- Mon graphique en courbe sur Power BI
- La création d’un visuel « vignette »
- Le visuel carte du monde sur Power BI : paramètre
- Le visuel carte du monde sur Power BI
- le visuel « jauge » sur Power BI
- Segmentation de mes visuels dans Power BI
- Quelques éléments supplémentaires sur les visuels dans Power BI
- Aide pour choisir son type de visuel
- Le marché des visuels dans Microsoft Power BI
Module 7 : Introduction à Microsoft Power BI Service
- Informations concernant les bases de données et les vidéos
- Introduction à Microsoft Power BI Service
- Les tarifs des différentes versions
- La création d’un compte Microsoft Power BI Service
- La publication de votre premier rapport dans le service de Power BI
- Les premières fonctionnalités dans Power BI Service
- La création d’un tableau de bord
- La planification d’une actualisation dans Microsoft Power BI Service
- Actualisation d’un fichier Excel dans Microsoft Power BI Service
- Les droits des utilisateurs et la sécurité dans Microsoft Power BI Service
- Partager un rapport dans Microsoft Power BI Service
- Importer un rapport sur un site WordPress
- Création d’un rapport Powerpoint dans Microsoft Power BI Service
- Ajouter des restrictions dans vos rapports
- Le concept de Dataset dans Microsoft Power BI Service
- Le concept de Dataflux dans Microsoft Power BI Service partie 1
- Le concept de Dataflux dans Microsoft Power BI Service partie 2
- La création d’une application dans Microsoft Power BI Service
- Automatiser le partage à l’aide de la création d’une newsletter
- Les différents rôles dans un espace de travail
Module 8 : Travaux pratiques
Troisième section : SQL
Module 1 : Introduction au SQL et aux bases de données
- Comprendre les bases de SQL : Définir ce qu’est le SQL, explorer son histoire, son importance sur le marché de l’emploi, et comparer SQL avec NoSQL.
- Évaluation des connaissances : Quiz sur les concepts d’introduction au SQL.
Module 2 : Installation et découverte de l’environnement de travail
- Installer les environnements SQL : Apprendre les différences entre SQL Server, MySQL et PostgreSQL, et résoudre les erreurs d’installation.
- Découverte des outils : Introduction à la base de données AdventureWorks, installation de l’environnement de travail, et présentation de PG Admin.
- Évaluation des connaissances : Quiz sur l’installation et la découverte de l’environnement.
Module 3 : Les bases du langage SQL
- Maîtriser les requêtes de base : Utilisation des commandes SELECT, SELECT DISTINCT, WHERE, ORDER BY, LIMIT, GROUP BY, HAVING, et les expressions conditionnelles.
- Pratique intensive : Exercices pratiques sur les différentes commandes et filtres SQL.
- Évaluation des connaissances : Quiz sur les concepts appris.
Module 4 : Les jointures (JOIN)
- Comprendre les jointures : Apprendre les différents types de jointures (INNER JOIN, LEFT JOIN, RIGHT JOIN, OUTER JOIN, SELF JOIN).
- Pratique des jointures : Exercices pratiques pour chaque type de jointure.
- Évaluation des connaissances : Quiz sur les jointures.
Module 5 : Conception de base de données
- Principes de base de la conception : Introduction aux clés primaires et étrangères, formes normales et normalisation.
- Typologies et types de données : Apprendre les typologies de bases de données relationnelles et les types de données possibles.
- Création et manipulation de bases de données : Créer des bases de données, des tables, ajouter des contraintes, insérer, modifier et supprimer des données.
- Évaluation des connaissances : Quiz sur la conception de base de données.
Module 6 : Les fonctions
- Utilisation des fonctions : Introduction aux fonctions SQL (texte, numériques, dates, JSON) et expressions régulières (Regex).
- Pratique des fonctions : Exercices pratiques sur l’utilisation des différentes fonctions.
- Évaluation des connaissances : Quiz sur les fonctions SQL.
Module 7 : Les sous-requêtes et les vues
- Maîtriser les sous-requêtes et les vues : Apprendre à utiliser les sous-requêtes simples et corrélées, et les vues.
- Pratique des sous-requêtes et vues : Exercices pratiques pour maîtriser ces concepts.
- Évaluation des connaissances : Quiz sur les sous-requêtes et les vues.
Module 8 : Les fonctionnalités avancées
- Optimisation et gestion avancée : Utilisation de l’indexation pour l’optimisation, procédures stockées, triggers, gestion des droits d’accès, et transactions ACID.
- Pratique avancée : Exercices pratiques sur les procédures, triggers et gestion des droits.
- Évaluation des connaissances : Quiz sur les fonctionnalités avancées.
Module 9 : SQL et Python
- Intégration avec Python : Introduction à Python, utilisation de Notebooks Python, exécution de requêtes SQL, visualisation de données et manipulation avec Pandas.
- Pratique de l’intégration : Exercices pratiques sur l’intégration de SQL et Python.
Module 10 : Découverte de la solution Cloud Big Query
- Exploration des solutions cloud : Comprendre les solutions cloud, introduction à Big Query, import et analyse de données avec Big Query, création de dashboards Looker.
Quatrième section : Programmation R
Module 1 : Introduction à la Programmation R
- Présentation de la formation : Introduction aux objectifs et à la structure de la formation.
- Installation de R et RStudio : Guide pour télécharger et installer R et RStudio, et découverte de l’interface de RStudio.
- Présentation du projet : Aperçu du projet final que les participants réaliseront.
Module 2 : Traitement des Données et Manipulations Avancées
- Importer des données : Apprendre à importer des données dans R, avec des astuces pour simplifier le processus.
- Manipulation des données : Modifier les noms de colonnes, le contenu des cellules, traiter les valeurs manquantes, et recoder les variables qualitatives et quantitatives.
- Prétraitement des données : Vérification finale des données avant les analyses ultérieures.
Module 3 : Statistiques pour l’Analyse de Données
- Calculs statistiques de base : Apprendre à calculer les effectifs, fréquences, pourcentages, moyennes, médianes, quartiles, minimums, maximums, variances et écarts-types.
Module 4 : Visualisation Avancée des Données (DataViz)
- Introduction à la Data Visualization : Concepts de base et importance de la visualisation des données.
- Création de graphiques : Produire des diagrammes à barres, diagrammes circulaires, boîtes à moustaches, histogrammes, et graphiques croisés pour comparer les variables.
Module 5 : Réaliser des Tests d’Hypothèses / Tests Statistiques
- Introduction aux tests d’hypothèses : Concepts et importance des tests statistiques.
- Tests spécifiques : Apprendre et pratiquer le test du Khi-Deux, le test de Shapiro-Wilk, le test de Mann-Whitney, et le test de Student.
Module 6 : Data Science : Appliquer un Algorithme de Machine Learning
- Introduction à la régression logistique : Concepts de base et applications pratiques.
- Création et optimisation de modèles : Séparation des données en jeux d’entraînement et de test, création et optimisation du modèle de régression logistique, et faire des prédictions.
- Évaluation des performances : Utiliser des matrices de confusion, analyser les performances avec le test de Hosmer et Lemeshow et la courbe ROC.
Module 7 : Conclusion, Conseils, Remerciements et Bonus
- Synthèse de la formation : Résumer les points clés abordés durant la formation et fournir des conseils pour la suite.
- Bonus : Exporter le code R en différents formats (HTML, Word, PDF) pour faciliter le partage et la documentation des analyses.
Travaux pratique
Cinquième section : STATA
Introduction
Introduire les participants à STATA et aux concepts de base de l’analyse de données.
Module 1 : Mise en route
- L’interface de Stata : Familiariser les participants avec l’interface utilisateur de STATA.
- Utilisation de l’aide dans Stata : Apprendre à utiliser les ressources d’aide intégrées dans STATA pour résoudre les problèmes.
- Syntaxe des commandes : Comprendre la syntaxe de base des commandes STATA.
- Fichiers .do et .ado : Apprendre à créer et utiliser des fichiers de commandes (.do) et des programmes (.ado) dans STATA.
- Fichiers journaux : Savoir comment générer et gérer des fichiers journaux pour documenter les sessions d’analyse.
- Importer des données : Maîtriser les différentes méthodes d’importation de données dans STATA.
Module 3 : Exploration des données
- Visualisation des données brutes : Savoir afficher et examiner les données importées.
- Description et résumé : Apprendre à décrire et résumer les données avec des statistiques descriptives.
- Tabulation et tableaux : Utiliser des tableaux pour organiser et examiner les données.
- Valeurs manquantes : Identifier et gérer les valeurs manquantes dans les jeux de données.
- Analyse numérique de la distribution : Analyser la distribution des variables.
- Utilisation des pondérations : Apprendre à utiliser des pondérations dans les analyses.
Module 4 : Manipulation des données
- Recodage d’une variable existante : Modifier les valeurs des variables existantes.
- Création de nouvelles variables, remplacement d’anciennes variables : Générer de nouvelles variables et remplacer les anciennes.
- Nommer et étiqueter les variables : Apprendre à nommer et étiqueter correctement les variables.
- Extensions pour générer : Utiliser des extensions pour la génération de variables complexes.
- Variables indicatrices : Créer et utiliser des variables indicatrices.
- Conserver et supprimer des données/variables : Savoir comment conserver ou supprimer des parties spécifiques des données.
- Sauvegarde des données : Apprendre à sauvegarder les jeux de données après les modifications.
- Conversion de données sous forme de chaînes de caractères : Convertir des données en format texte et inversement.
- Combinaison de données : Fusionner différentes sources de données.
- Utiliser efficacement les macros et les boucles : Automatiser les tâches répétitives avec des macros et des boucles.
- Accès aux informations stockées : Accéder et utiliser les informations stockées dans les jeux de données.
- Boucles multiples : Apprendre à utiliser des boucles imbriquées pour des manipulations complexes.
- Variables de date : Travailler avec des variables de date dans STATA.
- L’indice sur les groupes : Appliquer des opérations par groupes dans les données.
Module 5 : Visualisation des données
- Graphiques dans Stata : Créer et personnaliser différents types de graphiques.
- Graphiques en barres et en points : Utiliser des graphiques en barres et en points pour représenter les données.
- Graphiques de distribution : Représenter graphiquement la distribution des données.
- Diagrammes à secteurs : Créer des diagrammes circulaires.
- Lignes de meilleur ajustement : Ajouter des lignes de tendance aux graphiques.
- Représentation graphique de fonctions personnalisées : Visualiser des fonctions personnalisées.
- Graphiques en courbes de niveau : Créer des graphiques en courbes de niveau et analyser les interactions.
- Données de gigue dans les diagrammes de dispersion : Ajouter des jittres pour améliorer la lisibilité des diagrammes de dispersion.
- Graphiques en tournesol : Utiliser des graphiques en tournesol pour représenter les données.
- Combinaison de graphiques : Combiner plusieurs types de graphiques.
- Modification de la taille des graphiques : Ajuster la taille des graphiques.
- Graphiques par groupes : Créer des graphiques segmentés par groupes.
- Modifier la couleur des graphiques : Personnaliser les couleurs des graphiques.
- Ajouter du texte aux graphiques : Ajouter des annotations aux graphiques.
- Diagrammes de dispersion avec catégories : Créer des diagrammes de dispersion catégorisés.
Module 6 : Test des moyennes, corrélations et ANOVA
- Association entre deux variables catégorielles : Tester l’association entre deux variables catégorielles.
- Test des moyennes : Réaliser des tests de comparaison de moyennes.
- Corrélation bivariée : Calculer et interpréter les corrélations bivariées.
- Analyse de la variance (ANOVA) : Effectuer des ANOVA pour comparer les moyennes entre groupes.
Module 7 : Régression linéaire
- Régression par les moindres carrés ordinaires (MCO) : Apprendre les bases de la régression linéaire.
- Variables factorielles dans la régression MCO : Utiliser des variables factorielles dans les régressions.
- Statistiques de diagnostic pour la régression MCO : Analyser les diagnostics de régression.
- Variables dépendantes logarithmiques et effets d’interaction dans la régression MCO : Travailler avec des variables dépendantes logarithmiques et des interactions.
- Test d’hypothèse dans la régression par les MCO : Tester des hypothèses dans les régressions.
- Présentation des estimations de la régression par MCO : Présenter les résultats de régression.
- Standardisation des estimations de régression : Standardiser les coefficients de régression.
- Représentation graphique des estimations de régression : Visualiser les estimations de régression.
- Analyse de décomposition d’Oaxaca : Effectuer une analyse de décomposition d’Oaxaca.
- Modèles mixtes : Intercepts et coefficients aléatoires : Apprendre les modèles à effets mixtes.
- Régression linéaire sous contrainte catégorique : Utiliser des régressions avec contraintes catégoriques.
Module 8 : Modèles de choix catégoriques
- Modèles de choix binaires (régression Logit/Probit) : Apprendre les modèles logit et probit.
- Diagnostic et interprétation de la régression Logit et Probit : Diagnostiquer et interpréter les modèles logit et probit.
- Modèles de choix ordonnés et multinomiaux : Travailler avec des modèles ordonnés et multinomiaux.
Module 9 : Modèles à variables fractionnaires/proportionnelles
- Logit fractionnaire, régression bêta et régression bêta non gonflée : Apprendre les modèles pour variables fractionnaires et proportionnelles.
Module 10 : Nombres aléatoires et simulation
- Nombres aléatoires : Générer des nombres aléatoires.
- Processus de génération de données : Simuler des processus de génération de données.
- Simulation d’une violation des hypothèses statistiques : Simuler des scénarios de violation des hypothèses statistiques.
- Simulation de Monte Carlo : Réaliser des simulations de Monte Carlo.
Travaux pratique
Sixième section Python
Livrable
- 𝐶𝑒𝑟𝑡𝑖𝑓𝑖𝑐𝑎𝑡 𝐷𝑎𝑡𝑎 𝐴𝑛𝑎𝑙𝑦𝑠𝑡
- Certificat Business intelligence analyst
- Certificats consultants en analyse de données
- Attestation de stage
- Enregistrement vidéo après chaque cours et 𝑆𝑢𝑝𝑝𝑜𝑟𝑡 𝑑𝑒 𝑐𝑜𝑢𝑟𝑠 𝑝𝑑𝑓
- 𝑅𝑒́𝑠𝑒𝑎𝑢𝑡𝑎𝑔𝑒
- 𝐴𝑐𝑐𝑜𝑚𝑝𝑎𝑔𝑛𝑒𝑚𝑒𝑛𝑡
Durée de la formation : 6 mois soit 3 mois de formation pratique et 3 mois de stage distanciel. Le stage n’est pas obligatoire