Nouveau

Introduction à la Data Science

Code Formation: 5290

| Ajouter aux favoris

Compétence principale visée

Acquérir la méthodologie et les outils d'un projet de data science

Objectifs pédagogiques

  • Découvrir et prendre en main Python pour des projets de Data Science
  • Acquérir les concepts de base et la méthodologie d'un projet de Data science
  • Mettre en œuvre les outils nécessaires à la construction d'un projet de Data science

Public

  • Tous collaborateurs en charge de mettre en œuvre un projet de Data Science

Prérequis

  • Notion de programmation
  • Niveau équivalent bac+2 scientifique

PARTIE 1 - INTRODUCTION

  • Introduction à la Data Science : présentation de l'histoire de la Data Science, des concepts de base, de cas d'étude et de la méthodologie
  • Comprendre ce qu'est un dataset, les différents types de données manipulées en Data Science - transactionnel, graphe, ordonné - et acquérir des notions sur la qualité des données
  • Rappels des traitements statistiques sur les données : moyenne, variance, écart-type, skewness, etc.

PARTIE 2 - FONDAMENTAUX DE PYTHON POUR LA DATA SCIENCE

  • Concepts de base : types de données simples et composées, structure de contrôle, manipulation de fichiers
  • Pourquoi Python pour la Data Science et découverte de l'écosystème de librairies, framework et outils
  • Découverte de l'outil indispensable pour la manipulation de données en Python : Pandas

                        - Concepts de base : Séries et DataFrame, lecture et écriture de données, sélection de    données, qualité des données

                        - Méthodes de visualisation de données

                        - Calculs statistiques

                        - Opération complexes : agrégation, pivot, jointure

                        - Manipulation de séries temporelles

PARTIE 3 - MACHINE LEARNING

  • Introduction aux activités du Machine Learning : clustering, prédiction, règles d'association, détection d'anomalie       
  • Apprentissage supervisé - régression : régression linéaire avec régularisation, notions de biais et variance, méthode de sélection des hyperparamètres, métriques
  • Apprentissage supervisé - classification : régression logistique, arbre de décision, sous/sur-apprentissage, SVM, forêt aléatoire, ensemble learning, métriques
  • Apprentissage non supervisé : clustering k-means et DBCSAN, clustering hiérarchique, méhodes d'analyse factorielles

La démarche pédagogique proposée s'appuiera sur l'alternance d'apports théoriques, d'échanges techniques et d'illustrations autour de cas pédagogiques existants. En complément, elle intégrera de nombreuses mises en situation et de travaux pratiques

 

Entre les sessions de formation, des projets seront à réaliser par les stagiaires

Evaluation des acquis de formation
Evaluation des acquis des apprenants réalisée en fin de formation par un questionnaire ouvert contextualisé.
Taux de réussite

72% des apprenants ont acquis la compétence principale visée

Résultat obtenu pour 32 participants évalués ayant suivi une formation dans la thématique sur les 5 dernières années

Évaluation de la satisfaction

Evaluation du ressenti des participants en fin de formation (Niveau 1 KIRKPATRICK)

Résultats de l’évaluation

Le niveau de satisfaction globale est évalué à 4.3/5 par les participants.

Evaluations réalisées auprès des 108 participants ayant suivi une formation dans la thématique sur les 5 dernières années

Actualisée le 25-01-2024