Logo de l'organisme de formation

La BI au service des entreprises durables

Représentation de la formation : MACHINE LEARNING EN PYTHON

MACHINE LEARNING EN PYTHON

Apprenez à créer et déployer des modèles prédictifs de Machine Learning avec Python et scikit-learn.

Formation mixte
Accessible
Durée : 21 heures (3 jours)
Durée :21 heures (3 jours)
HT
Se préinscrire
Durée :21 heures (3 jours)
HT
Se préinscrire
Durée :21 heures (3 jours)
HT
Se préinscrire

Formation créée le 30/11/2022. Dernière mise à jour le 26/10/2023.

Version du programme : 1

Programme de la formation

Cette formation alterne contenu théorique et mise en pratique. Elle vous permettra de comprendre en profondeur le Machine Learning : ses enjeux et ses limites, comment concevoir un use case, quels sont les principaux algorithmes et comment les utiliser, les optimiser, et évaluer la qualité des modèles prédictifs obtenus. Vous mettrez les notions apprises en pratique sur des cas concrets réels, et maîtriserez les bonnes pratiques du domaine, les écueils à éviter absolument, le cycle de développement et de déploiement, ainsi que la supervision du modèle en production. L’objectif est de vous donner toutes les bases nécessaires pour que vous puissiez à l’issue de la formation faire votre propre projet de Machine Learning, depuis la récupération des données jusqu’à l’exploitation de votre modèle. Vous comprendrez comment appliquer ces techniques sur des données structurées, du texte, ainsi que des séries temporelles.

Objectifs de la formation

  • Comprendre l’apport du Machine Learning et ses limites
  • Maîtriser les principaux algorithmes
  • Savoir créer et optimiser un modèle prédictif en python
  • Mesurer la qualité des modèles et les performances attendues en production
  • Connaître le workflow global du projet
  • Savoir mettre en œuvre les bonnes pratiques pour éviter les écueils de ce type de projet
  • Pouvoir déployer un modèle, le superviser et le mettre à jour en production
  • Comprendre comment appliquer le Machine Learning sur des données structurées, sur du texte, et sur des séries temporelles

Profil des bénéficiaires

Pour qui
  • Développeur, data engineer, data analyst, data scientist, chercheur, ingénieur R&D, chef de projet technique, statisticien, et toute personne travaillant dans la data et sachant manipuler du code informatique
Prérequis
  • Connaitre un langage de programmation, idéalement python

Contenu de la formation

  • Introduction au Machine Learning :
    • Principe général et concepts basiques
    • Exemples de cas d’usage dans différents secteurs : industrie, marketing, IoT, web, énergie...
    • Cadre d’utilisation : possibilités et limitations
    • Bien formuler la problématique : comment passer d’un problème métier à un problème Machine Learning
  • Ecosystème Python :
    • Python scientifique : numpy, pandas, matplotlib, scipy
    • La lirairie Scikit-learn
    • Notebook Jupyter, Anaconda
  • Algorithmes de Machine Learning, première partie : les bases
    • Régression linéaire et régression logistique
    • K plus proches voisins : KNN
    • Arbres de décision et Random Forests
  • Critères d’évaluation :
    • Régression : MAE, MSE, RMSLE, R2...
    • Classification : accuracy, precision, recall, F1 score...
    • Procédures d’évaluation : train-test split, cross-validation, validation set
  • Optimisation des hyper-paramètres :
    • Gridsearch, randomsearch
    • Soft optimisation et hard optimisation
  • Méthodologie et bonnes pratiques :
    • Déroulé d’un projet de data science : une procédure itérative
    • Workflow complet du projet
    • Pipeline de transformation
    • Ecueils à éviter et comment s’en prémunir : surrapprentissage (overfitting) et fuite de données (data leakage)
  • Data prepration et feature extraction :
    • Traitement des données aberrantes et manquantes
    • Normalisation et standardisation
    • Combinaison de features
  • Mise en production :
    • Déployer un modèle en production via une API
    • Monitoring des modèles
    • Mise à jour des modèles
  • Algorithmes de Machine Learning, deuxième partie : les autres catégories
    • Boosting et gradient boosting
    • Clustering
    • Détection d’anomalie
    • Réseaux de neurones et Deep Learning
  • Adapter selon le type de données :
    • Comment traiter du texte
    • Comment traiter des séries temporelles
Suivi de l'exécution et évaluation des résultats
  • Feuilles de présence.
  • Questions orales ou écrites (QCM).
  • Mises en situation.
  • Formulaires d'évaluation de la formation.
  • Certificat de réalisation de l’action de formation.
Ressources techniques et pédagogiques
  • Accueil des apprenants dans une salle dédiée à la formation.
  • Documents supports de formation projetés.
  • Exposés théoriques
  • Etude de cas concrets
  • Quiz en salle
  • Mise à disposition en ligne de documents supports à la suite de la formation.

Capacité d'accueil

Entre 1 et 8 apprenants

Délai d'accès

2 semaines

Accessibilité

Remplir le questionnaire de pré-formation Les moyens d’accès physiques aux personnes handicapés sont soumis aux normes des installations du client. Des dispositifs peuvent être prévus en cas d’un handicap auditif, visuel, mental ou psychique.