Présentation de la formation Préparation des données & Feature Engineering
La qualité des données conditionne directement la performance des analyses et des modèles d’intelligence artificielle. Dans la majorité des projets data et IA, la préparation des données et le feature engineering représentent la part la plus importante du travail.
Cette formation permet d’acquérir les fondamentaux de la préparation des données et du feature engineering, afin de transformer des données brutes en données propres, structurées et exploitables pour l’analyse ou le machine learning. Elle s’adresse aux professionnels souhaitant comprendre et mettre en œuvre ces étapes clés sans entrer dans des algorithmes complexes.
Objectifs de la formation Préparation des données & Feature Engineering
Objectifs pédagogiques :
- Comprendre le rôle de la préparation des données dans les projets data & IA
- Identifier les problèmes courants de qualité des données
- Comprendre les principes du feature engineering
- Connaître les principales techniques de transformation des données
- Appréhender les bonnes pratiques de préparation des jeux de données
Objectifs opérationnels :
- Nettoyer et préparer un jeu de données brut
- Gérer les données manquantes et aberrantes
- Transformer des variables pour les rendre exploitables
- Créer des variables pertinentes (features)
- Préparer un jeu de données prêt pour l’analyse ou l’IA
Programme de la formation Préparation des données & Feature Engineering
Jour 1 – Préparation et nettoyage des données
Introduction à la préparation des données
Pourquoi préparer les données ?
Place de la préparation dans un projet data & IA
Types de données (numériques, catégorielles, textuelles)
Qualité des données et impacts métier
Identification des problèmes de données
Données manquantes
Données incohérentes ou erronées
Valeurs aberrantes (outliers)
Données dupliquées
Techniques de nettoyage
Suppression ou correction des anomalies
Gestion des valeurs manquantes
Standardisation des formats
Bonnes pratiques de traçabilité
Atelier pratique
Analyse d’un jeu de données brut
Identification des problèmes de qualité
Nettoyage et préparation initiale
Jour 2 – Feature Engineering et préparation pour l’IA
Introduction au feature engineering
Qu’est-ce qu’une feature ?
Pourquoi le feature engineering est crucial
Features manuelles vs automatiques
Lien entre features et performance des modèles
Transformation des variables
Encodage des variables catégorielles
Normalisation et standardisation
Discrétisation des variables
Transformation de variables temporelles
Création de nouvelles features
Agrégations et calculs dérivés
Features basées sur le temps
Combinaisons de variables
Bonnes pratiques et pièges à éviter
Atelier pratique
Création de nouvelles variables à partir des données préparées
Préparation d’un jeu de données final
Validation collective des features produites
Les autres formations en MLOps & industrialisation IA
AWS – Machine Learning & MLOps (SageMaker)
Créer, entraîner et déployer des modèles ML et utiliser les services IA managés d’AWS
Azure – AI, Machine Learning & MLOps
Développer des applications intelligentes sur Azure avec Machine Learning, Cognitive Services et MLOps
GCP – Vertex AI & Machine Learning
Déployer des modèles ML sur GCP avec Vertex AI, du dataset à la production