Module 1
Introduction
Introduction
2 min
Leçons vidéo
Exercices
Lab pratique
Cette formation vous apprendra à comprendre et utiliser les text embeddings pour vos applications IA. Les embeddings sont la représentation vectorielle du texte et sont fondamentaux pour la recherche sémantique et RAG.
Importance des embeddings :
Les embeddings capturent le sens sémantique du texte dans des vecteurs numériques. Ils permettent de comparer la similarité de textes, de faire de la recherche sémantique, et de construire des systèmes RAG.
Ce que vous allez apprendre :
Concepts fondamentaux des text embeddings
Modèles d'embeddings (OpenAI, Cohere, open source)
Génération d'embeddings pour différents types de texte
Métriques de similarité (cosine, euclidean, dot product)
Dimensionnalité et compression des embeddings
Evaluation de la qualité des embeddings
Applications pratiques (recherche, RAG, classification)
Optimisation des performances
Fine-tuning de modèles d'embeddings
Cette formation vous donnera une maîtrise complète des embeddings, pierre angulaire de nombreuses applications GenAI.
Module 2
Premiers Pas avec les Text Embeddings
Premiers Pas avec les Text Embeddings
12 min avec code
Leçons vidéo
Exercices
Lab pratique
Configuration de l'API d'embeddings
Génération d'embedding pour une phrase
Génération par batch pour meilleure performance
Comprendre les dimensions (768, 1536, etc.)
Lab pratique : Générer vos premiers embeddings
Utilisez le SDK Python approprié pour implémenter cette fonctionnalité. Consultez la documentation Azure pour les exemples de code complets.
Module 3
Comprendre les Text Embeddings
Comprendre les Text Embeddings
8 min
Leçons vidéo
Exercices
Lab pratique
Différence entre word embeddings et sentence embeddings
Word2Vec/GloVe vs BERT/Sentence-BERT
Espace sémantique et proximité
Propriétés mathématiques des embeddings
Consultez la documentation Azure pour l'implémentation détaillée de cette fonctionnalité.
Module 4
Visualiser les Embeddings
Visualiser les Embeddings
9 min avec code
Leçons vidéo
Exercices
Lab pratique
PCA (Principal Component Analysis)
t-SNE pour mieux séparer les clusters
Visualisation en 2D/3D
Interprétation des clusters sémantiques
Lab pratique : Visualiser des embeddings par thème
Consultez la documentation Azure pour l'implémentation détaillée de cette fonctionnalité.
Module 5
Applications des Embeddings
Applications des Embeddings
16 min avec code
Leçons vidéo
Exercices
Lab pratique
Entraîner un classifieur (Logistic Regression, SVM)
Prédire sentiment, catégorie, intention
Évaluation de performance
Lab pratique : Classifier des avis clients
K-means pour regrouper par thème
Découvrir des catégories automatiquement
Analyser les clusters formés
Lab pratique : Clusteriser des documents
Isolation Forest pour anomalies
Identifier textes hors-sujet
Quality assurance de données
Lab pratique : Détecter texte spam ou aléatoire
Module 6
Génération de Texte avec LLMs
Génération de Texte avec LLMs
15 min avec code
Leçons vidéo
Exercices
Lab pratique
Temperature (0.0 - 1.0) : Contrôle la créativité
Top-k : Limite aux k tokens les plus probables
Top-p (nucleus sampling) : Somme de probabilité
Lab pratique : Expérimenter avec différents paramètres
Consultez la documentation Azure pour l'implémentation détaillée de cette fonctionnalité.
Temperature basse (0.0-0.3) : Extraction de faits, Q&A
Temperature moyenne (0.4-0.7) : Dialogue, résumé
Temperature élevée (0.8-1.0) : Créativité, brainstorming
Module 7
Construire un Système Q&A avec Recherche Sémantique
Construire un Système Q&A avec Recherche Sémantique
19 min avec code
Leçons vidéo
Exercices
Lab pratique
1. Indexation de la base de connaissances
2. Recherche sémantique avec ScaNN ou FAISS
3. Récupération des k documents les plus pertinents
4. Génération de réponse avec contexte
5. Lab pratique : Système Q&A sur votre documentation
Consultez la documentation Azure pour l'implémentation détaillée de cette fonctionnalité.
ScaNN pour recherche ultra-rapide (millions de documents)
Caching des embeddings fréquents
Tuning du nombre de voisins (k)
Combinaison avec filtres métadonnées
Module 8
[Optionnel] Configuration Cloud
[Optionnel] Configuration Cloud
1 min
Leçons vidéo
Exercices
Lab pratique
Instructions pour configuration Google Cloud Vertex AI (optionnel).