Module 1
Introduction
Introduction
5min
Leçons vidéo
Exercices
Lab pratique
Introduction aux défis d'évaluation et de debugging des applications GenAI. Découvrez les problématiques spécifiques aux systèmes non-déterministes.
Lab : Exercices pratiques
Module 2
Configuration des Outils
Configuration des Outils
8min
Leçons vidéo
Exercices
Lab pratique
Maîtrisez les métriques d'évaluation pour les tâches génér atives : BLEU, ROUGE, BERTScore, et métriques personnalisées.
Lab : Exercices pratiques
Module 3
Traçage de Chaînes LLM
Traçage de Chaînes LLM
12min
Leçons vidéo
Exercices
Lab pratique
Apprenez à créer des datasets de test représentatifs. Construisez des benchmarks adaptés à votre domaine métier.
Lab : Exercices pratiques
Module 4
Comparaison de Prompts
Comparaison de Prompts
10min
Leçons vidéo
Exercices
Lab pratique
Découvrez les techniques de debugging pour identifier les sources d'erreurs : mauvais prompts, contexte inadéquat, hallucinations.
Lab : Exercices pratiques
Module 5
LLM-as-Judge
LLM-as-Judge
10min
Leçons vidéo
Exercices
Lab pratique
Utilisez les outils de traçabilité et d'observabilité pour comprendre le comportement de vos chaînes LLM complexes.
Lab : Exercices pratiques
Module 6
Monitoring en Production
Monitoring en Production
5min
Leçons vidéo
Exercices
Lab pratique
Optimisez itérativement vos prompts et votre architecture. Apprenez à faire du prompt engineering data-driven.
Module 7
Conclusion
Conclusion
5min
Leçons vidéo
Exercices
Lab pratique
Synthèse des techniques d'évaluation et de debugging pour des applications GenAI robustes en production.