Module 1
Introduction
Introduction
3min
Leçons vidéo
Exercices
Lab pratique
Cette formation vous apprendra à construire des applications avec des modèles open source avancés comme Llama, Mistral, ou Falcon. L'open source offre transparence, contrôle total, et possibilité de déploiement on-premise.
Avantages des modèles open source :
Les LLMs open source permettent un déploiement souverain, sans dépendance à des APIs externes. Vous gardez le contrôle de vos données et pouvez personnaliser les modèles selon vos besoins spécifiques.
Ce que vous allez apprendre :
Panorama des modèles open source de pointe (Llama 3, Mistral, Falcon)
Configuration et déploiement local (Ollama, vLLM, TGI)
Fine-tuning et adaptation de domaine
Quantization pour optimiser les performances
Comparaison avec modèles propriétaires
Intégration dans applications Python
Déploiement on-premise et cloud privé
Optimisation des ressources (GPU, CPU)
Cas d'usage enterprise
Cette formation est essentielle pour les organisations qui privilégient la souveraineté des données et le contrôle sur leur infrastructure IA.
Module 2
Présentation des Modèles MoE
Présentation des Modèles MoE
6min
Leçons vidéo
Exercices
Lab pratique
Architecture Mixture-of-Experts et évolution des modèles :
Architecture MoE avec 128 experts et seulement 17B paramètres actifs par token
Contexte ultra-long : de 1 million à 10 millions de tokens
Support multimodal : texte + images
12 langues supportées
Efficacité : 24x plus efficace qu'un modèle dense équivalent
Module 3
Démarrage Rapide avec APIs
Démarrage Rapide avec APIs
6min avec code
Leçons vidéo
Exercices
Lab pratique
Configuration et premiers appels API :
Initialisation du client API
Appels de chat simples
Construction d'un traducteur multilingue (12 langues)
Utilisation via plateformes d'hébergement (Together.ai, Replicate, etc.)
Module 4
Détection d'Objets Multimodale
Détection d'Objets Multimodale
9min avec code
Leçons vidéo
Exercices
Lab pratique
Capacités vision avancées :
Raisonnement multi-images comparatif
Image grounding : détection d'objets avec coordonnées de bounding boxes
Screenshot to code : conversion d'interfaces UI en code React/Vue/etc.
Analyse visuelle détaillée
Module 5
Format de Prompts
Format de Prompts
8min avec code
Leçons vidéo
Exercices
Lab pratique
Tokens spéciaux et construction de prompts :
Format de prompt brut avec tokens spéciaux
Construction manuelle de prompts
Format multimodal avec images
Tokens : beginoftext, endoftext, startheader, endheader, eot, image
Module 6
Compréhension de Contexte Long
Compréhension de Contexte Long
7min avec code
Leçons vidéo
Exercices
Lab pratique
Traitement de contextes massifs :
Analyse de livres entiers (750k tokens)
Traitement de codebases GitHub complètes (1.5M tokens)
Requêtes complexes sur 10M tokens
Stratégies d'organisation de contexte long
Module 7
Outil d'Optimisation de Prompts
Outil d'Optimisation de Prompts
10min avec code
Leçons vidéo
Exercices
Lab pratique
Optimisation automatique de prompts :
Outil d'optimisation intégré
Amélioration itérative basée sur données d'entraînement
Passage de 31% à 54% d'accuracy automatiquement
Optimisation pour classification, sentiment analysis, catégorisation
Module 8
Kit de Données Synthétiques
Kit de Données Synthétiques
7min avec code
Leçons vidéo
Exercices
Lab pratique
Génération de datasets de fine-tuning :
Génération de conversations synthétiques
Filtrage qualité automatique
Augmentation de diversité (paraphrase, backtranslation)
Pipeline complet : génération, filtrage, équilibrage, split train/val/test