Retour
CoursIntermédiaireRAG SystemsGenAI Builders

Building Multimodal Search and RAG

Famille : 🟩 F2 - GenAI Builders

Express

À l'issue de cette formation, vous serez capable de :

Maîtriser les concepts fondamentaux
Acquérir des compétences pratiques

Programme Détaillé

6 modules de formation

Module 1

Introduction au Multimodal RAG

15min
Leçons vidéo
Exercices
Lab pratique
Qu'est-ce que le multimodal ?
Use cases : e-commerce, documentation technique, médical
Limites du RAG text-only
Architecture multimodale overview
Lab : Exploration dataset multimodal
Module 2

Embeddings Multimodaux

25min
Leçons vidéo
Exercices
Lab pratique
Modèles CLIP (OpenAI)
BridgeTower embeddings
Comment encoder texte et images dans même espace
Similarity search cross-modal
Lab : Générer embeddings pour texte et images
Module 3

Vector Databases pour Multimodal

20min
Leçons vidéo
Exercices
Lab pratique
Weaviate multimodal support
Indexation d'images et texte
Schema configuration
Storage et retrieval optimization
Lab : Setup Weaviate multimodal collection
Module 4

Recherche Sémantique sur Images

25min
Leçons vidéo
Exercices
Lab pratique
Image-to-image search
Text-to-image search
Image-to-text search
Hybrid queries (texte + image)
Ranking et filtering
Lab : Application de recherche visuelle
Module 5

RAG avec Contexte Visuel

30min
Leçons vidéo
Exercices
Lab pratique
Retrieval de documents avec images
Combiner texte et visuels dans le contexte
Vision LLMs (GPT-4V, Claude 3) pour RAG
Describing images dans les réponses
Structurer le contexte multimodal
Lab : RAG Q&A avec images et texte
Module 6

Production et Use Cases

15min
Leçons vidéo
Exercices
Lab pratique
Applications e-commerce (recherche produits)
Documentation technique (diagrammes + texte)
Médical imaging RAG
Fashion et retail
Performance optimization
Lab : Projet multimodal complet

Prérequis pour suivre cette formation

Python intermédiaire
RAG fondamental (embeddings, vector search)
Concepts de computer vision (basique)
Vector databases basics
Python 3.8+
Jupyter Notebook
Clés API (OpenAI, Weaviate Cloud)
Connexion internet (images datasets)

Public Cible

Développeurs
Ingénieurs logiciels

Compétences que vous allez acquérir

Compétences pratiques en IA générative

Ressources

Informations Pratiques

Détails de la formation

Durée
1-2h
Niveau
Intermédiaire
Prix
2230 €
Langue
Français
Certification
-

Pourquoi choisir Adservio Academy ?

Formations 100% pratiques
Formateurs experts certifiés
Accompagnement personnalisé
Contenu à jour avec l'IA