====== Ministral 3 3B · Programme de Français FWB · PC Portable ====== Test RAG comparatif · Ollama + AnythingLLM · PDF brut (N0) · TXT converti (N1) · Markdown (N2) {{ :wiki:test-ia.webp |}} {{:wiki:mistral-logo-color-black.png?200|}} ===== Fiche du test ===== ^ Modèle ^ Ministral 3 3B ^ | Éditeur | Mistral AI | | Quantisation | Q4_K_M · modèle léger | | Environnement | Ollama + AnythingLLM | | Embedding | AnythingLLM natif (all-MiniLM · CPU) | | Corpus | Programme de Français FWB | | Niveaux | N0 (PDF brut) · N1 (TXT) · N2 (Markdown) | ^ Machine ^ PC Portable ^ | CPU | Ryzen 5 5600H | | RAM | 8 Go DDR5 | | GPU | GTX 1650 · 4 Go VRAM | | OS | Debian 13 | ^ Scores moyens ^ N0 ^ N1 ^ N2 ^ | Moyenne | 3,17 / 5 | 3,50 / 5 | 3,83 / 5 | | Vitesse | ~16-17 tok/s (dégradation en fin de session) || ===== Résultats par question ===== ^ Q ^ Type ^ N0 ^ N1 ^ N2 ^ | Q1 | Compétences de cycle | 3/5 | 3/5 | 3/5 | | Q2 | Objectif du programme | 4/5 | 3/5 | 5/5 | | Q3 | Approche en lecture | 3/5 | 4/5 | 3/5 | | Q4 | Piège culturel | 3/5 | 3/5 | 4/5 | | Q5 | Piège anti-hallucination | 1/5 | 4/5 | 5/5 | | Q6 | Différenciation pédagogique | 3/5 | 4/5 | 4/5 | | **Moyenne** | | **3,17** | **3,50** | **3,83** | **Comportement notable · Q5 N0 · hallucination franche** Le modèle reconnaît l'absence d'information horaire dans le corpus, puis invente un tableau de chiffres présentés comme officiels en avouant lui-même les avoir générés hors corpus. C'est le comportement RAG le plus problématique du test : une hallucination annoncée mais quand même produite. La préparation N1 puis N2 élimine progressivement ce comportement. **Comportement notable · Q5 · progression 1/5 > 4/5 > 5/5** C'est le signal le plus fort de ce test : chaque niveau de préparation documentaire réduit significativement la tentation d'inventer des données absentes. N2 atteint la posture RAG idéale : identifier ce qui manque sans compenser par de l'invention. Argument décisif pour investir dans la préparation du corpus. **Comportement notable · aucun niveau universellement supérieur** N1 gagne Q3 (4/5 en 30s), N2 gagne Q2 et Q5 (5/5), N0 reste compétitif sur Q2 (4/5). La qualité du Markdown produit varie selon les sections du document source, certaines passent mieux en TXT qu'en Markdown. La préparation optimale dépend des questions prioritaires pour l'usage visé. ===== Enseignements ===== **La progression sur Q5 est l'argument décisif** 1/5 > 4/5 > 5/5 sur le piège anti-hallucination. Chaque niveau de préparation réduit la tentation d'inventer des données absentes. C'est la démonstration la plus claire de l'impact de la qualité documentaire. **N1 : meilleur compromis sur config réduite** Meilleur temps moyen (37s), dégradation en session la plus faible (-21%), et résistance à l'hallucination nettement améliorée. Accessible sans compétences techniques, une seule commande de conversion suffit. **La qualité du Markdown conditionne les gains N2** N2 gagne sur Q2 et Q5 mais régresse en Q3 par rapport à N1. Certaines sections du document source passent mieux en TXT qu'en Markdown selon l'outil utilisé. Vérification visuelle du fichier produit indispensable. **Config réduite : facteur limitant en fin de session** 86 secondes sur Q6 en N2, dégradation du débit de -31% sur la session. La préparation documentaire améliore la qualité mais ne compense pas les contraintes matérielles. N2 est à réserver à une config plus puissante. ===== Verdicts ===== **N0 · ★★★☆☆ · Limité · usage avec supervision uniquement** Hallucine sur les données absentes du corpus et se dégrade fortement en fin de session. À réserver à une exploration rapide sans enjeu de fiabilité. **N1 · ★★★★★ · Très pertinent · recommandé sur config réduite** Meilleur compromis qualité/temps/stabilité. Résistance à l'hallucination nettement améliorée. Dégradation en session la plus faible (-21%). Accessible sans compétences techniques particulières. **N2 · ★★★★★ · Très pertinent · recommandé sur config confortable** Meilleur score global et posture RAG la plus rigoureuse. Demande une vérification visuelle du Markdown produit. Sur config réduite, le temps de réponse peut devenir pénalisant en fin de session. ===== Ressources ===== [[:telechargements|Corpus et questionnaires utilisés · page Téléchargements]] ---- **Votre organisation envisage de déployer de l'IA locale ?** Comptoir Open Source accompagne les PME, associations et institutions dans la mise en place d'une infrastructure IA locale open source : sélection des modèles, configuration matérielle, déploiement des outils. [[https://comptoiropensource.org|comptoiropensource.org]]