Ministral 3 3B · Programme de Français FWB · PC Portable
Fiche du test
| Modèle | Ministral 3 3B |
|---|---|
| Éditeur | Mistral AI |
| Quantisation | Q4_K_M · modèle léger |
| Environnement | Ollama + AnythingLLM |
| Embedding | AnythingLLM natif (all-MiniLM · CPU) |
| Corpus | Programme de Français FWB |
| Niveaux | N0 (PDF brut) · N1 (TXT) · N2 (Markdown) |
| Machine | PC Portable |
|---|---|
| CPU | Ryzen 5 5600H |
| RAM | 8 Go DDR5 |
| GPU | GTX 1650 · 4 Go VRAM |
| OS | Debian 13 |
| Scores moyens | N0 | N1 | N2 |
|---|---|---|---|
| Moyenne | 3,17 / 5 | 3,50 / 5 | 3,83 / 5 |
| Vitesse | ~16-17 tok/s (dégradation en fin de session) | ||
Résultats par question
| Q | Type | N0 | N1 | N2 |
|---|---|---|---|---|
| Q1 | Compétences de cycle | 3/5 | 3/5 | 3/5 |
| Q2 | Objectif du programme | 4/5 | 3/5 | 5/5 |
| Q3 | Approche en lecture | 3/5 | 4/5 | 3/5 |
| Q4 | Piège culturel | 3/5 | 3/5 | 4/5 |
| Q5 | Piège anti-hallucination | 1/5 | 4/5 | 5/5 |
| Q6 | Différenciation pédagogique | 3/5 | 4/5 | 4/5 |
| Moyenne | 3,17 | 3,50 | 3,83 |
Comportement notable · Q5 N0 · hallucination franche
Le modèle reconnaît l'absence d'information horaire dans le corpus, puis invente un tableau de chiffres présentés comme officiels en avouant lui-même les avoir générés hors corpus. C'est le comportement RAG le plus problématique du test : une hallucination annoncée mais quand même produite. La préparation N1 puis N2 élimine progressivement ce comportement.
Comportement notable · Q5 · progression 1/5 > 4/5 > 5/5
C'est le signal le plus fort de ce test : chaque niveau de préparation documentaire réduit significativement la tentation d'inventer des données absentes. N2 atteint la posture RAG idéale : identifier ce qui manque sans compenser par de l'invention. Argument décisif pour investir dans la préparation du corpus.
Comportement notable · aucun niveau universellement supérieur
N1 gagne Q3 (4/5 en 30s), N2 gagne Q2 et Q5 (5/5), N0 reste compétitif sur Q2 (4/5). La qualité du Markdown produit varie selon les sections du document source, certaines passent mieux en TXT qu'en Markdown. La préparation optimale dépend des questions prioritaires pour l'usage visé.
Enseignements
La progression sur Q5 est l'argument décisif
1/5 > 4/5 > 5/5 sur le piège anti-hallucination. Chaque niveau de préparation réduit la tentation d'inventer des données absentes. C'est la démonstration la plus claire de l'impact de la qualité documentaire.
N1 : meilleur compromis sur config réduite
Meilleur temps moyen (37s), dégradation en session la plus faible (-21%), et résistance à l'hallucination nettement améliorée. Accessible sans compétences techniques, une seule commande de conversion suffit.
La qualité du Markdown conditionne les gains N2
N2 gagne sur Q2 et Q5 mais régresse en Q3 par rapport à N1. Certaines sections du document source passent mieux en TXT qu'en Markdown selon l'outil utilisé. Vérification visuelle du fichier produit indispensable.
Config réduite : facteur limitant en fin de session
86 secondes sur Q6 en N2, dégradation du débit de -31% sur la session. La préparation documentaire améliore la qualité mais ne compense pas les contraintes matérielles. N2 est à réserver à une config plus puissante.
Verdicts
N0 · ★★★☆☆ · Limité · usage avec supervision uniquement
Hallucine sur les données absentes du corpus et se dégrade fortement en fin de session. À réserver à une exploration rapide sans enjeu de fiabilité.
N1 · ★★★★★ · Très pertinent · recommandé sur config réduite
Meilleur compromis qualité/temps/stabilité. Résistance à l'hallucination nettement améliorée. Dégradation en session la plus faible (-21%). Accessible sans compétences techniques particulières.
N2 · ★★★★★ · Très pertinent · recommandé sur config confortable
Meilleur score global et posture RAG la plus rigoureuse. Demande une vérification visuelle du Markdown produit. Sur config réduite, le temps de réponse peut devenir pénalisant en fin de session.
Ressources
Corpus et questionnaires utilisés · page Téléchargements
Votre organisation envisage de déployer de l'IA locale ? Comptoir Open Source accompagne les PME, associations et institutions dans la mise en place d'une infrastructure IA locale open source : sélection des modèles, configuration matérielle, déploiement des outils. comptoiropensource.org


