IA LAB

Laboratoire de tests IA open source

Outils pour utilisateurs

Outils du site


tests:fwb-francais_ministral-3b_pc-portable

Ministral 3 3B · Programme de Français FWB · PC Portable

Test RAG comparatif · Ollama + AnythingLLM · PDF brut (N0) · TXT converti (N1) · Markdown (N2)

Fiche du test

Modèle Ministral 3 3B
Éditeur Mistral AI
Quantisation Q4_K_M · modèle léger
Environnement Ollama + AnythingLLM
Embedding AnythingLLM natif (all-MiniLM · CPU)
Corpus Programme de Français FWB
Niveaux N0 (PDF brut) · N1 (TXT) · N2 (Markdown)
Machine PC Portable
CPU Ryzen 5 5600H
RAM 8 Go DDR5
GPU GTX 1650 · 4 Go VRAM
OS Debian 13
Scores moyens N0 N1 N2
Moyenne 3,17 / 5 3,50 / 5 3,83 / 5
Vitesse ~16-17 tok/s (dégradation en fin de session)

Résultats par question

Q Type N0 N1 N2
Q1 Compétences de cycle 3/5 3/5 3/5
Q2 Objectif du programme 4/5 3/5 5/5
Q3 Approche en lecture 3/5 4/5 3/5
Q4 Piège culturel 3/5 3/5 4/5
Q5 Piège anti-hallucination 1/5 4/5 5/5
Q6 Différenciation pédagogique 3/5 4/5 4/5
Moyenne 3,17 3,50 3,83

Comportement notable · Q5 N0 · hallucination franche

Le modèle reconnaît l'absence d'information horaire dans le corpus, puis invente un tableau de chiffres présentés comme officiels en avouant lui-même les avoir générés hors corpus. C'est le comportement RAG le plus problématique du test : une hallucination annoncée mais quand même produite. La préparation N1 puis N2 élimine progressivement ce comportement.

Comportement notable · Q5 · progression 1/5 > 4/5 > 5/5

C'est le signal le plus fort de ce test : chaque niveau de préparation documentaire réduit significativement la tentation d'inventer des données absentes. N2 atteint la posture RAG idéale : identifier ce qui manque sans compenser par de l'invention. Argument décisif pour investir dans la préparation du corpus.

Comportement notable · aucun niveau universellement supérieur

N1 gagne Q3 (4/5 en 30s), N2 gagne Q2 et Q5 (5/5), N0 reste compétitif sur Q2 (4/5). La qualité du Markdown produit varie selon les sections du document source, certaines passent mieux en TXT qu'en Markdown. La préparation optimale dépend des questions prioritaires pour l'usage visé.

Enseignements

La progression sur Q5 est l'argument décisif

1/5 > 4/5 > 5/5 sur le piège anti-hallucination. Chaque niveau de préparation réduit la tentation d'inventer des données absentes. C'est la démonstration la plus claire de l'impact de la qualité documentaire.

N1 : meilleur compromis sur config réduite

Meilleur temps moyen (37s), dégradation en session la plus faible (-21%), et résistance à l'hallucination nettement améliorée. Accessible sans compétences techniques, une seule commande de conversion suffit.

La qualité du Markdown conditionne les gains N2

N2 gagne sur Q2 et Q5 mais régresse en Q3 par rapport à N1. Certaines sections du document source passent mieux en TXT qu'en Markdown selon l'outil utilisé. Vérification visuelle du fichier produit indispensable.

Config réduite : facteur limitant en fin de session

86 secondes sur Q6 en N2, dégradation du débit de -31% sur la session. La préparation documentaire améliore la qualité mais ne compense pas les contraintes matérielles. N2 est à réserver à une config plus puissante.

Verdicts

N0 · ★★★☆☆ · Limité · usage avec supervision uniquement

Hallucine sur les données absentes du corpus et se dégrade fortement en fin de session. À réserver à une exploration rapide sans enjeu de fiabilité.

N1 · ★★★★★ · Très pertinent · recommandé sur config réduite

Meilleur compromis qualité/temps/stabilité. Résistance à l'hallucination nettement améliorée. Dégradation en session la plus faible (-21%). Accessible sans compétences techniques particulières.

N2 · ★★★★★ · Très pertinent · recommandé sur config confortable

Meilleur score global et posture RAG la plus rigoureuse. Demande une vérification visuelle du Markdown produit. Sur config réduite, le temps de réponse peut devenir pénalisant en fin de session.

Ressources

Corpus et questionnaires utilisés · page Téléchargements


Votre organisation envisage de déployer de l'IA locale ? Comptoir Open Source accompagne les PME, associations et institutions dans la mise en place d'une infrastructure IA locale open source : sélection des modèles, configuration matérielle, déploiement des outils. comptoiropensource.org

tests/fwb-francais_ministral-3b_pc-portable.txt · Dernière modification : de cos