IA LAB

Laboratoire de tests IA open source

Outils pour utilisateurs

Outils du site


tests:s2-fwb-francais_ministral-3-8b_serveur-light

Différences

Ci-dessous, les différences entre deux révisions de la page.

Lien vers cette vue comparative

Prochaine révision
Révision précédente
tests:s2-fwb-francais_ministral-3-8b_serveur-light [2026/05/17 09:39] – créée costests:s2-fwb-francais_ministral-3-8b_serveur-light [2026/05/17 14:58] (Version actuelle) cos
Ligne 2: Ligne 2:
  
 Test RAG comparatif · Ollama + AnythingLLM · PDF brut (N0) · TXT converti (N1) · Markdown (N2) · Embedding bge-m3 Test RAG comparatif · Ollama + AnythingLLM · PDF brut (N0) · TXT converti (N1) · Markdown (N2) · Embedding bge-m3
 +
 +{{ :wiki:test-ia.webp |}}
  
 {{:wiki:mistral-logo-color-black.png?200|}} {{:wiki:mistral-logo-color-black.png?200|}}
Ligne 87: Ligne 89:
  
 ===== Verdicts ===== ===== Verdicts =====
 + 
 <WRAP round box> <WRAP round box>
-**N0 · ★★☆☆☆ · Risqué · hallucination factuelle confirmée · non recommandé** +**N0 · ★★☆☆☆ · Non adapté · hallucination factuelle confirmée · usage non recommandé dans cette configuration** 
 + 
 2,83/5 en moyenne. Erreur grave sur Q5 (34 périodes hallucinées) et échec total sur Q4. Le corpus PDF brut génère suffisamment de bruit pour compromettre la fiabilité sur les questions factuelles. Usage sans préparation déconseillé sur ce type de document. 2,83/5 en moyenne. Erreur grave sur Q5 (34 périodes hallucinées) et échec total sur Q4. Le corpus PDF brut génère suffisamment de bruit pour compromettre la fiabilité sur les questions factuelles. Usage sans préparation déconseillé sur ce type de document.
 </WRAP> </WRAP>
 + 
 <WRAP round box> <WRAP round box>
-**N1 · ★★★☆☆ · Acceptable · meilleur niveau du test · supervision nécessaire** +**N1 · ★★★☆☆ · Limité · meilleur niveau du test · usage avec supervision uniquement** 
 + 
 3,50/5 en moyenne. La conversion TXT corrige l'hallucination de N0 et améliore significativement Q1 et Q5. Reste en échec sur Q4. Utilisable avec supervision active, notamment sur les questions à ancrage disciplinaire croisé. 3,50/5 en moyenne. La conversion TXT corrige l'hallucination de N0 et améliore significativement Q1 et Q5. Reste en échec sur Q4. Utilisable avec supervision active, notamment sur les questions à ancrage disciplinaire croisé.
 </WRAP> </WRAP>
 + 
 <WRAP round box> <WRAP round box>
-**N2 · ★★★☆☆ · Acceptable · instable sur les questions factuelles · supervision nécessaire** +**N2 · ★★★☆☆ · Limité · instable sur les questions factuelles · usage avec supervision uniquement** 
 + 
 3,33/5 en moyenne. La conversion Markdown apporte un gain sur Q2 (citation exacte restituée) mais dégrade Q1 et Q5 par rapport à N1. Le profil de réponses est inégal. Supervision recommandée, en particulier sur les données chiffrées et les croisements disciplinaires. 3,33/5 en moyenne. La conversion Markdown apporte un gain sur Q2 (citation exacte restituée) mais dégrade Q1 et Q5 par rapport à N1. Le profil de réponses est inégal. Supervision recommandée, en particulier sur les données chiffrées et les croisements disciplinaires.
 </WRAP> </WRAP>
tests/s2-fwb-francais_ministral-3-8b_serveur-light.1779010762.txt.gz · Dernière modification : de cos