IA LAB

Laboratoire de tests IA open source

Outils pour utilisateurs

Outils du site


syntheses:fwb-francais

Différences

Ci-dessous, les différences entre deux révisions de la page.

Lien vers cette vue comparative

Les deux révisions précédentesRévision précédente
Prochaine révision
Révision précédente
syntheses:fwb-francais [2026/05/17 15:02] cossyntheses:fwb-francais [2026/05/27 18:11] (Version actuelle) – [Profils d'usage recommandés] cos
Ligne 15: Ligne 15:
 | Réponses évaluées    | 72 | 6 questions × 3 niveaux × 4 modèles      | | Réponses évaluées    | 72 | 6 questions × 3 niveaux × 4 modèles      |
  
-===== Classement général · score N2 =====+===== Classement général =====
  
 ^ Rang ^ Modèle            ^ Machine                          ^ N0    ^ N1          ^ N2        ^ ^ Rang ^ Modèle            ^ Machine                          ^ N0    ^ N1          ^ N2        ^
Ligne 48: Ligne 48:
 </WRAP> </WRAP>
  
-===== Analyse · la régression N1 du Ministral 3 14B ===== 
- 
-<WRAP round alert> 
-**Anomalie documentée : N1 inférieur à N0 sur deux questions clés** 
-</WRAP> 
  
 ^ Question                      ^ N0    ^ N1        ^ N2        ^ Variation N0>N1 ^ ^ Question                      ^ N0    ^ N1        ^ N2        ^ Variation N0>N1 ^
Ligne 62: Ligne 57:
 | Q6 · Différenciation          | 3/5   | 3/5       | 5/5       | stable          | | Q6 · Différenciation          | 3/5   | 3/5       | 5/5       | stable          |
  
-<WRAP round box> 
-**Ce qui s'est passé** 
- 
-La conversion du PDF officiel FWB vers TXT a produit un fichier fragmenté : les tableaux et listes structurés du programme ont été aplatis en blocs de texte linéaire sans séparateurs clairs. Pour un modèle de 14B dont le contexte d'attention est plus large, cette densité sans structure produit un effet inverse : le modèle cherche des connexions dans un flux continu et perd les ancrages documentaires précis qu'il exploite très bien en N0 et N2. 
-</WRAP> 
- 
-<WRAP round box> 
-**Pourquoi le 8B n'est pas affecté** 
- 
-Le Ministral 3 8B produit des scores N0/N1 identiques (4,17) sur le même corpus. Les modèles plus petits sont moins sensibles à la fragmentation structurelle car ils opèrent sur des fenêtres de contexte plus courtes et traitent les chunks de manière plus indépendante. 
-</WRAP> 
  
 La régression N1 n'est pas un signe de faiblesse du modèle : elle indique au contraire qu'il est plus exigeant sur la qualité structurelle du corpus. **Recommandation pratique :** pour les modèles 14B et plus, éviter la conversion TXT basique sur des documents officiels à structure complexe. Passer directement de N0 à N2. La régression N1 n'est pas un signe de faiblesse du modèle : elle indique au contraire qu'il est plus exigeant sur la qualité structurelle du corpus. **Recommandation pratique :** pour les modèles 14B et plus, éviter la conversion TXT basique sur des documents officiels à structure complexe. Passer directement de N0 à N2.
  
-===== Comportements notables ===== 
- 
-<WRAP round alert> 
-**Le cas phi4-mini · une hallucination de type différent** 
- 
-Sur Q4, phi4-mini n'identifie pas le terme pédagogique local et produit des réponses hors sujet présentées avec assurance. En N1, il a interprété le terme comme une technique liée au sommeil et développé trois paragraphes entiers dans cette direction. Là où un 8B ou 14B constate l'absence et s'arrête, phi4-mini comble le vide avec du contenu plausible non documenté. Sur un corpus officiel destiné à des professionnels de l'éducation, ce comportement est disqualifiant sans supervision constante. 
-</WRAP> 
- 
-<WRAP round tip> 
-**Le cas Ministral 3 3B · la préparation documentaire comme antidote** 
- 
-La progression 1/5 > 4/5 > 5/5 sur Q5 est le signal le plus fort de toute la série : un modèle qui hallucine librement en N0 devient rigoureux en N2 sur la même question. Argument décisif pour investir dans la préparation du corpus, même sur des configurations matérielles modestes. 
-</WRAP> 
  
 ===== Enseignements transversaux ===== ===== Enseignements transversaux =====
Ligne 116: Ligne 87:
 </WRAP> </WRAP>
  
-<WRAP round box> 
-**Les lacunes culturelles locales sont irréductibles par le RAG** 
- 
-Q4 met en évidence une limite structurelle : les modèles entraînés sur des corpus internationaux ne connaissent pas les spécificités du système scolaire FWB. Aucune préparation documentaire ne peut corriger ce type de lacune. 
-</WRAP> 
  
 <WRAP round box> <WRAP round box>
Ligne 131: Ligne 97:
  
 ^ Contexte                          ^ Modèle recommandé        ^ Niveau ^ Verdict   ^ ^ Contexte                          ^ Modèle recommandé        ^ Niveau ^ Verdict   ^
-Usage en établissement scolaire   | Ministral 3 8B           | N2     | ★★★★★    |+Serveur IA léger   | Ministral 3 8B           | N2     | ★★★★★    |
 | Config légère - PC portable       | Ministral 3 3B           | N1     | ★★★★★    | | Config légère - PC portable       | Ministral 3 3B           | N1     | ★★★★★    |
-| Serveur partagé multi-utilisateurs| Ministral 3 14B          | N2     | ★★★★☆    |+| Serveur IA multi-utilisateurs| Ministral 3 14B          | N2     | ★★★★☆    |
 | phi4-mini 3.8B                    | Non recommandé ce corpus  | -      | ★★☆☆☆    | | phi4-mini 3.8B                    | Non recommandé ce corpus  | -      | ★★☆☆☆    |
  
syntheses/fwb-francais.1779030123.txt.gz · Dernière modification : de cos