syntheses:fwb-francais
Différences
Ci-dessous, les différences entre deux révisions de la page.
| Les deux révisions précédentesRévision précédenteProchaine révision | Révision précédente | ||
| syntheses:fwb-francais [2026/05/18 18:59] – cos | syntheses:fwb-francais [2026/05/27 18:11] (Version actuelle) – [Profils d'usage recommandés] cos | ||
|---|---|---|---|
| Ligne 48: | Ligne 48: | ||
| </ | </ | ||
| - | ===== Analyse · la régression N1 du Ministral 3 14B ===== | ||
| - | |||
| - | <WRAP round alert> | ||
| - | **Anomalie documentée : N1 inférieur à N0 sur deux questions clés** | ||
| - | </ | ||
| ^ Question | ^ Question | ||
| Ligne 62: | Ligne 57: | ||
| | Q6 · Différenciation | | Q6 · Différenciation | ||
| - | <WRAP round box> | ||
| - | **Ce qui s'est passé** | ||
| - | |||
| - | La conversion du PDF officiel FWB vers TXT a produit un fichier fragmenté : les tableaux et listes structurés du programme ont été aplatis en blocs de texte linéaire sans séparateurs clairs. Pour un modèle de 14B dont le contexte d' | ||
| - | </ | ||
| - | |||
| - | <WRAP round box> | ||
| - | **Pourquoi le 8B n'est pas affecté** | ||
| - | |||
| - | Le Ministral 3 8B produit des scores N0/N1 identiques (4,17) sur le même corpus. Les modèles plus petits sont moins sensibles à la fragmentation structurelle car ils opèrent sur des fenêtres de contexte plus courtes et traitent les chunks de manière plus indépendante. | ||
| - | </ | ||
| La régression N1 n'est pas un signe de faiblesse du modèle : elle indique au contraire qu'il est plus exigeant sur la qualité structurelle du corpus. **Recommandation pratique :** pour les modèles 14B et plus, éviter la conversion TXT basique sur des documents officiels à structure complexe. Passer directement de N0 à N2. | La régression N1 n'est pas un signe de faiblesse du modèle : elle indique au contraire qu'il est plus exigeant sur la qualité structurelle du corpus. **Recommandation pratique :** pour les modèles 14B et plus, éviter la conversion TXT basique sur des documents officiels à structure complexe. Passer directement de N0 à N2. | ||
| - | ===== Comportements notables ===== | ||
| - | |||
| - | <WRAP round alert> | ||
| - | **Le cas phi4-mini · une hallucination de type différent** | ||
| - | |||
| - | Sur Q4, phi4-mini n' | ||
| - | </ | ||
| - | |||
| - | <WRAP round tip> | ||
| - | **Le cas Ministral 3 3B · la préparation documentaire comme antidote** | ||
| - | |||
| - | La progression 1/5 > 4/5 > 5/5 sur Q5 est le signal le plus fort de toute la série : un modèle qui hallucine librement en N0 devient rigoureux en N2 sur la même question. Argument décisif pour investir dans la préparation du corpus, même sur des configurations matérielles modestes. | ||
| - | </ | ||
| ===== Enseignements transversaux ===== | ===== Enseignements transversaux ===== | ||
| Ligne 116: | Ligne 87: | ||
| </ | </ | ||
| - | <WRAP round box> | ||
| - | **Les lacunes culturelles locales sont irréductibles par le RAG** | ||
| - | |||
| - | Q4 met en évidence une limite structurelle : les modèles entraînés sur des corpus internationaux ne connaissent pas les spécificités du système scolaire FWB. Aucune préparation documentaire ne peut corriger ce type de lacune. | ||
| - | </ | ||
| <WRAP round box> | <WRAP round box> | ||
| Ligne 131: | Ligne 97: | ||
| ^ Contexte | ^ Contexte | ||
| - | | Usage en établissement scolaire | + | | Serveur IA léger |
| | Config légère - PC portable | | Config légère - PC portable | ||
| - | | Serveur | + | | Serveur |
| | phi4-mini 3.8B | Non recommandé ce corpus | | phi4-mini 3.8B | Non recommandé ce corpus | ||
syntheses/fwb-francais.1779130789.txt.gz · Dernière modification : de cos
