tests:s2-fwb-francais_ministral-3-14b_serveur-ia
Différences
Ci-dessous, les différences entre deux révisions de la page.
| Prochaine révision | Révision précédente | ||
| tests:s2-fwb-francais_ministral-3-14b_serveur-ia [2026/05/22 08:35] – créée cos | tests:s2-fwb-francais_ministral-3-14b_serveur-ia [2026/05/22 09:50] (Version actuelle) – cos | ||
|---|---|---|---|
| Ligne 21: | Ligne 21: | ||
| | RAM | 32 Go | | | RAM | 32 Go | | ||
| | GPU | RX 9060 XT · 16 Go VRAM | | | GPU | RX 9060 XT · 16 Go VRAM | | ||
| - | | OS | Linux | + | | OS | Linux Mint 22 |
| ^ Scores moyens | ^ Scores moyens | ||
| Ligne 41: | Ligne 41: | ||
| **Point critique · Q5 · aveu d' | **Point critique · Q5 · aveu d' | ||
| - | Aucun niveau ne restitue le tableau des périodes hebdomadaires (S1 : 6 périodes, S2 : 4 périodes, S3 : 4 périodes) pourtant présent aux pages 3-4 du corpus. Le modèle adopte un comportement cohérent et prudent en déclarant ne pas trouver l' | + | Aucun niveau ne restitue le tableau des périodes hebdomadaires (S1 : 6 périodes, S2 : 4 périodes, S3 : 4 périodes) pourtant présent aux pages 3-4 du corpus. Le modèle adopte un comportement cohérent et prudent en déclarant ne pas trouver l' |
| </ | </ | ||
| Ligne 47: | Ligne 47: | ||
| **Point critique · Q1 · régression inexpliquée en N2** | **Point critique · Q1 · régression inexpliquée en N2** | ||
| - | En N0 et N1, le modèle restitue correctement les compétences de fin de S3 depuis les pages 184-185 du programme | + | En N0 et N1, le modèle restitue correctement les compétences de fin de S3 depuis les pages 184-185 du programme. En N2, il admet ne pas trouver les attendus détaillés et renvoie au tableau synoptique de la section 4.2.3, réponse générée en 24 secondes seulement, signe que peu de contexte pertinent a été récupéré. Ce comportement paradoxal |
| </ | </ | ||
| Ligne 53: | Ligne 53: | ||
| **Point critique · Q4 · confusion persistante sur les trois niveaux** | **Point critique · Q4 · confusion persistante sur les trois niveaux** | ||
| - | La question sur les liens entre français et disciplines d' | + | La question sur les liens entre français et disciplines d' |
| </ | </ | ||
| Ligne 71: | Ligne 71: | ||
| **Comportement notable · Q6 · montée en qualité en N2** | **Comportement notable · Q6 · montée en qualité en N2** | ||
| - | La question sur l' | + | La question sur l' |
| </ | </ | ||
| Ligne 79: | Ligne 79: | ||
| **14B vs 8B sur le même corpus et le même embedding : le volume de paramètres paye sur la prudence** | **14B vs 8B sur le même corpus et le même embedding : le volume de paramètres paye sur la prudence** | ||
| - | Le 14B se distingue du 8B par un comportement plus prudent face aux données manquantes. Là où le 8B hallucine 34 périodes en N0 sur Q5, le 14B admet son ignorance sur les trois niveaux. Cette sobriété épistémique est un avantage concret en contexte RAG pédagogique, | + | Le 14B se distingue du 8B par un comportement plus prudent face aux données manquantes. Là où le 8B hallucine 34 périodes en N0 sur Q5, le 14B admet son ignorance sur les trois niveaux. Cette sobriété épistémique est un avantage concret en contexte RAG pédagogique, |
| </ | </ | ||
| Ligne 103: | Ligne 103: | ||
| <WRAP round box> | <WRAP round box> | ||
| - | **N0 · ★★★★☆ · Correct | + | **N0 · ★★★★☆ · Pertinent sous conditions |
| 3,67/5 en moyenne. Le 14B gère le PDF brut sans hallucination, | 3,67/5 en moyenne. Le 14B gère le PDF brut sans hallucination, | ||
tests/s2-fwb-francais_ministral-3-14b_serveur-ia.1779438923.txt.gz · Dernière modification : de cos
