Différences

Ci-dessous, les différences entre deux révisions de la page.

--- syntheses:nextcloud [2026/05/18 19:13] – cos
+++ syntheses:nextcloud [2026/05/18 19:14] (Version actuelle) – cos
@@ Ligne 75: / Ligne 75: @@
 Le 8B occupe une position médiane remarquable : 3,33/5 constant sur les trois niveaux, sans l'inversion du 14B ni la volatilité du 3B. Les deux angles morts (Q2 et Q4) sont structurels et non résolus par aucun niveau de préparation. **Recommandation :** ajuster la taille et le chevauchement des chunks AnythingLLM sur les sections 4.3 et 4.9 du corpus avant tout nouveau test sur ce modèle.
-===== Comportements notables =====
-<WRAP round alert>
-**Hallucinations administrateur · un comportement spécifique au corpus technique**
-Sur le corpus FWB, les hallucinations portaient sur des termes pédagogiques locaux. Sur le corpus Nextcloud, un comportement nouveau apparaît : le 14B en N2 et le 3B en N2 construisent des réponses d'administrateur système complètes (paramètres config.php, extensions PHP, configuration WebRTC, ports TURN) sur des questions qui appelaient uniquement des réponses utilisateur. Ces réponses sont techniquement plausibles et bien rédigées, ce qui les rend particulièrement difficiles à détecter.
-</WRAP>
-<WRAP round info>
-**Corpus anglais, questions françaises · aucun impact observé sur les modèles Ministral**
-Les trois modèles Ministral répondent en français à partir du corpus anglais sans confusion linguistique ni erreur de traduction sur les termes techniques. Résultat notable pour un déploiement RAG en accompagnement d'organisations francophones utilisant des outils open source documentés en anglais.
-</WRAP>
-<WRAP round tip>
-**Le chunking RAG comme variable déterminante · signal adressé à l'infrastructure**
-L'angle mort persistant sur Q2 pour trois modèles sur quatre, et sur Q4 pour le 8B, n'est pas imputable aux modèles eux-mêmes. Les sections concernées existent dans le corpus mais ne sont jamais récupérées par AnythingLLM, quel que soit le niveau de préparation. La taille des chunks et le taux de chevauchement sont des paramètres critiques sur un corpus de plus de 7 000 lignes.
-</WRAP>
 ===== Enseignements transversaux =====
-<WRAP round box>
-**Le corpus technique inverse les conclusions du corpus pédagogique**
-Sur le corpus FWB, le 8B dominait (4,67/5 en N2) et le N2 était le meilleur niveau pour tous les modèles. Sur le corpus Nextcloud, le 14B prend la tête avec N0 comme meilleur niveau, et le 3B préfère N1. La nature du corpus conditionne les résultats autant que la taille du modèle.
-</WRAP>
 <WRAP round box>