Depuis 2024, deux approches dominent l'architecture des IA juridiques : le RAG (Retrieval-Augmented Generation), qui connecte un modèle à une base de données externe, et le fine-tuning, qui ré-entraîne un LLM sur un corpus spécialisé pour le faire « parler droit ». En droit francophone — où la norme est dense, la jurisprudence foisonnante et la confidentialité maximale — choisir entre RAG et fine-tuning, ou les combiner, fait la différence entre une IA fiable… et un outil dangereux.

1. RAG et fine-tuning, en langage cabinet

1.1  RAG : l'IA apprend où trouver la réponse

Le RAG consiste à stocker vos documents — codes, lois, jurisprudence, templates, contrats, courriers — dans une base de données externe (souvent vectorielle, comme pgvector), à interroger cette base pour chaque question, puis à enrichir le prompt du LLM avec les extraits les plus pertinents avant de générer la réponse.

En pratique, pour un cabinet francophone : vous posez « Analyse ce bail et contrôle les clauses de durée, révision de loyer et pénalités de retard ». Le système RAG récupère le Code civil, la jurisprudence pertinente et vos modèles de contrats internes, puis le LLM produit une réponse contextualisée avec des extraits citables et sourcés.

Le RAG s'inscrit dans la logique de « retrouver la bonne source » plutôt que de mémoriser la norme en interne — ce qui est crucial dans un droit qui évolue par réformes législatives successives.

1.2  Fine-tuning : l'IA apprend comment répondre

Le fine-tuning consiste à prendre un modèle généraliste (Mistral, Llama, Qwen…), le ré-entraîner sur un jeu de données spécialisé — questions/réponses, contrats annotés, extraits de jurisprudence, templates — afin de modifier ses poids internes pour qu'il réponde mieux dans un domaine ciblé.

Pour un cabinet : vous fournissez des exemples de consultations correctement rédigées, de contrats structurés, de réponses conformes au Code de déontologie, et le modèle « apprend » le style, le ton, la structure attendue et la terminologie juridique francophone. Le fine-tuning correspond à « apprendre le bon style et les bonnes procédures » — plus que la bonne source.

→ Prérequis

Le fine-tuning sur le droit francophone implique de disposer d'un corpus propre, annoté et représentatif. Les enjeux de constitution de ce corpus — notamment pour Légifrance — sont couverts dans l'article n°3 : Légifrance comme corpus d'entraînement.

2. Comparatif : RAG vs Fine-tuning pour le droit francophone

Voici un tableau récapitulatif adapté au contexte juridique francophone — France, OHADA, Maghreb et Golfe :

Critère RAG Fine-tuning
Objectif principal Réponses basées sur des documents précis et traçables Comportement plus stable et cohérent du modèle
Mise à jour des connaissances Très rapide — on met à jour la base (Légifrance, jurisprudence, modèles cabinet) Lente et coûteuse — une réforme majeure implique un ré-entraînement
Coût de maintenance Stockage + index vectoriel ; peu de calcul par requête GPU, cycles d'entraînement répétés, stockage du modèle — élevé à long terme
Traçabilité / citations Excellente — on peut indiquer exactement quels documents ont servi à la réponse Faible — le modèle peut mélanger ce qu'il a appris, sans citation précise
Risque d'hallucinations Réduit si la base est propre et bien indexée Peut persister sur des cas hors-domaine ou peu documentés
Confidentialité Élevée — données restent dans votre base locale ou cloud souverain Délicate si fine-tuning externe — risque de fuite de données métiers
Style et format de sortie Dépend du modèle de base — peut manquer de cohérence rédactionnelle Excellent — le modèle apprend le ton, la structure et les procédures du cabinet

En droit francophone, le RAG l'emporte sur l'actualisation, la traçabilité et la confidentialité — le fine-tuning s'impose pour le style et les procédures répétitives.

3. RAG : le choix de base pour une IA juridique fiable

3.1  Pourquoi commencer par le RAG ?

Les experts en IA appliquée recommandent en 2026 de commencer par le RAG pour la plupart des usages juridiques, puis d'ajouter du fine-tuning si nécessaire. Les raisons sont structurelles :

3.2  RAG concret en droit francophone

Une architecture RAG pour le droit francophone intègre plusieurs couches :

Couche 1 — Base vectorielle
  • Textes juridiques (Légifrance, codes OHADA, droit marocain, tunisien), jurisprudence, templates, contrats, FAQ — encodés et indexés dans pgvector ou FAISS.
  • Index hiérarchisé par juridiction (France, OHADA, Maghreb, Golfe, Common Law, finance islamique) et par spécialité (corporate, fiscal, social-paie, immobilier, compliance).
Couche 2 — Chunking juridique intelligent
  • Pas des blocs de 512 tokens : des sections, articles, clauses et décisions — avec métadonnées (date, juridiction, code, tribunal, thème).
  • Fenêtres de chevauchement pour préserver la continuité des raisonnements à cheval sur plusieurs articles.
Couche 3 — Agents thématiques
  • Un Agent Bail qui récupère le Code civil, la jurisprudence locative et vos modèles de baux internes.
  • Un Agent Conformité RGPD qui tire de la base vos politiques internes, la réglementation européenne et la jurisprudence CNIL.
  • Un Agent Multi-juridiction qui bascule automatiquement entre droit français, OHADA et droit marocain/tunisien selon le contexte du dossier.

4. Fine-tuning : la spécialisation fine du comportement

4.1  Quand le fine-tuning est pertinent

Le fine-tuning devient pertinent lorsque le RAG seul ne suffit plus à standardiser le comportement du modèle. Les cas d'usage typiques en droit francophone :

4.2  Limites du fine-tuning pur

Le fine-tuning ne peut pas remplacer le RAG pour les raisons suivantes :

⚠ Risque métier

Une IA juridique fondée uniquement sur le fine-tuning risque d'être obsolète, peu traçable et juridiquement dangereuse, même si le style est impeccable. L'apparence de compétence — réponses bien formulées, jargon juridique maîtrisé — masque un risque réel d'inexactitude sur le fond.

5. Combinaison RAG + fine-tuning : la stack souveraine Actelyo

Actelyo adopte une architecture RAG-d'abord, fine-tuning ensuite, déployée de façon souveraine en on-premise ou local-first.

5.1  Architecture RAG-d'abord

Le RAG est au cœur de la plateforme Actelyo :

5.2  Fine-tuning ciblé sur le comportement

Le fine-tuning intervient en complément, de manière ciblée :

En pratique : le modèle fine-tuné sait comment répondre — l'actualité normative vient du RAG. Les deux couches sont complémentaires et non substituables.

5.3  Sécurité et souveraineté

L'ensemble de la stack tourne dans une architecture souveraine :

→ Architecture technique détaillée

Le détail de l'infrastructure Docker, pgvector et de l'orchestration des conteneurs est documenté dans l'article n°14 : Docker, pgvector et RAG : l'infrastructure d'une IA juridique souveraine.

6. Comment choisir pour votre cabinet francophone

Voici une matrice de décision pour un cabinet francophone en 2026 :

Votre situation RAG d'abord Fine-tuning en complément
Vos documents changent souvent ? Oui → RAG indispensable Non → fine-tuning peut suffire
Besoin de citations et de traçabilité ? Oui → RAG fortement préféré Non → fine-tuning acceptable
Sortie ultra-structurée attendue (style maison) ? Suffisant pour la connaissance, peut manquer de cohérence formelle Oui → fine-tuning pour le ton et la structure
Confidentialité maximale ? RAG en local/on-premise → idéal Préférer fine-tuning local — risque si entraînement externe
Plusieurs juridictions couvertes ? Un même modèle, plusieurs bases — flexibilité maximale Multiplicité de modèles fine-tunés → complexité et coût

La recommandation pratique pour un cabinet francophone en 2026 est claire : commencez par une architecture RAG (base de données vectorielle, intégration Légifrance, jurisprudence, templates), ajoutez du fine-tuning ciblé pour le ton et les procédures internes, et déployez le tout dans une architecture souveraine — on-premise, Docker, BYOK.

Conclusion

RAG et fine-tuning ne sont pas des alternatives exclusives — ce sont deux couches complémentaires d'une IA juridique mature. Le RAG garantit l'exactitude factuelle, l'actualisation et la traçabilité ; le fine-tuning garantit la cohérence comportementale et la conformité aux pratiques du cabinet. Pris séparément, chacun est insuffisant. Combinés dans une architecture souveraine, ils forment le socle d'une IA juridique fiable, responsable et durablement à jour.

En droit francophone — où la technicité normative est élevée, les réformes fréquentes et la responsabilité professionnelle engagée à chaque consultation — cette combinaison n'est pas un luxe : c'est la condition minimale d'un déploiement éthique et professionnel de l'intelligence artificielle.