ChatGPT est impressionnant. GitHub Copilot change la vie des développeurs. Mais dans un cabinet d'avocats ou un office notarial, envoyer des données clients vers un serveur américain n'est pas une question de préférence — c'est une question déontologique. L'IA locale résout ce problème en ramenant le calcul là où les données doivent rester : chez vous. Voici ce que ça signifie concrètement.
1. Définition : qu'est-ce qu'une IA locale ?
1.1 La distinction fondamentale : où tourne le modèle ?
Lorsqu'on parle d'IA générative, la question centrale n'est pas de savoir quel modèle est utilisé — c'est de savoir où ce modèle s'exécute. Trois configurations sont possibles dans le monde professionnel :
ChatGPT, Copilot, Gemini — Le modèle tourne chez l'éditeur, à l'étranger. Chaque requête transite par des serveurs tiers.
OVHcloud AI, Scaleway — Serveurs européens avec garanties contractuelles, mais les données quittent tout de même votre périmètre.
Le modèle tourne sur votre propre serveur. Aucune donnée ne quitte votre infrastructure. Jamais.
Une IA locale (ou on-premise) est un système d'intelligence artificielle dont le moteur d'inférence s'exécute sur du matériel physiquement contrôlé par l'organisation. Les modèles de langage (LLM) sont chargés en mémoire GPU sur ce matériel et traitent les requêtes sans jamais transmettre de données à un tiers. La connexion Internet est optionnelle et peut être entièrement coupée sans affecter le fonctionnement du système.
1.2 IA locale ne signifie pas IA dégradée
Une idée reçue persistante : l'IA locale serait forcément moins performante que les grandes plateformes cloud. Ce n'est plus vrai depuis 2024. Plusieurs évolutions convergentes ont changé la donne :
- Quantization et compression — les techniques GGUF, AWQ, GPTQ permettent de faire tourner des modèles de 13 à 70 milliards de paramètres sur du matériel professionnel standard, avec une perte de performance inférieure à 5 % par rapport aux versions complètes.
- Modèles spécialisés — un modèle de 7B paramètres fine-tuné sur du droit français surpasse systématiquement un modèle généraliste de 70B sur les tâches juridiques ciblées. La taille brute ne détermine pas la pertinence.
- Architecture RAG — en connectant un modèle local à une base documentaire juridique à jour, on compense sa date de coupure et on lui fournit des sources vérifiables — avantage que les grandes plateformes cloud n'offrent pas nativement pour votre corpus propre.
- Hardware accessible — un serveur équipé d'un Nvidia RTX 4090 (environ 2 500 €) suffit pour faire tourner Mistral 7B en local. Pour les cabinets plus exigeants, un A100 80 GB couvre les modèles jusqu'à 70B.
2. Pourquoi le cabinet d'avocats n'est pas une entreprise comme les autres
2.1 Le secret professionnel : un impératif absolu
L'article 66-5 de la loi n° 71-1130 du 31 décembre 1971 est catégorique : le secret professionnel de l'avocat est « général, absolu et illimité dans le temps ». Sa violation est un délit pénal (art. 226-13 du Code pénal, puni d'un an d'emprisonnement et de 15 000 € d'amende).
La question juridique qui se pose lorsqu'un avocat utilise ChatGPT avec des données clients est simple : envoyer des informations confidentielles vers les serveurs d'OpenAI constitue-t-il une divulgation à un tiers ? La réponse du CNB et de plusieurs barreaux européens est convergente : oui, si les données ne sont pas suffisamment anonymisées et si les garanties contractuelles sont insuffisantes.
Dans son avis du 17 novembre 2023, le CNB a rappelé que l'utilisation d'outils IA cloud par les avocats doit être conforme aux règles du secret professionnel et du RGPD. Il recommande explicitement de privilégier des solutions permettant un traitement local des données ou des outils avec des garanties contractuelles fortes d'isolation et de non-réutilisation. La Conférence des Bâtonniers a formulé des recommandations similaires en mars 2024.
2.2 Le RGPD et les données des clients
Les cabinets traitent des données personnelles sensibles (état civil, santé dans certains contentieux, données financières, données judiciaires). L'article 28 du RGPD impose que tout sous-traitant — ce qu'est un prestataire IA cloud — fasse l'objet d'un contrat de sous-traitance détaillant les garanties. Les conditions générales des grands prestataires américains sont, dans la majorité des cas, insuffisantes.
L'IA locale supprime ce problème à la racine : puisque les données ne quittent pas votre infrastructure, il n'y a pas de sous-traitance au sens du RGPD.
2.3 La responsabilité professionnelle en cas de fuite
Que se passe-t-il si des données clients transitant par un service IA cloud font l'objet d'une data breach ? Les conséquences sont multiples :
- Notification obligatoire à la CNIL dans les 72 heures (art. 33 RGPD) ;
- Notification aux clients concernés si le risque est élevé (art. 34 RGPD) ;
- Risque d'action disciplinaire devant le Bâtonnier pour violation du secret professionnel ;
- Mise en jeu de la responsabilité civile professionnelle ;
- Risque réputationnel considérable dans un métier fondé sur la confiance.
Une IA locale élimine ce vecteur de risque. Une fuite ne peut survenir que depuis votre propre infrastructure — que vous contrôlez, sécurisez et auditez.
3. La comparaison complète
Ce tableau révèle une réalité que les équipes commerciales des grandes plateformes SaaS préfèrent ne pas mettre en avant : pour les professions réglementées, les critères les plus importants sont systématiquement du côté de l'on-premise.
| Critère | SaaS cloud généraliste | Cloud souverain | IA locale on-premise |
|---|---|---|---|
| Données hébergées chez vous | ✗ Non | ✗ Non | ✓ Oui |
| Secret professionnel garanti | ✗ Non | ◑ Partiel | ✓ Oui |
| Fonctionnement hors connexion | ✗ Non | ✗ Non | ✓ Oui |
| Mise à jour modèle libre | ✗ Non | ◑ Partiel | ✓ Oui |
| Contrôle total du corpus | ✗ Non | ◑ Partiel | ✓ Oui |
| Conformité RGPD native | ✗ Non | ◑ Partiel | ✓ Oui |
| Coût prévisible long terme | ✗ Non | ◑ Partiel | ✓ Oui |
| Déploiement immédiat | ✓ Oui | ✓ Oui | ✗ Non |
| Puissance de calcul illimitée | ✓ Oui | ✓ Oui | ✗ Non |
| Mises à jour automatiques | ✓ Oui | ✓ Oui | ✗ Non |
4. La stack technique d'une IA locale pour cabinet juridique
4.1 Les composants essentiels
Une IA locale professionnelle n'est pas un simple logiciel à installer. C'est un écosystème de composants qui interagissent. Voici la stack complète déployée par Actelyo :
| Couche | Composant Actelyo | Licence | Rôle |
|---|---|---|---|
| Orchestration | Paperclip | Open source, MIT | Coordonne les agents IA entre eux et avec les outils |
| Agents IA | OpenClaw | Open source | Exécution des tâches autonomes (revue, rédaction, veille) |
| Base RAG | AcBase / pgvector | PostgreSQL + extension | Stockage vectoriel des documents juridiques indexés |
| LLM routing | LiteLLM | Apache 2.0 | Aiguille les requêtes vers le bon modèle selon la tâche |
| Modèle LLM | Mistral 7B/Large | Apache 2.0 / commercial | Modèle francophone de base, fine-tuné droit français |
| Documents | AnythingLLM | Open source | Interface ingestion et gestion du corpus documentaire |
| Signature | DocuSeal (AcSign) | Open source | Signature électronique conforme eIDAS, sans cloud tiers |
| ERP cabinet | Dolibarr (AcBook) | Open source, GPL | Comptabilité, facturation, gestion des dossiers clients |
| Infrastructure | Docker Compose | Open source | Isolation par conteneur, déploiement reproductible |
| Base de données | PostgreSQL | Open source | Données structurées + vecteurs (pgvector) en un seul SGBD |
4.2 Pourquoi l'open source est un impératif de souveraineté
Actelyo a fait le choix délibéré de construire sur une stack 100 % open source. Ce choix n'est pas idéologique — il est stratégique pour trois raisons :
- Absence de dépendance fournisseur — aucun composant propriétaire ne peut décider unilatéralement d'augmenter ses tarifs ou de modifier ses conditions.
- Auditabilité — le code source étant disponible, n'importe quel expert en sécurité peut vérifier qu'aucune donnée n'est exfiltrée vers un tiers.
- Évolutivité libre — la stack peut intégrer le dernier modèle Mistral, LLaMA ou Qwen dès sa sortie, sans attendre un éditeur propriétaire.
Tous les composants open source intégrés sont renommés sous la marque Actelyo (AcBase, AcSign, AcBook, AcRH) et exposés via des API propriétaires. Cette architecture « API-only » garantit qu'Actelyo ne propage pas les licences GPL/AGPL des outils sous-jacents vers le code applicatif — une précaution juridique indispensable pour un éditeur de logiciel commercial.
4.3 Le matériel nécessaire
L'une des objections les plus fréquentes à l'IA locale est le coût et la complexité du matériel. Voici la réalité des configurations nécessaires selon la taille du cabinet :
| Profil | Petit cabinet (1–5) | Cabinet moyen (6–20) | Grand cabinet (20+) |
|---|---|---|---|
| GPU recommandé | RTX 4090 (24 GB) | A6000 (48 GB) | A100 80 GB × 2 |
| Modèle adapté | Mistral 7B Q4 | Mistral 13B / 30B | Mistral Large (70B+) |
| RAM système | 32 GB DDR5 | 64 GB DDR5 | 128–256 GB DDR5 |
| Stockage corpus | 2 To NVMe | 4–8 To NVMe RAID | 10–20 To NVMe RAID |
| Coût matériel estimé | ~3 500–5 000 € | ~8 000–15 000 € | ~25 000–50 000 € |
| Délai déploiement | 3–5 jours ouvrés | 1–2 semaines | 2–4 semaines |
5. Les cas d'usage concrets
5.1 Vue d'ensemble : ce que l'IA locale fait aujourd'hui
| Tâche | Sans IA | Avec Actelyo | Ce que fait l'IA |
|---|---|---|---|
| Revue de contrat | 15–45 min | 2–4 min | Extraction clauses, signalement risques, résumé exécutif |
| Rédaction d'acte | 2–4 h | 20–40 min | Génération sur modèle paramétré, vérification obligations |
| Recherche juridique | 1–3 h | 5–15 min | Interrogation corpus filtré, sources citées et vérifiables |
| Veille réglementaire | 2–4 h/semaine | Automatique | Agent surveillant Légifrance + JOUE + sources sectorielles |
| Résumé de jurisprudence | 30–60 min/arrêt | 3–5 min/arrêt | Syllabus structuré : faits, question de droit, solution |
| Préparation d'audience | 3–6 h | 45–90 min | Consolidation pièces, chronologie, arguments contradictoires |
| Due diligence M&A | 5–15 jours | 2–4 jours | Revue de data room, cartographie risques, rapport structuré |
| RGPD / Conformité | Temps variable | Continu / auto | Agent Conformité : audit permanent des traitements |
5.2 Cas d'usage #1 : la revue de contrat augmentée
La revue de contrat est la tâche la plus chronophage et la plus à risque dans un cabinet. Un avocat expérimenté consacre en moyenne 3 à 4 heures à la revue complète d'un contrat commercial standard (30 à 80 pages). Actelyo réduit ce temps à 20 à 40 minutes en réalisant automatiquement :
- L'extraction de toutes les clauses structurantes (durée, résiliation, garanties, indemnités, loi applicable, juridiction compétente) ;
- Le signalement des clauses déséquilibrées ou inhabituelles par rapport aux standards de marché intégrés dans la base ;
- La vérification de la conformité aux obligations légales en vigueur ;
- La production d'un mémo de revue structuré en quelques minutes, que l'avocat complète et valide.
L'avocat reste décisionnaire sur chaque point signalé. L'IA ne supprime pas le jugement — elle supprime le travail mécanique qui précède ce jugement.
5.3 Cas d'usage #2 : la recherche juridique RAG
La question est posée en langage naturel. Le système retrouve les décisions pertinentes dans la base (jurisprudence indexée depuis Légifrance, enrichie des arrêts du cabinet) et les présente triées par pertinence avec leurs références complètes. La synthèse est générée : évolution de la jurisprudence, points de convergence, divergences entre chambres, dernière décision en date. Chaque affirmation est liée à sa source.
« Avant Actelyo, une recherche jurisprudentielle sur un sujet un peu pointu me prenait facilement une demi-journée entre la recherche sur LexisNexis, la lecture des arrêts et la synthèse. Maintenant, j'obtiens une première synthèse en 8 minutes, que je complète et valide. Le gain n'est pas seulement en temps — c'est aussi en sérénité : je sais que je n'ai pas oublié un arrêt important. »
5.4 Cas d'usage #3 : l'agent de veille réglementaire
L'Agent Conformité d'Actelyo surveille en permanence les sources d'évolution légale pertinentes pour le cabinet et ses clients :
- Publications au Journal Officiel (via l'API Légifrance, mise à jour quotidienne) ;
- Nouvelles décisions de jurisprudence dans les domaines pratiqués ;
- Nouvelles circulaires et instructions administratives des ministères ;
- Publications de l'AMF, de l'ACPR, de la CNIL selon les domaines de pratique ;
- Alertes sur les dossiers clients spécifiques (publication de nouvelles normes applicables).
L'agent produit chaque matin une newsletter personnalisée structurée par domaine de pratique. Ce qui demandait 2 à 4 heures de travail hebdomadaire devient un processus entièrement automatisé.
6. Les questions fréquentes des avocats
« Faut-il une DSI pour gérer ça ? »
Non. Actelyo est déployé et maintenu par nos équipes techniques. Le cabinet ne gère qu'un accès à une interface web — exactement comme un SaaS, mais avec une infrastructure hébergée chez vous. Les mises à jour, la sécurité et la maintenance sont assurées par Actelyo dans le cadre d'un contrat de support. La compétence informatique interne requise est nulle.
« Est-ce que ça tombe en panne ? »
Tout système informatique peut connaître une défaillance. La différence avec le SaaS cloud : vous n'êtes pas dépendant de la disponibilité d'un tiers. En cas de problème sur votre serveur local, votre équipe technique ou Actelyo en télémaintenance intervient directement. Il n'y a pas de page de statut à surveiller, pas de panne généralisée affectant tous vos confrères simultanément.
« L'IA locale peut-elle s'améliorer au fil du temps ? »
Oui, de deux manières. Premièrement, la base RAG s'enrichit en continu : chaque nouveau texte légal, chaque nouvelle décision jurisprudentielle, chaque acte produit par le cabinet (avec son accord) améliore les réponses. Deuxièmement, les modèles de langage peuvent être remplacés ou mis à jour sans changer d'interface — le cabinet bénéficie des progrès de l'écosystème open source sans coût supplémentaire.
« L'IA va-t-elle remplacer mes collaborateurs ? »
Non. L'IA locale augmente les collaborateurs, elle ne les remplace pas. Un avocat augmenté par Actelyo produit davantage, avec moins d'erreurs mécaniques, sur des tâches de plus haute valeur ajoutée. Les cabinets du Programme Pionniers n'ont pas réduit leurs effectifs — ils ont augmenté leur volume d'affaires traité avec les mêmes équipes.
Conclusion : l'IA locale n'est pas l'avenir — c'est le présent responsable
La question n'est plus de savoir si les cabinets d'avocats vont adopter l'IA. Elle est déjà là, dans leurs pratiques quotidiennes — souvent sous forme de ChatGPT utilisé en cachette par des collaborateurs qui n'ont pas attendu l'autorisation du managing partner. La vraie question est : quelle IA ? Avec quelles garanties ? Sur quelle infrastructure ?
Pour les professions réglementées, la réponse ne peut pas être « n'importe quelle IA cloud pourvu qu'elle soit utile ». Le secret professionnel, le RGPD, la responsabilité déontologique ne sont pas des contraintes négociables. Ils définissent le périmètre dans lequel toute solution technologique doit s'inscrire.
L'IA locale n'est pas une option pour les perfectionnistes. C'est la seule architecture compatible avec les obligations fondamentales des professions juridiques. Actelyo a été construit sur cette conviction — et chaque cabinet qui rejoint le Programme Pionniers en fait l'expérience concrète, dès le premier jour de déploiement.
Article #12 — On-premise vs SaaS cloud : le vrai coût total pour un cabinet juridique. TCO sur 3 ans, risques RGPD, dépendance fournisseur : l'analyse chiffrée qui aide les cabinets à prendre la bonne décision d'infrastructure.
Les mécanismes RAG mentionnés dans cet article sont analysés dans l'article n°5 : RAG vs Fine-tuning. L'automatisation documentaire est traitée dans l'article n°10 : L'automatisation documentaire dans les cabinets juridiques.