Guide

Comment Safe-Doc pseudonymise ou anonymise vos documents (visuellement).

Safe-Doc sécurise l'usage des IA externes grâce à un processus simple : pseudonymiser (ou anonymiser), analyser, désanonymiser.
Un flux contrôlable : import → détection → remplacement → vérification → export (et restauration optionnelle).

Vue d'ensemble (1 minute)

Entrée

Document unique, texte collé, ou traitement multi-documents via Data Room.

Protection

Choisissez le type de remplacement et le niveau N1–N2 (N3 en roadmap Q3 2026) selon votre risque.

Sorties

Texte prêt à copier + mapping (si réversible) + indicateurs de risque résiduel.

1) Importer : Fichier, Texte, ou Data Room

Capture Safe-Doc : zone d'import et choix du mode

Importer

Importer un fichier, coller du texte, ou utiliser la Data Room pour traiter plusieurs documents.

Capture Safe-Doc : module de restauration via mapping JSON

Restaurer

Réinjecter localement les valeurs à partir d'un mapping_xxx.json et d'une réponse IA tokenisée.

Capture Safe-Doc : section Data Room multi-documents

Data Room

Analyse multi-documents avec pseudonymes cohérents sur tout le lot.

Options d'import

  • Importer un fichier : glisser-déposer ou sélectionner un document (PDF/DOCX/TXT).
  • Coller du texte : pratique pour un e-mail, un extrait, une note.
  • Data Room (multi-documents) : importer plusieurs documents d'un coup pour une analyse multi-documents.
Fichier Texte Data Room

Pourquoi Data Room est utile

En mode pseudonymisation, l'entité "Carrefour" reste le même pseudonyme dans tous les documents.

Document 1
Document 2
Carrefour
Carrefour
[ORG_2]
[ORG_2]

Idéal pour due diligence, lots contractuels, dossiers multi-pièces.

2) Choisir le mode : Anonymisé, Pseudonymisé, ou Fictif

Anonymisé

Remplacement par tokens génériques : [PERSONNE], [LIEU]

Quand vous ne voulez conserver aucun lien entre occurrences.

Pseudonymisé

Tokens numérotés et cohérents : [PERSONNE_1], [ORG_2].

Parfait pour garder le "fil" narratif (même entité → même identifiant).

Données fictives

Remplacements lisibles (noms/adresses inventés) pour un texte "naturel".

Pratique pour relire ou présenter, sans exposer les vraies valeurs.

3) Monter en protection : N1–N2, N3 (roadmap)

Principe

Plus vous montez en niveau, plus Safe-Doc réduit la capacité de ré-identification par le contexte (dates, montants, lieux, style).

N1–N2 Standard · Avancé

Identifiants directs (PII) et contexte à risque : tokenisation, nettoyage et généralisation (dates, montants, lieux, références).

N3 Haute sécurité

Empreinte stylistique et signaux faibles. Roadmap Q3 2026.

Exemple visuel

« 17,3 M- – 12 février 2026 – Rouen »
N1–N2 : réduction du contexte · N3 (roadmap)
« mid-teen millions – T1 2026 – Nord de la France »

Le but est de conserver le sens utile tout en diminuant l'identifiabilité.

4) Vérifier : entités détectées et scan résiduel

Capture Safe-Doc : tableau des entités détectées et ajustement

Entités détectées

Vérifier, filtrer et ajuster ce qui doit être pseudonymisé ou anonymisé.

Capture Safe-Doc : résultat pseudonymisé et options de copie/mapping

Texte prêt

Copier le résultat pseudonymisé + récupérer mapping/rapport si nécessaire.

Ce que vous contrôlez

  • Entités détectées : personnes, organisations, lieux, emails, téléphones, IBAN, montants…
  • Choix utilisateur : vous pouvez décocher ce que vous ne souhaitez pas pseudonymiser ou anonymiser.
  • Comparaisons : vues par source (ex. IA vs regex) selon l'interface.

Pourquoi la relecture reste clé

La détection peut produire des faux positifs (masquage excessif) ou des faux négatifs (oubli). Les indicateurs (scan résiduel / leakage score) aident à évaluer le risque, mais ne remplacent pas une vérification humaine.

5) Exporter + Restaurer (optionnel)

Sorties principales

  • Texte pseudonymisé (ou anonymisé selon le mode) : prêt à copier dans un outil d'IA.
  • Mapping JSON : correspondance "original → token" si vous activez un mode réversible.
  • Rapport : éléments d'audit et indicateurs (selon le niveau).

Restaurer une réponse IA

Collez la réponse de l'IA contenant les tokens, puis importez votre mapping pour réinjecter localement les valeurs.

Prêt à tester sur un document réel ?

Pseudonymisez ou anonymisez en quelques secondes.