Guide

Comment SafeDoc anonymise vos documents (visuellement).

SafeDoc sécurise l’usage des IA externes grâce à un processus simple : anonymiser, analyser, désanonymiser.
Un flux contrôlable : import → détection → remplacement → vérification → export (et restauration optionnelle).

Retour à l’accueil Voir le flux

Vue d’ensemble (1 minute)

Entrée

Document unique, texte collé, ou traitement multi-documents via Data Room.

Protection

Choisissez le type de remplacement et le niveau N1 → N2 (N3 en roadmap Q3 2026) selon votre risque.

Sorties

Texte prêt à copier + mapping (si réversible) + indicateurs de risque résiduel.

1) Importer : Fichier, Texte, ou Data Room

Capture SafeDoc : zone d’import et choix du mode

Importer

Importer un fichier, coller du texte, ou utiliser la Data Room pour traiter plusieurs documents.

Capture SafeDoc : module de restauration via mapping JSON

Restaurer

Réinjecter localement les valeurs à partir d’un mapping_xxx.json et d’une réponse IA tokenisée.

Data Room

Analyse multi-documents avec pseudonymes cohérents sur tout le lot.

Options d’import

Importer un fichier : glisser-déposer ou sélectionner un document (PDF/DOCX/TXT).
Coller du texte : pratique pour un e-mail, un extrait, une note.
Data Room (multi-documents) : importer plusieurs documents d’un coup pour une analyse multi-documents.

Fichier Texte Data Room

Pourquoi Data Room est utile

En mode pseudonymisation, l’entité “Carrefour” reste le même pseudonyme dans tous les documents.

Document 1

Document 2

Carrefour

[ORG_2]

Idéal pour due diligence, lots contractuels, dossiers multi-pièces.

2) Choisir le mode : Anonymisé, Pseudonymisé, ou Fictif

Anonymisé

Remplacement par tokens génériques : [PERSONNE], [LIEU]…

Quand vous ne voulez conserver aucun lien entre occurrences.

Pseudonymisé

Tokens numérotés et cohérents : [PERSONNE_1], [ORG_2].

Parfait pour garder le “fil” narratif (même entité → même identifiant).

Données fictives

Remplacements lisibles (noms/adresses inventés) pour un texte “naturel”.

Pratique pour relire ou présenter, sans exposer les vraies valeurs.

3) Monter en protection : N1, N2, N3 (roadmap)

Principe

Plus vous montez en niveau, plus SafeDoc réduit la capacité de ré-identification par le contexte (dates, montants, lieux, style).

N1 Standard

Tokenisation PII / nettoyage de base.

N2 Avancé

Généralisation et réduction contextuelle renforcées.

N3 Haute sécurité

Protections supplémentaires. Roadmap Q3 2026.

Exemple visuel

« 17,3 M— – 12 février 2026 – Rouen »

↓

N2 (N3 roadmap) : réduction du contexte

↓

« mid-teen millions – T1 2026 – Nord de la France »

Le but est de conserver le sens utile tout en diminuant l’identifiabilité.

4) Vérifier : entités détectées et scan résiduel

Entités détectées

Vérifier, filtrer et ajuster ce qui doit être anonymisé.

Capture SafeDoc : résultat anonymisé et options de copie/mapping

Texte prêt

Copier le résultat anonymisé + récupérer mapping/rapport si nécessaire.

Ce que vous contrôlez

Entités détectées : personnes, organisations, lieux, emails, téléphones, IBAN, montants…
Choix utilisateur : vous pouvez décocher ce que vous ne souhaitez pas anonymiser.
Comparaisons : vues par source (ex. IA vs regex) selon l’interface.

Pourquoi la relecture reste clé

La détection peut produire des faux positifs (masquage excessif) ou des faux négatifs (oubli). Les indicateurs (scan résiduel / leakage score) aident à évaluer le risque, mais ne remplacent pas une vérification humaine.

5) Exporter + Restaurer (optionnel)

Sorties principales

Texte anonymisé : prêt à copier dans un outil d’IA.
Mapping JSON : correspondance “original → token” si vous activez un mode réversible.
Rapport : éléments d’audit et indicateurs (selon le niveau).

Restaurer une réponse IA

Collez la réponse de l’IA contenant les tokens, puis importez votre mapping pour réinjecter localement les valeurs.

Prêt à tester sur un document réel ?

Anonymisez en quelques secondes.

Ouvrir SafeDoc Lire la FAQ