Identifier ses données personnelles - RGPD… par où commencer ?

Article rédigé par Amina Belhassena, le 3 octobre 2025

Le RGPD impose aux entreprises de garantir la protection des données personnelles de leurs utilisateurs. La première étape essentielle pour assurer la conformité consiste à identifier les données personnelles présentes dans vos systèmes. Découvrez dans cet article l’importance de cette démarche, les défis à relever pour une détection efficace et comment choisir les bonnes solutions pour garantir une conformité RGPD optimale.

1. Découverte de données : étape incontournable pour la conformité RGPD

Lorsque vous initiez un projet de mise en conformité au RGPD, vous ne savez pas toujours où sont stockées vos données :

Vous ne connaissez pas l'emplacement exact des données : Vos progiciels (ERP, CRM, etc.) contiennent des données, mais vous ignorez où elles sont précisément stockées.
Les éditeurs de logiciels peuvent ne pas pouvoir localiser les données : Dans certains cas, l’éditeur de la solution n’est pas en mesure de localiser les données dans la base, souvent à cause d'une personnalisation ou d'une maîtrise partielle du framework de stockage.

Dans ce contexte, la découverte de données personnelles devient essentielle. En scannant les bases et fichiers selon des algorithmes définis, le logiciel identifie les sources de données et vous aide à constituer votre registre de données pour commencer la mise en conformité.

2. Comment créer et maintenir un registre de données conforme au RGPD ?

Selon la CNIL, « le registre des activités de traitement permet de recenser vos traitements de données et de disposer d’une vue d’ensemble de ce que vous faites avec les données personnelles ». Il est prévu par l’article 30 du RGPD, et participe à la documentation de la conformité.

Pour constituer votre registre, identifiez et indiquez les informations suivantes :

Qui ?
- Responsable du traitement
- Responsables des opérations
- Sous-traitants
Quoi ?
- Catégories de données
- Sensibilité des données
Pourquoi ?
- Finalité de la collecte des données
Où ?
- Lieux de stockage des données
- Pays où les données sont susceptibles d’être transférées
Jusqu’à quand ?
- Durée de conservation des données
Comment ?
- Moyens d’accès et mesures de sécurité mises en place

La constitution de ce registre peut être facilitée par un logiciel de détection des données qui permettra de définir une base technique du travail à effectuer. La connaissance des sources de données et du type de données stockées permettra de catégoriser plus facilement les données, et le risque d’oubli d’une partie des données en sera diminué.

Détectez vos données personnelles et identifiantes avec DATA Discovery

Découvrez DATA DiscoveryDécouvrez DATA Discovery

3. Quels sont les défis à relever lors de la recherche de données personnelles ?

Le principal défi de la détection des données réside dans l’exhaustivité des sources de données et des règles de détection.

Sources de données à recenser

On appelle sources de données tous les endroits où sont conservées les informations :

Bases de données : SQL, NoSQL
Stockages des progiciels hors DB : XML, fichiers
Emails : Serveur et machines des utilisateurs
Données cachées : Fichiers Excel, CSV, documents réseau

Ce recensement ne doit pas être négligé : plus il est détaillé, plus la détection des données sera efficace.

Types de données protégées par le RGPD

Il est important de préciser que les données personnelles protégées par le RGPD ne se limitent pas aux seules données sensibles (opinions politiques, origine raciale, orientation sexuelle, religion…), dont le recueil est en principe interdit sauf exceptions. Toute information permettant d’identifier une personne est considérée comme donnée personnelle, qu'elle soit :

Directement identifiable : nom, photo, empreinte, adresse postale, adresse e-mail, numéro de téléphone, numéro de sécurité sociale, matricule interne, adresse IP, identifiant de connexion, enregistrement vocal, etc.
Indirectement identifiable : informations qui, lorsqu’elles sont croisées avec d’autres données, permettent de remonter à une personne.

Détection des données

Les règles de détection permettent d'identifier ces données, qu'elles soient directes ou quasi-directes, et de garantir leur protection conformément au RGPD.

On retrouve souvent ces données sous des formats spécifiques, détectables par divers procédés informatiques, par exemple :

L’adresse
Le code postal
Le nom
La date de naissance
Le visage dans une image
La positions GPS

Il conviendra ensuite de protéger ces données personnelles dans leur utilisation première et de ne pas les utiliser pour autre chose, excepté si elles sont découplées des données identifiantes (donc anonymisées).

4. Comment choisir une solution de découverte de données ?

Le choix d’une solution de détection de données personnelles repose sur plusieurs critères :

1. La finalité de la détection :

Suppression d’une personne : Rechercher toutes les données d’une personne pour exercer un droit à l’oubli.
Extraction pour tests : Maîtriser une portion ciblée de données pour effectuer des tests sans compromettre la confidentialité.

2. Le coût et la complexité :

Il est inutile de déployer des processus complexes de détection pour des données de mauvaise qualité ou des données qui nécessitent une anonymisation partielle.
Limiter la complexité de détection permet de traiter plus rapidement et à moindre coût.

3. Maîtriser le périmètre du besoin :

Le RGPD ne demande pas d’anonymiser toutes les données de l’entreprise, mais seulement celles qui sortent du cadre de la finalité de leur collecte. Il est donc essentiel de bien définir l'étendue du projet pour éviter des coûts excessifs.

Conclusion

En conclusion, la détection des données personnelles et sa gestion sont des étapes essentielles pour toute entreprise souhaitant respecter le RGPD. Choisir les bonnes solutions de détection et de gestion de données, adaptées aux besoins spécifiques de votre entreprise, est primordial pour garantir une conformité optimale. Contactez-nous pour en savoir plus sur nos outils de découverte de données RGPD et commencer dès aujourd'hui à sécuriser vos données personnelles.

Détectez vos données personnelles et identifiantes avec DATA Discovery

Découvrez DATA DiscoveryDécouvrez DATA Discovery

À propos de l'auteur

Amina Belhassena

Solution Architect, ARCAD Software

Titulaire d’un doctorat en Informatique et Technologies, spécialité Big Data Processing, Amina a travaillé plusieurs années dans différentes entreprises du domaine de la donnée, où elle a acquis une solide expérience en traitement, gestion et valorisation des données. Elle a rejoint ARCAD Software en 2024 en tant que Product Manager, avant d’évoluer vers le poste de Solution Architect DOT, rôle dans lequel elle accompagne aujourd’hui les clients dans leurs projets d’anonymisation et d’échantillonnage des données.

Identifier ses données personnelles – RGPD : Par où commencer ?

1. Découverte de données : étape incontournable pour la conformité RGPD

2. Comment créer et maintenir un registre de données conforme au RGPD ?

Pour constituer votre registre, identifiez et indiquez les informations suivantes :

3. Quels sont les défis à relever lors de la recherche de données personnelles ?

Sources de données à recenser

Types de données protégées par le RGPD

Détection des données

4. Comment choisir une solution de découverte de données ?

1. La finalité de la détection :

2. Le coût et la complexité :

3. Maîtriser le périmètre du besoin :

Conclusion

À propos de l'auteur

Amina Belhassena

Solution Architect, ARCAD Software

Partagez cette ressource !