La qualité des données ou data quality représente un enjeu majeur pour les entreprises. A travers cet article, nous allons vous partager notre expérience sur ce sujet !
N’entendez-vous pas souvent au cours d’un projet: “Les données ne sont pas correctes”, “Pourquoi avons-nous ce résultat ? ”, “Ces données sont expirées” ? Le résultat d’un projet repose principalement sur les données partagées à l’utilisateur final. Une nouvelle application tout juste sortie de production affichant des résultats incorrects suscitera au mieux l’interrogation par les utilisateurs et plus vraisemblablement son abandon.

Qu’est ce que la Data Quality?

La data quality est l’ensemble des actions mises en place par une entreprise pour pérenniser ses données dans le temps. Elle veillera aussi à la pertinence et la cohérence des données restituées. La donnée est une matière qui se transforme. Les coordonnées personnelles des clients changent, le référentiel d’articles d’une entreprise évolue… En plus d’être changeantes, des erreurs humaines peuvent dégrader les données ou présenter des doublons entre les différents systèmes d’informations. Une base de données non maintenue devient très rapidement obsolète. Elle ne reflète plus la réalité et peut avoir des conséquences désastreuses sur une entreprise.

Comment évaluer la qualité de vos données ?

La data quality repose sur six piliers :

  • La fraîcheur des données : plus votre donnée est récente, plus elle a de la valeur. Le rafraîchissement régulier des données permet d’avoir une bonne vision à un instant T et de prendre les bonnes décisions.
  • L’exactitude des données représente la cohérence des données. Les données sont-elles précises? correctes ? Reflètent-elles la réalité ?
  • La disponibilité des données constitue l’accès aux informations par l’utilisateur. On peut l’évaluer selon la présentation et le classement des données. On peut également l’évaluer selon les délais de mise à disposition de celles-ci.
  • La complétude des données est la capacité à une base de données d’avoir l’ensemble des informations demandées par un service d’une entreprise. Elle est fortement liée à l’utilisation. On pourrait se demander si l’ensemble des champs à saisir est bien renseigné.
  • La traçabilité des données permet de suivre l’évolution de la donnée au cours du temps depuis le moment où l’information est collectée, suivi du traitement de la donnée jusqu’à la restitution de celle-ci.
  • La sécurité des données est une notion importante pour les entreprises. Les droits d’accès aux données sensibles et l’ensemble des plans d’actions mis en place contre les fuites ou pertes d’informations sensibles définissent la sécurité des informations.

Pourquoi la qualité des données est un enjeu essentiel pour les entreprises ?

Nous avons vu que la qualité des données repose sur plusieurs critères bien précis et qu’elle a besoin d’être entretenue. Ne pas accorder d’importance à la donnée, c’est accumuler de la donnée sur tout et n’importe quoi qui la rendrait inexploitable.

La non qualité des données engendre des impacts de coûts et d’images sur l’entreprise. Elle peut également contribuer à prendre de mauvaises décisions stratégiques. Pour vous donner un exemple, prenons le cas d’un opérateur mobile. Ses conditions générales de ventes mises à jour impacteront le tarif des forfaits. Il a l’obligation d’avertir son client. Pour cela, l’entreprise s’appuie sur sa base de données pour récupérer les adresses emails ou postales de ses clients. Si l’adresse n’est plus valable, le client risque de ne pas recevoir l’information et constatera le changement lorsque le prélèvement sera effectif sur la facture. Le client pourra donc contester la facture entraînant un geste commercial de la part de l’entreprise ou pire la résiliation du contrat d’abonnement.

Quelles actions mettre en place pour améliorer la qualité des données ?

Pour remettre de l’ordre dans ses données et garder un haut niveau de qualité, différentes approches peuvent être entreprises.

Dans un premier temps, l’équipe en charge de la gestion des données doit déterminer les objectifs stratégiques de son l’entreprise. En effet, c’est en déterminant les objectifs que vont découler les besoins de l’entreprise en terme de données. Suite à cela, l’entreprise doit faire le tri de ses données en se concentrant sur les données essentielles et en supprimant les données inutiles. De plus, l’erreur est humaine, la mauvaise qualité des données repose en partie sur les erreurs de saisies manuelles. Il est donc important de sensibiliser les employés sur la qualité des données et les impacts que cela produisent sur l’entreprise.

Suite à la définition des besoins, un ensemble de processus et de techniques sont à mettre en place pour identifier les données inexactes, incohérentes, incomplètes et garantir un haut niveau de qualité au cours du temps. Pour finir, une phase de contrôle de qualité des données est nécessaire pour s’assurer de l’exactitude des données et de la non surcharge des bases de données. On profitera de cette phase pour contrôler également l’usage des données par les collaborateurs.

La donnée est une source essentielle pour l’entreprise.

La Data Quality, avoir des données précises, fraîches, rapides, disponibles et sécurisées pour les utilisateurs contribuent à la performance de l’entreprise.

   Jean-Luc VU