Data Mining, l’art de faire parler les données

Extraire du savoir de la Data

Le Data Mining se traduit, en français, par plusieurs expressions comme exploration de données ou fouille de données. Ou même encore extraction de connaissances à partir de données, qui expose clairement le but de cette technologie. En effet, il s’agit d’obtenir des connaissances à partir de grandes quantités de données. 

Cette technologie utilise un ensemble d’algorithmes issus de disciplines telles que les statistiques, l’intelligence artificielle ou l’informatique. Pour ainsi construire des modèles à partir des données. C’est-à-dire trouver des corrélations ou des patterns (motifs) entre de nombreuses bases de données relationnelles et d’en extraire un maximum de connaissances. 

L’utilisation de ce savoir dans le monde professionnel répond à plusieurs problématiques, allant de la gestion de la relation client à la maintenance préventive, en passant par la détection de fraudes. 

L’exploration de données suit le mouvement de l’exploitation toujours plus poussée des données de l’entreprise. Si la Business Intelligence permet de constater un fait et de l’expliquer, l’exploration de données permet de classer les faits et d’en extraire des prévisions ou de les éclairer en révélant par exemple les variables ou les paramètres qui pourraient expliquer un comportement d’achat, des différences de chiffres d’affaires ou l’impact d’une campagne marketing.

data mining mind7 consulting

Des acteurs bien connus

A la différence des produits de BI ou de BMP, les solutions de Data Mining ne sont jamais totalement autosuffisantes. En effet, l’assistance d’un consultant spécialisé en Data Science ou d’un Data Scientist est fortement recommandée afin de rendre les résultats compréhensibles. Le marché se divise entre produits commerciaux et logiciels open source.

Parmi les leaders des solutions commerciales on retrouve IBM Cognos, Microsoft SQL Server Analysis, Google Analytics Data Mining R, Dataiku, Tibco Software, SAS Enterprise Miner, Isoft Alice, Statistica Data Miner et Oracle Advanced Analytic Data Mining.

Dans le monde de l’open-sucre on trouve des solutions comme Weka, Rapid Miner, Knime et Orange. 

Le dernier Magic Quadrant de Gartner mêle les plateformes de Data Science et de Machine Learning. Il relie ces deux technologies avec le Data Mining. Il donne cependant une bonne idée de la hiérarchie des forces en présence.

Parmi les leaders on trouve Alteryx, Mathworks, Databricks, Dataiku, SAS et Tibco Sofware. Il place IBM comme unique challenger. Microsoft, Google, Rapid Miner et Knime sont classés parmi les visionnaires. 

Un outil transverse

data mining - mind7 consulting(1)

La production de données s’accroit chaque jour et avec l’arrivée de l’IoT. Elle devrait encore s’amplifier, la maîtrise du Data Mining devient donc une arme concurrentielle. Cette technologie impacte tous les secteurs.

Dans la vente et le marketing, il permet d’assurer une vue 360 du client riche, de connaître les comportements d’achat et la typologie de sa clientèle.

Concernant l’assurance, il assure la détection des comportements frauduleux et des personnes à risque et il évalue le montant de leurs indemnisations.

Dans la banque et la finance, le Data Mining aide à détecter les fraudes à la carte bancaire, évalue les risques à l’attribution d’un prêt et peut établir des liens cachés entre les indicateurs. 

En ce qui concerne les RH, il aide à catégoriser les employés et simplifie le recrutement

Dans les secteur médical, il quantifie la réponse d’un patient à un traitement, identifie les thérapies à succès, évalue les doses efficaces et l’apparition des effets secondaires.

Dans l’aérospatiale, la masse de données géographiques et météo est traitée grâce au Data Mining.

Enfin en génétique humaine, le Data Mining permet de recherche dans notre ADN des marqueurs de maladies. Il aide à la préventions et au choix des traitements.