Hmeq HMEQ Guide de démarrage avec SAS Enterprise Miner Introduction au Data Mining Loin d'avoir la prétention de former de véritables Data Miners ce qui implique une formation théorique avancée en statistique ce guide de démarrage devrait permettre d ? êt
HMEQ Guide de démarrage avec SAS Enterprise Miner Introduction au Data Mining Loin d'avoir la prétention de former de véritables Data Miners ce qui implique une formation théorique avancée en statistique ce guide de démarrage devrait permettre d ? être capable de faire un processus de Data Mining pour analyser des pro ?ls et prédire des comportements Le but du Data Mining est plus que d ? obtenir le meilleur modèle de construire rapidement un modèle et d ? en dé ?nir la qualité et si possible a priori le retour sur investissement qu ? un modèle peu générer Une attention particulière sera donc portée à l ? interprétation des résultats Le Data Mining est un ensemble de techniques permettant d ? extraire des masses de données importantes des informations à forte valeur ajoutée La traduction littérale du terme Data Mining en français est fouille de données La plupart des techniques de Data Mining ne datent pas d ? aujourd ? hui elles sont des années soixante et soixante dix certaines ont même été dé ?nies dans les années trente Néanmoins la recherche dans ce domaine est actuellement encore très proli ?que et certains nouveaux algorithmes des années quatre vingt dix et deux mille viennent apporter de nouveaux concepts Ce qui est nouveau c ? est la quantité des données disponibles la capacité des machines à les traiter et surtout ce qui fait que le Data Mining est si populaire c ? est le retour sur investissement qu ? il peut engendrer En e ?et on peut constater que la quantité des données stockées augmente beaucoup plus vite que la puissance de calcul des machines D ? après la loi de Moore ? s le volume de données stockées double à peu près tous les deux ans On enregistre les patients à l ? hôpital les commandes les stocks les transactions bancaires les réservations pour le train l ? avion etc une liste exhaustive de la masse d ? information hébergée dans les ordinateurs serait bien impossible à créer Le volume des données stockées est donc exorbitant mais parmi ces données se trouvent une mine d ? information qui ne demande qu ? à être exploitée Je vous propose de dé ?nir le Data Mining par l ? ensemble des techniques que l ? on peut classer dans ce domaine Je n ? ai certainement pas la prétention d ? avoir la dé ?nition universelle la littérature en propose de nombreuses Les limites de ce domaine étant variables selon les auteurs l ? objectif de cette dé ?nition est simplement de préciser ce qu ? il faut comprendre par Data Mining On peut classer les techniques de Data Mining en deux grandes familles les techniques descriptives qui permettent de décrire la situation actuelle et les techniques prédictives qui en apprenant sur le passé simulent l ? avenir ? Les techniques descriptives ? Recherche de groupe homogène sans apriori segmentation en anglais classi ?cation en français ? Recherche d ? associations
Documents similaires
-
20
-
0
-
0
Licence et utilisation
Gratuit pour un usage personnel Aucune attribution requise- Détails
- Publié le Jan 24, 2021
- Catégorie Industry / Industr...
- Langue French
- Taille du fichier 85.5kB