Cours statistique datamining et bio info
Statistique Big ??Data ??Mining Apprentissage Résumé L ? objet de ce cours est d ? introduire sous une forme homogène et synthétique les techniques de modélisation statistique ou d ? apprentissage supervisé utilisées le plus couramment en fouille de données volumineuses ou de grande dimension data mining big data pour l ? aide à la décision dans des champs d ? applications très divers industriels marketing ou encore en relation avec des thématiques de recherche en Biologie Épidémiologie L ? objectif principal est la modélisation pour la prévision et donc la recherche de modèles optimaux parcimonieux pour di ?érentes méthodes de modélisation statistique classique modèles gaussiens et binomiaux analyse discriminante moins classiques ridge pls lasso arbres binaires de décision ou encore dites d ? apprentissage réseaux de neurones agrégation de modèles machines à vecteurs supports issues du machine learning ?? Statistique Big ??Data ??Mining Apprentissage ?? Erreur de prévision et risque ?? Sélection de variables et régularisation en régression multiple ?? Régression PLS ACP et PLS parcimonieuses ?? Régression logistique ?? Modèles non paramétriques ?? Analyse discriminante décisionnelle ?? Arbres binaires de décision ?? Réseaux neuronaux ?? Agrégation de modèles ?? Machines à vecteurs supports ?? En guise de conclusion ?? Annexes ?? Déontologie scienti ?que et Statistique ?? Introduction au bootstrap Statistique Big ??Data ??Mining Apprentissage Introduction Un peu d ? histoire - ?? hOctets Il était une fois la Statistique une question i e biologique associée à une hypothèse expérimentalement réfutable une expérience plani ?ée avec n ?? individus observés sur p moins de variables un modèle linéaire supposé vrai un test une décision une réponse s ?? kO Les premiers outils informatiques se généralisant l ? analyse des données en France multivariate statistics ailleurs Mardia et al explore prétendument sans modèle des données plus volumineuses s ?? MO En Intelligence Arti ?cielle les systèmes experts expirent supplantés par l ? apprentissage machine learning des réseaux de neurones La Statistique aborde des modèles non-paramétriques ou fonctionnels s ?? GO Premier changement de paradigme Les données ne sont plus plani ?ées elles sont préalablement acquises et basées dans des entrepôts pour les objectifs usuels i e comptables de l ? entreprise L ? aide à la décision les valorise From Data Mining to Knowledge Discovery Fayyad et al Les logiciels de fouille regroupent dans un même environnement des outils de gestions de données des techniques exploratoires et de modélisation statistique C ? est l ? avènement du marketing quantitatif et de la gestion de la relation client GRC ou CRM s ??TO Deuxième changement de paradigme Le nombre p de variables explose de l ? ordre de à notamment avec les biotechnologies omiques o? p n L ? objectif de qualité de prévision l ? emporte sur la réalité du modèle devenu ??bo? te noire ? Face au éau de la dimension Apprentissage Machine et Statistique s ? unissent en Apprentissage Statistique statistical learning Hastie et al - sélectionner des modèles en équilibrant biais vs variance minimiser conjointement erreurs
Documents similaires










-
35
-
0
-
0
Licence et utilisation
Gratuit pour un usage personnel Aucune attribution requise- Détails
- Publié le Apv 20, 2022
- Catégorie Management
- Langue French
- Taille du fichier 86.1kB