Arbres decision cart chaid c45
CHAID ?? CART ?? C et les autres ? Ricco RAKOTOMALALA Equipe de recherche en Ingénierie des Connaissances Laboratoire ERIC CDi ?érenciation des méthodes Mesures d ? Evaluation de la Segmentation -- Impact ? Mesures statistiques ? Mesures issues de la théorie de l ? information Regroupement des modalités ? modalité branche ? Arbre Binaire ? Arbre m-aire Détermination de la taille optimale ? ? Pré-pruning ? Post- pruning Autres subtilités coûts graphes arbres obliques arbres ous Equipe de recherche en Ingénierie des Connaissances Laboratoire ERIC CEvaluer une segmentation -- Impact Comment les caractériser S Maximalité Distribution pure ? dans les feuilles S Minimalité Pas de modi ?cation des distributions S Intermédiaire Modi ?cation des distributions association de certaines valeurs de X avec celles de Y Equipe de recherche en Ingénierie des Connaissances Laboratoire ERIC CImpact Mesures de liaison statistique ?? CHI- et ses normalisations CHAID Tableau de calcul Caractériser la connaissance de X améliore la connaissance des valeurs de Y Y X y yk yK ? x xl xL ? M L n kl L nk M n l n Principe Comparer les valeurs observées avec les valeurs théoriques lorsque Y et X sont indépendants produit des marges CHI- varie entre et oo ? ? ? K k L l F ECF EB F ED nkl ?? nk ? n l n nk ? n l F F F F F F n T de Tschuprow est une normalisation par les degrés de libertés Il varie entre et t n? ? K ?? ? L ?? Equipe de recherche en Ingénierie des Connaissances Laboratoire ERIC CImpact Exemple pour le t de Tschuprow -- CHAID S Distribution enfant pure ? S Pas de modi ?cation des distributions Equipe de recherche en Ingénierie des Connaissances Laboratoire ERIC S Modi ?cation des distributions association des valeurs de certaines valeurs de X avec celles de Y CImpact Théorie de l ? information ?? Le gain informationnel C Entropie de Shannon Quantité d ? information pour conna? tre les valeurs de Y ? E Y K ?? k nk n ? log F EBF EC F ED nk n F F F F F F Entropie Conditionnelle Quantité d ? information pour conna? tre les valeurs de Y Sachant les valeurs de X ? ? L E Y X ?? l n l n K nkl n k l ? log F ECF EBF EDF EC nkl n l F F F F F F F F Gain d ? entropie G Y X E Y ?? E Y X Gain d ? entropie normalisée Gain Ratio ?? Tenir compte de la distribution marginale de X GR Y X E Y ?? E Y X E X Equipe de recherche en Ingénierie des Connaissances Laboratoire ERIC CImpact Exemple pour le gain ratio ?? C S Distribution pure ? dans les feuilles S Pas de modi ?cation des distributions Equipe de recherche en Ingénierie des Connaissances Laboratoire ERIC S Modi ?cation des distributions association des
Documents similaires
-
32
-
0
-
0
Licence et utilisation
Gratuit pour un usage personnel Aucune attribution requise- Détails
- Publié le Apv 17, 2022
- Catégorie Science & technolo...
- Langue French
- Taille du fichier 53.5kB