Intelligence Artificielle Apprentissage Intelligence Artificielle Apprentissage

Intelligence Artificielle Apprentissage Intelligence Artificielle Apprentissage APPRENTISSAGE: Définitions Définition 1 (Dictionnaire Larousse) - apprendre = acquérir de nouvelles connaissances • savoir, connaître - apprendre = contracter de nouvelles habitudes • savoir-faire Définition 2 (Intelligence artificielle - Simon) - L’apprentissage induit des changements dans le système qui sont adaptatifs dans le sens qu’ils permettent au système de faire la même tâche une nouvelle fois plus efficacement. Apprentissage : Caractéristique essentielle de l’intelligence humaine. informations utilisées: Inné+Acquis Apprendre (IA) : Changer pour le mieux (selon certain critère) et intégrer de nouvelles informations en vue de s’en servir dans le future (probablement dans des situations nouvelles). Intelligence Artificielle Apprentissage pourquoi apprendre ? (Complexité, système ouvert, comportement inconnu, environnement inconnu) apprendre quoi ? (Compétence, organisation, coordination, communication) AGENTS: Apprentissage comment apprendre ? (isolé ou interactif, intégrer l’expérience des autres ...) Intelligence Artificielle Apprentissage Techniques d’apprentissages Intelligence Artificielle APPRENTISSAGE Trois types d’apprentissage : Apprentissage supervisé - Le retour désiré est connu. Apprentissage non supervisé - Aucun indice. L’agent apprend à partir des relations entre les perceptions. Il apprend à prédire les perceptions à partir de celles du passé. Apprentissage par renforcement - Le résultat désiré est inconnu. L’évaluation de l’action est faite par récompense ou punition. Intelligence Artificielle APPRENTISSAGE Types d’apprentissages 1. Apprentissage supervisé supervisé À partir de l’échantillon d’apprentissage S = {(xi, ui)}1,m on cherche une loi de dépendance sous-jacente • Par exemple une fonction h aussi proche possible de f (fonction cible) tq : ui = f(xi) • Ou bien une distribution de probabilités P(xi, ui) afin de prédire l’avenir Intelligence Artificielle APPRENTISSAGE Apprentissage supervisé supervisé Intelligence Artificielle APPRENTISSAGE • Si f f est une fonction continue – Régression – Estimation de densité • Si f f est une fonction discrète – Classification • Si f f est une fonction binaire (booléenne) – Apprentissage de concept Intelligence Artificielle APPRENTISSAGE Apprentissage non supervisé non supervisé De l’échantillon d’apprentissage S = {(xi)}1,m on cherche des régularités sous-jacente – Sous forme d’une fonction : régression – Sous forme de nuages de points (e.g. mixture de gaussiennes) – Sous forme d’un modèle complexe (e.g. réseau bayésien) afin de résumer, détecter des régularités, comprendre … Intelligence Artificielle APPRENTISSAGE 3. Apprentissage par Renforcement par Renforcement (AR) (AR) Les données d’apprentissage – Une séquence de perceptions, d’actions et de récompenses : (st, at, rt)t = 1, • Avec un renforcement rt • rt peut sanctionner des actions très antérieures à t Le problème Le problème : inférer une application : situation perçue  action afin de maximiser un gain sur le long terme (Comment sacrifier petit gain à court terme au profit du meilleur gain à long terme ?) Apprentissage de réflexes ... -> … apprentissage de planification Intelligence Artificielle APPRENTISSAGE - Renforcement Apprentissage Supervisé: arbres de décision Une des formes les plus simples d’apprentissage, mais tout de même une de celles qui connaissent le plus de succès. À partir d’exemples, le but est d’apprendre des structures d’arbres permettant de prendre des décisions. Chaque noeud représente un test à faire. Chaque branche représente une valeur possible résultant du test. Une feuille correspond à la décision. Intelligence Artificielle Apprentissage Exemple ( Jouer au tennis ) On a enregistré les différents états des journées où on a joué ou pas dans le tableau suivant: Intelligence Artificielle Apprentissage Les valeurs de l’attribut Ciel sont : ensoleillé, nuageux et pluvieux Les valeurs de l’attribut Température sont: chaude, tempérée, et froide Les valeurs de l’attribut Humidité sont: élevée et normale Les valeurs de l’attribut Vent sont: faible et fort QUESTION: Y a t- il une règle permettant de décider ( jouer ou pas) pour aujourd’hui (pluvieux et vent faible) Construire un arbre de décision L’apprentissage d’un arbre de décision est fait à partir d’exemples de valeurs d’attributs et de la valeur résultante du prédicat à apprendre. Exemple = ensemble de valeurs d’attributs (propriétés) La valeur du prédicat est appelée la classification de l’exemple (ex: Vrai / Faux). L’ensemble des exemples est appelé l’ensemble d’entraînement. Le but est de trouver le plus petit arbre qui respecte l’ensemble d’entraînement. (NP-complex) L’arbre doit extraire des tendances ou des comportements (règles) à partir des exemples. Intelligence Artificielle Apprentissage Procédure : construire-arbre(X) , X=ensemble d’exemples Si tous les exemples de X appartiennent à la même classe alors créer une feuille portant le nom de cette classe sinon choisir un (Le meilleur) attribut A pour créer un nœud Le test associé à ce nœud sépare X en V parties : X1,,, Xv construire-arbre (Xk) k=1,,,V (V : nombre de valeurs de A) finsi Algorithme Intelligence Artificielle Apprentissage Ciel ? Ensoleillé Nuageux Pluvieux Jouer Ne pas jouer Vent ? [X1] [X2] [X3] [X] Exemple Est-ce une bonne journée pour jouer au tennis ? Attributs : ciel, Température, Humdité et vent (caracteristiques d’une journée) 2 Classes: Jouer( OUI ) , ne pas jouer (NON) Les exemples: les journées Intelligence Artificielle Apprentissage Les valeurs de l’attribut Ciel sont : Ensoleillé, nuageux et pluvieux Les valeurs de l’attribut Température sont: chaude, tempérée, et froide Les valeurs de l’attribut Humidité sont: élevée et normal Les valeurs de l’attribut Vent sont: faible et fort Algorithme (ID3) Il construit les arbres de décision de haut en bas. Il place à la racine l’attribut le plus important, c’est-à-dire celui qui sépare au mieux les exemples positifs et négatifs. Par la suite, il y a un nouveau noeud pour chacune des valeurs possibles de cet attribut. Pour chacun de ces noeuds, on recommence le test avec le sous-ensemble des exemples d'entraînement qui ont été classés dans ce noeud. Intelligence Artificielle Apprentissage Le Choix du meilleur Attribut ( plusieurs Algorithmes) Intelligence Artificielle Apprentissage l’Entropie mesure alors le degré de l’hétérogénité dans une population Choix de l’attribut On choisit l'attribut ayant le meilleur gain d'information: S : les exemples d'entraînement. A : l'attribut à tester. V(A) : les valeurs possibles de l'attribut A. Sv : le sous-ensemble de S qui contient les exemples qui ont la valeur v pour l'attribut A. c : le nombre de valeurs possibles pour la fonction visée (classes). pi : la proportion des exemples dans S qui ont i comme valeur pour la fonction visée. Intelligence Artificielle Apprentissage Intelligence Artificielle Apprentissage Exemple ( arbre ID3) Premièrement, il faut choisir la racine de l'arbre. Pour cela, nous allons choisir l'attribut qui a le plus grand gain d'information. – Pour calculer le gain d'information, nous devons d'abord calculer l'entropie des exemples d'entraînement. – Il y a 9 exemples positifs et 5 exemples négatifs, sur un total de 14, donc nous obtenons une entropie de: Maintenant, nous allons calculer le gain d'information pour le premier attribut, l'attribut Ciel. – Cet attribut a 3 valeurs possibles, donc les exemples d'entraînement seront regroupés en 3 sous-ensembles. – Nous commençons donc par calculer l'entropie des 3 sous-ensembles: Sensoleillé={j1 -, j2 -, j8 -, j9 +, j11 +} Snuageux={j3 +, j7 +, j12 +, j13 +} Spluvieux={j4 +, j5 +, j6 -, j10 +, j14 -} Le calcul du gain d’information pour l’attribut Ciel va donc donner: Intelligence Artificielle Apprentissage Exemple On calcul le gain de la même manière pour les trois autres attributs: L'attribut qui a le plus grand gain d'information est l'attribut Ciel, donc se sera la racine de l'arbre de décision. En séparant les exemples selon les valeurs de l’attributs Ciel, on obtient l’arbre partiel: Sensoleillé={j1 -, j2 -, j8 -, j9 +, j11 +} Snuageuxé={j3 +, j7 +, j12 +, j13 +} Spluvieux={j4 +, j5 +, j6 -, j10 +, j14 -} On peut voir que lorsque le ciel est nuageux, il reste uniquement des exemples positifs, donc ce noeud devient une feuille avec une valeur de Oui pour la fonction visée. Pour les deux autres noeuds, il y a encore des exemples positifs et négatifs, alors il faut recommencer le même calcul du gain d'information, mais avec les sous-ensembles restant. Intelligence Artificielle Apprentissage On a alors les règles de décision: SI le ciel est ensoleillé et l’humidité est élevée ALORS on ne joue pas SI le ciel est ensoleillé et l’humidité est normale ALORS on joue SI le ciel est nuageux ALORS on joue SI le ciel est pluvieux et le vent est fort ALORS on ne joue pas SI le ciel est pluvieux et le vent est faible ALORS on joue Exercice On veut déterminer si on aime ou pas un restaurant donné Les attributs étudiés sont : le prix et le type de ce qui est à manger Les valeurs pour Prix : Bas(B), Moyen(M) et Haut(H) Les valeurs pour Type : Tagine (T) et Couscous(C). Les classes : Aimer (+) et Ne pas Aimer (-) On utilise les exemples d’apprentissage suivants : - Est-ce que l’arbre T1 classifie bien les exemples ? - En commençant par l’attribut Prix, Donner l’arbre obtenu T2. - Calculer le gain (par ID3) pour l’attribut Prix - Calculer le gain (par ID3) pour l’attribut Type - Construire alors l’arbre T3 - Traduire l’arbre T3 en règles log2=1, log1/2=-1, log1/3 = -1.585, log2/3 = -0.585, log2/5=-1.322 ,log3/5=-0.737 + - Prix Type T uploads/Management/ ch5-apprentissagelpi1-2015.pdf

  • 19
  • 0
  • 0
Afficher les détails des licences
Licence et utilisation
Gratuit pour un usage personnel Attribution requise
Partager
  • Détails
  • Publié le Jul 26, 2022
  • Catégorie Management
  • Langue French
  • Taille du fichier 1.0602MB