Weka Présentation de Weka Weka Waikato Environment for Knowledge Analysis Environnement Waikato pour l ? analyse de connaissances Suite de logiciels d ? apprentissage automatique et d ? exploration de données écrite en Java Développée à l ? université de

Présentation de Weka Weka Waikato Environment for Knowledge Analysis Environnement Waikato pour l ? analyse de connaissances Suite de logiciels d ? apprentissage automatique et d ? exploration de données écrite en Java Développée à l ? université de Waikato en Nouvelle-Zélande Historique Développement de la version originale en C Re-développement à partir de zéro en Java Weka reçoit le SIG KDD award Pentaho Corporation acquiert une licence exclusive CPrésentation de Weka downloads sur Sourceforge Disponible pour toutes les plateformes Windows x Windows x Mac OS X Linux etc Documentation riche et communauté large Le livre Data Mining Practical Machine Learning Tools and Techniques troisième édition API http weka sourceforge net doc stable Wiki http weka wikispaces com FAQ http weka wikispaces com FAQ Tutoriels mailing list etc CQue contient le toolkit Weka Outils de pré-traitement des données ?ltering Sélection transformation combinaison d ? attributs normalisation re-échantillonnage etc Algorithmes pour l ? exploration de données Clustering classi ?cation régression etc Analyse de résultats Évaluation de performances comparaison d ? algorithmes etc Plusieurs interfaces Graphiques Explorer Experimenter et Knowledge Flow En ligne de commande CLI CAperçu de l ? interface de Weka jan Rév - page sur CFormat d ? entrée Le format d ? entrée par défaut de Weka est le ARFF Attribute Relation File Format D ? autres formats peuvent être importés CSV binaire BDD SQL avec JDBC à partir d ? une URL etc Caractéristiques du format de ?chier ARFF Les commentaires sont précédés de Ceci est un commentaire dans un ensemble de donnees Dé ?nition du nom de l ? ensemble de données avec relation Le nom doit être aussi compréhensible que possible relation temperatureMaison jours CFormat d ? entrée Dé ?nition des features avec attribute Attributs nominaux suivis des valeurs entre accolades attribute outlook sunny overcast rainy Attributs numériques avec real attribute temperature real Attributs chaines avec string les valeurs doivent être entre doubles guillemets blah blih bloh attribute unTexte string Attributs dates avec date yyyy-MM-dd-THH mm ss attribute uneDate date data signale le début des instances CExemple de ?chier ARFF Ensemble de donnees sur la meteo relation weather De ?nition des features attribute outlook sunny overcast rainy attribute temperature real attribute humidity real attribute windy TRUE FALSE attribute play yes no Debut des instances data sunny FALSE no sunny TRUE no overcast FALSE yes rainy FALSE yes CFormat d ? entrée Par défaut le dernier attribut est considéré comme la variable de classe à prédire En CLI la commande -c permet de choisir la variable à prédire e g -c spéci ?e le premier attribut Dans le cas de données éparses il est possible de compresser les données en ne représentant pas explicitement les valeurs Le format est Instances contenant beaucoup de class A class B Instances compressees avec des accolades class A class B C

  • 28
  • 0
  • 0
Afficher les détails des licences
Licence et utilisation
Gratuit pour un usage personnel Aucune attribution requise
Partager