Mpra paper 76653 1 M PRA Munich Personal RePEc Archive Data Science with Python Algorithm Statistics DataViz DataMining and Machine-Learning Moussa Keita February Online at https mpra ub uni-muenchen de MPRA Paper No posted February UTC CData Science sous
M PRA Munich Personal RePEc Archive Data Science with Python Algorithm Statistics DataViz DataMining and Machine-Learning Moussa Keita February Online at https mpra ub uni-muenchen de MPRA Paper No posted February UTC CData Science sous Python Algorithme Statistique DataViz DataMining et Machine-Learning Par Moussa Keita PhD Consultant Big Data-Data Science Umanis Consulting Group Paris Février Version Résumé La Data Science est une discipline technique qui associe les concepts statistiques aux algorithmes puissants de calculs informatiques en vue du traitement et de la modélisation des données de masse issues des phénomènes de l ? observation économiques industriels commerciaux ?nancières managériaux sociaux etc En matière de Business Intelligence et de veille stratégique la Data Science est devenue un outil incontournable d ? aide à la prise de décisions pour les dirigeants Elle permet d ? exploiter et de valoriser tout le patrimoine informationnel interne et externe de l ? entreprise Le langage de programmation Python s ? est rapidement imposé au cours des récentes années comme un langage de premier choix à la disposition des Data Scientists pour exploiter le potentiel grandissant du Big Data Le gain de popularité dont béné ?cie aujourd ? hui ce langage s ? explique en grande partie par les nombreuses possibilités o ?ertes par ses puissants modules notamment d ? analyses numériques et de calculs scienti ?ques numpy scipy pandas de visualisation de données matplotlib mais aussi de Machine Learning scikit-learn Présenté dans une approche hautement pédagogique ce manuscrit revisite les di ?érents concepts indispensables à la maitrise de la Data Science sous Python Le travail est organisé en sept chapitres Le premier chapitre est consacré à la présentation des bases de la programmation sous Python Dans ce chapitre nous présentons notamment les di ?érents éléments de langage qui forment l ? ossature du programme python mais aussi les di ?érents objets de programmation qui en forment le socle Le second chapitre est consacré à l ? étude des cha? nes de caractères et des expressions régulières L ? objectif de ce second chapitre est de se familiariser avec le traitement et l ? exploitation des cha? nes de caractères qui constituenet les valeurs des variables couramment rencontrées dans les bases de données non structurées Le troisième chapitre est consacré à la présentation des méthodes de gestion de ?chiers et de traitements de texte Le but de ce chapitre est d ? approfondir le précédent chapitre en présentant les méthodes couramment utilisées pour le traitement des données non structurées qui se présentent généralement sous forme de ?chiers de textes Le quatrième chapitre est consacré à la présentation des méthodes de traitement et d ? organisation des données initialement stockées sous forme de tables de données Le cinquième chapitre est consacré à la présentation des méthodes classiques d ? analyses statistiques analyses descriptives tests statistiques régression linéaires et logistiques ? Quant au sixième chapitre il est consacré à la présentation des méthodes de datavisualization histogrammes diagrammes en barres pie-plots box-plots scatter-plots courbes d ? évolution Cgraphiques en
Documents similaires
-
28
-
0
-
0
Licence et utilisation
Gratuit pour un usage personnel Aucune attribution requise- Détails
- Publié le Nov 20, 2021
- Catégorie Management
- Langue French
- Taille du fichier 490.6kB