Expert Science des données Plan Flux de travail de science des données Traduit
Expert Science des données Plan Flux de travail de science des données Traduit de Anglais vers Français - www.onlinedoctranslator.com Ce qui rend ce cours de science des données différent Les experts en science des données se concentrent sur la création d'informations précieuses et exploitables pour les clients. Les scientifiques de données débutants se concentrent sur la couverture de la plus grande pile technologique. Les experts savent qu'ils doivent comprendre le problème dès le départ, obtenir les bonnes données et créer de la valeur pour le client. Les débutants ne comprennent pas comment chaque étape du flux de travail de la science des données est cruciale pour ajouter de la valeur à l'étape suivante. Flux de travail de science des données Maîtriser le flux de travail de la science des données est crucial, ainsi que les bons outils, pour devenir un expert en science des données. Ce cours couvrira tout ce dont vous avez besoin pour commencer votre voyage vers la maîtrise de la science des données. À la fin du cours, vous obtiendrez un modèle couvrant tous les aspects pour vous assurer que votre projet de science des données suit ce flux et est réalisé efficacement avec du code Python en utilisant les bonnes bibliothèques. Cours de science des données Curriculum Il s'agit d'un cours complet de 12 heures sur la science des données expertes. Nous nous efforçons de vous aider à démarrer avec la science des données avec les outils les plus efficaces et la bonne compréhension de ce qui ajoute de la valeur à un projet de science des données. La plupart utilisent trop de temps pour couvrir trop de technologies sans ajouter de valeur et finissent par créer des projets de science des données de mauvaise qualité. Vous ne voulez pas finir comme ça ! Suivez le Secret Data Science Blueprint, qui vous fournira un modèle ciblé couvrant tout ce dont vous avez besoin pour créer des projets Data Science réussis. Flux de travail de science des données Visualisation de données pandas pour la science des données Sources de données : Web Scraping, bases de données, fichiers CSV, Excel et parquet Où trouver des données Joindre (combiner) des données Statistiques que vous devez connaître Modèles d'apprentissage automatique Nettoyage des données Mise à l'échelle des fonctionnalités Sélection de fonctionnalité Sélection du modèle COMMENT COMMENCER Téléchargez tous les notebooks Jupyter à partir du référentiel (téléchargement de fichier zip). Décompressez le téléchargement (main.zip) à l'endroit approprié. Lancez Anaconda et démarrez JuPyter Notebook (Télécharger) Ouvrez le premier Notebook à partir du téléchargement. Aller àLEÇON 00 sur la page suivante 0 MOINS0 AU Introduction au workflow de science des données Cela vous permettra de comprendre ce qu'est la science des données et comment réussir. Comment concentrer vos efforts pour obtenir les résultats les plus rapides et ne pas perdre de temps à apprendre toutes les technologies possibles pour la science des données. Objectif de la leçon Qu'est-ce qui fait le succès d'un Data Scientist ? Pourquoi la science des données ? Comment la science des données a-t-elle commencé ? Cela vous surprendra ! Comment fonctionne le workflow de science des données. De quelles compétences un Data Scientist a-t-il besoin ? Scientifique de données débutant vs expert. Data Science Workflow utilisé sur des données réelles avec du code Python. Un projet à essayer par vous-même - réalisez votre premier projet Data Science. Une solution au projet avec du code. 0 MOINS1AU Visualisation des données pour la science des données La visualisation des données pour la science des données n'est pas seulement la façon de présenter vos données, il s'agit de la qualité des données et de l'exploration des données pour comprendre la nature des données. La visualisation des données vous aide à comprendre rapidement les données. Notre cerveau humain n'est pas doué pour comprendre les lignes de données numériques. Mais lorsque nous sommes visuellement présentés avec des données, nous absorbons rapidement les informations. Cela améliore notre compréhension des données et nous permet de prendre des décisions plus rapidement. . Objectif de la leçon Comprendre la puissance de la visualisation de données. Comment la visualisation nous permet de voir des modèles dans les données. Apprenez à utiliser les pandas et Matplotlib. Qu'est-ce que la qualité des données et comment la visualisation vous aide-t-elle ? Comment repérer les mauvaises entrées de données. Identifiez les contours avec la visualisation. Comment explorer les données avec la visualisation. Comment ajouter un titre, définir des étiquettes et ajuster l'axe. Utilisez DataFrames et comparez les données. Créez des graphiques linéaires, des graphiques à barres, des histogrammes, des graphiques circulaires et des nuages de points. Créer une annotation sur les graphiques. 0 MOINS2 AU pandas pour la science des données Lorsque vous travaillez avec des données tabulaires (feuilles de calcul, bases de données, etc.), pandas est le bon outil avec une structure de données intégrée. pandas facilite l'acquisition, l'exploration, le nettoyage, le traitement, l'analyse et la visualisation de vos données à l'intérieur du DataFrame (pandas Data Structure). pandas est livré avec un grand cadre d'outils - ce qui peut être intimidant. Dans cette leçon, nous décrirons ce dont vous avez besoin, comment trouver de l'aide et comment travailler avec pandas DataFrames. Objectif de la leçon Une brève introduction aux pandas DataFrames Pour quel type de données les DataFrames sont-elles utilisées ? Où trouver de la documentation supplémentaire La feuille de triche des pandas Comment travailler avec des données dans DataFrames Installer et importer des pandas Lire des fichiers CSV avec des pandas dans un DataFrame Afficher les données dans un DataFrame Utilisation de l'index, des colonnes, des dtypes, de la forme et de la longueur sur un DataFrame Découpage d'un DataFrame sur des colonnes et des lignes. Création de nouvelles colonnes dans un DataFrame Filtrage et regroupement de données dans un DataFrame Conversion de colonnes en DateTimes et modification des colonnes de chaîne 0 MOINS3 AU Récupération Web Web Scraping n'est pas seulement amusant - il vous permet d'obtenir des données à partir de n'importe quelle page Web et de faire votre propre analyse des données. Avec la bibliothèque des pandas en Python, vous pouvez le faire en deux étapes et préparer les données pour un traitement ultérieur. Tout d'abord, obtenez l'URL de la page et utilisez pandas read_html pour analyser les données de la page Web dans une liste de DataFrames. Deuxièmement - Data Wrangling - qui signifie transformer les données pour qu'elles soient dans le bon format pour un traitement ultérieur. Il peut s'agir d'extraire des valeurs numériques d'entrées telles que : "1 234 567 $" ou de convertir des dates en objets de date. Objectif de la leçon Comprendre ce qu'est le Web Scraping Comment utiliser la bibliothèque des pandas pour Web Scrape Comprendre les problèmes juridiques liés au Web Scraping Démontrer le défi avec les données après le Web Scraping Apprendre ce qu'est le Data Wrangling Comment voir les types de données de Web Data Comment convertir des données en valeurs numériques dans un DataFrame Pour extraire des valeurs de chaînes à partir de DataFrame Gestion des erreurs lors de la conversion des DataFrames 0 MOINS4 AU Bases de données principales avec pandas Apprenez à obtenir des données à partir de bases de données et dans un DataFrame pandas. Nous apprendrons également comment joindre des données de tables dans des DataFrames uniques. Nous verrons ce que sont les bases de données relationnelles et comment elles modélisent les données en lignes dans les colonnes d'une série de tables. Vous apprendrez comment les bases de données ressemblent à une collection de DataFrames ou de feuilles de données Excel. Vous obtiendrez les instructions SQL les plus courantes (Structured Query Language) nécessaires pour obtenir des données de la base de données vers DataFrame. C'est en fait moins que vous ne le pensez. Nous travaillerons sur de vraies bases de données SQLite, mais vous saurez vous connecter à d'autres bases de données. Objectif de la leçon Qu'est-ce qu'une base de données ? Comprendre le modèle de base de données relationnelle. Requêtes SQL les plus utilisées. Comment utiliser un connecteur de base de données. Connecteur SQLite3 pour se connecter à la base de données SQLite. Comment utiliser sqlite3 avec des fichiers SQLite. Liste toutes les tables de la base de données. Comment utiliser le connecteur de base de données avec pandas DataFrames. Syntaxe de jointure SQL pour joindre plusieurs tables en un seul DataFrame. Utilisez Folium pour tracer des données sur une carte. 0 MOINS5 AU Lire les fichiers CSV, Excel et Parquet Vous apprendrez à lire des données à partir de fichiers CSV, Excel et Parquet dans des pandas DataFrames. Cela inclut le contenu des formats de fichiers, leurs différences et le format dans lequel vous devez stocker vos données, qui dépend du contexte. De plus, vous apprendrez les arguments les plus couramment utilisés pour chaque méthode pour lire des données dans le DataFrame de pandas. Enfin, vous obtiendrez une collection d'excellents endroits pour trouver des données en ligne. Dans le projet, on nous donnera un problème de science des données et uploads/Science et Technologie/ expert-data-science.pdf
Documents similaires










-
29
-
0
-
0
Licence et utilisation
Gratuit pour un usage personnel Attribution requise- Détails
- Publié le Jui 18, 2022
- Catégorie Science & technolo...
- Langue French
- Taille du fichier 5.7013MB