Python - Science des données

Grand public

Cours WEB-PRO

Plateforme Windows

Durée 30 heures

Non offert présentement

M'aviser lorsqu'un groupe sera ouvert

Préalables

Connaître les bases minimales du langage et de l’environnement Python 3 (types de variables, opérateurs, structures de données, contrôles if-else, boucles for-while).

Objectifs

À la fin du cours, le participant maîtrisera les modules de calculs, de modélisation et visualisation afin d’analyser des données.

Approche pédagogique

  • Présentation des concepts à l’aide de notes de cours
  • Expérimentation des concepts à l'ordinateur
  • Exercices à l’ordinateur supervisés par le formateur
  • Questions et réponses sur les concepts, aide et déblocage lors des exercices
  • Consulter le site du formateur :  https://ugolab.gitlab.io/sdp/isdp_desc/

Attestation délivrée en fin de cours

Une attestation de participation est remise aux personnes ayant assisté à plus de 80 % des heures de formation.

Matériel pédagogique

Tout le cours se déroule sur le logiciel Jupyter Notebook, en ligne. Le participant ouvre un compte (identifiant et un mot de passe). Les fichiers sont distribués par Google Docs. Le participant doit apporter une clé USB pour télécharger et garder les fichiers.

Autres particularités

Afin d'atteindre un bon niveau de maîtrise, le participant devrait réviser les notes et poursuivre les exercices entre les cours.

Contenu du cours

  • Modélisation des données

-       Compréhension des données, des structures de données et des conversions

-       Importation, sélection, modification, segmentation, itérations, regroupement et segmentation sur des structures de données

-       Fusion, concaténation sur des jointures (à la SQL) et agrégations

-       Application de calculs arithmétiques, statistiques et sélection conditionnelle

  • Utilisation des modules numérique et scientifiques de Python 3

-       Modules de base (liste, tuple, dictionnaire, chaîne de caractères)

-       Numpy (structure ndarray)

-       Pandas (structures Series et DataFrame)

-       GeoPandas (structures GeoSeries et GeoDataFrame)

-       Matplotlib, aperçu de Seaborn

-       Folium, aperçu de Cartopy

  • Maitrise de logiciels

-       Interpréteur interactif Jupyter Notebook, autres logiciels utiles et outils en ligne

  • Visualisation des données

-       Graphiques et cartes

-       Figures fixes et interactives

  • Traitement de données

-       Données numériques

-       Données alphanumériques et textuelles

-       Données vectorielles (géomatique)

  • Programmation d’une analyse de données et d’une séquence de travail

-     Automatisation des calculs en opposition avec un logiciel analytique à la souris

College de Maisonneuve | Formation continue