Langage R et science des données

Durée

15 h

Objectifs

Le cours a pour but de donner aux étudiants la capacité de manipuler des données à l’aide du langage R. Le cours consiste en l’extraction, la normalisation, la présentation et en l’application de méthodes statistiques sur les données. Le tout grâce au langage R, spécialisé en science des données.

Contenu

Cours 1: Survol du cours et discussions

  • Science des données
  • Big Data
  • Langage R et de R Studio.
  • “Hello World” en R sous R Studio.
  • Diverses notions du langage R. sous Colab

Cours 2: Présentation des données

  • Structures de contrôle
  • Structures de données.
  • Code R sous Python
  • Préparer les données (encodage et normalisation)
  • Présentation de Kaggle et des datasets de R

Cours 3: Manipulation et prétraitement des données.

  • Utilisation des différents types de graphiques.
  • Opérateur PIPE et librairie DPLYR.
  • Exemple de prétraitement de données

Cours 4: Opérations statistiques – 1ère partie.

  • Arbre de décision bayésien
  • Régression linéaire
  • Autres packages sur CRAN

Cours 5: Opération statistiques – 2è partie.

  • Distributions normales
  • Régression linéaire multiple
  • Régression logistique

Stratégie pédagogique

Présentations magistrales des sujets par l’enseignant.

Préalable(s)

Aucun cours préalable, mais il est nécessaire d’avoir un niveau de programmation minimalement intermédiaire.

Le démarrage des cours est conditionnel à un nombre suffisant d’inscriptions. Les dates peuvent varier. Vous serez avisé des changements s’il y a lieu. Certaines conditions s’appliquent pour les formations de courte durée financées par Emploi-Québec.