Acquisition et traitement des données massives – Big Data

Durée

45 h

Objectifs

Ce cours permet aux participants d’acquérir des connaissances en gestion et traitement des données massives (Big Data) ainsi que l’acquisition de compétences pour l’utilisation d’outils adaptés.

Contenu

o Illustrer des cas d’usages du Big Data
o Connaître l’écosystème Hadoop
o Entreposer des données dans HDFS
o Charger des données dans HDFS
o YARN et moteurs de traitement
o Comprendre les Concepts MapReduce
o Concepts de grappes (clustering) et de NoSQL
o Base de données NoSQL de l’écosystème Hadoop (HBase, MongoDB)
o Introduction au traitement temps réel dans un environnement Big Data
o Analyse de sentiments (« end 2 end ») à partir d’un réseau social (ex. Twitter, Facebook)
o Analyse de données avec Hive, Pig, Impala
o Se connecter via JDBC ou ODBC à HIVE et effectuer des requêtes SQL
o Introduction à la science des données et le Big Data

Stratégie pédagogique

  • Présentation des fonctions et des commandes
  • Démonstration à l’ordinateur
  • Exercices supervisés
Le démarrage des cours est conditionnel à un nombre suffisant d’inscriptions. Les dates peuvent varier. Vous serez avisé des changements s’il y a lieu. Certaines conditions s’appliquent pour les formations de courte durée financées par Emploi-Québec.