Programmation statistique et science des données

Formation sur la programmation statistique et l'analyse de données

Les langages de programmation statistique permettent de manipuler des ensembles de données, produire des analyses et construire des graphiques élaborés. Par exemple, le langage R est un des langages de prédilection en apprentissage machine (machine learning), il est supporté par une grande communauté de chercheurs et contributeurs du monde entier. L’environnement R est de type source libre (open source). Cette formation a pour but de fournir les bases requises pour débuter des projets d’analyse, de programmation et de forage de données (data mining) en R.

Objectifs d'apprentissage

  • Effectuer les manipulations courantes d’une table de données (trier, filter, sélectionner, fusionner, etc.)
  • Importer, nettoyer, organiser et exporter des fichiers de données
  • Créer des graphiques simples pour visualiser les données
  • Écrire des fonctions sur mesure réutilisables
  • Savoir chercher de l’aide dans la communauté R

Public ciblé

  • Toute personne désirant utiliser un langage de programmation pour manipuler des données et générer des rapports.
  • Ce cours requiert de connaître les bases de la programmation informatique, peu importe le langage.

Format

  • Virtuel ou présentiel
  • 60% théorie, 40% pratique (apportez vos jeux de données pour les exercices)​
  • Durée : 16 heures (ou 4x 4 heures)

Contenu

  • L’environnement R et RStudio
  • Types de variables
  • Vecteurs, matrices et dataframes, sélection de sous-ensembles
  • Opérations élémentaires et logiques
  • Structure des énoncés « if-else », boucles « for » et « while »
  • Structure des fonctions sur mesure réutilisables
  • Concept de fonction vectorisée et de boucle implicite
  • Comment trouver de l’aide sur le web
  • Ateliers pratiques et exercices : importer un fichier de données; obtenir des statistiques descriptives; construire des graphiques simples; faire une analyse de Pareto; rédiger une fonction sur mesure et l’appeler; copier-coller des résultats et graphiques vers d’autres logiciels

Prérequis

  • Être familier avec l'informatique en général
  • Idéalement avoir en tête des cas d'utilisation
  • Avoir installé le logiciel R
  • Avoir installé la version gratuite de RStudio

Cette formation est axée sur la pratique, les éléments théoriques sont très limités. Pour de plus d’informations ou pour planifier votre formation, n’hésitez pas à nous contacter!



⤶ (retour à la page sur l'analytique avancée)