Programme

La formation est organisée en modules répartis sur quatre séances :

Séance 1 : Introduction et démarrage en douceur (01/10/2025)

L'objectif de cette première séance est de comprendre la logique du langage R et de se familiariser avec l'interface R Studio en apprenant à manipuler un jeu de données structuré de type dataframe. Nous verrons en particulier comment :
  • Manipuler un dataframe avec le package dplyr
  • Utiliser des fonctions statistiques de base pour explorer des données quantitatives et qualitatives
  • Tenir compte des données manquantes
  • Visualiser les données avec les packages ggplot2 et plotly
  • Comparer différents types de visualisations et leur usages.  
Testez vos connaissances avec ce QCM

Séance 2 : Analyses de corpus (08/10/2025)

Cette séance a pour objectif d’apprendre à traiter des données non structurées (texte brut) et de se familiariser avec les principales méthodes d’analyse issues de la linguistique de corpus et du traitement automatique des langues. À partir d’un corpus de presse historique, nous explorerons différentes approches : n-grams, analyse de fréquences, concordances, co-occurrences, modélisation thématique et reconnaissance d’entités nommées. Pour cela, nous utiliserons à la fois des packages classiques comme quanteda et tidytext, ainsi que des outils plus spécifiques tels que histtext.

Séance 3 : Analyse et visualisation de réseaux (15/10/2025)

Cette séance introduira les principaux concepts et méthodes de l’analyse formelle de réseaux à travers l’étude de réseaux simples (unimodaux) et bipartites. Nous aborderons les mesures globales (ordre, diamètre, densité), les mesures locales de centralité (degré, intermédiarité), la détection de communautés, ainsi que l’analyse des liens (poids, attributs). Une attention particulière sera portée à la notion d’équivalence structurale ou régulière, utile pour identifier des entités occupant une position équivalente dans un réseau, notamment bipartite. Le tutoriel s’appuiera principalement sur le package igraph pour l’analyse et la visualisation, et sur le package Places pour l’étude de l’équivalence. 

Séance 4 : Séance « à la carte » (05/11/2025)

  • Révisions et approfondissements des cours précédents.
  • Applications à vos propres données.
  • Brève introduction à R Markdown et GitHub.



 

Commentaires

Posts les plus consultés de ce blog

Bienvenue !