Tous les événements

26 janvier 2017
Paris

séminaire RUSS – Traitement de données historiques avec R

Dans le cadre du séminaire RUSS (R à l’Usage des Sciences Sociales), l’EHESS accueille jeudi 26 janvier 2017 de 9h30 à 12h00 Arnaud Bringé (Ined-Service Méthodes Statistiques) pour une séance sur le thème du traitement de données historiques avec R.

Données utilisées

La présentation sera effectuée à partir de la juxtaposition de plusieurs sources de données historiques du 18ème siècle. Elle a pour cadre la ville de Martigues, victime de la dernière épidémie de peste en France (1720). Les données proviennent de listes nominatives issues de recensements fiscaux et de registres paroissiaux (Baptêmes-Mariages-Sépultures).

Ce type de sources est notamment caractérisé par la présence de nombreuses données textuelles, qui permettent notamment d’identifier les individus et la construction de généalogies. Ces données textuelles existent aussi très fréquemment pour caractériser des lieux (naissance, mariage, décès, origine) ou des professions. En préalable à tout traitement ou à tout regroupement, elles nécessitent d’être harmonisées.

CONTENU

Le séminaire montrera dans un premier temps, quelles fonctions R utiliser afin d’homogénéiser au maximum ces données textuelles. Cette première partie décrira l’utilisation des packages stringr pour le traitement des chaines de caractères et stringdist pour le calcul de distances entre chaînes.

La juxtaposition de plusieurs sources nécessite une homogénéisation des informations, tant au niveau des variables que des observations considérées.La deuxième partie décrira l’utilisation du package sqldf.

Enfin, l’analyse de ces sources nominatives a conduit au calcul de statistiques à un niveau agrégé (famille, maison). La dernière partie décrira l’utilisation des packages plyr et dplyr.

Détails pratiques

Le nombre de places est limité, l’inscription est obligatoire

S’inscrire

Lieu

EHESS, salle du conseil B,

R-1,  bâtiment Le France,

190-198 avenue de France

75013 Paris

Vie de la recherche

CESSDA Eric s’engage pour la science ouverte européenne

Chargé.e d'études et de statistiques (niveau 7 voire 8 selon profil) F/H à la CNAF Paris La branche famille de la Sécurité Sociale...

Opportunités

Du 29 mars 2018 au 19 avril 2018

Chargé.e d’études et de statistiques (niveau 7 voire 8 selon profil) F/H à la CNAF

Chargé.e d'études et de statistiques (niveau 7 voire 8 selon profil) F/H à la CNAF Paris La branche famille de la Sécurité Sociale...