Tous les événements

26 janvier 2017
Paris

séminaire RUSS – Traitement de données historiques avec R

Dans le cadre du séminaire RUSS (R à l’Usage des Sciences Sociales), l’EHESS accueille jeudi 26 janvier 2017 de 9h30 à 12h00 Arnaud Bringé (Ined-Service Méthodes Statistiques) pour une séance sur le thème du traitement de données historiques avec R.

Données utilisées

La présentation sera effectuée à partir de la juxtaposition de plusieurs sources de données historiques du 18ème siècle. Elle a pour cadre la ville de Martigues, victime de la dernière épidémie de peste en France (1720). Les données proviennent de listes nominatives issues de recensements fiscaux et de registres paroissiaux (Baptêmes-Mariages-Sépultures).

Ce type de sources est notamment caractérisé par la présence de nombreuses données textuelles, qui permettent notamment d’identifier les individus et la construction de généalogies. Ces données textuelles existent aussi très fréquemment pour caractériser des lieux (naissance, mariage, décès, origine) ou des professions. En préalable à tout traitement ou à tout regroupement, elles nécessitent d’être harmonisées.

CONTENU

Le séminaire montrera dans un premier temps, quelles fonctions R utiliser afin d’homogénéiser au maximum ces données textuelles. Cette première partie décrira l’utilisation des packages stringr pour le traitement des chaines de caractères et stringdist pour le calcul de distances entre chaînes.

La juxtaposition de plusieurs sources nécessite une homogénéisation des informations, tant au niveau des variables que des observations considérées.La deuxième partie décrira l’utilisation du package sqldf.

Enfin, l’analyse de ces sources nominatives a conduit au calcul de statistiques à un niveau agrégé (famille, maison). La dernière partie décrira l’utilisation des packages plyr et dplyr.

Détails pratiques

Le nombre de places est limité, l’inscription est obligatoire

S’inscrire

Lieu

EHESS, salle du conseil B,

R-1,  bâtiment Le France,

190-198 avenue de France

75013 Paris

Vie de la recherche

Portrait : Arianna Caporali, ingénieure à l’INED

L'équipe Progedo rencontre Arianna Caporali, chargée de la mise à disposition des enquêtes et du développement des bases de données contextuelles à l’INED. Elle travaille notamment sur GGP.

Opportunités

Du 5 février 2019 au 18 février 2019

Ingénieur-e d’études en traitement et analyse de données pour la future Plateforme universitaire de données à la MSH Alpes

Ingénieur-e d’études en traitement et analyse de données pour la future Plateforme universitaire de données à la MSH...