Tous les événements

26 janvier 2017
Paris

séminaire RUSS – Traitement de données historiques avec R

Dans le cadre du séminaire RUSS (R à l’Usage des Sciences Sociales), l’EHESS accueille jeudi 26 janvier 2017 de 9h30 à 12h00 Arnaud Bringé (Ined-Service Méthodes Statistiques) pour une séance sur le thème du traitement de données historiques avec R.

Données utilisées

La présentation sera effectuée à partir de la juxtaposition de plusieurs sources de données historiques du 18ème siècle. Elle a pour cadre la ville de Martigues, victime de la dernière épidémie de peste en France (1720). Les données proviennent de listes nominatives issues de recensements fiscaux et de registres paroissiaux (Baptêmes-Mariages-Sépultures).

Ce type de sources est notamment caractérisé par la présence de nombreuses données textuelles, qui permettent notamment d’identifier les individus et la construction de généalogies. Ces données textuelles existent aussi très fréquemment pour caractériser des lieux (naissance, mariage, décès, origine) ou des professions. En préalable à tout traitement ou à tout regroupement, elles nécessitent d’être harmonisées.

CONTENU

Le séminaire montrera dans un premier temps, quelles fonctions R utiliser afin d’homogénéiser au maximum ces données textuelles. Cette première partie décrira l’utilisation des packages stringr pour le traitement des chaines de caractères et stringdist pour le calcul de distances entre chaînes.

La juxtaposition de plusieurs sources nécessite une homogénéisation des informations, tant au niveau des variables que des observations considérées.La deuxième partie décrira l’utilisation du package sqldf.

Enfin, l’analyse de ces sources nominatives a conduit au calcul de statistiques à un niveau agrégé (famille, maison). La dernière partie décrira l’utilisation des packages plyr et dplyr.

Détails pratiques

Le nombre de places est limité, l’inscription est obligatoire

S’inscrire

Lieu

EHESS, salle du conseil B,

R-1,  bâtiment Le France,

190-198 avenue de France

75013 Paris

Vie de la recherche

CESSDA-Fr / Adisp : ouverture des données sur les étudiants

Le service de l'Adisp (Archives de Données Issues de la Statistique Publique) est désormais ouvert aux étudiants.

Opportunités

Du 22 janvier 2018 au 5 février 2018

Poste à pouvoir : Ingénieur de Recherche (BAP D) – doctorat en SHS – LabexMed

Poste d' ingénieur de recherche (BAP D) - doctorat en SHS sur budget de LabexMed, en CDD, 1 an renouvelable une fois à la Maison Méditerranéenne des Sciences de l’Homme – USR 3125, Aix en Provence