Toutes les actus

Data without Boundaries : quels progrès pour l’accès aux données très détaillées de la statistique publique en Europe ?

Les grandes bases de la statistique publique constituent des ressources extrêmement riches pour la recherche et la société. Les dispositifs d’accès sécurisés aux données indirectement identifiantes ou sensibles, tels que le CASD pour la France, permettent désormais plus facilement de les utiliser. Mais les obstacles persistent pour les projets qui mobilisent des sources de plusieurs pays : barrières juridiques, diversité des procédures d’autorisation, dispersion de l’information, et dispositifs sécurisés peu adaptés au travail collaboratif entre chercheurs, sont autant de difficultés rencontrées par les chercheurs désireux d’accéder à des données confidentielles au-delà des frontières nationales.

Bâtir une coopération au niveau européen pour faciliter les accès transnationaux

S’inspirant des modèles fructueux de coopération entre acteurs de la recherche et producteurs de statistique publique qui ont permis d’ouvrir l’accès à ces données au plan national (Réseau Quetelet, INSEE et services statistiques ministériels pour la France, UKDA et ONS pour la Grande-Bretagne), DwB a rassemblé 28 partenaires, banques de données pour la recherche, centres de recherche méthodologique, et instituts nationaux de statistique publique de 14 pays, sous la coordination scientifique de Roxane Silberman, directrice du Réseau Quetelet. Organisés par domaines de compétence, les groupes de travail de DwB ont travaillé à harmoniser les usages et pratiques et à bâtir une coopération au niveau européen entre le CESSDA, le réseau européen des banques de données dont PROGEDO est partenaire, et le système statistique européen coordonné par Eurostat.

Vers un réseau européen de centres sécurisés

Traçant les grandes lignes d’une feuille de route européenne vers une plus grande harmonisation, des recommandations ont été formulées sur les standards pour les métadonnées, les critères d’accréditation des chercheurs pour l’accès aux données confidentielles, et les principes du contrôle des sorties pour les données traitées via des accès sécurisés.
L’architecture proposée pour un réseau européen de centres sécurisés (European Remote Access Network, EuRAN) a pour objectif de faciliter le travail collaboratif d’équipes de chercheurs sur des sources hébergées dans des centres sécurisés différents, tout en garantissant la nécessaire protection de la confidentialité. Le niveau de sécurité très élevé permet à un tel réseau de fonctionner dans les cadres juridiques existant. Un premier contrat entre l’IAB en Allemagne (service statistique du ministère de l’emploi) et le UKDA en Grande-Bretagne a permis de vérifier l’efficience de la notion de cercle de confiance entre partenaires européens. Cet accord, fondé sur l’équivalence des dispositions juridiques et des procédures de sécurité, permet aux chercheurs accrédités en Grande-Bretagne d’utiliser les données très détaillées d’IAB sans avoir à se rendre en Allemagne. Dans la lignée de cette expérimentation, des accords équivalents sont en négociation pour la France et les Pays-Bas, amorces de coopération européenne entre centres sécurisés.
Mis en place par le CASD, un Proof of Concept de réseau sécurisé européen a été développé dans le cadre de DwB à partir de serveurs installés sur 3 noeuds européens (CASD/France, GESIS/Allemagne, et DESTATIS/Allemagne) et un noeud central.
Présenté en mars 2015, lors de la seconde édition du European Data Access Forum à Luxembourg, ce projet a permis de démontrer concrètement la faisabilité informatique d’un tel réseau au delà de liaisons bilatérales.

De nouveaux outils pour l’exploration des micro-données de la statistique publique en Europe

Très concrètement également, les partenaires du projet ont travaillé sur les solutions pour améliorer l’information et la documentation sur les données nationales. Deux nouveaux outils sont nés de cette réflexion :

  • CIMES (Centralising and Integrating Metadata from European Statistics), un catalogue de métadonnées de base, en anglais et au format international DDI, sur les données disponibles pour chacun des pays ainsi sur que les procédures d’autorisation et les liens avec les diffuseurs. Pour cet outil, créé et développé par les partenaires du Réseau Quetelet – ADISP en coopération avec le CASD-, la participation française a été centrale.
  • MISSY (Microdata Information System) un programme qui organise la documentation jusqu’au niveau fin des variables pour les enquêtes européennes Eurostat et facilite leur usage pour la recherche comparative. Le GESIS, la banque de données allemande, a adapté son outil à la structure de ces enquêtes pour la mise en oeuvre de cette solution très appréciée par Eurostat.

Une coopération renforcée

La coopération entre les partenaires, créée par le cadre du projet, est sortie renforcée du travail mené en commun. Cette dynamique s’est étendue aux communautés parties prenantes des questions d’accès aux données, mobilisant dans les discussions les banques de données pour la recherche, les instituts nationaux de statistique européens et impliquant également directement les chercheurs – accès gratuits aux centres sécurisés, sessions de formation aux enquêtes Eurostat – et les centres intéressés par la création d’accès sécurisés à distance qui ont pu visiter les installations existantes.
Des coopérations nouvelles ont vu le jour entre banques de données et instituts de statistique, là où elles n’existaient pas ou peu. D’ores et déjà, un accord est en cours de discussion pour formaliser une coopération entre le CESSDA et Eurostat, et pérenniser le European Data Access Forum, plate-forme européenne permettant de confronter régulièrement les besoins des différents acteurs et les avancées réalisées. Des projets sont en cours pour la construction d’un réseau sécurisé européen dans le cadre du prochain appel H2020.

Site de DwB    Site de CIMES     Site de MISSY

 

Événements

19 mai 2017

Les Statisticiens et la CNIL : Témoignages historiques

Le groupe « Histoire de la Statistique » de la Société Française de Statistique (SFdS) organise vendredi 19 mai 2017 une demi-journée de séminaire consacrée aux rapports entre la CNIL et les statisticiens producteurs de données d’enquêtes.

Opportunités

Du 9 janvier 2017 au 24 février 2017

Appel à projet ELIPSS, Étude Longitudinale par Internet Pour les Sciences Sociales

Le panel ELIPSS (Étude Longitudinale par Internet Pour les Sciences Sociales), dispositif d'enquêtes par Internet destiné à la communauté...