Lignes directrices relatives au plan de gestion des données
Introduction
Les plans de gestion des données (PGD) varient grandement en fonction du contexte entourant les domaines de recherche, les méthodes de recherche et les projets qu’ils touchent. Cela dit, chaque PGD doit traiter des considérations relatives à plusieurs sujets clés : rôles et responsabilités; questions éthiques et juridiques et gestion des données liées aux Autochtones (s’il y a lieu); collecte de données; documentation et métadonnées; stockage, sécurité et accès; conservation, dépôt et partage des données.
Généralement, le PGD idéal est complet, précis et conforme aux pratiques exemplaires propres à sa discipline. Les causes des lacunes d’un PGD sont habituellement liées à un de ces trois éléments, par exemple : le PGD ne détaille pas le dépôt des données (incomplet); il ne précise pas où seront conservées les données (imprécis); le dépôt sélectionné se prête mal au type de données (non conforme aux pratiques exemplaires propres à la discipline du projet). Les IRSC reconnaissent néanmoins que dans plusieurs domaines de recherche, les pratiques en matière de gestion des données sont en cours d’élaboration et les pratiques exemplaires n’ont pas encore été établies (c.-à-d. dépôts préconisés, normes de métadonnées, etc.).
Un PGD doit en outre décrire comment les données adhèreront aux principes FAIR — Findable (facile à trouver), Accessible (accessible), Interoperable (interexploitable) et Reusable (réutilisable). Toutefois, cela ne signifie pas qu’il doit comprendre une section dédiée à la conformité des données aux principes FAIR; un PGD complet, précis et conforme aux pratiques exemplaires, le cas échéant, décrira adéquatement l’adhérence des données à ces principes. Les IRSC reconnaissent que les défauts en matière d’infrastructure (p. ex. absence de dépôt convenable) et les pratiques propres à la discipline du projet (p. ex. absence de normes de métadonnées) peuvent limiter l’adhérence des données aux principes FAIR. Les IRSC reconnaissent également la différence entre des données « accessibles » et « ouvertes ». Dans beaucoup de cas, en raison d’obligations éthiques, commerciales ou juridiques, les données doivent être assujetties à un accès contrôlé et, dans certains cas, l’accès aux données ne peut pas être fourni. Voyez les conseils des IRSC sur l’application de ces principes.
Pour la recherche réalisée par ou avec une communauté métisse, inuite ou des Premières Nations, le PGD doit être élaboré conjointement avec cette communauté, conformément aux principes de gestion des données de recherche qu’elle accepte, comme les principes CARE (en anglais seulement) — Collective Benefit (avantage collectif), Authority to Control (autonomie décisionnelle), Responsibility (responsabilisation) et Ethics (éthique) —, les principes PCAP® — propriété, contrôle, accès et possession — des Premières Nations, les principes de la Stratégie nationale inuite sur la recherche (Inuit Qaujimajatuqaugit) [ PDF (4,4 Mo) - lien externe ] ou les principes PCAI — propriété, contrôle, accès et intendance — de la Fédération métisse du Manitoba.
Instructions pour les différentes sections du plan de gestion des données
Mise en contexte : rôles et responsabilités, questions éthiques et juridiques, gestion des données liées aux Autochtones
- Établissez qui sera responsable de la gestion des données pendant et après le projet, ainsi que les principales tâches de gestion des données associées à ces responsabilités.
- Décrivez les contraintes éthiques, juridiques ou commerciales auxquelles les données sont soumises, le cas échéant. Si le projet touche à des données de nature délicate, expliquez la façon dont les obligations éthiques préalables au projet (p. ex. consentement des participants à la collecte et à l’utilisation des données) seront remplies.
- Si le projet comporte des travaux réalisés par ou avec une communauté métisse, inuite ou des Premières Nations, précisez comment vous comptez respecter les principes autochtones de gestion des données de recherche. Décrivez la collaboration avec les partenaires autochtones du projet qui a abouti au PGD (notamment qui a été mobilisé et quand, et comment le partenariat a influencé le PGD).
Exemples de lacunes à combler dans cette section
- Le plan énonce les risques associés à la protection de la vie privée, mais il n’explique pas comment ceux-ci seront atténués.
- Le plan indique que le projet fera appel à des groupes autochtones et que les principes autochtones de gestion des données de recherche seront respectés, mais ne précise pas l’approche de gestion des données qui sera utilisée tout au long du projet et une fois le projet achevé — p. ex. le plan n’explique pas la structure de gouvernance qui fera en sorte que la propriété et le contrôle des données des Autochtones restent entre les mains de ces derniers.
Collecte de données
- Décrivez quelles données seront recueillies, produites ou utilisées et de quelle manière — p. ex. au moyen d’études observationnelles, d’expériences, de simulations, de logiciels ou d’outils en particulier (p. ex. REDCap).
Exemples de lacunes à combler dans cette section
- Le plan indique quelles données seront produites, mais il ne précise pas quel logiciel ou quelle plateforme seront utilisés pour les produire.
Documentation et métadonnées
- Expliquez si des informations seront fournies aux autres pour aider à la compréhension et à la réutilisation des données — p. ex. fichier de texte « readme », cahier de code, cahier de laboratoire, etc. Idéalement, la documentation du jeu de données est fournie dans un format lisible par machine et librement accessible — p. ex. en formats « .csv » ou « .txt ».
- Indiquez quelle norme de métadonnées sera utilisée, lorsque possible et pertinent. La norme peut être générale (p. ex. Dublin Core [en anglais seulement] ), mais elle est idéalement propre au domaine du projet (le cas échéant, elle peut être soutenue par le dépôt dans lequel vous prévoyez stocker les données). Une telle indication est particulièrement pertinente pour les équipes de recherche qui prévoient établir une plateforme ou un centre de données.
Exemples de lacunes à combler dans cette section
- Le plan prévoit la documentation adéquate des données, mais il n’explique pas quelle méthode sera employée — p. ex. au moyen d’un fichier de texte « readme ».
- Le plan ne précise pas si une norme de métadonnées sera utilisée et n’apporte pas de justification à cet effet.
Stockage, sécurité et accès
- Expliquez où et comment les données seront stockées de façon sécuritaire au cours du projet de recherche, et qui y aura accès (p. ex. quels membres de l’équipe de recherche). L’emplacement de stockage pour la durée du projet est souvent fourni par votre établissement, ou parfois par des fournisseurs externes, surtout si vous prévoyez collaborer avec l’industrie ou d’autres partenaires non universitaires.
Exemples de lacunes à combler dans cette section
- Le plan affirme que les données seront stockées de façon sécuritaire durant le projet, mais ne précise pas l’emplacement du stockage ni les personnes qui y auront accès pendant les travaux.
Conservation, dépôt et partage
- Expliquez où les données seront déposées lorsque le projet de recherche sera terminé et pendant combien de temps elles seront conservées. Les chercheurs peuvent décider de conserver les données dans le dépôt de leur établissement, de les déposer dans un dépôt externe, ou bien d’en conserver une partie au sein de leur établissement (p. ex. données de nature délicate) et de déposer le reste dans un dépôt externe (p. ex. données se prêtant au libre accès). Il est important de prévoir ces éléments dès le début du projet, afin qu’un plan clair puisse être suivi dans l’éventualité où le CPD quitterait ses fonctions ou changerait d’établissement.
- Expliquez quelles données seront partagées et sous quelle forme (c.-à-d. brutes ou traitées). Expliquez, s’il y a lieu, si les données sont assujetties à des contrôles d’accès ou à des limites pour des raisons de confidentialité, de protection de la vie privée ou de propriété intellectuelle.
- Décrivez les procédures d’accès aux données s’il y a lieu.
Exemples de lacunes à combler dans cette section
- Le plan indique que les données seront déposées, mais il ne précise pas où ni pendant combien de temps; le plan mentionne un dépôt, mais celui-ci est inadéquat ou non conforme aux pratiques exemplaires propres à la discipline du projet.
- Le plan mentionne que les données ne peuvent pas être partagées afin de respecter des exigences de protection de la vie privée ou d’un comité d’éthique de la recherche, mais les explications à ce sujet sont manquantes ou peu convaincantes.
- Le plan n’explique pas comment les données seront rendues accessibles aux autres — p. ex. le dépôt rendra les données disponibles à tous sur le Web ou en contrôlera l’accès, un identifiant pérenne à ajouter aux publications sera assigné aux données, etc.
Cinq étapes essentielles pour appliquer les principes FAIR à vos données
Les principes FAIR sont le reflet des meilleures pratiques internationales pour garantir que les données de recherche diffusées sont faciles à trouver, accessibles, interexploitables et réutilisables. Le présent document vise à vous fournir des indications pour adhérer à ces principes.
Les principes FAIR et le présent document n’offrent pas d’indications quant aux questions et aux approches éthiques qui doivent être prises en compte pour déterminer les paramètres d’accès aux données à mettre en place. Pour obtenir plus de renseignements et de conseils sur les questions éthiques liées au partage de données, veuillez communiquer avec les bibliothécaires de données ou les agents d’éthique de la recherche de votre établissement.
En ce qui concerne la recherche réalisée par ou avec une communauté métisse, inuite ou des Premières Nations, les principes FAIR ne doivent être appliqués qu’après en avoir informé la communauté autochtone concernée, après avoir obtenu son consentement et conformément aux principes de gestion des données de recherche qu’elle accepte, comme les principes CARE (en anglais seulement) — Collective Benefit (avantage collectif), Authority to Control (autonomie décisionnelle), Responsibility (responsabilisation) et Ethics (éthique) — ou PCAP® — propriété, contrôle, accès et possession.
Dans l’encadré ci-dessous, vous trouverez un résumé des cinq étapes à suivre pour appliquer les principes FAIR à vos données. Pour obtenir des directives techniques et détaillées, veuillez consulter la page FAIR Principles (en anglais seulement) sur le site Web de GOFAIR.
Cinq étapes essentielles pour appliquer les principes FAIR à vos données
- Créez ou enregistrez une version de vos données dans un format de fichier couramment compris et non exclusif (p. ex. .txt, .csv). Si des normes de données ou des attentes quant au format des données sont établies pour votre domaine de recherche, respectez-les.
- Déposez vos données dans un dépôt reconnu par votre domaine de recherche. S’il n’existe aucun dépôt propre à votre domaine, choisissez un dépôt général (p. ex. DFDR, Zenodo [en anglais seulement], Dryad [en anglais seulement]). Le dépôt doit être indexé dans un agrégateur de bases de données de premier plan (p. ex. OpenAIRE [en anglais seulement], Dataset Search de Google, DataMed [en anglais seulement]).
- Une norme de métadonnées doit être établie pour le dépôt; suivez cette norme lorsque vous remplissez la fiche de métadonnées du jeu de données. Vous pouvez utiliser des outils en ligne comme CEDAR Workbench (en anglais seulement) pour vous aider à remplir la fiche de métadonnées sans commettre d’erreur.
- Choisissez une licence appropriée (en anglais seulement) pour la réutilisation de vos données.
- Le dépôt doit permettre d’attribuer un identifiant pérenne (PID) au jeu de données ou à la fiche de métadonnées, comme un identificateur d’objet numérique (DOI) (en anglais seulement). Lorsque vous publiez un article qui se fonde sur ces données, veillez à ce qu’il comporte un énoncé sur l’accès aux données comprenant un PID.
- Date de modification :