Lexique

Archives ouvertes

également : archives OAI/ archives en libre accès / archives électroniques ouvertes (open archive)
Réservoir où sont déposées des données issues de la recherche scientifique et de l’enseignement dont l’accès se veut ouvert, c’est-à-dire sans barrière.
Cette ouverture est rendue possible par l’utilisation de protocoles communs qui facilitent l’accessibilité de contenus provenant de plusieurs entrepôts maintenus par différents fournisseurs de données.

Centre de données

également Data Center
Infrastructure immobilière et technique qui sert à stocker des informations de manière centralisée. Cette infrastructure héberge d’importants équipements informatiques (serveurs) dans des salles techniques spécifiques et sécurisées (alimentation électrique, refroidissement, accès au réseau).

Data paper

Article scientifique examiné par les pairs (peer-reviewing) décrivant les données, leurs méthodes d’obtention et leur potentiel pour de futures recherches. L’objectif d’un data paper est de valoriser les données, et d’informer la communauté scientifique de leur existence et de leur disponibilité dans un entrepôt de données.

Délégué à la protection des données

également Data Protection Officer (DPO)
Ses missions sont définies dans les articles 38 et 39 du  Règlement général sur la protection des données.
Le DPO doit s’assurer et contrôler que le RGPD est bien respecté dans l’organisation (publique ou privée) où il exerce. Il conseille de manière indépendante le responsable du traitement et l’informe quant aux obligations en matière de protection des données personnelles. Enfin, il gère les interactions avec la CNIL (ou toute autre autorité de contrôle).

Données de la recherche

également Données scientifiques ou Research data
Ensemble des informations collectées, observées ou créées sous une forme numérique dans le cadre d’un projet de recherche.

Entrepôt de données

également Data Share House ou Data Warehouse
Base de données rassemblant une grande quantité d’informations issues de différentes applications de production avec des formats divers (Excel, XML…).

Exploration de données ou Data Mining

Exploration et l’extraction de connaissances à partir de grandes quantités de données par des méthodes automatiques ou semi-automatiques grâce à des algorithmes. Cette exploration permettra ainsi de construire des modèles scientifiques. Cette fouille peut s’appliquer aussi à du texte : on parlera alors de Text and Data Mining ou TdM.

Gestionnaire de données

également Data Manager
Recueille et organise les informations de l’entreprise en vue de leur exploitation optimale. Il crée et administre les bases de données. Il a généralement des compétences en statistiques et/ou informatique.


Jeu de données

également Dataset
« agrégation (…) de données brutes ou dérivées présentant une certaine « unité », rassemblées pour former un ensemble cohérent » (définition INIST).
Un jeu de données peut avoir une structure tabulaire (CSV type Excel), une structure d’arbre (type JSON ou XML) une structure de graphe (type RDF).

IDENTIFIANT PERSISTANT (PID)

Un identifiant pérenne (Persistent identifier ou PID) est un code alphanumérique associé à un objet ou ressource de façon permanente. Il est disponible et gérable à long terme ; il ne changera pas si l’objet est renommé ou déplacé (changement de site, d’entrepôts de données…).

Libre accès

Par « accès libre », il faut entendre mise à disposition gratuite sur l’Internet public, permettant à tout un chacun de lire, télécharger, copier, transmettre, imprimer, chercher ou faire un lien vers le texte intégral de ces articles, les disséquer pour les indexer, s’en servir de données pour un logiciel, ou s’en servir à toute autre fin légale, sans barrière financière, légale ou technique autre que celles indissociables de l’accès et l’utilisation d’Internet. La seule contrainte sur la reproduction et la distribution, et le seul rôle du copyright dans ce domaine devraient être de garantir aux auteurs un contrôle sur l’intégrité de leurs travaux et le droit à être correctement reconnus et cités via une licence creative commons.

LICENCE CREATIVE COMMONS

Toutes les licences Creative Commons ont de nombreuses caractéristiques importantes en commun. Chaque licence Creative Commons assure également aux titulaires de droits qu’ils seront crédités et cités de la manière dont ils le souhaitent. Toutes les licences Creative Commons fonctionnent dans le monde entier et s’appliqueront aussi longtemps que dureront les droits d’auteur (parce qu’elles sont fondées sur les droits d’auteur). Ces caractéristiques communes servent de point de référence, à partir duquel les titulaires de droits peuvent choisir d’accorder des permissions complémentaires quand ils décident de la manière dont ils souhaitent que leur œuvre soit utilisée.

Métadonnées

En termes simples, les métadonnées sont des « données sur les données », ou des informations utilisées pour identifier et décrire les données, elles sont l’un des éléments clés de la pratique FAIR.

Selon les principes FAIR, l’identifiant persistant (PID) et « des métadonnées suffisamment riches » sont suffisants pour permettre à vos données d’être trouvées, utilisées et citées de manière fiable.

Les métadonnées sont inhérentes aux documents que vous avez créés comme celles présentes dans un document texte, dans une photographie, ou d’image produite par un microscope avec les données constructeur. Votre travail sera de les enrichir avec des mots clefs pour qu’elles puissent être trouvées par une simple recherche. Pour cela, vous devez créer vos métadonnées en utilisant un vocabulaire contrôlé.

Plan de gestion de données (PGD)

également Data Plan Management (DMP)
Document formel explicitant la façon dont vous obtenez, documentez, analysez et utilisez vos données à la fois au cours de votre recherche et une fois le projet terminé.
Il décrit dans le détail les méthodes et processus de création, de fourniture, de maintenance, de conservation et de protection des données. (Définition Cirad)

Voie dorée

également golden road, gold road, gold OA, journal-mediated OA
S’applique à la publication d’articles dans des revues en libre accès, quel que soit leur mode de financement. Elle correspond à la deuxième stratégie recommandée dans l’Initiative de Budapest pour l’Accès Ouvert : « Revues alternatives : en second lieu, les savants ont besoin des moyens pour lancer une nouvelle génération de revues alternatives engagées dans le libre accès et pour aider les revues existantes qui choisissent d’opérer la transition vers l’accès libre. »

Voie verte

également green road, green OA, green road to OA, repository-mediated OA
Auto-archivage par les chercheurs ou l’archivage par une tierce personne des articles dans des archives ouvertes. Elle correspond à la première stratégie préconisée dans l’Initiative de Budapest pour l’Accès Ouvert : « Auto-archivage : en premier lieu, les savants ont besoin d’outils et d’assistance pour déposer leurs articles de revues à comité de lecture dans des archives électroniques ouvertes, une pratique communément appelée auto-archivage »

Extrait du glossaire de l’INIST http://openaccess.inist.fr/spip.php?page=glossaire