Métadonnée

Infos
Une métadonnée (du grec meta "après" et du latin data "informations") est une donnée servant à définir ou décrire une autre donnée quel que soit son support (papier ou électronique).
Métadonnée

Une métadonnée (du grec meta "après" et du latin data "informations") est une donnée servant à définir ou décrire une autre donnée quel que soit son support (papier ou électronique).

Historique

Dans les bibliothèques numériques (médiathèques), on a pris l'habitude d'utiliser des notices bibliographiques pour décrire le contenu et les aspects normatifs d'un document. Elles facilitent la gestion interne des ressources documentaires et, côté usagers, permettent d'optimiser la recherche et la localisation des documents électroniques. Dès 1988, la Bibliothèque du Congrès, aux États-Unis, proposait un protocole pour la recherche d'information (Z39.50), fondé sur des éléments de données, qui fut revu en 1992.

Généralisation

Les langages de marquage de type GML, puis SGML et HTML, permirent d'introduire des métadonnées dans les documents. Les Communautés européennes adoptèrent le langage SGML dès 1984. La notion de métadonnées utilisables par les ordinateurs fut proposée assez tôt dans l'histoire du Web, dès 1994, par son inventeur Tim Berners-Lee, lors de la conférence WWW 94 où fut annoncée la création du W3C. Les métadonnées sont en effet au cœur de l'architecture Web. En 1995, les métadonnées firent l'objet d'un atelier à Dublin (Ohio), pour les méthodes de recherche d'information. En parallèle, la bibliothèque du Congrès proposait une 3 version du protocole Z39.50. En 1999, le W3C définit le cadre permettant de créer un réseau de métadonnées acceptant le langage XML : Resource Description Framework (RDF). Le tronc commun de métadonnées Dublin Core a été adopté par l'Union européenne en 2002.

Une notion qui concerne tous les organismes

Description

Les notices contiennent des informations sur la source du document (titre, auteur, date, sujet, éditeur, etc.), la nature du document (monographie, périodique, etc.), son contenu informationnel (descripteurs, mots-clés, résumé) et sa localisation physique (la cote). Pour un document numérique, ces notices s'appellent des métadonnées et sont contenues dans le document lui-même. Les métadonnées sont aussi utilisées pour d'autres types de ressources informatiques contenant des images ou du son (cédérom, dévédérom). Les métadonnées sont, dans le cadre du Web sémantique, des données signifiantes qui permettent de faciliter l'accès au contenu informationnel d'une ressource informatique, une notice de contenu intégrée en quelque sorte (dans l'en-tête des documents HTML côté code source ou en tant que fichier XML autonome par exemple). Au moins quinze éléments, répartis autour de trois domaines, permettent d'identifier et de décrire les ressources documentaires :
- Contenu : titre, sujet, description, source, langue, relation, couverture.
- Propriété intellectuelle : créateur, éditeur, contributeur, droits (droits d'auteur, ...).
- Matérialisation : date, type, format, identifiant. Les métadonnées sont un élément essentiel de l'architecture Web. Toutefois, limiter les métadonnées aux ressources numériques de types documents, sons et images, serait une erreur : dans les bases de données relationnelles, les métadonnées incluent le nom de chaque table et le type de chaque colonne dans la table.

Une notion essentielle à l'interopérabilité

Les métadonnées correspondent à des balises que l'on introduit dans les fichiers ou dans des langages de programmation appropriés, les langages de marquage XML. Les balises ont pour effet d'améliorer l'efficacité des recherches d'information par rapport aux recherches plein texte. RDF (Resource Description Framework) crée les conditions d'interopérabilité, avec des réseaux de métadonnées, et l'utilisation du langage XML. Il est très important de noter que les ressources numériques balisées transportent avec elles leurs propres métadonnées lorsqu'elles sont téléchargées, copiées, répliquées, transmises par des messageries électroniques. Ceci s'applique à tous les types de ressources numériques (texte, son, image, multimédia). Les métadonnées sont ainsi l'un des principaux éléments de l'étiquetage avec des balises (ou tags, en langage informatique), surtout dans le Web 2.0. Le potentiel des métadonnées est beaucoup plus important, car elles peuvent faire interopérer les ressources informatiques, dans la mesure où elles ont été paramétrées et structurées dans des dictionnaires de données (ou registres de métadonnées). On peut alors faire communiquer les bases de données classiques, utilisées dans les progiciels de gestion intégrés) et les données non structurées (documents, images, manipulés en gestion des connaissances...).

Tous les secteurs de l'économie peuvent être concernés

Pour un ensemble de raisons, tant historiques que juridiques, on n'a pas encore pris conscience, en Europe, de la sensibilité de la gestion des métadonnées pour les processus de décision dans les entreprises. Même aux États-Unis, cette prise de conscience a été difficile, la technicité du sujet cachant son caractère stratégique. Voir http://www.tdan.com/i008fe01.htm SELECTING THE "RIGHT" META DATA TO MANAGE Robert S. Seiner - TDAN.com & KIK Consulting Services L'expert américain Robert Steele a bien compris l'importance des métadonnées dans les sources ouvertes. Les métadonnées concernent tous les secteurs de l'économie à travers la gestion de contenu, puisque tous les organismes gèrent des ressources documentaires sous forme électronique :
- Administrations centrales et territoriales,
- Entreprises,
- Universités et grandes écoles,
- Centres d'études et de recherches,
- Médiathèques. Dans l'économie de l'immatériel, il est important de protéger le patrimoine informationnel constitué par les ressources documentaires, car les documents électroniques contiennent souvent des données confidentielles. La circulation de documents sous forme électronique entre différents types d'organismes rend la protection du patrimoine informationnel complexe.

Différence de perception entre l'Amérique et l'Europe

Selon Robert Steele, expert américain en sources ouvertes, qui intervient à Bruxelles, les métadonnées sont appelées à jouer un rôle de plus en plus important pour la représentation avancée de contexte dans les modèles de contrôle d'accès et les langages de ressources Web actives.

En Amérique

Un certain nombre d'équipes impliquées dans la sémantique sur le web ont organisé un atelier à Dublin (Ohio) en 1995 sur les métadonnées, en définissant le standard Dublin Core. Différents départements du gouvernement fédéral (DoD, ...) se sont dotés de registres de métadonnées, qui permettent de définir un champ commun de partage de connaissances entre des organisations travaillant sur des sujets de souveraineté : défense, justice, environnement...Le responsable du chantier DRM (data reference model) du projet FEA du gouvernement fédéral, Michael Daconta, est l'ancien responsable du centre d'excellence sur les métadonnées du Department of Homeland Security. La Bibliothèque du Congrès, située à Washington, joue un rôle moteur dans la définition des métadonnées aux États-Unis. Les standards de métadonnées sont l'un des trois éléments clés de la stratégie données en réseau centré du département de la défense des États-Unis, avec les communautés d'intérêt et les services d'entreprise GIG. Le gouvernement canadien doit se conformer au Dublin Core depuis octobre 2001.

Dans l'Union européenne

Au Royaume-Uni, l' (United Kingdom Office for Library and Information Networking) est l'organisme le plus avancé sur la gestion de l'information numérique (métadonnées et interopérabilité). Il développe des projets pour la recherche et développement financés par l'Union européenne. Il a une influence sur la réglementation, l'« awareness », la recherche et développement, les technologies Web. En France, par manque d'information ou de formation à ce propos, relativement peu de webmestres intègrent des métadonnées aux contenus numériques qu'ils publient. La raison est probablement que les métadonnées n'ont pas de valeur juridique normative au niveau européen et dans les États membres (en particulier en France), puisqu'il n'y a pas d'obligation légale ni de standard officiel. Les webmestres introduisent au coup par coup des métaéléments (meta tags, balises meta) dans les pages web. Des organismes comme le Commissariat à l'énergie atomique et le CNES (membres de l'association emploient des métadonnées pour l'archivage à long terme, en utilisant les recommandations de l'OAIS. La a adopté en 2002 les Identifiants de Ressource Uniformes (Uniform Resource Identifiers, URI) pour l'accès aux ressources Web, en s'appuyant sur des standards de métadonnées. « Nos standards de métadonnées ont des éléments - unités signifiantes - qui peuvent être comparés et mis en correspondance avec des éléments d'autres standards ». Ce groupe de projet a travaillé pour la Commission européenne. Il est composé de personnes appartenant à :
- GILS : Government Information Locater Service (USA)
- MARC21 : standards de la bibliothèque du Congrès américain (USA)
- IEEE/LOM : Learning Object Metadata (USA)
- DCMI : Dublin Core Metadata Initiative (USA)
- DOI Foundation : Digital Object Identifier
- ONIX : ONIX for books, diffusion de livres
- CERIF : Common European Research Informade0031.htm Metadata/Taxonomy]
- la NASA : . Les classifications étant structurées, il est plus aisé de gérer la traçabilité, d'agréger les données, et de protéger le patrimoine informationnel. Les métadonnées sont ainsi un élément essentiel du chantier de gestion de contenu en ingénierie des connaissances.

Métadonnées et traçabilité : gestion de la preuve

La gestion des documents d'archives doit pouvoir s'appuyer sur des données cohérentes le long du cycle de vie des données. Il existe donc des normes de gestion des documents d'archives (ISO 15489), et une norme particulière sur les métadonnées (ISO).

Métadonnées et agrégation des données : gouvernance

Dans le domaine de la gouvernance en général (gouvernement, administrations, entreprises, les métadonnées stockées dans des métadictionnaires (ou repository ; référentiels) sont utilisées comme « données sur les données », ou données de référence. Les métadonnées permettent de décrire les données utilisées dans les analyses et prises de décisions :
- la définition exacte des données (sémantique)
- la source des données (date, origine)
- la façon dont elles sont calculées, agrégées, ... (règles de calcul)
- les règles métier qui s'y rapportent
- le processus d'extraction, transformation et chargement qui a été mis en œuvre (voir ETL et Intégration d'applications d'entreprise). Les métadonnées facilitent les analyses croisées dans la gouvernance d'entreprise :
- Les tableaux de bord de gestion et l'informatique décisionnelle (entrepôts de données et datawarehouse) : dans ce cas, les outils d'extraction et de gestion des métadonnées sont répertoriés dans la liste d'outils décisionnels.
- Les tableaux de bord prospectifs, encore peu employés en France.

Cadre de référence

Des travaux internationaux convergent pour utiliser « intelligemment » avec le Web les métadonnées avec des moteurs de recherche en décrivant les ressources numériques ou physiques et en établissant des relations avec d'autres ressources.

Mise en œuvre d'un registre de métadonnées

Le pilotage d'organisations complexes (administrations centrales et locales, pôles de compétitivité, ...) nécessite d'employer des informations d'autorité, qui sont contenues dans des référentiels de métadonnées appelés registres de métadonnées. Un registre de métadonnées est un « Système de gestion des métadonnées, c'est-à-dire un système formel qui fournit l'information d'autorité sur la sémantique et la structure de chaque élément. Pour chaque élément, le registre en donne la définition, les qualificatifs qui lui sont associés, ainsi que les correspondances avec des équivalents dans d'autres langues ou d'autres schémas. » La norme ISO/CEI 11179, dont l'application est fortement conseillée par le gouvernement américain, inclut les recommandations pour la mise en œuvre d'un registre de métadonnées. La partie 6 contient des recommandations organisationnelles. Par exemple, il faut mettre en place, au niveau adéquat, l'organisation qui convient (architectes de données, réseau de correspondants, ...).

Référentiels de métadonnées généraux : Dublin Core

Ce référentiel trouve son origine aux États-Unis (1995) et a été adopté par plus de huit gouvernements. Le « Dublin Core » est la principale initiative visant à la convergence des éléments de métadonnées à utiliser. C'est un schéma de métadonnées générique qui peut servir de base à des registres de métadonnées. Le Dublin Core pousse à une normalisation dans l'Union européenne, via les données employées dans les systèmes d'information. La Commission européenne emploie donc des métadonnées dans ses livres blancs, sur des sujets pouvant toucher à la souveraineté. Le programme IDABC de la Commission européenne (3 phase du programme IDA), concernant les services d'e-Gouvernement, s'appuie largement sur les métadonnées du Dublin Core. Il a donné naissance au projet MIReG, qui vise à développer un framework de métadonnées, concernant les extensions du Dublin Core aux informations gouvernementales, qui soit basé sur les recommandations nationales sur les métadonnées des informations du secteur public. Le projet de directive INSPIRE (2006) doit inciter les États membres et la Communauté européenne à mettre en place des organisations publiques (services de jeux de données), chargées de créer et de mettre à jour les métadonnées (registres de métadonnées), au moins pour ce qui concerne les informations géographiques. Elle devrait faire évoluer le cadre législatif.Il faut noter que la directive 2003/98/CE fournit un cadre pour la réutilisation des informations du secteur public. Les conditions d'application de la directive sont fonction des États membres et des organismes de secteur public. Il existe un projet de traduction française de la norme internationale Dublin Core (voir ), mais aucun organisme ne semble prendre la responsabilité ou le leadership.

Métadonnées et structuration des données

Métadonnées et contenu des pages web

Le contenu des pages web est structuré à l'aide de balises meta, en langage HTML. Les différentes balises employées permettent de structurer les informations selon différents thèmes (mots-clés, description, auteur, titre, sujet...).

Métadonnées et validation des documents : DSDL

Le langage XML a été conçu pour faire circuler de l'information porteuse de sémantique sur la Toile. Cette circulation permet de valider progressivement les informations pour en faire de la connaissance partagée entre des communautés de pratique. Partant du DTD de SGML, l'échelle de validation des Document Schema Definition Languages (DSDL) a été mise au point afin de valider les documents électroniques. Dans le cas d'XML, l'emploi de schémas XML permet de faire passer les documents XML du stade "well-formed" au stade "valid". Les outils qui participent à cette validation progressive sont les moteurs de recherche, dont l'optimisation s'appuie largement sur les éléments méta du langage HTML employé pour les pages web, les moteurs de règle, et les moteurs d'orchestration. Dans ce processus global, les liens (type d'élément link dans HTML) mettent à jour en permanence les liens entre pages web pour "optimiser" la connaissance. Par exemple, dans le commerce électronique, à partir d'une organisation en registre de métadonnées, l'utilisation conjointe du registre ebXML et du registre d'annuaires UDDI permet d'organiser une orchestration (en interne aux entreprises) et une chorégraphie (en externe aux entreprises).

Métadonnées et classification : schémas de classification

Les métadonnées permettent de structurer des classifications. On trouve des exemples de taxonomies employant des métadonnées :
- l'Income Revenue Service : Le « Dublin Core » comprend 15 éléments de description :
- formels (titre, auteur, éditeur),
- intellectuels (sujet, description, langue…)
- et relatifs à la propriété intellectuelle. Chaque élément de description a plusieurs raffinements possibles (version qualifiée). L'utilisation de ce référentiel doit impérativement être accompagnée d'une organisation en registre de métadonnées. Avant toute mise en œuvre de ce référentiel, il faut être conscient de son caractère sensible sur le plan de la protection du patrimoine informationnel et des contraintes organisationnelles qui y sont liées. C'est la raison pour laquelle le gouvernement américain conseille fortement de s'appuyer sur les recommandations de la norme ISO/CEI 11179 (partie 6 sur l'enregistrement). Le moteur de recherche Google s'appuie sur le Dublin Core. La programmation network-centric utilise les métadonnées du Dublin Core. Le système de publication d'OpenWeb est basé sur ce tronc commun. La norme ISO 15836:2003 est la transposition normative de ce référentiel en version non qualifiée. Elle est utilisée par plus de huit gouvernements dans le monde. En France, on l'emploie dans la Gestion électronique des documents (GED) ou dans les Systèmes d'archivage électronique (SAE). Il n'existe pas de traduction officielle, complète, et unique du référentiel Dublin Core en français. Il existe plusieurs guides d'utilisation en français. Voir : . Il existe d'autres référentiels de métadonnées :
- Le standard 5015.2 du département de la défense pour le records management,
- Open Document Management API (ODMA), très orienté sur les documents électroniques,
- X500 Green Pages.

Autres référentiels de métadonnées

Bibliothèques L'initiative la plus ancienne pour définir des troncs communs d'éléments standardisés de métadonnées remonte aux années 1960, avec le standard MARC développé par la bibliothèque du Congrès. Le schéma MODS, développé par la Bibliothèque du Congrès, est un compromis entre la complexité de MARC et la simplicité du Dublin Core. Archivage à long terme L'archivage à long terme se fait selon le modèle OAIS, avec le schéma XML METS (Metadata Encoding and Transmission Standard). Il est utilisé par le Commissariat à l'énergie atomique et le CNES. Presse L'IPTC recommande l'utilisation d'un référentiel international de métadonnées spécifique à la presse, IPTC Core.

Cadre général : Web sémantique, RDF

Les métadonnées trouvent leur pleine utilisation dans le Web sémantique. Celui-ci repose :
- sur les standards généraux du Web :
- Protocole HTTP,
- URI,
- langage XML
- sur des standards propres au Web sémantique :
- Resource Description Framework (RDF) : ce cadre de référence comporte des modèles de graphe destinés à décrire de façon formelle les ressources Web et leurs métadonnées, de façon à permettre le traitement automatique de telles descriptions. RDF a été défini en 1999 par le W3C, c'est le référentiel de base du Web sémantique.
- Les métadonnées peuvent également être utilisées dans des extensions de RDF : RDF Schema et OWL.

Formats

- XMP : format de métadonnées basé sur XML, utilisé dans les applications PDF, de photographie et de graphisme, applicable au web. Il a été lancé par Adobe Systems en avril 2001.

Normalisation

La quasi-totalité des normes sur les métadonnées ne sont disponibles qu'en anglais. Les seules normes qui soient disponibles en langue française sont celle sur le Dublin Core (qui en réalité est très courte), et surtout la norme ISO 21127 sur le patrimoine culturel immatériel. La normalisation est importante sur différents aspects : la recherche d'information, la structuration d'ontologies dans le web sémantique, et la définition de règles métier. Les normes sur les registre de métadonnées (ISO 11179, complétée par deux autres normes, Dublin Core) définissent les concepts et l'organisation. En plus de ces normes générales, il existe des normes particulières à certains domaines :
- L'archivage informatique ;
- Le patrimoine culturel (ISO 21127) ;
- Les informations géographiques ;
- Le commerce électronique ;
- La gestion des documents d'archives ;
- Les documents électroniques.

Risques

Risques liés aux métadonnées

Les métadonnées sont utiles à l'interopérabilité, mais leur emploi sans précaution présente des risques.
- On a déjà souligné que la mise en œuvre d'un registre de métadonnées nécessite de s'appuyer sur la norme idoine (ISO/CEI 11179),
- Certains experts préconisent d'enlever les métadonnées des documents électroniques. Voir : Le plus grand risque serait d'ignorer l'importance des métadonnées, et de ne pas percevoir qu'elles sont largement utilisées dans beaucoup de systèmes informatiques.

Utilisation par les langages informatiques

Les métadonnées peuvent être utilisées dans les langages de marquage : SGML, HTML, XHTML. XML, et ses langages dérivés :
- Langage GML (Geography Markup Language) ;
- Langage multimédia SMIL 1.0 (élément meta) et SMIL 2.0 (élément metadata). Le langage SKOS, en cours de développement au W3C pour utilisation dans la Communauté européenne, prévoit d'employer des métadonnées dans le cadre RDF en environnement web sémantique. Le langage Java accepte également les métadonnées. Voir : Liste des JSR sur l'interopérabilité informatique

Génération des métadonnées

Les métadonnées peuvent être introduites de façon manuelle, mais aussi semi-automatique, ou automatique. Voir :
-
-

Critiques

Bien que la majorité des informaticiens voient les métadonnées comme une opportunité pour une meilleure interopérabilité, certaines critiques font remarquer que :
- Les métadonnées sont trop chères et consommatrices de temps. L'argument est que les entreprises ne produiront pas de métadonnées sans qu'il y ait un besoin, car cela coûte de l'argent, et les particuliers ne produiront pas de métadonnées complexes parce que leur création prend beaucoup de temps.
- Les métadonnées sont trop complexes. Les particuliers ne créeront pas de métadonnées parce que les formats existants, spécialement MPEG-7, sont trop compliqués. Tant qu'il n'y aura pas d'outil automatique pour créer les métadonnées, on n'en créera pas.
- Les métadonnées sont subjectives et dépendent du contexte. Deux personnes associeront probablement des métadonnées différentes à la même ressource en raison de leurs points de vue différents. De plus, les métadonnées peuvent être mal interprêtées du fait qu'elles dépendent du contexte. Par exemple, la recherche sur "art post-moderne" peut manquer un certain élément parce l'expression n'était pas en usage au moment où cette œuvre d'art a été créée, ou bien la recherche sur les "photos prises à 1:00" peut produire des résultats confus à cause des différences de temps local.
- Il n'y a pas de fin aux métadonnées. Par exemple, lorsqu'on annote un match de football avec des métadonnées, on peut décrire tous les joueurs et leurs actions et s'arrêter là. On peut aussi décrire la publicité en arrière-plan et les vêtements que portent les joueurs. On peut aussi décrire chaque supporter dans les tribunes et les vêtements qu'il porte. Toutes ces métadonnées peuvent être intéressantes d'une façon ou d'une autre — comme les spectateurs, les sponsors ou une unité de la police spécialisée dans la lutte contre le terrorisme — et même pour une simple ressource, la quantité possible de métadonnées peut être gigantesque.
- Les métadonnées sont inutiles. Beaucoup de moteurs de recherche permettent aujourd'hui de trouver du texte très efficacement. D'autres techniques pour rechercher des images, de la vidéo et de la musique deviendront de plus en plus puissantes dans l'avenir. Ainsi, on n'a pas vraiment besoin des métadonnées.
- Pour les documents multilingues, il faut encore traduire les métadonnées, ce qui accroît la complexité et les risques. Il faudrait en outre traduire les normes sur les métadonnées dans les principales langues.

Utilisations par types de ressources

Pages Web

Le langage HTML permet de structurer la nature et le contenu des pages Web. C'est l'utilisation la plus classique.

Bases de données relationnelles

Les bases de données relationnelles utilisent aussi des métadonnées dans les tables. C'est dans la phase d'alignement stratégique des projets de système d'information, en particulier d'urbanisation, que l'on est amené à étudier comment les données de sécurité se positionnent dans l'architecture de données des systèmes d'information.

Systèmes de fichiers Unix

Les systèmes de fichiers disposent de quelques informations de base sur les fichiers, qui sont à ce titre des métadonnées. Les principales sont le nom du fichier, sa taille, la date de création et de dernière modification. Dans les systèmes UNIX, les droits d'accès (en lecture, écriture et exécution selon l'utilisateur, le groupe, ou les autres) sont des métadonnées sensibles. Ces droits d'accès sont décrits dans ce que l'on appelle les inodes (contraction d'index-node, nœud d'index). Il semblerait que l'avenir de la localisation, de la lecture-repérage et de la collecte d'information dans les systèmes de fichiers passe par l'utilisation massive des métadonnées. Certains systèmes de fichiers en cours de développement comme la version 4 de ReiserFS ou WinFS ont pour objectif de rendre la recherche des fichiers plus simple et plus intuitive, et les métadonnées permettent d'y arriver. Tous les fichiers seront donc pourvus de métadonnées permettant de savoir ce qu'ils contiennent. Il faut noter que le principe n'est pas nouveau : le BeOS file system (BFS) était notamment réputé pour son support des métadonnées. Le ressource fork du système de fichiers utilisé par les anciennes version de Mac OS permettait également ce type de gestion.

Fichiers bureautiques

Des formats de fichiers tels que PDF, Word, Excel, ou OpenOffice.org utilisent des métadonnées. Elles sont visibles et peuvent être complétées à partir du menu Fichier > propriétés du document dans l'interface des applications correspondantes. Le format de document OpenDocument (ou ODF), ouvert, contient des métadonnées dans le fichier meta.xml. Ce format a été recommandé par Bernard Carayon et a été adopté par l'Union européenne.

Contenus multimédia

- MPEG-7 est une norme de description de contenu qui intègre des métadonnées
- MPEG-21
- MXF Fichiers graphiques Chaque format d'image numérique implémente une façon spécifique de stocker les métadonnées, mais il existe certaines normes communes à plusieurs types, par exemple :
- le standard EXIF est utilisable à la fois dans les fichiers JPEG ou TIFF,
- le standard XMP est intégrable à une douzaine de types de fichier différents (JPEG, JPEG 2000, TIFF, GIF, PNG, etc.).
- DIG35, et JPX. Son Les formats de son numérique intègrent des métadonnées :
- Dolby Digital EX
- Dolby E etc. Presse Les technologies applicables sont PRISM, NewsML, et NITF. Voir aussi : IPEG Fichiers MP3 Les métadonnées sont utilisées par le format MP3 dans les tags ID3. On peut en effet y insérer des informations comme le nom de la chanson, de l'interprète, ou encore la date de sortie.

Utilisations par types d'applications

Logiciels libres

Les logiciels libres utilisent comme tous les logiciels des métadonnées. Par exemple, le système de gestion intégrée des documents du gouvernement du Québec emploie des métadonnées avec des composants d'indexation et de stockage. Voir : En France, dans le Cadre Commun d'Interopérabilité du Référentiel Général d'Interopérabilité du programme d'e-Gouvernement ADELE, les technologies du logiciel libre sont représentées par l'intermédiaire de Zope, qui a des capacités à interopérer via le langage DTML (Dynamic Template Markup Language). Ce langage emploie lui-même des métadonnées. Voir :

Gestion des brevets

Les droits de propriété intellectuelle sont l'un des élements du Dublin Core. Les données sur les brevets peuvent être indexées dans des applications de gestion des brevets ou gestion des actifs novateurs (IPAM, Intellectual Property Asset Management, ou IAM), en utilisant des métadonnées. Voir :

Progiciels de gestion intégrés

Les grands progiciels de gestion intégrés (SAP, Oracle Corporation, ...) ont des fonctions permettant de gérer les métadonnées. On les appelle quelquefois gestion des données de référence ou Master Data Management (MDM).

Gestion de contenu

Les applications progicielles de gestion des connaissances ont, dans la gestion de contenu, des fonctions permettant de gérer les métadonnées. À ce titre, elles sont essentielles pour la gestion de la preuve (voir supra).

Interfaces de programmation (API)

Les métadonnées peuvent être employées dans les spécifications J2EE du langage de programmation Java, en particulier dans les interfaces de programmation (API). Elles font l'objet de formats d'interface : JMI (Java Metadata Interface), spécifique au langage Java. XMI (XML Metadata Interchange) est un standard d'échanges de métadonnées UML.

Moteurs de recherche

Les moteurs de recherche peuvent s'appuyer sur des métadonnées pour améliorer les recherches d'information par rapport aux recherches plein texte. Dans les années 1995-1999, on utilisait beaucoup des métaéléments HTML pour optimiser ies premiers moteurs de recherche, mais on s'est rendu compte qu'ils n'étaient pas toujours fiables.

Services Web

Les services Web (architecture SOA) manipulent de grandes quantités de métadonnées. L'organisation WS-I (Web Services Interoperability) a développé une série de profils pour faire évoluer les futures normes impliquées dans l'interopérabilité des services Web. Voir : . Les métadonnées servent à plusieurs choses : elles décrivent les formats de message que le service prend en charge, et les modèles d'échange de messages valides pour un service, grâce à la spécification WSDL. Les métadonnées décrivent aussi les capacités et les exigences d'un service, grâce à la spécification WS-Policy. Cette dernière forme de métadonnée se nomme la « stratégie » d'un service. Parmi les spécifications qu'utilisent les services web pour les métadonnées, outre WSDL et WS-Policy, il faut citer WS-Security et WS-MetadataExchange.Introduction à l'architecture de services Web et ses spécifications WS-
-
, Luis Felipe Cabrera, Christopher Kurt, Don Box, Microsoft, octobre 2004.

Informatique décisionnelle

Les métadonnées permettent d'effectuer des analyses multidimensionnelles, dans les applications de gestion des ressources humaines, finances, gestion de la relation client. À ce titre, elles sont un élément essentiel de la gouvernance d'entreprise (voir supra).

Commerce électronique

Le projet Interoperability of Data in E-Commerce Systems ou INDECS (compatibilité des données dans les systèmes de commerce électronique) emploie des métadonnées.

Monétique

Les standards en monétique et en systèmes de paiements par cartes de crédit comportent des métadonnées .

Systèmes d'exploitation

Les métadonnées seront utilisées dans le prochain système d'exploitation Microsoft Windows Vista, dont les conditions de sécurité sont controversées. Voir :

Messageries électroniques

Les messageries électroniques peuvent véhiculer des métadonnées. Jason R. Baron a fait une étude dans le cadre de l'IEEE en 1999 sur l'archivage des courriels de l'administration américaine. Voir la présentation qu'il fait pour l'US National Archives and Records Administration :

Systèmes de gestion de règles métier

Les SGRM définissent des règles métier en employant des métadonnées.

Syndication de contenu Web

Les balises de syndication RSS contiennent des métadonnées.

Métadonnées dynamiques et contexte

L'utilisation de métadonnées dynamiques permet de mieux interpréter le contexte. Voir :
-
- Les métadonnées sont employées dans les stratégies réseau centré.

Domaines d'application

Bibliothèque numérique

-

Fonctions régaliennes

Gouvernement et finances :
-
- En France, les métadonnées sont employées dans le programme ADELE, dans les règles relatives aux Composants Communs (voir , règle C73), et pour l'archivage électronique selon la norme OAIS (voir ) Défense :
- : registre de métadonnées du Département de la Défense
- DITPR est un référentiel qui permet de déclarer les métadonnées dans le cadre d'architecture DoDAF. Développement durable :
-
- Sécurité intérieure :
- Justice :
- Aux États-Unis :
- En France : projet Solon de dématérialisation de la production normative juridique. Le périmètre défini en 2005 ne concerne que les décrets.

Environnement, écologie

- Environmental Protection Agency (EPA) :
- Agence européenne de l'environnement : Sur l'environnement, voir aussi : L'Agence de protection de l'environnement des États-Unis (EPA) a défini un langage informatique à base de métadonnées : Ecological metadata language.

Commerce électronique

- Commerce électronique : le registre ebXML, géré au niveau des Nations unies, utilise des métadonnées.

Données géospatiales

- États-Unis :
- Union européenne : directive INSPIRE, sur les données spatiales et géographiques

Autres domaines

Recherche
- Agriculture
- sur le site de la FAO
- AgMES sur la Wikipedia anglophone. Géologie
- Commerce international
- Santé
- Marine et océanographie
- etc.

Organismes francophones ayant des compétences sur les métadonnées

Liste non exhaustive :
- INRIA
- Secrétariat du Conseil du Trésor du Canada
- Bibliothèque de l'Université Laval
- École nationale supérieure des mines de Saint-Étienne
- INIST
- Université Claude-Bernard Lyon 1
- CNRS, laboratoire Creatis
- Université Pierre et Marie-Curie, LIP6
- Bibliothèque nationale de France

Notes

Bibliographie

Les Clés du Succès en Gestion des Métadonnées, Un Livre Blanc d'Alan Perkins de ASG

Voir aussi

Architecture et interopérabilité
- Architecture Web
- Web sémantique
- Interopérabilité informatique Référentiels
- Registre de métadonnées
- Dublin Core (initié aux États-Unis en 1995) Recherches d'information
- Recherche d'information ; Z39.50 ; ISO 23950
- Exploration de données (fouille de données, data mining) Autres applications
- Gestion des documents d'archives ; ISO 15489
- Sécurité des données
- Alignement stratégique Union européenne
- MIReG ==
Sujets connexes
ADELE   Administration américaine   Administration publique   Adobe Systems   Agence de protection de l'environnement des États-Unis   Agriculture   Alignement stratégique   Années 1960   Architecture Web   Archivage électronique   Auteur   Autorité   Balise (métadonnée)   BeOS file system   Bernard Carayon   Bibliothèque du Congrès   Bibliothèque nationale de France   Bibliothèque numérique   Brevet   Cadre d'architecture   Chorégraphie des Services Web WS-*   Classification   Commerce international   Commerce électronique   Commissariat à l'énergie atomique   Commission européenne   Communauté européenne   Communautés européennes   Connaissance   Conscience   Contexte (communication)   Contrôle d'accès   Courrier électronique   Couverture (métadonnée)   Cycle de vie   Date   Date (métadonnée)   Digital Object Identifier   Directive INSPIRE   Document   Document Schema Definition Languages   Donnée   Droits (métadonnée)   Droits d'accès   Dublin Core   Décision   Défense et sécurité   Développement durable   E-Gouvernement   EbXML   Entreprise   Entrepôt de données   Environnement   Europe   Exchangeable image file format   Exploration de données   Extensible Markup Language   Extensible Metadata Platform   Extract Transform Load   Fichier texte   Formation   Framework   France   Français   GML   Geography Markup Language   Gestion de contenu   Gestion de la relation client   Gestion des connaissances   Gestion des documents d'archives   Gestion des données de référence   Gestion des ressources humaines   Gestion électronique des documents   Google   Gouvernance   Gouvernance d'entreprise   Gouvernement   Grande école   Graphics Interchange Format   Graphisme   Grec ancien   Géologie   ID3   ISO/CEI 11179   ISO 15489   ISO 15836   ISO 21127   ISO 23950   Identifiant (métadonnée)   Image numérique   Information   Informatique décisionnelle   Inode   Interopérabilité   Intégration d'applications d'entreprise   JMI   JPEG 2000   Java (langage)   Java (technologie)   Java Specification Requests   Joint Photographic Experts Group   Justice   Langage de programmation   Langue   Langue (métadonnée)   Latin   Leadership   Learning Object Metadata   Liste d'outils décisionnels   Liste des spécifications des Services Web WS-*   Logiciel libre   METS   MPEG-1/2 Audio Layer 3   MPEG-21   MPEG-7   Mac OS   Marine   Material eXchange Format   Microsoft Excel   Microsoft Windows Vista   Microsoft Word   Modèle (informatique)   Monographie   Monétique   Moteur de recherche   Multimédia   Méta (préfixe)   Normalisation (industrie et service)   Norme   Normes sur les métadonnées   OAIS   OWL   Océanographie   Ohio   Ontologie (informatique)   OpenDocument   OpenOffice.org   Oracle Corporation   Orchestration (informatique)   Ordinateur   Organisation des Nations unies   Organisation des Nations unies pour l'alimentation et l'agriculture   Patrimoine culturel immatériel   Photographie   Portable Document Format   Portable Network Graphics   Presse écrite   Projet   Propriété intellectuelle   RDF Schema   RSS (format)   Recherche d'information   Recherche et développement   Registre de métadonnées   ReiserFS   Représentation   Resource Description Framework   Risque   Règles métier   Référentiel   SKOS   SOA   Santé   Secteur public   Son numérique   Souveraineté   Syndication   Systems, applications, and products for data processing   Système d'information   Sécurité des données   Sémantique   Table (base de données)   Tagged Image File Format   Tim Berners-Lee   Titre   Toile   Traçabilité   Unified Modeling Language   Union européenne   Université   Urbanisation (informatique)   Usager   Utilisateur (informatique)   Valid XML document   WS-I   WS-Policy   WS-Security   Web 2.0   Web sémantique   Webmestre   Well-formed XML document   WinFS   XHTML   Z39.50   Zope  
#
Accident de Beaune   Amélie Mauresmo   Anisocytose   C3H6O   CA Paris   Carole Richert   Catherinettes   Chaleur massique   Championnat de Tunisie de football D2   Classement mondial des entreprises leader par secteur   Col du Bonhomme (Vosges)   De viris illustribus (Lhomond)   Dolcett   EGP  
^