La métadonnée

Métadonnée : mot composé du préfixe grec méta qui signifie « au-delà, au-dessus, autour » ; le mot renvoi à l’idée de « donnée sur la donnée ». Une métadonnée est une donnée servant à décrire une autre donnée quel que soit son support (papier ou électronique).

Dès 1954, les établissements comme les bibliothèques ou les archives ont choisi d’élaborer un système de codification du signalement et du contenu des documents qu’ils manipulent. On utilisait des fiches cartonnées dont la structure a été normalisée. Dix ans plus tard ces descriptions ont été informatisées sous la forme de notices bibliographiques, utilisées tant pour la gestion interne des ressources documentaires que, côté usagers, pour faciliter la recherche et la localisation des documents.

1984 marque l’apparition d’une évolution majeure puisque qu’avec l’arrivée de langage type GML d’abord et le HTML un peu plus tard, la distinction entre les fiches, les notices, d’une part, et les contenus, d’autre part, qui était la norme, tant à disparaître avec une nouvelle organisation de l’information qui introduit les métadonnées dans les documents eux-mêmes.

Métadonnées et web sémantique

Les notices bibliographiques contiennent des informations sur la nature du document (roman, théâtre, périodique etc.), le document lui-même (titre, auteur, sujet, etc.), son contenu (mots-clés, résumé) et enfin de sa localisation physique (la cote dans les rayonnages de la bibliothèque).

Avec l’apparition des documents numériques, ces données d’identification et de recherche sont contenues de le document lui-même est prennent dans les années 90 le nom de « métadonnées ». Elles intègrent les CD ROM, les photos numériques (les données Exif, indiquant la date, la focale de l’objectif utilisée voire les coordonnées GPS sont des métadonnées) etc.

Très tôt dans l’histoire du Web (à la création du W3C en 1994), les métadonnées ont été intégrées à chaque page web, tout d’abord dans l’en-tête des fichiers HTML puis directement dans le code source avec l’apparition en 1998 du XML et son balisage à base de chevrons < > permettant de séparer dans les lignes de code le texte destiné aux humains et le texte destiné aux machines.

Par exemple un bout de code :

//<élément>Texte</élément>
<dc:title>Astérix le Gaulois</dc:title>
<ex:livre attribut=”valeur” type=”BD”>
<dc:title>Astérix chez les Belges</dc:title>
<!– élément répété –>
<dc:creator>René Goscinny</dc:creator>
<dc:creator>Albert Uderzo</dc:creator>
<dc:description>
<b>Astérix chez les Belges</b> est un album de
<a href=”http://fr.wikipedia.org/wiki/Bande_dessinée”>bande dessinée</a> de la
série Astérix le Gaulois créée par René Goscinny et Albert Uderzo.//
donne autant d’information au lecteur de la page qu’à l’ordinateur en charge de la traiter et de l’afficher.

Les métadonnées sont un élément incontournable du paysage internet. Toutefois, on ne peut pas les limiter aux ressources telles que de pages web, fichiers son ou images. Par exemple, dans un tableur les noms des lignes et des colonnes sont des métadonnées, tout comme les noms de tables ou de colonnes dans une base de données relationnelle.

L’intérêt des métadonnées

Les métadonnées sont devenues indispensables et leur utilité dépasse largement la simple recherche documentaire. Au-delà de la recherche d’information de contenu et de gestion et d’archivage des documents, les métadonnées présentent un intérêt indiscutable dans 2 domaines

La facilitation l’interopérabilité

Le partage et l’échange facilité d’informations entre différents systèmes et la capacité à rendre des documents interopérables facilement sont une des conséquences majeures de la création de normes de description.

La gestion des droits et authentification

Les droits de propriété intellectuelle autant que les droits d’accès (ou de modification) à des pages ou à des documents (restrictions de consultation) tout comme l’encodage d’une signature électronique pour valider un texte sur Internet sont gérés via les métadonnées encodées dans les documents.

 Les risques de dérive

Le principal risque lié à l’utilisation des métadonnées tient à l’exploitation, hors des cadres normatifs et légaux, des métadonnées laissées par les utilisateurs lors de leur navigation internet. Cet aspect concerne principalement les moteurs de recherche et l’utilisation qu’ils font de données, comportementales par exemple, n’ayant pas de lien direct avec la recherche effectuée pour affiner le ciblage publicitaire.

La création de bulles cognitives sur les réseaux sociaux est aussi une conséquence « à risque » de l’utilisation des métadonnées de navigation, en renvoyant aux internautes une « image » de leur réseau s’éloignant de la réalité statistique pour se rapprocher d’une réalité adaptée à leur propre comportement. Ce phénomène de bulle cognitive a été mis en avant, entre autres, lors des élections tant en France qu’aux USA.

Métadonnées et SEO

Les métadonnées interviennent dans la meilleure visibilité d’un site internet ou d’une page d’un site, en permettant une meilleure interprétation du contenu de la page par les robots des moteurs de recherche et dont une optimisation de la pertinence des pages de résultats. Votre agence SEO vous apportera à la fois ses compétences sur les métadonnées proprement dites mais aussi sur leur mise en adéquations avec les processus de recherche (cadre sémantique entre autre) développés par les internautes pour accéder aux sites internet de votre environnement.