Le microformat

Une page web contient une quantité d’informations non réellement discriminées. Les balises et attributs (avant l’arrivée des micro-formats) étaient utilisés à des fins d’affichage mais peu de description. En caricaturant à peine, la seule manière de mettre en avant une partie jugée importante de l’information était d’utiliser une balise <li> ou un attribut <b>. Et cette mise en avant n’était compréhensible que par un lecteur humain, capable par une analyse visuelle du contenu de repérer les points importants, analyse hors de portée des robots des moteurs de recherche.

Baliser des données structurées consiste à intégrer au sein même du code d’une page web  des balises destinées à indiquer aux moteurs de recherche les éléments caractéristiques de l’élément principal décrit (recette. film, concert, etc.).

La création des micro-formats dès 2003 a visé à combler cette lacune. Les micro-formats sont par définition un formatage des données destiné à structurer l’information destinée aux utilisateurs finaux. En ajoutant du sens via la codification de balises HTML ils apportent une solution simple et peu consommatrice de puissance de calcul (contrairement à des systèmes d’intelligence artificielle visant à la compréhension d’un texte libre).

Quand une donnée est structurée par les balises dédiées elle devient plus facilement analysée et comprise par les moteurs de recherche et de bénéficie éventuellement d’un traitement spécifique dans les pages de résultats sous forme de rich snippet. Cette structuration se fait grâce à l’utilisation de balises HTML de marquage qui sont regroupées en 3 grandes familles : les microformats, les microdonnées ou microdata  et le RDFa.

Microformat et métadonnées

Les micro-formats font partie, comme les micro-data (ou micro-données), des métadonnées en ce sens qu’ils donnent de l’information sémantique sur le contenu de la page elle-même en structurant et balisant des données. Aujourd’hui, le mot  « méta-données » est en général utilisé plus spécifiquement pour designer des éléments destinés à ajouter du sens au contenu général de la page et le plus souvent, quand on parle de méta données on parle des balises qui sont en général positionnées au niveau du « header » de la page. Les micro-formats, comme les micro-data, sont eux utilisés dans la partie « body » de la page pour préciser le sens de certains éléments de contenu.

Aujourd’hui, l’utilisation la plus courante des micro-formats est reliée à la sémantique des pages web dans un but d’optimisation de la qualité des pages de résultats des moteurs de recherche et donc indirectement du SEO. Le développement des riche-snippet par exemple n’aurait pas existé sans l’intégration de plus en plus fréquente des microformats dans les pages des sites.

Microformat et microdata

Micro-formats, RDFa et micro-data sont avant tout des systèmes de balisage visant à rendre le contenu compréhensible par les moteurs de recherche. Ni les uns ni les autres n’ajoute d’éléments visant à améliorer la perception ou la compréhension du texte par des humains.

La principale différence entre les 3 tient à la standardisation. Les micro-données sont standardisées et font partie du WHATWG HTML (les bibliothèques de micro-data sont centralisées sur schema.org). Le RDFa est lui un standard W3C.  Les micro-formats (et micro-format 2) ne sont pas standardisés, à l’exception de hCalendar et hCard dont les conventions d’écriture devenues des quasi normes, mais de nombreuses bibliothèques existent qui permettent de les utiliser facilement.

Un exemple de microformat

Le plus connu des micro-formats est sans doute hCard. Utilisé pour publier les coordonnées de contact des personnes ou des entreprises, en HTML, XHTML, Atom, XML ou flux RSS.

Il permet, par exemple,  aux outils de partage d’extraire les éléments et de les charger dans un programme de gestion de carnet d’adresses.

Concrètement, le code d’un micro-format n’est en rien différent d’un morceau de code HTML classique. Synthétiquement, le morceau de code servant à intégrer des coordonnées  dans une page internet ressemblera à ceci :

//
<div class=”vcard”>
<div class=”fn”>John Doe</div>
<div class=”org”>La Société</div>
<div class=”tel”>123-444-3210</div>
<a class=”url” href=”http://lasociete.com/”>http://lasociete.com/</a>
</div>
//

Ici ‘fn'(formal name), ‘org’, ‘tel’ et ‘url’ sont des noms de classes spécifiques définies par le micro-format hCard; l’ensemble est enchâssé dans la balise ‘class=”vcard”‘, qui indique que les autres classes forment une hCard, et ne sont pas nommés par pure coïncidence. D’autres classes, optionnelles de hCard existent aussi, telles que bday – une date de naissance de personne, photo  ou email entre autres.

Une fois les coordonnées de la personne structurées grâce au microformat hCard, il est possible pour un logiciel, par exemple pour les plugins des navigateurs, d’extraire l’information et de la transférer vers d’autres applications, telles qu’un carnet d’adresses par exemple.

Par ailleurs certains micro-formats peuvent s’insérer dans d’autres comme par exemple le microformat « geo » qui peut s’intégrer à hCard ou à hCalendar pour spécifier les coordonnées géographiques d’un lieu. Les coordonnées peuvent être directement extraites de la carte de visite ou de l’agenda par un récepteur GPS adhoc.

Microformats et SEO

A l’heure du web sémantique, les micro-formats, comme les micro-données, sont des éléments indispensables pour la meilleure compréhension des pages web par les logiciels d’analyse et de recherche.

Par ailleurs, en permettant d’améliorer la lisibilité des pages de résultats sur les moteurs de recherche, les micro-data et les micro-formats sont des éléments à ne pas négliger dans le cadre d’une politique SEO pointue. Votre agence SEO saura vous aider à choisir les micro-formats à utiliser en fonction de vos objectifs et des processus de recherche utilisés par votre cible.