D’Archie à Google

Après des débuts hésitants avec Archie en 1991 il fallut attendre 1994 et Yahoo ! Qui donna naissance au premier outil performant pour trouver une information sur web en s’inspirant du mode de classement des encyclopédies. Pas de robots à l’époque. Les pages étaient lues et indexées par des êtres humains, un peu comme dans les annuaires web du début des années 2000.

Parallèlement à Yahoo! et aux autres outils de recherche construits sur le modèle « annuaire/encyclopédie, les robots d’indexation commencent à apparaître. Cette mutation technologique donna naissance, en 1995, à Altavista, premier moteur de recherche comme on les connaît aujourd’hui. Altavista, entreprise cofondée par un Français, resta le moteur incontournable jusqu’à l’arrivée du moteur Google en 1998.

Moteurs de recherche 1

Aujourd’hui, quand on pense moteur de recherche, on pense Internet et Google (qui détient plus de 92 % du marché de la recherche sur internet)

Mais il y a des moteurs de recherche ailleurs que sur le Net en tant que tel. Partout où il y a des masses de données à trier, chercher, indexer, les moteurs de recherches performants sont indispensables. Au sein des réseaux sociaux, les forums ou des encyclopédies en ligne bien sûr mais aussi pour faire des recherches dans les bases de données des entreprises et des institutions comme dans tous les datas center.

En quelques chiffres

La croissance du nombre de pages indexées et de sites répertoriés par les moteurs de recherche est l’exact reflet du développement de l’Internet et des ordinateurs au cours des 20 dernières années.

En 1996, AltaVista indexe un peu plus de 30 millions de pages et reçoit environ 10 millions de requêtes par jour.

En 2000 Google recense plus d’un milliard de page

Et en 2017 :

  • 130 000 milliards de pages et documents recensé
  • 20 milliards de pages crawlées quotidiennement
  • 65 000 requêtes par seconde soit plus de 5 milliards par jour

Notons que le nombre de documents recensé par Google en 2017 inclus à la fois toutes les photos publiées par les applications comme Instagram, mais aussi les centaines de millions de pages recensées dans le cadre des différents projets de numérisation du patrimoine littéraire mondial.

Le nombre de requêtes est lui plus parlant puisque Google a traité chaque jour de 2017 plus de requêtes qu’Altavista pour toute l’année 1996.

Requête et confidentialité

La protection des données et informations personnelles est un réel enjeu. Or le modèle économique actuel, qui permet l’extraordinaire rentabilité d’un moteur de recherche comme Google, est basé sur l’exploitation la plus fine possible d’habitudes de visites et de recherches des visiteurs. Aussi les moteurs « commerciaux » utilisent-ils les cookies, à la fois pour améliorer l’expérience utilisateur mais aussi pour affiner le ciblage publicitaire et donc le taux de clic sur les annonces.

Aujourd’hui de nouveaux moteurs alternatifs comme Qwant, créé en 2013 sur le thème : « Le moteur de recherche qui respecte votre vie privée » ou les méta-moteurs comme IX-Quick, qui interrogent les moteurs à votre place et garantissent votre anonymat peinent à trouver leur place. Ils sont encore loin derrières Yahoo et Bing et font office de petits. Sans doute parce que les internautes font passer la confidentialité après la qualité et la rapidité des retours.

Lexique propre aux moteurs

Afin de ne pas être perdu dans le lexique si particulier des moteurs de recherche, et rencontrer certains problèmes en matière d’expérience utilisateur, voici quelques définitions (non exhaustives) qui vous aideront à y voir plus clair.

  • Barre d’adresses : permet de saisir manuellement l’URL du site internet (adresse du site web) ou effectuer une recherche via un mot-clé directement à la manière d’un champ de recherche. Située en haut à gauche, elle est souvent accompagnée d’un bouton permettant de valider l’adresse saisie, ainsi que d’une liste déroulante des adresses (que l’on peut gérer) déjà utilisées.
  • Navigateur Internet : logiciel permettant d’afficher des sites internet, consulter du contenu, télécharger des fichiers ou encore effectuer des recherches. Les plus courants sont Google Chrome, Mozilla Firefox, Safari (Mac), Internet explorer (Windows)
  • Fenêtre : Zone géométrique apparaissant à l’écran afin d’afficher le contenu additionnel ou non d’un navigateur internet.
  • Page d’accueil : page web que l’utilisateur a choisi pour se charger manuellement à chaque ouverture. Par exemple sur Internet explorer, Cliquez sur l’icône Outils dans l’angle supérieur droit de la fenêtre du navigateur. Sélectionnez Options Internet. Dans l’onglet Général, repérez la section « Page d’accueil » et saisir l’URL désirée dans le champ requis.
  • Il est également possible de définir un moteur de recherche par défaut selon vos préférences. Sur Google Chrome voici les étapes : il vous faudra vous rendre sur l’icône des Paramètres (symbolisant un menu) dans l’angle supérieur, puis la section moteur de recherche et enfin sélectionner le navigateur par défaut pour le définir. Une manipulation utile qui vous fera gagner du temps.
  • Sur Internet Explorer : cliquez sur la flèche à droite dans la barre de recherche et sur « Gérer les moteurs de recherche ». Ensuite, Cliquez sur le navigateur désiré en choisissant « Par défaut » puis sur le bouton « Fermer »
  • Partenaires de recherche : en SEA, les partenaires du réseau de recherche permettent d’étendre la diffusion des annonces. Ainsi, sur Google par exemple, sur les sites des partenaires de Google sont diffusées les annonces ou les fiches de produits Google Shopping, comme pour le display. Il est possible d’activer ou non cette option en gardant ou non une case cochée prévue à cet effet.
  • Onglet : permet d’accéder à plusieurs sites en même temps dans un même navigateur. Les onglets s’ouvrent dans l’angle en haut à droite du navigateur.

Moteur de recherche et SEO

Quand on est un internaute, ce qu’on demande à un moteur de recherche, c’est de remonter rapidement des résultats pertinents. Et lorsqu’on est éditeur de site internet, ce qu’on cherche c’est à être visible. Or, en souriant, certains spécialistes du comportement des internautes disent : « Sur la quatrième page de Google, on peut cacher un cadavre ».

Autrement dit, pour qu’un site existe, il faut qu’il soit situé à la première page ou éventuellement à la deuxième page de réponse du moteur de recherche. Et pour arriver à ce résultat il n’y a que deux moyens : acheter des la publicité sur Google (il est recommandé par des experts d’agence SEA) ou essayer sur la partie référencement naturel (SEO) de comprendre le fonctionnement des robots et construire les pages pour les rendre « crawlers friendly «. C’est le rôle des spécialistes de l’optimisation du contenu que sont les agences SEO. Parallèlement, les moteurs de recherche doivent fournir rapidement des résultats pertinents pour séduire et fidéliser les internautes et donc les annonceurs. Ce qui les amène à faire évoluer les algorithmes à la fois pour gagner en rapidité mais aussi pour éviter de faire remonter en page une des sites peu pertinents mais très bien optimisés