Publié le 20 octobre 2020 à 11 h 25 min

Le machine learning dans le classement des résultats de recherche d’images

Google utilise les algorithmes du machine learning dans la majorité de ses produits et services, pour offrir aux utilisateurs une meilleure expérience sur son moteur de recherche.

Machine learning 1

Description :

  • Les images peuvent être classées dans les résultats de recherche et aider les pages d’un site, à être plus pertinentes pour les requêtes sur lesquelles, elles sont classées.
  • Le machine learning n’est pas basé sur une liste de caractéristiques traditionnelles et spécifiques comme l’attribut alt, la légende ou le nom du fichier pour classer les images mais il utilise divers signaux, plus précis, qui tiennent tout de même compte de ces caractéristiques.
  • Google utilise utilise plusieurs types de machine learning :
    – le deep learning : technique qui empile des couches non-linéaires d’opérations dans le réseau neuronal artificiel.
    – d’autres modèles comme les modèles linéaires, les modèles probabilistes,  les arbres de décision.

L’avis Pixalione

  • Google utilise le machine learning pour apporter des résultats de recherche d’images plus précis en générant un score de pertinence entre l’image, la landing page et les données indexées pour une requête donnée.
  • En apprenant à identifier les images avec le machine learning, Google peut inciter des sites comme les e-commerce à utiliser des images pertinentes pour gagner des positions dans les résultats de recherche.

Les différentes caractéristiques utilisées par le machine learning

Grâce au machine learning, Google utilise des combinaisons de caractéristiques pour améliorer la pertinence des résultats de recherche d’images.

Machine learning 3

L’objectif du brevet sur la recherche d’images:

  • Indexer de nombreuses images pour répondre aux requêtes d’images des internautes.
  • Identifier une image et une landing page respectives pour chaque résultat de recherche.
  • Chaque résultat de recherche d’images doit tenir compte des caractéristiques de la requête lancée et des caractéristiques de l’image.
  • Le machine learning va aider Google à identifier les caractéristiques d’une landing page et des images par rapport à une requête donnée. Il va générer un score de pertinence pour mesurer la qualité du résultat de recherche identifié.
  • Cela va permettre au moteur de recherche de fournir des résultats de recherche d’images adaptés à un dispositif utilisateurs, en se basant sur un score de pertinence généré par le machine learning.
  • Les avantages de ce processus breveté sont de s’inscrire dans un système d’amélioration continue pour fournir des résultats de recherche d’images toujours plus pertinents et personnalisés à chaque internaute.
  • L’objectif est d’établir des corrélations précises entre les nombreuses images indexées par le moteur de recherche, les landing pages identifiées et les requêtes des internautes afin d’améliorer la qualité des résultats renvoyés aux utilisateurs.

L’avis Pixalione

  • Les avantages de ce processus breveté sont de s’inscrire dans un système d’amélioration continue pour fournir des résultats de recherche d’images toujours plus pertinents et personnalisés à chaque internaute.
  • L’objectif est d’établir des corrélations précises entre les nombreuses images indexées par le moteur de recherche, les landing pages identifiées et les requêtes des internautes afin d’améliorer la qualité des résultats renvoyés aux utilisateurs.

Extraction des caractéristiques

Pour classer les résultats de recherche d’images, les algorithmes du machine learning de Google, utilisent un processus qui consiste à déterminer un ensemble de caractéristiques qui vont être combinées et vont définir un modèle adapté à chaque requête.

Machine learning 4

Description :

  • Caractéristiques extraites de l’image : utiliser les vecteurs qui représentent le contenu de l’image pour établir une caractéristique grâce à un ensemble de données (forme, couleur, pixels…)
  • Caractéristiques de la landing page : date du premier crawl, informations sur l’auteur de la page, langue utilisée sur le site, caractéristiques du site auquel la page appartient, les mots clés identifiés sur la page, caractéristiques des liens qui pointent vers l’image et la page ( ancres de texte, pages d’où proviennent les liens)
  • Caractéristiques de la requête d’image : langue utilisée pour la requête, termes de la requête, heure d’émission de la requête, localisation de la requête, appareil utilisateur à partir duquel la requête a été lancée

L’avis Pixalione

  • Google s’appuie sur le score de pertinence défini à partir des différentes caractéristiques pour évaluer la probabilité qu’un utilisateur sélectionne ce résultat de recherche, plutôt qu’un autre. Plus le score est élevé, plus le résultat est pertinent. Il s’agit, toutefois d’une probabilité.
  • Ce classement est soumis à un système de pondération du modèle de machine learning utilisé par Google, qui varie selon des caractéristiques spécifiques et qui peut modifier le classement des résultats de recherche d’images, à tout moment.