Référencement

Les entités Google, Vous les connaissez pas mais c’est l’aspect le plus important de votre SEO

Savez-vous c’est quoi « les entités Google »?

Peu de gens en parlent, peu de gens les connaissent, cependant ils constituent, à mon avis, le concept le plus important à comprendre dans le domaine du référencement en ce moment. Point final.

Les entités sont déjà là depuis longtemps, mais nous en parlons rarement (très rarement). C’est en partie parce que Google reste toujours discret en ce qui les concerne mais surtout à cause du manque d’informations solides pour les comprendre.

Une entité est définie par Google par : « Une ‘chose’ ou un concept qui est singulier, unique, bien défini et distinguable.  Par exemple, une entité peut être une personne, un lieu, un article, une idée, un concept abstrait, un élément concret, une autre chose appropriée, ou toute combinaison de ceux-ci.

En général, les entités comprennent des choses ou des concepts représentés linguistiquement par des noms. Par exemple, la couleur « Bleu », la ville « Casablanca » et l’animal imaginaire « Licorne » peuvent chacun être des entités.

Chaque phrase ou énoncé comporte des entités et des liens. Exemple, dans la phrase « Karim déteste le spam », il y a deux entités « Karim » et « spam », et il y a un lien qui relie les deux « déteste ». Si vous vous inquiétez du fait que votre contenu ne soit plus classé sur Google, c’est parce qu’il perturbe les entités et leurs liens.

Vous devez également vous rappeler que votre texte d’ancrage est un lien entre votre site/page et le domaine référent.

Ainsi, le sujet de votre lien de backlinking établit une relation directe avec votre propre site. Par exemple, si j’ai un site sur « achat d’appartements à Casablanca », tout lien retour provenant de sites en relation avec « l’immobilier » sera plus utile que les sites sur le « sport et santé » ou d’autres niches.

L’extraction d’entités et de relations est une tâche standard de l’exploration de texte ou du traitement du langage naturel (NLP: Natural Language processing). Google comprend le contenu en fonction des entités et de leurs relations.

Histoire des entités

Afin de bien comprendre les entités, on devrait se référer aux brevets en relation avec le sujet. J’en ai trouvé 2:

L’un des premiers brevets sur les entités a été accordé à Google en 2015. Selon ce brevet, les entités sont classées dans les recherches en fonction de trois facteurs: (c’était 4 avant)

1- La connexité : La connexité est déterminée sur la base des entités de cooccurrence. Si 2 entités apparaissent de manière répétée ensemble, alors Google établit une relation entre elles.

Par exemple, si « immobilier Casablanca » et « achat d’appartement à Casablanca » apparaissent ensemble dans plusieurs articles, ils sont liés.

2- Notabilité : C’est la valeur d’une entité dans la catégorie.

Par exemple, je peux me classer en tête des résultats de recherche pour « vente immobilière à Casablanca » avec plusieurs centaines (ou quelques milliers) de liens, mais j’ai besoin de millions de liens si je veux me classer pour « premier ministre du Maroc ».

3- Contribution : Il s’agit d’une mesure de la contribution d’une entité à un sujet et elle est déterminée par des signaux externes comme les liens et les commentaires.

Si je crée un nouveau guide immobilier intitulé « le guide de Karim pour achat de bien immobilier », sa contribution au thème « achat immobilier » sera faible. Au contraire, le « guide de Mubawab pour achat de bien immobilier au Maroc  » a une plus grande contribution car il a été soutenu par des signaux externes.

Un brevet de 2016 couvre les détails suivants :

  • Un identifiant unique est attribué à chaque entité.
  • Une entité récurrente dans les 10 premiers résultats de recherche est privilégiée pour le knowledge panel (on l’appel comme ça même en français).
  • Il existe une base de données qui regroupe presque toutes les entités possibles et leurs connexions.
  • Les entités sont classées par un score de qualité.
  • Google détermine la pertinence des entités pour les résultats de recherche et les knowledge panels.
  • Google choisit les entités en fonction du contexte s’il existe plusieurs entités portant le même nom.

Un brevet de 2018 (le dernier que j’ai pu trouvé) est intitulé « Entités connexes ». Il couvre les détails suivants :

  • La base de données des entités ne contient pas seulement des entités mais aussi leurs relations avec d’autres entités. Par exemple, une entité « Aziz Akhannouch » contiendrait la date de naissance, la taille, l’éducation, le parti, le conjoint, les enfants, etc.
  • Certaines entités sont plus prioritaires que d’autres. Par exemple, la date à laquelle Aziz Akhannouch a ouvert un compte Facebook sera moins prioritaire que sa date de naissance.
  • Les sites d’autorité comme Wikipédia établissent une relation plus forte entre les entités. Par exemple, Wikipédia qualifiant Aziz Akhannouch de « premier ministre marocain » établira une relation forte entre les entités « Aziz Akhannouch » et « premier ministre marocain » par rapport à cet article qui est destiné au référencement.

Base de données d’entités en expansion:

Google extrait des entités de sites fiables comme Wikipédia. Mais ces sites ne sont pas mis à jour fréquemment. Google part donc à la recherche d’entités pour en trouver de nouvelles.

Par exemple, s’il existe une rumeur selon laquelle « Manal Benchlikha » sort un nouvel album nomé « 180° », Wikipedia attendra une annonce officielle, mais pas les fans, la discussion sur la sortie du nouvel album sur les médias sociaux et les forums, commence en force.

Google crée donc une nouvelle entité « 180° » et la lie à l’entité existante « Manal Benchlikha », car ils apparaissent ensemble à plusieurs reprises. Lorsqu’il y aura une annonce officielle, Google disposera de suffisamment d’informations pour créer un knowledge panel.

Comment utiliser des entités dans votre contenu pour améliorer votre classement:

Si votre contenu ne possède pas les entités du contenu le mieux classé dans les résultats de recherche, il risque de ne pas être classé, même après avoir pris soin de tout le reste (On et Off page).

Vous pouvez extraire les entités de vos concurrents en utilisant l’IA en langage naturel de Google.

L’analyse d’entités est gratuite pour un maximum de 5 000 unités par mois, chaque unité comptant 1 000 caractères (espaces blancs compris). Ainsi, un article ordinaire de 500 mots peut vous coûter 2 à 3 unités. Cela devrait être suffisant pour les débutants.

Conclusion:

Le référencement évolue super vite et on ne suit pas tout au même rythme. Vous devriez vous mettre dans les entités et suivre le mouvement avant qu’il ne soit trop tard.