Google a confirmé aujourd’hui l’authenticité d’une collection de 2 500 documents internes qui ont fuité, dévoilant des détails sur les données collectées par l’entreprise, une information jusqu’alors gardée secrète. Ces documents apportent un éclairage inédit, bien que toujours partiel, sur les rouages de l’un des systèmes les plus influents qui façonne le web.
Les documents révèlent des types de données que Google suit, certains pouvant être utilisés dans son algorithme de classement de recherche, hautement confidentiel. « Nous conseillons de ne pas faire des suppositions inexactes sur le fonctionnement de la recherche basées sur des informations hors contexte, périmées ou incomplètes », a déclaré Davis Thompson, porte-parole de Google, dans un courriel adressé à The Verge. Google a souvent partagé des informations sur le fonctionnement de la recherche et les facteurs pris en compte par ses systèmes, tout en cherchant à protéger l’intégrité de ses résultats contre les manipulations.
L’existence de ce matériel divulgué a été initialement signalée par les experts en optimisation pour les moteurs de recherche (SEO), Rand Fishkin et Mike King, qui ont publié cette semaine leurs premières analyses des documents. Google n’a pas répondu aux demandes de commentaires de The Verge hier sur l’authenticité de la fuite.
Qu’est-ce que le SEO ?
Le SEO, ou Search Engine Optimization (Optimisation pour les moteurs de recherche), désigne l’ensemble des techniques utilisées pour améliorer la position d’un site web sur les pages de résultats des moteurs de recherche (SERP). L’objectif principal du SEO est d’accroître la visibilité d’un site web en optimisant son contenu et sa structure pour qu’il soit mieux classé par les moteurs de recherche pour des mots-clés pertinents. Cette pratique comprend l’optimisation technique du site (vitesse de chargement, compatibilité mobile, architecture du site), la création de contenu de qualité, l’acquisition de liens entrants (backlinks) de sites reconnus, et l’amélioration de l’expérience utilisateur. En résumé, le SEO aide les sites web à atteindre un trafic organique plus élevé et plus qualifié.
Cette révélation pourrait provoquer des remous importants dans l’industrie du SEO. Le matériel divulgué suggère que Google collecte et utilise potentiellement des données que les représentants de l’entreprise ont affirmé ne pas contribuer au classement des pages dans la recherche Google, telles que les clics, les données des utilisateurs de Chrome, et plus encore. Les milliers de pages de documents servent de répertoire d’informations pour les employés de Google, mais il n’est pas clair quelles parties des données détaillées sont réellement utilisées pour classer le contenu de recherche — les informations pourraient être périmées, utilisées strictement à des fins de formation, ou collectées mais non utilisées spécifiquement pour la recherche.
Néanmoins, les informations rendues publiques sont susceptibles de provoquer des vagues dans les industries du SEO, du marketing et de l’édition. Google est généralement très secret sur le fonctionnement de son algorithme de recherche, mais ces documents, ainsi que des témoignages récents dans le cadre d’une affaire antitrust du Département de la Justice des États-Unis, ont fourni plus de clarté sur les signaux auxquels Google pense lorsqu’il s’agit de classer les sites web.
Les choix de Google en matière de recherche ont un impact profond sur quiconque compte sur le web pour les affaires, des éditeurs indépendants aux restaurants en passant par les boutiques en ligne. En conséquence, une industrie de personnes espérant déchiffrer le code ou déjouer l’algorithme a vu le jour, offrant parfois des réponses contradictoires. La vague de documents internes offre, au moins, une idée de ce que l’entreprise dominant le web envisage.