Les équipes de Google ont finalement mis à jour leurs algorithmes pour filtrer automatiquement les tentatives de Google Bombing. Matt Cutts, le Monsieur anti-Web Spam de Google, en a fait l’annonce plus tôt cette semaine sur le Official Google Webmaster Central Blog.
Qu’est-ce que le Google Bombing, se demandent certains ? C’est un procédé visant à associer sur un moteur de recherche un mot ou une expression ironique ayant peu de rapport avec la réalité des faits à une page web donnée, souvent la biographie d’une personnalité ou la page d’accueil d’une grande entreprise. La plus connue des Google Bombs est sans doute la requête miserable failure (échec lamentable) associée sur les moteurs de recherche à la biographie de George W. Bush Jr. publiée sur le site de la Maison Blanche, ou bien encore sur le site officiel du journaliste américain anti-Bush Michael Moore. Désormais, ces Google Bombs sont de l’histoire ancienne sur le moteur de recherche de Google, même si l’on peut toujours les trouver sur certains moteurs de recherche concurrents.
Le principe des Google Bombs est assez simple : Google a été le premier des grands moteurs de recherche à tenir compte des mots-clés utilisés sur des sites externes en guise de mots-clés apparaissant sur les liens entre les pages. Outre les mots-clés servant de liens, Google — et depuis tous les autres moteurs de recherche majeurs — tient aussi compte de la légende intégrée au lien, en plus d’autres paramètres. Les sites externes définissant ainsi de fait les mots-clés associés aux pages d’autres sites, il devient alors possible de référencer une page web en dehors de son contrôle sur des mots-clés non initialement envisagés par son responsable. En utilisant donc en nombre des liens et légendes utilisant des mots-clés ironiques vers des pages web cibles précises, les instigateurs des Google Bombs arrivent ainsi à associer ces mots-clés douteux et illégitimes à des sites web tout à fait sérieux et légitimes.
Mais ce nouvel algorithme de fitlrage est-il une réalité ou bien un effet d’annonce ? Fort de la liste des plus connues Google Bombs, j’ai fait un test sur les trois principaux moteurs de recherche pour en avoir le coeur net :
Google Bomb | Live | Yahoo! | |
christy walton | |||
député liberticide | |||
french military victories | |||
gros balourd | |||
insignifiant | |||
iznogoud | |||
le lobby microsoft | |||
litigious bastards | |||
magouilleur | |||
ministre blanchisseur | |||
miserable failure | |||
mouton insignifiant | |||
nicolas sarkozy | |||
waffles | |||
weapons of mass destruction |
Note : ND (Non Disponible) signifie que la page cible de la Google Bomb n’a pas été trouvée dans les trente premiers résultats de résultats de recherche.
Comme le montre le tableau ci-dessus reprenant l’impact des principales Google Bombs sur les principaux moteurs de recherche actuels, il apparaît que Google, avec son nouvel algorithme de filtrage, s’en sort le mieux avec 73 % des Google Bombs filtrées correctement ; la seconde place revient à Live qui évite 20 % des bombes ; enfin, la troisième et dernière place revient à Yahoo! avec moins de 7 % des bombes filtrées.
Faut-il pour autant y voir une représentativité de la pertinence des résultats de recherche globaux sur ces moteurs de recherche ? Certainement pas ! En effet, le nouvel algorithme de filtrage automatique mis en place par Google est spécifique à ce type de canulars et n’entend pas perturber les résultats de recherche classiques. D’ailleurs, ce nouvel algorithme est plutôt anecdotique, puisque la majeure partie des mots-clés utilisés sur ces Google Bombs est sans réel impact sur la pertinence de l’ensemble des bases de données des moteurs de recherche sur le web.
En revanche, il sera sans doute intéressant de suivre la pertinence de cet algorithme de filtrage par rapport au référencement naturel légitime des sites. En effet, ce nouvel algorithme n’identifiant pas 100 % des Google Bombs, on est en droit de se demander s’il ne génère pas à l’opposé de faux positifs, à savoir de mots-clés et sites légitimes à tort considérés comme des Google Bombs et retirés de l’indexation…
C'est dommage pour les canulars, j'aimais bien cette forme de contestation