Depuis quelques jours, « Google »:http://googleblog.blogspot.com/2010/06/our-new-search-index-caffeine.html communique sur son nouveau système d’indexation dénommé *Caffeine*. Cela fait environ un an que « Caffeine est testé »:http://www.01net.com/editorial/504881/google-invite-les-internautes-a-tester-son-futur-moteur/. Il semble maintenant complètement opérationnel.
L’indexation consiste pour Google (et pour les autres moteurs de recherche) à scanner vos sites, grâce à des petits programmes robots (les Google bots) qui se baladent sur vos pages et collectent des informations relatives aux mots clés qu’elles contiennent.
Chaque page, pour faire simple, est ainsi associée à des groupes de mots clés (et réciproquement). Vous pouvez avoir un aperçu de la structure de cet index quand vous sollicitez le « générateur de mots clés d’Adwords »:https://adwords.google.com/o/Targeting/Explorer?__u=1000000000&__c=1000000000&stylePrefOverride=2#search.none!ideaType=KEYWORD&requestType=IDEAS, par exemple, ou le moteur de recherche avancé de « Google Ad Planner »:https://www.google.com/accounts/ServiceLogin?service=branding<mpl=adplanner&continue=https%3A//www.google.com/adplanner/.
Jusqu’à présent, l’indexation se faisait « par couches différenciées ». Les robots passaient en revue les contenus textuels d’un côté, les contenus vidéo de l’autre, etc.
Compte tenu de l’inflation gigantesque des données, le travail d’indexation par couches posait un problème : celui de la mise à jour des résultats. Car, leur actualisation (se traduisant par un rafraîchissement des listes produites par vos requêtes) devait attendre que toute la couche soit traitée. Il pouvait donc s’écouler jusqu’à plusieurs semaines entre la collecte de l’info et son rendu.
Ce délai était devenu inadapté au Web actuel. Le web 2.0 en particulier provoque une actualisation permanente générée par les internautes. C’est le fameux déluge de données. « Twitter »:http://blog.twitter.com/ c’est, par exemple, 65 millions de messages chaque jour (selon « Mathew Ingram de Gigaom »:http://gigaom.com/2010/06/16/why-the-worlds-no-1-search-engine-needed-a-jolt-of-caffeine/).
Par conséquent, avec Caffeine, Google a modifié son processus d’indexation. Dorénavant l’actualisation des résultats n’attend plus qu’une couche entière soit analysée. Le rafraîchissement est donc « plus rapide »:http://www.lemondeinformatique.fr/actualites/lire-avec-caffeine-google-passe-a-l-indexation-quasi-instantanee-30881.html : autrement dit, quand vous posez une question à Google, ce qu’il vous propose comme réponse est plus _frais_ (d’environ 50% selon Google). Pour être encore plus concret, cela signifie qu’un contenu peut-être sur Google quelques secondes après sa mise en ligne.
Quelles conséquences pour les sites du e-tourisme ?
* C’est une excellente nouvelle pour etourisme.info, puisque nos articles apparaîtront encore plus vite ;
* Ca ne change rien aux fondamentaux du référencement, a priori : la popularité d’une page, la densité de mots clefs, les liens… continuent d’être à la base du fonctionnement du moteur de recherche. Voir cet article de « webrankinfo »:http://www.webrankinfo.com/dossiers/indexation/caffeine, cependant, pour surveiller ce sujet ;
* Mais attention, à mon avis, aux stratégies d’opportunité ou aux vagues médiatiques : imaginons un journaliste ou un blogueur qui fait un article sur votre destination. Il peut vous griller la politesse sur un certain nombre de mots clefs pendant quelques temps. De même, il est possible qu’un évènement associé à vos mots clefs stratégiques bouleverse un peu la hiérarchie des résultats des premières pages de Google ;
* Il faut donc s’attendre à *une encore plus grande volatilité de votre visibilité*.
C’est un des bouleversements entraînés par le web 2.0 : vous n’êtes plus tout à fait maîtres de votre référencement, puisque le contenu qui vous concerne vous échappe de plus en plus.
Il va falloir imaginer de nouvelles stratégies…
Vous y avez déjà réfléchi ?