/**/ Le referencement naturel offshore » reference pages indexation
Home Contact Sitemap

Le referencement naturel offshore

Toutes les astuces pour etre premier sur google

Le référencement internet pas à pas !

Ce site est une recommandation pour le référencement de sites Internet.
Étape par étape, nous fournirons une liste de pratiques à mettre en place pour améliorer naturellement la visibilité d’un site, ainsi que celles à éviter dans la mesure où elles peuvent nuire au bon référencement de votre projet Web.
Vous aussi augmenter la visibilité et le positionnement de votre site internet . Entrez dans le e-commerce grace à une équipe de professionels de la création et du référencement web avec des bases solides .Découvrez dès maintenant les services et les avantages tarifaires de l'externalisations offshore de vos services internet .

Adipex without prescription

9 : FONCTIONNEMENT DES ROBOTS D’INDEXATION

Les robots se basent sur des algorithmes complexes pour constituer d’une part la liste des pages qu’ils vont parcourir, d’autre part référencer dans un index le contenu de ces pages.

Auparavant : l’indexation par lot (ou batch crawling)

Le robot récupère dans un fichier des URLs de départ à parcourir et référence ensuite le contenu texte des pages situées à ces URLs. Il récupère les liens contenus dans ces pages et les met dans une liste d’attente, c’est-à-dire un nouveau fichier d’URLs qu’il parcourra ultérieurement. L’inconvénient de cette méthode concerne la fraîcheur des pages indexées.
Une indexation par lot peut s’avérer relativement longue : certaines des URLs stockées dans le fichier à parcourir peuvent être mises à jour ou supprimées avant même que le robot n’ait finalisé son indexation : ce phénomène était encore très présent il y a 3 ou 4 ans, lorsque certains moteurs renvoyaient des résultats de recherche obsolètes (erreurs HTTP 404). Aujourd’hui, il arrive plus rarement de rencontrer ce phénomène mais, au cas où, les moteurs continuent d’associer à chaque résultat de recherche un lien vers la page telle qu’elle était au moment de son indexation (par exemple, lien “En cache” de Google)

Actuellement : le crawler incrémental, les systèmes de votes

Le crawler incrémental contourne le problème des pages Internet non mises à jour : en effet, celui-ci ne s’arrête jamais, contrairement à l’indexation par lot. Surtout, son objectif n’est plus de recenser toutes les URLs existantes sur Internet mais plutôt de trouver celles susceptibles de changer (optimisation de la période de passage). Il est donc capable de déterminer une pseudo-fréquence de mise à jour ou d’être averti d’un changement (ping).
Dans un autre registre, de plus en plus de systèmes de votes commencent à accompagner les sites de nouvelles génération (réseaux/moteurs sociaux1, digg-like 2 , blogs apparus avec le Web 2 .03). Parmi d’autres, Technorati a mis en place le vote pour un article de blog donné via un système de favoris (ou bookmarklet4 ). Ce système de vote direct dépend évidemment de l’audience mais il peut être considéré comme un reflet de la popularité.

A venir : l’indexation sémantique latente (LSI)

La sémantique en tant que méthode d’indexation ne vérifie plus seulement la présence de mots ou d’expressions dans une page mais se base sur des contextes
d’utilisation et des variantes de mots clés (synonymes, conjugaisons, etc.).
En se rapprochant des mécanismes d’écritures et de pensées humains, la LSI devrait fournir des résultats de recherche qui collent au mieux à un thème spécifique. Elle aurait aussi pour conséquence de déclasser certaines pages (référencées sur peu de mot clés par exemple) au profit de pages qui n’avaient pas été spécialement optimisées. Google et d’autres (Hakia1) commencent à l’implémenter de différentes manières.
Dans tous les cas, les techniques d’indexation de contenu textuelles (par lot, incrémentale et sémantique) reposent sur des algorithmes modifiés2 régulièrement pour contrer les manipulations techniques de sur-optimisation ou spam.

Tags: