indexation et cache de moteur de recherche

indexation et cache de moteur de recherche

9 avril 2019 0 Par Makrem

Tapez site : monsite.com sur Google en remplaçant monsite.com par le domaine de votre choix : vous découvrirez la liste des pages indexées par Google pour ce domaine . Vous pouvez aussi spécifier un sous-domaine ou un répertoire pour gagner en précision :
si cette approche est parfois imprécise , elle donne un aperçu intéressant du nombre de page indexées.
suivez aussi l’indexation de votre site via Search console, un outil gratuit proposé par Google .Cliquez sur index puis couverture et vous aurez accès à la liste des URL indexées ( onglets valides avec des avertissements ) , la liste des pages dont vous refusez l’indexation ( onglet Exclusses ) ainsi qu’une remontée des erreurs et anomalies rencontrées par Google lors du crawl ( onglet Erreurs ) . Nous vous invitons à vous reporter au chapitre dédié à search console pour en savoir plus.

UN CACHE RECENT POUR UN MEILLEUR POSITIONNEMENT

La version en cache est une photographie de votre page à un instant T. Or , une version en cache ancienne a plus de chance d’être obsolète :un contenu visité par Google il y a une heure n’a probablement pas ou peu changé , tandis qu’une URL crawlée il y a plusieurs mois possède une plus forte probabilité d’avoir été modifiée . L’algorithme valorise les contenus pour lesquels il dispose d’une version en cache récente .
Accéder au cache de la page de votre choix
a coté d’un résultat affiché sur Google vous constatez souvent la présence d’une petite flèche verte . Cliquez sur cette flèche puis sur << En Cache >> pour afficher la version en cache de Google .Vous pouvez aussi taper sur Google ou dans la barre d’adresse de votre navigateur URL de votre précédée du mot cache ..
La version en cache vous apporte de précieuses informations,à commencer par la date du dernier passage du Googlebot .vous pourrez notamment savoir si les modification apportées à une page ont été prises en compte , ou si la page que vous venez de créer a été ajoutée à l’index de Google .
Trois versions en cache a la page sont proposées par Google :
-Version intégrale : cette version en cache reprend le contenu , la mise en forme et les
fonctionnalités avancées prises en compte par Google ;
-Version en texte seul : cette version se concentre sur le contenu éditorial, elle est
utile pour savoir si votre texte et les éléments de navigation ont bien été prise
en compte ;
-Afficher la source : cette version vous présente l’ensemble du code source indexé par
Google.
Notez que certain sites bloquent l’accès au cache de leurs pages. c’est notamment le cas des sites d’actualités par abonnement , qui ne veulent pas que des petits malins accèdent au contenus payants en regardant les versions en cache .
Pour suivre le processus de crawl , les référence chevronnées utilisent des analyseur de logs. ils consultent l’historique des visites à un site et identifient les passages du Googlebot ou d’un autre robot d’indexation . Ils savent exactement la fréquence de crawl de chaque URL d’un site et peuvent corréler cette donnée a d’ autres informations comme le nombre de liens internes pointant vers la page encore son niveau de profondeur 20.
crawl et indexation : les bases d’un référencement réussi
Quel que soit votre profil , vous serez amené en tant que référenceur à favoriser l’indexation des sites dont vous avez la charge .Cette dimension technique de notre métier est indispensable: un site mal indexé sera le plus  mal positionné sur Google et ne générera qu’un faible trafic SEO. Cette étape est souvent associée au technique pack SEO  mais est accessible à des profil qui n’ont pas des compétences informatiques poussés .Avec les bons outils , en commençant par un crawler, vous pouvez facilement améliorer le crawl de votre site et contribuer sa bonne indexation
>> PROPOSER UN CODE SOURCE FAVORABLE AUX ROBOTS D’INDEXATION
Vos pages sont crawlées par les moteurs de recherche. Mais votre contenu est-il réellement lu par Googlebot ? Vous devez pour cela vous assurer que votre code source permet aux moteurs de recherche d’accéder réellement à votre contenu : menus , textes , image … Le choix des langages de programmation et la vérification du cache sont alors déterminants par une indexation complète de votre site.