9.1. Rendre votre site indexable

Faciliter l’indexabilité de votre site pour les moteurs de recherche

Si vous avez compris comment créer un fichier robots.txt et que vous l’avez configurer correctement pour donner accès uax pages que vous souhaitez indexer, alors il nbe vous reste qu’à faire quelques autres vérifications pour rendre votre site indexable.

Un hébergement rapide et fiable

Connaissez vous la règle des 8 secondes ? Elle est simple, si votre page web met plus de 8 secondes à se charger, les internautes quitteront la page avant d’avoir visiter votre site. Et les moteurs qui privilégient leurs ressources serveur préféreront indexer des sites exempts de problèmes de temps de chargement.

Reprenons notre exemple avec Mr Bot et sa ville à parcourir. Si la route qui mène à votre habitation est en terre battue et se situe loin de la ville, vous pouvez imaginer que cela sera un frein à une fréquentation assidue de Mr Bot.

Il arrive que votre site soit inaccessible temporairement, ce n’est pas bien grave, mais si vous avez des problèmes d’hébergement et que votre site ne réponds pas trop souvent, il y a des chances pour que le robot passe à coté sans l’indexer. Si cela dure, il est aussi possible qu’il se fasse retirer de l’index du moteur de recherche, parce que les utilisateurs ne peuvent plus vous joindre.

Nul besoin d’être un pro pour comprendre : un hébergement rapide et sécurisé assure l’indexation de son site par les moteurs de recherche et aide à communiquer et donc réaliser des ventes rapidement, surtout dans le cas d’un e-commerce.

Créer un plan de site

Un plan de site (sitemap en anglais) est une sorte de carte indiquant la disposition de vos pages au sein de votre site. Dans l’analogie précédente, le plan du site serait le plan de votre habitation, indiquant les détails de toutes vos pièces. Si le plan est conforme à la réalité, Mr Bot peut éviter de se déplacer pour une visite de vérification, car à sa lecture il peut mettre à jour vos informations dans l’ordinateur depuis le bureau du maire.

mr botIl y a deux types de plans de site :

    • Le plan de site HTML: il est fait tout aussi bien pour les utilisateurs que pour les robots. Il permet de lister toutes les informations sur une seule page. Ce qui évite les navigations successives.

      Un exemple de Sitemap en HTML

      Un exemple de Sitemap en HTML

    • Le plan de site XML : La plupart du temps intitulé sitemap.xml, il est crée pour les moteurs et leurs robots indexeurs. Une fois installé sur la racine du site, il se trouve à une profondeur de 1 et liste toutes les urls sous forme d’un flux xml. L’avantage du flux est que si vous changez une information sur votre site, le flux est mis à jour en temps réel. Créer et installer un plan de site XML permet de s’assurer que les robots indexeront correctement toutes les pages de votre site.

      Un exemple de Sitemap en XML

      Un exemple de Sitemap en XML

Créer un plan de site sitemap.xml

Comment pouvez vous faire pour créer un sitemap pour vous faire indexer rapidement? Il se trouve que Google a créé un outil pour générer automatiquement le sitemap de votre site >> Outil Google pour le Sitemap.
Il en existe en fait une multitude, vous pouvez par exemple utiliser celui-ci : Un autre outil pour le Sitemap

Après avoir crée votre sitemap, il ne vous reste plus qu’à le soumettre aux moteurs de recherche. La procédure varie pour chacun d’entre eux, voici les liens pour accéder à la page de déclaration du sitemap :

    • Google : Ils disposent d’un outil pour webmaster très complet qui vous guidera dans la procédure.
    • Yahoo! : Vous trouverez en bas de la page un formulaire pour entrer l’URL de votre Sitemap.

Si vous voulez ajouter votre plan sitemap.xml à d’autres moteurs de recherche, il vous suffit de vous rendre sur sa page d’accueil et de taper « submit sitemap nom_du_moteur_de_recherche »(en remplaçant « nom_du_moteur_de_recherche » par le nom adéquat) vous trouverez un formulaire à remplir, vous n’aurez plus qu’à suivre les instructions.

Sachez cependant que vous pouvez déclarer de manière générale l’emplacement de votre plan de site XML par un fichier robots.txt en indiquant « Sitemap: VOTRE URL » (en remplaçant VOTRE URL par l’adresse à laquelle est accessible votre Sitemap).

En donnant votre sitemap aux moteurs de recherche, vous ne lui permettez pas seulement de trouvez votre site, vous lui assurez un chemin facile à travers le site. Le sitemap envoie des liens sur toutes les pages de votre site.

Réécrire les URL

Tout d’abord il faut différencier deux types d’URL, les URL statiques et les URL dynamiques.
Vous avez surement déjà croisé des URL ressemblant à www.nomdusite.fr/item=23654, ce sont des URL dynamiques on les reconnait à la deuxième partie de l’adresse incompréhensible pour les utilisateurs « item=23654 » on ne peut pas dire s’il s’agit d’une page, d’une catégorie, d’un article…
Il existe d’autres types d’URL, elles ressemblent plus à cela : www.nomdusite.fr/posts.html ce sont des URL statiques, on voit facilement ce qui se trouve sur la page, ici le fichier HTML « Posts ». Les moteurs de recherches préfèrent les URL de type statique plutôt que les dynamiques.
Il est possible de changer ses URL pour les rendre plus plaisantes pour les moteurs de recherches.

Écrire sur un fichier .htaccess est une tâche compliquée nécessitant des connaissances spécifiques. Pour y accéder, il va vous falloir un client FTP tel que Filezila, cela va vous permettre d’accéder aux fichiers de votre site. Il suffit ensuite de trouver le fichier .htaccess qui se trouve à la racine du site, ouvrez-le et ajoutez y la commande « RewriteEngine on ». Vous pourrez ainsi réécrire les URL grâce à des règles de reécriture que vous devez encore créer. Les urls exotiques doivent devenir pertinentes pour renseigner utilisateurs et robots.

Nous avons vu dans le chapitre précédent à propos du fichier robots.txt que nous pouvions cacher aux moteurs de recherche refuser l’accès à certaines pages. C’est une bonne occasion d’empêcher l’indexation des anciennes URL dynamiques (avant réécriture).

Corriger les erreurs HTML

Les robots sont programmés pour comprendre le langage HTML et s’il y a des erreurs dans le code, il y a des chances pour qu’ils soient mal interprétés par le robot. Malheureusement, l’erreur est humaine et il est presque certain qu’il y a des erreurs dans votre code HTML au moment où vous lisez ceci.
Avoir un code juste à 100% n’améliorera pas votre référencement car le robot trouve normal qu’un code soit bien écrit, cependant si votre code comporte des erreurs cela pénalisera la page d’une manière ou d’une autre.

Mais comment corriger le code sans de solides bases en HTML?
Il existe des outils qui recherchent pour vous les erreurs dans le code et vous disent comment les corriger. Tout ce que vous avez à faire est de suivre ce lien et d’y coller l’URL de votre site : W3C validator

validator accueil

Cliquez maintenant sur « Check » pour que l’outil cherche des erreurs.

validator résultat

Arrivé sur cette page, toutes les erreurs présentes sur votre code HTML sont listées et ce n’est pas tout car l’outil vous propose également des solutions pour votre problème.
Effectuez toutes les modifications et attention de ne pas oublier de renvoyer le fichier modifié sur vos serveurs.

 

Retirez la double page d’accueil

Je pense que vous avez déjà tous déjà vu ça, quand vous arrivez sur un site, une page s’affiche pour mettre en avant un produit ou juste vous souhaiter la bienvenue sur le site.

Exemples de pages d'accueil
Exemples de pages d’accueil

Ces pages d’accueil sont mauvaises pour l’indexation du site car elles font perdre un niveau de profondeur à tout le site. Il faut savoir que les robots explorent 4 niveaux de profondeur dans les sites web.
Ce n’est déjà pas beaucoup sans qu’en plus on en supprime un à cause d’une page d’accueil, voici un schéma pour imager la structure d’un site avec une double page d’accueil :

schéma structure d'un site

Personnellement je n’aime pas ces pages d’accueil, et je pense que la plupart des usagers ne les aiment pas non plus, c’est un peu comme un vestibule totalement vide avant d’entrer dans une maison fabuleuse, qui voudrais y perdre du temps?
Pour résumer, les double-pages d’accueil ne font que nuire à vos ventes, donc si vous en avez une je vous conseille vivement de la retirer.