Corriger les erreurs 404

Verifier les liens indexés

-> La Search console, qu’est ce que c’est ?
Il s’agit de l’analyse d’un site web faire par l’algorithme de Google.

-> Utiliser la Google Search Console

L’indexation réalisée par Google des pages du site web peut parfois mener à des erreurs lors de leur modification. En effet, une page indexée et enregistrée par la console garde son indexation même si son URL a changé. Heureusement, de nombreux changements sur WordPress sont automatiques et ne créent pas ces erreurs.

Il est cependant conseillé de vérifier régulièrement les erreurs 404 à l’aide par exemple de la Google Search Console ou d’un logiciel de SEO. 

Lors de la dernière analyse réalisée pour Babylonradio.com, nous avons par exemple constaté une quantité importante d’erreurs de ce genre. Les liens correspondant à ces erreurs étaient au format :
http://babylonradio.com/fr/my-page

L’intégration d’un précédent plugin de traduction sur l’ensemble des posts a créé des doublons qui sont restés indexés. Ainsi, même après suppression de ce plugin, les pages suivantes n’existantes plus mais peuvent toujours apparaitre dans les resultats de recherche ce qui pose evidemment un problème.

  • http://babylonradio.com/fr/my-page
  • http://babylonradio.com/it/my-page
  • http://babylonradio.com/pl/my-page
  • http://babylonradio.com/es/my-page
  • […]
La désindexation des pages peut se faire avec le temps mais le plus efficace est d’en informer Google. Pour cela, dans la Google Search Console, choisir 

  indexer >> elever >>  nouvelle requête

La demande ci dessous a été implémentée en format Regex pour Babylonradio.com. Google peut mettre un peu de temps à la prendre en compte, raison pour laquelle j’ai pris soin de rédiger des redirections pour ces pages, évitant ainsi les erreurs 404. 

Rediriger dans le fichier source

  • Utiliser le fichier htaccess

Ce fichier régit la configuration d’un site web. Il se rédige dans le langage Apache et permet de contrôler les paramètres généraux du serveur. Ainsi, nous l’utiliserons pour rediriger des pages, ou intégrer des paramètres de sécurité. Il est disponible via le plugin de SEO Rankmath ou directement dans les fichiers backend.

Etant données que toutes les pages à rediriger (dans ce cas) ont leur lien hypertexte sous le même format, j’ai choisi d’implémenter au format Regex la redirection voulue.

Cette redirection aurait pu être réalisée dans un plugin de SEO dont le format Regex est pris en compte. Cependant, celui que nous utilisons (Rankmath) ne permet pas de redirigier vers un ensemble de pages dynamiques. 

Je choisis alors d’utiliser le fichier htaccess.
Etant donné le risque élevé de commettre une erreur lors de l’écriture, j’utilise un logiciel en ligne pour simuler mon code. Je l’intègre ensuite au siteweb utilisé pour les essais de développements et vérifie que tout fonctionne. 

Lorsque le code a été validé, je l’intègre au fichier htaccess du site principal, et n’oublie pas de commenter. 

# REDIRECTION TRANSLATION PAGES
# April 27, 2023
# Valentine Maillard

RewriteEngine on

# Spanish
RewriteCond %{REQUEST_URI} /es/
RewriteRule ^es/(.*)$ $1  [L,R=301]

# Italian
RewriteCond %{REQUEST_URI} /it/
RewriteRule ^it/(.*)$ $1  [L,R=301]

# Breton
RewriteCond %{REQUEST_URI} /br/
RewriteRule ^br/(.*)$ $1  [L,R=301]

# French
RewriteCond %{REQUEST_URI} /fr/
RewriteRule ^fr/(.*)$ $1  [L,R=301]

# Polish
RewriteCond %{REQUEST_URI} /pl/
RewriteRule ^pl/(.*)$ $1  [L,R=301]

# Ukrainian
RewriteCond %{REQUEST_URI} /uk/
RewriteRule ^uk/(.*)$ $1  [L,R=301]

Comme mentionné précédemment, le plugin Rankmath propose un module de redirections vers une page statique. Je l’utiliserai pour les pages d’évenements qui n’existent plus par exemple.

Resultats

Depuis mon arrivée, le 13 mai 2023, les améliorations ont permis de diminuer de moitié les erreurs 404, les amenant de 27800 pages à 13300 pages. Cependant, pour une raison que je ne peux expliquer, l’analyse doit être relancée régulièrement (environ tous les 3 jours). En effet, il est apparu qu’après 1500 pages l’algorythme s’arrête. Ainsi, il est évalué que que 80% des erreurs soient éliminées mais cette estimation est uniquement faite à partir des résultats fournis par la console lors de l’analyse. Le constat après 1000 pages analysées fourni une centaine de pages toujours en erreurs (parfois 1500). Ce resultat atteint rarement les 200 pages. 
Aujourd’hui, nous ne pouvons pas prouver avec certitude que ce soit résolu mais une diminution de moitié est déjà très satisfaisante, et conforme à mes objectifs.