Passer au contenu principal

Comment identifier et résoudre les pages orphelines pour le SEO des sites Web

Découvrez la raison des pages orphelines, leur impact sur le référencement et la manière dont vous pouvez les rendre accessibles aux moteurs de recherche.

Apparaître parmi les premiers résultats de recherche organiques n’est pas une tâche facile. Les propriétaires de sites Web doivent non seulement optimiser leur texte, leurs titres, leurs méta-descriptions et leur texte alt à l’aide de termes clés, mais ils doivent également identifier les éléments techniques qui ont un impact positif sur le référencement et leur donner la priorité. Il s’agit notamment de veiller à ce que chaque page Web puisse être explorée, indexée et interprétée par les moteurs de recherche.

Si un site Web n’est pas accessible du point de vue d’un moteur de recherche, peu importe que votre texte soit bien documenté et optimisé. Il suffit d’un lien brisé ou d’une page Web qui se charge lentement pour que votre site Web soit mal classé.

Les pages orphelines font partie de ces petits problèmes ennuyeux qui peuvent conduire votre site Web à ne pas être aussi bien classé que vous le souhaiteriez. Heureusement, il existe des moyens d’identifier et de corriger ce phénomène.

Qu’est-ce qu’une page orpheline ?

Pour que les pages Web soient bien (ou au minimum) classées dans les résultats des moteurs de recherche (SERP), elles doivent pouvoir être parcourues par les robots de ces derniers. Ces automatismes (également appelés crawlers) utilisent les liens internes pour « crawl » d’une page à l’autre, et c’est la seule façon pour eux de découvrir de nouvelles pages sur votre site Web. Une fois qu’ils ont parcouru votre site, les robots sont en mesure de stocker chaque page dans l’index d’un moteur de recherche et de les afficher chaque fois qu’un utilisateur sélectionne votre résultat.

Cependant, si certaines pages Web n’ont pas de liens internes pointant vers elles, vous avez ce que l’on appelle des pages orphelines. Il est alors très difficile pour les robots des moteurs de recherche d’explorer votre site Web.

Les pages orphelines peuvent toutefois être indexées, car elles sont toujours accessibles par le biais de redirections ou de liens externes. Mais s’il est possible pour les robots ou les utilisateurs d’accéder à ces pages Web, cela ne signifie pas pour autant qu’elles sont faciles à trouver.

Pages orphelines et pages sans issue

Les pages orphelines sont similaires aux pages sans issue, mais il existe une différence distincte. Ces premières n’ont pas de liens internes pointant vers elles, mais elles ont des liens externes. De leur côté, les pages sans issue n’ont aucun lien interne ou externe menant à elles, ce qui peut offrir une mauvaise expérience utilisateur à quiconque se retrouve sur cette page.

Les pages sans issue peuvent se former à cause de liens brisés, d’une navigation interne médiocre ou d’un nombre insuffisant de liens breadcrumbs, obligeant les utilisateurs à revenir à une page précédente pour quitter la page sans issue. Cependant, il existe des cas où des pages sans issue sont nécessaires, comme des pages de confirmation de commande ou des pages de remerciement.

Comment des pages importantes deviennent des pages orphelines

Les pages orphelines apparaissent parce qu’elles n’ont pas de liens internes pointant vers elles. Que ce soit intentionnel ou non, cela se produit pour différentes raisons.

Structure de site médiocre

Une raison courante pour laquelle des pages orphelines apparaissent est une mauvaise conception de la structure du site, c’est-à-dire la manière dont votre site Web est organisé et interconnecté. Une structure de site optimisée comportera une page d’accueil avec quelques pages de catégories qui y sont liées. Sous chacune de ces catégories se trouvent d’autres sous-catégories et des pages de contenu individuelles. Cela permet aux moteurs de recherche d’explorer facilement votre site Web.

Cependant, tu peux avoir une structure de site médiocre si tu as :

  • Les pages de catégories importantes qui se trouvent loin de votre landing page Accueil
  • Liens internes limités vers des pages de contenu importantes
  • Navigation par breadcrumbs désorganisée
  • Nouvelles pages qui ne sont pas classées dans une catégorie

Inévitablement, ces symptômes de la structure du site peuvent, sans le savoir, entraîner la création d’une ou de plusieurs pages orphelines. Plus encore, ils peuvent faire en sorte que des pages importantes aient très peu d’autorité, ce qui signifie que vos pages Web ne seront pas considérées comme utiles par les moteurs de recherche tels que Google.

Migration de site

La migration de votre site Web peut également entraîner la formation de pages orphelines - mais cela ne signifie pas que cette opération soit une mauvaise chose. Il existe diverses raisons pour lesquelles vous pourriez avoir besoin de migrer votre site Web, comme l’amélioration de la structure de votre site, l’ajustement de votre conception Web ou le passage de vos URL au protocole HTTPS. Toutefois, que vous transfériez votre site Web vers une plateforme entièrement différente ou que vous réorganisiez simplement quelques rubriques, vous risquez de vous retrouver avec des pages orphelines si vous ne faites pas attention.

Lors de la migration d’un site, il est possible que vous perdiez la trace de certaines pages Web et que vous supprimiez les liens qui les relient. Il est également possible d’exclure accidentellement d’anciennes pages lorsque vous réajustez la navigation de votre site Web. Quoi qu’il en soit, il s’agit là d’événements courants qui font que des pages Web pertinentes passent à travers les mailles du filet et deviennent orphelines.

Garder les anciennes pages

Même si toutes vos pages importantes sont crawlables, d’anciennes pages sans importance peuvent devenir orphelines et submerger votre site Web. Cela peut se produire lorsque vous avez une page non pertinente vers laquelle vous n’avez plus besoin de fournir de liens (comme les pages de produits en rupture de stock ou abandonnés), mais que celle-ci reste en ligne sur votre site Web.

Par exemple, imaginons que vous créiez chaque année une nouvelle page d’événement pour une occasion annuelle spéciale. Si vous n’archivez pas toutes les pages d’événements précédentes, elles deviendront toutes des pages orphelines. Si un utilisateur tombe sur cette page, il risque d’être désorienté ou induit en erreur par le contenu de ces anciennes pages.

Pourquoi les pages orphelines sont-elles mauvaises pour le SEO ?

De nombreux propriétaires de sites Web peuvent être choqués de voir une page Web bien classée reculer soudainement dans les SERP. En effet, lorsqu’elles ne sont pas utilisées correctement, les pages orphelines peuvent nuire gravement à vos efforts de référencement. Lisez la suite pour découvrir pourquoi les pages orphelines peuvent faire obstacle au SEO.

Réduit l’indexation par les crawlers des moteurs de recherche

Lorsque les robots des moteurs de recherche explorent votre site Web, ils recherchent spécifiquement de nouvelles pages à placer dans l’index de ces derniers. Il s’agit d’une énorme base de données qui répertorie et stocke toutes les pages Web afin qu’elles apparaissent dans les résultats.

Cependant, les robots ne sont pas en mesure de se rendre organiquement sur les pages orphelines, ce qui signifie qu’ils auront du mal à les indexer. Si une page orpheline ne peut être trouvée dans l’index d’un moteur de recherche, il est très peu probable qu’elle apparaisse dans les résultats.

Quoi qu’il en soit, il est possible qu’une page orpheline soit indexée, même si un bot ne peut pas crawler jusqu’à elle. Pour ce faire, vous pouvez utiliser un sitemap XML, qui est une carte de l’ensemble de l’architecture de votre site que les robots peuvent suivre afin d’explorer les pages de votre site Web. Gardez toutefois à l’esprit qu’il s’agit d’une solution temporaire et que vous devez toujours chercher à réparer vos pages orphelines, même si vous disposez d’un sitemap XML.

Réduit le classement dans les moteurs de recherche

Chaque lien entrant augmente la valeur de lien de votre site Web, c’est-à-dire le niveau d’autorité de lien de votre site Web. Plus le nombre de liens entrants sur votre site Web est élevé, plus votre capital de liens est important et plus vos pages Web seront bien classées dans les SERP.

Malheureusement, les pages orphelines ont très peu d’autorité car elles n’ont pas de liens internes pointant vers elles. Cela signifie que vos pages orphelines ne seront pas bien classées dans les SERP, voire qu’elles ne seront pas classées du tout.

Crée une mauvaise expérience utilisateur

Les pages orphelines n’offrent souvent pas une grande expérience aux internautes. En l’absence de liens entrants provenant d’un menu de navigation, les pages orphelines deviennent pratiquement invisibles pour les utilisateurs qui tentent de trouver des informations importantes ou nouvelles. Par ailleurs, si un utilisateur tombe sur des pages orphelines de faible valeur contenant des informations périmées ou obsolètes, il risque d’être désorienté ou de supposer que le contenu est correct.

Consomme le crawl budget

Le crawl budget (budget d’exploration) est le nombre de pages qu’un moteur de recherche va explorer dans un laps de temps donné. Les outils tels que Google disposent d’un crawl budget afin que les robots puissent explorer, indexer et restituer efficacement vos pages Web les plus importantes sans submerger votre serveur.

Les pages orphelines peuvent absorber une partie de votre crawl budget limité, qui serait autrement consacré à l’exploration des pages importantes. Cela peut rendre difficile le crawling et l’indexation des pages intéressantes, ce qui nuit à vos efforts de référencement.

Notez que, selon Google, cette règle ne s’applique qu’aux sites Web de grande taille, car les sites de petite et moyenne taille comptent beaucoup moins de pages à explorer par les robots.

Comment utiliser les données d’audit de site pour identifier les pages orphelines

Maintenant que vous savez pourquoi les pages orphelines ne sont pas optimales pour le référencement, il est temps de réfléchir à la façon de les trouver et éventuellement de les corriger.

La recherche de pages orphelines peut s’avérer délicate, car si les robots des moteurs de recherche ne peuvent pas crawler jusqu’à elles, ils ne peuvent pas vous dire si ces pages existent ou non ! Même si vous choisissez d’utiliser un outil d’exploration de site pour trouver vos pages orphelines, ces derniers ont toujours besoin de liens internes pour parcourir la structure de votre site.

Dans ce cas, vous pouvez toujours utiliser un outil d’audit de site pour vous aider à trouver les pages orphelines. Il comparera diverses sources de données sur le trafic du site Web et identifiera les incohérences entre elles. Les pages les plus fréquentées sont probablement celles qui sont fréquemment visitées par les utilisateurs et les robots. En revanche, celles qui reçoivent peu de trafic sur le site Web sont probablement des pages orphelines.

Pour ce faire, suivez ces 3 étapes :

  1. Dresser la liste de tous les URL : utilisez un sitemap XML ou un système de gestion de contenu (par exemple, WordPress, Wix ou GoDaddy) pour obtenir une liste de toutes les URL de votre site Web.
  2. Effectuer une exploration du site Web : utilisez votre outil d’audit pour créer une liste de toutes les pages qui sont correctement indexées par un moteur de recherche.
  3. Analyser et comparer les résultats : examinez votre liste d’URL et les pages indexées de votre audit. L’outil d’audit vous indiquera les URL qui n’ont pas de liens pointant vers elles, ce qui signifie que vous avez trouvé vos URL orphelines.

Certains sites Web d’audit peuvent faire tout cela en une seule fois pour vous. Mais si vous souhaitez obtenir des résultats plus précis, il est préférable de prendre votre temps et de réaliser cette partie manuellement. Vous trouverez ci-dessous d’autres sources de données que vous pouvez utiliser pour effectuer des comparaisons, telles que Google Search Console et les fichiers journaux de votre serveur.

Plan de site XML

Un sitemap XML doit contenir une liste de toutes les URL de votre site Web, qu’il s’agisse de pages orphelines ou non. Veillez donc à comparer toutes les données à cette liste. Si votre sitemap XML n’est pas mis à jour ou si vous savez qu’il ne contient pas toutes les URL de votre site Web, vous devriez certainement envisager d’utiliser d’autres sources de données pour trouver vos pages orphelines.

Fichiers journaux du serveur

Un fichier journal de serveur est un fichier texte qui contient une demande de serveur émanant d’un utilisateur ou d’un robot de moteur de recherche. Pour simplifier, chaque fois qu’une page Web fait l’objet d’une recherche ou d’un clic, cette page est « demandée » au serveur. Le serveur reçoit la demande de cette page et envoie la page en réponse.

Grâce à ces données, vous pouvez savoir quelles pages sont reconnues par votre serveur et renvoyées à l’utilisateur. Cela signifie que vous serez en mesure de savoir, à partir de votre serveur, quelles pages sont demandées et, plus important encore, lesquelles ne le sont pas.

Google Analytics

Google Analytics aide les propriétaires de sites Web à analyser le trafic et les performances Web, notamment le nombre de pages vues, le taux de rebond et les conversions. Plus important encore, Google Analytics peut identifier les pages de votre site Web qui sont fréquemment visitées par les utilisateurs, ce qui vous permet d’identifier les pages peu ou pas visitées. Grâce à ces données, vous pouvez vous faire une idée précise des pages orphelines en raison de la faible quantité de trafic organique.

Google Search Console

Avec Google Search Console, les propriétaires de sites Web ont accès à une suite gratuite d’outils pour les aider à améliorer leur classement. Google Search Console est également réputé pour sa capacité à résoudre les problèmes techniques liés au référencement, tels que la compatibilité avec les mobiles, la sécurité et les liens brisés.

À l’instar des données de Google Analytics, Google Search Console peut fournir des données sur les sites Web qui reçoivent du trafic et ceux qui n’en reçoivent pas. De plus, elle permet de détecter les problèmes d’indexation et les erreurs de crawling, qui sont deux caractéristiques communes des pages orphelines.

Méthodes pour réparer une page orpheline

Il existe plusieurs méthodes pour réparer une page orpheline, la première et la plus évidente étant d’ajouter simplement des liens internes vers cette page Web. Toutefois, avant de commencer à modifier votre site Web, demandez-vous s’il existe des raisons sous-jacentes pour lesquelles cette page orpheline l’est devenue. À partir de là, vous serez en mesure de prendre la bonne décision, celle qui répondra le mieux aux besoins de votre site Web et de vos visiteurs.

Ajoute des liens internes

La manière la plus simple de corriger une page orpheline est d’ajuster votre menu de navigation et vos autres pages de contenu afin d’inclure des liens qui pointent vers celle-ci. Si vous aviez l’intention de créer des liens internes pour cette page, c’est le moment de les ajouter. Mais que faire si vous ne savez pas comment ajouter des liens de manière cohérente à votre page orpheline ?

Par exemple, imaginons que vous ayez un article de blog récemment développé qui est devenu une nouvelle page orpheline. Tout d’abord, passez au peigne fin vos autres articles et voyez s’il y a des sujets ou des thèmes communs qui se rapportent à votre nouveau blog. Ensuite, attachez des hyperliens à ces mots-clés, ce qui permettra au lecteur (ou à un robot) de finir par trouver ce nouvel article. Vous pouvez également appliquer la même logique aux pages produit, aux landing pages et aux autres pages contenant des informations similaires.

Fusionner avec d’autres pages

Choisir de combiner votre page orpheline avec d’autres pages est une autre façon de résoudre ce problème. Tout d’abord, demandez-vous si vous avez une page similaire ou identique à votre page orpheline. Si chacune a le même objectif, songez à les combiner et à ajuster le texte et les éléments visuels pour qu’ils correspondent à l’objectif général des deux pages.

Penser aux balises noindex

Une balise noindex est un extrait HTML qui empêche certaines pages d’apparaître dans l’index d’un moteur de recherche, vous permettant ainsi de mettre en avant les pages les plus importantes pour l’indexation. Les exemples de pages internes dotées de balises noindex sont les landing pages publicitaires, les pages de confirmation de commande, les pages de résultats de recherche ou les pages relatives aux politiques de protection de la vie privée.

Par coïncidence, il peut également s’agir de pages orphelines, car rien ne pointe vers elles en interne. Elles apparaissent en raison de liens externes (comme les annonces cliquables) ou de redirections de pages. Afin d’éviter que ces pages n’absorbent votre crawl budget ou n’apparaissent dans les résultats de recherche, veillez à ajouter cette balise à votre code HTML.

Détermine si la page orpheline a de la valeur

Si l’ajout de liens internes, la combinaison avec d’autres pages et l’ajout de balises noindex ne semblent pas être les bonnes solutions, posez-vous la question suivante : cette page orpheline est-elle vraiment importante ? Les pages orphelines peuvent souvent passer inaperçues pendant un certain temps. Si la page n’a pas vraiment manqué, vous n’en avez peut-être pas besoin et vous devriez choisir de la supprimer.

Augmentez le trafic de vos pages Web en optimisant ou en supprimant les pages orphelines.

Lorsqu’elles ne sont pas utilisées correctement, les pages orphelines peuvent nuire gravement aux efforts de référencement de votre site Web. Il n’est pas facile de déterminer exactement où se trouvent les pages orphelines, d’autant plus qu’elles sont pratiquement invisibles pour les utilisateurs et les robots des moteurs de recherche. Malgré tout, une fois que vous aurez trouvé et corrigé vos pages orphelines, votre site Web bénéficiera certainement d’un meilleur classement dans les SERP.

Partagez cet article