Une page orpheline peut contenir votre meilleur contenu, mais si aucun lien interne ne pointe vers elle, Google ne la découvrira peut-être jamais. Voici comment repérer ces pages isolées et les intégrer à votre maillage interne pour qu’elles soient explorées et indexées.
Qu’est-ce qu’une page opheline ?
Définition simple
Une page orpheline est une page web qui n’est reliée à aucune autre page de votre site. Elle n’apparaît dans aucun menu, aucune catégorie, aucun article, et aucun lien interne ne pointe vers elle. Les visiteurs comme les moteurs de recherche ne peuvent pas la découvrir en naviguant sur le site.
3 exemples de pages orphelines :
- Une fiche produit encore en ligne mais absente de sa page catégorie / collection
- Une page d’article de blog non liée depuis aucun contenu récent
- Une landing page créée pour une campagne SEA, mais pas intégrée au site
Définition technique SEO
En SEO, une page orpheline est une URL valide (code 200) indexable, mais exclue du maillage interne. Elle ne bénéficie d’aucun lien entrant interne ce qui l’empêche de recevoir du PageRank. De ce fait, elle échappe au parcours de crawl des spiders, ce qui limite sa découvrabilité, sa fréquence d’exploration, et donc ses chances d’être indexée ou positionnée.
Quelles sont les causes des pages orphelines ?
Refonte ou migration de site mal planifiée
Lors d’une refonte ou d’une migration de site, certaines pages peuvent être oubliées dans la nouvelle structure. Les liens internes entre plusieurs pages peuvent aussi être supprimés. Leur URL directe fonctionne, mais ne sont plus intégrées dans l’arborescence ni dans le maillage, ce qui en fait des pages orphelines.
Pages générées automatiquement par un CMS
Certains CMS tels que Wordpress, Prestashop ou Shopify peuvent générer des pages archives, filtres, fiches produits désactivées, pages de recherche, taxonomies…. Si ces pages ne sont ni maillées dans le site, ni désindexées, elles deviennent orphelines et parfois indexées malgré leur absence de lien.
Modification ou suppression de liens internes
Une page peut devenir orpheline suite à la suppression d’un lien interne dans une page parent, une catégorie ou un article. Cette erreur est fréquente lorsque l’on travaille à la réécriture de contenus en masse.
Mauvaise gestion des redirections
Lorsqu’une URL est modifiée (slug, chemin de dossier), l’absence de redirection 301 vers la nouvelle URL fait que l’ancienne reste en ligne, mais non liée. Inversement, certaines pages supprimées sans envoi d’un code 410 peuvent continuer à exister dans l’index ou à recevoir du trafic direct sans pour autant être reliées au site. Dans les deux cas, on crée une page orpheline.
Pages volontairement orphelines
Utilisées pour des campagnes Google Ads, Meta Ads ou emailings, les landing pages publicitaires sont laissées orphelines. En effet, ces pages sont conçues pour ne pas être accessibles via le site afin de contrôler leur trafic ou d’éviter l’indexation. La bonne pratique à adapter est de leur attribuer une balise noindex.
Pourquoi les pages orphelines nuisent au référencement naturel ?
Problème d’indexation et de visibilité
Google et les autres moteurs de recherche utilisent les liens internes pour explorer un site. Lorsqu'une page ne reçoit aucun lien entrant elle est difficile à découvrir par les crawlers. Même si elle est présente dans le sitemap XML, son indexation n'est pas garantie.
Absence de PageRank
Une page qui n’est pas maillée ne reçoit pas de jus SEO en provenance d’autres pages du site. Elle est isolée dans la structure du site et ne bénéficie d’aucune transmission d’autorité. Cela réduit son potentiel de positionnement quelle que soit la qualité de son contenu.
Gaspillage du budget de crawl
Google alloue à chaque site un certain budget de crawl. Les pages orphelines sont découvertes via des backlinks, le sitemap, ou d’anciens liens cachés dans les pages profondes. Elle peuvent mobiliser ce budget au détriment de pages plus stratégiques.
Comment détecter les pages orphelines de votre site web ?
Méthode 1 - Crawl du site avec Screaming Frog
Screaming Frog est un outil de crawl reproduisant le comportement des robots des moteurs de recherche et permettant d’analyser l’ensemble des pages d’un site. Il génère donc la liste des pages maillées entre elles et donc les liens entrants de chaque page. Vous pouvez l’utiliser gratuitement pour analyser 500 url.
- Dans l’outil, renseignez votre sitemap XML pour comparer les URL connues du site et celles accessibles via le maillage interne.
- Connectez votre Google Search Console en cochant l’option "Crawl des nouvelles URL découvertes dans Google Search Console".
- Lancez le crawl du site.
- Consultez l’onglet "Pages orphelines" pour identifier les URL sans liens internes.
Méthode 2 - Utiliser votre sitemap XML, la Search Console et Excel
Commencez par ouvrir votre sitemap XML et à récupérer toutes vos URL. Vous les mettez dans une colonne sur Excel. Il s’agit de toutes les URL que vous voulez voir indexer sur Google.
Ensuite, accéder à la Search Console. Pour faire ce qui suit, il faut au préalable avoir soumis votre sitemap à la Search Console. Dans l’onglet “Indexation”, cliquez sur “Toutes les pages envoyées” puis sur “Afficher les données concernant les pages indexées”. Augmenter le nombre de lignes par page à 500 puis appuyer sur le bouton d’export de la liste.
Insérer cela dans une deuxième colonne sur Excel. Comparer les 2 colonnes afin de repérer les pages qui ne sont pas indexées. Il y a de fortes chances pour que ces pages soient orphelines.
Corriger les pages orphelines détectées
Corriger une page orphelines utile pour le SEO
Certaines pages orphelines ont un contenu pertinent pour les internautes, un potentiel de positionnement. Il est intéressant de les conserver et de les réintégrer dans votre maillage interne. Vérifier qu’elle figure bien dans le sitemap XML. Ajoutez au moins un lien interne contextuel depuis une page de même thématique (article, catégorie, page pilier, menu…). Utiliser l’outil “Inspection d’URL” de Google Search Console pour demander un nouveau crawl
Corriger une page sans valeur ajoutée
Certaines pages orphelines sont anciennes, pauvres en contenu ou plus du tout pertinentes dans votre stratégie SEO. Nous vous conseillons de les retirer afin de ne pas nuire à l’autorité du site. Deux options s’offrent à vous.
- Dans la majorité des cas, nous vous conseillons de faire une redirection 301 vers une page similaire ou de niveau supérieur. Cela conserve le trafic et le jus SEO.
- Vous pouvez aussi mettre la page en code “410 Gone” afin de signaler qu’elle a été supprimée définitivement (dans le cas de les fiches produits expirées ou d’anciennes offres). Évitez juste de laisser ces pages générer une erreur 404 sans explication.
Les pages volontairement orphelines
Les landing pages SEA peuvent rester orphelines pour ne pas parasiter le parcours utilisateur ou apparaître dans les SERP. Dans ce cas, ajoutez à la page une balise <meta name="robots" content="noindex, nofollow">. N’oubliez pas d’exclure la page du sitemap XML et du plan de site HTML.
Bonnes pratiques pour éviter les pages orphelines
Intégrer le maillage dès la création de contenu
Chacune de vos nouvelles pages publiées doivent être reliées à d'autres pages du site thématiquement proche ou dans une zone de contenu contextuel ("à lire aussi", "Produits similaires". Prenez l’habitude de ne jamais publier une page sans lien entrant.
Maintenir un sitemap XML à jour
Le fichier sitemap doit reprendre toutes les pages que vous souhaitez faire indexer sur Google. Les pages supprimées ou désindexées doivent en être retirées (c’est automatique selon la solution que vous utilisez).
Réaliser des audits du maillage interne
Planifiez des audits techniques (crawl + analyse du sitemap) tous les 3 mois. L’objectif est d’identifier les nouvelles pages orphelines créées et de les corriger en améliorant le maillage interne.
Sensibiliser les équipes éditoriales et techniques
Les pages orphelines sont souvent créées par oubli ou méconnaissance. Former les rédacteurs à l’importance du maillage interne et aux process de publication permet d’éviter les corrections a posteriori.
FAQ
Page orpheline vs page isolée : quelle différence ?
Les deux termes sont souvent utilisés comme synonymes. En pratique une page orpheline n’est liée à aucune autre. Une page isolée peut avoir quelques liens entrants, mais être hors du parcours de navigation.
Est-ce grave d’avoir quelques pages orphelines sur son site ?
Oui, surtout si ces pages contiennent du contenu utile ou stratégique. Même en petit nombre, les pages orphelines nuisent à l’architecture du site, diluent le budget de crawl et privent ces contenus de visibilité organique.
Une page orpheline peut-elle être bien positionnée sur Google ?
C’est très peu probable. Sans lien interne, une page orpheline ne bénéficie d’aucun jus de lien et est difficile à découvrir par les robots de Google. Même si elle est indexée grâce au sitemap ou un backlink externe, ses chances de bien se positionner dans les résultats de recherche restent très faibles.
Page orpheline vs page profonde : quelles différences ?
- Une page orpheline n’a aucun lien interne vers elle. Une page profonde est accessible avec des liens à plusieurs clics depuis la page d’accueil. La profondeur n’est pas un problème si des liens existent : Google suit les liens quelle que soit la profondeur (plus ou moins rapidement).
- Une page profonde peut être bien indexée si elle reçoit des liens internes de qualité. Une page orpheline risque de ne jamais être découverte ou indexée, même si elle est à la racine. Le problème n’est pas la distance depuis l’accueil, mais l’absence totale de liens vers la page.