Le dico du référencement — Définition : duplicate content
Duplicate content est un terme anglais qui signifie “contenu dupliqué”.
Lorsqu’une nouvelle page web est mise en ligne, si elle possède le même contenu (le même texte ou quasiment le même texte) qu’une page existante déjà référencée, on dit que la nouvelle page est en « duplicate content », elle propose un « contenu dupliqué ». La page originale est la page dite « canonique ».
Google référence mal les pages en « duplicate content ». Le moteur de recherche n’a pas intérêt à référencer deux pages qui présentent exactement le même texte, les mêmes informations.
Autrement dit, si votre page web reprend le texte d’une page existante (déjà indexée dans Google), vous n’arriverez pas à être bien positionné dans les résultats. Il vous faut un contenu unique (un texte unique).
Google ne précise pas à partir de quel pourcentage exact de mots identiques, deux pages sont considérées comme étant en « duplicate content » (autour de 70 % ?).
Outils pratiques et gratuits pour détecter le duplicate content
-
Déterminer le taux de duplicate content d’un texte
Vous disposez d’un texte (un fichier Word ou txt par exemple) et vous souhaitez savoir s’il est déjà présent sur le web ? Il suffit de copier-coller le texte en question dans l’un des outils suivants :
-
Déterminer le taux de duplicate content entre 2 textes avant leur mise en ligne
Vous venez d’écrire 2 articles sur le même sujet et vous souhaitez, avant de les mettre en ligne, vérifier que ces 2 textes ne sont pas trop similaires ?
-
Déterminer le niveau de duplicate content d’une page (URL)
Vous souhaitez vérifier le niveau de duplicate content d’une page web existante ? Pour cela, entrez l’URL en question dans l’un des outils suivant :
-
Comparer le niveau de duplicate content de 2 pages (URL)
Pour comparer le contenu de 2 pages (2 URL) et tester leur niveau de duplicate content :
Définition duplicate content — Le dico SEO — Mise à jour : janvier 2012