Aussi appelé « duplicate content », la duplication de contenu est la bête noire de Google et des propriétaires de sites internet. Si le contenu dupliqué peut représenter une facilité ou du temps gagné, c’est aussi une pratique que le moteur de recherche pénalise fortement en SEO. Outre les questions juridiques (de l’ordre du plagiat), le contenu dupliqué rend l’indexation par les moteurs plus complexe.
Qu’est-ce que le duplicate content ? Existe-t-il différentes formes de contenu dupliqué ? Pourquoi est-ce dommageable pour le référencement naturel d’un site internet ? Comment s’en prémunir ? L’équipe Jloo vous explique le contenu dupliqué en détail.
Sommaire
Quels sont les différents types de contenus dupliqués ?
La duplication de contenu interne
Il est très fréquent qu’un site internet contienne du duplicate content en interne. Il s’agit le plus souvent d’une erreur technique ou humaine. Le CMS publie en effet deux pages ayant des URLs différentes pour un contenu identique. Cela peut arriver par exemple au moment de la refonte d’un site lorsque les nouvelles URLs côtoient les anciennes pour venir en compétition avec elles. Les doublons peuvent aussi être causés par des produits qui se ressemblent et dont les textes sont donc presque identiques. Il peut aussi s’agir de textes copiés à partir de fichiers PDF proposés sur le site internet.
Le duplicate content interne peut être partiel ou total : partiel lorsque seule une portion du site est similaire, total lorsque c’est l’intégralité du site qui fait doublon (la version mobile et la version desktop).
La duplication de contenu externe
Aussi appelé contenu dupliqué inter-sites, le duplicate content externe peut provenir soit d’un copié collé total de votre site par un site tiers, soit de citations piochées à la volée sur votre site. Ce vol ou plagiat provient par exemple d’un concurrent, mais il peut aussi s’agir de plusieurs sites vendant le même type de produits et ayant renseigné le descriptif fourni par leur fournisseur.
Il arrive aussi qu’un site Web fasse rédiger un contenu par un blogueur : celui-ci publie l’article sur son propre site et vous-même le publiez sur votre site. Certains secteurs d’activité utilisent en outre les mêmes bases de données de contenu, c’est le cas notamment des sites touristiques sur lesquels on trouve régulièrement du duplicate content. Les sites internet de voyage présentent souvent deux villes différentes sur deux pages distinctes en utilisant cependant les mêmes informations. Un tel duplicate content pourra être évité en développant tout simplement le contenu relatif à chaque ville et en apportant des contenus bien distincts.
Quels sont les risques SEO du duplicate content sur un site ?
Le contenu dupliqué interne pose problème lorsque les robots de Google crawlent un site internet. Deux pages similaires entrent en concurrence sur une même requête, Google doit donc faire un choix pour sélectionner la plus pertinente. Résultat : une seule page est affichée sur le moteur de recherche et votre deuxième page ne sera pas positionnée.
Sachez également que les robots de Google qui passent sur votre site crawlent un nombre limité de pages. Le moteur de recherche risque donc de perdre du temps en crawlant des pages identiques au détriment de pages originales qui mériteraient tout autant d’être bien positionnées.
De la même façon, le duplicate content externe a un impact sur le positionnement d’un site Web. Là encore, Google ne choisira qu’une page sur les deux identiques. Mais, pour faire son choix, le moteur de recherche se basera notamment sur la date de publication des textes. De cette manière, Google fait la part entre les contenus identiques et reconnaît aisément le véritable auteur du contenu dont il privilégie alors le positionnement. Mais tout n’est pas aussi simple en matière de contenu dupliqué, la popularité du site qui a utilisé un contenu peut aussi influencer le choix des moteurs de recherche. Un site plus populaire et plus ancien que le vôtre sera ainsi privilégié par Google même s’il n’est pas l’auteur du texte. Le véritable auteur doit alors signaler le duplicate content à Google pour que celui-ci retire le contenu plagié.
Le risque du duplicate content est principalement lié au positionnement sur les SERPs. Il est rare qu’un site internet entier se fasse pénaliser. Une telle pénalité est appliquée seulement lorsque c’est l’intégralité du site Web qui est copiée.
Pour résumer :
– Google pénalise rarement le duplicate content interne ou externe lorsque celui-ci n’est pas total.
– Le duplicate content exerce une influence néfaste sur le bon référencement d’un site web : Google a du mal à choisir la page la plus pertinente, le temps de crawl sur votre site est gaspillé et votre popularité est dispersée entre les pages similaires.
Comment détecter le contenu dupliqué de votre site Web ?
Pour détecter un contenu dupliqué interne il vous suffit de lancer un crawl. De nombreux outils sont utilisés en SEO afin de simuler le passage des robots sur les sites Web et mettre en exergue toutes les barrières qui bloquent le bon travail de Google.
Pour détecter un contenu dupliqué externe, commencez par taper sur le moteur de recherche quelques phrases entre guillemets provenant de votre site. Si Google fait ressortir d’autres sites internet que le vôtre c’est le signe que des concurrents utilisent vos contenus à leur avantage. Cette méthode de duplicate content a cependant ses limites car elle demande beaucoup de temps. Les experts SEO soucieux de fournir à Google un contenu original utilisent donc des outils dédiés au contenu dupliqué : Copyscape ou Plagiarism Detector par exemple.
Comment éviter le contenu dupliqué pour optimiser son positionnement sur les moteurs de recherche ?
Pour éviter le duplicate content externe, effectuez régulièrement des recherches sur Google afin de rester en veille. Soyez vigilant lorsque vous lancez un partenariat, assurez-vous ainsi que les contenus créés resteront originaux et qu’ils ne seront pas utilisés par d’autres sites. Prévoyez par exemple d’insérer un lien renvoyant vers l’article original ou demander à votre partenaire d’utiliser la balise « noindex ».
Pour éviter la duplication de contenu en interne vérifiez d’abord que votre site internet est accessible uniquement à partir d’un nom de domaine. Veillez également à rester vigilant vis-à-vis des redirections 301, notamment si une refonte est en cours sur votre site internet.
Pour réduire le duplicate content et améliorer votre stratégie SEO, n’hésitez pas à retravailler vos contenus pour que chaque page soit originale même lorsque les produits se ressemblent. N’utilisez pas les descriptions de produit rédigés par les fournisseurs (vous y gagnerez aussi en taux de conversion, car le visiteur aura une meilleur compréhension de vos produits).
Le contenu dupliqué est une pratique qui peut avoir des conséquences directes sur votre référencement sur les moteurs de recherche. Si Google ne pénalise pas systématiquement les contenus dupliqués, les risques SEO doivent être pris en compte. En e-commerce par exemple, le contenu dupliqué et le mauvais positionnement d’un site internet sur les résultats du moteur de recherche se feront sentir sur le taux de conversion des internautes. Le duplicate content doit donc être régulièrement vérifié par les propriétaires de sites internet e-commerce.