Google pénalise t-il les sites qui contiennent du contenu dupliqué ?

Publié le

- par

Ludovic Passamonti

SEO technique

Qu’est-ce que le contenu dupliqué  ? 

Google définit le contenu dupliqué de cette façon : 

a…) des blocs importants de contenu identiques situés dans un même domaine ou répartis sur plusieurs domaines qui correspondent complètement à un autre contenu ou qui sont sensiblement similaires.

Il explique dans cet article disponible sur Google Search Central que :

« Si l’une des pages de votre site est accessible via plusieurs URL, ou si différentes pages de votre site présentent un contenu similaire (par exemple, une page avec une version mobile et une version classique), Google les considère comme des versions en double de la même page ». 

Pourquoi Google n’aime pas le contenu dupliqué  ? 

Google n’aime pas le contenu dupliqué pour plusieurs raisons :

  • À cause de la dégradation de la qualité des résultats de recherche : lorsqu’un utilisateur effectue une recherche, il souhaite trouver des résultats pertinents et variés. Les résultats de recherche remplis de pages proposant un contenu quasiment identique nuisent à l’expérience utilisateur en fournissant des informations redondantes et peu utiles. En décourageant le contenu dupliqué, Google favorise donc des résultats plus diversifiés et de meilleure qualité avec des contenus originaux et uniques.
  • Car cela peut être perçu comme une tentative de manipulation de ses classements. Certaines personnes peuvent créer intentionnellement du contenu dupliqué dans le but de manipuler les classements de recherche et d’obtenir du trafic “non mérité”. En pénalisant le contenu dupliqué, Google cherche donc à décourager ces pratiques de spam et à garantir l’équité dans les classements.
  • Pour maintenir une indexation efficace des pages : lorsque les robots de Google explorent et indexent le Web, il tente d’organiser les informations de manière efficace et logique. Si plusieurs pages contiennent le même contenu, cela complique le travail des robots pour définir la page originale, ou la page qui a le plus de valeur ajoutée pour les utilisateurs et qui mérite d’être mise en avant dans son classement.
  • Enfin, il y a une raison financière. L’analyse continue de milliards de pages web, appelée Crawl dans le jargon SEO, coûte des millions d’euros à Google chaque année. Google estime que le contenu dupliqué constitue environ 30% du contenu disponible sur le web. L’entreprise prête une attention particulière à la bonne dépense de ses ressources serveurs pour se concentrer uniquement sur les pages pertinentes et ne plus perdre de temps à visiter des pages avec du contenu dupliqué.

Quelle est la position officielle de Google sur la pénalisation du contenu dupliqué ?

Dans un article appelé “Démystifier le mythe de la pénalité sur le contenu dupliqué, disponible sur Google Search Central, la bible du SEO chez Google, il est clairement énoncé que :

Il n’existe pas de pénalité de contenu dupliqué. Du moins, pas de la manière dont la plupart des gens se l’imaginent quand ils disent cela.

Si vous récupérez du contenu d’autres sites et le republiez à l’identique sur le vôtre, ou si vous republiez du contenu sans ajouter de valeur supplémentaire, ces tactiques sont clairement décrites et déconseillées dans nos consignes aux webmasters.

Ne créez pas plusieurs pages, sous-domaines ou domaines avec un contenu substantiellement dupliqué.

Le contenu dupliqué sur un site n’est pas un motif d’action sur ce site, sauf s’il apparaît que l’intention du contenu dupliqué est d’être trompeur et de manipuler les résultats des moteurs de recherche. Si votre site souffre de problèmes de contenu dupliqué et que vous ne suivez pas les conseils ci-dessus, nous choisissons nous-mêmes la meilleure version du contenu à afficher dans nos résultats de recherche”.

Matt Cutts, l’un des porte-paroles de Google, qui dirige l’équipe Webspam est intervenu à de nombreuses reprises sur le sujet et explique dans cette vidéo datant de 2013 la manière dont Google agit en cas détection de contenu dupliqué.

Il n’y a pas de raison de s’inquiéter si vous avez un peu de contenu dupliqué dans votre site”.

https://www.youtube-nocookie.com/embed/mQZY7EmjbMA

La réalité du terrain

L’utilisation du terme “pénalité” est un abus de langage, car en aucun cas votre site ne sera désindexé des résultats de Google comme c’est le cas lors d’une pénalité manuelle ou d’une pénalité algorithmique.

De nombreux experts SEO se sont mis à parler de “pénalité” car il s’avère que les pages avec du contenu dupliqué se positionnent très mal, voire pas du tout. Google les détecte et les classe dans un index secondaire par rapport aux pages d’autres sites qu’il juge plus pertinentes, avec plus de valeur ajoutée dans les informations apportées. 

Certes, c’est une forme de pénalisation en soit, mais cela n’a rien à voir avec une vraie “pénalité Google”, qui aboutit à la perte de la totalité des positions et de la visibilité du site concerné dans les pages de résultats de Google.

L’éventualité d’une véritable pénalité manuelle de la part de Google est de plus en plus exceptionnelle. Cela peut arriver si un site a été visé par un reporting manuel de plagiat. Si c’est le cas, un message d’alerte apparaît dans la Search Console pour prévenir le propriétaire du site.

Il est prouvé que plus un site contient de contenu dupliqué, plus cela représente un frein pour son référencement naturel, car cela dégrade sa qualité SEO globale et cela envoie un mauvais signal à Google. Les pages incriminées risquent de rester très longtemps dans les bas-fonds des SERP tant que le contenu dupliqué est présent. Il sera ensuite difficile de positionner des pages pertinentes même si elles sont uniques pour l’internaute.

C’est notamment le risque avec des techniques SEO comme celle du “Content spinning”, souvent utilisée dans des stratégies de référencement local pour positionner un site sur de nombreuses requêtes du type “activité + nom d’une ville”.

Par exemple : une entreprise de location de camion de déménagement avec des agences implantées dans les grandes villes de France voudra être visible sur toutes les zones de  chalandise de ses agences. Il faudra donc créer une multitude de pages avec un contenu très similaire pour adresser les centaines, voire des milliers de requêtes sur son activité.

  • Location camion déménagement Paris
  • Location camion déménagement Marseille
  • Location camion déménagement Lyon
  • Location camion déménagement Bordeaux
  • etc…

 Si la proportion de ce contenu similaire est trop importante par rapport à la proportion de contenu unique présente dans le site, cela peut aboutir à une perte significative de positions.

Les avis divergent au sein de la communauté SEO quant à la proportion maximale de contenu dupliqué toléré par Google dans un site. Chez Jloo, nous conseillons de rester dans une proportion de contenu dupliqué inférieure à 20% afin d’être certain de “passer sous le radar” des filtres.

Ludovic

Passamonti

Ludovic travaille depuis 1999 dans le digital. Chef de projet web, puis consultant e-commerce indépendant à partir de 2008. Il fonde le cabinet de consulting e-commerce Skeelbox en 2012. Le SEO a toujours été un sujet au coeur de la stratégie webmarketing de ses clients. Il travaille depuis ses débuts avec de nombreuses agences SEO du marché et pratique le référencement naturel à leurs côtés. Ludovic rejoint l'agence SEO Jloo en 2019 pour apporter sa vision business et son expertise e-commerce à leurs clients.