Le duplicate content est un contenu que l’on retrouve sur plusieurs pages d’un site web ou sur plusieurs sites internet différents. Il peut s’agir de textes totalement identiques ou très similaires. Or, depuis que Google a lancé son filtre Panda, le moteur de recherche veille à la qualité éditoriale des sites. Le contenu dupliqué est préjudiciable et peut entraîner des sanctions. Comment savoir si votre site contient du contenu dupliqué ? Comment faire pour y remédier et conserver votre référencement ? Nous vous disons tout.
Les différentes formes de contenu dupliqué
Le contenu interne
On peut retrouver du contenu dupliqué sur un même site. Par manque de temps, certains propriétaires de sites internet reproduisent un texte identique sur plusieurs pages sans avoir connaissance du risque encouru. Cela envoie un mauvais signal à Google qui doute de la qualité et de la pertinence du contenu éditorial. Ce duplicate content peut prendre plusieurs formes. Il peut ainsi s’agir de blocs de textes reproduits sur différentes pages ou, de manière très fréquente, de fiches produits dupliquées. Par exemple, pour un vêtement disponible en plusieurs coloris, au lieu de réaliser une seule fiche avec un menu déroulant pour choisir la couleur, certains produisent autant de fiches qu’ils proposent de couleurs. L’erreur alors commise est de copier-coller le descriptif. Le contenu dupliqué peut également se retrouver au niveau des balises (titres et descriptions). Or, à l’instar du contenu de vos pages, chaque balise doit être unique.
Le contenu externe
Cette fois, on parle de contenu dupliqué avec un autre site. On retrouve le cas typique de ces fameuses fiches produits. Nombre de sites e-commerce reproduisent le contenu de leur fournisseur, or ces textes sont déjà bien souvent utilisés par la concurrence. Malheureusement, beaucoup ignorent l’impact d’une telle pratique sur leur SEO. Certains, pour optimiser leur référencement, utilisent des sous-domaines, voire créent des sites satellites. Or, si les textes sont identiques ou similaires sur ces derniers, le risque de pénalisation est majeur. Lorsque l’on évoque le duplicate content, on parle aussi de plagiat pur et simple. Certains propriétaires de sites peu scrupuleux font tout simplement un copier-coller d’un article de blog ou de tout autre contenu de site.
Les conséquences et risques du duplicate content
Le contenu dupliqué va impacter négativement votre référencement naturel. En effet, le filtre Panda veille au grain. Il s’assure que vous rédigez un contenu textuel unique et de qualité apportant une information à vos lecteurs. Qu’il s’agisse de duplication de contenu interne ou externe, Google va se retrouver face à un dilemme.
Si deux pages ont un contenu identique, laquelle doit être privilégiée ? Plusieurs cas de figure peuvent se présenter. De prime abord, Google va favoriser la date de publication. C’est donc le copieur qui sera pénalisé. Mais, malheureusement, ce n’est pas toujours le cas. Google prend également en compte la pertinence du site.
Si votre site est récent et qu’il n’a pas une notoriété importante aux yeux de Google, ce dernier peut privilégier un site plus populaire, même si c’est lui a copié vos textes. En cas de production de textes identiques sur votre site, Google ne référencera qu’une seule page.
De plus, ce moteur de recherche va perdre du temps à crawler des pages inutiles au lieu de s’intéresser à des pages plus pertinentes. Le risque de produire du contenu dupliqué ou d’être victime de plagiat est simple : votre référencement naturel sera négativement impacté et vous constaterez une baisse de trafic. Négliger la production de contenu unique peut ainsi fortement nuire à votre activité sur le web.
Quels outils pour détecter du contenu dupliqué ?
Gratuits ou non, certains outils ont été développés pour ne pas subir les foudres de Google Panda. Ils peuvent être utiles pour faire un audit de site et savoir si votre contenu est dupliqué. Mais ils peuvent également être utilisés en amont afin que vous soyez certain de publier un contenu unique. En voici quelques-uns qui vont vous permettre de détecter le contenu dupliqué ou d’éviter d’en rédiger.
- Screaming Frog SEO : cet outil de référencement gratuit permet de déterminer si toutes vos balises sont réellement uniques (titres, descriptions, Hn).
- Positeo : cet outil SEO permet de détecter du contenu dupliqué. Il affiche les URLs concernées ainsi que le taux de duplication des textes.
- Copyscape : autre outil de détection des contenus dupliqués, Copyscape analyse votre texte pour savoir s’il est identique ou similaire à un contenu déjà présent sur le web. Vous pouvez également saisir votre URL et vérifier que votre contenu n’est pas déjà présent ailleurs.
- Siteliner : cet outil permet de scanner votre site et de déterminer si du contenu dupliqué est retrouvé en interne. Un pourcentage indique le taux de similarité entre 2 pages.
- Google Search Console : elle propose de nombreuses fonctionnalités dont l’amélioration HTML qui permet de mettre le doigt sur la duplication éventuelle de balises.
Que faire pour corriger un souci de contenu dupliqué ?
Vous venez de découvrir que certains textes de votre site sont identiques ? Vous vous apercevez qu’un autre site a publié vos textes ? Voici les solutions à privilégier pour régler rapidement ce problème et éviter d’être déclassé sur Google.
Les optimisations internes
De manière interne, deux solutions s’offrent à vous. Vous pouvez choisir de réécrire tous vos textes en utilisant l’un des outils ci-dessus pour vous assurer que, cette fois, votre contenu est réellement unique. N’hésitez pas à confier cette tâche à un rédacteur, à une agence SEO ou d’inbound marketing.
La seconde solution consiste à utiliser des balises canonical. Cela permet, en cas de contenu dupliqué, d’indiquer aux moteurs de recherche quelle URL ils doivent prendre en considération.
Duplication sur un site externe
Là encore, on se retrouve face à deux cas de figure. Si un site a volé votre contenu, contactez-le afin qu’il retire celui-ci. Vous avez également la possibilité de signaler à Google la violation du droit d’auteur. Si, malgré vos démarches, le contenu n’est pas retiré, il est préférable de réécrire le vôtre afin de ne pas prendre le risque d’être pénalisé.
Si l’un de vos contenus a été copié par erreur, par un partenaire qui a utilisé l’un de vos textes pour vous présenter par exemple, là encore contactez-le. Demandez-lui de changer son texte ou proposez-lui un nouveau texte rédigé par vos soins.
A ce jour, selon Google, 60 % des textes sur internet sont dupliqués. L’enjeu est majeur puisque le contenu dupliqué peut entraîner une détérioration de votre positionnement sur les moteurs de recherche. Nous ne pouvons que vous conseiller de produire du contenu unique et pertinent pour améliorer votre référencement naturel et gagner en crédibilité auprès de Google. N’hésitez pas à utiliser les outils SEO à votre disposition ou à faire appel à des professionnels du référencement et de la rédaction.