Continuons à parler du contenu dans l’effort de référencement naturel. Après avoir évoqué des astuces pour
écrire un contenu SEO optimisé, nous revenons aujourd’hui sur le phénomène du duplicate content et son impact sur le référencement.
Qu’est-ce que le duplicate content et quel est son impact ?
Le duplicate content, ou contenu dupliqué en français, désigne comme son nom l’indique la présence de contenus identiques à plusieurs endroits différents. Plus simplement, lorsque deux contenus rédactionnels identiques se retrouvent à deux adresses web différentes (deux URL), on parle de duplicate content. Il peut être totalement involontaire ou complétement intentionnel, bien que la seconde option soit plus rare. Pratique à éviter, quelles sont donc les conséquences du duplicate content ?
Pour les moteurs de recherche, le duplicate content ne constitue pas toujours une faute. En effet, Google ne sanctionne pas chaque site réalisant du duplicate, puisqu’il réserve les pénalités pour les actions de duplicate qu’il juge volontaires. En effet, piquer un texte à la concurrence pour avoir rapidement du contenu à indexer et donc accélérer son gain de positions peut-être tentant, mais c’est justement dans ce cas précis que les moteurs de recherche pourront agir et simplement blacklister le site, où lui faire perdre nombre de places. C’est en partie suite à cette surveillance des contenus de la part de Google et l’amélioration de ses robots que l’exigence de qualité et d’originalité dans le contenu d’un site a fortement été augmentée ces dernières années.
Les exceptions au duplicate content
Comme nous venons de le préciser, Google n’attaque pas chaque preuve de duplicate content : la tolérance est de mise, notamment pour des contenus qui, de par leur nature, sont voués à être répétés à l’identique. C’est notamment le cas des mentions légales des sites internet, qui au final reprennent toujours les mêmes informations et présentent donc des structures souvent identiques. Matt Cutts avait ainsi indiqué il y a quelques mois que le duplicate content de textes juridiques ou obligatoires était évidemment toléré, à condition bien sûr de ne pas en profiter pour sur-optimiser le contenu en y ajoutant énormément de mots-clés.
Le responsable anti-spam vient d’ailleurs de publier une nouvelle vidéo à ce sujet, en précisant que si du duplicate content était inévitable, il était possible d’utiliser la balise
rel=canonical, afin d’informer à Google quelle est votre page principale, celle ayant publié le contenu original. Vous pouvez également, si cela ne nuit pas à votre référencement, désindexer les pages avec du duplicate, afin que Google ne les crawle pas.