Dotclear, SEO

Bien comprendre le Duplicate Content

Les moteurs de recherches comme Google, sont basés sur des algorithmes qui permettent d’afficher les résultats d’une recherche ordonnés par pertinence. Ces algorithmes sont en constante évolution afin de pouvoir proposer des résultat toujours plus judicieux. Depuis peu, les moteurs de recherche sont en mesure de juger la qualité du contenu d’un site.

Par exemple, Google va analyser votre contenu afin de savoir s’il est unique ou bien s’il est dupliqué sur plusieurs sites. C’est dans ce cas précis que l’on parle de Duplicate Content (contenu dupliqué).

Voici une image (via) afin d’expliquer le phénomène du Duplicate Content :

Duplicate Content

Vous l’avez compris, le contenu de votre blog est précieux, il ne faut en aucun cas le publier ailleurs. Le processus de détection du Duplicate Content n’est pas infaillible. Effectivement, la sélection des sites les plus pertinents et l’attribution du contenu à son auteur est basée sur le nombre de liens entrants ainsi que le “poids SEO” (qualité générale du site vis à vis des moteurs de recherche).

De la sorte, il arrive que les agrégateurs de flux RSS soient mieux référencés que la source. C’est ainsi que Wikio ressort souvent devant vos propres articles.

Pour lutter contre le Duplicate Content, vous devez éviter d’ajouter votre flux RSS sur les nombreux sites qui vont le publier : Ziki, Wikio, Paperblog etc. Il existe un outil capable de détecter les sites reprenant votre contenu : Copyscape (10 premiers résultats gratuits, premium ensuite). Un plugin WordPress vous permet d’ailleurs de protéger votre flux RSS via Copyscape (et du plagiat par la même occasion).

Il est également important de ne pas dupliquer votre contenu au sein même de votre blog. Autrement dit, le contenu de votre article doit être accessible que depuis une seule et même adresse. Les tags, pages d’archives et autres sont souvent sources de duplicate content. Pour éviter que Google trouve votre article sous différentes url, il vous suffit de créer un fichier robot.txt qui va bloquer l’accès à certaines urls. Pour les utilisateurs de WordPress, un excellent plugin vous permet de lutter contre le duplicate content au sein de votre blog grâce aux attributs NoIndex et NoFollow : HeadSpace 2.

Pour aller plus loin :

ABONNEZ-VOUS à la mailing list, c'est GRATUIT !

Abonnez-vous à la mailing list et recevez plein d'infos intéressantes !

16 Comments

  1. oui, et encore…Le duplicate, c’est copier le contenu d’un article dans son intégralité pour le copier sur une autre plateforme. et même sur un article copié à 100%, il suffit de refaire la pagination, avec des titres, mettre des mots différents en gras, en italique, bref, changer qualques balises pour que les moteurs passent dessus sans même détecter un Duplicate content!

    Un épouvantail, rien d’autres…

    Ceci dit, ne copier pas bêtement, ce n’est pas l’objet de mon commentaire, ni même je n’ai dans l’idée de motiver la copie !!! 🙂

  2. moi je m’en fous, je copie, mais j’enrichis mon article après.
    google me fait chier depuis plus d’un an à me blacklister alors, si je le pouvais je leur mettrais un un gros doigt dans là où vous savez…

  3. Bonjour Romain,
    Les pages dans Wikio qui contiennent le résumé (400 caractères, 60/70 mots) de l’article et les commentaires ne sont pas indexés dans Google.
    Wikio ne peut donc pas être mieux placé que l’article original sur le blog !
    Wikio ne soumet à Google que les catégories optimisées par nos documentalistes.
    De plus, dans les pages Wikio, l’article n’apparait jamais dans son intégralité, mais juste un résumé.
    Pour les autres services que tu cites dans ton billet, c’est vrai qu’ils indexent le contenu des blogs dans un mode duplicate content. J’avais déjà écrit un article à ce sujet sur mon blog ( http://www.alterclickr.com/?p=337 )
    Par contre, Wikio ne le fait pas, et indexer son blog sur Wikio ne présente donc aucun risque de duplicate content.
    A ta diposition pour toute question.
    Marc

  4. Pour contrer cela sur Paperblog, il existe un bon plugin WordPress, seule obligation insérer le tag more dans les articles. (il est relativement complet et permet si besoin est d’ajouter adsense dans les feeds (sans avoir besoin de feedburner)). Il s’agit <a href=”http://planetozh.com/blog/my-projects/wordpress-plugin-better-feed-rss/” target=”_blank”>d’Ozh’better feed</a>. Depuis que je l’utilise j’ai des visites sur le blog à partir de Paperblog, ce qui n’était pas le cas auparavant.
    Enjoy WP.
    Amitié
    Thierry qui part en vacances dimanche

  5. Je suis en plain déménagement de blog, avec rapatriement des archives de 2 anciens blogs sur un seul et unique nouveau. je suis donc un peu forcée de faire du duplicate content. Et j’ai une petite question: si je supprime les anciens articles des vieux blogs au fur et à mesure, est-ce que les moteurs de recherche vont quand même détecter les doublons? Et y a-t-il une manière de contourner ça?

  6. Comme je le disais, le DC n’est valable que si c’est EXACTEMENT la même chose, à la balise près! Je te conseille (comme je l’ai fais pour mes blogs, de mettre une phrase d’introduction sur le nouveau blog pour chaque article, du type. “Cet article était à l’origine publié sur mon ancien blog. J’ai changé d’héberheur (ou de plateforme) et ….etc..
    Cette phrase d’introduction permet de ne pas avoir le même contenu. Change éventuellement la place des images.
    Si tu utilises le plugin “All In One SEO”, modifie le titre, modifie le contenu, et tout passera sans aucun problème!

  7. @yves et @ vicky : je ne suis pas sûre que juste placer un texte devant les articles dupliqués évitera le problème du DC. Les robots détectent des portions de textes identiques, et non pas des pages identiques. La suite des billets dupliqués sera donc toujours un doublon de l’original.
    Vicky, je te conseillerai plutôt de faire des redirections depuis tes anciens articles que tu veux supprimer, vers leur doublon sur ton nouveau blog. Ainsi, tu ne perdras pas l’historique de tes anciens billets et les lecteurs de tes anciens blogs découvriront ton nouveau blog. Pour faire les redirections, utilise le fichier robots.txt.

  8. @ SurfAnna: J’ai repris les articles en changeant certains portions de gras, d’italique, en insérant des images… Mais hélas la redirection, mon ancienne plate-forme ne le permet pas, ça aurait été trop beau! Merci des conseils.

  9. @ Vicky : de rien. Effectivement, si la redirection n’est pas possible, c’est embêtant… tiens-nous au courant de l’évolution de ton référencement, c’est toujours intéressant ! 🙂

  10. Ping : Liens blogmarks de la semaine | Ozmoz
  11. Ping : Marre du duplicate content | Le Grand Bazar
  12. Je sais que l’article date un peu, mais je cherchais des détails sur cette “vieille” histoire de lien entre wikio et le duplicate content. Quant au conseil “ne vous inscrivez pas sur wikio”, il faudrait aujourd’hui écrire “vérifiez que vous n’êtes pas inscrit sur wikio”. Ils ont référencé 2 de mes blogs sans m’en avertir, et même pire: ils m’ont relancée plusieurs fois il y a quelques semaines par mail, je leur ai clairement répondu que je ne voulais pas être sur wikio… et ils m’y ont inscrit quand même. Un peu gros, non?

Laisser un commentaire

Votre adresse de messagerie ne sera pas publiée. Les champs obligatoires sont indiqués avec *

Ce site utilise Akismet pour réduire les indésirables. En savoir plus sur comment les données de vos commentaires sont utilisées.

Avant de partir

Abonnez-vous à la mailing list et recevez plein d'infos intéressantes !