duplicate content ou contenu dupliqué
Il est important de comprendre et d’identifier ce qu’est le contenu dupliqué ou duplicate content. Le duplicate content est généralement défini comme des blocs conséquents de texte qui sont recopiés d’un site à un autre. De nombreux webmasters essaient d’utiliser le contenu dupliqué pour manipuler et influencer les résultats des moteurs de recherche. La communauté des référenceurs continue de débattre sur la légitimité et l’existence des filtres de contenu dupliqué. La plupart des webmasters, eux, ont simplement accepté le fait que le duplicate content pouvait constituer une pénalité par la plupart des moteurs de recherche.
Comment un moteur de recherche peut-il déterminer quelle version de contenu est l’original ? Il est difficile pour un moteur de recherche de dite quel site est à l’origine d’une version de contenu, et des sites web « innocents » peuvent se retrouver pénalisés ou bannis pour avoir inclus du contenu dupliqué. Après avoir analysé le comportement des moteurs de recherche, il faut assumer le fait qu’ils retiennent la plupart du temps le contenu listé depuis une source dite « de confiance ». Pour cela , ils peuvent se référer au nombre de liens entrants de la source, à l’âge du domaine, ou à n’importe quel facteur d’optimisation pour statuer sur la réputation du domaine qui contient le contenu dupliqué. Si l’une des copies est considérée par le moteur de recherche comme provenant d’une source « réputée », alors il classera la page convenablement, tandis que l’autre source, qui pourrait pourtant être la version originale du contenu, se verra pénalisée.
Tous les représentants des moteurs de recherche ont clairement fait comprendre qu’ils préféraient les contenus uniques. Les webmasters qui désirent éviter une pénalité feraient bien de suivre ces quelques conseils.
Comment un moteur de recherche peut-il déterminer quelle version de contenu est l’original ? Il est difficile pour un moteur de recherche de dite quel site est à l’origine d’une version de contenu, et des sites web « innocents » peuvent se retrouver pénalisés ou bannis pour avoir inclus du contenu dupliqué. Après avoir analysé le comportement des moteurs de recherche, il faut assumer le fait qu’ils retiennent la plupart du temps le contenu listé depuis une source dite « de confiance ». Pour cela , ils peuvent se référer au nombre de liens entrants de la source, à l’âge du domaine, ou à n’importe quel facteur d’optimisation pour statuer sur la réputation du domaine qui contient le contenu dupliqué. Si l’une des copies est considérée par le moteur de recherche comme provenant d’une source « réputée », alors il classera la page convenablement, tandis que l’autre source, qui pourrait pourtant être la version originale du contenu, se verra pénalisée.
Tous les représentants des moteurs de recherche ont clairement fait comprendre qu’ils préféraient les contenus uniques. Les webmasters qui désirent éviter une pénalité feraient bien de suivre ces quelques conseils.
Les redirections
Si vous refondez votre site, utilisez des redirections permanentes 301. C’est un excellent moyen de router votre trafic web depuis vos anciennes pages vers les nouvelles.
L’unicité
Chaque page de votre site doit être unique. Le thème de chaque page d’un site web, même s’il est similaire au thème d’une autre page, doit est être composé d’un contenu unique et original.
Les langues multiples
S’il existe plusieurs versions du site en différentes langues, employez différents domaines pour chacune d’entre elles. De cette manière les moteurs de recherche ne se contenteront pas de voir qu’un article est simplement traduit en différentes langues et ne sera pas considéré comme contenu dupliqué. Chaque version de langue est un contenu unique aux yeux d’un moteur de recherche.
Des META tags uniques
Chaque page du site doit avoir des balises META uniques ( TITLE, DESCRIPTION et KEYWORDS ). Deux pages possédant le même TITLE peuvent être considérées comme contenu dupliqué et seule l’une d’entre elles sera indexée.
Le fichier robots.txt
Si vous faites intentionnellement du contenu dupliqué sur votre site, assurez-vous de la présence d’un fichier robots.txt à la racine de votre site pour prévenir les moteurs de recherche de ne pas venir indexer telle ou telle partie de votre site (ou une partie que vous voudriez garder privée).
L’affiliation
Si vous promouvez des produits ou des services en employant un programme d’affiliation, utilisez fiches produits uniques. Si vous utilisez simplement les mêmes descriptions de produit en provenance de votre affilieur, c’est exactement comme si vous aviez copié ses fiches produits et vos pages seront considérées comme contenu dupliqué (car il y a de grandes chances que votre affilieur soit considéré comme source de confiance).
Le copyright
Incluez un copyright au pied de chacune de vos pages web.
Droits d’auteur
copyright / droits d’auteur
Si vous découvrez qu’un autre site web a reproduit votre contenu sans votre consentement, faites valoir vos droits d’auteur. Utilisez CopyScape ( http://www.copyscape.com ) pour savoir quelles sont les pages qui ont été dupliquées.
Ensuite, si vous constatez une infraction, entrez poliment en contact avec le site en infraction et demandez-lui de faire les modifications appropriées.
Si les changements satisfaisants ne sont pas effectués dans un laps de temps raisonnable, vous pouvez entrer en relation avec l’hébergeur du site contrevenant et voir avec lui ce qu’il est possible de faire. Vous pouvez également soumettre une plainte DMCA ( Digital Millenium Copyright Act ) à Google ( http://www.google.com/dmca.html ), si les pages contrefaites figurent dans les résultats de ses index. La procédure est stricte et longue, alors assurez-vous de la légitimité de votre action.
Ensuite, si vous constatez une infraction, entrez poliment en contact avec le site en infraction et demandez-lui de faire les modifications appropriées.
Si les changements satisfaisants ne sont pas effectués dans un laps de temps raisonnable, vous pouvez entrer en relation avec l’hébergeur du site contrevenant et voir avec lui ce qu’il est possible de faire. Vous pouvez également soumettre une plainte DMCA ( Digital Millenium Copyright Act ) à Google ( http://www.google.com/dmca.html ), si les pages contrefaites figurent dans les résultats de ses index. La procédure est stricte et longue, alors assurez-vous de la légitimité de votre action.
Eviter les contenus identiques
Evitez, autant que faire se peut, de créer une page web qui contient un contenu identique ou étroitement lié à une autre page web de votre site. Si pour raison quelconque vous avez deux pages dont le contenu est identique, utilisez le fichier robots.txt pour bloquer l’accès à l’une d’entre elles aux moteurs de recherche. Vous éviterez ainsi tout contenu dupliqué indexé dans les résultats de recherche.
En conclusion
Bien que l’on puisse toujours se demander si les moteurs de recherche accorde une pénalité ou non au contenu dupliqué, tous ont toutefois exprimé qu’ils n’avaient absolument pas envie de proposer le même contenu dans leurs pages de résultats. Si, sur votre site, vous n’en proposez pas, faites malgré tout des recherches actives pour savoir si d’autres sites web ne sont pas en infraction en ayant reproduit vos contenus. Cette démarche proactive vous permettra d’éviter d’éventuelles sanctions.
Suggestion de publications disponible dans la même thématique