Partager cet article avec vos amis et contacts via les reseaux sociaux

Référencement naturel de site internet : comment éviter le contenu dupliqué (duplicate content)

Comment éviter le duplicate content (contenu dupliqué) lors du referencement naturel de votre site internet sur les moteurs de recherche


Les plus importants moteurs de recherche essaient de filtrer leurs résultats en supprimant tous les résultats dont le contenu figure déjà dans leurs bases de données. Ce type de filtrage est appelé filtre de contenu dupliqué / duplicate content ) ...


duplicate content ou contenu dupliqué
duplicate content ou contenu dupliqué
Il est important de comprendre et d’identifier ce qu’est le contenu dupliqué ou duplicate content. Le duplicate content est généralement défini comme des blocs conséquents de texte qui sont recopiés d’un site à un autre. De nombreux webmasters essaient d’utiliser le contenu dupliqué pour manipuler et influencer les résultats des moteurs de recherche. La communauté des référenceurs continue de débattre sur la légitimité et l’existence des filtres de contenu dupliqué. La plupart des webmasters, eux, ont simplement accepté le fait que le duplicate content pouvait constituer une pénalité par la plupart des moteurs de recherche.

Comment un moteur de recherche peut-il déterminer quelle version de contenu est l’original ? Il est difficile pour un moteur de recherche de dite quel site est à l’origine d’une version de contenu, et des sites web « innocents » peuvent se retrouver pénalisés ou bannis pour avoir inclus du contenu dupliqué. Après avoir analysé le comportement des moteurs de recherche, il faut assumer le fait qu’ils retiennent la plupart du temps le contenu listé depuis une source dite « de confiance ». Pour cela , ils peuvent se référer au nombre de liens entrants de la source, à l’âge du domaine, ou à n’importe quel facteur d’optimisation pour statuer sur la réputation du domaine qui contient le contenu dupliqué. Si l’une des copies est considérée par le moteur de recherche comme provenant d’une source « réputée », alors il classera la page convenablement, tandis que l’autre source, qui pourrait pourtant être la version originale du contenu, se verra pénalisée.

Tous les représentants des moteurs de recherche ont clairement fait comprendre qu’ils préféraient les contenus uniques. Les webmasters qui désirent éviter une pénalité feraient bien de suivre ces quelques conseils.

Les redirections

Si vous refondez votre site, utilisez des redirections permanentes 301. C’est un excellent moyen de router votre trafic web depuis vos anciennes pages vers les nouvelles.

L’unicité

Chaque page de votre site doit être unique. Le thème de chaque page d’un site web, même s’il est similaire au thème d’une autre page, doit est être composé d’un contenu unique et original.

Les langues multiples

S’il existe plusieurs versions du site en différentes langues, employez différents domaines pour chacune d’entre elles. De cette manière les moteurs de recherche ne se contenteront pas de voir qu’un article est simplement traduit en différentes langues et ne sera pas considéré comme contenu dupliqué. Chaque version de langue est un contenu unique aux yeux d’un moteur de recherche.

Des META tags uniques

Chaque page du site doit avoir des balises META uniques ( TITLE, DESCRIPTION et KEYWORDS ). Deux pages possédant le même TITLE peuvent être considérées comme contenu dupliqué et seule l’une d’entre elles sera indexée.

Le fichier robots.txt

Si vous faites intentionnellement du contenu dupliqué sur votre site, assurez-vous de la présence d’un fichier robots.txt à la racine de votre site pour prévenir les moteurs de recherche de ne pas venir indexer telle ou telle partie de votre site (ou une partie que vous voudriez garder privée).

L’affiliation

Si vous promouvez des produits ou des services en employant un programme d’affiliation, utilisez fiches produits uniques. Si vous utilisez simplement les mêmes descriptions de produit en provenance de votre affilieur, c’est exactement comme si vous aviez copié ses fiches produits et vos pages seront considérées comme contenu dupliqué (car il y a de grandes chances que votre affilieur soit considéré comme source de confiance).

Le copyright

Incluez un copyright au pied de chacune de vos pages web.

Droits d’auteur

copyright / droits d’auteur
copyright / droits d’auteur
Si vous découvrez qu’un autre site web a reproduit votre contenu sans votre consentement, faites valoir vos droits d’auteur. Utilisez CopyScape ( http://www.copyscape.com ) pour savoir quelles sont les pages qui ont été dupliquées.

Ensuite, si vous constatez une infraction, entrez poliment en contact avec le site en infraction et demandez-lui de faire les modifications appropriées.

Si les changements satisfaisants ne sont pas effectués dans un laps de temps raisonnable, vous pouvez entrer en relation avec l’hébergeur du site contrevenant et voir avec lui ce qu’il est possible de faire. Vous pouvez également soumettre une plainte DMCA ( Digital Millenium Copyright Act ) à Google ( http://www.google.com/dmca.html ), si les pages contrefaites figurent dans les résultats de ses index. La procédure est stricte et longue, alors assurez-vous de la légitimité de votre action.

Eviter les contenus identiques

Evitez, autant que faire se peut, de créer une page web qui contient un contenu identique ou étroitement lié à une autre page web de votre site. Si pour raison quelconque vous avez deux pages dont le contenu est identique, utilisez le fichier robots.txt pour bloquer l’accès à l’une d’entre elles aux moteurs de recherche. Vous éviterez ainsi tout contenu dupliqué indexé dans les résultats de recherche.

En conclusion

Bien que l’on puisse toujours se demander si les moteurs de recherche accorde une pénalité ou non au contenu dupliqué, tous ont toutefois exprimé qu’ils n’avaient absolument pas envie de proposer le même contenu dans leurs pages de résultats. Si, sur votre site, vous n’en proposez pas, faites malgré tout des recherches actives pour savoir si d’autres sites web ne sont pas en infraction en ayant reproduit vos contenus. Cette démarche proactive vous permettra d’éviter d’éventuelles sanctions.

Rédigé par Christophe Da Silva, le Lundi 26 Avril 2010 et lu 11118 fois.

Notez



Vous avez apprécié cette publication ?
Partagez cet article avec vos amis & contacts,
Par  Email Email , Facebook Facebook , Tweeter Tweeter , et  les autres reseaux sociaux Plus ...
& Recevez les nouvelles publications ,
Par Mail :
  



1.Posté par SRC Bordeaux le 26/04/2010 10:02 | Alerter
Utilisez le formulaire ci-dessous pour envoyer une alerte au responsable du site concernant ce commentaire :
Annuler

Est-ce que le fait de de coller dans le contenu de son site web, une partie d'une loi, d'un décret, ou d'un code quel qu'il soit, sera considéré comme un contenu dupliqué, dans la mesure ou il sera peut être repris par de nombreux sites ?

Cordialement,

Romain G

2.Posté par Christophe Da Silva le 26/04/2010 10:15 | Alerter
Utilisez le formulaire ci-dessous pour envoyer une alerte au responsable du site concernant ce commentaire :
Annuler

Bonjour

@ SRC Bordeaux : Si n'est qu'une portion de texte contenu dans une page, ce n'est pas du DC. Le DC n'est considéré comme tel qu'à partir du moment où la densité du texte reproduit est au moins égal à 50% du texte.

L'objectif d'un contenu pertinent n'est pas pas de reproduire intégralement un texte sur une page web, ce qui est clairement du DC. Tâchez plutôt de n'en citer que quelques parties, en les commentant par exemple. C'est ce que l'on peut observer par exemple avec les définitions de Wikipédia, incluses dans un texte.

Bonne continuation

Christophe

3.Posté par Léo, Propulsr le 26/04/2010 10:26 | Alerter
Utilisez le formulaire ci-dessous pour envoyer une alerte au responsable du site concernant ce commentaire :
Annuler

Un élément important du combat contre le contenu dupliqué est la balise rel canonical. Celle-ci est d'ailleurs maintenant utilisée par défaut dans les CMS de type Wordpress.

Elle permet d'identifier la page "de référence" et de supprimer le contenu dupliqué présent sur beaucoup de sites dynamiques ayant des URL avec query strings (par exemple) renvoyant vers la même page.

4.Posté par Christophe Da Silva le 26/04/2010 10:46 | Alerter
Utilisez le formulaire ci-dessous pour envoyer une alerte au responsable du site concernant ce commentaire :
Annuler

@Léo : absolument. Et s'il vous en prenait l'envie de bidouiller le code de votre Wordpress (ce qui m'arrive systématiquement), c'est sans doute la dernière balise à supprimer !

Christophe

5.Posté par Les Fées Créatives le 10/05/2010 21:24 | Alerter
Utilisez le formulaire ci-dessous pour envoyer une alerte au responsable du site concernant ce commentaire :
Annuler

Bonjour et merci pour ces commentaires instructifs. Laissez moi vous conter une aventure qui nous est arrivée dernièrement...
Nous avons autorisé il y a quelques mois un revendeur a diffuser notre catalogue. Le site a eu une mise à jour importante en Février, et malgré un référencement naturel via une société ayant pignon sur rue, notre visibilité ne décollait pas. Jusqu'au jour ou nous avons trouvé en première page de Google sur le mot "lanière cuir" une de nos images hébergée sur un autre site.
Le propriétaire, après envoi d'une facture pour utilisation de nos images, nous appelle et menace de nous faire un procès, soutenant que cette image leur appartenait.
Nous avons ainsi découvert dans nos investigations que tout notre catalogue était repris par X comparateurs de prix mais se trouvait également sur une bonne dizaine de market-place, nous poussant vers les dernières pages de Google.
Il nous a fallu plusieurs semaines pour sortir de ce bourbier, tous nos articles, textes et images é...

6.Posté par Alex PONTIERS le 21/06/2012 11:22 | Alerter
Utilisez le formulaire ci-dessous pour envoyer une alerte au responsable du site concernant ce commentaire :
Annuler

Lorsque son contenu est utilisé, il est aussi possible d'utiliser la balise pour faire identifier son contenu comme unique et non CP...
Et puis il faut protéger son contenu, car il devient la base de tout site web, bien que tout soit relatif ;-)


Thématique similaire

Contacts & infos légales
RollBox Thématiques @ lEuroMag
voyage
massages
geothermie
tablette tactile
automobile
quad sport
abris vélos
station lavage vélo
chocolat
ipad apple
iphone apple
smartphone
littérature
prévisions météo
programme tv
horoscope du jour
investir en bourse
réséaux sociaux
aérothermie
jeux de poker
rédaction contenu
kopi luwak
webmarketing
pigistes

Version - Aujourd'hui  lecteurs lEuroMag & Web TV © 2007 | buzz | redaction Actuellement  internautes sont connectés
Retrouvez lEuroMag magazine sur les Réseaux Sociaux
lEuroMag magazine sur Facebook lEuroMag magazine sur Twitter les Buzz du magazine lEuroMag via Google-Buzz lEuroMag magazine sur Netvibes Les Scoops de lEuroMag magazine sur Scoopeo les Videos de lEuroMag Magazine sur Dailymotion les Videos du magazine lEuroMag sur YouTube le Blog Buzz de lEuroMag magazine lEuroMag magazine sur votre iPhone Recevez la NewsLetter de lEuroMag magazine les Flux RSS du magazine lEuroMag

Partager sur Facebook Partager sur Twitter Envoyer a un contact par Email Inscription Newsletter Hebdomadaire