Conseils, trucs et réflexions sur les sujets chauds de l'industrie du numérique | Globalia

Comment se protéger du plagiat de votre site web

Rédigé par Globalia | Apr 27, 2016 7:00:00 AM

 

En tant qu’entrepreneurs, webmarketers & influenceurs, nous avons l’opportunité incroyable de vivre, travailler et faire évoluer le monde du web. C’est avec nos idées, notre esprit de créateur et d’innovateur que l’on peut faire avancer les choses et voir notre Far West numérique se former et se modeler à l’image de ses utilisateurs.

Le mauvais côté de notre conquête digitale: plus nous sommes privilégiés de succès, plus nous augmentons les chances d'être victime de plagiat de site internet.

Il y a des risques à se laisser faire et à être impassible, alors comment peut-on se protéger d'avoir notre site web copié?

Définition du plagiat

« Le plagiat est une faute d’ordre moral, civil ou commercial, qui peut être sanctionnée au pénal, elle consiste à copier un auteur ou accaparer l’œuvre d’un créateur dans le domaine des arts sans le citer ou le dire, ainsi qu’à fortement s’inspirer d’un modèle que l’on omet, délibérément ou par négligence, de désigner. Il est souvent assimilé à un vol immatériel. » —  Wikipedia

Droit d’auteur

Le droit d’auteur, une propriété intellectuelle par définition, est une conception philosophique, légale & morale qui donne crédit à l’auteur original pour un œuvre artistique ou littéraire. Jadis, c’était utilisé souvent pour les œuvres physiques, mais aujourd’hui, ce concept transcende l’aspect physique pour être mieux représenté de manière numérique.

Évidemment, malgré le monde numérique sans frontières perceptibles, le respect de ce droit humain réside dans la législation propre à chaque pays, où les sites sont hébergés. Ces pays suivent les droits de tradition civiliste (appelé Droit Civil au Québec). Aux États-Unis, nous avons vu l’émergence du DMCA, Digital Millenium Copyright Act, la loi C-11 au Canada, ainsi que l’EUCD en Europe et, plus précisément, la loi DADVSI en France.

Qu’est-ce qu’un Scraper

Les scrapers prennent leur nom de par leurs méthodes de copie. Comparativement au plagiat manuel, où les gens prennent votre contenu et le publient quelque peu modifié en prenant crédit et s’identifiant comme le créateur original, le scraper numérise votre contenu pour le republier sur leur site de manière automatique. Ils se retrouvent donc souvent avec un site internet de plagiat, autrement appelé un Scraper Site.

Image prise de webdata-scraping

Effets néfastes sur votre référencement

Une fausse croyance est de penser que votre site web sera intensément pénalisé lorsque votre contenu est plagié par une tierce partie. La réalité est qu’à moins que cette tierce partie n’ait copié votre contenu sur 1000 domaines différents, il y a de minces chances que cela vous affecte directement. En réalité, on devrait même aller jusqu’à dire qu’au moment où vous avez mis en ligne votre texte ou votre image, la tierce partie ait eu le temps de vous copier et de le mettre en ligne pratiquement en même temps. À ce moment-là, peut-être qu’il y aurait un problème à régler.

Votre notoriété en souffre

L’un des problèmes qui peut survenir lors du plagiat de site internet est une question de branding. Bien que Google peut discerner le contenu d’un autre, de dire lequel est arrivé en premier par quelque manière que ce soit, on ne peut en dire autant pour un usager.

Par expérience personnelle, nous avons souvent vus, disons 95 % du temps, du contenu dupliqué se placer en dessous de nos clients dans les résultats de recherches. Le 5 % restant était dû au fait qu'un client avait publié un document dans un journal ou une revue traditionnelle, et quelqu’un l’avait ensuite transcrit sur son site pour le mettre en ligne. Le malfaiteur se retrouvait ensuite premier dans les résultats de recherches puisqu’il avait mis en ligne ce document avant le client. Vous vous demandez peut-être comment nous avons réglé le problème. J’en parlerai plus bas, dans la section « Je suis plagié & je veux agir ».

Vos positions dans les résultats de recherches

Google devient de plus en plus intelligent. Mettons-nous dans la position où votre site a été copié et le fautif est plus visible que vous dans les résultats. Ne paniquez pas. Google devient de plus en plus poussé et le but ultime de l'algorithme (depuis la mise à jour Panda) est d'être capable d'agir de manière transparente et continue. Du jour au lendemain, votre compétiteur pourrait tomber dans les abysses.

 

La méthodologie complète Inbound marketing : téléchargez notre guide maintenant!

 

Croyez-moi, si quelqu’un utilise votre contenu et se proclame comme le créateur original, vous devriez plus penser à vos droits d’auteurs qu’aux moteurs de recherches.

Comment prévenir le plagiat

Prévenir le plagiat de site internet n'est pas si compliqué si vous utilisez des liens canoniques (canonicals). Si vous allez sur des blogues populaires, disons Buzzfeed, Searchengineland ou encore Moz, vous vous rendrez compte qu’ils ont des self-referenced canonical. De par la définition précédente d’un scraper, un lien canonique sera copié avec tout le reste de votre contenu et il y a de fortes chances que le scraper mette en ligne son contenu et, sans le savoir, référence votre lien URL comme la source. Par conséquent, son contenu ne sera pas indexé et votre page originale restera autoritaire. Avis important : assurez-vous de bien implanter les liens canoniques puisque si une erreur se glisse, cela pourrait vous coûter cher.

Plusieurs ressources sur le web vous diront d’utiliser plusieurs méthodes différentes pour arrêter et empêcher les gens d’utiliser votre contenu. Faites attention et renseignez-vous avant de les utiliser si c’est quelque chose que vous voulez entreprendre. Ils vous diront de bloquer le clic droit, d’autres vous diront de cacher votre code source (pour l’amour de Dieu, ne le faites pas, sinon vous disparaîtrez des moteurs de recherches) ou encore protéger vos images. Honnêtement, tout ce que cela fera c’est ralentir les scrapers ou toute autre forme de copieur de prendre votre contenu. S’ils le veulent vraiment, ils trouveront un moyen. À mon humble avis, les ressources dépensées ne valent pas la peine d’empêcher vos usagers d’utiliser des fonctions qu’ils utilisent partout ailleurs pour quelques pommes pourries.

2 méthodes pour détecter le plagiat

Méthode manuelle

Cette méthode de base est très facile à utiliser. Il ne suffit qu’à prendre un morceau de votre texte, de le copier et d’en faire la recherche sur Google. Vous pouvez le faire avec ou sans guillemets dépendamment de la sorte de plagiat que vous essayez de trouver. Par exemple, pour du contenu copié mot pour mot, vous seriez mieux de mettre votre texte entre guillemets pour faire une recherche en "Exact Quote".

Ensuite, vous aurez donc des résultats que vous pourrez vérifier rapidement avec la Meta Description qui aura le contenu le plus pertinent à votre requête. Faites une lecture rapide, sinon rien ne vous empêche d’aller vérifier chaque URL.

Méthode automatique

Une méthode efficace qui ne requiert que très peu d’effort de votre part. L’outil que nous recommandons est Copyscape. L’outil semble très simple, très épuré, mais n’en est pas de moins performant. Il y a une version gratuite et, évidemment, vous pouvez acheter des crédits pour l’utiliser un peu plus souvent que la normale. Vous n'avez qu'à prendre l'URL à analyser, et Copyscape vous présentera des résultats en cas où vous êtes plagiés. Cependant, si l'outil vous propose des exemples, analysez-les pour être certain qu'il s'agit bel et bien d'une copie de votre contenu.

Je suis plagié & je veux agir

Si vous croyez avoir trouvé un Scraper, je vous suggère de rapporter le fait via le Scraper Report de Google. Sinon, si quelqu’un qui vous a copié se positionne en avant de vous, je vous conseille ces étapes :

  1. Ne réagissez pas trop fort. Ne paniquez pas. Prenez le temps d’examiner la documentation que vous croyez fautive. Assurez-vous que ce contenu est bel et bien copié et que vous n’y êtes pas nommé ou encore vérifiez s’il y a un lien canonique vers votre site.
  2. Prenez une capture d’écran ou toute autre manière pour prouver que le contenu se retrouve sur le site fautif.
  3. Envoyez une lettre cordiale. Essayez de communiquer avec le propriétaire du site ainsi qu’à l’hébergeur du site dans le même courriel.
  4. Si l’étape précédente ne fonctionne pas, cette fois-ci, envoyez un autre courriel un peu plus « agressif ».
  5. Si ça ne fonctionne toujours pas, faites recours à la loi. Que ce soit une requête DMCA ou autre, utilisez cette méthode seulement comme dernier recours. N’abusez surtout pas de cette action, car cela peut engendrer des complications si jamais vous vous trompez. Si vous êtes rendu à cette étape, je vous conseille de faire appel à vos avocats et de vérifier les options légales.

Personne n'est à l’abri du plagiat, mais nous avons tous les moyens de nous protéger, prévenir et améliorer notre situation. On pourrait argumenter et dire qu'internet aide et facilite le plagiat, mais à l'inverse, les moteurs de recherches deviennent de plus en plus sophistiqués pour contrer cette menace. L'important est de ne jamais agir de façon abrupte, de ne pas paniquer et, au besoin, demander conseil à des professionnels.