En tant qu’entrepreneurs, webmarketers & influenceurs, nous avons l’opportunité incroyable de vivre, travailler et faire évoluer le monde du web. C’est avec nos idées, notre esprit de créateur et d’innovateur que l’on peut faire avancer les choses et voir notre Far West numérique se former et se modeler à l’image de ses utilisateurs.
Le mauvais côté de notre conquête digitale: plus nous sommes privilégiés de succès, plus nous augmentons les chances d'être victime de plagiat de site internet.
Il y a des risques à se laisser faire et à être impassible, alors comment peut-on se protéger d'avoir notre site web copié?
« Le plagiat est une faute d’ordre moral, civil ou commercial, qui peut être sanctionnée au pénal, elle consiste à copier un auteur ou accaparer l’œuvre d’un créateur dans le domaine des arts sans le citer ou le dire, ainsi qu’à fortement s’inspirer d’un modèle que l’on omet, délibérément ou par négligence, de désigner. Il est souvent assimilé à un vol immatériel. » — Wikipedia
Le droit d’auteur, une propriété intellectuelle par définition, est une conception philosophique, légale & morale qui donne crédit à l’auteur original pour un œuvre artistique ou littéraire. Jadis, c’était utilisé souvent pour les œuvres physiques, mais aujourd’hui, ce concept transcende l’aspect physique pour être mieux représenté de manière numérique.
Évidemment, malgré le monde numérique sans frontières perceptibles, le respect de ce droit humain réside dans la législation propre à chaque pays, où les sites sont hébergés. Ces pays suivent les droits de tradition civiliste (appelé Droit Civil au Québec). Aux États-Unis, nous avons vu l’émergence du DMCA, Digital Millenium Copyright Act, la loi C-11 au Canada, ainsi que l’EUCD en Europe et, plus précisément, la loi DADVSI en France.
Les scrapers prennent leur nom de par leurs méthodes de copie. Comparativement au plagiat manuel, où les gens prennent votre contenu et le publient quelque peu modifié en prenant crédit et s’identifiant comme le créateur original, le scraper numérise votre contenu pour le republier sur leur site de manière automatique. Ils se retrouvent donc souvent avec un site internet de plagiat, autrement appelé un Scraper Site.
Image prise de webdata-scraping
Une fausse croyance est de penser que votre site web sera intensément pénalisé lorsque votre contenu est plagié par une tierce partie. La réalité est qu’à moins que cette tierce partie n’ait copié votre contenu sur 1000 domaines différents, il y a de minces chances que cela vous affecte directement. En réalité, on devrait même aller jusqu’à dire qu’au moment où vous avez mis en ligne votre texte ou votre image, la tierce partie ait eu le temps de vous copier et de le mettre en ligne pratiquement en même temps. À ce moment-là, peut-être qu’il y aurait un problème à régler.
L’un des problèmes qui peut survenir lors du plagiat de site internet est une question de branding. Bien que Google peut discerner le contenu d’un autre, de dire lequel est arrivé en premier par quelque manière que ce soit, on ne peut en dire autant pour un usager.
Par expérience personnelle, nous avons souvent vus, disons 95 % du temps, du contenu dupliqué se placer en dessous de nos clients dans les résultats de recherches. Le 5 % restant était dû au fait qu'un client avait publié un document dans un journal ou une revue traditionnelle, et quelqu’un l’avait ensuite transcrit sur son site pour le mettre en ligne. Le malfaiteur se retrouvait ensuite premier dans les résultats de recherches puisqu’il avait mis en ligne ce document avant le client. Vous vous demandez peut-être comment nous avons réglé le problème. J’en parlerai plus bas, dans la section « Je suis plagié & je veux agir ».
Google devient de plus en plus intelligent. Mettons-nous dans la position où votre site a été copié et le fautif est plus visible que vous dans les résultats. Ne paniquez pas. Google devient de plus en plus poussé et le but ultime de l'algorithme (depuis la mise à jour Panda) est d'être capable d'agir de manière transparente et continue. Du jour au lendemain, votre compétiteur pourrait tomber dans les abysses.
La méthodologie complète Inbound marketing : téléchargez notre guide maintenant!
Croyez-moi, si quelqu’un utilise votre contenu et se proclame comme le créateur original, vous devriez plus penser à vos droits d’auteurs qu’aux moteurs de recherches.
Prévenir le plagiat de site internet n'est pas si compliqué si vous utilisez des liens canoniques (canonicals). Si vous allez sur des blogues populaires, disons Buzzfeed, Searchengineland ou encore Moz, vous vous rendrez compte qu’ils ont des self-referenced canonical. De par la définition précédente d’un scraper, un lien canonique sera copié avec tout le reste de votre contenu et il y a de fortes chances que le scraper mette en ligne son contenu et, sans le savoir, référence votre lien URL comme la source. Par conséquent, son contenu ne sera pas indexé et votre page originale restera autoritaire. Avis important : assurez-vous de bien implanter les liens canoniques puisque si une erreur se glisse, cela pourrait vous coûter cher.
Plusieurs ressources sur le web vous diront d’utiliser plusieurs méthodes différentes pour arrêter et empêcher les gens d’utiliser votre contenu. Faites attention et renseignez-vous avant de les utiliser si c’est quelque chose que vous voulez entreprendre. Ils vous diront de bloquer le clic droit, d’autres vous diront de cacher votre code source (pour l’amour de Dieu, ne le faites pas, sinon vous disparaîtrez des moteurs de recherches) ou encore protéger vos images. Honnêtement, tout ce que cela fera c’est ralentir les scrapers ou toute autre forme de copieur de prendre votre contenu. S’ils le veulent vraiment, ils trouveront un moyen. À mon humble avis, les ressources dépensées ne valent pas la peine d’empêcher vos usagers d’utiliser des fonctions qu’ils utilisent partout ailleurs pour quelques pommes pourries.
Cette méthode de base est très facile à utiliser. Il ne suffit qu’à prendre un morceau de votre texte, de le copier et d’en faire la recherche sur Google. Vous pouvez le faire avec ou sans guillemets dépendamment de la sorte de plagiat que vous essayez de trouver. Par exemple, pour du contenu copié mot pour mot, vous seriez mieux de mettre votre texte entre guillemets pour faire une recherche en "Exact Quote".
Ensuite, vous aurez donc des résultats que vous pourrez vérifier rapidement avec la Meta Description qui aura le contenu le plus pertinent à votre requête. Faites une lecture rapide, sinon rien ne vous empêche d’aller vérifier chaque URL.
Une méthode efficace qui ne requiert que très peu d’effort de votre part. L’outil que nous recommandons est Copyscape. L’outil semble très simple, très épuré, mais n’en est pas de moins performant. Il y a une version gratuite et, évidemment, vous pouvez acheter des crédits pour l’utiliser un peu plus souvent que la normale. Vous n'avez qu'à prendre l'URL à analyser, et Copyscape vous présentera des résultats en cas où vous êtes plagiés. Cependant, si l'outil vous propose des exemples, analysez-les pour être certain qu'il s'agit bel et bien d'une copie de votre contenu.
Si vous croyez avoir trouvé un Scraper, je vous suggère de rapporter le fait via le Scraper Report de Google. Sinon, si quelqu’un qui vous a copié se positionne en avant de vous, je vous conseille ces étapes :
Personne n'est à l’abri du plagiat, mais nous avons tous les moyens de nous protéger, prévenir et améliorer notre situation. On pourrait argumenter et dire qu'internet aide et facilite le plagiat, mais à l'inverse, les moteurs de recherches deviennent de plus en plus sophistiqués pour contrer cette menace. L'important est de ne jamais agir de façon abrupte, de ne pas paniquer et, au besoin, demander conseil à des professionnels.