Le spam, la bête noire de votre site web

Guillaume Viguier-Just
4 min readJun 25, 2013

--

Le spam ou pourriel est la bête noire de tout webmaster qui se respecte. Il est très désagréable de se réveiller un matin et de découvrir que son site web est rempli de commentaires publicitaires avec des liens redirigeant vers d’autres sites, le plus souvent très douteux. Voici un panorama des différentes méthodes de protection pour votre site web.

D’où vient le spam ?

Le spam vient principalement de programmes informatiques qui sont écrits dans le seul et unique but de spammer des sites web afin d’augmenter le nombre de liens redirigeant vers un site web ou un produit en particulier.

Ces robots s’inscrivent sur les sites Internet en remplissant automatiquement des formulaires puis postent automatiquement des centaines, voire des milliers de commentaires dans des forums, sur des articles de blog etc…

Les protections au niveau des formulaires

Les robots qui remplissent automatiquement des formulaires ont quelques caractéristiques qui peuvent les différencier des humains :

  • ils les remplissent bêtement : ils remplissent absolument tous les champs des formulaires
  • ils prennent moins de temps que les humains pour les remplir : le plus souvent, en moins d’une seconde, le formulaire est rempli et envoyé
  • ils sont incapables de lire des images et incapables de réaliser des opérations demandant un minimum d’intelligence

C’est en se basant sur ces caractéristiques que les méthodes suivantes ont vu le jour.

Honeypot

Honeypot est, à la base, un module du CMS Drupal qui :

  • Ajoute un champ caché dans tous les formulaires : les humains, ne voyant pas ce champ, ne le remplissent pas. Les robots par contre le remplissent.
  • Refuse les soumissions trop rapides : les robots, croyant que la soumission a échoué, abandonnent et passent à un autre site web

Cette méthode est très efficace mais surtout, elle ne “ punit “ pas les utilisateurs en les forçant à prouver qu’ils sont humains.

Captcha

Cette méthode est sûrement la plus connue et la plus utilisée : elle consiste à demander aux utilisateurs de prouver qu’ils sont humains, soit en réalisant une opération mathématique simple, en leur posant une question simple ou en leur demandant de recopier des caractères inscrits sur une image.

Bien qu’étant efficace, elle force les utilisateurs à passer une étape de plus avant de pouvoir envoyer leur contenu, sans oublier que de plus en plus, les images des captchas sont de plus en plus difficiles à lire, même pour des humains !

Les protections par services web

Les protections par services web consistent à envoyer le contenu d’un formulaire avant son insertion à un service web afin qu’il l’analyse automatiquement, déterminant ainsi si le contenu est du spam ou non. Plusieurs services de ce type existent, et je ne citerai ici que les principaux. Bien qu’étant très efficace et permettant d’éviter les captchas ou autres techniques punissant l’utilisateur, elles ont le plus souvent, lorsque l’on dépasse un certain niveau de trafic, un coût non négligeable.

Akismet

Akismet propose une offre gratuite pour les sites personnels non lucratifs, ainsi qu’une offre Pro à 5 $ / mois pour les petits sites d’entreprises.

Mollom

Mollom, créé par le fondateur de Drupal, propose une offre gratuite limitée à 50 commentaires légitimes par jour. Vient ensuite une offre “ Mollom Developer “ limitée à 600 commentaires légitimes par jour mais proposée à… 30 € / mois.

Bien que je trouve l’offre “ Mollom Developer “ assez chère, l’idée de faire payer uniquement les commentaires légitimes (l’offre gratuite vous protégera de tout le spam) est excellente.

Stop Forum Spam

Stop Forum Spam n’analyse pas le commentaire des textes, mais les spammers : Stop Forum Spam se base sur une base de données des adresses IP, adresses email et pseudonymes utilisés par les spammers. Si un utilisateur essaye de s’inscrire sur votre site avec une adresse IP, email ou pseudonyme présent dans cette base de données, son inscription est rejetée.

A noter que Stop Forum Spam n’est pas un service ayant un but lucratif, et est donc entièrement gratuit, fonctionnant grâce à des donations.

Les protections serveurs

Bad Behavior

Bad Behavior s’installe au niveau du serveur web et propose une stratégie beaucoup plus agressive envers les spammers. Lorsqu’un spammer est reconnu à travers son adresse IP ou ses headers HTTP, l’accès à votre site lui est tout simplement bloqué.

Le risque est bien entendu, tout comme pour Stop Forum Spam, de bloquer des utilisateurs légitimes, toutefois Bad Behavior leur donne la possibilité de débloquer l’accès au site web protégé en leur demandant de prouver qu’ils sont humains.

Conclusion : s’adapter au développement de son site

Honeypot fonctionnera efficacement sur la majorité des sites ayant peu de trafic, je vous conseille donc de commencer par là. Ensuite, si le besoin se fait sentir, vous pourrez passer à Mollom ou Akismet, suivant le type de site que vous possédez.

Originally published at https://www.gvj-web.com on June 25, 2013.

--

--