La plus connue des formes de spam est le pourriel (par contraction des termes poubelle et courriel, ce dernier étant la contraction des termes courrier électronique), ou le spam véhiculé par le courrier électronique. C’est aussi l’une des formes de spam les plus anciennes. Le pourriel vise les utilisateurs d’emails, à savoir à peu près tous les Internautes du monde, dont le nombre avoisine actuellement environ 1 milliard d’utilisateurs.
Mais il existe diverses autres formes de spam ciblant les sites web en général et les blogs en particulier :
- le spam des commentaires ;
- le spam des rétroliens ;
- le spam des référants.
Spam des commentaires
L’idée de polluer les commentaires des blogs vise à accroître la visibilité d’un produit en générant des commentaires accompagnés de liens vers un ou des sites externes. Ces commentaires sont généralement générés automatiquement et visent à accroître le trafic, d’une part, depuis les sites ainsi pollués et, d’autre part, depuis les moteurs de recherche qui tiennent compte du nombre de liens menant vers une page web pour en estimer la popularité ou la pertinence.
Le spam des commentaires des blogs est souvent combattu avec des CAPTCHA graphiques, mécanismes demandant à l’utilisateur humain d’entrer une valeur affichée sous la forme d’une image généralement déformée ou brouillée, afin de rendre difficile l’identification par un automate. Certaines plateformes, afin de faciliter l’accessibilité aux personnes non ou mal voyantes, proposent aussi des versions audio ou encore des énigmes de logique aux utilisateurs. Il existe diverses autres moyens de lutte contre le spam des commentaires. Dans tous les cas, il s’agit de s’assurer que le commentaire laissé n’est pas issu d’un robot spammeur, mais d’un utilisateur légitime.
Les moteurs de recherche ont proposé aux blogueurs l’emploi de l’attribut nofollow dans les liens générés par des tiers sur des sites web afin de réduire l’impact du spam sur la pertinence de leurs résultats de recherche et limiter l’engouement des spammeurs pour le spam des commentaires. En somme, les commentaires peuvent être accompagnés de liens vers le site de leurs auteurs, mais ces liens ne sont pas pris en considération par les moteurs de recherche. L’impact sur le spam de cet attribut semble avoir été réduit sur les moteurs de recherche, mais ne semble pas pour autant avoir freiné les spammeurs.
Spam des rétroliens
La pollution par spam des rétroliens est sensiblement la même que celle des commentaires. Un rétrolien est tout simplement un commentaire généré par un site externe. En somme, lorsqu’un blog fait référence à un autre article de blog, il prévient l’article ainsi cité. Ce dernier, par courtoisie, et pour permettre aux lecteurs d’approfondir le sujet, affiche ainsi les liens vers les pages qui le citent.
Le souci est que le mécanisme est à l’origine entièrement automatique, du moins dans sa forme la plus commune et la plus souple, et que s’il apporte une véritable valeur ajoutée aux lecteurs, il est du pain béni pour les spammeurs. En effet, pour garder le mécanisme automatique, il n’est plus possible de proposer un CAPTCHA sur les rétroliens. Les mécanismes anti-spam de rétrolien s’appuyent donc sur des listes noires d’adresses IP de spammeurs, de serveurs ouverts, la pertinence des pages ainsi proposées ou le contenu des extraits proposés à la publication.
Spam des référants
Enfin, le spam des référants consiste à faire croire à un site web, tel un blog, qu’il reçoit des visiteurs depuis un autre site web. En effet, par convention, les navigateurs web indiquent lors du chargement d’une page web la page web qui les y a menés. Cette information est utilisée par les webmasters pour connaître la provenance de leurs visiteurs et donc mieux cibler leurs campagnes de promotion.
Certains webmasters, par fierté ou bien par désir de partager ces informations avec les visiteurs (après tout, un visiteur qui envoie des visiteurs est un site web digne d’intérêt !), publient les référants sur des pages publiquement accessibles. Or, comme nous l’avons déjà vu, les moteurs de recherche comptabilisent les liens entre les pages web pour déterminer la popularité ou la pertinence d’une page web. Du coup, les spammeurs polluent les sites web de référants falsifiés en espérant attirer de nouveaux visiteurs via, d’une part, les pages de statistiques publiques de certains sites web et via, d’autre part, les moteurs de recherche qui mettent en avant alors leurs pages.
Conclusion
Pour mieux combattre un ennemi, il faut apprendre à le connaître. Ici, nous venons d’identifier les trois principales formes de spam touchant les blogs. Maintenant que nous connaissons les centres d’intérêt des spammeurs, nous pouvons envisager de protéger nos blogs.
Le spam de retroliens est tellement important sur mon blog que j'ai décidé de bloquer les trackback (retroliens). C'est pas trop pénalisant pour un blog intimist, bcp plus pour un blog expert je pense. D'ailler je n'ai pas appliqué cette manipulation sur mon blog expert. Le spam par reférant est également trés chiant. Le filtrage est toujours possible, soit pas un plugin, soit par un robot.txt bien fait (le mien comporte une centaine de ligne), soit encore par des expréssions réguliéres dans la configuration apache (jamais tenté pour ma part). En ce moment je constate bcp de spam référant effectué par des navigateurs maxton, je pense qu'un virus ou spyware est en cause.
Je confirme, sheepyr, les rétroliens sont très peu utilisés sur les blogs grand public, alors que sur les blogs relatifs au web ou à la technologie, les rétroliens sont plus exploités.
Note cependant que les spammeurs se moquent du fichier robots.txt pour la plupart. Pour ma part, je bloque le spam par référents via des expressions rationnelles Apache, ainsi que par blocage des adresses IP m'envoyant du spam au niveau du pare-feu du serveur.
Aidez moi car je souffre de ces spams qui m’adresse le même commentaire (environ 50 par jour) pour réagir a un article sur mon blog,
Merci pour votre soutien
@Nad : Il existe deux possibilités principales. Tout d’abord, installer et configurer une solution anti-spam. Sous WordPress, la plus connue est Akismet. Elle est payante, sur abonnement, pour toute utilisation autre qu’un blog personnel dépourvu de publicité ou d’intention commerciale. Il en existe d’autres. Ensuite, tu peux probablement fermer les commentaires de l’article spammé. Cela est possible dans l’écran d’édition de l’article dans WordPress. Si tu utilises une autre plateforme de blogging, consulte sa documentation et les forums officiels.