Il faut savoir qu’en référençant un site auprès des annuaires, on doit presque toujours fournir une adresse email. Pourquoi ? Certains annuaires s’en servent pour vérifier qu’il y a un être humain derrière la soumission. Certes, on peut se demander pourquoi il y a besoin d’être un être humain pour soumettre un site digne d’intérêt : Google est un parfait exemple de choix de sites par intérêt sans intervention humaine directe. La réponse est simple : le spam. En inscrivant votre site dans un annuaire, nombreux sont ceux qui utilisent ensuite l’adresse fournie pour lui faire parvenir diverses offres promotionnelles sans aucun rapport, en règle générale, avec le centre d’intérêt du site soumis, voire aucun rapport avec le référencement, bien que ce dernier type de courrier indésirable soit majoritaire.
Vous l’aurez donc rapidement compris : il est bon de réserver une adresse email spécifique aux annuaires, et idéalement une adresse email spécifique à chaque site soumis aux annuaires. Fournir une adresse spécifique par soumission serait intéressant pour suivre le trafic des adresses email, mais à part dans ce but, l’intérêt est limité. Bref, créez-vous une adresse email qui recevra du spam… mais pas uniquement.
En effet, certains annuaires vous transmettront un email de validation de la soumission avec un lien à cliquer. Faites-le, à défaut de quoi le responsable de l’annuaire ne visitera pas votre site et par conséquent ne l’inclura pas dans son annuaire. De plus, certains webmasters fournissent les décisions de leur validation : site accepté ou refusé. Si vous savez interpréter cette information automatiquement, cela vous permet de faire diverses statistiques fort intéressantes.
C’est d’ailleurs à partir de ces validations ou refus que j’ai élaborés ces quelques statistiques (en rouge, les refus, en bleu, les acceptations) :
Même si les parts de validation ne tiennent compte que des emails reçus, et que je ne peux garantir qu’ils sont représentatifs de tous les annuaires, y compris ceux qui n’envoient aucun message, il apparaît tout de même que la part des refus d’un site web soumis ne varie pas considérablement selon le site : en moyenne 78 % des soumissions de sites aux annuaires sont validées. Encore faut-il tout de même fournir un titre, une description et une catégorie en rapport avec le site, tout en ne ciblant que des annuaires généralistes ou spécialisés correspondants au site.
je ne sais que penser :
A) d’un côté, l’objectif d’un moteur est de référencer… Pas forcément ‘trier par le filtre de la qualité’. Dans l’éventualité où ce site POURRAIT intéresser quelqu’un, MEME par le biais d’une publicité (plus ou moins) déguisée, il ne la refuseront pas forcément.
B) d’un autre côté, il est vrai qu’un annuaire peu AUSSI servir de premier filtre… ainsi l’on ne sera censé avoir que des annuaires « propres » et « nettoyés » de ces sites MadSense (et un jeu de mot nul, un !)
…toute la difficulté en temps qu’annuaire est de trancher entre un site soit (cas A) ) un minimum informel, ou (cas B) ) réellement à valeur ajoutée…
Ne pourrait on pas conclure que moins de 25% des annuaires (qui ne forment pas un échantillon représentatif) cherche la qualité au détriment de la facilité ?
… et il reste une question en suspens : dans l’hypothèse où la validation n’est pas faite par un stagiaire en week end, mais bien par des gens un minimum compétent, où se situe la limite entre un site acceptable et un site non acceptable ?
En effet, Captain Flam, on pourrait voir ici une espèce de filtre qualitatif. Je demanderai à mes clients si je peux utiliser les chiffres de validation et de refus de leurs sites pour en faire un article ici. En effet, certains sites sont refusés alors qu’ils n’ont rien d’un MFA, même s’ils sont monétisés par la publicité.
Gerant 200 annuaires je peux te dire ceux que je refuse, je vient de refuser une personne qui m’a spamer au moins 50 ndd avec le même scritp sur le site remplie a 90 % de pub et 10 % de contenue. la seul diffrénece entre les sites était le nom de domaine et la couleur du font du site.
Il m’avais tous mis dans la même catégorie sans cherche à cibler. il à perdue du temps pour rien car autant j’aurais put accepter un site mais 50 identiques. :(
Je refuse aussi ceux qui référence toute les pages de leur site, car pour ça il y a le premium.
Je refuse aussi beaucoup ceux qui font 10 fois le même blog avec le même contenue pour que ces blog renvoie du jus à un site principale.
Je refuse systematiquement tous blog qui traite du crédit ou de l’assurance si il n’a pas un nom de domaine et un vrais contenue.
Je refuse et fait chier toute boite de référencement qui vend ces liens 8 euro piéce et qui les place sur mes annuaires. Si il veulent vendent des liens sur mels annuaires qu’ils passe en premium.
D’ailleur avant je validais manuelement les sites qui ne cliquais pas sur le lien retour contenue dans l’email, mais ça prend trop de proportion que je vais les suprimer sans cherche a s’avoir chaque début du mois.
Je pourrais enlever se liens a cliquer mais quand je voie que certain référencement en automatique en validant un site sur 200 annuaires en seulement quelque heures sans même vérifier que tout marche correctement dans leur soumissions j’enrage.
Derniérement une boite de ref à spamé sur les 200 annuaires un site, même titre, même descritpion et même url érroné qui renvoie vers rien. là j’était vert j’ai du tout viré manuelement.
ça me prend du temps c’est vrais mais au moins je me tape pas toute les crottes du net.
« Si vous savez interpréter cette information automatiquement, cela vous permet de faire diverses statistiques fort intéressantes. »
Tres intéressant, j’aimlerai bien connaitre la technique (automatique, hein) pour automatiser ça… J’ai une petite idée pour les types d’annuaires qui envoyes une reponse type mais sur un dev personnel, tu fais comment? curiosité … :)
@Canyon : Pour le suivi des validation de sites dans les annuaires, j’utilise une adresse Gmail ou Google Apps. L’interface de ces outils permettent d’associer des filtres aux emails reçus. Ces filtres permettent notamment d’associer une étiquette spécifique suivant divers paramètres.
En l’occurrence ici, une étiquette validé ou refusé suivant des mots-clés repérés dans les titres ou dans les corps des messages. La plupart des annuaires web exploitent les mêmes solutions logicielles et ne modifient pas leur comportement par défaut. Certains encodent mal les caractères accentués. D’autres modifient quelques mots ci-et-là dans les envois. Il faut donc environ une douzaine de filtres au total pour qualifier l’ensemble des messages reçus, qu’il s’agisse de messages de validation de l’email, de confirmation de validation ou de rejet de la soumission. De tels filtres n’ont besoin d’être créés qu’une seule fois pour toutes, et réutilisés pour l’ensemble des annuaires et l’ensemble des sites que l’on exploite.
Pour ce qui est des annuaires basés sur des scripts spécifiques, peu populaires, voire exploités sur un site en particulier, on notera qu’il n’y a pas non plus une infinité de moyens d’indiquer au webmaster que son site a été validé ou refusé. Certains mots reviennent de manière logique, comme « validé », « ajouté », « félicitations », etc. Au pire, on peut toujours classer les emails reçus à la main si la mise en place de filtres automatiques devait s’avérer inadaptée.
Enfin, pendant ou après la campagne de soumissions, il suffit de faire deux recherches pour faire des statistiques telles que décrites dans le présent message : rechercher tous les messages comportant l’URL du site et l’étiquette validé et une autre avec l’étiquette refusé et le tour est joué.
Sympa ;)
Merci de ta réponse. Je pensais me programmer un truc en ce sens, j’ai pas pensé à l’encodage au retour de mail. Tu parles de Google Apps, mis à part l’api pour « discuter » avec gmail, je vois pas?
@Canyon : Connais-tu Gmail ou Gapps ? (Les deux sont strictement équivalents en termes de fonctionnalités abordées ici.) Si ce n’est pas le cas, je t’invite à l’essayer, tu comprendras mieux.
Il faut en effet savoir que Gmail se distingue de bon nombre de clients mails en cela qu’il ne gère pas de dossiers pour classer les emails, mais des étiquettes. Et il permet d’associer autant d’étiquettes que l’on souhaite à un email. De plus, Gmail permet d’appliquer des filtres aux messages, automatiquement, dès leur réception. Ces filtres permettent de déclencher des actions. Parmi ces actions possibles, tu peux notamment appliquer une étiquette. Tu peux aussi rediriger l’email, ou en envoyer une copie, à une autre adresse.
Aussi, si tu as besoin d’une application entièrement automatique sans te prendre la tête, tu peux tout simplement configurer le compte Gmail où tu reçois les emails issus des annuaires web pour rediriger les emails reçus vers des autresses spécifiques. Par exemple, rediriger les emails d’acceptation vers l’adresse [email protected], les emails de refus vers l’adresse [email protected]. Cela te permettra de bénéficier de l’interface utilisateur de Gmail pour la maintenance des règles de redirection, sans avoir à toucher une ligne de code au niveau de ton script. Ton script n’aura en effet plus qu’à se connecter à ces comptes en POP3 ou IMAP pour relever les messages reçus, mettre à jour ses compteurs, puis effacer les messages comptabilisés du serveur.
De même, on peut cliquer, via le script, sur tous les liens présents dans les emails reçus pour valider d’éventuels liens de validation. Nul besoin d’être un être humain pour cela, mais j’avoue ne pas avoir essayé. Il faudrait s’assurer que les annuaires n’utilisent pas de détection de robots avant de mettre en production des clics automatiques sur les liens de validation…
Bien entendu, l’utilisation de Gmail est une possibilité, certainement pas la seule, et peut-être même pas la meilleure. Cependant, dans le cadre du présent article visant à déterminer le taux de validation, et pour faire des rapports détaillés à mes clients, cette technique de comptabilisation correspond actuellement à mes besoins. En revanche, dans un cadre plus industriel (des centaines ou des milliers de sites à gérer), il est effectivement plus pertinent de développer un script dédié, soit entièrement automatique, soit semi-automatique.
Non, je parlais de gmail qui fait partie des google apps, je voyais pas en fait l’utilité des gapps, maintenant que tu m’en parles, je vais peut être essayer de vaincre les quelques réticences que j’ai vis à vis de GG. Ceci est très intéressant : http://code.google.com/intl/fr-FR/apis/gmail/oauth/