SEO : Générateurs de contenu

Lien naturelVous le savez sans doute déjà si vous vous intéressez au référencement sur le web : pour apparaître dans les premiers résultats des moteurs de recherche, malgré les mises à jour régulières et perfectionnements des moteurs de recherche, l’un des premiers facteurs n’en reste pas moins humain, en l’occurrence la multiplication de liens issus de pages d’influence de qualité en quantité.

Obtenir des liens

Or, pour obtenir des liens en quantité, il faut du contenu original en conséquence, et de préférence du contenu de qualité, à savoir rédigé par des êtres humains, et de préférence de manière à faire ressortir des mots-clés particuliers. Une fois le référencement acquis sur un site, il faut encore en optimiser la redistribution auprès de son réseau de sites interne et de sites amis de contenu connexe ou complémentaire.

Créer des pages

Pour cela, diverses stratégies sont exploitées par les professionnels du référencement, dont voici quelques unes :

  • les annuaires qui proposent à des tiers de fournir du contenu gratuitement en échange de quelques liens vers leur site ;
  • les forums qui proposent à des tiers de produire du contenu gratuitement en échange de la mise en relation avec d’autres intervenants du site ;
  • les dictionnaires (dont encyclopédies et catalogues marchands) qui proposent aux visiteurs de découvrir les définitions de mots, de logiciels et de produits.

Créer un annuaire et le remplir

En matière d’annuaires, il existe de très nombreuses solutions technologiques gratuites et payantes qui permettent à des webmasters d’inscrire leurs sites gratuitement, contre un lien retour, ou contre rémunération. L’un des moyens les meilleurs marché pour remplir des annuaires encore vides est d’aller chercher leur contenu initial sur l’annuaire DMoz qui permet, contre un champ de liens retours, d’exploiter son contenu sur d’autres sites, gratuitement. L’inconvénient est bien entendu que malgré les quelque 200.000 sites référencés, le contenu fourni n’est pas unique. Cependant, avec un peu d’idées et d’astuce, et sous condition d’avoir un peu de temps et des compétences techniques, on peut aisément trouver des moyens d’ajouter à cette base de données des solutions pour enrichir le contenu de base avec du contenu unique, ou du moins rare, rendant l’ensemble original et lui procurer une nouvelle valeur ajoutée. Un exemple ? Proposer des sites connexes avec l’API Amazon Web Search Platform, par exemple, ou encore des captures d’écran des pages d’accueil des sites référencés via Alexa Site Thumbnail.

Créer un forum et le remplir

Dans le domaine de forums, en installant l’une des nombreuses solutions open source ou propriétaires disponibles (et ce ne sont pas les technologies de forums qui manquent !), on peut permettre à divers Internautes de communiquer entre eux, et ainsi créer du contenu original et unique. L’un des inconvénients d’un forum est qu’il est nécessaire, comme pour tout espace communautaire, d’atteindre une certaine masse critique pour intéresser les visiteurs de s’y inscrire. Là aussi, avec un peu de savoir-faire technologique, ou alors en faisant appel à des tiers, on peut trouver la parade. En effet, il existe une foule de forums déjà disponibles sur le Net, généralistes ou spécialisés, et certains proposent des API pour explorer ce contenu. Ainsi, Yahoo! Answers dispose d’une API permettant aux développeurs d’en extraire des conversations en vue de proposer de nouveaux services.

Créer un dictionnaire et le remplir

Pour ce qui est des dictionnaires, quelles qu’en soient les formes, ce n’est pas le contenu qui manque ! Là encore, il est toujours possible d’exploiter une vieille encyclopédie tombée dans le domaine public, mais aussi exploiter les innombrables pages de contenu de la Wikipédia qui est aisément récupérable, et que l’on peut agrémenter de nouvelles entrées, ou encore d’images libres de droits issues de services tiers, telles Flickr via son API. D’autres sources sont aussi disponibles, comme les catalogues d’affiliation disponibles en flux RSS, que l’on peut par exemple accompagner d’avis des Internautes dont on trouvera des références via l’API de Technorati. Certes, le contenu n’est pas unique, mais permet de multiplier des pages au contenu connexe, et à force de croiser des services, on finit par apporter une valeur ajoutée unique.

Service de remplissage automatique au contenu unique

Pour ma part, en ce moment, je fais divers essais de génération de contenu original à base de dictionnaires inspirés de la Wikipédia et de Wiktionnaire et exploitant Story Teller, le générateur d’articles originaux que j’ai développé voici quelque temps.

Dans un premier temps, je rédige un glossaire au contenu thématique et unique dans le but d’exploiter ce glossaire sur divers sites thématiques que j’édite déjà ou qui sont en préparation. Je m’attèle à  rédiger un millier de définitions courtes disponibles sous la forme d’un service web doté d’une API exploitable automatiquement.

L’idée est la suivante : un site demande la définition du terme « mariage » et obtient une définition qui lui sera spécifique et unique, même si cent autres sites demandent eux aussi la définition du même terme « mariage ».

J’entends exploiter ce service en interne, puis éventuellement le proposer comme service payant devant enrichir en contenu des sites tiers. Par la suite, le service pourra être décliné, en plus d’un glossaire qui définit un mot ou une expression en moins de dix phrases, une encyclopédie plus complète, ou encore carrément des discussions de forum uniques prêtes à l’emploi, et toutes originales, voire un annuaire web généraliste ou thématique, lui aussi au contenu unique à chaque fois, etc.

Le but n’est pas de créer des sites par milliers, mais plutôt d’enrichir des sites qui se lancent en leur offrant à moindres frais un contenu ciblé relevant directement de leur thématique. Ainsi, le nouveau site d’une agence matrimoniale pourra enrichir son contenu initial de pages de conseils originaux à moindres frais, une boutique de sport pourra publier des articles de saison qui lui seront spécifiques, et un forum féminin pourra multiplier à loisir les incessantes discussions sur la meilleure manière de perdre du poids, le tout à des prix tout à fait abordables, puisque les frais de création seraient amortis sur l’ensemble des clients du service.

Comments

  1. N’est-ce pas un peu « grey-hat » comme technique de SEO? Dans tous les cas, le visiteur, lui ne sera pas dupe… et risque très vite de se lasser de ces articles « repompés »!

    Enfin, je dis ça, mais je suis sûr que ton appli aura très vite un succès fou!

  2. @Julien : Je note que l’essentiel des sites web actuellement promus dans les premiers résultats de recherche de Google exploitent des techniques similaires, notamment par l’exploitation de dictionnaires sur des sites sans aucun rapport avec la choucroute pour la création de pages satellites bidon.

    Le but ici n’est pas de créer des pages bidon, mais de créer des pages au contenu pertinent unique et bon marché.

    Les visiteurs se lasseront très vite de lire le même contenu, c’est une certitude. Il est clair, pour reprendre l’exemple mentionné précédemment, que publier dix définitions du mot « mariage » sur le même site n’a strictement aucun intérêt. En revanche, en publier une sur dix sites différents, sites relatifs au mariage ou à la rencontre, notamment, a son sens, d’autant si ces définitions n’apparaissent pas isolées, mais accompagnées d’autres informations pertinentes.

    Par exemple, sur ton blog, tu as une certaine quantité de mots-clés (ou tags) que tu peux exploiter pour rechercher des articles. La définition de chaque terme dans les pages de résultats, ou encore la définition de chaque terme au bas des articles pourrait apporter une valeur ajoutée à ton site. Ces définitions permettraient à tes lecteurs néophytes de mieux les intégrer, alors que les lecteurs déjà au courant, que la définition soit unique ou non, les ignoreraient.

  3. Martin Yassine [Référencement Ouest] says:

    Pour ce qui est générer du contenu
    Il est préférable de diffuser des communiqués de presses virtuels (plutôt des communiqués de presse différents pour le même évènement) pour éviter de tomber dans la duplication de contenu.
    Faire comprendre au client que ses partenaires peuvent lui fournir des liens (Fournisseurs, sous traitants…) et qu’il peut même user de sa position de force en tant que client pour obtenir des liens de qualités
    Pour ce qui est des annuaires on oublie souvent les pages jaunes (60 millions de visites par an) bien que les liens ne soient pas pris en compte par les moteurs de recherches.
    Mais pour essayer de boucler le débat sur les annuaires il y a environ 30 annuaires (généralistes) qui d’une part génèrent du trafic mais aussi leur liens vers le site ont une valeur ajouté en thermes de popularité.
    Enfin pour résumer et j’espère que je ne vous apprends rien (la qualité prime sur la quantité)
    PS : je viens de découvrir ce blog (je n’ai pas pu me retenir) bon courage !

  4. @Yassine : J’ai toujours du mal à voir en quoi un client est dans une situation de force du fait qu’il soit client. Dans mon approche des relations commerciales, le client et le fournisseurs procèdent à un échange que chacun considère comme équitable : le client fournit de l’argent avec le fournisseur qui lui fournit en échange un service ou un produit.

  5. Bonjour Martin,

    Je me souviens de ce billet, et j’étais très curieux de savoir ce que ces expérimentations allaient donner.

    Presque un an plus tard, qu’en est-il? Le service de « génération de contenu unique » est-il fonctionnel (en interne), les résultats SEO sont-ils au rendez-vous… et allez-vous le proposer en externe?

    Pour « une certaine catégorie de site », je partage la même vision, et j’ai tendance à vouloir éviter de re-créer ce que d’autres ont déjà (bien) fait!

  6. @Webmaster Code Promo : Je n’ai toujours pas mis en pratique à grande échelle ce générateur de contenu. En effet, je suis assez frileux que les moteurs de recherche n’y voient du spam pur et simple. Aussi, je repousse toujours la mise en pratique de cette solution pas particulièrement qualitative.

  7. Bonjour,
    Vous l’avez souligné, avoir du contenu pertinent est un atout indéniable pour le référencement.
    Or, le contenu peut être également ajouté automatiquement, dans le cas d’un site qui ne bénéficie pas encore de beaucoup de visiteurs.

    Un exemple : GreenIvory.fr a développé MashupXpress, un outil pour dynamiser son site Web. Il va agréger des informations de sources diverses, pour ensuite filtrer puis publier leur contenu sur votre propre site Web.

    Cela permet d’améliorer le référencement : les moteurs de recherches identifient votre site comme étant actif, tout comme les utilisateurs…

    Pour plus d’explications, c’est ici : http://www.greenivory.fr/Produits/MashupXFeed/#mashupxpress

    A bientôt et bonne continuation à votre blog !

  8. Martin Rodger - Décoration africaine says:

    C’est malin d’y avoir pensé. Mais je pense sincèrement pas que cette technique soit efficace pour le positionnement. C’est des pages et donc des liens potentiels en plus. Mais pour le ranking, faut voir.

  9. La technique vise à créer du contenu et des liens. À voir comment ce contenu et ces liens sont créés. Si c’est du contenu bas de gamme, ce qui est habituellement le cas pour ce type de sites, à savoir du contenu généré automatiquement, produisant un langage synthétique, artificiel, ou alors basé sur du contenu dupliqué, en particulier du contenu dupliqué à outrance, alors ces sites seront déclassés des résultats de Google et le poids des liens qu’ils mettent sera annulé. Plus gênant, les sites profitant surtout de liens issus de telles pages peuvent à leur tour être déclassés, voire bannis des résultats de recherche.

    Il faut garder à l’esprit que Google a d’autres moyens d’analyser la réalité d’un contenu et l’aspect « naturel » des liens qu’il comporte. Par exemple, Google Analytics, DoubleClick for Publisher (ou DFP), et autres Google AdSense qui pourraient fleurir sur ces sites, ajoutés par leurs webmasters, ou encore les barres d’outils et autres navigateurs bourrés de spyware (je pense notamment à la Barre d’outils Google) permettent au moteur de recherche d’estimer le volume de visites sur un site web. Si un forum prétendant mille visiteurs chacun ayant posté vingt messages est invisible de tous les radars, que personne n’en parle sur les réseaux sociaux, à savoir qu’il est absent des citations de twitter, facebook, orkut, que personne n’en fait mention sur Gtalk, Google Tchat, aucun email n’en parle sur Gmail et Google Apps, c’est pour le moins suspect, voire carrément douteux.

    Pour autant, certains sites, ciblant la longue traîne, notamment, où la concurrence est faible, et le trafic confidentiel, ciblant une audience faible, mais qualifiée, peuvent gagner à exploiter de telles solutions, pour peu d’y mettre un minimum de travail, et non se contenter de spammer le web à outrance…