Types de mesures d’audience d’un site web

Mesure d’audience site-centric

Présentation

Les mesures d’audience site-centric se focalisent sur les sites web eux-mêmes. Le trafic d’un site est mesuré par le site lui-même, ou bien par un marqueur tiers ajouté aux pages web du site.

Avantages

Le serveur web qui sert le contenu aux utilisateurs est le plus à même de savoir ce qu’il a servi. Il maîtrise en effet l’ensemble des données qu’il sert. De plus, les journaux d’accès du serveur web sont un excellent outil d’analyse de l’activité des robots d’indexation des moteurs de recherche, ou bien encore de l’utilisation de la bande passante utilisée par le site.

Inconvénients

Ce n’est pas parce qu’une ressource a été servie par le serveur qu’elle a été reçue par le client. De plus, il est très difficile d’identifier avec précision un même utilisateur. En effet, l’adresse IP et les cookies généralement employés pour ce faire ne sont pas des garanties suffisantes quant à l’identité d’un visiteur. Par ailleurs, certains systèmes confondent certains robots automatisés avec des utilisateurs humains.

De plus, les webmasters ayant plein pouvoir sur les données à l’origine des analyses, ils peuvent les manipuler. Cela peut se faire notamment en dupliquant les données de fréquentation, en ajoutant plusieurs marqueurs sur une même page (notamment via des pages avec frames ou cadres) ou en forçant un rafraîchissement intempestif des pages.

Exemples

Parmi les solutions de mesure d’audience site-centric, on notera plusieurs outils d’analyse de journaux d’accès du serveur web. Parmi ceux-ci, citons :

  • AWStats est un outil open source assez simpliste qui par ailleurs a tendance à surestimer les visiteurs en comptabilisant parmi les visiteurs légitimes de nombreux robots d’indexation automatisés. Il nécessite cependant peu de ressources machine et s’intègre à une très vaste majorité d’environnements.
  • Urchin est un excellent outil commercial de mesure d’audience et d’analyse de fréquentation d’un site web avec des modules additionnels permettant en outre une analyse du comportement des consommateurs plus poussée. Cet outil est aussi disponible en tant que service gratuit sous l’appellation Google Analytics.
  • Webalizer qui est un outil open source de mesure d’audience relativement complet, mais ayant la réputation d’être assez lourd en ressources système.

De plus, il existe divers services tiers de mesure d’audience par marqueur à placer sur toutes les pages du site web, dont :

  • Google Analytics est un service gratuit jusqu’à 5 millions de pages vues par mois sans imposer de publicité ni logo sur les sites mesurés. Les statistiques fournies sont très complètes et intègrent le comportement des utilisateurs sur le site, ou bien encore le suivi des campagnes marketing.
  • Médiamétrie-eStat est un service commercial de mesure et d’analyse d’audience d’un site web.
  • Xiti qui est un service commercial qui existe aussi en version gratuite en échange de l’affichage d’un logo, sans afficher d’autre publicité. Les statistiques proposées sont très complètes.

Mesure d’audience user-centric

Présentation

Les mesures d’audience user-centric se focalisent sur les utilisateurs. Un panel d’utilisateurs installe un logiciel de type mouchard qui suit leurs déplacements sur le web.

Avantages

Le système étant centré sur l’utilisateur, c’est ce que l’utilisateur voit réellement qui est comptabilisé. L’utilisateur étant généralement clairement identifié, le panel suivi comporte par ailleurs des données démographiques pertinentes, telles que le sexe, l’âge, le lieu de résidence, ou bien encore les revenus de l’utilisateur. Ces données sont donc particulièrement précieuses pour une étude marketing poussée.

Inconvénients

Pour être représentatifs, les panels d’utilisateurs se doivent d’être larges et représentatifs de la population. Or, la distribution des mouchards (généralement sous la forme de barres d’outils) n’est pas toujours homogène et certaines tranches de la population d’Internautes sont parfois sur- ou sous-estimées. Sur les services américains, notamment, les populations hors Etats-Unis sont souvent sous-représentées, voire même occultées, et les données concernant les sites non anglophones sont par conséquent peu pertinentes. Ces panels sont souvent trop faibles pour suivre avec précision des sites ayant une audience moindre, attirant moins de 100.000 visiteurs uniques par mois.

Par ailleurs, il n’est pas si évident d’identifier clairement un utilisateur. En effet, un même ordinateur est souvent utilisé par plusieurs personnes et toutes ne disposent pas d’un compte utilisateur distinct des autres utilisateurs de la machine. Ainsi, dans un foyer comportant deux parents avec leurs deux enfants, il n’est donc pas évident d’identifier à coup sûr chacun des utilisateurs.

Enfin, ces panels occultent souvent certaines tranches de la population, comme les utilisateurs de certains navigateurs (la barre d’outils Alexa ne supporte par les navigateurs Firefox, Safari ou Opera) ou de certains terminaux Internet (les téléphones portables ou les consoles de jeux vidéo sont occultés). Certains lieux d’accès à Internet ne sont pas non plus pris en compte (comme les installations militaires, les administrations, les écoles, les universités, les cafés-Internet, etc.)

Exemples

Plusieurs services exploitent ce type d’outil, parmi lesquels :

  • Alexa permet de connaître gratuitement la fréquentation des sites sur la base des millions d’utilisateurs de la barre d’outils Alexa pour navigateurs Internet Explorer.
  • Comscore propose à ses clients une analyse d’audience de sites web basée sur un panel d’un million de résidents étatsuniens.
  • Médiamétrie utilise un panel de 7.000 Internautes résidant en France dans ses publications concernant le web français.

Mesure d’audience network-centric

Présentation

Les mesures d’audience network-centric se focalisent sur le réseau. Les FAI proposent une analyse du trafic occasionné sur leur réseau par leurs clients.

Avantages

L’analyse d’audience des données issues des FAI a l’avantage d’étudier un très large panel d’utilisateurs, qu’il est par conséquent difficile de biaiser. Les données sont donc relativement fiables.

Inconvénients

Si l’on veut connaître avec précision l’ensemble du trafic d’un site web, il faut étudier des données issues de plusieurs FAI et ce, dans plusieurs pays. Or, la plupart du temps, les services analysant l’audience par l’étude des données réseau se limitent à quelques FAI, essentiellement étatsuniens. L’audience analysée est par conséquent partielle.

Par ailleurs, une partie des visites échappe à l’analyse réseau du FAI. En effet, l’utilisation d’un serveur mendataire (ou proxy) sur un réseau local permet à plusieurs utilisateurs locaux de consulter un site web pour une seule requête émise, faussant ainsi les consultations réelles.

Exemples

Parmi les services proposant une analyse de fréquentation sur la base du trafic réseau, notons :

  • Hitwise propose à ses clients une analyse du trafic d’un site ou d’un panel de sites (parmi 800.000 sites suivis) d’après des données récoltées auprès des FAI.

Mesure d’audience hybride

Présentation

Certains services, conscients des limitations de chacune des méthodes de mesure d’audience et de trafic des sites web, ont opté pour des solutions hybrides, à savoir un mélange de plusieurs sources et de méthodes pour étoffer leurs bases de données de fréquentation des sites.

Avantages

En multipliant les sources et les méthodes de mesure d’audience, celles-ci sont d’autant plus fiables.

Inconvénients

Généralement, l’emploi de méthodes diverses laisse supposer des carances existantes au niveau de chacune des sources, plutôt qu’une exhaustivité des données. Une analyse plus approfondie des données permet alors de valider ou d’invalider leur pertinence.

Exemples

Il existe par ailleurs des services faisant appel à diverses sources de mesures d’audience. Parmi eux :

  • Compete propose des rapports d’audience des sites web sur la base des deux millions d’utilisateurs de la barre d’outils Compete (user-centric), ainsi que des données issues des FAI (network-centric).
  • Quantcast propose des données issues de mesures par marqueur (site-centric) ou encore issues des FAI (network-centric).

Conclusion

Sur des sites de taille modeste, avec moins de 100.000 visiteurs uniques mensuels, la meilleure source d’informations semble être une mesure d’audience site-centric, de préférence réalisée à l’aide d’un marqueur tiers auprès d’un service digne de confiance. En effet, les panels d’utilisateurs (user-centric) sont souvent trop restreints pour prendre en compte la fréquentation réelle du site. Si le site vise une tranche particulière de la population, il est possible qu’une analyse du trafic réseau auprès des FAI (network-centric) occulte totalement les consultations réelles des visiteurs.

Sur des sites de taille moyenne, avec moins de 1 million de visiteurs uniques mensuels, il est utile de croiser les informations site-centric avec des informations user- et/ou network-centric afin d’avoir une bonne vue d’ensemble. L’intérêt d’un panel d’utilisateurs permettra en effet de qualifier le profil-type des Internautes, notamment leur âge, leur sexe, ou bien encore leurs méthodes de consommation et leurs revenus. Des données site- et network-centric permettront de compléter l’étude avec des données quantitatives plus précises.

Sur des sites de taille plus imposante, les trois méthodes paraissent pertinentes. L’usage d’une méthode à base de panel d’utilisateurs permettra en outre de qualifier les visiteurs, et de récolter des informations marketing très utiles pour un site commercial désireux de connaître ses clients ou pour un site d’informations désireux de connaître ses utilisateurs afin de démarcher des annonceurs.

Comme vous le constatez, il n’existe pas de système idéal pour mesurer l’audience d’un site web. Pour s’assurer d’une estimation juste, autant quantitative que qualitative, il convient alors d’utiliser plusieurs sources de données et de croiser des informations pertinentes pour valider leur cohérence.

Comments

  1. Alors personnelement pour les statistiques je ne jure QUE par phpmyvisite. C'est gratuit , libre , et ça dispose d'une communauté trés active. 

  2. Attention aux panels de Mediametrie en France, cela peut être du grand n'importe quoi : Habbo.fr sort à 695.000 navigateurs uniques par mois (mesuré via des cookies par Nielsen) quand, sur le même mois, Mediametrie dit avoir comptabilisé 39.000 Visiteurs Uniques via ses panels.  => les données panels sont à manier avec grande précaution, car, dans notre cas, elles sont plus qu'erronées.

  3. Nawak, je trouve intéressant que tu privilégies phpMyVisites pour des raisons certes multiples, mais qui n'incluent pas la pertinence des résultats, puisque tu as omis ce critère qui paraît pourtant essentiel dans le domaine de l'analyse d'audience d'un site web.

    Pour ma part, pour mesurer l'audience de mes sites web, je me fie essentiellement à Google Analytics pour des raisons de pertinence (l'outil fournit des informations exhaustives et cohérentes) et de tarification (gratuit). Par ailleurs, sur l'un de mes sites, j'utilise en même temps plusieurs outils de mesure d'audience :

    1. Google Analytics (gratuit, marqueur JavaScript externe) ;
    2. Xiti (version gratuite, marqueur JavaScript externe et image) ;
    3. Quantcast (gratuit, version avec marqueur JavaScript externe)
    4. Webalizer (analyse du journal d'activité du serveur web) ;
    5. compteur des publicités affichées de la régie publicitaire Oxado que j'utilise sur ce site-là.

    J'aurai l'occasion de couvrir ce sujet plus en profondeur dans un article de comparaison de ces divers outils de mesure et d'analyse d'audience.

    JB, j'ai l'impression que les analyses d'audience de Médiamétrie France sont essentiellement aléatoires, tout comme l'ensemble des analyses d'audience de sites web basés sur des panels d'utilisateurs.

    Dans le cadre des analyses d'audience d'Alexa, par exemple, une comparaison des résultats entre l'audience mesurée par l'outil user-centric d'Alexa, ainsi que les mesures effectuées par des outils server-centric montrent une différence présentant un rapport 130 entre les deux méthodes. Cela montre bien que les chiffres fournis par Alexa ne sont pas cohérents par rapport à d'autres outils.

    Pour en revenir plus généralement aux outils user-centric, on peut les comparer aux sondages d'opinion politiques qui eux aussi se basent sur les personnes (interrogées sur leurs opinions politiques ou leurs intentions de vote). Ceci étant, les sondages utilisent non seulement des personnes sensées être représentatives d'une population, mais en plus, les réponses des personnes interrogées sont pondérées avec les résultats des votes précédents. En effet, les réponses aux sondages diffèrent aux votes effectués anonymement. Si nous nous sentions traqués, visiterions-nous les mêmes sites web ? Par ailleurs, qui accepterait de se faire suivre clic après clic ?

    La seule fois où je l'accepte, c'est en parfaite connaissance de cause : pour manipuler les résultats. C'est pour cette raison que j'avais installée la barre d'outils Alexa et que comme par hasard tous les webmasters désireux de promouvoir leur site sur Alexa (chiffres utilisés par certaines régies publicitaires pour déterminer le tarif des espaces publicitaires sur ces sites web), essentiellement des sites web technologiques, à savoir gérés par des personnes très au courant des dessous du fonctionnement de ces outils, apparaissent parmi les plus visités du web, malgré quelques 2 millions de barre d'outils Alexa estimées installées…

    Bref, je n'ai vraiment aucune confiance dans les outils de mesure d'audience user-centric… Et je ne m'étonne pas d'une différence aussi flagrante.

Speak Your Mind

*

Ce site utilise Akismet pour réduire les indésirables. Apprenez comment les données de vos commentaires sont utilisées.