Aller au contenu principal
Référencement

Le web analytics soumis au principe d’indétermination d’Heisenberg

Les outils et méthodes employés pour remonter les données Analytics d'un site sont-ils sans impacts sur eux ?

David Patiashvili 7 min de lecture
Illustration : Le web analytics soumis au principe d’indétermination d’Heisenberg
Impactons-nous nos propres statistiques en voulant les analyser ?
Sommaire

    Cela fait déjà pas mal de temps que je souhaitais faire un article sur les systèmes d’analyse de trafic. Que ce soit des outils / services en ligne d’analyse de trafic comme Google Analtyics ou Xiti, ou bien des outils / services en ligne de tracking et de CRM comme HubSpot ou QuantaCast, ces scripts tiers ne sont pas sans impact sur l’analyse en elle-même.

    Le principe d’indétermination d’Heisenberg

    Avant de basculer sur la mise en pratique de ce principe, je vais d’abord essayer de vous expliquer simplement celui-ci.

    Le principe d’indétermination d’Heisenberg (aussi appelé le principe d’incertitude de Heisenberg) énonce le fait qu’observer une particule subatomique, comme un électron, altérera son état. Cela implique que le fait de vouloir relever la vitesse d’une particule impacte cette dernière juste par le fait de l’analyser.

    Pour ceux qui souhaitent avoir plus d’informations sur ce principe, voici quelques liens pour vous aider : Futura Sciences, Nos Pensées, Astronomes ou plus simplement les moteurs de recherche.

    Dans notre vie quotidienne, il est vrai qu’il est difficile de se rendre compte de ce genre de principe. Lorsque vous regardez le compteur de vitesse de votre voiture et qu’il indique 90 km/h, vous pouvez estimer que c’est la bonne valeur.

    Mais un jour l’homme créa Internet

    Le fonctionnement d’une page Web

    Il est vrai que, de nos jours, la navigation sur des sites internet est quelque chose de commun. En tant qu’utilisateurs, nous espérons que le contenu souhaité se charge rapidement et sans difficulté (et accessoirement qu’il corresponde à ce que nous souhaitons et attendons, ce qui est encore une autre histoire).

    Voici une explication simplifiée du processus de chargement d’une page web, qui devrait parler à tout le monde.

    Étape 1 : Récupération de la feuille de route

    Première étape - Chargement du code source
    Le code source de la page

    Première étape, le navigateur charge sa feuille de route. Le code source de la page que vous sollicitez est retourné par le serveur qui l’héberge. Sur cette feuille de route, sont inscrits :

    • Les prérequis et instructions nécessaires au bon assemblage de votre contenu, qui doivent être chargés avant même de commencer à afficher la page. Ces données se trouvent dans la section HEAD du code source d’une page Web.
    • Les instruction d’assemblage à suivre pour que la page Web s’affiche comme souhaité par l’éditeur. Celles-ci se trouvent dans la section BODY du code source d’une page Web.

    Étape 2 : Récupération des prérequis

    Deuxième étape - Mise en place des pré-requis
    Les en-têtes

    Seconde étape, le navigateur va suivre les instructions détaillées dans les prérequis de la feuille de route. Ces prérequis sont souvent :

    • les feuilles de styles, indispensables pour que le contenu soit bien mis en forme et dans les bonnes couleurs ;
    • les divers scripts, nécessaires aussi bien au fonctionnement du site qu’à la publicité et l’analyse (suivi du temps de chargement de la page Web, outils utilisés par l’utilisateur, etc…) ;
    • les métadonnées de la page (titre, description, etc.).

    Tant que toutes les étapes définies dans les prérequis ne sont pas réalisées, la page reste blanche. Pour faire le parallèle avec le montage d’un meuble, disons que tant que vous n’avez pas récupéré tout le nécessaire à son assemblage, celui-ci n’a pas encore commencé à être monté.

    Étape 3 : Suivi des instructions de montage

    Troisième étape : Suivi des instruction de montage
    Le montage

    Dernière étape, le montage de votre page Web avec les ressources déjà récupérées (prérequis) et celles que vous allez récupérer au fur et à mesure (images, vidéos, etc.). En comparaison, lorsque vous construisez une maison, en prérequis vous allez avoir besoin d’un terrain et d’un plan d’architecte. Puis au fil de la construction, les différents corps de métiers vont venir mettre leur touche. Il paraît évident que vous n’avez pas besoin d’un peintre avant que les murs ne soient montés… C’est donc une ressource qui sera appelée plus tard dans le chantier.

    À la fin de ce montage, le curseur de chargement de la page a disparu et celle-ci est entièrement chargée.

    Et le principe d’Heisenberg, où est-ce qu’il se place dans tout cela ?

    L’impact du tracking sur votre page

    Lorsque vous souhaitez remonter des statistiques, via un service en ligne, en intégrant des scripts JS dans votre page, automatiquement vous impactez les valeurs que vous remontez. Et lorsque je parle d’impacter, je veux plutôt dire dégrader.

    Plusieurs sites n’intègrent qu’un seul code tiers, comme celui Google Analytics ou encore de XITI. Dans ce cas, son impact reste minime, mais les données ainsi remontées ne seront pas toujours l’exact reflet du comportement des visiteurs de ces sites. Néanmoins, en partant du principe que l’environnement reste constant (celui du tracking), la comparaison des données reste viable dans le temps. On y croit en tout cas…

    Petit aparté, pendant que je suis sur les données remontées par des services tiers, sachez que celles-ci ne concernent que les utilisateurs qui ont bien chargé le script. Pour ceux qui désactivent le Javascript ou ceux qui ont installé un anti-tracker ou bloqueur de publicité, le service ne les verra tout simplement pas. Ce qui peut, selon le type de site et donc selon le type de visiteur, représenter une proportion non négligeable des résultats. Conclusion : vos données d’analyse sont et seront toujours incomplètes.

    Cet aparté terminé, reprenons. Comme, lorsque vous avez recours au tracking, vous demandez un prérequis additionnel, il faut bien que le navigateur aille charger cette nouvelle ressource. Or, celle-ci a un poids et une latence de chargement fonction du serveur et de la connexion du client, et réalise un traitement supplémentaire sur votre page (sinon cela ne servirait à rien).

    Par ce fait, l’ajout du script impactera automatiquement :

    • le poids total de la page,
    • la vitesse de chargement du site,
    • l’expérience utilisateur.

    Ici, je ne parle que du cas simple du chargement d’un script unique, mais de nombreux sites en intègrent des dizaines. Vous vous demandez peut-être comment il est possible d’avoir des dizaines de scripts traquant les utilisateurs d’une seule et même page ? Eh bien, comme ça :

    • En ayant signé plusieurs partenariats et en permettant à chaque partenaire d’être autonome dans le suivi des données sans passer par l’éditeur (chacun disposant de son propre Google Analytics par exemple). Il faut bien faire de l’argent…
    • En utilisant plusieurs services tiers (CRM) qui nécessitent l’ajout d’un code de tracking chacun pour suivre les conversions (et qui récupèrent, par la même occasion, l’ensemble des informations du navigateur du client, au même titre que Google Analytics). Il faut bien mener des campagnes et les suivre pour faire de l’argent… pourquoi pas ?
    • En insérant des publicités intégrant un script différent - et pas toujours très light malheureusement - pour chaque régie publicitaire. Il faut bien faire de l’argent… encore ??
    • En faisant n’importe quoi. Comment ça ? Certaines sociétés ne prennent même pas la peine de mutualiser leurs codes de tracking. Par exemple, certaines disposant de deux comptes Google Analytics, ajoutent bêtement deux fois la même ressource (c’est un peu comme si on vous donnait deux fois le même tournevis), alors qu’il serait possible de n’en utiliser qu’un seul. Il faut bien aller vite dans les développements pour …

    Petit comparatif simple

    Voici un comparatif GTMetrix simple d’une page d’un site où, dans le premier cas, il n’y a pas de Google Analytics et où, dans le second, nous ne faisons qu’ajouter le script de suivi Google Analytics, sans rien toucher d’autre :

    GTMetrix sans Google Analytics
    Score GTMetrix d'une page sans Google Analytics
    GTMetrix Avec Google Analtyics
    Score GTMetrix de la même page avec Google Analytics

    En les comparant dans les mêmes conditions, nous constatons que la page avec Google Analytics augmente :

    • le temps total de chargement de + 1,6 s,
    • le poids de la page de + 0,10 Mb,
    • le nombre de requêtes de + 4.

    Soit presque 30% de temps en plus juste pour un script qui permet de traquer les visiteurs et leurs comportements sur le site. Imaginez les sites qui en intègrent des dizaines ? Le temps perdu pour les visiteurs en chargement d’éléments non nécessaires au site.

    Que peut-on dire de tout cela ?

    En tant qu’utilisateur final, il faut comprendre qu’à chaque fois que vous naviguez sur un site, vous avez 99% de chance de charger des ressources qui n’ont pas de valeur pour vous mais qui en ont pour l’éditeur. De ce fait, en navigant sur Internet, vous allez nécessairement perdre du temps et du débit (et donc, pour ceux navigant sur un mobile et qui paient au débit, de l’argent).

    Je vous invite, si ce n’est pas déjà fait, à installer sur vos navigateurs des plug-ins qui bloquent une grosse partie de ces ressources “inutiles”: Ghostery, AdBlock, etc. Vous verrez sûrement des pages parfois vides, mais sachez que de nombreux sites n’ont pas vraiment de réel contenu. Ils n’ont parfois que deux paragraphes avec uniquement tout autour des publicités qui habillent la page.

    Pour les éditeurs, je vous conseille de bien réfléchir avant d’ajouter plusieurs scripts tiers, car vous allez impacter votre expérience utilisateur mais également vos propres données. De plus, RGPD oblige, pour chaque script vous devez insérer une section informant les internautes du recours aux cookies et obtenir leur consentement. Cette bannière supplémentaire (fournie par exemple par des prestataires comme QuantCast) va impacter une fois de plus votre expérience utilisateur …

    Le recours à ce type de prestataire pose les mêmes problèmes que l’utilisation de VPN, dont je parlais dans ma précédente publication que je vous invite à lire si ce n’est pas déjà fait ;).

    Partager