Mesure d’audience de site web via Matomo
En 2020, j’ai publié un article intitulé Évolutions de la gouvernance des projets libres. J’en étais plutôt fier, persuadé qu’il allait en faire méditer plus d’un. Pourtant, cet article n’a suscité peu ou prou aucune réaction, et pas le moindre commentaire sur mon site web. Dure déception, j’en suis venu à m’interroger sur l’intérêt de consacrer autant d’énergie à écrire, à ciseler mes articles. Puis, au fil des mois, j’ai croisé de plus en plus de personnes qui l’avaient lu, en avaient pensé le plus grand bien et l’avaient diffusé autour d’elles. Onze mois plus tard, sur un salon professionnel, une connaissance m’a introduit auprès d’une autre personne en disant « Je te présente l’auteur du meilleur blog post de l’année ! » Je ne sais pas si mon article méritait ce qualificatif, mais ce n’est pas le sujet. J’ai réalisé sur ce salon que l’article avait été grandement apprécié et largement diffusé, bien au-delà de mon réseau, sans que je n’en sache rien.
J’aurais bien aimé mesurer l’audience de cet article, savoir combien de personnes avaient lu cette page et les autres de mon site. Mais il n’était pas question pour moi d’installer un mouchard tel que Google Analytics ou autre, je préférais rester dans l’ignorance et faire avec ma frustration.
Fin 2022, tout en me baladant sur les berges du canal du Midi, j’écoutais un podcast de l’émission Libre à vous. Alexandre Bulté, directeur technique d’Etalab, et Ronan Chardonneau, formateur indépendant, échangeaient sur l’analyse d’audience de sites web et Matomo. J’avais vaguement entendu parler de Matomo auparavant, sans vraiment m’y intéresser. Cette émission m’a permis de comprendre que Matomo était une alternative éthique à Google Analytics, qu’il offrait un compromis entre analyse de fréquentation et respect de la vie privée. Cela correspondait exactement à mon attente. Je me fiche en effet éperdument du pédigrée exact de mes visiteurs et de la couleur de leurs sous-vêtements. Je veux juste savoir si mes articles sont lus et lesquels sont les plus consultés. Matomo propose cet équilibre. Il collecte suffisamment d’informations pour pouvoir distinguer les visiteurs et retracer leur parcours du site, sans que ces informations ne permettent d’identifier nommément une personne ou de la géolocaliser avec précision.
Voici les informations que remonte par défaut Matomo sur un visiteur :
- Première moitié de l’adresse IP (i.e. 82.64.0.0 au lieu de 82.64.74.177)
- Pays et ville (France, Toulouse)
- Périphérique utilisé (PC ou smartphone)
- Système d’exploitation (Windows 10)
- Navigateur (Firefox 123)
- Résolution de l’écran (1920x1080)
- Horodate de la visite (samedi 16 mars 2024, 12:41:26)
- Pages consultées et liens sortants sur lesquels l’utilisateur a cliqué
- Origine de la visite (Google)
Cela permet aux auteurs d’affirmer :
« Matomo a également été approuvé par la Commission Nationale de l’Informatique et des Libertés (CNIL) comme l’un des rares outils d’analyse Web pouvant être utilisé pour collecter des données sans le consentement des visiteurs. »
On peut sans doute configurer Matomo et lui ajouter des greffons pour le rendre plus intrusif (auquel cas l’affirmation ci-dessus ne tient plus). En ce qui me concerne, je n’en ai cure. Les informations qu’il me renvoie en l’état me suffisent, elles me permettent de mesurer l’audience de mes articles.
J’ai donc déployé Matomo sur mon serveur en novembre 2022. L’installation a été triviale, sachant que mon serveur satisfaisait déjà tous les prérequis (serveur web, PHP, MariaDB). J’ai ensuite dû injecter quelques lignes de JavaScript dans chaque page de mon site. Là encore, l’opération s’est révélée aisée, puisque mon site est généré statiquement par Jekyll. Je n’ai eu qu’à modifier le fragment HTML constituant le header de toutes les pages. Un pipeline de CI/CD plus tard, le tour était joué.
Au-delà de la mesure d’audience d’un article dans les jours qui suivent sa publication, Matomo me permet aussi de voir quels sont les articles qui intéressent le plus les gens sur une échelle de temps bien plus longue. Cette mesure d’audience ne cesse de me surprendre, car les champions ne sont pas ceux sur lesquels j’aurais parié. Par exemple, au cours des 12 derniers mois, les deux pages les plus consultées de mon site ont été :
- NAS DIY à base de carte Odroid-H3 (21,7 % des visites)
- Consommation électrique d’un serveur NUC Intel (15,8 % des visites)
Je ne m’attendais en outre pas à ce que deux articles seulement engendrent un gros tiers des visites.