La dataviz (ou visualisation de données) devrait nous aider à comprendre la pandémie actuelle, mais nous donne-t-elle la bonne version ? Aagje nous fait part de son avis et trie le bon grain de l’ivraie au sujet des visualisations de données, et du manque de maturité des données. Quels enseignements pouvons-nous en tirer ?
Ces derniers mois, nous avons été exposés à toutes sortes de visualisations de données censées nous aider à comprendre l’impact de la pandémie de COVID-19. Des graphiques, tableaux de bord et infographies de toutes sortes nous présentent les faits sous des angles parfois fort différents.
Qualité des données
En Belgique, le débat sur le nombre de cas de COVID-19 rapportés refait surface : faut-il prendre une moyenne sur 7 jours ou les chiffres quotidiens ? En parallèle, des questions se posent quant à la fiabilité et à la fraîcheur des données.
La grande quantité de valeurs « non applicables » est plus préoccupante encore. Nous ne connaissons ni le sexe, ni l’âge de la personne pour près de 28 % des décès. Pour la Flandre, c’est le cas pour plus de 50 % des décès. Nous savons ce qui explique cette situation, mais nous ne sommes pas en mesure de nous attaquer aux causes fondamentales du problème.
Il devient évident que les organisations centrales et locales n’étaient pas prêtes à faire face à cette pandémie du point de vue de la maturité des données.
Défis mondiaux : parlons-nous la même langue ?
Il est aussi apparu clairement que pour être en mesure de créer un graphique permettant de comparer les données de différents pays, il fallait surmonter plusieurs obstacles. Tous les pays ne partagent pas la même définition d’un cas positif, ce qui entraîne des erreurs dans le classement des pays sur la base du nombre de cas positifs ou du taux de mortalité.
Qui plus est, les données ne sont pas toujours disponibles ou exhaustives, car tous les pays ou toutes les régions ne sont pas disposés à partager les données en question ou n’ont pas atteint un niveau de maturité des données suffisant que pour pouvoir récolter et stocker les données.
Évaluation de la maturité des données
Il convient d’évaluer plusieurs fondements de la maturité des données (organisation, disponibilité des données, technologie…). Le résultat de l’analyse peut aider à créer un plan stratégique, afin de pouvoir surmonter les problèmes rencontrés tout au long de cette pandémie.
Car en fin de compte, ces défis ne devraient pas nous empêcher de visualiser les données. Nous devons nous assurer que la visualisation est fiable, par exemple en indiquant clairement les différences au niveau des définitions. Si cette manière de procéder complexifie la visualisation, elle ne devrait pas constituer un obstacle.
Comme l’indique Alberto Cairo dans son livre The Functional Art: An Introduction to Information Graphics and Visualization : « Les graphiques ne doivent pas simplifier les messages. Ils doivent les clarifier, mettre en évidence des tendances, dévoiler des modèles et révéler des réalités jusque-là invisibles ».
Si vous voulez créer un graphique à partir des données relatives au COVID-19, vous pouvez prendre ces points en compte.
Vous désirez en savoir plus sur ce sujet passionnant ?
Contactez-nous dès aujourd’hui !