Les data en forme

Le 7 novembre 2011

La veille des journalistes de données d'OWNI vous transporte cette semaine d'Espagne en Papouasie-Nouvelle-Guinée, et fait une escale à Neuilly-sur-Seine.

L’Espagne aura l’honneur d’ouvrir le bal de notre veille “data” cette semaine. Non parce qu’elle accueille le G20 de Cannes cette année, mais parce que nous y avons trouvé bonne matière pour lui rendre cet hommage hebdomadaire : Open Data, visualisations et cartographie au menu ibérique.

Mi data es tu data

Datos.gob.es est le portail national qui gère et organise le catalogue de l’information publique de l’Administration générale de l’État”. Il vient d’ouvrir ses portes en version bêta, et permet à ce jour de naviguer dans un peu moins de 500 jeux de données répertoriés dans un catalogue avec l’intention manifeste d’utiliser des formats les plus universels qui soient – enjeu ô combien majeur. Une simple inscription au site permet de réutiliser les données librement et de proposer à la communauté des applications web ou mobile (plus ou moins réussies, c’est le jeu)… mais l’esprit est bien là, pour preuve l’excellent site “La Liste des Courses“, qui inaugure sans aucun doute une longue longue série d’initiatives citoyennes permises par l’ouverture des données.

Label de Cadiz

Le pays du tourisme et de la salade hors-sol ne pouvait décemment pas se priver d’un site haut en couleurs pour vanter le plus vertueux de ses commerces. C’est donc sans surprise que le joli “Tourisme espagnol en chiffres” [es] a vu le jour pour honorer les 60 millions de visiteurs annuels faisant la prospérité (très relative) de nos voisins champions du monde de foot. De très nombreuses visualisations ponctuent d’invisibles jeux de données (on a confiance), et à défaut d’admirer des images dans un taux de compression JPEG digne de ce nom, on doit au moins reconnaître l’exhaustivité du corpus et le gros boulot de création pour mettre en scène la data mêlant paramètres géographiques, économiques, sociaux et humains.

Combien l’Ibère gagne

Beaucoup plus modeste – et pas vraiment en Espagne, diront certains – la petite cartographie réalisée pour visualiser Barcelone sous l’angle des revenus de ses habitants en posant la question de l’impact éventuel des projets d’urbanisme récents. Au-delà de son sens, cette cartographie simple, réalisée avec le Map Maker de Google, est une illustration probante de la volonté d’offrir de nouveaux moyens aux journalistes aujourd’hui, et met le doigt sur l’un des nombreux outils à leur disposition. Cet exercice catalan, par exemple, fut réalisé à l’issue d’un atelier pratique mis en place par Carlos Alonso au sein du media140 [en] l’an dernier – sous le patronage du plus célèbre journaliste de données en Europe, Simon Rogers – en collaboration avec le site Open Data de Barcelone.

Où vivent les riches

Autre usage de Google Map, autre traitement de la data – et toujours dans l’optique de cartographier la société par le biais de la richesse de ces citoyens – l’application “Où vivent les riches ?” répond elle-même à la question sur les 100 premières villes de France (du moins celles de plus de 20 000 habitants pour lesquelles l’exercice est obligatoire, ce qui donne un léger biais à la carte) grâce aux données ISF 2009 du ministère du Budget diffusées par le site Data Publica. Cette carte est l’œuvre de Jean Abbiateci, dont on vous a déjà parlé dans les Data en forme, et, en complément de la carte, on lira l’article méthodologique de Benjamin Gans.

Qui occupe Wall Street

Sans relation – voire : l’infographie “Who’s Occupy Wall Street?” [en] est le résultat d’une étude effectuée par le site occupywallst.org, qui a reçu près de 5 millions de visiteurs uniques entre mi-septembre et fin octobre, et qui a donc sondé 5 000 d’entre eux. Le profil-type qui se dégage de cette dataviz spéciale #OWS : un homme blanc de 25-44 ans, qui possède un emploi plutôt mal payé, ni républicain ni démocrate. Et bien d’autres fioritures, à découvrir dans la méthodologie et dans les détails de cette élégante infographie.

Nous sommes les 99% + 1%

Preuve (s’il en fallait encore une) que le recensement de la population est l’un des domaines de prédilection des manieurs de données les plus créatifs, trois projets ont, cette semaine, attiré particulièrement notre attention et n’auront sans doute pas manqué de flatter la vôtre.

Dans cette première vidéo, “Visualizing How A Population Grows To 7 Billion” [en], Adam Cole et Maggie Starbard de la NPR se sont (sans doute bien) amusés à simuler l’évolution de la population mondiale à l’aide de verres percés et de liquides colorés aux débits calés sur les données de variations démographiques des continents à travers les âges. Le résultat n’est pas seulement compréhensible au premier coup d’œil – première qualité de la représentation de la donnée -, il est également élégant. Tout simplement.

Du coup, cette première vidéo nous a donné envie d’en ressortir une deuxième [en] du placard aux bijoux. Qu’on ait déjà vu ou pas le génial Hans Rosling et son explication de la croissance de la population mondiale (qui s’est tenu en 2010 au TED… de Cannes, vous voyez un peu l’astuce en introduction ci-dessus), le plaisir est toujours là. La datavision, comme nous l’enseigne le maître David McCandless, c’est une belle data, une belle vision, et le talent pour enrober le tout. Et assurément, il faut du talent pour passionner un auditoire avec des boîtes en plastique IKEA.

La dernière application démographique est celle du site “Poor Economics” [en] accompagnant la publication du livre éponyme d’Abhijit Vinayak Banerjee et Esther Duflo – lauréate française de la Médaille Clark, elle aussi habituée des TED Talks. Pour ceux qui connaîtraient et apprécieraient les visualisations un poil technique du département Deprivation and Marginalization in Education de l’Unesco, c’est pareil mais en plus simple et donc en beaucoup mieux. Sur une série de critères de vie quotidienne comme la consommation, la santé, l’éducation ou la micro-finance, les pays en voie de développement sont scrutés et analysés afin de mieux comprendre les besoins de chacun. C’est ainsi qu’on apprend que les habitants ruraux de Papouasie-Nouvelle-Guinée vivant avec 2 à 4 dollars par jour destinent en moyenne 13% de leur budget mensuel à la consommation d’alcool et de tabac (cf. ci-dessous). Face à ce type de données ultra-technique, penser la modélisation est loin d’être aisé : c’est ici brillamment réussi. Et la réalisation en HTML5 plutôt qu’en Flash est la cerise sur le gâteau.

Just do it

Petit coup de cÅ“ur de la semaine pour la jolie bidouille “Dataviz de la primaire socialiste” d’Étienne Côme. Désireux de croiser les data des résultats du 1er tour de la primaire socialiste avec des données socio-géo-démographiques issues de diverses sources pondues par l’Insee et de s’amuser à triturer la librairie Javascript d3 (déjà vue rapidement il y a deux semaines), Étienne a généré quatre visualisations très efficaces sous forme de carto, box plot, treemap et sunburst. Un remarquable ouvrage.


Retrouvez les précédents épisodes des Data en forme !

Laisser un commentaire

Derniers articles publiés