Articles

Une introduction à Marimekko, une carte de nombreuses couleurs et de nombreux noms

Remarque: Ce qui suit est le premier épisode d’une série en trois parties sur la carte Marimekko par le maître Zen de Tableau Jonathan Drumley. Tableau 10 vous donne un contrôle précis de la largeur de vos barres, ce qui permet ce nouveau type de graphique.

La firme de design Marimekko d’Helsinki, en Finlande, a illustré le style de design exubérant et coloré des années 1960.Les tissus et les meubles vifs de la firme étaient un favori parmi les plus audacieux et beaux de la décennie. En 1960, Jackie Kennedy a fait campagne pour son mari, John, en robes Marimekko. Le style Marimekko reste populaire à ce jour dans le design et, vous serez peut-être surpris de l’apprendre, dans la visualisation de données.

Un diagramme de Marimekko est un diagramme empilé en deux dimensions de barres empilées et contiguës – ressemblant un peu à un tissu de Marimekko. Les graphiques Marimekko combinent pop visuelle et informations. L’œil capture deux niveaux d’informations en admirant le motif coloré créé par le graphique.

Un graphique de Marimekko sous un autre nom

Le graphique de Marimekko porte également d’autres noms. Je l’ai vu aussi appelé un tracé en mosaïque, un graphique matriciel, un spinogramme empilé, un spineplot, une carte olympique ou sous-marine, un diagramme de Mondrian, ou même raccourci en graphique mekko. Et il y a autant de façons de définir ce type de graphique:

  • Une combinaison d’un graphique à colonnes empilées à 100% et d’un graphique à barres horizontales empilées à 100% en utilisant une variable différente pour chaque
  • Un graphique à colonnes empilées à largeur variable
  • Une façon d’afficher des relations parti-entières sur deux variables à la fois
  • Une façon d’afficher les fréquences d’un tableau de contingence où la surface de chaque cellule affichée est proportionnelle à l’ensemble
  • Jolie!

Nous l’appellerons Marimekko parce que c’est un nom commun dans le monde Tableau, bien que mosaic plot soit le nom le plus utilisé. Je soupçonne que la raison pour laquelle les utilisateurs de Tableau souhaitent ce graphique depuis 2009 est qu’il combine plusieurs variables de données en un seul rectangle d’un tracé. Et le « découpage » semble probablement plus efficace, même lorsqu’il crée un graphique plus compliqué qui nécessite des explications.

Mais si vous devez expliquer comment lire un graphique donné à vos utilisateurs, ce n’est probablement pas un bon graphique à coller sur un tableau de bord à usage général (car autant nous essayons d’écrire des instructions et de créer des liens vers des guides d’aide en ligne, combien les gens les utilisent-ils réellement?). Cela dit, un type de graphique plus compliqué peut être un outil fantastique pour la narration, comme on le voit dans la conférence TED de Hans Rosling, « Les meilleures statistiques que vous ayez jamais vues. »

Graphiques de Marimekko dans des applications du monde réel

Laissez-moi vous raconter une histoire en utilisant un exemple célèbre du paradoxe de Simpson (également connu sous le nom d’effet Simpson-Yule). En bref, le paradoxe de Simpson est celui où une tendance apparaît dans une direction lorsque nous regardons les données dans leur ensemble, puis la tendance s’inverse lorsque nous regardons des groupes de données (ou vice versa).

Au début des années 1970, il y a eu un procès pour préjugés sexistes contre la Division des diplômés de l’Université de Californie à Berkeley, accusant les femmes d’être discriminées dans le processus d’admission. Dans l’ensemble, les données semblaient concorder. À l’automne 1973, il y avait 3 421 femmes et 8 442 hommes admis, avec des taux d’admission d’environ 35% et 44% chacun:

Un groupe de professeurs et de membres du personnel de l’UC Berkeley a obtenu des données détaillées sur les admissions et est arrivé à une conclusion différente. Le célèbre article du groupe a conclu qu’au niveau du département, il y avait un biais faible mais significatif dans les admissions aux cycles supérieurs dans la direction opposée aux femmes.

Si nous décomposons les données par département pour les six plus grands départements, nous pouvons voir cette histoire différente. Dans quatre des six départements les plus importants, il y avait en fait une proportion plus élevée de femmes admises que d’hommes, bien que pour l’acceptation globale, les femmes avaient un taux d’admission inférieur:

Pourquoi ce paradoxe apparent? La raison est due à une variable cachée, dans ce cas le nombre de femmes et d’hommes qui postulent dans chaque département. Voici un ensemble de barres empilées qui indiquent le nombre de femmes et d’hommes qui postulent:

Il y a beaucoup plus d’hommes que de femmes qui postulent aux départements A et B, ce qui pondère les résultats. Il est plus difficile de déterminer la relation entre le nombre de candidats et le taux d’admission dans deux graphiques distincts. C’est là que l’intrigue de Marimekko peut entrer en jeu car elle nous permet d’afficher les deux mesures à la fois.

Le taux d’admission pour chaque sexe et département est toujours sur l’axe des ordonnées sous forme de barres empilées à 100% et le nombre de candidats est utilisé pour dimensionner chaque colonne. Et dans l’esprit d’y aller, j’ai demandé de l’aide sur les visuels. Ma collègue et fashionista des données Anya A’Hearn a appliqué des éléments de design à partir d’une impression Marimekko réelle pour la rendre magnifique:

Avec l’intrigue Marimekko, la pondération qui crée le paradoxe de Simpson devient vraiment apparente. Dans les départements A et B, il y a un taux d’admission élevé pour les deux sexes et une proportion beaucoup plus importante de candidats masculins. Cela tire effectivement vers le haut le taux d’admission global pour les hommes alors que dans d’autres départements, il y a un taux d’admission inférieur pour les hommes et une proportion plus égale de candidats masculins et féminins.

Marimekko dans Tableau

La vue ci-dessus n’est pas un seul graphique dans Tableau. Au lieu de cela, il est créé comme un tableau de bord avec diverses images et du texte pour les éléments de conception. Les données sont affichées dans trois feuilles de calcul: le graphique principal de Marimekko lui-même, un deuxième Marimekko pour les proportions globales et une troisième feuille de travail pour servir d’en-tête de département. Une vue alternative qui n’utilise que deux feuilles de calcul utilise une ligne de référence pour afficher les proportions globales :

Maintenant que vous savez ce qu’est un Marimekko et quand il est le plus utile, il est temps de commencer à construire dans Tableau 10. Dans le prochain épisode de cette série, je partagerai les étapes de la création d’un graphique Marimekko dans Tableau. Et dans la dernière tranche, je vais couvrir quelques alternatives aux cartes Marimekko qui sont plus faciles à construire.

Lorsqu’il n’écrit pas de tutoriels Tableau, Jonathan Drumley propose des conseils et des formations Tableau chez DataBlick. Il est également maître Zen de Tableau et est l’auteur de l’astuce Tableau du jour @helpmedatablick.