Articles

Eine Einführung in Marimekko, ein Diagramm mit vielen Farben und vielen Namen

Hinweis: Das Folgende ist der erste Teil einer dreiteiligen Serie über das Marimekko-Diagramm des Tableau-Zen-Meisters Jonathan Drummey. Tableau 10 gibt Ihnen eine präzise Kontrolle über die Breite Ihrer Balken und aktiviert diesen neuen Diagrammtyp.

Die Designfirma Marimekko aus Helsinki, Finnland, veranschaulichte den üppigen und farbenfrohen Designstil der 1960er Jahre. Die lebhaften Stoffe und Möbel des Unternehmens waren ein Favorit unter den kühnen und Schönen des Jahrzehnts. 1960 setzte sich Jackie Kennedy in Marimekko-Kleidern für ihren Ehemann John ein. Der Marimekko-Stil ist bis heute im Design und, wie Sie vielleicht überrascht sein werden, in der Datenvisualisierung beliebt.

Ein Marimekko-Diagramm ist ein zweidimensionales gestapeltes Diagramm aus gestapelten, zusammenhängenden Balken – ähnlich einem Marimekko-Gewebe. Marimekko-Diagramme kombinieren visuellen Pop mit Informationen. Das Auge erfasst zwei Informationsebenen, während es das farbenfrohe Muster bewundert, das das Diagramm erzeugt.

Ein Marimekko-Diagramm mit einem anderen Namen

Das Marimekko-Diagramm hat auch andere Namen. Ich habe es auch als Mosaikdiagramm, Matrixdiagramm, gestapeltes Spinogramm, Spineplot, olympisches oder U-Boot-Diagramm, Mondrian-Diagramm oder sogar als Mekko-Diagramm bezeichnet. Und es gibt genauso viele Möglichkeiten, diesen Diagrammtyp zu definieren:

  • Eine Kombination aus einem 100% gestapelten Säulendiagramm und einem 100% gestapelten horizontalen Balkendiagramm mit jeweils einer anderen Variablen
  • Ein gestapeltes Säulendiagramm mit variabler Breite
  • Eine Möglichkeit, Teil-zu-Ganz-Beziehungen über zwei Variablen gleichzeitig anzuzeigen
  • Eine Möglichkeit, die Häufigkeiten einer Kontingenztabelle anzuzeigen, in der die Fläche jeder angezeigten Zelle proportional zum Gesamten ist
  • Hübsch!

Wir nennen es Marimekko, weil dies ein gebräuchlicher Name in der Tableau-Welt ist, obwohl Mosaic Plot der am weitesten verbreitete Name ist. Ich vermute, dass Tableau-Benutzer dieses Diagramm seit 2009 wünschen, weil es mehrere Datenvariablen in einem einzigen Rechteck eines Diagramms kombiniert. Und „Chunking“ fühlt sich wahrscheinlich effizienter an, selbst wenn es ein komplizierteres Diagramm erstellt, das einer Erklärung bedarf.

Aber wenn Sie Ihren Benutzern erklären müssen, wie man ein bestimmtes Diagramm liest, dann ist es wahrscheinlich kein gutes Diagramm, auf einem Dashboard für den allgemeinen Gebrauch zu bleiben (denn so sehr wir versuchen, Anweisungen zu schreiben und Links zu Online-Hilfeanleitungen zu erstellen, wie viel nutzen die Leute sie tatsächlich?). Ein komplizierterer Diagrammtyp kann jedoch ein fantastisches Werkzeug für das Geschichtenerzählen sein, wie in Hans Roslings TED Talk „The Best Stats You’ve Ever Seen.“

Marimekko-Diagramme in realen Anwendungen

Lassen Sie mich Ihnen eine Geschichte anhand eines berühmten Beispiels des Simpson-Paradoxons (auch bekannt als Simpson-Yule-Effekt) erzählen. Kurz gesagt, Simpsons Paradoxon ist, wo ein Trend in eine Richtung erscheint, wenn wir die Daten als Ganzes betrachten, und dann kehrt der Trend die Richtung um, wenn wir Gruppen der Daten betrachten (oder umgekehrt). In den frühen 1970er Jahren gab es eine Gender-Bias-Klage gegen die Graduate Division der University of California Berkeley, in der Frauen im Zulassungsverfahren diskriminiert wurden. Insgesamt schienen sich die Daten zu einigen. Im Herbst 1973 wurden 3.421 Frauen und 8.442 Männer zugelassen, mit Zulassungsraten von jeweils etwa 35% und 44%:

Eine Gruppe von Fakultäten und Mitarbeitern der UC Berkeley erhielt detaillierte Zulassungsdaten und kam zu einem anderen Schluss. Das berühmte Papier der Gruppe kam zu dem Schluss, dass es auf Abteilungsebene eine kleine, aber signifikante Tendenz bei der Zulassung von Absolventen in die entgegengesetzte Richtung zu Frauen gab.

Wenn wir die Daten nach Abteilungen für die sechs größten Abteilungen aufschlüsseln, können wir diese andere Geschichte sehen. In vier der sechs größten Abteilungen gab es tatsächlich einen höheren Frauenanteil als Männer, obwohl Frauen für die Gesamtakzeptanz eine niedrigere Aufnahmequote hatten:

Warum das scheinbare Paradoxon? Der Grund liegt in einer versteckten lauernden Variablen, in diesem Fall der Anzahl der Frauen und Männer, die sich für jede Abteilung bewerben. Hier ist eine Reihe gestapelter Balken, die die Anzahl der Frauen und Männer anzeigen, die sich bewerben:

In den Abteilungen A und B bewerben sich viel mehr Männer als Frauen, und das gewichtet die Ergebnisse. Es ist schwieriger, die Beziehung zwischen der Anzahl der Bewerber und der Zulassungsrate in zwei separaten Diagrammen zu sehen. Hier kann der Marimekko-Plot ins Spiel kommen, da wir beide Takte gleichzeitig anzeigen können.

Die Zulassungsrate für jedes Geschlecht und jede Abteilung ist immer noch auf der y-Achse als 100% gestapelte Balken und die Anzahl der Bewerber wird verwendet, um die Größe jeder Spalte zu bestimmen. Und im Geiste, es zu versuchen, bat ich um Hilfe bei der Grafik. Meine Kollegin und Daten-Fashionista Anya A’Hearn hat Designelemente aus einem tatsächlichen Marimekko-Druck angewendet, um ihn wunderschön zu machen:

Mit dem Marimekko-Plot wird die Gewichtung, die Simpsons Paradoxon erzeugt, wirklich offensichtlich. In den Abteilungen A und B gibt es eine hohe Zulassungsquote für beide Geschlechter und einen viel größeren Anteil männlicher Bewerber. Das zieht effektiv die allgemeine Zulassungsrate für Männer, während in anderen Abteilungen, gibt es eine niedrigere Zulassungsrate für Männer und einen gleichen Anteil von männlichen und weiblichen Bewerbern.

Marimekko in Tableau

Die obige Ansicht ist kein einzelnes Diagramm in Tableau. Stattdessen wird es als Dashboard mit verschiedenen Bildern und Texten für Designelemente erstellt. Die Daten werden in drei Arbeitsblättern angezeigt: das Haupt-Marimekko-Diagramm selbst, ein zweites Marimekko für die Gesamtanteile und ein drittes Arbeitsblatt als Abteilungskopf. Eine alternative Ansicht, die nur zwei Arbeitsblätter verwendet, verwendet eine Referenzlinie, um die Gesamtproportionen anzuzeigen:

Nachdem Sie nun wissen, was ein Marimekko ist und wann es am nützlichsten ist, ist es an der Zeit, mit dem Erstellen in Tableau 10 zu beginnen. Im nächsten Teil dieser Serie werde ich die Schritte zum Erstellen eines Marimekko-Diagramms in Tableau erläutern. Und in der letzten Folge werde ich einige Alternativen zu Marimekko-Diagrammen behandeln, die einfacher zu erstellen sind.

Wenn er keine Tableau-Tutorials schreibt, bietet Jonathan Drummey Tableau-Beratung und -Schulung bei DataBlick an. Er ist auch Tableau Zen Master und Autor des @helpmedatablick Tableau tip of the day.