Articles

En introduktion till Marimekko, ett diagram med många färger och många namn

Obs: följande är den första delen av en tredelad serie på Marimekko-diagrammet av Tableau Zen-mästaren Jonathan Drummey. Tableau 10 ger dig exakt kontroll över bredden på dina staplar, vilket möjliggör denna nya diagramtyp.

Marimekko designfirma i Helsingfors, Finland exemplifierade den sprudlande och färgstarka designstilen på 1960-talet. byråns livliga tyger och möbler var en favorit bland decenniets djärva och vackra. 1960 kämpade Jackie Kennedy för sin man, John, I Marimekko-klänningar. Marimekko-stilen är fortfarande populär i dag i design och du kan bli förvånad över att lära dig datavisualisering.

ett Marimekko-diagram är ett tvådimensionellt staplat diagram över staplade, sammanhängande staplar—ser något ut som ett Marimekko-Tyg. Marimekko-diagram kombinerar visuell pop med information. Ögat fångar två nivåer av information som den beundrar färgstarka mönster diagrammet skapar.

ett Marimekko-diagram med något annat namn

Marimekko-diagrammet går också under andra namn. Jag har sett det också kallas en mosaik tomt, matrisdiagram, staplade spinogram, spineplot, OS eller ubåt Diagram, en Mondrian diagram, eller till och med förkortas till bara mekko diagram. Och det finns lika många sätt att definiera denna diagramtyp:

  • en kombination av ett 100% staplat kolumndiagram och 100% staplat horisontellt stapeldiagram med en annan variabel för varje
  • ett staplat kolumndiagram med variabel bredd
  • ett sätt att visa del-till-hela relationer över två variabler samtidigt
  • ett sätt att visa frekvenserna för en beredskapstabell där området för varje visad cell är proportionell mot hela
  • Pretty!

vi kallar det Marimekko eftersom det är ett vanligt namn i Tableauvärlden, men mosaic plot är det mer använda namnet. Jag misstänker att anledningen till att Tableau-användare har velat ha det här diagrammet sedan 2009 är att det kombinerar flera variabler av data i en enda rektangel av en plot. Och ”chunking” känns sannolikt effektivare, även när det skapar en mer komplicerad graf som kräver förklaring.

men om du måste förklara hur du läser ett visst diagram för dina användare, är det förmodligen inte ett bra diagram att hålla fast på en instrumentpanel för allmänt bruk (för så mycket som vi försöker skriva instruktioner och skapa länkar till Onlinehjälpguider, hur mycket använder folk dem faktiskt?). Med det sagt kan en mer komplicerad diagramtyp vara ett fantastiskt verktyg för berättande, vilket ses i Hans Roslings TED talk, ”den bästa statistiken du någonsin har sett.”

Marimekko-diagram i verkliga applikationer

Låt mig berätta en historia med ett känt exempel på Simpsons paradox (även känd som Simpson-Yule-effekten). Simpsons paradox är kort sagt där en trend visas i en riktning när vi tittar på data som helhet, och sedan vänder trenden riktningen när vi tittar på grupper av data (eller vice versa).

i början av 1970-talet fanns det en könsförskjutning mot Graduate Division vid University of California Berkeley som anklagade att kvinnor diskriminerades i antagningsprocessen. Sammantaget verkade uppgifterna vara överens. Hösten 1973 fanns det 3 421 kvinnor och 8 442 män antagna, med antagningsgrader på ungefär 35% och 44% vardera:

en grupp UC Berkeley-lärare och personal fick detaljerade antagningsdata och kom till en annan slutsats. Gruppens berömda papper drog slutsatsen att på avdelningsnivå, det fanns en liten men betydande partiskhet i examen antagning i motsatt riktning mot kvinnor.

om vi bryter ner data per avdelning för de sex största avdelningarna kan vi se den olika historien. I fyra av de sex största avdelningarna var det faktiskt en högre andel kvinnor som antogs än män, men för den övergripande acceptansen hade kvinnor en lägre antagningsgrad:

varför den uppenbara paradoxen? Anledningen beror på en dold lurande variabel, i detta fall antalet kvinnor och män som ansöker om varje avdelning. Här är en uppsättning staplade staplar som visar antalet kvinnor och män som ansöker:

det finns många fler män än kvinnor som ansöker till avdelningarna A och B, och det väger resultaten. Att se förhållandet mellan antalet sökande och antagningsgraden i två separata diagram är svårare att reta ut. Det är här Marimekko-tomten kan spela in eftersom det låter oss visa båda åtgärderna på en gång.

antagningsgraden för varje kön och avdelning ligger fortfarande på y-axeln som en 100% staplad stapel och antalet sökande används för att dimensionera varje kolumn. Och i en anda av att gå för det, jag bad om lite hjälp på det visuella. Min kollega och data fashionista Anya A ’ Hearn tillämpade designelement från ett faktiskt Marimekko-tryck för att göra det underbart:

med Marimekko-plottet blir viktningen som skapar Simpsons paradox verkligen uppenbar. I avdelningarna A och B finns det en hög antagningsgrad för båda könen och en mycket större andel manliga sökande. Det drar effektivt upp den totala antagningsgraden för män medan det i andra avdelningar finns en lägre antagningsgrad för män och en jämnare andel manliga och kvinnliga sökande.

Marimekko i Tableau

ovanstående vy är inte ett enda diagram i Tableau. Istället skapas det som en instrumentpanel med olika bilder och text för designelement. Data visas i tre kalkylblad: Huvud Marimekko diagram själv, en andra Marimekko för de totala proportioner, och en tredje kalkylblad att fungera som avdelningshuvudet. En alternativ vy som bara använder två kalkylblad använder en referensrad för att visa de övergripande proportionerna:

Nu när du vet vad en Marimekko är och när den är mest användbar är det dags att börja bygga i Tableau 10. I nästa del av denna serie delar jag stegen för att bygga ett Marimekko-diagram i Tableau. Och i den sista delen kommer jag att täcka några alternativ till Marimekko-diagram som är lättare att bygga.

När han inte skriver Tableau tutorials, erbjuder Jonathan Drummey Tableau konsultation och utbildning på DataBlick. Han är också en Tableau Zen mästare och författare @helpmedatablick Tableau tips för dagen.