En introduktion til Marimekko, et diagram med mange farver og mange navne
Bemærk: følgende er den første rate af en tredelt serie på Marimekko-diagrammet af Tableau mester Jonathan Drummey. Tableau 10 giver dig præcis kontrol over bredden af dine søjler, så denne nye diagramtype.
designfirmaet Marimekko i Helsinki, Finland eksemplificerede den sprudlende og farverige designstil fra 1960 ‘ erne. firmaets levende stoffer og møbler var en favorit blandt årtiets dristige og smukke. I 1960 kæmpede Jackie Kennedy for sin mand, John, i Marimekko kjoler. Marimekko-stilen forbliver populær den dag i dag inden for design, og du kan blive overrasket over at lære i datavisualisering.
et Marimekko-diagram er et todimensionelt stablet diagram af stablede, sammenhængende stænger, der ligner et Marimekko—stof. Marimekko diagrammer kombinerer visuel pop med information. Øjet fanger to niveauer af information, da det beundrer det farverige mønster, diagrammet skaber.
et Marimekko-diagram med ethvert andet navn
Marimekko-diagrammet går også under andre navne. Jeg har set det også kaldet en mosaik plot, matrice diagram, stablet spinogram, spineplot, olympisk eller ubåd Diagram, en Mondrian diagram, eller endda forkortet til bare mekko diagram. Og der er lige så mange måder at definere denne diagramtype på:
- en kombination af et 100% stablet søjlediagram og 100% stablet vandret søjlediagram ved hjælp af en anden variabel for hver
- et stablet søjlediagram med variabel bredde
- en måde at vise del-til-hele relationer på tværs af to variabler på en gang
- en måde at vise frekvenserne for en beredskabstabel, hvor området for hver vist celle er proportional med hele
- smuk!
vi kalder det Marimekko, fordi det er et almindeligt navn i Tableau-verdenen, selvom mosaic plot er det mere udbredte navn. Jeg formoder, at grunden til, at Tableau-brugere har ønsket dette diagram siden 2009, er, at det kombinerer flere variabler af data i et enkelt rektangel af et plot. Og” chunking ” føles sandsynligvis mere effektiv, selv når det skaber en mere kompliceret graf, der kræver forklaring.
men hvis du skal forklare, hvordan du læser et givet diagram til dine brugere, så er det nok ikke et godt diagram at holde fast på et dashboard til generel brug (fordi så meget som vi forsøger at skrive instruktioner og oprette links til online hjælpeguider, hvor meget bruger folk faktisk dem?). Når det er sagt, kan en mere kompliceret diagramtype være et fantastisk værktøj til historiefortælling, som det ses i Hans Roslings TED talk, “den bedste statistik, du nogensinde har set.”
Marimekko diagrammer i virkelige applikationer
Lad mig fortælle dig en historie ved hjælp af et berømt eksempel på Simpsons paradoks (også kendt som Simpson-Yule-effekten). Kort sagt er Simpsons paradoks, hvor en tendens vises i en retning, når vi ser på dataene som helhed, og så vender tendensen retning, når vi ser på grupper af dataene (eller omvendt).
i begyndelsen af 1970 ‘ erne var der en kønsforstyrrelse retssag mod Graduate Division af University of California Berkeley opladning, at kvinder blev diskrimineret i optagelsesprocessen. Samlet set syntes dataene at være enige. I efteråret 1973 var der 3.421 kvinder og 8.442 mænd optaget med optagelsesrater på ca.35% og 44% hver:
en gruppe af UC Berkeley fakultet og personale opnåede detaljerede optagelsesdata og kom til en anden konklusion. Gruppens berømte papir konkluderede, at der på afdelingsniveau var en lille, men betydelig bias i kandidatoptagelser i den modsatte retning mod kvinder.
Hvis vi opdeler dataene efter afdeling for de seks største afdelinger, kan vi se den anden historie. I fire af de seks største afdelinger var der faktisk en højere andel af kvinder optaget end mænd, men for den samlede accept havde kvinder en lavere optagelsesrate:
hvorfor det tilsyneladende paradoks? Årsagen skyldes en skjult lurende variabel, i dette tilfælde antallet af kvinder og mænd, der ansøger om hver afdeling. Her er et sæt stablede søjler, der viser antallet af kvinder og mænd, der ansøger:
der er mange flere mænd end kvinder, der ansøger om Afdeling A og B, og det vægter resultaterne. At se forholdet mellem antallet af ansøgere og optagelsesfrekvensen i to separate diagrammer er sværere at drille ud. Det er her Marimekko-plottet kan komme i spil, da det lader os vise begge mål på en gang.
optagelsesgraden for hvert køn og afdeling er stadig på y-aksen som 100% stablede søjler, og antallet af ansøgere bruges til at størrelse hver kolonne. Og i ånden af at gå efter det, jeg bad om hjælp til det visuelle. Min kollega og data fashionista Anya a ‘ Hearn anvendte designelementer fra et faktisk Marimekko-print for at gøre det smukt:
med Marimekko-plottet bliver vægtningen, der skaber Simpsons paradoks, virkelig tydelig. I Afdeling A og B er der en høj optagelsesrate for begge køn og en meget større andel af mandlige ansøgere. Det effektivt trækker op den samlede optagelse sats for mænd, mens i andre afdelinger, der er en lavere optagelse sats for mænd og en mere lige andel af mandlige og kvindelige ansøgere.
Marimekko i Tableau
ovenstående visning er ikke et enkelt diagram i Tableau. I stedet er det oprettet som et dashboard med forskellige billeder og tekst til designelementer. Dataene vises i tre regneark: det vigtigste Marimekko-diagram i sig selv, et andet Marimekko for de samlede proportioner og et tredje regneark, der fungerer som afdelingens overskrift. En alternativ visning, der kun bruger to regneark, bruger en referencelinje til at vise de samlede proportioner:
nu hvor du ved, hvad en Marimekko er, og når det er mest nyttigt, er det tid til at begynde at bygge i Tableau 10. I den næste rate af denne serie deler jeg trinene til at opbygge et Marimekko-diagram i Tableau. Og i den sidste rate dækker jeg nogle alternativer til Marimekko-diagrammer, der er lettere at bygge.
når han ikke skriver Tableau tutorials, Jonathan Drummey tilbyder Tableau rådgivning og uddannelse på DataBlick. Han er også en Tableau mester og forfattere @helpmedatablick Tableau tip af dagen.