Articles

An introduction to Marimekko, a chart of many colors and many names

opmerking: het volgende is de eerste aflevering van een driedelige serie over de Marimekko chart door Tableau Zen Master Jonathan Drummey. Tableau 10 geeft u nauwkeurige controle over de breedte van uw staven, waardoor dit nieuwe grafiektype.het designbureau Marimekko in Helsinki, Finland, illustreerde de uitbundige en kleurrijke designstijl van de jaren zestig. de levendige stoffen en meubels van het bedrijf waren een favoriet onder de gedurfde en mooie jaren van het decennium. In 1960, Jackie Kennedy campagne voor haar man, John, in Marimekko jurken. De Marimekko-stijl blijft populair tot op de dag van vandaag in ontwerp en, u zult verrast zijn om te leren, in datavisualisatie.

een Marimekko-grafiek is een tweedimensionale gestapelde grafiek van gestapelde, aaneengesloten staven—die enigszins lijken op een Marimekko-stof. Marimekko grafieken combineren visuele pop met informatie. Het oog vangt twee niveaus van informatie als het bewondert het kleurrijke patroon van de grafiek creëert.

een Marimekko-grafiek met een andere naam

De Marimekko-grafiek heeft ook andere namen. Ik heb gezien dat het ook wel een mozaïek plot, matrix grafiek, gestapelde spinogram, spineplot, Olympische of onderzeeër grafiek, een Mondriaan diagram, of zelfs ingekort tot gewoon Mekko grafiek. En er zijn net zoveel manieren om dit diagramtype te definiëren:

  • een combinatie van een 100% gestapeld kolomdiagram en 100% gestapeld horizontaal staafdiagram met behulp van een andere variabele voor elke
  • een variabele-breedte gestapeld kolomdiagram
  • een manier om part-to-whole relaties over twee variabelen tegelijk weer te geven
  • een manier om de frequenties van een contingency table weer te geven waarbij de oppervlakte van elke weergegeven cel proportioneel is aan de hele
  • Pretty!

we noemen het Marimekko omdat dat een veel voorkomende naam is in de Tableau wereld, hoewel mosaic plot de meest gebruikte naam is. Ik vermoed dat de reden Tableau-gebruikers deze grafiek hebben gewild sinds 2009 is dat het combineert meerdere variabelen van gegevens in een enkele rechthoek van een plot. En “chunking” voelt waarschijnlijk efficiënter, zelfs als het een ingewikkelder grafiek creëert die uitleg vereist.

maar als je moet uitleggen hoe je een gegeven grafiek aan je gebruikers moet lezen, dan is het waarschijnlijk geen goede grafiek om op een dashboard te plakken voor algemeen gebruik (want hoe vaak we ook proberen instructies te schrijven en links naar online Helpgidsen te maken, hoeveel gebruiken mensen ze eigenlijk?). Dat gezegd hebbende, een meer ingewikkelde grafiek type kan een fantastische tool voor het vertellen van verhalen, zoals te zien in Hans Rosling ’s TED talk,” de beste statistieken die je ooit hebt gezien.”

Marimekko charts in real world applications

laat me je een verhaal vertellen met behulp van een beroemd voorbeeld van Simpson ‘ s paradox (ook bekend als het Simpson-Yule effect). Kort gezegd, Simpson ‘ s paradox is waar een trend verschijnt in een richting als we kijken naar de gegevens als geheel, en dan de trend keert richting als we kijken naar groepen van de gegevens (of vice versa). in het begin van de jaren zeventig was er een gender-bias rechtszaak tegen de Graduate Division van de University of California Berkeley, die beweerde dat vrouwen werden gediscrimineerd in het toelatingsproces. Over het geheel genomen lijken de gegevens het met elkaar eens te zijn. In de herfst van 1973 werden 3.421 vrouwen en 8.442 mannen toegelaten, met een toelatingspercentage van ruwweg 35% en 44% elk:

een groep van UC Berkeley faculty and staff verkreeg gedetailleerde toelatingsgegevens en kwam tot een andere conclusie. De beroemde paper van de groep concludeerde dat er op afdelingsniveau een kleine maar significante vooringenomenheid was in de toelating van afgestudeerden in de tegenovergestelde richting ten opzichte van vrouwen.

als we de gegevens opsplitsen per afdeling voor de zes grootste afdelingen, kunnen we dat andere verhaal zien. In vier van de zes grootste afdelingen was er eigenlijk een groter percentage vrouwen toegelaten dan mannen, hoewel voor de algemene acceptatie, vrouwen een lager toelatingspercentage hadden:

waarom de schijnbare paradox? De reden is te wijten aan een verborgen loer variabele, in dit geval het aantal vrouwen en mannen van toepassing op elke afdeling. Hier is een set van gestapelde balken die het aantal vrouwen en mannen tonen die solliciteren:

Er zijn veel meer mannen dan vrouwen die solliciteren op afdelingen A en B, en dat is het wegen van de resultaten. Het zien van de relatie tussen het aantal aanvragers en het toelatingspercentage in twee afzonderlijke grafieken is moeilijker te plagen uit. Dit is waar de Marimekko plot in het spel kan komen, omdat het laat ons beide maten in een keer weer te geven.

het toelatingspercentage voor elk geslacht en elke afdeling ligt nog steeds op de y-as als een 100% gestapelde balken en het aantal aanvragers wordt gebruikt om elke kolom te bepalen. En in de geest om ervoor te gaan, vroeg ik om wat hulp met de beelden. Mijn collega en data fashionista Anya a ‘ Hearn paste ontwerpelementen toe van een Marimekko-print om het prachtig te maken:

met de Marimekko-plot wordt de weging die Simpson ‘ s paradox creëert duidelijk. In de afdelingen A en B is er een hoog toelatingspercentage voor beide geslachten en een veel groter deel van de mannelijke aanvragers. Dat trekt effectief het totale toelatingspercentage voor mannen, terwijl in andere afdelingen, is er een lagere toelatingspercentage voor mannen en een meer gelijk percentage van de mannelijke en vrouwelijke aanvragers.

Marimekko in Tableau

bovenstaande weergave is geen enkele grafiek in Tableau. In plaats daarvan is het gemaakt als een dashboard met verschillende afbeeldingen en tekst voor ontwerpelementen. De gegevens worden weergegeven in drie werkbladen: de belangrijkste Marimekko grafiek zelf, een tweede Marimekko voor de totale verhoudingen, en een derde werkblad op te treden als de afdeling header. Een alternatieve weergave die slechts twee werkbladen gebruikt, gebruikt een referentielijn om de totale verhoudingen weer te geven:

Nu u weet wat een Marimekko is en wanneer het het meest nuttig is, is het tijd om te beginnen met bouwen in Tableau 10. In de volgende aflevering van deze serie, Ik zal de stappen te delen om het bouwen van een Marimekko grafiek in Tableau. En in de laatste aflevering, zal ik een aantal alternatieven voor Marimekko grafieken die gemakkelijker te bouwen.wanneer hij geen Tableau tutorials schrijft, biedt Jonathan Drummey Tableau consulting en training aan bij DataBlick. Hij is ook een Tableau Zen Master en auteur van de @ helpmedatablick Tableau tip van de dag.