Articles

Una introducción a Marimekko, un gráfico de muchos colores y muchos nombres

Nota: La siguiente es la primera entrega de una serie de tres partes en el gráfico de Marimekko por el Maestro Zen de Tableau Jonathan Drummey. Tableau 10 le ofrece un control preciso del ancho de las barras, lo que permite este nuevo tipo de gráfico.

La firma de diseño Marimekko de Helsinki, Finlandia, ejemplificó el estilo de diseño exuberante y colorido de la década de 1960. Las telas y muebles vivos de la firma fueron los favoritos entre los audaces y hermosos de la década. En 1960, Jackie Kennedy hizo campaña por su esposo, John, con vestidos de Marimekko. El estilo Marimekko sigue siendo popular hasta el día de hoy en el diseño y, tal vez se sorprenda al enterarse, en la visualización de datos.

Un gráfico Marimekko es un gráfico apilado bidimensional de barras contiguas apiladas, que se parece un poco a un tejido Marimekko. Los gráficos Marimekko combinan pop visual con información. El ojo captura dos niveles de información mientras admira el patrón colorido que crea el gráfico.

Un gráfico de Marimekko con cualquier otro nombre

El gráfico de Marimekko también tiene otros nombres. Lo he visto también llamado diagrama de mosaico, diagrama de matriz, spinograma apilado, spineplot, gráfico olímpico o submarino, diagrama de Mondrian, o incluso acortado a solo gráfico mekko. Y hay tantas formas de definir este tipo de gráfico:

  • Una combinación de un gráfico de columnas apiladas al 100% y un gráfico de barras horizontales apiladas al 100% utilizando una variable diferente para cada
  • Un gráfico de columnas apiladas de ancho variable
  • Una forma de mostrar relaciones de parte a todo entre dos variables a la vez
  • Una forma de mostrar las frecuencias de una tabla de contingencia donde el área de cada celda mostrada es proporcional al conjunto

Lo llamaremos Marimekko porque es un nombre común en el mundo de Tableau, aunque mosaic plot es el nombre más utilizado. Sospecho que la razón por la que los usuarios de Tableau han querido este gráfico desde 2009 es que combina múltiples variables de datos en un solo rectángulo de un gráfico. Y» fragmentar » probablemente se sienta más eficiente, incluso cuando crea un gráfico más complicado que requiere explicación.

Pero si tiene que explicar cómo leer un gráfico determinado a sus usuarios, probablemente no sea un buen gráfico para pegarlo en un panel de control para uso general (porque por mucho que tratemos de escribir instrucciones y crear enlaces a guías de ayuda en línea, ¿cuánto las personas realmente las usan?). Dicho esto, un tipo de gráfico más complicado puede ser una herramienta fantástica para contar historias, como se ve en la charla TED de Hans Rosling, «Las mejores estadísticas que hayas visto.»

Gráficos de Marimekko en aplicaciones del mundo real

Déjame contarte una historia usando un famoso ejemplo de la paradoja de Simpson (también conocido como el efecto Simpson-Yule). En pocas palabras, la paradoja de Simpson es donde una tendencia aparece en una dirección cuando miramos los datos como un todo, y luego la tendencia se invierte cuando miramos grupos de datos (o viceversa).

A principios de la década de 1970, hubo una demanda por prejuicios de género contra la División de Graduados de la Universidad de California en Berkeley, alegando que las mujeres estaban siendo discriminadas en el proceso de admisión. En general, los datos parecen estar de acuerdo. En el otoño de 1973, había 3.421 mujeres y 8.442 hombres admitidos, con tasas de admisión de aproximadamente 35% y 44% cada uno:

Un grupo de profesores y personal de la UC Berkeley obtuvo datos detallados de admisión y llegó a una conclusión diferente. El famoso documento del grupo concluyó que a nivel de departamento, había un sesgo pequeño pero significativo en la admisión de graduados en la dirección opuesta hacia las mujeres.

Si desglosamos los datos por departamento para los seis departamentos más grandes, podemos ver esa historia diferente. En cuatro de los seis departamentos más grandes, en realidad hubo una mayor proporción de mujeres admitidas que de hombres, aunque para la aceptación general, las mujeres tuvieron una tasa de admisión más baja:

¿Por qué la aparente paradoja? La razón se debe a una variable oculta, en este caso el número de mujeres y hombres que solicitan cada departamento. Aquí hay un conjunto de barras apiladas que muestran el número de mujeres y hombres que aplican:

Hay muchos más hombres que mujeres que aplican a los departamentos A y B, y eso es ponderar los resultados. Ver la relación entre el número de solicitantes y la tasa de admisión en dos gráficos separados es más difícil de desentrañar. Aquí es donde la trama de Marimekko puede entrar en juego, ya que nos permite mostrar ambas medidas a la vez.

La tasa de admisión para cada género y departamento sigue en el eje y como barras apiladas al 100% y el número de solicitantes se utiliza para dimensionar cada columna. Y con el espíritu de ir a por ello, pedí ayuda con las imágenes. Mi colega y fashionista de datos Anya A’Hearn aplicó elementos de diseño a partir de un estampado real de Marimekko para hacerlo magnífico:

Con la trama de Marimekko, la ponderación que crea la paradoja de Simpson se hace realmente evidente. En los departamentos A y B, hay una alta tasa de admisión para ambos sexos y una proporción mucho mayor de solicitantes masculinos. Eso efectivamente eleva la tasa de admisión general para hombres, mientras que en otros departamentos, hay una tasa de admisión más baja para hombres y una proporción más igual de solicitantes masculinos y femeninos.

Marimekko en Tableau

La vista anterior no es un solo gráfico en Tableau. En su lugar, se crea como un panel de control con varias imágenes y texto para elementos de diseño. Los datos se muestran en tres hojas de trabajo: el gráfico principal de Marimekko en sí, un segundo Marimekko para las proporciones generales y una tercera hoja de trabajo para actuar como encabezado del departamento. Una vista alternativa que solo utiliza dos hojas de trabajo utiliza una línea de referencia para mostrar las proporciones generales:

Ahora que sabe qué es un Marimekko y cuándo es más útil, es hora de comenzar a compilar en Tableau 10. En la próxima entrega de esta serie, compartiré los pasos para crear un gráfico de Marimekko en Tableau. Y en la entrega final, cubriré algunas alternativas a los gráficos de Marimekko que son más fáciles de construir.

Cuando no está escribiendo tutoriales de Tableau, Jonathan Drummey ofrece consultoría y capacitación sobre Tableau en DataBlick. También es Maestro Zen de Tableau y es autor del consejo del día de Tableau @helpmedatablick.