Histograma apilado
Para analizar la relación entre la edad y la supervivencia, añadiremos el ratio de supervivencia en el histograma como una barra apilada. Los pasos son similares a los del gráfico de barras apiladas . No vamos a expandirnos demasiado aquí. Puedes consultar la guía anterior para obtener más detalles:
- Arrastra «Sobrevivido» a Marcas – Color.
- Agregar etiquetas de porcentaje:Mantenga pulsada la tecla Control y arrastre «CNT(Age)» en Marks – Label.Haga clic con el botón derecho del ratón en «CNT(Age)» en Marks Shelf ——-; haga clic en Quick Table Calculation ——-; elija Percent of Total.Haga clic con el botón derecho del ratón en «CNT(Age)» en Marks Shelf ——-; haga clic en Edit Table Calculation ——-; elija Specific Dimensions ——-; marque sólo «Survived».
- Formato de la etiqueta de porcentaje: haga clic con el botón derecho del ratón en «CNT(Age)» en Marks-Label… -…; haga clic en Numbers en Default – …; elija Percentage – …; edite los decimales a 0.
Podemos ver la composición y la proporción cuantitativa. Pero los números no son tan intuitivos como los elementos visuales , como los colores. Eso es lo que vamos a hacer a continuación.
Renderizado con colores divergentes
Aumentar la capacidad expresiva del histograma mostrando la diferencia con un color divergente.
- Calcular la diferencia de la tasa de supervivencia entre el rango de edad actual y el total: Hemos creado una «Tasa de supervivencia total» con el gráfico de barras de lado a lado. La fórmula es SUM(IF[Survived]==1 THEN 1 ELSE 0 END) / SUM([Number of Records]).Crear un Campo Calculado «Diferencia de Tasa de Supervivencia» basado en él: haga clic con el botón derecho del ratón en el blanco del Panel de Datos —-; elija Crear Campo Calculado… —-; introduzca la fórmula [Tasa de Supervivencia Total]- TOTAL([Tasa de Supervivencia Total]) —-; nómbrelo como «Diferencia de Tasa de Supervivencia».
- Renderizar barra con color divergente:Arrastrar «Diferencia de la relación de supervivencia» en Marcas – Color.Hacer clic en el triángulo invertido de la Leyenda y elegir Editar Colores…Elegir Rojo-Verde Divergente en la Paleta. Aquí quiero explicar por qué elegimos este divergente:Quiero que el color se explique por sí mismo. En la percepción de la mayoría de la gente, el Verde significa bueno/pasar/positivo/saludable, mientras que el Rojo significa malo/ban/negativo/no saludable.Expandir opciones avanzadas. De acuerdo con la diferencia en el rango, establecemos Inicio como -0.4 y Fin como 0.4 (ignora 80-85 porque contiene sólo un pasajero).
- Añada etiquetas en la parte superior de cada barra.Arrastre «Diferencia de la tasa de supervivencia» en Marcas – Etiqueta.Formatee la etiqueta a porcentaje y 1 decimal como los pasos anteriores.
Análisis :
Cuando un histograma se representa con colores divergentes, muestra la información de forma más intuitiva. Específicamente en este ejemplo, más verde significa que es más probable que sobrevivan, mientras que más rojo significa que es más difícil sobrevivir. El gris está más cerca del promedio de supervivencia.
Podemos ver que los pasajeros menores de 5 años son los que más probabilidades tienen de sobrevivir, y los de 5-10, 30-40, 45-55 años tienen una oportunidad relativamente alta de sobrevivir. Por otro lado, los pasajeros de 65-75 años son los más difíciles de sobrevivir, y los de 20-25, 55-65 obtienen un ratio de supervivencia relativamente bajo.
Demuestra que los pasajeros relativamente jóvenes eligieron sacrificarse y dieron la oportunidad de sobrevivir a los niños y a los ancianos.