Conjunto de datos
En esta guía, usamos el conjunto de datos del Titanic. Gracias a Kaggle y a la Enciclopedia-Titanica por este conjunto de datos.
Contiene 887 registros de los pasajeros reales del Titanic. Para más detalles, por favor consulte a Kaggle. Analizaremos qué tipo de personas es probable que sobrevivan. En otras palabras, ¿qué factores influyen en la supervivencia de los pasajeros?
Analizaremos este conjunto de datos con el gráfico de barras y sus extensiones.
Importación de datos
Importar datos en los siguientes pasos:
- Descargue el archivo «titanic.csv» desde aquí.
- Entonces importaremos los datos a Tableau. Puedes simplemente arrastrar este archivo a Tableau, o elegir formalmente Archivo de texto en el panel Conectar, y navegar hasta el archivo de destino «titanic.csv».
- Si se importó con éxito, verá los datos cargados en la pestaña Fuente de datos. El cuadro deducirá el tipo de datos y el papel de cada columna automáticamente, pero no siempre es correcto. Así que, a veces necesitamos un preprocesamiento.
Antes de eso, tenemos que aprender algunos conceptos importantes relacionados con Tableau.
Conceptos relacionados
Campos de datos
Cuando se importan los datos a Tableau, cada columna se convierte en un campo de datos. Los campos de datos tienen dos atributos importantes:
- Tipo de datos: los más comunes son Número (entero, flotante), Cadena, Booleano, y Fecha.
- Función: marcar los datos como Dimensión o Medida, Discreta o Continua. Ayuda a Tableau a visualizar los datos de diferentes maneras.
Dimensiones vs. Medidas
Las dimensiones representan valores cualitativos, como identificaciones, fechas y categorías. Tableau no calcula con ellos y los mostrará como encabezados en su lugar.
Las medidas representan valores cuantitativos que se pueden medir, como las ventas y las temperaturas. Las medidas se agregan en la vista por defecto.
Entenderlos de otra manera, que resumí aquí:
Discreto vs. Continuo
Discreto representa con el color azul y muestra los encabezamientos en el cuadro. Como literalmente, los datos discretos son entidades separadas o individualmente distintas.
Continuo representa con verde color y muestra ejes en el cuadro. Por el contrario, los datos continuos forman un todo ininterrumpido, sin interrupción.
Tanto la dimensión como las medidas pueden ser discretas o continuas.
Aquí hay una tabla de ejemplo de todas las combinaciones:
Roles de campo de datosDiscretosContinuosDimensión de usuario (común)fecha (también puede ser discreta, rara)Mide la temperatura después de truncado (muy rara)ventas (común)
Si está confundido sobre estos conceptos y no tiene claro a dónde pertenecen sus datos, puede cambiar los papeles y ver cómo esto afecta a la apariencia de su gráfico.
Preprocesamiento de datos
Antes de dibujar un gráfico, debemos preparar nuestros datos primero. Algunos trabajos de preprocesamiento son mejores para operar fuera de Tableau, tales como la discusión de datos y la ingeniería de características.
Aquí hablaremos sobre el trabajo en Tableau. Principalmente, comprobará y corregirá el tipo de datos y el papel de los campos de datos, que hemos mencionado antes.
Preparemos nuestros datos:
- Haz clic en la pestaña Hoja. En el panel de datos de la izquierda, podemos ver que a nuestros campos de datos se les ha asignado el tipo y el rol automáticamente.
- Compruebe el tipo de cada campo de datos. Todo parece correcto.
- Compruebe el papel de cada campo de datos. Encontraremos «Sobrevivido», «Clase», «Padres/hijos a bordo», y «Hermanos/esposos a bordo» debe ser Dimensión Discreta. Hay dos maneras de lograrlo.Convertir arrastrando en el panel de datos.Haga clic con el botón derecho y elija en el menú emergente.