Empecemos por crear un gráfico de dispersión básico paso a paso.
- Antes de dibujar, necesitamos hacer un preprocesamiento de datos con la ayuda de herramientas externas como Excel. Para mostrar cada fila como un punto, necesitamos agregar una identificación para identificar. La forma más fácil es añadir la columna de identificación en Excel. En la actualidad, es difícil crear identificadores únicos en Tableau. Si insistes en ello, por favor consulta este post.
- Podemos generar un gráfico básico automáticamente usando «Show Me». Esta es la forma más fácil de construir un gráfico de dispersión. Haz clic en Mostrarme y verás estas instrucciones: Para las gráficas de dispersión, intenta 0 o más dimensiones, 2 a 4 medidas.
En este ejemplo, necesitamos dos medidas, RM y MEDV. Mantén pulsada la tecla Control ( Comando en Mac) mientras haces clic para seleccionar múltiple RM y MEDV, luego elige tramas de dispersión en Muéstrame .
- Ahora nos damos cuenta de que sólo hay un punto en el gráfico. Eso es porque todos los registros están agregados. Aquí podemos dividir los datos por ID, que creamos antes. Convertir ID en Dimensión. Arrastrar ID en Marcas – Detalle. Cambiar a la Vista Completa para una mejor visualización.
- En la parte superior de la gráfica de dispersión, dieciséis puntos de datos tienen un valor de 1MEDV1 de 50.0. Son valores atípicos que han sido fijados por el límite superior. Para un análisis más preciso, deberíamos eliminar estos valores atípicos. Multi-seleccionarlos y hacer clic en Excluir en el cuadro de diálogo emergente. Tableau los excluirá en los Filtros.
- Para obtener un gráfico más atractivo, edite los elementos visuales como la forma y el color:Expanda la tarjeta de Forma en Marcas y reemplace el círculo vacío por el sólido o cualquier otra forma que tenga sentido para sus lectores.Para reducir el impacto de la superposición, expanda la tarjeta de Color en Marcas y deslice la Opacidad a semitransparente.
- Añada una línea de tendencia para identificar la correlación entre RM y MEDV.Haga clic con el botón derecho del ratón en el gráfico y elija Líneas de tendencia –
- En el último paso, vamos a pulir este gráfico: Editar el título de «Relación entre el número de habitación y el precio de la casa». Renombrar el eje x como «Número de habitación» y el eje y como «Precio de la casa».
Análisis :
En este gráfico básico de dispersión, analizamos la correlación entre el número de habitaciones y el precio de la casa. Simulamos la relación mediante el modelo lineal. A partir de las variables estadísticas proporcionadas por Tableau, podemos ver que el valor P es inferior a 0,001 y el R-cuadrado es 0,471. Esto indica que su correlación lineal es relativamente alta.
Cuando nos centramos en los puntos, podemos sacar alguna otra información. Descubrimos que el promedio de habitaciones está entre 5,5 y 6,8 y el precio de la casa está entre 15.000 y 25.000. También podemos distinguir claramente los valores atípicos y analizar más a fondo la información detallada de los mismos.