Saltar al contenido

Explorando los datos visualmente con R

El gráfico de barras se utiliza para trazar una variable categórica o una combinación de variables continuas y categóricas. Se construye utilizando la función geom_bar() . El código que se muestra a continuación representa el gráfico de barras de la variable $0027Purpose$0027, donde la altura vertical representa el conteo de las categorías.

123 ggplot(dat, aes(Purpose)) + geom_bar()

{r}

Explorando los datos visualmente con R
Explorando los datos visualmente con R

Salida:

El gráfico de barras de arriba muestra la distribución de frecuencias de la variable «Propósito». Sin embargo, tal vez queramos visualizar la relación entre una medida resumida, como la renta media, y el propósito para el que se aplicó el préstamo.

Dado que el argumento por defecto en $0027geom_bar$0027 es count , primero agregamos la variable $0027Purpose$0027 contra la variable $0027Income$0027. La primera línea de código de abajo utiliza el argumento FUN=media para calcular la renta media según las clases de la variable $0027Propósito$0027. La segunda línea renombra las columnas, mientras que la tercera línea crea la gráfica requerida.

1234567 aggdata(dat$Income, by=list(dat$Purpose), FUN=mean, na.rm=TRUE) names(aggdata) = c("Purpose", "Mean_Income") ggplot(aggdata, aes(Purpose, Mean_Income)) + geom_bar(stat = "identidad", fill = "blue") + ggtitle("Ingreso medio en las categorías de propósito")

{r}

Salida:

También es posible crear un gráfico de barras apilado, una versión avanzada de un gráfico de barras, que se utiliza para visualizar una combinación de variables categóricas, como se muestra a continuación.

123 ggplot(dat, aes(Purpose, fill = approval_status)) + geom_bar() + labs(title = "Stacked Bar Chart", x = "Purpose", y = "Count")

{r}

Salida: