Saltar al contenido

Manipulación de marcos de datos en R

El comando filtro selecciona las filas en base a la condición especificada. Comenzaremos filtrando los datos de los solicitantes cuyo préstamo sea aprobado. La primera línea de código a continuación imprime la tabla de la variable $0027approval_status$0027. La salida muestra que hay 410 solicitantes cuyo préstamo fue aprobado.

La segunda línea crea un nuevo marco de datos, $0027approved_loan$0027, mientras que la tercera línea imprime la dimensión, que es de 410 líneas y 10 variables.

Manipulación de marcos de datos en R
Manipulación de marcos de datos en R
12345 table(dat$approval_status)approved_loan = dat %§;% filter(approval_status == "Yes")print(dim(approved_loan))

{r}

Salida:

12[1] 410 10

Una de las cosas a notar en el código anterior es el uso del operador de la tubería, escrito como %>% . Este operador de tubería nos permite encadenar múltiples comandos $0027dplyr$0027 juntos, de tal manera que toma la salida de un comando y la alimenta como entrada al siguiente comando.

El comando «filtro» también puede ser usado para incluir múltiples condiciones. El código que se muestra a continuación filtra los datos utilizando diferentes condiciones en dos variables, $0027approval_status$0027 y $0027credit_score$0027.

12345 approved_satis <- dat % >% filter(approval_status == "Yes", Credit_score == "Satisfactory") dim(approved_satis)

{r}

Salida:

12[1] 372 10

La salida anterior muestra que los datos resultantes tienen ahora 372 registros en lugar de los 600 originales debido a las condiciones que utilizamos.

El comando de filtro también puede ser usado con variables numéricas, como se muestra en las líneas de código a continuación. La salida confirma que la operación se ha completado.

123456789 income_age <- dat %>% filter(Income > 600000, Age >= 30) dim(income_age) summary(income_age$Income) summary(income_age$Age)

{r}

Salida:

12345678[1] 205 10 Min. 1er Qu. Media de la media 3er Qu. Max. 606300 711100 843300 1100888 1274700 3173700 Min. 1er Qu. Media de la media 3er Qu. Max. 30.00 43.00 55.00 52.81 62.00 75.00