¿Es cualitativo o cuantitativo?
Los datos cuantitativos son información sobre las cantidades y, en general, es algo que puede medirse. Por otro lado, los datos cualitativos son información que no puede medirse y se conocen como datos categóricos. Los datos reunidos mediante debates en grupos de discusión, entrevistas individuales o estudios de casos suelen ser cualitativos. Además, pueden clasificarse de la siguiente manera:
Datos del binomio
El binomio no es un dato binario (0 o 1, verdadero o falso) y, generalmente, es el resultado de resultados de probabilidad. Por ejemplo, una serie de ensayos que resultan en cualquiera de dos posibles resultados: Se lanza una moneda 100 veces y se registran los resultados. Se utiliza un gráfico de dispersión para mostrar la distribución.
123#Generar números de muestra; myseq <- seq(1,100,por =1)> print(myseq)
r
123# Distribución de binomios; BD <- dbinom(myseq,100,0.5)> print(BD)
r
12# Hacer un gráfico de dispersión.; gráfico (x = myseq, y = BD, xlab ="Probabilidad",ylab="Número de observación")
r
Datos nominales:
Los valores se asignan a distintas categorías y no tienen un orden significativo. Por ejemplo, los datos sobre los hábitos de fumar pueden ser categorizados pero no ordenados. Escenario: Se generan datos aleatorios para categorizar el género. Se utilizan gráficos circulares para mostrar los valores de los porcentajes.
123#Generación de un conjunto de datos con valores de género; Género <- c("Hombre", "Mujer", "Sin respuesta")
tabla(sample(Gender,25,replace =TRUE, prob = c(0.25,0.50,0.25)))
r
12# Haciendo un gráfico de pastel básico; pastel( Gendervales, Género)
r
Datos ordinales
Los datos nominales están ordenados pero no hay una escala para medir la diferencia. El orden o rango de los datos es la característica distintiva de los datos ordinales. Escenario: Vamos a crear un conjunto de datos de encuesta ficticia para los pacientes a los que se les preguntó con qué frecuencia tienen dolor de cabeza y si el dolor es alto, medio o bajo. Haremos un gráfico de la columna vertebral para mostrar los resultados.
1234567#construir un conjunto de datos para la encuesta de la frecuencia de los dolores de cabeza frente al nivel de dolor. Frecuencia de los dolores de cabeza vs. nivel de dolor. frame(frequecyh, levelpain)> plot(factor(levelpain)~factor(frequecyh), xlab="Frecuencia de dolor", ylab="Nivel de dolor")
r
Datos continuos
Datos que representan una gama de información que puede ser dividida en niveles. En resumen, datos que no se pueden contar y que tienen valores infinitos pero que aún así son medibles y se pueden subdividir. Por ejemplo, la temperatura, la humedad, la altura, el peso, etc. se miden en un rango determinado.
Escenario: Tomemos el ejemplo del conjunto de datos de Beaver1 y construyamos un Histograma para los valores de temperatura.
1; hist(beaver1$temp,xlab ="Temperatura",ylab ="Rango",main ="Beaver 1")
r
Datos discretos
Las lecturas o el conteo de números enteros que son limitados. En términos simples, los datos discretos implican números enteros, un número limitado de valores posibles, y no pueden ser divididos en partes. Por ejemplo, 50 empleados, 3 portátiles, 5 amigos son todos enteros. Escenario: Tomemos el ejemplo del conjunto de datos de mtcars donde el número de cilindros y engranajes es un número entero, por lo que un gráfico de barras puede representar la relación entre ambos.
12; x <- tabla(mtcars$engranaje,mtcars$cil); barplot(x, xlab ="No de cilindros", ylab ="Engranajes")
r
¿Sus datos son univariantes o multivariantes?
Univariante
Univariante : Como su nombre indica, Uni (uno) y Variante (variable), los datos tienen una sola variable o, en términos estadísticos, datos compuestos de un solo componente vectorial. Por ejemplo, los cambios de temperatura en un solo punto en diferentes fechas: Veamos cómo se representa el conjunto de datos incorporado Muertes accidentales en EE.UU. en un gráfico lineal. Es un simple conjunto de datos con el año, el mes y el número de muertes accidentales y es un buen ejemplo de datos univariados.
123# Datos Univariados; imprimir (USAccDeaths)
r
Multivariante
Multivariante : Por otro lado, Multi (muchas) Variante (variables) son múltiples variables en estados variados. Por ejemplo, el estudio de las temperaturas, la humedad y la velocidad del viento en diferentes puntos y fechas. Escenario: Para este escenario tomemos el conjunto de datos del iris y usemos una matriz de diagrama de dispersión.
12# diagrama de datos del iris (iris)
r