¿Qué tipo de variable es? ¡Descúbrelo aquí!

Las variables pueden ser cuantitativas o categóricas. Las variables cuantitativas son cantidades o recuentos; Por ejemplo, la edad, el número de niños y los ingresos son todas variables cuantitativas. Las variables categóricas representan agrupaciones; Por ejemplo, el tipo de mascota, la calificación de acuerdo y la marca de zapatos son variables categóricas.

Las variables cuantitativas son de naturaleza numérica y pueden ser continuas o discretas. Las variables continuas contienen mediciones con precisión decimal, por ejemplo, la altura o el peso de una persona. Las variables discretas contienen recuentos que deben ser valores enteros enteros, como el número de miembros en la familia de una persona, o el número de goles que un equipo de baloncesto anotó en un juego.

Las variables categóricas consisten en datos que se pueden agrupar en categorías distintas y son ordinales o nominales. Variables categóricas ordinales que son grupos que contienen una clasificación inherente, como calificaciones de obras o respuestas a una pregunta de encuesta con una escala puntual, por ejemplo, en una escala del 1-7, ¿qué tan feliz está ahora? Las variables categóricas nominales están hechas de categorías sin un orden inherente, los ejemplos de variables nominales son especies de hormigas o el color del cabello de las personas.

Una distinción clave entre las variables categóricas ordinales y las variables cuantitativas discretas es que existe un grado uniforme de diferencia dentro de las variables cuantitativas discretas. La diferencia entre uno y dos gatitos es la misma que la diferencia entre cinco y seis gatitos. Sin embargo, con las variables categóricas ordinales, la diferencia entre las categorías puede variar mucho. La diferencia entre una calificación de una estrella y una calificación de dos estrellas, por ejemplo, puede ser diferente a una calificación de tres estrellas y una calificación de cuatro estrellas.

¿Qué es una variable cualitativa y cuantitativa?

La principal diferencia entre la variable cualitativa y cuantitativa es que la primera representa una calidad del sujeto u objeto que puede expresarse a través de las palabras. El segundo en cambio se expresa solo en números.

Dicho esto, debe aclararse que también es posible atribuir el valor a las variables cualitativas. Por ejemplo, imaginamos una base de datos en la que los ciudadanos son asignados número 1 para su clasificación, mientras que los extranjeros, por la misma razón, se asigna el número de O. Sin embargo, esto no significa que la variable sea cuantitativa, ya que no es una variable medible .

También se debe tener en cuenta que las variables cuantitativas son específicas o exactas. Esto, a diferencia de las variables cualitativas que tienden a ser más relativas.

Por ejemplo, el peso de una maleta puede ser de 23.5 kg. Este es un valor exacto. Sin embargo, una variable cualitativa podría ser el nivel de satisfacción del servicio en un restaurante, donde se puede solicitar un puntaje de 1 a 5. Sin embargo, una variable cualitativa permanecerá y la forma de medirlo será más inexacta que el ejemplo de La maleta que una persona podría dudar en dar una puntuación de 3 o 4 si su nivel de satisfacción es moderado.

Los tipos de variables cuantitativas son los siguientes:

  • Variables discretas: son los que asumen, solo, ciertos valores y no un valor entre dos de ellos. Por ejemplo, cuando una variable solo puede tomar valores completos, es discreto. Imaginemos la cantidad de autos que posee una persona. Un individuo no puede tener un automóvil y medio.

¿Cuándo se dice que una variable es cualitativa?

Se dice que dos variables cualitativas son independientes si el conocimiento sobre el valor de una variable no le ayuda a predecir el otro; Es decir, las probabilidades para una variable son las mismas que las probabilidades condicionales dadas la otra variable. Cada variable tiene sus propios porcentajes de población, que representan las probabilidades de ocurrencia para cada categoría. Los porcentajes de población condicionales son las probabilidades de ocurrencia para una variable cuando restringe la atención a una sola categoría de la otra variable. Estos porcentajes de población restringidos representan las probabilidades condicionales para una variable dada esta categoría de la otra.

Por ejemplo, suponga que el porcentaje de población de defectos de «pintura de pintura» es de 3.1% en general. Sin embargo, cuando Jones es el gerente de servicio, el porcentaje de población condicional de los defectos del flujo de pintura es del 11,2%. En este caso, el conocimiento sobre una variable (el gerente particular) lo ayuda a predecir el resultado del otro (el tipo de defecto) porque 3.1% y 11.2% son diferentes. Los defectos de pintura son más probables cuando Jones está de servicio y menos probable cuando alguien más está a cargo. Por lo tanto, estas dos variables no son independientes.

Debe tener en cuenta que la situación de la vida real es algo más involucrada que este ejemplo porque debe trabajar con porcentajes de muestra como estimaciones de las probabilidades de población; No podrá solo mirar los porcentajes y ver si son diferentes porque (casi) siempre serán diferentes debido a la oportunidad aleatoria. La prueba de chi-cuadrado para la independencia le dirá cuándo las diferencias van más allá de lo que es razonable debido a la oportunidad aleatoria sola.

La distribución de dos variables cualitativas medidas en el nivel nominal (o dos variables cuantitativas medidas en forma dicotómica) se puede representar en la tabla de contingencia 2 × 2 que se muestra en la Tabla I. El coeficiente Phi es el análogo de la fórmula computacional para la correlación de Pearson coeficiente se muestra en la ecuación. (8). Para los datos descritos en las celdas de la Tabla I, ϕ es

Aquí ϕ solo puede tomar valores máximos (∣ϕ∣ = 1.0) cuando ambos (a + b) = (c + d) y (a + c) = (b + d). Cuando este no es el caso, el valor máximo de ϕ puede ser sustancialmente menor.

¿Qué tipo de variable es el sí o no?

Se dice que una variable es binaria o dicotómica, cuando solo hay dos niveles posibles.

Estas variables generalmente se pueden redactar en una pregunta de «sí/no».

Ni alguien no es un fumador es un ejemplo de una variable binaria.

Datos categóricos: los datos categóricos representan características como el género de una persona, el estado civil, la ciudad natal o los tipos de películas que les gustan. … (Otros nombres para datos categóricos son datos cualitativos, o datos sí/no).

La altura es una variable de relación, porque los intervalos entre los números son comparables y hay un cero absoluto para la altura. Tiene sentido decir que una persona de 6 pies de altura mide el doble que una persona de 3 pies de altura.

escala nominal que se mide usando una escala nominal es cualitativa. Las categorías, colores, nombres, etiquetas y comidas favoritas junto con respuestas sí o no son ejemplos de datos de nivel nominal.

Por ejemplo, el ingreso es una variable que se puede registrar en una escala ordinal o de relación: a nivel ordinal, puede crear 5 agrupaciones de ingresos y codificar los ingresos que caen dentro de ellos de 1 a 5. A nivel de relación, registraría números exactos para ingresos.

Hay cuatro niveles básicos: nominal, ordinal, intervalo y relación. Una variable medida en una escala «nominal» es una variable que realmente no tiene ninguna distinción evaluativa. Un valor no es realmente mayor que otro. Un buen ejemplo de una variable nominal es el sexo (o género).

Las variables que registran una respuesta como un conjunto de categorías se denominan categóricos. Dichas variables se dividen en tres clasificaciones: nominal, ordinal e intervalo. Las variables nominales tienen categorías que no tienen orden natural para ellas.

¿Qué es una variable dicotómica?

Muchos investigadores, en la fase de análisis de datos, deciden transformar una variable continua (por ejemplo: «presión arterial» o «peso») en una variable dicotómica (generalmente con valores «bajos» y «altos»))))

¿Qué razones los empuja a tal maniobra? En general, se hace para simplificar el análisis o para una interpretación más fácil de los datos. Otra razón muy «popular» es la que la variable se distribuye de una manera muy asimétrica y desea evitar el efecto que cualquier outs en las estimaciones puede tener (en este caso, sin embargo, sugiero otras técnicas más adecuadas, como la regresión cuántos).

¿Pero es el de dicotomizar una variable una buena idea?
Eso depende.
En general, excepto en algunas situaciones, la respuesta es no.
¿Porque? La razón más evidente es la pérdida de información contenida en la variable continua.
En particular, si mira el gráfico a continuación, pierda la información:
En términos «horizontales» (flecha azul), es decir, el rango de la variable;
en términos «verticales» (flecha roja), que representa la variabilidad de su resultado en relación con el valor de su variable continua

Pero se podría decir: esta información no me interesa. El problema, sin embargo, es que al renunciar a esta información, el poder de su análisis también se reduce. Y la reducción de potencia es considerable: en general, es equivalente a perder aproximadamente un tercio de su tamaño de muestra. Si lo piensas, es una enormidad.

Artículos Relacionados:

Más posts relacionados:

Deja una respuesta

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *