Variables Categóricas Nominales: Qué Son y Cómo Se Clasifican

Una variable categórica es un tipo variable con dos o más categorías. A veces se llama una variable discreta, se clasifica principalmente en dos (nominales y ordinales).

Por ejemplo, si un restaurante está tratando de recopilar datos de la cantidad de pizza ordenada en un día según el tipo, consideramos que esto es datos categóricos. Al recopilar los datos, el restaurante agrupará el número de pedidos de acuerdo con el tipo de pizza (por ejemplo, pepperoni, pollo, etc.) ordenado.

En este caso, el tipo de pizza ordenada es la variable categórica. Las variables de datos categóricas se dividen en dos, a saber; Variable ordinal y variable nominal.

Este tipo de variable de datos categóricos no tiene un orden intrínseco a sus categorías. Por ejemplo, el estado civil es una variable categórica que tiene dos categorías (solteras y casadas) sin orden intrínseco a las categorías.

Hay dos categorías principales de variables de datos nominales, a saber; categorías coincidentes e inigualables. A continuación se realizan las pruebas realizadas en cada categoría:

  • Prueba de McNemar: esta es una prueba sin distribución para datos nominales emparejados (2 grupos).
  • Prueba Q de Cochran: esta es una prueba realizada en 3 o más grupos.
  • Prueba exacta de Fisher: esta prueba se usa cuando la frecuencia esperada es inferior a 5.
  • Prueba de chi-cuadrado: esta prueba se usa cuando la frecuencia esperada es 5 o más.

Este tipo de variable categórica tiene un orden intrínseco a sus categorías. Por ejemplo, al estudiar la gravedad del error en el software, la gravedad es una variable categórica con categorías ordenadas que son; crítico, mediano y bajo.

¿Qué es la cualitativa nominal ejemplos?

  • Género Masculino Femenino)
  • Denominaciones
  • (Cabello) colores
  • Curso
  • Residencia
  • Nacionalidades

Un ejemplo de escala nominal muy bien conocido es el código postal. Aunque este es un número, un código postal alto no es mejor o peor que un código postal bajo. Los números no se pueden clasificar cuantitativamente.

En contraste, podemos diferenciar en términos de calidad. Por lo tanto, los códigos postales que comienzan con un 1 se asignan geográficamente a Berlín y códigos postales que comienzan en las 8, el área de Munich.

Alternativamente, las características también se pueden transferir a números. Si observa el ejemplo del color del cabello, por ejemplo, rubio = 1, marrón = 2, negro = 3 etc. Esto no significa que la rubia sea el mejor color de cabello y el negro lo peor. Esto se trata solo de la descripción de las características de un número. Una posible transformación de escala también podría verse así: rubio = 2, marrón = 4, negro = 6. Por supuesto, las diferentes características no deben tener el mismo número. Rubio = 2, marrón = 2, negro = 6 estaría prohibido porque ya no podíamos distinguir entre rubia y marrón.

La elección de categorías para datos de escala nominal es particularmente interesante. Por lo tanto, podría expandir el ejemplo del color del cabello en cualquier cantidad de colores (por ejemplo, rubio claro, marrón oscuro, rojo rojo, etc.). En este caso, la cantidad de colores de cabello no es un tamaño significativo. Sin embargo, si observa los diversos cursos de estudio de una universidad, esto puede proporcionar información sobre la dispersión de los intereses temáticos de los estudiantes.

¿Qué es la cualitativa nominal?

Los datos nominales son datos «etiquetados» o «nombrados» que se pueden dividir en varios grupos que no se superponen. Los datos no se miden o evalúan en este caso, solo se asigna a múltiples grupos. Estos grupos son únicos y no tienen elementos comunes. El orden de los datos recopilados no se puede establecer utilizando datos nominales y, por lo tanto, si cambia el orden de los datos, su importancia de los datos no se alterará.

En la nomenclatura latina «nomen» significa – nombre. Los datos nominales presentan una similitud entre los diversos elementos, pero los detalles sobre esta similitud pueden no ser revelados. Esto es simplemente para facilitar el proceso de recopilación y análisis de datos para los investigadores. En algunos casos, los datos nominales también se denominan «datos categóricos».

Si los datos binarios representan datos «de dos valores», los datos nominales representan datos de «valor múltiple» y no puede ser cuantitativo. Los datos nominales se consideran discretos. Por ejemplo, un perro puede ser un labrador o no.

  • Los datos nominales nunca se pueden cuantificar: los datos nominales siempre estarán en forma de nomenclatura, es decir, una encuesta enviada a países asiáticos puede incluir una pregunta como la mencionada en este caso. Aquí, el análisis estadístico, lógico o numérico de los datos no es posible, es decir, un investigador no puede sumar, restar o multiplicar los datos recopilados o concluir que la variable 1 es mayor que la variable 2.
  • Ausencia de orden: a diferencia de los datos ordinales, los datos nominales tampoco se les puede asignar un orden definitivo. En el ejemplo anterior, el orden de las opciones de respuesta es irrelevante para las respuestas proporcionadas por el encuestado.
  • Propiedad cualitativa: los datos recopilados siempre tendrán una propiedad cualitativa: es muy probable que las opciones de respuesta sean de naturaleza cualitativa.
  • No se puede calcular la media: la media de los datos nominales no se puede establecer incluso si los datos se organizan en orden alfabético. En el ejemplo mencionado anteriormente, es imposible que un investigador calcule la media de las respuestas presentadas para las etnias debido a la naturaleza cualitativa de las opciones.
  • Concluya un modo: pedirle a una gran muestra de individuos que presenten sus preferencias: la respuesta más común será el modo. En el ejemplo proporcionado, si el japonés es la respuesta presentada por una sección más grande de una muestra, será el modo.
  • Los datos son principalmente alfabéticos: en la mayoría de los casos, los datos nominales son alfabéticos y no numéricos, por ejemplo, en el caso mencionado. Los datos no numéricos también se pueden clasificar en varios grupos.

La mayoría de los datos nominales se recopilan a través de preguntas que proporcionan al encuestado una lista de elementos para elegir, por ejemplo:

¿En qué estado vives? ____ (seguido de una lista desplegable de estados) ¿Cuál de los siguientes elementos elige normalmente para sus ingredientes de pizza? (Seleccione todo lo que se aplique) 1) Espinacas 2) Pepperoni 3) Olivas 4) Sardinas 5) Salchicha 6) Queso adicional 7) Cebollas 8) Tomates 9) Otros (Especifique) _______________ Hay tres formas en que se pueden recopilar datos nominales. En el primer ejemplo, el encuestado recibe espacio para escribir en su estado de origen. Esta es una forma de la pregunta abierta que eventualmente se codificará con que cada estado se le asigne un número. Esta información también podría proporcionarse al encuestado en forma de una lista, donde seleccionarían una opción. El segundo ejemplo es en forma de preguntas de respuesta múltiple donde cada categoría está codificada 1 (si se selecciona) y 0 si no se selecciona. También incorpora un componente abierto que permite al encuestado la opción de escribir en una categoría no incluida en la lista. Estas «otras respuestas» especificar «necesitarán codificación si se van a analizar. Los datos nominales se analizan utilizando porcentajes y el «modo», que representa las respuestas más comunes. Para una pregunta dada, puede haber más de una respuesta modal, por ejemplo, si las aceitunas y las salchichas se seleccionaron el mismo número de veces. Preguntas de respuesta múltiple, p. El ejemplo de pizza enumerado anteriormente, permite a los investigadores la capacidad de crear una variable métrica que puede usarse para un análisis adicional. En este escenario, el encuestado puede seleccionar cualquiera o todas las opciones que le proporcionen una variable que varía de cero (ninguno seleccionado) hasta el número máximo de categorías. Esto se convierte en una herramienta útil para la segmentación del consumidor. Los datos nominales se usan mejor para perfilar a sus encuestados. Aunque limitadas en TI habilidades estadísticas, este tipo de datos es fundamental para obtener una comprensión más profunda de sus encuestados. A continuación, examinaremos los datos ordinales.

¿Qué son las variable categóricas ejemplos?

Los datos categóricos se muestran en tablas de dos vías contando el número de observaciones que se dividen en dos categorías para dos variables, una dispuesta en filas y la otra en columnas. Si, por ejemplo, se les pidió a 20 individuos que identificaran el color de su cabello y ojos durante una encuesta, ¿cómo lo harían? Se vería algo así:

Según las distribuciones marginales, el número de individuos en cada fila o columna se determina sin considerar cómo otras ecuaciones lineales en dos variables influyen en el número de individuos con ojos azules. Al analizar las tablas de dos vías, los porcentajes a menudo se usan en oposición a los recuentos simples porque los recuentos simples a menudo son difíciles de analizar. Aquí hay cuatro ejemplos de personas con cabello rojo. Las 20 observaciones significan que el 20% de las personas que fueron encuestadas fueron pelircadas.

Ques: Encuentre la desviación media sobre la mediana de los siguientes datos: (5 puntos)

En este caso, la mediana se refiere a la media de las observaciones 15 y 16. Para cada una de estas observaciones, la observación correspondiente es 13. Ambas observaciones caen dentro de la frecuencia acumulativa 18.

Por lo tanto, mediana M = (15ª observación +16ª observación) /2 = (13 +13) /2 = 13 Aquí están las desviaciones absolutas de la mediana, es decir, | xi-m | se muestran en la tabla.

Tenemos ∑i = ( displaystyle sum_ {i = 1}^{8} ) fi = 30 y ∑i = ( displaystyle sum_ {i = 1}^{8} ) fi | xi- M | = 149 Por lo tanto

  • D. (m) = 1 /n ( displayStyle sum_ {i = 1}^{8} ) fi | xi-m | = 1/30 × 149 = 4.97

¿Cómo se representa una variable categórica?

Supongamos que tenemos una población y una variable en las que estamos interesados. Obtenemos una muestra, que podría ser grande o pequeña, y observamos los valores de nuestra variable para las personas en esa muestra. Nos referiremos informalmente a esta colección de valores como un conjunto de datos.

En esta sección, suponemos también que la variable que estamos viendo es categórica. Luego podemos resumir el conjunto de datos diciendo qué valores categóricos vimos para las personas en la muestra y con qué frecuencia vimos esos valores.

Hay dos formas en que podemos hacer fotos de esta información: gráficos de barras y gráficos circulares.

Podemos tomar los valores que vimos para los individuos en la muestra a lo largo del eje (x ) de un gráfico, y sobre cada uno de esos etiquetas hacen un cuadro cuya altura indica cuántos individuos tenían ese valor: la frecuencia de ocurrencia de eso valor. [Def: frecuencia]

Esto se llama gráfico de barras. Como con todos los gráficos, siempre debe etiquetar todos los ejes. El eje (x )-se etiquetará con alguna descripción de la variable en cuestión, la etiqueta del eje (y ) siempre será «frecuencia» (o algún sinónimo como «contar» o «número de veces») .

Ejemplo 1.2.1. En el ejemplo 1.1.7, supongamos que tomamos una muestra de las siguientes 10 volteretas de nuestra moneda. Supongamos además que 4 de los flips aparecieron cabezas: escríbelo como «H», y 6 colocaron colas, T. Entonces se vería la tabla de barras correspondiente

Hay una variante del tipo de gráfico de barras anterior que en realidad se ve casi igual pero cambia las etiquetas en el eje (y )-. Es decir, en lugar de hacer que la altura de cada barra sea cuántas veces ocurrió cada valor categórico, podríamos hacer que sea qué fracción de la muestra tenía ese valor categórico: la frecuencia relativa [def: Relfreq]. Esta fracción a menudo se muestra como un porcentaje.

Artículos Relacionados:

Related Posts

Deja una respuesta

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *