Qualtrics ha proporcionado una herramienta de tabulación cruzada para que realice un análisis multivariado en dos o más variables a la vez. Esta herramienta incluye numerosas opciones para personalizar sus diagramas, incluida la capacidad de calcular estadísticas de chi cuadrado y ANOVA.
Esta página cubre los conceptos básicos de configurar una tabla cruzada, además de todas las diversas formas en que puede configurar sus variables o hacer cálculos. Consulte las opciones de Crosstab para funciones adicionales.
- Elija una variable de la lista y pruébela al cuadro de filas (Stub) para crear filas. Por lo general, estas son calificaciones o variables de «salida», como la satisfacción.
- Ahora puede agregar celdas de información que desee agregarse a su tabla cruzada. Obtenga más información sobre estas opciones en la sección de cálculos disponibles.
- ¡Ahora tienes una tabla cruzada! Puede hacer ediciones a las celdas, columnas o filas de esta tabla de crosstab en cualquier momento.
A medida que recoja más respuestas, sus diagramas de tabla deberán recalcularse. Haga clic en el icono de configuración en la esquina superior derecha y seleccione Importar datos más recientes para agregar las nuevas respuestas a su conjunto de datos. Su diagrama de tabla no estará disponible mientras se recalcula.
También es posible que desee aplicar la ponderación a sus datos de diagrama. Esto se puede hacer en función de la ponderación de respuesta o en función de una de las variables numéricas existentes en sus datos.
- Elija una variable de la lista y pruébela al cuadro de filas (Stub) para crear filas. Por lo general, estas son calificaciones o variables de «salida», como la satisfacción.
- Ahora puede agregar celdas de información que desee agregarse a su tabla cruzada. Obtenga más información sobre estas opciones en la sección de cálculos disponibles.
- ¡Ahora tienes una tabla cruzada! Puede hacer ediciones a las celdas, columnas o filas de esta tabla de crosstab en cualquier momento.
¿Qué es una tabla de contingencia y para qué sirve?
Una tabla de contingencia resume la información de múltiples variables aleatorias discretas. Un ejemplo de la tabla de contingencia se da en la Tabla 5.1: X es la variable aleatoria que representa los gustos y disgustos de probabilidad y estadísticas de los estudiantes, mientras que Y es la variable aleatoria que representa su somnolencia durante la conferencia.
Una tabla de contingencia corresponde a una función de masa de probabilidad. La columna más derecha se llama total de la fila marginal, la fila inferior se llama la columna marginal total y la celda de fondo derecho se llama gran total. El total marginal de la fila y el total marginal de la columna corresponden a funciones de masa de probabilidad marginal, mientras que cada fila y cada columna corresponden a funciones de masa de probabilidad condicional. Las pruebas de hipótesis utilizando la tabla de contingencia se explicarán en la Sección 10.4.
Una tabla de contingencia consiste en una colección de células que contienen recuentos (por ejemplo, de personas, establecimientos u objetos, como eventos). Las células se organizan con mayor frecuencia en la forma o clasificaciones cruzadas correspondientes a las variables categóricas subyacentes. Las tablas de contingencia vienen en una variedad de formas y tamaños, y sus entradas pueden ser generadas por una variedad de diferentes modelos de muestreo. Estas tablas obtienen su nombre del trabajo temprano de Karl Pearson, que estaba interesado en la asociación entre dos variables, X e Y; Pearson se propuso medir la contingencia de y en x por analogía con regresión y correlación para variables aleatorias continuas. En las ciencias sociales de hoy, los investigadores a menudo están interesados en comprender las interrelaciones entre múltiples variables categóricas (que surgen, por ejemplo, en el contexto de encuestas de muestra de individuos u hogares) y los cambios entre estas relaciones a lo largo del tiempo. Dichas relaciones a menudo pueden representarse como parámetros en modelos log-lineal o logísticos.
¿Qué es una tabla cruzada o de contingencia?
Las tablas de contingencia también llamadas tablas cruzadas o tablas de frecuencia bidireccional describen la relación entre varias variables categóricas (cualitativas). Una relación bivariada se define por la distribución conjunta de las dos variables aleatorias asociadas.
Deje que $ x $ y $ y $ son dos variables de respuesta categórica. Deje que la variable $ x $ tenga niveles de $ i $ y la variable $ y $ tenga $ j $ niveles. Las posibles combinaciones de clasificaciones para ambas variables son $ I Times J $. La respuesta $ (x, y) $ de un sujeto elegido al azar de alguna población tiene una distribución de probabilidad, que se puede mostrar en una tabla rectangular que tiene $ i $ filas (para categorías de $ x $) y $ j $ columnas (para categorías de $ y $). Las células de esta tabla rectangular representan los resultados de $ ij $ posibles. Su probabilidad (digamos $ pi_ {ij} $) denota la probabilidad de que ($ x, y $) caiga en la celda en la fila $ i $ y columna $ j $. Cuando estas celdas contienen recuentos de frecuencia de resultados, la tabla se llama tabla de contingencia o clasificación cruzada y se conoce como una tabla $ i $ por $ j $ ($ i times j $).
La distribución de probabilidad {$ pi_ {ij} $} es la distribución conjunta de $ x $ y $ y $. Las distribuciones marginales son las filas y las columnas totales obtenidas al sumar las probabilidades conjuntas. Para la variable de fila ($ x $), la probabilidad marginal se denota por $ pi_ {i+} $ y para la variable de columna ($ y $) se denota por $ pi _ {+j} $, donde el subíndice «+» denota la suma sobre el índice que reemplaza; es decir, $ pi_ {i+} = sum_j pi_ {ij} $ y $ pi _ {+j} = sum_i pi_ {ij} $ satisfacer
¿Qué es una tabla de contingencia y qué otro nombre recibe?
Una tabla de contingencia, también conocida como tabla de clasificación cruzada, describe las relaciones entre dos o más variables categóricas.
Una tabla de clasificación cruzada dos variables se denomina tabla de contingencia de 2 vías y forma una tabla rectangular con filas para las categorías R de la variable x y columnas para las categorías C de una variable y. Cada intersección se llama celda y representa los posibles resultados. Las células contienen la frecuencia de las ocurrencias articulares de los resultados X, y. Una tabla de contingencia que tiene filas R y columnas C se llama Tabla R x C.
Una variable que tiene solo dos categorías se llama variable binaria. Cuando ambas variables son binarias, la tabla de contingencia resultante es una tabla de 2 x 2. Además, comúnmente conocido como una tabla de cuatro veces porque hay cuatro células.
Una tabla de contingencia puede resumir tres distribuciones de probabilidad: articulación, marginal y
condicional.
- La distribución conjunta describe la proporción de los sujetos clasificados conjuntamente por una categoría de X y una categoría de Y. Las células de la tabla de contingencia dividida por el total proporcionan la distribución conjunta. La suma de la distribución conjunta es 1.
- Las distribuciones marginales describen la distribución de la variable x (fila) o y (columna) sola. Los totales de fila y columna de la tabla de contingencia proporcionan las distribuciones marginales. La suma de una distribución marginal es 1.
- Las distribuciones condicionales describen la distribución de una variable dados los niveles de la otra variable. Las celdas de la tabla de contingencia divididas por los totales de fila o columna proporcionan las distribuciones condicionales. La suma de una distribución condicional es 1.
¿Qué otros nombres recibe la tabla de contingencia?
Las tablas de contingencia, los gráficos circulares agrupados y los gráficos de barras agrupados muestran las distribuciones de dos variables categóricas y cómo se relacionan entre sí. Se pueden usar para mostrar cuán diferente es la distribución de una variable a través de los valores del otro.
Las tablas de contingencia, también conocidas como tablas de dos vías, contienen la frecuencia de las respuestas para cada combinación de valores en dos variables categóricas. Al describir la relación entre dos variables categóricas, es importante investigar las diferencias entre las distribuciones condicionales y marginales de las variables. Una distribución condicional es la distribución de una variable dado que la otra variable es igual a algún valor. La distribución marginal es la distribución general de una variable, ignorando la otra.
Por ejemplo, considere la siguiente tabla de contingencia:
La distribución marginal del color del cabello es 43% rubia/57% morena porque, de los 28 sujetos totales en este conjunto de datos, 12 tenían cabello rubio y 16 tenían cabello castaño. La distribución condicional del color del cabello para mujeres es 47% rubia/53% morena (considerando solo los 17 sujetos en la columna «femenina»), mientras que la distribución condicional del color del cabello para los hombres es 36% rubia/67% morena (considerando solo los 11 sujetos en la columna «masculina»). Al comparar las distribuciones condicionales y marginales, podemos ver cómo el color del cabello difiere entre los dos géneros.
Artículos Relacionados:
- La tabla de contingencia es una herramienta de análisis estadístico que se utiliza para estudiar la relación entre dos variables.
- Cómo crear una tabla de contingencia en Excel paso a paso
- Tablas de contingencia: ejemplos y explicación
- Tabla de contingencia: estadística para una mejor toma de decisiones