En estadísticas, una tabla de contingencia (también conocida como tabulación cruzada o crosstab) es un tipo de tabla en un formato de matriz que muestra la distribución de frecuencia (multivariada) de las variables. Se utilizan en gran medida en la investigación de encuestas, inteligencia empresarial, ingeniería e investigación científica. Proporcionan una imagen básica de la interrelación entre dos variables y pueden ayudar a encontrar interacciones entre ellas. Karl Pearson usó por primera vez la tabla de contingencia del término en «Sobre la teoría de la contingencia y su relación con la asociación y la correlación normal», [1] parte de la serie Biométrica de la Investigación de la Compañía de Drapers.
Un problema crucial de las estadísticas multivariadas es encontrar la estructura de dependencia (directa) subyacente a las variables contenidas en las tablas de contingencia de alta dimensión. Si se revelan algunas de las independencias condicionales, incluso el almacenamiento de los datos se puede hacer de manera más inteligente (ver Lauritzen (2002)). Para hacer esto, se puede usar conceptos de teoría de la información, que obtienen la información solo de la distribución de la probabilidad, que puede expresarse fácilmente a partir de la tabla de contingencia por las frecuencias relativas.
Una tabla de pivote es una forma de crear tablas de contingencia utilizando el software de hoja de cálculo.
Supongamos que hay dos variables, sexo (hombre o mujer) y mano (derecha o zurda). Además, suponga que 100 individuos son muestreados al azar de una población muy grande como parte de un estudio de diferencias de sexo en la mano. Se puede crear una tabla de contingencia para mostrar el número de personas que son hombres diestros y zurdos, hembra diestra y zurda. Tal tabla de contingencia se muestra a continuación.
¿Qué es una tabla de contingencia y ejemplo?
Las tablas de contingencia son herramientas utilizadas por los estadísticos cuando necesitan dar sentido a los datos que tienen más de una variable. Las tablas de contingencia también se llaman tablas de tabulación cruzada o pestaña cruzada. Las tablas de contingencia se muestran en forma de matriz o cuadrícula. Los números que se muestran dan la frecuencia de cada punto de datos.
La tabla de contingencia del término fue utilizada por primera vez en 1904 por Karl Pearson, un matemático inglés al que se le atribuye el lanzamiento del estudio de estadísticas matemáticas.
Una de las dificultades para intentar descifrar los datos que tienen más de una variable es encontrar la estructura de los datos. El uso de una tabla de contingencia permite al estadístico comprender mejor los datos utilizando la probabilidad y las frecuencias relativas.
Intente actualizar la página o comuníquese con el servicio de atención al cliente.
Como miembro, también obtendrá acceso ilimitado a más de 84,000
Lecciones en matemáticas, inglés, ciencia, historia y más. Además, obtenga pruebas de práctica, cuestionarios y entrenamiento personalizado para ayudarlo
triunfar.
Un conjunto aleatorio de 100 personas que tienen mascotas fueron encuestadas para ver si había una correlación entre el género y si tenían un perro o un gato. Esta es una tabla de contingencia que describe los datos.
El número de hombres, hembras, dueños de perros y dueños de gatos se llaman totales marginales. El número total de personas involucradas en el estudio se llama gran total.
Al colocar los datos en una tabla, se pueden extraer algunas conclusiones que podrían no ser evidentes si los datos estuvieran en una lista. El usuario puede ver que parece haber una correlación entre el género y la propiedad de mascotas. Parece que más hombres poseen perros, mientras que más mujeres poseen gatos. Las pruebas estadísticas como la prueba Chi-cuadrado de Pearson, la prueba G, la prueba exacta de Fisher y la prueba de Barnard pueden dar la importancia de los datos en la tabla de contingencia.
¿Cuando una tabla es contingente?
La Tabla 1 anterior es un ejemplo de una tabla de contingencia. Es una tabla estadística que permite presentarse simultáneamente y en una serie estadística de la página cruzada 2.
En el capítulo anterior, se analizaron series de datos individuales. En este capítulo trabajaremos en contingencias, 2 series a la vez.
Los métodos descritos como parte de la descripción de la serie de datos individuales se extenderán a las tablas de contingencia. Estos incluyen calcular la fuerza laboral y las frecuencias. Además, abordaremos un problema práctico que es la noción de independencia entre las variables representadas en la tabla de contingencia.
Sea X como, cuyos términos se presentan en línea (tamaño) e i el número total de sus métodos (i = 4).
Sea la forma en que los términos se presentan en la columna (verrealcool) y j el número total de sus métodos (j = 3).
Designa el índice de una línea. Xi es una modalidad de x con i = 0,…, i-1
Designo el índice de una columna. Yj es una modalidad de y con j = 0,…, j-1
NIJ designa la fuerza laboral parcial. Este es el valor que encontramos cuando se encuentra con la tabla una modalidad en línea (XI) y una modalidad de columna (YJ). Se interpreta como el número de individuos que presentan simultáneamente la modalidad XI y la modalidad YJ
N21 = 124 que interpretó como el número de personas entrevistadas que tenían un tamaño medido entre 1m75 y 1m84 y dijeron que habían consumido entre 3 y 7 vasos de alcohol durante la noche.
¿Cómo se hace una tabla de contingencia?
Una tabla de contingencia, a veces llamada tabla de frecuencia bidireccional, es un mecanismo tabular con al menos dos filas y dos columnas utilizadas en estadísticas
presentar datos categóricos en términos de frecuencia
conteos. Más precisamente, una contingencia
La tabla muestra la frecuencia observada de dos variables,
cuyas frecuencias observadas se organizan en filas y columnas. La intersección de una fila y una columna de contingencia
La tabla se llama celda.
Por ejemplo, la tabla de contingencia anterior tiene dos filas y cinco columnas (no contando filas/columnas de encabezado) y muestra los resultados de una muestra aleatoria de adultos clasificados
por dos variables, a saber, el género y la forma favorita de comer helado (Larson y Farber
2014). Un beneficio de tener datos presentados en una tabla de contingencia es que permite
uno para realizar más fácilmente los cálculos de probabilidad básicos, una hazaña más fácil aún
Al aumentar una fila de resumen y columna a la tabla.
La tabla anterior es una versión extendida de la primera tabla obtenida agregando una fila y columna de resumen. Estos resúmenes permiten un cálculo más fácil de varias cantidades diferentes relacionadas con la probabilidad. Por ejemplo, hay
una probabilidad de que
la persona probada prefiere su helado en una taza, mientras que
La probabilidad de que un participante aleatorio sea femenino.
Además, calculando las probabilidades condicionales
se hace más fácil utilizando tablas de contingencia, por ejemplo, la probabilidad de que una persona prefiera
sándwiches de helado dado que la persona es hombre es, mientras que
la probabilidad condicional de que una persona sea hombre dado que los sándwiches de helado
se prefieren es.
¿Cómo se elabora una tabla de contingencia de frecuencias relativas?
Una tabla de contingencia es una representación tabular de datos basados en categorías. Muestra las frecuencias para combinaciones particulares de valores para dos variables aleatorias discretas, por ejemplo, X e Y. Cada celda en la tabla representa una combinación mutuamente excluyente de valores X-Y. Una tabla de contingencia para dos variables basadas en categorías también se conoce como tabla de dos vías.
La siguiente tabla de contingencia muestra una distribución de frecuencia hipotética de la preferencia del nivel de educación de las mujeres en tres países entre una muestra aleatoria de 120 mujeres:
La tabla anterior indica que un nivel de educación «secundario o inferior» es dominante en Tanzania, mientras que la «escuela secundaria» es dominante en Uganda. Las mujeres kenianas a menudo suben a un nivel de grado de «licenciatura» o «maestría». También podemos ver que ninguna mujer tanzana tiene un título de «maestría» dentro de la muestra.
La frecuencia conjunta es el número de veces que una combinación de dos condiciones ocurre juntas. Por ejemplo, «Kenia» y «secundaria o inferior» tienen una frecuencia conjunta de 5.
La suma de las frecuencias conjuntas a través de filas y columnas se llama frecuencias marginales. Por ejemplo, la frecuencia marginal del título de «licenciatura» es la suma de las frecuencias conjuntas en los tres países, es decir, 25 (= 15 + 5 + 5). La «escuela secundaria o inferior» y la «escuela secundaria» tienen las frecuencias marginales más grandes.
También podemos crear tablas de contingencia utilizando frecuencias relativas. Por ejemplo, la preferencia por la «escuela secundaria» en Uganda es ( frac {25} {120} = 21 %).
¿Cómo se calcula la probabilidad en una tabla de contingencia?
Una tabla de contingencia proporciona una forma de retratar datos que pueden facilitar el cálculo de las probabilidades. La tabla ayuda a determinar las probabilidades condicionales con bastante facilidad. La tabla muestra valores de muestra en relación con dos variables diferentes que pueden ser dependientes o contingentes entre sí. Más adelante, utilizaremos las tablas de contingencia nuevamente, pero de otra manera.
Supongamos que un estudio de violaciones de exceso de velocidad y conductores que usan teléfonos celulares produjeron los siguientes datos ficticios:
El número total de personas en la muestra es 755. Los totales de la fila son 305 y 450. Los totales de la columna son 70 y 685. Observe que 305 + 450 = 755 y 70 + 685 = 755.
Calcule las siguientes probabilidades usando la tabla. * * *
b. Encuentra P (el conductor no tuvo violación en el último año). * * *
C. Encuentra P (el conductor no tuvo violación en el último año y era un usuario de teléfono celular). * * *
d. Find P (el controlador es un usuario o un controlador de teléfono celular no tuvo violación en el último año). * * *
mi. Find P (el controlador es un usuario de teléfono celular dado que el controlador tuvo una violación en el último año). * * *
F. Encuentra P (el conductor no tuvo violación el año pasado dado que el conductor no era un usuario de teléfono celular)
Soluciones: a. Número de número Userstotal de teléfonos celulares en el estudio = 305755
b. número que no tenía un número total de violación en el estudio = 685755
(El espacio muestral se reduce al número de conductores que tuvieron una violación.) * * *
(El espacio muestral se reduce al número de controladores que no eran usuarios de teléfonos celulares).
Artículos Relacionados:
- Cómo crear una tabla de contingencia en Excel paso a paso
- Tablas de contingencia: una guía paso a paso para el análisis estadístico
- Tablas de contingencia: ejemplos y explicación
- Tabla de contingencia: estadística para una mejor toma de decisiones
- ¿Qué es un diagrama de contingencias? Aprende a crear uno para optimizar tu planificación