Tablas de contingencia: ejemplos y explicación

El ejemplo de la tabla de contingencia a continuación muestra ventas de computadora en nuestra tienda ficticia. Específicamente, describe las frecuencias de ventas del género del cliente y el tipo de computadora comprada. Es una mesa de dos vías (2 x 2). Cubro las convenciones de nombres al final.

En esta tabla de contingencia, las columnas representan tipos de computadora y las filas representan géneros. Los valores celulares son frecuencias para cada combinación de género y tipo de computadora. Los totales están en los márgenes. Observe el gran total en el margen inferior derecho.

De un vistazo, es fácil ver cómo las tablas de dos vías organizan sus datos y pintan una imagen de los resultados. Puede ver fácilmente las frecuencias para todas las combinaciones de subconjuntos posibles junto con totales para hombres, hembras, PC y Mac.

Estas distribuciones representan la distribución de frecuencia de una variable categórica sin tener en cuenta otras variables. Como era de esperar, puede encontrar estas distribuciones en los márgenes de una tabla de contingencia.

Los siguientes ejemplos de distribución marginal corresponden a los reflejos azules.

Por ejemplo, la distribución marginal del género sin considerar el tipo de computadora es la siguiente:

  • Hombres: 106
  • Hembras: 117

Alternativamente, la distribución marginal de los tipos de computadora es la siguiente:

Para estas distribuciones, especifica el valor para una de las variables en la tabla de contingencia y luego evalúa la distribución de frecuencias para la otra variable. En otras palabras, condiciona la distribución de frecuencia para una variable estableciendo un valor de la otra variable. Eso puede sonar complicado, pero es fácil usar una tabla de contingencia. Solo mire a través de una fila o abajo en una columna.

¿Cuándo es una tabla de contingencia?

Una tabla de contingencia es la tabla que cuenta con las observaciones de múltiples variables categóricas. Las hileras y columnas de las tablas corresponden a estas variables categóricas.

Por ejemplo, después de una elección reciente entre dos candidatos, una encuesta de salida registró el género y el voto de 100 votantes aleatorios y tabuló los datos de la siguiente manera:

Esta tabla de contingencia contiene las respuestas por género y voto. El recuento en la intersección de la fila I y la columna J es identificado por NIJ, y representa el número de observaciones que exhiben esa combinación de niveles. Por ejemplo, N1,2 muestra el número de encuestados masculinos que votaron por el candidato B.

La tabla también incluye totales marginales para cada nivel de las variables. Los totales marginales para las filas muestran que 52 de los encuestados eran mujeres. Los totales marginales para las columnas muestran que 67 encuestados votaron por el candidato A. Además, el gran total muestra que el tamaño de la muestra es 100.

Las tablas de contingencia también pueden revelar asociaciones entre las dos variables. Use una prueba de chi-cuadrado o la prueba exacta de Fisher para determinar si los recuentos observados difieren significativamente de los recuentos esperados bajo la hipótesis nula de ninguna asociación. Por ejemplo, podría probar si existe una asociación entre género y voto.

Las tablas de contingencia más simples son tablas de dos vías que contaminan las respuestas por dos variables. Puede clasificar las observaciones por tres o más variables «cruzándolas». En el ejemplo de votación anterior, también puede clasificar las respuestas por estado laboral de la siguiente manera:

El análisis de correspondencia simple puede detectar asociaciones en tablas de contingencia que clasifican los datos en más de dos variables. Para realizar un análisis de correspondencia simple en Minitab, elija STAT> Multivariate> Análisis de correspondencia simple.

¿Cuando una tabla es contingencia?

La asignación de contingencia también llamada escala móvil es un elemento de salario bruto, precisamente un elemento de cheque de pago para actualizar el salario al aumento de la inflación. Es un elemento del salario introducido en Italia en la década de 1950 gracias a la negociación colectiva que dio a luz al CCNL (contrato laboral colectivo nacional).

Periódicamente, ISTAT calcula el costo de vida teniendo en cuenta los precios de ciertos productos (por ejemplo, pan, leche, pastas, cuadernos, lavadoras, etc.). Si los precios de estos productos han aumentado, significa que el costo de vida ha aumentado.

Sin embargo, debe decirse que este mecanismo de adaptación del salario al costo de vida, a través de la asignación de contingencia, hasta la fecha ya no está activo: la asignación de contingencia se ha calculado hasta 1992 y desde entonces ya no ha sufrido Sin aumento, según lo establecido por el memorando de comprensión del 31 de julio de 1992 en el que participaron los socios sociales (asociaciones de la categoría de trabajadores, empresas y gobierno).

A partir de ese momento, por lo tanto, la contingencia ya no ha aumentado, ya no ha sufrido ningún aumento o disminución, hasta el punto de que algunos CCNL ya no existe, o más bien, se agregó directamente al salario básico. Es por eso que a menudo hablamos de la contingencia anterior.

Aquí están las asignaciones de contingencia proporcionadas para el siguiente CCNL.

Comercio CCNL

El CCNL para los trabajadores involucrados en la industria de metalurgia y la instalación de plantas ha combinado la contingencia del salario básico, por lo tanto, ya no hay los dos elementos separados: el artículo «mínimos contractuales» ya incluye tanto el salario básico como la contingencia:

CCNL Metalworks

¿Qué es una tabla de contingencia en Epidemiologia?

Tablas 4.1A, 4.1B y 4.1C muestran recuentos de casos (frecuencia) por una sola variable, por ejemplo, edad. Los datos también se pueden tabular cruzados para mostrar los recuentos por una variable adicional. La Tabla 4.2 muestra el número de casos de sífilis clasificados tanto por el grupo de edad como por el sexo del paciente.

Tabla 4.2 Casos reportados de sífilis primaria y secundaria por edad y sexo – Estados Unidos, 2002

Seleccione frecuencias, luego elija variable en frecuencias de. La salida muestra la tabla con porcentajes de fila y columna, más chi-cuadrado y valor p. Para una tabla de dos por dos, la salida también proporciona odds ratio, relación de riesgo, diferencia de riesgo e intervalos de confianza. Tenga en cuenta que para un estudio de cohorte, el porcentaje de filas en células de pacientes con enfermedades es la proporción de ataque, a veces llamada tasa de ataque.

Una tabla de dos variables con datos clasificados conjuntamente por esas dos variables se conoce como tabla de contingencia. La Tabla 4.3 es un ejemplo de un tipo especial de tabla de contingencia, en la que cada una de las dos variables tiene dos categorías. Este tipo de mesa se llama mesa de dos por dos y es un favorito entre los epidemiólogos. Dos por dos tablas son convenientes para comparar personas con y sin la exposición y aquellos con y sin la enfermedad. A partir de estos datos, los epidemiólogos pueden evaluar la relación, si las hay, entre la exposición y la enfermedad. La Tabla 4.3 es una tabla de dos por dos que muestra uno de los hallazgos clave de una investigación del envenenamiento por monóxido de carbono después de una tormenta de hielo y una falla de energía prolongada en Maine. (4) En la tabla, la variable de exposición, ubicación del generador de energía , tiene dos categorías: dentro o fuera de la casa. Del mismo modo, la variable de resultado, el envenenamiento por monóxido de carbono, tiene dos categorías: casos (número de personas que se enfermaron) y controles (número de personas que no se enfermaron).

La Tabla 4.4 ilustra un formato genérico y notación estándar para una tabla de dos por dos. El estado de la enfermedad (p. Ej., Enfermo versus bien, a veces casos denotados frente a controles si un estudio de casos y controles) generalmente se designa a lo largo de la parte superior de la tabla, y el estado de exposición (por ejemplo, expuesto versus no expuesto) se designa a lo largo del lado. Las letras A, B, C y D dentro de las 4 células de la tabla de dos por dos se refieren al número de personas con el estado de la enfermedad indicado anteriormente y el estado de exposición indicado a su izquierda. Por ejemplo, en la Tabla 4.4, «C» representa el número de personas en el estudio que están enfermas pero que no tenían la exposición estudiada. Tenga en cuenta que el «HI» representa totales horizontales; H1 y H0 representan el número total de personas expuestas y no expuestas, respectivamente. El «VI» representa totales verticales; V1 y V0 representan el número total de personas enfermas y de pozo (o casos y controles), respectivamente. El número total de sujetos incluidos en la tabla de dos por dos está representado por la letra t (o n).

¿Cuáles son las pruebas de contingencia?

Las pruebas en tablas de contingencia se utilizan para evaluar la asociación y la independencia entre las filas y las columnas de una tabla de contingencia, así como para calcular diversas medidas de asociación.

  • La estadística de Chi-cuadrado de Pearson permite probar la independencia entre las filas y las columnas de la tabla, midiendo hasta qué punto la tabla observada está lejos (en el sentido de chi-cuadrado) de la tabla esperada calculada usando las mismas sumas marginales.

Uno muestra que esta estadística sigue una distribución de chi-cuadrado con grados de libertad (R-1) (C-1). Sin embargo, este resultado es asintótico y, antes de usar la prueba, se recomienda asegurarse de que:

Que al menos el 80% de los valores esperados son superiores a 5;

En el caso en que R = 2 y C = 2, Yates (1934) sugirió una corrección de continuidad.

Una prueba basada en la relación de probabilidad y en la estadística G2 de los Wilks se ha desarrollado como una alternativa a la prueba de Chi-cuadrado de Pearson. Consiste en comparar la probabilidad de la tabla observada con la probabilidad de la tabla esperada definida como para la prueba de Chi-cuadrado de Pearson

La prueba exacta de Fisher permite calcular la probabilidad de que se observara una tabla que muestra una asociación más fuerte entre las filas y las columnas, se fijan las sumas marginales y bajo la hipótesis nula de independencia entre las filas y las columnas. En el caso de una tabla de 2 x2, la independencia se mide a través de la probabilidad.

Prueba de Monte Carlo: se ha desarrollado una prueba no paramétrica basada en simulaciones para probar la independencia entre filas y columnas. Se realizan varias simulaciones de Monte Carlo definidas por el usuario para generar tablas de contingencia que tienen las mismas sumas marginales que la tabla observada. La estadística de chi-cuadrado se calcula para cada una de las tablas simuladas. El valor p se determina luego demandando la distribución obtenida de las simulaciones.

Artículos Relacionados:

Más posts relacionados:

Deja una respuesta

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *