Tablas de contingencia chi cuadrado: cómo usarlas y qué significan

Cuando el análisis de datos categóricos se refiere a
más de una variable de tablas de dos vías (también conocidas como
Se emplean tablas de contingencia). Estas tablas proporcionan una base para
inferencia estadística, donde las pruebas estadísticas cuestionan la relación
entre las variables sobre la base de los datos observados.En el conjunto de datos «niños populares», se preguntó a los estudiantes en los grados 4-6 si lo bueno
Las calificaciones, la capacidad atlética o la popularidad fueron más importantes para ellos. Un bidireccional
Tabla que separa a los estudiantes por calificación y por la elección del factor más importante
se muestra a continuación:Hay error en la segunda columna (los porcentajes suma a 99, no 100)
Debido al redondeo. A partir de la aparición de los porcentajes de columna, sí
no parece que haya una gran variación en preferencia a través del
tres grados.

Fuente de datos: Chase, M.A y Dummer, G.M. (1992), «El papel de los deportes como determinante social
para niños, «Investigue trimestralmente para ejercicio y deporte, 63, 418-424. conjunto de datos disponible hasta
La Biblioteca de datos y historias de Statlib (DASL).

La prueba de chi-cuadrado proporciona un método para probar la asociación
entre las variables de fila y columna en una tabla de dos vías. La hipótesis nula
H0 supone que no hay asociación entre el
variables (en otras palabras, una variable no varía según el
otra variable), mientras que la hipótesis alternativa ha afirma
que alguna asociación existe. La hipótesis alternativa no
especificar el tipo de asociación,
Entonces se requiere mucha atención a los datos para interpretar la información.
proporcionado por la prueba.

¿Qué es chi cuadrado de contingencia?

La prueba de independencia de Chi-cuadrado de Pearson es un procedimiento estadístico no paramétrico con una estadística de prueba distribuida por chi-cuadrado que se utiliza para probar la dependencia mutua de dos atributos. El análisis de contingencia de chi-cuadrado es una extensión de la prueba de mesa cruzada «clásica» que examina cada uno de los dos atributos contra dos características.

Aquí, las tablas cruzadas se pueden usar para calcular los diversos coeficientes que reflejan el tamaño y la dirección de las correlaciones.

Este capítulo explica en detalle el procedimiento del análisis de contingencia de chi-cuadrado basado en la siguiente pregunta:

¿Existe una correlación entre la edad y la probabilidad de obtener cáncer intestinal?

El procedimiento del análisis de contingencia de chi-cuadrado se resume en tres pasos, que se describen en la siguiente sección.

La pregunta se examina en base a un conjunto de datos proporcionado por el estadístico Analysis Institute (SAS). Los datos están en 406 personas que tenían una colonoscopia (detección intestinal).

La respuesta a las preguntas se puede encontrar con la ayuda de una representación esquemática, que en este caso se ve de la siguiente manera:

Es posible calcular varios coeficientes que reflejan el tamaño y la dirección de las relaciones. Tres de estos coeficientes se describen en la siguiente sección.

La Figura 2 muestra con qué frecuencia ocurren las categorías de atributos de las dos variables que se están probando.

El estadístico de prueba de chi-cuadrado se calcula comparando la tabla de frecuencias observadas con la tabla de frecuencias esperadas en el caso de la independencia estadística. Los valores de la tabla de frecuencias esperadas se calculan mediante las distribuciones marginales (totales a través de filas y columnas, ver «Total» en la Figura 3). Las distribuciones marginales se corresponden con las distribuciones de probabilidad estimadas de los grupos bajo la hipótesis nula.

¿Qué significa el coeficiente de contingencia?

Una tabla de contingencia, como en la prueba de independencia de Chi-cuadrado, revela si dos conjuntos de datos o grupos son independientes o no. No revela la fuerza de la dependencia. El coeficiente de contingencia es una medida no paramétrica de la asociación para datos de clasificación cruzada.

Después de calcular el valor de chi cuadrado del ejercicio de la tabla de contingencia, podemos usar ese valor para determinar el coeficiente de contingencia con la siguiente fórmula.

Si C es cero de muy cerca de cero, no hay asociación entre los dos grupos. Si el valor C está más cerca de 1, existe una fuerte asociación negativa o positiva.

Una de las desventajas del coeficiente es que generalmente no logra 1, incluso si hay completamente dependiente el uno del otro. Puede determinar el valor de max c teórico con r (el número de filas y columnas, que deben ser iguales)

$$ gran displaystyle {{c} _ { max}} = sqrt { frac {r-1} {r}} $$

Para una tabla de dos por dos, C tiene un posible máximo de 0.707.

Usando el valor de Chi-cuadrado del ejemplo de la prueba de la independencia de 7.5, que tiene un tamaño de muestra de 40, encontramos

$$ grande displaystyle c = sqrt { frac {7.5} {40+7.5}} = 0.397 $$

Que sugieren una modesta asociación entre la posición de una persona y su opinión.

Esto fue probablemente un error tipográfico y estoy seguro de que lo sabías, pero solo tenía una pequeña corrección de que «C» está limitado entre 0 y 1 en lugar de -1 y 1. La razón de esto es que la forma en que hemos construido Nuestra estadística de prueba, por ejemplo, (o-e)^2/e, nunca puede ser negativa y, en consecuencia, «c» nunca puede ser negativa.

¿Cuándo se acepta chi cuadrado?

La prueba de chi cuadrado, también escrita como una prueba χ2, es cualquier prueba de hipótesis estadística en la que la distribución de muestreo de las estadísticas de prueba es una distribución de chi cuadrado cuando la hipótesis no es cierta. Sin otras calificaciones, la ‘prueba de chi-cuadrado’ a menudo se usa como abreviatura de Pearson para la prueba de chi cuadrado. La prueba de chi cuadrado se usa para determinar si hay una diferencia significativa entre las frecuencias proporcionadas y las frecuencias observadas en una o más categorías. En los usos estándar de esta prueba, las percepciones se caracterizan en clases fundamentalmente no relacionadas, y hay algunas hipótesis o teoría injustificada, lo que probablemente da la probabilidad de que cada percepción caiga en la clase de comparación. La motivación detrás de la prueba es evaluar la probabilidad de que las percepciones que se realizan sean válidas, aceptando la especulación de irrealidad.

Las pruebas de chi cuadrado se construyen regularmente a partir de un agregado de errores cuadrados, o mediante la fluctuación del ejemplo. Las intuiciones de la prueba que persiguen una transmisión Chi-cuadrado surgen de una suposición libremente extendida de información libre, que son en gran medida sustanciales debido a las hipótesis en la medida de lo posible. Se puede utilizar una prueba de chi cuadrado para tratar de rechazar la teoría no índice de que la información es gratuita.

De la misma manera, se cree que la prueba de chi cuadrado es una prueba en la que esto es asypíticamente válido, lo que implica que la circulación de la inspección (si la teoría no válida es válida) puede hacerse para hacer el transporte del chi-cuadrado tan intenso como se desee, lo que hace que el tamaño del ejemplo sea bastante enorme.

¿Cuándo se acepta o se rechaza la hipótesis nula?

La hipótesis dada se prueba con la ayuda de los datos de la muestra. Una muestra aleatoria simple tiene la plena libertad de dar cualquier valor a sus estadísticas. La muestra no es consciente de nuestros planes, y elegimos nuestra hipótesis sobre la base de las estadísticas de la muestra. Si la muestra no respalda la hipótesis nula, la rechazamos sobre la base de probabilidad y aceptamos la hipótesis alternativa. Si la muestra no se opone a la hipótesis, se acepta la hipótesis.

Sin embargo, aquí «aceptar» no significa la aceptación de la hipótesis nula, solo significa que la muestra no se ha opuesto fuertemente. «No opuesto» no significa que la muestra haya apoyado fuertemente la hipótesis. No se puede establecer el apoyo de la muestra a favor de la hipótesis. Cuando se rechaza la hipótesis, se rechaza con una alta probabilidad.

Por lo tanto, el rechazo de $$ {h_o} $$: es una decisión fuerte y nos lleva a la aceptación de $$ {h_1} $$. Pero la aceptación de $$ {h_1} $$ no es como la aceptación de $$ {h_o} $$. La aceptación de la hipótesis nula no nos da una cierta decisión fuerte; Es una situación que puede requerir alguna investigación adicional. En esta etapa, se deben tener en cuenta muchos factores. El tamaño de la muestra y ciertas otras características que aún no se han discutido nos ayudan a investigar más la hipótesis nula antes de que finalmente sea aceptada. Por lo tanto, el rechazo es una decisión pero no necesariamente verdadera, y la aceptación no es una decisión en ningún sentido de la palabra.

Existe un enfoque moderno en el que no se utilizan los términos rechazo y aceptación, sin embargo, este enfoque está más allá del alcance de esta publicación. Pero sigue siendo cierto porque la aceptación de una hipótesis nula es una decisión débil, mientras que el rechazo es una fuerte evidencia de la muestra contra la hipótesis nula. Cuando se rechaza la hipótesis nula, significa que la muestra ha realizado algún trabajo estadístico, pero cuando se acepta la hipótesis nula, significa que la muestra es casi silenciosa. El comportamiento de la muestra no debe usarse a favor de la hipótesis nula.

Artículos Relacionados:

Más posts relacionados:

Deja una respuesta

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *