Prueba de Ji Cuadrada: La Guía Definitiva

El recuento observado es el número real de observaciones en una muestra que pertenece a una categoría.

El recuento esperado es la frecuencia que se esperaría en una celda, en promedio, si las variables son independientes. Minitab calcula los recuentos esperados como el producto de los totales de fila y columna, dividido por el número total de observaciones.

Puede comparar los valores observados y los valores esperados para cada celda en la tabla de salida. En estos resultados, el recuento de células observado es el primer número en cada celda, y el recuento esperado es el segundo número en cada celda.

Si se asocian dos variables, entonces la distribución de observaciones para una variable diferirá dependiendo de la categoría de la segunda variable. Si dos variables son independientes, entonces la distribución de observaciones para una variable será similar para todas las categorías de la segunda variable. En este ejemplo, de la columna 1, fila 2 de la tabla, el recuento observado es 76, y el recuento esperado es 60.78. El recuento observado parece ser mucho más grande de lo esperado si las variables fueran independientes.

La suma de los recuentos para todas las células. La suma de todos los recuentos de filas es igual a la suma de todos los recuentos de columnas.

Use los recuentos marginales para comprender cómo se distribuyen los recuentos entre las categorías.

En estos resultados, el total para la fila 1 es 143, el total para la fila 2 es 155, y el total para la fila 3 es 110. La suma de todas las filas es 408. El total para la columna 1 es 160, el total para la columna 2 es 134, y el total para la columna 3 es 114. La suma de todas las columnas es 408.

¿Qué es la prueba de ji cuadrada?

Devuelve la prueba de independencia. La función Test.Chi devuelve el valor de la distribución del cuadrado (χ2) para los datos estadísticos y los grados de libertad apropiados. Es posible usar pruebas χ2 para establecer si los resultados esperados se confirman a través de un experimento.

IMPORTANTE: Esta función ha sido reemplazada por una o más funciones nuevas capaces de ofrecer una mayor precisión y cuyos nombres recuerdan el uso relativo de manera más apropiada. Aunque esta función todavía está disponible por razones de compatibilidad con versiones anteriores, es apropiado considerar inmediatamente el uso de las nuevas funciones, ya que la función de compatibilidad puede no estar disponible en las versiones futuras de Excel.

Int_Effective obligatorio. Intervalo de datos que contiene las observaciones que se compararán con los valores esperados.

Int_play obligatorio. Intervalo de datos que contiene la proporción del producto de la línea total y la columna para el total total.

Si int_Effective e int_previsto tienen un número diferente de datos, las pruebas devolverán el valor de error #n/d.

La prueba χ2 primero calcula los datos estadísticos χ2 por medio de la siguiente fórmula:

AIJ = frecuencia efectiva en el I-EMA Riga, J-Esima Colonna

Eij = frecuencia prevista en el i-eema riga, j-esima colonna

Un valor mínimo de χ2 es un indicador de independencia. Como se puede observar en la fórmula, χ2 siempre es un valor positivo o igual a 0 y es igual a 0 solo si aij = eij para cada i, j.

¿Cuándo se usa la prueba de chi cuadrado?

La prueba de bondad de ajuste o prueba de Pearson utiliza la distribución que enmarca quién verificar la bondad con la que se describe un conjunto de datos mediante una distribución hipotética. Por ejemplo, puede ser una alternativa a la prueba normal para la distribución gaussiana. La prueba consiste en comparar las frecuencias observadas con las frecuencias teóricas proporcionadas por la distribución hipotética. Esta comparación se lleva a cabo utilizando el cuadrado de desechos entre frecuencias teóricas y observadas.

Donde FOI es la frecuencia observada, FIS es la frecuencia esperada por la distribución hipotética para la clase I-ESIMA.

Generalmente, la prueba de cuyo marco para la bondad del ajuste se usa cuando se trata de variables categóricas (ver el último párrafo), o variables cuyos valores se dividen en clases mutuamente excluyentes. Para las variables continuas, la prueba se puede realizar después de organizar los datos en un histograma de las frecuencias. En el último caso, el resultado de la prueba depende en gran medida del ancho de los intervalos y se considera relevante si cada grupo tiene al menos 5 datos o el número de grupos (o rectángulos) en los que los datos se dividen igual a 2n^(2/ 5) con n número de datos.

Si se generan el histograma, muchos rectángulos contienen menos de 5 puntos, generalmente agrupan los datos en un solo rectángulo a las colas de los histogramas hasta que alcanzan el número de 5 puntos.

La variable que se definió anteriormente sigue una distribución de densidad de probabilidad que enmarca con la libertad ν-B donde B es el número de parámetros conocidos de la distribución hipotética, como el promedio, la desviación estándar o el parámetro de forma.

¿Cuándo se aplica la prueba chi cuadrado?

Pruebas chi-dos (o khi-deux, o)
son pruebas de hipótesis estadísticas no paramétricas. Toman su nombre del hecho de que leemos
La brecha crítica en la tabla de la ley del chi-dos. Son principalmente tres:
  • la prueba del chi-dos de ajuste, o de adecuación,
    que compara en general la distribución observada en una muestra estadística con una distribución teórica.
  • La prueba de la independencia de Chi-Two, que prueba si dos caracteres de un
    La población es independiente.
  • La prueba de homogeneidad, que prueba si las muestras provienen de la misma población.
El propósito de esta prueba es comparar una distribución teórica de un personaje con una distribución.
observado. Para esto, el personaje debe tomar un número finito de valores, o estos valores deben almacenarse
en un número finito de clases.
  • la prueba del chi-dos de ajuste, o de adecuación,
    que compara en general la distribución observada en una muestra estadística con una distribución teórica.
  • La prueba de la independencia de Chi-Two, que prueba si dos caracteres de un
    La población es independiente.
  • La prueba de homogeneidad, que prueba si las muestras provienen de la misma población.
  • Un personaje A cuyos posibles valores se dividen en K clases A1,…, ak.
    La probabilidad teórica en cada una de las clases se observa P1,…, PK.
  • n Observaciones, que dan una fuerza laboral N1 para la Clase A1,…, NK
    Para la clase AK. Por supuesto, debemos tener n1+…+nk = n.
  • Hipótesis probada: «La distribución observada se ajusta a la distribución teórica» ​​con un riesgo
    Error a.
  • VERIFICACIÓN APIITORIA DE LAS CONDICIONES APLICACIÓN: La fuerza laboral teórica debe verificar
    $ e_ {i, j} geq $ 5 para todos i, j.
  • Ejemplo: comparar la efectividad de dos medicamentos que actúan sobre la misma enfermedad, pero a los precios
    Diferente, el Seguro Social ha llevado a cabo una encuesta sobre las curaciones obtenidas siguiendo cada uno de los tratamientos.
    Los resultados se registran en la siguiente tabla:
    Ya hemos calculado la fuerza laboral marginal. Los números teóricos son:
    La variable de prueba es de aproximadamente 2.5, mientras que el valor crítico, para un nivel de riesgo del 5%,
    IS 3.84 (exploramos la tabla del Chi-2 hasta un grado de libertad). Por lo tanto, podemos estimar razonablemente aquí
    que la tasa de curación no depende del precio del medicamento y haga preguntas sobre la oportunidad.
    Para continuar vendiendo el querido medicamento.

    ¿Qué características deben tener las variables de estudio para aplicar la prueba chi cuadrado?

    Resumiendo los valores observados y los valores esperados calculados en una tabla y determinar el valor de chi-cuadrado.

    Podemos ver que el chi-cuadrado se calcula como 2.22 utilizando la fórmula estadística de chi-cuadrado.

    Con una confianza del 95% que es alfa = 0.05, verificaremos el valor de chi-cuadrado calculado cae en la región de aceptación o rechazo.

    Tener grados de libertad = 1 (calculado con tabla de contingencia) y alfa = 0.05 El valor de chi-cuadrado es 3.84.

    La distribución de chi-cuadrado es el lado derecho ya que la diferencia en observada y esperada es grande.

    En el hig. Rechazaremos la hipótesis nula si el valor de chi-cuadrado cae en la región de error (alfa de 0 a 0.05).

    Así que aquí estamos aceptando la hipótesis nula ya que el valor de chi-cuadrado es menor que el valor crítico de chi-cuadrado.

    Para concluir que las dos variables son independientes, la variable de género no se puede seleccionar para capacitar al modelo.

    El chi-cuadrado es sensible a las pequeñas frecuencias en las células de las tablas. En general, cuando el valor esperado en una celda de una tabla es inferior a 5, Chi-cuadrado puede generar errores en conclusiones.

    Nota: Aquí consideramos muestras con tamaño 400 y para las muestras más grandes, los resultados pueden variar.

    Aquí está el siguiente código, sobre cómo realizar la prueba de chi-cuadrado usando Python.

    Hasta ahora, aprendimos sobre tener la respuesta categórica y el predictor categórico, pero ¿qué pasa si tenemos la respuesta continua y el predictor categórico? Usaremos ANOVA. Consulte mi artículo ANOVA para la selección de funciones en el aprendizaje automático.

    Artículos Relacionados:

    Más posts relacionados:

    Deja una respuesta

    Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *