La prueba de aquellos que se usan ampliamente para verificar que las frecuencias de los valores observados se adaptan a las frecuencias teóricas de una distribución de la probabilidad preestablecida. Por ejemplo, se sabe que el resultado de 100 lanzamientos de una moneda sigue a una distribución uniforme y es difícil obtener un resultado que difiere significativamente de obtener 50 cabezas y 50 cruces. La prueba del cuadrado le permite establecer, después de establecer el error máximo tolerado, si las discrepancias entre las frecuencias observadas y teóricas son completamente atribuibles al azar o si es legítimo asumir que la moneda está compuesta.
Suponga que en una muestra particular se ha observado que un conjunto de posibles eventos E1, E2,…, EK se presenta con frecuencias O1, O2,…, OK (llamadas frecuencias observadas). Luego, supongamos que, de acuerdo con las reglas de probabilidad, esperamos un segundo conjunto de posibles eventos con frecuencias E1, E2,…, EK (llamadas frecuencias teóricas o esperadas), es decir, resumiendo:
La variable de prueba χ2 { DisplayStyle Chi ^{2}} se obtiene agregando, para cada evento y el cuadrado de los desechos entre las frecuencias teóricas y observadas, se pesa en frecuencias teóricas:
Por lo tanto, si el número total de eventos k { splatyle k} se fija, se distribuye como una variable χ2 { dongestyle chi ^{2}} con k-{ displaystyle k-1} grados de libertad. De lo contrario, si K es una variable a su vez, por ejemplo, Poissonian (como puede ser en un experimento de conteo), se distribuye como una variable χ2 { splatyle chi ^{2}} con k { displaysstyle k} grados de libertad.
¿Cómo se realiza la prueba de chi cuadrado?
Hay 3 puntos a tener en cuenta para que la prueba que se realice correctamente y sean:
- Un buen genetista debe atribuir mucha importancia a la dimensión de la población analizada
- No se basa en porcentajes o relaciones, sino en datos efectivos
- La importancia de la hipótesis. Un buen genetista para determinar si los genes están asociados deben verificar los datos y evaluar si están de acuerdo con la hipótesis de nada (no asociación).
La imagen cuya imagen es, por lo tanto, la diferencia entre el valor observado y el valor esperado dividió el valor esperado al segundo. Recuerde, si tratamos con varias clases, entonces tenemos que insertar el resumen.
Incluyendo la parte teórica que ahora podemos preguntarnos: «¿Cómo llevo a cabo una prueba quién es una foto?»
1) Use los datos de una encrucijada para responder las siguientes preguntas:
- Un buen genetista debe atribuir mucha importancia a la dimensión de la población analizada
- No se basa en porcentajes o relaciones, sino en datos efectivos
- La importancia de la hipótesis. Un buen genetista para determinar si los genes están asociados deben verificar los datos y evaluar si están de acuerdo con la hipótesis de nada (no asociación).
2) Calcule cuántos descendientes se espera para cada clase si la hipótesis no es correcta, multiplicando por el porcentaje requerido por la hipótesis nada por el número total de descendencia
3) Calcule el grado de libertad (GL). Esta es una medida del número de parámetros que pueden variar independientemente en el experimento.
4) Use X^2 y GL para encontrar «» P «(probabilidad de que una desviación de los números esperados pueda deberse al caso).
¿Por qué se llama chi cuadrado?
La distribución de la estadística de chi-cuadrado se llama distribución de chi-cuadrado.
En esta lección, aprendemos a calcular la estadística de chi-cuadrado y encontrar la probabilidad
asociado con la estadística. Y trabajaremos a través de algunos ejemplos de chi-cuadrado para ilustrar puntos clave.
Supongamos que realizamos lo siguiente
Experimento estadístico. Seleccionamos una muestra aleatoria de tamaño N de
una población normal, que tiene una desviación estándar igual a σ.
Encontramos que la desviación estándar en nuestra muestra es igual a s. Dado
estos datos, podemos definir un
estadística,
llamado chi-square,
Usando la siguiente ecuación:
La distribución de la estadística de chi-cuadrado se llama distribución de chi-cuadrado.
El chi-cuadrado
La distribución se define por lo siguiente
Función de densidad de probabilidad:
donde y0 es una constante que depende del número de grados de
Libertad, χ2 es la estadística de chi-cuadrado,
v = n – 1 es el número de
grados de libertad, y
e es una constante igual a la base del
Sistema de logaritmo natural (aproximadamente 2.71828). Y0 está definido, entonces
que el área debajo de la curva de chi-cuadrado es igual a uno.
En la siguiente figura, la curva roja muestra la distribución de los valores de chi-cuadrado
calculado a partir de todas las muestras posibles de tamaño 3, donde los grados de libertad son n
– 1 = 3 – 1 = 2. De manera similar, la curva verde muestra la distribución para
muestras de tamaño 5 (grados de libertad iguales a 4); y la curva azul, para
muestras de tamaño 11 (grados de libertad iguales a 10).
¿Qué significa el chi cuadrado?
El cuadrado Chi (y²) es una variable aleatoria distribuida como una suma de cuadrados de variables independientes, cada una distribuida de acuerdo con una ley de Laplace-gauss.
En algunos casos, estamos llevados a comparar el personal observado en el personal teórico o esperado. Estos números teóricos son aquellos que se observarían si estuvieran completamente determinados por una determinada hipótesis. Estos son, por ejemplo, la fuerza laboral observada para las clases de N de una distribución en comparación con el número que se observaría si la variable respetara exactamente la ley binomial, o incluso, la fuerza laboral observada en las cuatro cajas de una tabla de contingencia definida por El cruce de dos variables con dos modalidades en comparación con la fuerza laboral que se observaría si estas dos variables fueran exactamente independientes.
Para describir la diferencia entre los números observados y la fuerza laboral teórica, hay una cantidad x². Por lo tanto, para una fuerza laboral total dada, x² es aún más mayor ya que la diferencia entre las dos series de fuerza laboral es mayor. Conocemos la distribución de muestreo de x² para un número determinado de grados de libertad.
Este número es el de la fuerza laboral que podría modificarse libremente respetando las distribuciones totales estudiadas. Es N – 1 para una distribución que incluye n clases, (k – 1) (l – 1) para una tabla de contingencia de k columnas y líneas. Al consultar una tabla que proporciona estas distribuciones de muestreo (tabla x²), puede saber si es posible rechazar, en un nivel dado de significado, la hipótesis de que el número observado no es diferente de la fuerza laboral teórica.
Artículos Relacionados: