Volviendo a nuestra salida de ejemplo, podemos usar nuestro numerador de relación F y denominador para calcular nuestro valor F como este:
Para poder concluir que no todas las medias grupales son iguales, necesitamos un gran valor F para rechazar la hipótesis nula. ¿Es la nuestra es lo suficientemente grande?
Una cosa complicada de los valores F es que son una estadística sin unidad, lo que los hace difíciles de interpretar. Nuestro valor F de 3.30 indica que la varianza entre grupos es 3.3 veces el tamaño de la varianza dentro del grupo. El valor de hipótesis nula es que las variaciones son iguales, lo que produce un valor F de 1. ¿Es nuestro valor F de 3.3 lo suficientemente grande como para rechazar la hipótesis nula?
No sabemos exactamente cuán poco común es nuestro valor F si la hipótesis nula es correcta. Para interpretar los valores F individuales, necesitamos colocarlos en un contexto más amplio. Las distribuciones F proporcionan este contexto más amplio y nos permiten calcular las probabilidades.
Una sola prueba F produce un solo valor F. Sin embargo, imagine que realizamos el siguiente proceso.
Primero, supongamos que la hipótesis nula es cierta para la población. A nivel de población, las cuatro medias grupales son iguales. Ahora, repitemos nuestro estudio muchas veces dibujando muchas muestras aleatorias de esta población utilizando el mismo diseño ANOVA unidireccional (cuatro grupos con 10 muestras por grupo). A continuación, realizamos ANOVA unidireccional en todas las muestras y trazamos la distribución de los valores F. Esta distribución se conoce como distribución de muestreo, que es un tipo de distribución de probabilidad.
¿Cómo se calcula la distribución F?
La distribución F, también conocida de distribución de fisher-snedecor, se utiliza ampliamente para probar la igualdad de variaciones de dos poblaciones normales. F-Distribution obtuvo su nombre después de R.A. Fisher que inicialmente desarrolló este concepto en la década de 1920. Es una distribución de probabilidad de una estadística F.
La distribución F generalmente es una distribución sesgada y también relacionada con una distribución de chi cuadrado. La distribución F es la relación de la variable de chi-cuadrado aleatorio x1 con grados de libertad ϑ1 y x2 variable de chi-cuadrado aleatorio con grados de libertad ϑ2. (En otras palabras, cada una de las variables aleatorias de chi-cuadrado se ha dividido por sus grados de libertad)
La forma de la distribución depende de los grados de libertad de numerador ϑ1 y denominador ϑ2.
- La curva de distribución F se sesga positivamente hacia la derecha con el rango de 0 y ∞
- El valor de F siempre positivo o cero. Sin valores negativos
- La forma de la distribución depende de los grados de libertad de numerador ϑ1 y denominador ϑ2.
- Del gráfico anterior está claro que el grado de asimetría disminuyó con el aumento de grados de libertad de numerador y denominador
- La curva de distribución F nunca será simétrica, si aumenta los grados de libertad, será más similar al simétrico
La prueba F compara el más de un nivel de variable independiente con múltiples grupos que utiliza la distribución F. Esto generalmente se usa en los cálculos de ANOVA. Siempre use la distribución F para la prueba F para comparar más de dos grupos.
¿Cómo se utiliza la tabla de distribución F?
Si bien la media indica el valor «central» o promedio de todo el conjunto de datos, la desviación estándar indica la «extensión» o la variación de los puntos de datos alrededor de ese valor medio.
- Para facilitar un método estándar uniforme para cálculos fáciles y aplicabilidad a problemas del mundo real, se introdujo la conversión estándar a los valores Z, que forman la parte de la tabla de distribución normal.
- Las propiedades de una distribución normal incluyen: la curva normal es simétrica sobre la media; La media está en el medio y divide el área en mitades; El área total debajo de la curva es igual a 1 para la media = 0 y stdev = 1; y la distribución se describe completamente por su media y stddev.
- Las tablas de distribución normales se utilizan en el comercio de valores para ayudar a identificar las tendencias hacia arriba o las tendencias bajas, los niveles de soporte o resistencia y otros indicadores técnicos.
La línea horizontal roja en ambos gráficos anteriores indica el valor «media» o promedio de cada conjunto de datos (10 en ambos casos). Las flechas rosadas en el segundo gráfico indican la extensión o la variación de los valores de datos del valor medio. Esto está representado por el valor de desviación estándar de 2.83 en el caso de DataSET2. Dado que DataSET1 tiene todos los valores mismos (como 10 cada uno) y no hay variaciones, el valor STDDEV es cero y, por lo tanto, no se aplican flechas rosadas.
El valor STDDEV tiene algunas características significativas y útiles que son extremadamente útiles en el análisis de datos. Para una distribución normal, los valores de datos se distribuyen simétricamente a cada lado de la media. Para cualquier conjunto de datos distribuido normalmente, trazar gráfico con stddev en el eje horizontal y el número de valores de datos en el eje vertical, se obtiene el siguiente gráfico.
- Para facilitar un método estándar uniforme para cálculos fáciles y aplicabilidad a problemas del mundo real, se introdujo la conversión estándar a los valores Z, que forman la parte de la tabla de distribución normal.
- Las propiedades de una distribución normal incluyen: la curva normal es simétrica sobre la media; La media está en el medio y divide el área en mitades; El área total debajo de la curva es igual a 1 para la media = 0 y stdev = 1; y la distribución se describe completamente por su media y stddev.
- Las tablas de distribución normales se utilizan en el comercio de valores para ayudar a identificar las tendencias hacia arriba o las tendencias bajas, los niveles de soporte o resistencia y otros indicadores técnicos.
El área debajo de la curva en forma de campana, cuando se mide, indica la probabilidad deseada de un rango dado:
- Para facilitar un método estándar uniforme para cálculos fáciles y aplicabilidad a problemas del mundo real, se introdujo la conversión estándar a los valores Z, que forman la parte de la tabla de distribución normal.
- Las propiedades de una distribución normal incluyen: la curva normal es simétrica sobre la media; La media está en el medio y divide el área en mitades; El área total debajo de la curva es igual a 1 para la media = 0 y stdev = 1; y la distribución se describe completamente por su media y stddev.
- Las tablas de distribución normales se utilizan en el comercio de valores para ayudar a identificar las tendencias hacia arriba o las tendencias bajas, los niveles de soporte o resistencia y otros indicadores técnicos.
¿Cuándo se utiliza la F de Fisher?
La prueba de Pearson Chi-Quadro es válida «asintótica», es decir, si el tamaño de la muestra es muy elegido. Por el contrario, si en una tabla de contingencia, al menos una celda resalta una frecuencia muy baja (en la práctica, por debajo de 5), se usa la prueba exacta de Fisher.
¿Cuál es el análisis de varianza (ANOVA)? El análisis de la varianza (ANOVA) es una fórmula estadística utilizada para comparar las variaciones entre el medio (o promedio) de diferentes grupos. Una variedad de escenarios lo usa para establecer si hay alguna diferencia entre los promedios de diferentes grupos.
¿Cómo se usa ANOVA de alguna manera? El análisis de la varianza a una forma en general se usa cuando tiene una sola variable o factor independiente, y desea verificar si alguna variación o niveles diferentes de este factor tienen un efecto medible en una variable dependiente.
En las estadísticas, la prueba F para la comparación de dos variaciones es una prueba de hipótesis basada en la distribución de fisher-snedecor y tiene como objetivo verificar la hipótesis de que dos poblaciones que siguen ambas distribuciones normales tienen la misma varianza.
Calcule la estimación de F. El valor F se determina usando la receta F = (SSE1-SSE2/M)/SSE2/N-K, donde SSE = Total de los cuadrados restantes, M = Limitaciones y K = número de factores libres. Encuentre estadísticas F (el valor crítico para esta prueba).
El valor p en estadísticas inferenciales indica el grado de importancia de la muestra. En un análisis de muestras de datos, determina la probabilidad de obtener los mismos resultados o menos probables de los observados durante la prueba, suponiendo la hipótesis de nada verdadero.
¿Cuándo se usa la distribución F?
La distribución F, también conocida como Distribución F de Snedecor o la distribución Fisher-Snedecor (después de R.A. Fisher y George W. Snedecor), es la distribución de proporciones de dos estimadores independientes de las variaciones de población.
Supongamos que tenemos dos muestras con observaciones N1 y N2, la relación F = S12 / S22 donde S12 y S22 son las variaciones de muestra, se distribuye de acuerdo con una distribución F con grados numeradores V1 = N1-1, y V2 = N2 -1 Denominador Grados de libertad.
Por ejemplo, si F sigue una distribución F y los grados de libertad para el numerador son 4 y los grados de libertad para el denominador son 10, entonces F ~ F4,10. Para cada combinación de estos grados de libertad hay una distribución F diferente. La distribución F se extiende más cuando los grados de libertad son pequeños. A medida que aumentan los grados de libertad, la distribución F está menos dispersa.
La distribución F está sesgada hacia la derecha, y los valores F solo pueden ser positivos. La curva alcanza un pico no muy lejos a la derecha de 0, y luego se acerca gradualmente al eje horizontal. La distribución F se acerca, pero nunca toca el eje horizontal.
El uso principal de la distribución F es probar si se han dibujado dos muestras independientes para las poblaciones normales con la misma varianza, o si dos estimaciones independientes de la varianza de la población son homogéneas o no, ya que a menudo es deseable comparar dos variaciones más bien de dos promedios. Por ejemplo, los administradores universitarios preferirían dos profesores universitarios que los exámenes de calificación tengan la misma variación en su calificación. Para esto, la prueba F se puede usar, y después de examinar el valor p, la inferencia se puede dibujar en la variación.
¿Cuándo se usa F de Snedecor?
En este artículo cubriremos la distribución F (distribución de Fisher-Snedecor) que a menudo se usa en las pruebas de análisis de varianza (ANOVA) y, por lo tanto, definitivamente vale la pena saber si usted es un científico de datos.
La distribución F está estrechamente relacionada con la distribución de chi-cuadrado. Si no está familiarizado con la distribución de chi-cuadrado, le recomiendo leer una de mis publicaciones anteriores que detalla las complejidades de esta distribución particular:
Una variable aleatoria es parte de la distribución F si satisface lo siguiente:
Donde χ2 son dos variables aleatorias distribuidas diferentes de chi cuadrado de dos muestras independientes, que tienen grados de libertad v_1 y v_2 respectivamente. En otras palabras, es la proporción de dos variables aleatorias distribuidas con chi cuadrado divididas por sus grados de libertad correspondientes.
Recuerde que los grados de libertad para la distribución de chi-cuadrado son el número de variables aleatorias normalmente distribuidas que cuadran y resumimos. Si no está familiarizado con esto, consulte mi artículo de «distribución de chi-cuadrado simplemente explicado» que está vinculado anteriormente.
¡La distribución sobre todos los valores F posibles da lugar a la distribución F!
Si ha estado siguiendo mis publicaciones de cerca, es posible que se haya dado cuenta de que la distribución F se deriva fundamentalmente de la distribución binomial:
¡El lector interesado puede encontrar una derivación completa aquí, que incluye muchas cosas divertidas como las matrices jacobianas!
¿Cuando la prueba F es significativa?
La prueba F se usa en el análisis de regresión para probar la hipótesis de que todos los parámetros del modelo son cero. También se usa en el análisis estadístico al comparar modelos estadísticos que se han ajustado utilizando los mismos factores y datos subyacentes para determinar el modelo con el mejor ajuste. Eso es:
La prueba F fue desarrollada por Ronald A. Fisher (por lo tanto, la prueba F) y es una medida de la relación de variaciones. La estadística F se define como:
Una regla general que se usa a menudo en el análisis de regresión es que si f> 2.5, entonces podemos rechazar la hipótesis nula. Concluiríamos que hay un valor de parámetro menos que no es cero.
La prueba F se puede realizar comparando la estadística F (calculada desde sus datos) con el valor F crítico de la tabla F como se muestra en la Tabla 15.2.6. El resultado es significativo si el estadístico F es mayor porque esto indica mayores diferencias entre los promedios de muestra. Recuerde que, como suele ser el caso con las pruebas de hipótesis, cuando acepta la hipótesis nula, tiene una conclusión débil en el sentido de que no debe creer que la hipótesis nula ha demostrado ser cierta. Su conclusión al aceptar la hipótesis nula es realmente que no hay suficiente evidencia para rechazarla.
Tabla 15.2.6. Encontrar el resultado de la prueba F utilizando el valor F crítico
Para probar el ejemplo de calidad del proveedor en el nivel del 5%, la estadística F (5.897) se puede comparar con el valor F crítico (en algún lugar entre 3.316 y 3.150 desde la tabla F o, más exactamente, 3.165). Dado que la estadística F es mayor, el resultado es significativo:
Existen diferencias significativas entre sus proveedores en términos de nivel de calidad promedio (P <0.05).
¿Cuando el valor F es significativo?
También he escrito sobre cómo interpretar R-cuadrado para evaluar la fuerza de la relación entre su modelo y la variable de respuesta.
Recientemente me han preguntado, ¿cómo se ajusta la prueba F del significado general y su valor P con estas otras estadísticas? ¡Ese es el tema de esta publicación!
En general, una prueba F en regresión compara los ajustes de diferentes modelos lineales. A diferencia de las pruebas t que solo pueden evaluar un coeficiente de regresión a la vez, la prueba F puede evaluar múltiples coeficientes simultáneamente.
La prueba F de la importancia general es una forma específica de la prueba F. Compara un modelo sin predictores con el modelo que especifique. Un modelo de regresión que no contiene predictores también se conoce como modelo de intercepción solo.
Las hipótesis para la prueba F de la importancia general son las siguientes:
- Hipótesis nula: el ajuste del modelo de intercepción y su modelo son iguales.
- Hipótesis alternativa: el ajuste del modelo de intercepción solo se reduce significativamente en comparación con su modelo.
Si el valor P para la prueba F de la prueba de significancia general es menor que su nivel de significancia, puede rechazar la hipótesis nula y concluir que su modelo proporciona un mejor ajuste que el modelo de intercepción solo.
¡Excelente! ¡Ese conjunto de términos que incluyó en su modelo mejoró el ajuste!
Por lo general, si no tiene ningún valor de P significativo para los coeficientes individuales en su modelo, la prueba F general tampoco será significativa. Sin embargo, en algunos casos, las pruebas podrían producir resultados diferentes. Por ejemplo, una prueba F general significativa podría determinar que los coeficientes no son conjuntamente iguales a cero, mientras que las pruebas para coeficientes individuales podrían determinar que todos ellos son iguales individualmente a cero.
¿Qué significa el valor crítico de F en una regresión?
Suponga que realizamos un análisis de regresión lineal múltiple utilizando horas estudiadas y de preparación de exámenes tomados como variables predictoras y puntaje final del examen como variable de respuesta. Cuando ejecutamos el análisis de regresión, recibimos el siguiente resultado:
En el análisis de regresión, la estadística F se calcula como regresión MS / MS residual. Esta estadística indica si el modelo de regresión proporciona un mejor ajuste a los datos que un modelo que no contiene variables independientes. En esencia, prueba si el modelo de regresión en su conjunto es útil.
En este ejemplo, la estadística F es 273.26 / 53.68 = 5.09.
Supongamos que queremos saber si esta estadística F es significativa en el nivel alfa = 0.05. Usando la tabla de distribución F para alfa = 0.05, con un numerador de grados de libertad 2 (df para regresión) y grados de libertad denominador 9 (df para residual), encontramos que el valor crítico F es 4.2565.
Dado que nuestra estadística F (5.09) es mayor que el valor crítico F (4.2565), podemos concluir que el modelo de regresión en su conjunto es estadísticamente significativo.
Supongamos que queremos saber si tres técnicas de estudio diferentes conducen o no a diferentes puntajes del examen. Para probar esto, reclutamos 60 estudiantes. Asignamos al azar 20 estudiantes cada uno para usar una de las tres técnicas de estudio durante un mes en preparación para un examen. Una vez que todos los estudiantes toman el examen, realizamos un ANOVA unidireccional para averiguar si estudiar la técnica tiene o no un impacto en los puntajes del examen. La siguiente tabla muestra los resultados del ANOVA unidireccional:
En un ANOVA, la estadística F se calcula como tratamiento MS / Error MS. Esta estadística indica si la puntuación media para los tres grupos es igual.
Artículos Relacionados:
