Por ejemplo, los datos recopilados en, por ejemplo, cinco instrumentos tienen uno
Factor (instrumentos) en cinco niveles. El ANOVA prueba si
Los instrumentos tienen un efecto significativo en los resultados.
Se puede establecer el modelo para el análisis de varianza
En dos formas matemáticamente equivalentes. En el
Después de la discusión, cada nivel de cada factor se llama
célula. Para el caso unidireccional, una celda y un nivel son equivalentes
Dado que solo hay un factor. En el siguiente, el
subíndice I se refiere al nivel y al
subíndice j se refiere a la observación dentro
un nivel. Por ejemplo, Y23 se refiere
a la tercera observación en el segundo nivel.
- [Y_ {ij} = mu_ {i} + e_ {ij} ]
- ( hat {y_ {ij}} = hat { mu} _ {i} )
- (Y_ {ij} = mu + alpha_ {i} + e_ {ij} )
- ( hat {y} _ {ij} = hat { mu} + hat { alpha} _ {i} )
(R_ {ij} = y_ {ij} – hat { mu} – hat { alpha} _ {i} )
La distinción entre estos modelos es que el segundo
El modelo divide la media celular en una media general y el efecto
del nivel del factor I. Este segundo modelo hace el
El factor efecto más explícito, por lo que enfatizaremos este enfoque.
- Suma total de cuadrados. Los grados de libertad para
Esta entrada es el número de observaciones menos una. - Suma de cuadrados para el factor. Los grados de libertad
Para esta entrada es el número de niveles menos uno.
El cuadrado medio es la suma de cuadrados divididos
por el número de grados de libertad.
¿Cómo calcular ANOVA de un factor?
El análisis de varianza (ANOVA) es el método más utilizado de análisis estadístico de datos cuantitativos. Calcula la probabilidad de que las diferencias entre las medias observadas puedan simplemente deberse al azar. Todos los científicos deben saber cómo usarlo.
Está estrechamente relacionado con la prueba t de Student, pero mientras que la prueba t solo es adecuada para comparar dos tratamiento significa que el ANOVA puede usarse tanto para comparar varios medios como en situaciones más complejas.
El ANOVA divide la variación total en una serie de piezas, como tratamiento, bloqueo, error y total, dependiendo del diseño del experimento.
El ANOVA unidireccional se usa para un factor único entre el diseño de sujetos, es decir, para comparar dos o más medias de tratamiento.
El ANOVA bidireccional «sin interacción» se usa para comparar medias de tratamiento, pero estos surgen de un diseño de bloque aleatorizado donde el experimento se ha dividido en una serie de «mini-experimentos»
El ANOVA bidireccional «con interacción» se usa para un diseño con dos o más factores de efectos fijos, conocidos como diseño «factorial».
Se utiliza un diseño mixto (con y sin interacción) para diseños factoriales en bloques aleatorios.
Las parcelas de diagnóstico de residuos se utilizan para examinar si los datos son consistentes con los supuestos subyacentes al ANOVA. Las transformaciones de escala pueden ser necesarias para hacer un ANOVA válido.
Los gráficos de residuos se utilizan para evaluar los supuestos sobre los que depende el ANOVA.
Puede ser necesaria una transformación de escala si no se cumplen los supuestos.
¿Cómo hacer un ANOVA de un factor?
En el transcurso de los últimos capítulos, probablemente pueda detectar una tendencia general. Comenzamos a buscar herramientas que pueda usar para comparar dos grupos entre sí, especialmente la prueba (t ) (capítulo 13). Luego, introdujimos el análisis de varianza (ANOVA) como un método para comparar más de dos grupos (Capítulo 14). El capítulo sobre regresión (Capítulo 15) cubrió un tema algo diferente, pero al hacerlo introdujo una nueva idea poderosa: construir modelos estadísticos que tienen múltiples variables predictoras utilizadas para explicar una única variable de resultado. Por ejemplo, se podría utilizar un modelo de regresión para predecir el número de errores que un estudiante comete en una prueba de comprensión de lectura en función de la cantidad de horas que estudió para la prueba, y su puntaje en una prueba de IQ estandarizada. El objetivo en este capítulo es importar esta idea al marco ANOVA. Por ejemplo, supongamos que estábamos interesados en usar la prueba de comprensión de lectura para medir los logros de los estudiantes en tres escuelas diferentes, y sospechamos que las niñas y los niños se están desarrollando a diferentes tasas (por lo que se espera que tengan un rendimiento diferente en promedio). Cada estudiante se clasifica de dos maneras diferentes: sobre la base de su género y sobre la base de su escuela. Lo que nos gustaría hacer es analizar los puntajes de comprensión de lectura en términos de ambas variables de agrupación. La herramienta para hacerlo se conoce genéricamente como ANOVA factorial. Sin embargo, dado que tenemos dos variables de agrupación, a veces nos referimos al análisis como un ANOVA bidireccional, en contraste con los ANOVA unidireccionales que ejecutamos en el Capítulo 14.
Cuando discutimos el análisis de varianza en el Capítulo 14, asumimos un diseño experimental bastante simple: cada persona cae en uno de varios grupos, y queremos saber si estos grupos tienen diferentes medios en alguna variable de resultado. En esta sección, discutiré una clase más amplia de diseños experimentales, conocidos como diseños factoriales, en tenemos más de una variable de agrupación. Di un ejemplo de cómo podría surgir este tipo de diseño arriba. Otro ejemplo aparece en el Capítulo 14, en el que estábamos mirando el efecto de diferentes drogas en el estado de ánimo. Gain experimentado por cada persona. En ese capítulo encontramos un efecto significativo del fármaco, pero al final del capítulo también realizamos un análisis para ver si había un efecto de la terapia. No encontramos uno, pero hay algo un poco preocupante por tratar de ejecutar dos análisis separados tratando de predecir el mismo resultado. Tal vez en realidad hay un efecto de la terapia en el aumento del estado de ánimo, pero no pudimos encontrarlo porque estaba siendo «oculto» por el efecto de la droga. En otras palabras, queremos ejecutar un solo análisis que incluya tanto Drug como la terapia como predictores. Para este análisis, cada persona está clasificada por el fármaco que se les dio (un factor con 3 niveles) y qué terapia recibieron (un factor con 2 niveles). Nos referimos a esto como un diseño factorial (3 Times 2 ). Si tabulamos cruzado el fármaco por terapia, utilizando la función Xtabs () (ver Sección 7.1), obtenemos la siguiente tabla: 231
Como puede ver, no solo tenemos participantes correspondientes a todas las combinaciones posibles de los dos factores, lo que indica que nuestro diseño está completamente cruzado, sino que resulta que hay un número igual de personas en cada grupo. En otras palabras, tenemos un diseño equilibrado. En esta sección hablaré sobre cómo analizar los datos de los diseños equilibrados, ya que este es el caso más simple. La historia de los diseños desequilibrados es bastante tediosa, por lo que la pondremos a un lado por el momento.
Al igual que ANOVA unidireccional, Factorial ANOVA es una herramienta para probar ciertos tipos de hipótesis sobre los medios de población. Por lo tanto, un lugar sensato para comenzar sería ser explícito sobre cuáles son nuestras hipótesis. Sin embargo, antes de que podamos llegar a ese punto, es realmente útil tener una notación limpia y simple para describir los medios de población. Debido al hecho de que las observaciones están clasificadas en términos de dos factores diferentes, hay muchos medios diferentes que uno podría estar interesado. Para ver esto, comencemos por pensar en todas las diferentes muestras significa que podemos calcular para este tipo de diseño. En primer lugar, existe la idea obvia de que podríamos estar interesados en esta tabla de grupos significa:
Ahora, este resultado muestra una tabulación cruzada del grupo de grupo para todas las combinaciones posibles de los dos factores (por ejemplo, personas que recibieron el placebo y sin terapia, personas que recibieron el placebo al obtener TCC, etc.). Sin embargo, también podemos construir tablas que ignoren uno de los dos factores. Eso nos da una salida que se ve así:
Pero, por supuesto, si podemos ignorar un factor, ciertamente podemos ignorar ambos. Es decir, también podríamos estar interesados en calcular el aumento promedio del estado de ánimo en los 18 participantes, independientemente de qué drogas o terapia psicológica se les diera:
media (clin.trial $ ament.Gain)
¿Cómo calcular F en ANOVA?
- Para comprender cómo usar una prueba F para juzgar si varias medias de población son iguales.
En el Capítulo 9 «Problemas de dos muestras» vimos cómo comparar dos medias de población μ1 y μ2. En esta sección aprenderemos a comparar tres o más medios de población al mismo tiempo, lo cual a menudo es de interés en aplicaciones prácticas. Por ejemplo, un administrador de una universidad puede estar interesado en saber si los promedios de calificación de los estudiantes son los mismos para diferentes especialidades. En otro ejemplo, un oncólogo puede estar interesado en saber si los pacientes con el mismo tipo de cáncer tienen los mismos tiempos de supervivencia promedio bajo varios tratamientos de cáncer de competencia diferentes.
En general, suponga que hay K poblaciones normales con medias posiblemente diferentes, μ1, μ2,…, μK, pero todas con la misma varianza σ2. La pregunta del estudio es si todas las medias de la población K son las mismas. Formulamos esta pregunta como prueba de hipótesis
Para realizar la prueba K, las muestras aleatorias independientes se toman de las k poblaciones normales. Las medias de la muestra K, las variaciones de la muestra K y los tamaños de la muestra K se resumen en la tabla:
La media de la muestra combinada de todas las observaciones de N:
Mstmean Square para el tratamiento. Se puede considerar como la varianza entre las k muestras aleatorias independientes individuales y el cuadrado de Msemean para un error. como la varianza dentro de las muestras. Esta es la razón del nombre de «análisis de varianza», el anovanálisis de varianza universalmente abreviado. El adjetivo «unidireccional» tiene que ver con el hecho de que el esquema de muestreo es el más simple posible, la de tomar una muestra aleatoria de cada uno población bajo consideración. Si los medios de las poblaciones K son todos los mismos, entonces las dos cantidades MST y MSE deben estar cerca de las mismas, por lo que la hipótesis nula se rechazará si la relación de estas dos cantidades es significativamente mayor que 1. esto produce la siguiente prueba estadística y métodos y condiciones para su uso.
¿Cómo se interpreta el ANOVA?
El ANOVA unidireccional es una prueba de hipótesis que evalúa dos declaraciones mutuamente excluyentes sobre dos o más medios de población. Estas dos declaraciones se denominan hipótesis nula y las hipótesis alternativas. Una prueba de hipótesis utiliza datos de muestra para determinar si rechazar la hipótesis nula.
- La hipótesis nula (H0) es que las medias del grupo son iguales.
- La hipótesis alternativa (HA) es que no todas las medias grupales son iguales.
Compare el valor p con el nivel de significancia para determinar si rechazar la hipótesis nula.
El nivel de significancia (denotado por alfa o α) es el nivel máximo de riesgo aceptable para rechazar la hipótesis nula cuando la hipótesis nula es verdadera (error tipo I).
Use el nivel de significancia para decidir si rechazar o no rechazar la hipótesis nula (H0). Cuando el valor p es menor que el nivel de significancia, la interpretación habitual es que los resultados son estadísticamente significativos y usted rechazó H0.
Para ANOVA unidireccional, rechaza la hipótesis nula cuando hay evidencia suficiente para concluir que no todos los medios son iguales.
La tabla de métodos indica si Minitab supone que las variaciones de población para todos los grupos son iguales.
Mire en la columna de desviación estándar (STDEV) de la salida ANOVA unidireccional para determinar si las desviaciones estándar son aproximadamente iguales.
Si no puede asumir variaciones iguales, deseleccione asumir variaciones iguales en el cuadro sub-dialog de opciones para unidireccional
Anova. En este caso, Minitab realiza la prueba de Welch, que funciona bien cuando las variaciones no son iguales.
¿Qué significa el valor de p en una prueba ANOVA?
Para determinar si la diferencia entre las medias del grupo es estadísticamente significativa, podemos ver el valor p que corresponde al estadístico F.
Para encontrar el valor p que corresponde a este valor F, podemos usar una calculadora de distribución F con grados numeradores de libertad = TRATAMIENTO DE DF y grados de libertad denominador de libertad = error DF.
Por ejemplo, el valor p que corresponde a un valor F de 2.358, numerador DF = 2 y denominador DF = 27 es 0.1138.
Si este valor p es menor que α = .05, rechazamos la hipótesis nula del ANOVA y concluimos que existe una diferencia estadísticamente significativa entre las medias de los tres grupos.
De lo contrario, si el valor p no es menor que α = .05, entonces no rechazamos la hipótesis nula y concluyimos que no tenemos evidencia suficiente para decir que existe una diferencia estadísticamente significativa entre las medias de los tres grupos.
En este ejemplo particular, el valor p es 0.1138, por lo que no rechazaríamos la hipótesis nula. Esto significa que no tenemos evidencia suficiente para decir que existe una diferencia estadísticamente significativa entre los medios grupales.
Si el valor p de un ANOVA es inferior a .05, entonces rechazamos la hipótesis nula de que cada media de grupo es igual.
En este escenario, podemos realizar pruebas post-hoc para determinar exactamente qué grupos difieren entre sí.
Hay varias pruebas pos-hoc potenciales que podemos usar después de un ANOVA, pero las más populares incluyen:
- Prueba de tukey
Artículos Relacionados: