Antes de comenzar el proceso de calcular un ANOVA de 2 factores, necesitamos revisar varios elementos clave del estudio:
- Factores: las variables/predictores independientes
- Niveles de cada factor: cuántas condiciones/grupos/tratamientos tiene un factor
- Variable de respuesta: esta es la variable dependiente/variable de resultado/medición tomada
- Número total de condición en el experimento: esto se identifica multiplicando el número de niveles para cada factor
- Número de sujetos por condición, n: cuántos participantes están en cada nivel/grupo/tratamiento
- Número total de participantes del experimento, N: Esto se determinará por tipo de factor para cada uno. En un diseño entre grupos, habrá cuatro condiciones diferentes de los participantes. En un diseño completo de medidas repetidas, todos los participantes están en todas las condiciones. En diseño mixto, variará según el diseño del estudio para cada factor. Para este capítulo, estamos enfocados en un diseño entre temas.
Recuerde que en los experimentos que están diseñados para probar una relación de causa y efecto entre dos variables (diseños experimentales), el factor es la variable hipotetizada para hacer que algo suceda. La variable de respuesta es la variable que creemos que se verá afectada (cambiada) por el factor.
El nivel de cada factor se refiere a las categorías de un factor representado en el experimento. En nuestro ejemplo de edad y género, el número de niveles fue de 2 x 2: nos referimos al diseño por sus niveles (también puede llamarlos condiciones/grupos/tratamientos).
Nuestro ejemplo de la Tabla 1 fue un diseño de 2 x 2 porque había dos niveles de la variable de edad (es decir, más joven y mayor) y dos niveles de género (es decir, hombre y mujer).
¿Qué es ANOVA ejemplo?
ANOVA prueba la homogeneidad del promedio de la variable cuantitativa estudiada en los diferentes valores de la variable cualitativa. El análisis de la varianza, si conduce a un resultado lejos de ser cero, permite rechazar la hipótesis nula: la variable cualitativa influye efectivamente en la variable cuantitativa.
El método ANOVA se utiliza en el contexto de estudios cuantitativos en muchas áreas, para probar o verificar hipótesis. Ilustraciones:
- En el ejemplo del boletín, el equipo de marketing recopila muchos datos relacionados con la tasa de apertura. La compañía conoce en particular el sector geográfico y el sexo de cada suscriptor al boletín. La prueba ANOVA en el factor del sector geográfico no hace un enlace de dependencia en evidencia: en Burdeos, en París y en Le Havre, el promedio es similar. La prueba ANOVA en el factor sexual, por otro lado, revela una diferencia significativa: el análisis de la varianza le permite identificar este factor de influencia.
- Una encuesta nacional realizada por un instituto de encuestas revela que el 60 % de los franceses están equipados con un televisor conectado. ANOCA le informa si el factor geográfico y el nivel de ingresos son decisivos. De una ciudad a otra, no se observa una diferencia promedio significativa. Los promedios difieren, por otro lado, en gran medida dependiendo de los ingresos. El análisis de la varianza concluye así una correlación entre tener un televisor conectado y el nivel de ingresos.
- Un establecimiento de enseñanza deportiva estudia el rendimiento de sus estudiantes para mejorarlo. El establecimiento se esfuerza por comparar los resultados deportivos de varios grupos de candidatos, cada grupo después de una dieta específica. La prueba F da como resultado una relación de variaciones cercanas a 1: el factor de dieta alimentaria no afecta los resultados deportivos. El establecimiento prueba otra hipótesis: el rendimiento varía según la frecuencia de la capacitación. El análisis de la varianza verifica esta segunda hipótesis.
Estos ejemplos son ilustraciones esquematizadas del método ANOVA, en su versión univariada. En realidad, la prueba de Fisher compara variaciones no solo entre muestras, sino también dentro de las muestras. Las pruebas avanzadas, además, permiten realizar análisis multivariados, que prueban la relación de dependencia de una variable cuantitativa con varios factores cualitativos. Las herramientas de cálculo automático permiten obtener los resultados del análisis de la varianza en forma de una tabla fácilmente utilizable, el usuario se contenta con ingresar a sus datos de experiencia.
¿Qué es la ANOVA ejemplo?
ANOVA determina si los grupos creados por los niveles de la variable independiente son estadísticamente diferentes al calcular si las medias de los niveles de tratamiento son diferentes de la media general de la variable dependiente.
Si alguna de las medias del grupo es significativamente diferente de la media general, entonces la hipótesis nula es rechazada.
ANOVA utiliza la prueba F para la significación estadística. Esto permite la comparación de medios múltiples a la vez, porque el error se calcula para todo el conjunto de comparaciones en lugar de para cada comparación bidireccional individual (que ocurriría con una prueba t).
La prueba F compara la varianza en cada media del grupo a partir de la varianza general del grupo. Si la varianza dentro de los grupos es menor que la varianza entre los grupos, la prueba F encontrará un valor F más alto y, por lo tanto, una mayor probabilidad de que la diferencia observada sea real y no se debe al azar.
Los supuestos de la prueba ANOVA son los mismos que los supuestos generales para cualquier prueba paramétrica:
- Independencia de las observaciones: los datos se recopilaron utilizando métodos estadísticamente válidos, y no hay relaciones ocultas entre las observaciones. Si sus datos no cumplen con esta suposición porque tiene una variable de confusión que necesita controlar estadísticamente, use un ANOVA con variables de bloqueo.
- Variable de respuesta distribuida normalmente: los valores de la variable dependiente siguen una distribución normal.
- Homogeneidad de varianza: la variación dentro de cada grupo que se compara es similar para cada grupo. Si las variaciones son diferentes entre los grupos, entonces ANOVA probablemente no sea el adecuado para los datos.
¿Cuándo se usa el ANOVA?
Al usar el primer paso, el primer paso es el control de las contrataciones. De hecho, ANOVA es una herramienta estadística muy poderosa, pero como todas las herramientas estadísticas más fuertes, sufre enormemente si se violan las contrataciones preliminares.
Si aplica el ANOVA cuando hay una violación de la contratación preliminar, obtiene una sobreestimación del efecto y, por lo tanto, del valor p, invalidando por completo sus resultados.
El ANOVA (incluido el ANOVA one -Way) se basa en tres contrataciones:
- Distribución normal de la variable en grupos (especialmente para muestras pequeñas)
- OmoSchendesticity (es decir, demuestre que la varianza en los diferentes grupos es similar)
La prueba de contratación no significa dar por sentado en los parámetros empíricos que son respetados, sino que significa demostrar numéricamente y/o gráficamente que las contrataciones son verdaderas.
Como se mencionó al comienzo de este breve artículo, el procedimiento de cálculo de Annova es matemáticamente -Elevación, ya que tiene una serie de pasos que hacen que el cálculo no sea adecuado para aquellos que no son prácticos con los números, aunque el cálculo solo requiere aplicaciones aritméticas.
Cuando no está seguro de su comprensión y reproducción de la fórmula matemática, mi consejo siempre es hacer que el valor de la prueba F y el valor p relativo calculen cualquier software estadístico (todo el software produce el mismo número si le proporciona el mismo conjunto de datos!).
¿Cuándo se utiliza ANOVA de un factor?
Inventado por primera vez a principios de 1900 por el psicólogo Charles Spearman, el análisis factorial es el proceso por el cual un sistema complicado de muchas variables se simplifica completamente definiéndolo con un número menor de «factores». Si estos factores se pueden estudiar y determinar, pueden usarse para predecir el valor de las variables en un sistema. Un ejemplo simple sería usar la inteligencia de una persona (un factor) para predecir sus puntajes verbales, cuantitativos, de escritura y analíticos en el GRE (variables).
El análisis de varianza (ANOVA) es el método utilizado para comparar mediciones continuas para determinar si las mediciones se muestrean de las mismas distribuciones o diferentes. Es una herramienta analítica utilizada para determinar la importancia de los factores en las mediciones observando la relación entre una «variable de respuesta» cuantitativa y un «factor» explicativo propuesto. Este método es similar al proceso de comparación de la diferencia estadística entre dos muestras, ya que invoca el concepto de prueba de hipótesis. Sin embargo, en lugar de comparar dos muestras, una variable se correlaciona con uno o más factores explicativos, típicamente utilizando la estadística F. A partir de esta estadística F, el valor p se puede calcular para ver si la diferencia es significativa. Por ejemplo, si el valor p es bajo (valor p <0.05 o valor p <0.01, esto depende del nivel de importancia deseado), entonces existe una baja probabilidad de que los dos grupos sean los mismos. El método es altamente versátil, ya que puede usarse para analizar sistemas complicados, con numerosas variables y factores. En este artículo, discutiremos el cálculo involucrado en un solo factor, dos factores: sin réplicas y dos factores: con replicas ANOVA. A continuación, se encuentra una breve descripción de los diferentes tipos de ANOVA y algunos ejemplos de cuándo se pueden aplicar.
El ANOVA unidireccional se usa para probar la variación entre dos o más grupos de datos independientes, en el caso de que la varianza depende de un solo factor. Se emplea con mayor frecuencia cuando hay al menos tres grupos de datos, de lo contrario, una prueba t sería un análisis estadístico suficiente.
El ANOVA bidireccional se usa en el caso de que la varianza depende de dos factores. Hay dos casos en los que se puede emplear ANOVA bidireccional:
- Datos sin réplicas: se usa al recopilar un solo punto de datos para una condición especificada
- Datos con réplicas: utilizados al recopilar múltiples puntos de datos para una condición especificada (el número de réplicas debe especificarse y debe ser el mismo entre los grupos de datos)
- Ejemplo: hay tres reactores idénticos (R1, R2, R3) que generan el mismo producto.
- ANOVA unidireccional: desea analizar la varianza del rendimiento del producto en función del número de reactor.
- ANOVA bidireccional sin réplicas: desea analizar la varianza del rendimiento del producto en función del número de reactor y la concentración de catalizador.
- ANOVA bidireccional con réplicas: para cada concentración de catalizador, se tomaron datos triplicados. Desea analizar la varianza del rendimiento del producto en función del número de reactor y la concentración de catalizador.
Aunque ANOVA le dirá si los factores son significativamente diferentes, lo hará de acuerdo con un modelo lineal. ANOVA siempre asumirá un modelo lineal, es importante considerar interacciones no lineales fuertes que ANOVA puede no incorporar al determinar la importancia. ANOVA funciona asumiendo cada observación como medio general + efecto medio + ruido. Si hay una relación no lineal entre estos (por ejemplo, si la diferencia entre la columna 1 y la columna 2 en la misma fila es esa columna 2 = columna1^2), entonces existe la posibilidad de que ANOVA no lo atrape.
Artículos Relacionados: