Ejemplos de prueba de Kruskal-Wallis: cómo optimizar su análisis

La prueba de Kruskal Wallis H usa rangos en lugar de datos reales. La prueba Kruskal Wallis es la alternativa no paramétrica al ANOVA unidireccional. No paramétrico significa que la prueba no asume que sus datos provienen de una distribución particular. La prueba H se usa cuando no se cumplen los supuestos para ANOVA (como el supuesto de normalidad). A veces se llama ANOVA unidireccional en rangos, ya que los rangos de los valores de datos se utilizan en la prueba en lugar de los puntos de datos reales.

La prueba determina si las medianas de dos o más grupos son diferentes. Como la mayoría de las pruebas estadísticas, calcula una estadística de prueba y la compara con un punto de corte de distribución. La estadística de prueba utilizada en esta prueba se llama estadística H. Las hipótesis para la prueba son:

H0: las medianas de población son iguales.
H1: Las medianas de población no son iguales.

La prueba de Kruskal Wallis le dirá si hay una diferencia significativa entre los grupos. Sin embargo, no le dirá qué grupos son diferentes. Para eso, deberá ejecutar una prueba post hoc.

H0: las medianas de población son iguales.
H1: Las medianas de población no son iguales.

Desea averiguar cómo la ansiedad de la prueba afecta los puntajes reales de las pruebas. La variable independiente «ansiedad de prueba» tiene tres niveles: sin ansiedad, ansiedad a baja cantidad y alta ansiedad. La variable dependiente es la puntuación del examen, clasificada de 0 a 100%.

Desea averiguar cómo el estado socioeconómico afecta la actitud hacia los aumentos de impuestos a las ventas. Su variable independiente es «estado socioeconómico» con tres niveles: clase trabajadora, clase media y rica. La variable dependiente se mide en una escala Likert de 5 puntos desde totalmente de acuerdo hasta estar totalmente en desacuerdo.

Una variable independiente con dos o más niveles (grupos independientes). La prueba se usa más comúnmente cuando tiene tres o más niveles. Para dos niveles, considere usar la prueba U Mann Whitney.

Sus observaciones deben ser independientes. En otras palabras, no debe haber relación entre los miembros en cada grupo o entre grupos. Para obtener más información sobre este punto, consulte: Asunción de independencia.

Todos los grupos deberían tener las mismas distribuciones de forma. La mayoría del software (es decir, SPSS, Minitab) probará esta condición como parte de la prueba.

¿Cuándo usar U de Mann Whitney y Kruskal-Wallis?

Acabamos de lanzar una actualización de nuestras bibliotecas numéricas de optimización extrema para .NET que agrega algunas clases nuevas. Hemos agregado dos pruebas no paramétricas: las pruebas de Mann-Whitney y Kruskal-Wallis. Estos se utilizan para probar la hipótesis de que dos o más muestras se extrajeron de la misma distribución. La prueba de Mann-Whitney se usa para dos muestras. La prueba de Kruskal-Wallis se usa cuando hay dos o más muestras.

Para ambas pruebas, la estadística de prueba solo depende de los rangos de las observaciones en la muestra combinada, y no se hace ninguna suposición sobre la distribución de las poblaciones. Este es el significado del término no paramétrico en este contexto.

La prueba de Mann-Whitney, a veces también llamada prueba de Wilcoxon-Mann-Whitney o la prueba de suma de rango de Wilcoxon, a menudo se interpreta para probar si la mediana de las distribuciones es la misma. Aunque una diferencia en la mediana es el diferenciador dominante si está presente, otros factores como la forma o la propagación de las distribuciones también pueden ser significativos.

Para tamaños de muestra relativamente pequeños, y si no hay vínculos presentes, devolvemos un resultado exacto para la prueba de Mann-Whitney. Para muestras más grandes o cuando algunas observaciones tienen el mismo valor, se usa la aproximación normal común.

La prueba Kruskal-Wallis es una extensión de la prueba de Mann-Whitney a más de dos muestras. Siempre usamos una aproximación para la distribución. La aproximación más común es a través de una distribución de chi-cuadrado. Elegimos ir con una aproximación en términos de la distribución beta que generalmente es más confiable, especialmente para tamaños de muestra más pequeños. Para comparar con otro software estadístico, el valor p-cuadrado también está disponible.

¿Qué diferencias existe entre las pruebas de Kruskal Wallis y Mann-Whitney?

Estoy de acuerdo con la respuesta de Michael Chernick, pero creo que se puede hacer un poco más fuerte. Ignore el límite de 0.05 en la mayoría de las circunstancias. Solo es relevante para el enfoque Neyman-Pearson que es en gran medida irrelevante para el uso inferencial de estadísticas en muchas áreas de la ciencia.

Ambas pruebas indican que sus datos contienen evidencia moderada contra la hipótesis nula. Considere esa evidencia a la luz de lo que sepa sobre el sistema y las consecuencias que se derivan de las decisiones (o indecisión) sobre el estado del mundo real. Argumentar un caso razonado y proceder de una manera que reconoce la posibilidad de reevaluación posterior.

La prueba de Mann-Whitney o Wilcoxon compara dos grupos, mientras que la prueba de Kruskal-Wallis se compara 3. Al igual que en el ANOVA ordinario con tres o más grupos, el procedimiento generalmente sugirió es hacer la prueba ANOVA F general primero y luego mirar las comparaciones por pares en Caso hay una diferencia significativa. Haría lo mismo aquí con el ANOVA no paramétrico. Mi interpetación de su resultado es que hay marginalmente una diferencia significativa entre los grupos en el nivel 0.05 y si acepta que la diferencia basada en la prueba de Mann-Whitney indica que podría atribuirse a G $ _1 $ y G $ _2 $ significativamente diferente.

¡No te cuelen con la magia del nivel de significancia de 0.05! El hecho de que la prueba de Kruskal-Wallis proporcione un valor P ligeramente más de 0.05, no tome eso como que no hay diferencias estadísticamente significativas entre los grupos. Además, el hecho de que la prueba de Mann-Whitney proporcione un valor P para la diferencia entre G $ _1 $ y G $ _2 $ un poco por debajo de 0.03 no hace que la diferencia entre los dos grupos sea muy significativa. Ambos valores P están cerca de 0.05. Un conjunto de datos ligeramente diferente podría cambiar fácilmente al valor p de Kruskal-Wallis por eso.

¿Cuándo se debe utilizar Kruskal Wallis?

Use la prueba Kruskal -Wallis cuando tenga una variable nominal y una variable clasificada. Prueba si los rangos medios son los mismos en todos los grupos.

El uso más común de la prueba de Kruskal-Wallis es cuando tiene una variable nominal y una variable de medición, un experimento que generalmente analizaría utilizando ANOVA unidireccional, pero la variable de medición no cumple con la suposición de normalidad de un unidireccional. Anova. Algunas personas tienen la actitud de que, a menos que tenga un tamaño de muestra grande y pueda demostrar claramente que sus datos son normales, debe usar rutinariamente Kruskal -Wallis; Piensan que es peligroso usar ANOVA unidireccional, que asume la normalidad, cuando no sabe con certeza que sus datos son normales. Sin embargo, el ANOVA unidireccional no es muy sensible a las desviaciones de la normalidad. He realizado simulaciones con una variedad de distribuciones no normales, incluidas las plantas, altamente máximas, altamente sesgadas y bimodales, y la proporción de falsos positivos siempre es de alrededor del 5% o un poco más bajo, tal como debería ser. Por esta razón, no recomiendo la prueba Kruskal-Wallis como alternativa al ANOVA unidireccional. Debido a que muchas personas lo usan, debes estar familiarizado con él incluso si te convenceo de que se usa en exceso.

La prueba Kruskal-Wallis es una prueba no paramétrica, lo que significa que no supone que los datos provienen de una distribución que puede describirse completamente por dos parámetros, media y desviación estándar (la forma en que puede una distribución normal). Al igual que la mayoría de las pruebas no paramétricas, lo realiza en datos clasificados, por lo que convierte las observaciones de medición en sus filas en el conjunto de datos general: el valor más pequeño obtiene un rango de 1, el siguiente más pequeño obtiene un rango de 2, y así sucesivamente . Pierde información cuando sustituye los rangos por los valores originales, lo que puede hacer de esta una prueba algo menos poderosa que un ANOVA unidireccional; Esta es otra razón para preferir ANOVA unidireccional.

La otra suposición de ANOVA unidireccional es que la variación dentro de los grupos es igual (homoscedasticidad). Si bien Kruskal-Wallis no supone que los datos son normales, sí supone que los diferentes grupos tienen la misma distribución, y los grupos con diferentes desviaciones estándar tienen diferentes distribuciones. Si sus datos son heteroscedásticos, Kruskal-Wallis no es mejor que ANOVA unidireccional, y puede ser peor. En cambio, debe usar el ANOVA de Welch para datos hétecedastic.

La única vez que recomiendo usar Kruskal-Wallis es cuando su conjunto de datos original consiste en una variable nominal y una variable clasificada; En este caso, no puede hacer un ANOVA unidireccional y debe usar la prueba Kruskal-Wallis. Las jerarquías de dominio (en biología conductual) y las etapas de desarrollo son las únicas variables clasificadas en las que puedo pensar que son comunes en biología.

¿Cómo hacer la prueba de Kruskal-Wallis en Minitab?

El análisis de varianza unidireccional de Kruskal Wallis es una prueba de hipótesis estadística para comparar las medianas entre más de dos grupos.

Hipótesis nula (H0): η1 = η2 =… = ηk
Hipótesis alternativa (HA): al menos una de las medianas es diferente de otras donde:
ηi es la mediana de la población i
k es el número de grupos de nuestro interés

Es una extensión de la prueba de Mann -Whitney. Si bien la prueba de Mann -Whitney nos permite comparar las muestras de dos poblaciones, la prueba Kruskal -Wallis nos permite comparar las muestras de más de dos poblaciones. Una diferencia clave entre esta prueba y la prueba de Mann -Whitney es la robustez de la prueba cuando las poblaciones no tienen forma idéntica. Si este es el caso, hay una prueba diferente, llamada mediana de Mood, que es más apropiada.

Hipótesis nula (H0): η1 = η2 =… = ηk
Hipótesis alternativa (HA): al menos una de las medianas es diferente de otras donde:
ηi es la mediana de la población i
k es el número de grupos de nuestro interés

Los datos de muestra extraídos de las poblaciones de interés son imparciales y representativos.

Los datos de las poblaciones K son continuas u ordinales cuando el espacio entre los valores adyacentes no es constante.

Las poblaciones K son independientes entre sí.

La prueba de Kruskal-Wallis es robusta para la población no distribuida normalmente.

La prueba Kruskal -Wallis funciona de manera muy similar a la prueba de Mann -Whitney. Paso 1: Agrupe las muestras K de las poblaciones K (la muestra I es de la población I) en un solo conjunto de datos y luego ordene los datos en orden ascendente clasificado de 1 a N, donde N es el número total de observaciones en los grupos K. Paso 2: Agregue los rangos para todas las observaciones de la muestra I y llame RI, donde puedo ser entero entre 1 y k.

¿Cómo se hace la prueba de Kruskal Wallis?

La prueba Kruskal-Wallis es una alternativa libre de distribución para un ANOVA: básicamente queremos saber si 3+ poblaciones tienen medias iguales en alguna variable. Sin embargo,

ANOVA no es adecuado si la variable dependiente es ordinal;
ANOVA requiere que la variable dependiente se distribuya normalmente en cada subpoblación, especialmente si los tamaños de muestra son pequeños.

La prueba Kruskal-Wallis es una alternativa adecuada para ANOVA si los tamaños de muestra son pequeños y/o la variable dependiente es ordinal.

Un hospital ejecuta un piloto rápido en 3 vacunas: administran cada una a n = 5 participantes. Después de una semana, miden la cantidad de anticuerpos en la sangre de los participantes. Los datos así obtenidos se encuentran en esta hoja de Google, en parte que se muestra a continuación.

Ahora, nos gustaría saber si algunas vacunas desencadenan más anticuerpos que otros en las poblaciones subyacentes. Dado que los anticuerpos son una variable cuantitativa, ANOVA parece la elección correcta aquí.

Sin embargo, ANOVA requiere que los anticuerpos se distribuyan normalmente en cada subpoblación. Y debido a nuestros tamaños de muestra mínimos, no podemos confiar en el teorema del límite central como lo hacemos generalmente (o de todos modos). Y encima de eso,
Nuestros tamaños de muestra son demasiado pequeños para examinar la normalidad.
Solo el énfasis de este punto, los histogramas para los anticuerpos por grupo se muestran a continuación.

En todo caso, los dos histogramas inferiores parecen ligeramente sesgados positivamente. Esto tiene sentido porque la cantidad de anticuerpos tiene un límite inferior de cero pero sin límite superior. Sin embargo, las especulaciones sobre las distribuciones de población no se ponen más serias que eso.

¿Cuándo se hace la prueba de Kruskal Wallis?

Como se mencionó anteriormente, la prueba Kruskal-Wallis permite comparar tres o más grupos. Más precisamente, se utiliza para comparar tres o más grupos en términos de una variable cuantitativa. Se puede ver como la extensión de la prueba de Mann-Whitney que permite comparar 2 grupos bajo la suposición de no normalidad.

En el contexto de nuestro ejemplo, vamos a usar la prueba de Kruskal-Wallis para ayudarnos a responder la siguiente pregunta: «¿Es la longitud de las aletas diferentes entre las 3 especies de pingüinos?»

Las hipótesis nulas y alternativas de la prueba de Kruskal-Wallis son:

(H_0 ): las 3 especies son iguales en términos de longitud de la aleta
(H_1 ): al menos una especie es diferente de las otras 2 especies en términos de longitud de la aleta

Tenga cuidado de que, en cuanto al ANOVA, la hipótesis alternativa no es que todas las especies sean diferentes en términos de longitud de la aleta. Lo contrario de todas las especies en igualdad ( (H_0 )) es que al menos una especie es diferente de las otras ( (H_1 )). En este sentido, si se rechaza la hipótesis nula, significa que al menos una especie es diferente de las otras 2, pero no necesariamente que las 3 especies son diferentes entre sí. Podría ser que la longitud de la aleta para la especie Gentoo es diferente a la de las especies Chinstrap y Adelie, pero la longitud de la aleta es similar entre la barbilla y la Adelie. Se deben realizar otros tipos de prueba (conocidos como pruebas post-hoc y cubiertas más tarde) para probar si las 3 especies difieren.

Ejemplos de prueba de Kruskal-Wallis: cómo optimizar su análisis

¿Cuándo usar U de Mann Whitney y Kruskal-Wallis?

¿Qué diferencias existe entre las pruebas de Kruskal Wallis y Mann-Whitney?

¿Cuándo se debe utilizar Kruskal Wallis?

¿Cómo hacer la prueba de Kruskal-Wallis en Minitab?

¿Cómo se hace la prueba de Kruskal Wallis?

¿Cuándo se hace la prueba de Kruskal Wallis?

Más posts relacionados:

Ciencias de la salud: ejemplos de estudios y aplicaciones

Ejemplos de la Pirámide de Maslow: cómo la jerarquía de necesidades afecta nuestra vida cotidiana

Deja una respuesta Cancelar la respuesta