Descarga gratuita de la prueba de Kruskal-Wallis en PDF

La prueba de Kruskal-Wallis (después de William Kruskal y Wilson Allen Wallis), también llamada ANOVA en una fila unidireccional (o ANOVA en una fila unidireccional) es un método no paramétrico utilizado para verificar si las muestras se originan en la misma distribución. Esta prueba se centra en la mediana de la población () (o el tratamiento en la literatura en inglés) y ofrece como hipótesis, nada de que las muestras sean similares y provienen de la misma muestra (combinada) de una población. La prueba le permite comparar dos o más muestras independientes de similares o no. Generaliza la prueba de Wilcoxon-Mann-Whitney, que se utiliza para comparar solo dos grupos. El equivalente paramétrico de la prueba Kruskal-Wallis es el análisis de varianza unidireccional (ANOVA).
K { displaystyle k} k⩾3 { displaystyle k geqslant 3} k { displaystyle k}

Una prueba significativa de Kruskal-Wallis indica que al menos una muestra domina otra muestra estocásticamente. La prueba no identifica dónde ocurre este dominio estocástico o para cuántos pares de grupos de dominio estocástico ocurre. Para analizar muestras específicas para determinar el dominio estocástico, a veces se usa la prueba DUNN, las parejas de Mann-Whitney prueban sin la corrección de Bonferroni o la prueba de contenido más poderosa pero menos conocida.

Al ser un método no paramétrico, la prueba Kruskal-Wallis no adquiere una distribución normal de los residuos, a diferencia del análisis similar de la varianza unidireccional. Si el investigador puede asumir una distribución de forma y escala idéntica para todos los grupos, excepto cualquier diferencia en los medios, entonces la hipótesis no es nada que los medios de todos los grupos sean los mismos, y la hipótesis alternativa es que al menos una mediana de la mediana de la La población de un grupo es diferente de la mediana de la población de al menos otro grupo.

Clasifique todos los datos de todos los grupos juntos, o clasifique los datos de 1 a N sin crear grupos. Asigna a cualquier valor conectado el promedio de las clasificaciones que habrían obtenido si no hubieran sido conectados.
Una corrección para las conexiones si usamos la fórmula abreviada descrita en el punto anterior se puede hacer que se dividiera, donde es el número de agrupaciones de diferentes rangos conectados, y es el número de valores conectados dentro del Grupo I que están conectados a un valor especial. Esta corrección generalmente marca una pequeña diferencia para el valor de h obtenido a menos que haya una gran cantidad de conexiones. { Fracc { sum _ {i = 1} ^ {g} (t_ {i} ^ {3} -t_ { i})} {n ^ {3} -n}}} g { donnestyle g} tio { displaystyle t_ {i}}
Finalmente, la decisión de rechazar o no la hipótesis se toma al compararla con un valor crítico obtenido de una tabla o software para un nivel determinado de importancia o alfa. Si es mayor que, la hipótesis no es nada rechazada. Si esto es posible (sin conexión, muestra no demasiado grande), debería ser posible compararse con el valor crítico obtenido de la distribución exacta de. De lo contrario, la distribución puede ser aproximadamente aproximadamente mediante una distribución situada con CHI (χ 2) con grados de libertad. Si algunos valores de Ni son pequeños (por ejemplo, menos de 5), la distribución de probabilidad exacta puede ser muy diferente de esta distribución de CHI-descartada. Si hay disponible una tabla de la distribución de probabilidad de χ 2, el valor del cuadrado crítico se puede encontrar insertando la tabla de grados de libertad y mirando bajo el significado o nivel o nivel deseado. } HVS { SPLASTYLE H_ {C}} H { DisplayStyle H} H { Dongestyle H} H { Dongestyle H} G DisplayStyle H} G-1 { DisplayStyle G-1}
Si las estadísticas no son significativas, no hay evidencia de dominio estocástico entre los campeones. Sin embargo, si la prueba es significativa, al menos una muestra domina otra muestra estocásticamente. Por lo tanto, un investigador puede usar los contrastes de la muestra entre parejas de muestras individuales o pruebas post hoc utilizando la prueba DUNN, que (1) usa correctamente las mismas clasificaciones que la prueba de Kruskal-Wallis y (2) usa correctamente la varianza agregada implícita A partir de la hipótesis, nada de la prueba de Kruskal-Wallis para determinar cuál de los pares de muestras son significativamente diferentes. Al realizar contrastes de muestras o múltiples pruebas, la tasa de error de tipo de tipo tiende a inflarse, lo que aumenta las preocupaciones en comparaciones múltiples.

Se necesita una gran cantidad de recursos de cálculo para calcular las posibilidades exactas de la prueba Kruskal-Wallis. El software existente proporciona solo una probabilidad exacta para muestras de menos de 30 participantes. Este software se basa en la aproximación asintótica para muestras más grandes.

¿Qué es la prueba de Kruskal-Wallis PDF?

Supongamos que tenemos k grupos, cada uno de ellos con N observaciones. Si todas las observaciones se ordenan de la más baja a la más alta y a cada una de ellas se le asigna su propio rango, cuando obtiene la suma de los rangos para cada uno de los grupos (re), se espera que, si la hipótesis no es nada satisfecho, Todos los grupos tienen un valor similar. A partir de esta idea, las estadísticas H se calculan después de esta fórmula:

La prueba de Kruskal-Wallis solo se puede aplicar bajo ciertas hipótesis, que tendrá que verificar antes de poder llevarla a cabo:

Las muestras comparadas no necesariamente deben provenir de una distribución normal
Homosquería: dado que la hipótesis no presupone que todos los grupos pertenezcan a la misma población y, por lo tanto, tengan los mismos medios, es necesario que todos los grupos tengan la misma varianza. Esta característica específica se puede verificar a través de representaciones gráficas o mediante la aplicación de pruebas de leveno o barttlet.
La misma distribución para todos los grupos: la distribución de los grupos no debe ser necesariamente normal, como ya hemos visto, pero debe ser lo mismo en total (por ejemplo, que todos muestren asimetría a la derecha)

Si, después de analizar sus muestras y grupos, ha confirmado que ha cumplido con estos requisitos, puede comparar las estadísticas de prueba Hruskal-Walalis. Hay dos formas diferentes de comparar, y la elección de las cuales se debe usar depende del tamaño de los grupos K y el número de observaciones en cada uno.

Las muestras comparadas no necesariamente deben provenir de una distribución normal
Homosquería: dado que la hipótesis no presupone que todos los grupos pertenezcan a la misma población y, por lo tanto, tengan los mismos medios, es necesario que todos los grupos tengan la misma varianza. Esta característica específica se puede verificar a través de representaciones gráficas o mediante la aplicación de pruebas de leveno o barttlet.
La misma distribución para todos los grupos: la distribución de los grupos no debe ser necesariamente normal, como ya hemos visto, pero debe ser lo mismo en total (por ejemplo, que todos muestren asimetría a la derecha)

Si el tamaño de los grupos k es igual a 3 y el número de observaciones en cada uno no es mayor que 5, para comparar las estadísticas estadísticas H, las tablas se usan con los valores teóricos de H.

En todos los demás casos, simplemente se supone que las estadísticas h siguen una distribución de χ2 con grados de libertad K-1 (donde K es el número de grupos que se compararán).

Sin embargo, se cree que ANOVA es una técnica bastante robusta incluso en ausencia de normalidad, especialmente con campeones medianos o grandes. Por esta razón, el uso de la prueba de Kruskal-Wallis se recomienda solo cuando las poblaciones a comparar son claramente asimétricas, todo en la misma dirección y cuando su varianza es homogénea. Si la varianza no es homogénea, la prueba apropiada es un ANOVA con una corrección de Welch. En los casos en que estamos tratando con datos puramente ordinales, ANOVA no se puede utilizar.

¿Qué es la prueba de Kruskal-Wallis?

Una prueba significativa de Kruskal -Wallis indica que al menos una muestra domina estocásticamente otra muestra. La prueba no identifica dónde ocurre este dominio estocástico o para cuántos pares de grupos obtiene el dominio estocástico. Para analizar los pares de muestra específicos para el dominio estocástico, la prueba de Dunn, [5] pruebas de Mann -Whitney por pares con corrección de Bonferroni, [6] o la prueba Conover -IMan más poderosa pero menos conocida [6] a veces se usan.

Dado que es un método no paramétrico, la prueba Kruskal-Wallis no asume una distribución normal de los residuos, a diferencia del análisis de varianza unidireccional análogo. Si el investigador puede hacer los supuestos de una distribución de forma idéntica y escalada para todos los grupos, excepto por cualquier diferencia en las medianas, entonces la hipótesis nula es que las medianas de todos los grupos son iguales, y la hipótesis alternativa es que al menos una población mediana de un grupo es diferente de la mediana de la población de al menos otro grupo. De lo contrario, es imposible decir si el rechazo de la hipótesis nula proviene del cambio en ubicaciones o dispersiones grupales. Este es el mismo problema que ocurre también con la prueba de Mann-Whitney. [7] [8] [9]

N { displaystyle n} es el número total de observaciones en todos los grupos
g { displaystyle g} es el número de grupos
ni { displaystyle n_ {i}} es el número de observaciones en el grupo I { displayStyle I}
rij { displaystyle r_ {ij}} es el rango (entre todas las observaciones) de observación j { displaystyle j} del grupo I { displayStyle I}
r¯i⋅ = ∑j = 1nirijni { displaystyle { bar {r}} _ {i cdot} = { frac { sum _ {j = 1}^{n_ {i}}} {ij} }} {n_ {i}}}} es el rango promedio de todas las observaciones en el grupo I { DisplayStyle I}
r¯ = 12 (n+1) { displayStyle { bar {r}} = { tFrac {1} {2}} (n+1)} es el promedio de todos los rij { displaystyle r_ {ij} }.
Si los datos no contienen lazos, el denominador de la expresión para h { displaystyle h} es exactamente (n-1) n (n+1)/12 { displaystyle (n-1) n (n+1)/12} y r¯ = n+12 { displayStyle { bar {r}} = { tFrac {n+1} {2}}}. De este modo

H = 12n (n+1) ∑i = 1gni (r¯i⋅ – n+12) 2 = 12n (n+1) ∑i = 1gnir¯i⋅2−3 (n+1) { displaystyle { Begin {alineado} h & = { frac {12} {n (n+1)}} sum _ {i = 1}^{g} n_ {i} izquierdo ({ bar {r}} _ {i CDOT}-{ frac {n+1} {2}} right)^{2} \ & = { frac {12} {n (n+1)}} sum _ {i = 1} ^{g} n_ {i} { bar {r}} _ {i cdot}^{2}- 3 (n+1) end {alineado}}} La última fórmula solo contiene los cuadrados del promedio rangos.

¿Cuándo se utiliza la prueba de Kruskal-Wallis?

La prueba de Kruskal-Wallis, propuesta por Kruskal y Wallis en 1952, es un método no paramétrico para probar si las muestras se originan a partir de la misma distribución.597,681 extiende la prueba U de Mann-Whitney a más de dos grupos. La hipótesis nula de la prueba de Kruskal-Wallis es que los rangos medios de los grupos son las mismas. Como la ANOVA unidireccional equivalente no paramétrica, la prueba de Kruskal-Wallis se llama ANOVA unidireccional en las filas. A diferencia del ANOVA unidireccional análogo, la prueba no paramétrica de Kruskal-Wallis no asume una distribución normal de los datos subyacentes. Por lo tanto, la prueba de Kruskal-Wallis es más adecuada para el análisis de los datos del microbioma. Debido a que los datos de microbioma posteriores a la secuencia a menudo no se distribuyen normalmente y contienen algunos valores atípicos fuertes, es más apropiado usar rangos en lugar de valores reales para evitar que la prueba se vea afectada por la presencia de valores atípicos o por la distribución no normal de datos.

Los ejemplos de la utilización de la prueba de Kruskal-Wallis en estudios de microbiomas están disponibles en los trabajos.415,682–685

El método de coeficiente de correlación de Pearson también se puede emplear para evaluar las diferencias de la diversidad alfa dentro y entre grupos de intereses194,686 por la prueba U de Mann-Whitney o PermanOva.687 Por ejemplo, en los estudios de microbioma de la piel, el coeficiente de correlación de Pearson se usó a Compare la diversidad microbiana de la piel (riqueza Chao 1) con características del huésped y factores ambientales para detectar la fuerza de una asociación lineal entre ellos.688

Todos los datos se agrupan y clasifican de más pequeños (1) a más grandes (N), luego se suman las sumas de rangos en cada subgrupo, y se calcula la probabilidad. La estadística H es

¿Cuándo se debe usar las pruebas no paramétricas?

1. Si el tamaño de la muestra es muy pequeño, puede no haber una alternativa al uso de una prueba estadística, no paramétrica a menos que la naturaleza de la distribución de la población se conozca exactamente.

2. Las pruebas no paramétricas generalmente producen menos hipótesis en los datos y podrían ser más relevantes para una situación particular. Además, la hipótesis probada por la prueba no paramétrica puede ser más apropiada para la investigación de investigación.

3. Las pruebas estadísticas no paramétricas están disponibles para analizar datos que están intrínsecamente en rangos y datos cuyas puntuaciones aparentemente numéricas tienen la fuerza de los rangos. Es decir, el investigador solo puede decir sobre sus sujetos que uno tiene más o menos que las características de otro, sin poder decir más o menos.

Por ejemplo, en el estudio de una variable como la ansiedad, podríamos afirmar que el sujeto A está más ansioso que el sujeto B sin saber exactamente tanto como un ansioso.

Si los datos están intrínsecamente en rangos, o incluso si se pueden clasificar solo como más o menos (más o menos, mejor o peor), pueden tratarse con métodos no paramétricos, mientras que no pueden tratarse con métodos paramétricos a menos que ellos son hipótesis precarias y, tal vez, poco realistas, se hacen en las distribuciones a continuación.

4. Los métodos no paramétricos están disponibles para procesar datos que son simplemente clasificadores o categoriales, es decir, medidos en una escala nominal. Ninguna técnica paramétrica se aplica a dichos datos.

Descarga gratuita de la prueba de Kruskal-Wallis en PDF

¿Qué es la prueba de Kruskal-Wallis PDF?

¿Qué es la prueba de Kruskal-Wallis?

¿Cuándo se utiliza la prueba de Kruskal-Wallis?

¿Cuándo se debe usar las pruebas no paramétricas?

Más posts relacionados:

El simbolo de la media: la forma mas simple de calcular la media

Los mejores pasos para hacer un sobre para tu proyecto

Deja una respuesta Cancelar la respuesta