En estadísticas, la prueba U de Mann-Whitney (también llamada Mann-Whitney-Wilcoxon (MWW/MWU), prueba de suma de rango Wilcoxon o Wilcoxon-Mann-Whitney) es una no parametricción de la hipótesis nula que, para seleccionado aleatoriamente Valores x e y De dos poblaciones, la probabilidad de que X sea mayor que y es igual a la probabilidad de que Y sea mayor que X.
Aunque Mann y Whitney [1] desarrollaron la prueba U de Mann -Whitney bajo la suposición de respuestas continuas con la hipótesis alternativa de que una distribución es estocásticamente mayor que la otra, hay muchas otras formas de formular las hipótesis nulas y alternativas de tal manera que la La prueba U de Mann – Whitney dará una prueba válida. [2]
- Las respuestas son al menos ordinales (es decir, uno puede decir al menos, de dos observaciones, que es mayor),
- Bajo la hipótesis nula H0, las distribuciones de ambas poblaciones son idénticas. [3]
- La hipótesis alternativa H1 es que las distribuciones no son idénticas.
Según la formulación general, la prueba solo es consistente cuando se produce lo siguiente bajo H1:
- Las respuestas son al menos ordinales (es decir, uno puede decir al menos, de dos observaciones, que es mayor),
- Bajo la hipótesis nula H0, las distribuciones de ambas poblaciones son idénticas. [3]
- La hipótesis alternativa H1 es que las distribuciones no son idénticas.
Bajo supuestos más estrictos que la formulación general anterior, por ejemplo, si se supone que las respuestas son continuas y la alternativa está restringida a un cambio de ubicación, es decir, F1 (x) = F2 (x + δ), podemos interpretar un significativo significativo Mann – Whitney U prueba como una diferencia en las medianas. Bajo esta suposición de cambio de ubicación, también podemos interpretar que la prueba U de Mann -Whitney evalúa si la estimación de Hodges -Lehmann de la diferencia en la tendencia central entre las dos poblaciones difiere de cero. La estimación de Hodges-Lehmann para este problema de dos muestras es la mediana de todas las diferencias posibles entre una observación en la primera muestra y una observación en la segunda muestra.
¿Qué es la prueba de U de Mann-Whitney?
La prueba compara dos poblaciones. La hipótesis nula para la prueba es que la probabilidad es del 50% de que un miembro dibujado al azar de la primera población excederá a un miembro de la segunda población.
Otra opción para la hipótesis nula es que las dos muestras provienen de la misma población (es decir, que ambos tienen la misma mediana).
El resultado de realizar una prueba U Mann Whitney es una estadística U. Para muestras pequeñas, use el método directo (ver más abajo) para encontrar la estadística de U; Para muestras más grandes, es necesaria una fórmula. O bien, puede usar tecnología como SPSS para ejecutar la prueba. Cualquiera de estas dos fórmulas son válidas para la prueba U Mann Whitney. R es la suma de los rangos en la muestra, y N es el número de elementos en la muestra.
Este método es limitado solo por la cantidad de cálculo que desea realizar. Cuanto más grande es la muestra, más compleja es las matemáticas:
- Nombre la muestra con los rangos más pequeños «Muestra 1» y la muestra con los rangos más grandes «Muestra 2». Elegir la muestra con los rangos más pequeños para ser «muestra 1» es opcional, pero facilita el cálculo.
- Tome la primera observación en la muestra 1. Cuente cuántas observaciones en la muestra 2 son más pequeñas que él. Si las observaciones son iguales, cuente como la mitad. Por ejemplo, si tiene diez que son menores y dos que son iguales: 10 + 2 (1/2) = 11.
- Repita el paso 2 para todas las observaciones en la muestra 1.
- Agregue todos sus totales de los pasos 2 y 3. Esta es la estadística U.
¿Qué mide la prueba U de Mann-Whitney?
Para realizar una prueba U de Mann-Whitney, se deben cumplir los siguientes cuatro suposiciones. Los tres primeros se relacionan con su elección de diseño de estudio, mientras que el cuarto refleja la naturaleza de sus datos:
- Asunción #1: tiene una variable dependiente que se mide a nivel continuo u ordinal. Los ejemplos de variables continuas incluyen el tiempo de revisión (medido en horas), inteligencia (medida usando la puntuación IQ), el rendimiento del examen (medido de 0 a 100), peso (medido en kg), etc. Los ejemplos de las variables ordinales incluyen elementos Likert (por ejemplo, una escala de 7 puntos desde «totalmente de acuerdo» hasta «totalmente en desacuerdo»), entre otras formas de clasificar categorías (por ejemplo, una escala de 5 puntos que explica cuánto le gustó a un cliente un producto , que van desde «no mucho» hasta «sí, mucho»).
Nota: Prácticamente hablando, su variable independiente en realidad puede tener tres o más grupos (por ejemplo, la variable independiente, «tipo de transporte», podría tener cuatro grupos: «autobús», «automóvil», «tren» y «plano»). Sin embargo, cuando ejecute el procedimiento de prueba de U Mann-Whitney en SPSS, deberá decidir qué dos grupos desea comparar (por ejemplo, puede comparar «bus» y «automóvil», o «autobús» y «avión», Etcétera).
- Asunción #1: tiene una variable dependiente que se mide a nivel continuo u ordinal. Los ejemplos de variables continuas incluyen el tiempo de revisión (medido en horas), inteligencia (medida usando la puntuación IQ), el rendimiento del examen (medido de 0 a 100), peso (medido en kg), etc. Los ejemplos de las variables ordinales incluyen elementos Likert (por ejemplo, una escala de 7 puntos desde «totalmente de acuerdo» hasta «totalmente en desacuerdo»), entre otras formas de clasificar categorías (por ejemplo, una escala de 5 puntos que explica cuánto le gustó a un cliente un producto , que van desde «no mucho» hasta «sí, mucho»).
Si no está familiarizado con ninguno de los términos anteriores, es posible que desee leer nuestros tipos de guía variable o usar nuestro selector de pruebas estadísticas para verificar que esté utilizando la prueba correcta antes de continuar, a lo que se puede acceder suscribiéndose a las estadísticas de Laerd.
¿Cuándo se utiliza una prueba de Mann-Whitney?
La prueba de Mann-Whitney es una prueba de ubicación y forma. Dadas dos muestras independientes, prueba si una variable tiende a tener valores más altos que el otro. Como afirma Altman, una forma de la estadística de prueba es una estimación de la probabilidad de que una variable sea menor que la otra, 1 aunque este estadístico no es producido por muchos paquetes estadísticos. En el caso en que la única diferencia de distribución es un cambio en la ubicación, esto puede describirse como una diferencia en las medianas. Por lo tanto, por ejemplo, el Centro de Ayuda en línea en Minitab 10.51 establece que la prueba de Mann-Whitney es «una prueba de rango de dos muestras para la diferencia entre dos medianas de población. . . Se supone que los datos son muestras aleatorias independientes de dos poblaciones que tienen la misma forma «. La Figura 11 muestra dos distribuciones para las cuales este es el caso. Una distribución se desplaza 0.75 unidades a la derecha: las medianas difieren en 0.75 unidades pero las formas son idénticas.
Dos distribuciones con una diferencia en la mediana pero sin diferencia de forma y propagación
Teóricamente, en muestras grandes, la prueba de Mann-Whitney puede detectar diferencias en la propagación incluso cuando las medianas son muy similares. Sin embargo, una forma alternativa de la prueba es mejor que la prueba estándar de Mann-Whitney para este propósito.2 La prueba alternativa, sin embargo, no es muy eficiente cuando las medianas de población son desiguales y no están ampliamente disponibles en los paquetes estadísticos.
¿Cuándo aplicar la prueba de Mann-Whitney?
Ahora veamos cuáles son los pasos que debe realizar para calcular manualmente la prueba de Mann-Whitney.
Como primer paso, todas las observaciones deben agruparse, ordenarse y asignarse a una serie de posición, donde en la posición 1 encontraremos el valor más pequeño. Por lo tanto, con esta operación está creando una variable llamada rango.
El segundo paso es calcular la UF, que se encuentra siguiendo esta fórmula:
- N1 = número de observaciones del primer grupo
- N2 = número de observaciones del segundo grupo
- R1 = suma de las posiciones (rangos) del primer grupo
- R2 = suma de los (rangos) del segundo grupo
En este punto, debe elegir un valor de ⍶ (generalmente 0.05) y, también considerando el número de muestra N1 y N2, encontrar el valor crítico correspondiente en la tabla estadística de Mann-Whitney.
En este punto, debes tomar una decisión. Si el tamaño de las dos muestras es inferior a 10, entonces desperdicie la hipótesis nada H0 si:
Por lo tanto, afirmar que Ledifference entre los dos grupos es estadísticamente significativa.
Sin embargo, si el tamaño de las dos muestras n, n> 10, su trabajo no ha terminado y debe realizar otros pasos.
Si n, n> 10, en este punto debe calcular las estadísticas z, cuya fórmula es:
Para encontrar este valor, simplemente necesita consultar la tabla de distribución normal.
Si tiene alguna dificultad para leer la tabla de distribución normal estandarizada, le dejo esta lección gratuita en la que la explico de manera rápida y rápida.
¿Cuándo usar Wilcoxon o Mann-Whitney?
En un enfoque matemático para las pruebas de hipótesis, comenzamos con un conjunto claramente definido de hipótesis y elegimos la prueba con las mejores propiedades para esas hipótesis. En la práctica, a menudo comenzamos con hipótesis menos precisas. Por ejemplo, a menudo un investigador quiere saber cuáles de los dos grupos generalmente tienen las respuestas más grandes, y una prueba t o una prueba de Wilcoxon-Mann-Whitney (WMW) podría ser aceptable. Aunque tanto las pruebas T como las pruebas WMW generalmente se asocian con hipótesis bastante diferentes, la regla de decisión y el valor p de cualquiera de las pruebas podrían estar asociados con muchos conjuntos diferentes de supuestos, que llamamos perspectivas. Es útil tener muchas de las diferentes perspectivas a las que se puede aplicar una regla de decisión recolectada en un lugar, ya que cada perspectiva permite una interpretación diferente del valor p asociado. Aquí recolectamos muchas de esas perspectivas para la prueba t de dos muestras, la prueba WMW y otras pruebas relacionadas. Discutimos validez y consistencia bajo cada perspectiva y discutimos las recomendaciones entre las pruebas a la luz de estas diferentes perspectivas. Finalmente, discutimos brevemente una regla de decisión para probar la neutralidad genética donde el conocimiento de las muchas perspectivas es vital para la interpretación adecuada de la regla de decisión.
En este artículo exploramos suposiciones para las pruebas de hipótesis estadística y cómo pueden relacionarse varios conjuntos de supuestos con la interpretación de una sola regla de decisión (DR). A menudo, las pruebas de hipótesis estadística se desarrollan bajo un conjunto de suposiciones, y posteriormente se muestra que el DR permanece válido después de relajar esos supuestos originales. En otras situaciones, las condiciones posteriores en las que se estudia el DR no son una relajación de los supuestos originales, sino una exploración de un par completamente diferente de modelos de probabilidad que no contienen completamente los modelos de probabilidad originales ni están contenidos dentro de ellos. En cualquier caso, tanto las interpretaciones originales del DR como las interpretaciones posteriores siempre están disponibles para el usuario cada vez que se aplica el DR, y el punto principal de este documento es que puede tener sentido empaquetar un solo DR con varios conjuntos de conjuntos de conjuntos de conjuntos de conjuntos de conjuntos de conjuntos de conjuntos de conjuntos de conjuntos de conjuntos de conjuntos de conjuntos de conjuntos de conjuntos de conjuntos supuestos.
Utilizamos el término «prueba de hipótesis» para denotar un DR junto con un conjunto de suposiciones que delinearan las hipótesis nulas y alternativas. Algunos DRS serán aproximadamente válidos para varios conjuntos de supuestos, y podemos empaquetar estos supuestos junto con el DR como una perspectiva múltiple DR (MPDR), donde cada perspectiva es una prueba de hipótesis diferente que usa la misma DR.
La perspectiva MPDR es una forma de observar los supuestos del DR estadístico y cómo se interpreta el DR, por lo que comenzamos en la Sección 2 discutiendo supuestos en la investigación científica en general, que muestra cómo los supuestos MPDR (es decir, supuestos estadísticos) encajan en científicos científicos inferencias. En la Sección 3 formalizamos nuestra notación y terminología en torno a MPDR. En la Sección 4 definimos el MPDR y discutimos algunas propiedades útiles. En la Sección 5 detallamos algunos MPDRS para dos pruebas de muestra de tendencia central, indicando formalmente muchas de las perspectivas y las propiedades asociadas. Este es el ejemplo principal de este documento y desarrolla casos en los que algunas perspectivas son subconjuntos de otras perspectivas dentro del mismo MPDR. En la Sección 6.1 discutimos las pruebas para los datos censurados por intervalos como un ejemplo de un uso diferente del MPDR. En este caso, la perspectiva MPDR toma dos DR diferentes desarrollados bajo dos conjuntos diferentes de suposiciones y muestra que cualquier DR puede aplicarse bajo el otro conjunto de supuestos, y podemos comparar las dos decisiones mirándolas desde la misma perspectiva (es decir, , del mismo conjunto de supuestos). En la Sección 6.2 discutimos las pruebas genéticas de neutralidad como un ejemplo de cómo tener varias perspectivas sobre un DR puede ser vital para la interpretación adecuada de la decisión.
¿Cuándo usar U de Mann-Whitney y Kruskal Wallis?
La prueba de Mann-Whitney es la alternativa no paramétrica a la prueba t a muestras independientes. Se usa cuando las muestras a comparar no presentan una distribución normal. Los requisitos necesarios son la independencia de los grupos y la homosquedasticidad. Además, debe tener datos ordinales.
La prueba le permite verificar si lo diferente entre los datos puede deberse al caso; En el caso de que la prueba demuestre que no pueden ser el resultado del caso, hablamos de «significación estadística». Se usa en situaciones donde hay dos variables nominales dicotómicas y pequeños campeones.
La prueba de chi-quadrato se usa para verificar la hipótesis de que los datos corresponden a los esperados. La idea detrás de la prueba es comparar los valores observados en los datos y los esperados si la hipótesis no es cierta.
Las pruebas no paramétricas son aquellas pruebas de hipótesis utilizadas en el campo de las estadísticas no paramétricas, el área en la que las estadísticas están libres de distribución o se basan en distribuciones cuyos parámetros no se especifican.
Las estadísticas no paramétricas son parte de las estadísticas en las que se supone que los modelos matemáticos no requieren hipótesis a priori sobre las características de la población (es decir, de un parámetro), o en cualquier caso las hipótesis son menos restrictivas que las utilizadas En estadísticas paramétricas.
Si el valor resultante de la prueba de leveno es inferior a un nivel de significancia (típicamente 0.05), es poco probable que las diferencias obtenidas en las variaciones de la muestra ocurrieron sobre la base de un muestreo aleatorio de una población con igual varianza.
Artículos Relacionados:
