Coeficiente de Correlación de Spearman: cómo calcularlo y qué significa

Para llevar a cabo este análisis, primero debe verificar que las dos variables excedan una lista de verificación que consta de 3 cheques. Solo si sus datos pasan todas estas comprobaciones, puede usar la correlación de Spearman para obtener resultados válidos de sus análisis.

Los primeros dos controles son teóricos y se refieren al diseño del estudio. El tercero requiere la construcción de un diagrama de dispersión, que puede crear rápidamente tanto con Excel como con cualquier software estadístico.

Por lo tanto, este índice es adecuado para medir las relaciones entre variables a escala Likert. Por ejemplo, cuando debe indicarse cuando está de acuerdo con una determinada declaración en una escala de 5 puntos que va de «totalmente desacuerdo» a «estar totalmente de acuerdo.

Es decir, para cada unidad estadística (por ejemplo, cada entrevistado) se debe medir un valor tanto para la primera como para la segunda variable. Si los datos no han aparecido, será necesario pensar en un análisis basado en muestras independientes para examinar las relaciones entre las variables.

Una relación es monótona cuando aumentan los valores de una variable, los valores de la otra variable aumentan incluso, si no de manera lineal. O, cuando aumentan los valores de una variable, los valores de la otra variable disminuyen incluso si no de manera lineal.

Si la relación no es monótona, puede transformar una o ambas variables para tratar de hacer que la relación sea monótona y luego rehacer todas las comprobaciones. Alternativamente, puede adoptar un modelo no lineal.

¿Qué es el coeficiente de correlación de Spearman PDF?

El índice de correlación R para rangos de Spearman es una medida estadística no paramétrica de correlación. Mide el grado de relación entre dos variables y la única hipótesis solicitada es que se pueden ordenar y, si es posible, continuos.

A diferencia del coeficiente de correlación lineal de Pearson, el coeficiente de Spearman no mide una relación lineal incluso si se utilizan medidas de intervalo. De hecho, le permite establecer qué tan bien se puede describir una relación entre dos variables utilizando una función monótona.

Una generalización del coeficiente de Spearman es útil en situaciones en las que desea verificar
que las observaciones tienen lugar en un orden particular, por ejemplo, cuando desea verificar que
Los valores mejoran entre un experimento y otro. En este caso, el
Prueba de página para alternativas ordenadas desarrolladas por E. B. Page.

Para verificar la hipótesis de que ρ es significativamente diferente de scratch,
El valor observado de ρ se puede comparar con los valores críticos de la variable aleatoria de Spearman,
consultar las tablas apropiadas publicadas para diferentes porcentajes de significancia.

El signo de la correlación de Spearman indica la dirección de la asociación entre x { splatyle x} (la variable independiente) e y { displaystyle y} (la variable dependiente). Si y { splatyle y} tiende a aumentar cuando x { desplazyle x} aumenta, el coeficiente de correlación de Spearman es positivo. Si y { splatyle y} tiende a disminuir cuando x { splawyle x} aumenta, el coeficiente de correlación de Spearman es negativo. Una correlación de Spearman igual a cero indica que no hay tendencia de y { displayle y} para aumentar o disminuir cuando x { displaystyle x} aumenta. La correlación de Spearman es a medida que crece a medida que X { Splatyle x} e y { splatyle y} enfoque que las funciones monotonales son perfectamente perfectas. Cuando x { splatyle x} e y { splatyle y} están perfectamente relacionados monotónicamente, el coeficiente de correlación de Spearman es igual a 1. { displaystyle 1.} Una relación monótona perfecta creciente implica que para dos pares de valores de datos XI, yi { dongestyle x_ {i}, y_ {i}} y xj, yj, { donnestyle x_ {j}, y_ {j},} hay que xi -{ displaystyle x_ {i} -x_ {j} } y yi – -yj { splatyle y_ {i} -y_ {j}} Siempre tenga el mismo signo. Una relación decreciente monótona perfecta implica que estas diferencias siempre tienen signos opuestos.

¿Qué es el coeficiente de correlación de Spearman?

El nombre de Charles Spearman y designado por una letra griega «ρ», el coeficiente de correlación de Spearman es una técnica de análisis de datos no paramétrico. Es una medida de la fuerza y ​​la dirección de dependencia estadística en la clasificación entre dos variables. Es una medida apropiada para usar cuando las variables se miden en una escala ordinal al menos.

La correlación de Spearman no tiene hipótesis en la distribución de datos, pero se basa en las hipótesis de correlación de Pearson. Las correlaciones de Pearson son una medida estadística de la fuerza entre una relación lineal entre las variables y sus hipótesis incluyen:

  • El intervalo o el nivel de informe
  • Que está vinculado linealmente
  • Que normalmente se distribuye

En cuanto al coeficiente de correlación de Spearman, puede usarlo cuando sus datos no tienen las hipótesis anteriores.

En primer lugar, comprendamos cuál es la función monótona. Una función monótona, independientemente del aumento en la variable independiente, aumenta o nunca disminuye. El gráfico a continuación es la mejor representación de la función monótona:

  • El intervalo o el nivel de informe
  • Que está vinculado linealmente
  • Que normalmente se distribuye
  • Aumento monótono: a medida que aumenta la variable X, la variable nunca ha disminuido.
  • Disminución monótona: a medida que aumenta la variable X, la variable nunca aumenta allí.
  • No monótono: a medida que aumenta la variable X, la variable puede aumentar o disminuir.
  • ¿Qué es el coeficiente de correlación PDF?

    La covarianza de (x ) y (y ) refleja necesariamente las unidades de ambas variables aleatorias. En su lugar, es útil tener una medida de dependencia adimensional, como el coeficiente de correlación.

    Coeficiente de correlación

    Sea (x ) y (y ) cualquiera de las dos variables aleatorias (¡discretas o continuas!) Con desviaciones estándar ( sigma_x ) y ( sigma_y ), respectivamente. El coeficiente de correlación de (x ) y (y ), denotado ( text {corrr} (x, y) ) o ( rho_ {xy} ) (la letra griega «rho») es definido como:

    En la última página, determinamos que la covarianza entre (x ) y (y ) es ( frac {1} {4} ). Y se nos da que la desviación estándar de (x ) es ( frac {1} {2} ), y la desviación estándar de (y ) es la raíz cuadrada de ( frac {1 } {2} ). Por lo tanto, es un ejercicio sencillo calcular la correlación entre (x ) y (y ) usando la fórmula:

    Entonces, ahora la pregunta natural es «¿Qué nos dice eso?». Bueno, exploraremos la respuesta a esa pregunta en profundidad en la página titulada más sobre la comprensión de Rho, pero por ahora deje que la siguiente interpretación sea suficiente.

    En la página titulada más sobre la comprensión de Rho, mostraremos que (-1 leq rho_ {xy} leq 1 ). Luego, el coeficiente de correlación se interpreta como:

    • If ( rho_ {xy} = 1 ), entonces (x ) y (y ) están correlacionados perfectamente, positivo y linealmente.
    • If ( rho_ {xy} =-1 ), entonces (x ) y (y ) están correlacionados perfectamente, negativamente y linealmente.

    ¿Cómo se interpreta el coeficiente de correlacion de Spearman?

    Esas pruebas usan los datos de las dos variables y la prueba si hay una relación lineal entre ellas o no. Por lo tanto, el primer paso es verificar la relación mediante un diagrama de dispersión para la linealidad. La R de Pearson se calcula mediante una prueba paramétrica que necesita variables continuas normalmente distribuidas, y es el coeficiente de correlación más comúnmente informado. Para las distribuciones no normales (para datos con valores extremos, valores atípicos), los coeficientes de correlación deben calcularse a partir de los rangos de los datos, no a partir de sus valores reales. Los coeficientes diseñados para este propósito son Rho de Spearman (denotado como RS) y Tau de Kendall. De hecho, la normalidad es esencial para el cálculo de la importancia y los intervalos de confianza, no el coeficiente de correlación en sí. El tau de Kendall es una extensión de Rho de Spearman. Debe usarse cuando el mismo rango se repite demasiadas veces en un pequeño conjunto de datos. Algunos autores sugieren que la tau de Kendall puede dibujar generalizaciones más precisas en comparación con el Rho de Spearman en la población.

    Después del cálculo de los coeficientes anteriores, surge una pregunta interesante: ¿cómo podemos nombrar esta fuerza? Todos los investigadores tienden a informar que existe una fuerte relación entre lo que han probado. Sin embargo, la mayoría de las veces, la importancia se informa incorrectamente en lugar de la fuerza de la relación. Una correlación estadísticamente significativa no significa necesariamente que la fuerza de la correlación sea fuerte. El valor p muestra la probabilidad de que esta fuerza pueda ocurrir por casualidad. En el conjunto de datos que se muestra en la Fig. 1, el coeficiente de correlación de las presiones sanguíneas sistólicas y diastólicas fue de 0.64, con un valor p de menos de 0.0001. Esta R de 0.64 es una correlación moderada a fuerte con una importancia estadística muy alta (p <0.0001). En el mismo conjunto de datos, el coeficiente de correlación de la presión arterial diastólica y la edad fue de solo 0.31 con el mismo valor p. Aunque tiene el mismo y alto nivel de significación estadística, es débil. El bajo nivel del valor p nos asegura que el 99.99% del tiempo la correlación es débil a una R de 0.31.

    En este contexto, se debe dar la máxima importancia para evitar malentendidos al informar coeficientes de correlación y nombrar su fuerza. En la Tabla 1, proporcionamos un gráfico combinado de las tres interpretaciones más utilizadas de los valores R. Los autores de esas definiciones son de diferentes áreas de investigación y especialidades.

    Interpretación de los coeficientes de correlación de Pearson y Spearman.

    ¿Cómo se interpreta el resultado del coeficiente de correlación?

    Uno puede interpretar los coeficientes de correlación mirando el número en sí, o mirando un diagrama de dispersión correspondiente, o ambos. Para ver ejemplos de cómo interpretar el coeficiente de correlación, observe los gráficos a continuación.

    El diagrama de dispersión anterior muestra dos variables casi sin correlación. El coeficiente de correlación es en realidad -0.05. Esto indica una correlación negativa muy débil. Tenga en cuenta el grupo muy suelto de puntos que no parecen tender en ninguna dirección particular. Esto significa que las dos variables no tienen una relación real y no están en gran medida correlacionadas.

    El diagrama de dispersión anterior es muy diferente al anterior. Este gráfico muestra dos variables con una correlación de -0.69. Esto indica una fuerte correlación negativa. Tenga en cuenta el flujo de puntos desde la esquina superior izquierda de la gráfica hacia la esquina inferior de la derecha. Esto indica una correlación negativa. Además, tome nota del grupo apretado de puntos que casi forman una línea. Esto es indicativo de una fuerte correlación.

    Un diagrama de dispersión con una correlación positiva moderada.

    El diagrama de dispersión anterior muestra un conjunto de datos con una correlación de 0.47. Esto indica una correlación positiva moderada. Tenga en cuenta el flujo de los puntos desde la esquina inferior izquierda hacia la esquina superior derecha. Esto revela una correlación positiva. Además, tenga en cuenta que los puntos se agrupan con bastante fuerza, pero no tan estrechamente como el gráfico anterior. Esto indica una correlación ligeramente más débil.

    Los ejemplos hasta ahora han sido ficticios y de poca consecuencia. Pero los coeficientes de correlación son utilizados por investigadores reales para iluminar conexiones reales todo el tiempo. Tomemos, por ejemplo, investigaciones recientes sobre el tema del «calentamiento global», también conocido como «cambio climático». La teoría dice que un aumento en los gases de efecto invernadero en la atmósfera de la Tierra hará que el planeta se caliente.

    ¿Qué determina el coeficiente de Spearman?

    La correlación es una medida estadística que determina qué tan estrechamente fluctúan dos variables. Una correlación positiva muestra la medida en que esas variables aumentan o disminuyen en paralelo. Una correlación negativa muestra el rango en el que una variable aumenta a medida que la otra disminuye. En este artículo, discutiremos una de esas correlación, es decir, la correlación de rango de Spearman.

    Para comprender la correlación de rango de Spearman, es importante comprender la función monotónica. Una función monotónica es una que nunca aumenta o nunca disminuye a medida que su variable independiente cambia.

    El siguiente gráfico ilustra la función monotónica:

    • Aumento monotónicamente: a medida que aumenta la variable X, la variable Y nunca disminuye.
    • Disminución monotónica: a medida que aumenta la variable X, la variable Y nunca aumenta.
    • No monotónico: a medida que aumenta la variable X, la variable y a veces disminuye y a veces aumenta.

    La correlación de rango de Spearman mide la fuerza y ​​la dirección de asociación entre dos variables clasificadas. Básicamente da la medida de la monotonicidad de la relación entre dos variables, es decir, qué tan bien se podría representar la relación entre dos variables utilizando una función monotónica.

    Paso 2: clasifique ambos datos en orden descendente. Las calificaciones más altas obtendrán un rango de 1 y las marcas más bajas obtendrán un rango de 5.

    Paso 3: Calcule la diferencia entre los rangos (d) y el valor cuadrado de d.

    ¿Que nos indica el coeficiente de Spearman?

    Publicado en 1904 por Charles Spearman, el coeficiente de correlación de Spearman y su prueba asociada son enfoques no paramétricos para medir y probar si dos variables continuas u ordinales están correlacionadas.

    Cabe señalar que el aspecto emparejado de las dos variables es abusivo, el coeficiente se aplica tanto a las variables temporales como a las variables no remuneradas. Sería más concreto hablar de variables conjuntas.

    Para las variables continuas, optaremos por el coeficiente de correlación de Spearman a expensas de Pearson cuando estemos en presencia de una pequeña muestra.

    Finalmente, debe tener en cuenta que la correlación y la causalidad no están intrínsecamente vinculadas. De hecho, dos variables pueden correlacionarse sin la variabilidad de una explica la de la otra. Luego usamos el coeficiente de correlación parcial en este caso para determinar si la relación que une dos variables no proviene de una tercera variable oculta.

    Hipótesis preliminar: variables continuas u ordinales emparejadas.

    La idea de la fórmula del coeficiente de correlación es imaginar una función monótona para la cual las parejas de filas asociadas con las parejas de puntos estarían lo más cerca posible de la varianza de los vectores de los rangos. Al observar el número de observaciones, y en base a este principio, tenemos la siguiente fórmula:

    Al observar el número de grupos de ex-capital, respectivamente, tenemos:

    El coeficiente de correlación de Spearman varía mientras tanto. De una forma «universalmente arbitraria» de la que hablamos,

    ¿Cuándo se utiliza la correlación de Spearman?

    Correlación del momento del producto Pearson

    La correlación de Pearson evalúa la relación lineal entre dos variables continuas. Una relación es lineal cuando un cambio en una variable se asocia con un cambio proporcional en la otra variable.

    Por ejemplo, puede usar una correlación de Pearson para evaluar si los aumentos de temperatura en su instalación de producción están asociados con la disminución del grosor de su recubrimiento de chocolate.

    Correlación de orden de rango de Spearman

    La correlación de Spearman evalúa la relación monotónica entre dos variables continuas u ordinales. En una relación monotónica, las variables tienden a cambiar juntas, pero no necesariamente a un ritmo constante. El coeficiente de correlación de Spearman se basa en los valores clasificados para cada variable en lugar de los datos sin procesar.

    La correlación de Spearman a menudo se usa para evaluar las relaciones que involucran variables ordinales. Por ejemplo, puede usar una correlación de Spearman para evaluar si el orden en que los empleados completan un ejercicio de prueba están relacionados con la cantidad de meses que han sido empleados.

    Siempre es una buena idea examinar la relación entre variables con un diagrama de dispersión. Los coeficientes de correlación solo miden las relaciones lineales (Pearson) o monotónicas (Spearman). Otras relaciones son posibles.

    Si la relación es que una variable aumenta cuando la otra aumenta, pero la cantidad no es consistente, el coeficiente de correlación de Pearson es positivo pero inferior a +1. El coeficiente de Spearman todavía es igual a +1 en este caso.

    ¿Cuál es la diferencia entre correlación de Pearson y Spearman?

    Hice correlaciones entre 2 variables. Antes de eso, verifiqué si las variables se distribuyeron normalmente. Resultó algunas veces que incluso al eliminar los valores extremos/aberrantes, las variables todavía eran un poco asimétricas o el histograma ligeramente extraño. Entonces, como era difícil decir si estas variables se distribuyeron «normalmente», comparé las correlaciones de Pearson y Spearman, para ver si difieren. Dicho esto, me preguntaba si eliminar o no los valores extremos antes de comparar estas dos pruebas, ¿sabiendo que Pearson no debería tenerlas y que no es un requisito previo para Spearman…?

    Parece que tiene información falsa sobre la correlación: * «Revisé si las variables se distribuyeron normalmente» para una correlación, no hay razón para que las variables sean gaussianas. Además, en muchos casos, es imposible, por ejemplo, cuando estudia una variación temporal midiendo día tras día: el día del día no es gaussiano por definición. * Incluso al eliminar los valores extremos/aberrantes «tenga cuidado, si los valores aberrantes se eliminan, los valores extremos son parte de la serie estadística. Y eliminarlos para la continuación. *» Pearson debe no tenerlos «Es un poco más complicado que eso, simplemente, el cálculo puede perder su utilidad si uno de los puntos de la nube está muy lejos de los demás. * Finalmente, debe saber que no medimos lo mismo con estos Dos coeficientes: el coeficiente de Pearson mide el grado de alineación de la nube de puntos (por lo tanto, una forma «retorcida» tendrá un coeficiente débil); el de Spearman mide la forma en que aumenta una variable cuando la otra aumenta.

    Entonces estás calculando, pero no parece saber qué o por qué. Sin embargo, esto es lo primero que debe saber, ¿verdad?

    Es muy raro que la comparación de los dos coeficientes sea realmente útil.

    Artículos Relacionados:

    Más posts relacionados:

    Deja una respuesta

    Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *