Prueba de Spearman: descubra su coeficiente de correlation

Si tiene dos variables numéricas que no están relacionadas linealmente, o si una o ambas variables son variables ordinales, aún puede medir la fuerza y ​​la dirección de su relación utilizando una estadística de correlación no paramétrica. El más común de estos es el coeficiente de correlación de rango de Spearman, ρ, que considera los rangos de los valores para las dos variables. Por ejemplo, considere las longitudes y los pesos de una muestra de cinco gatitos:

Los rangos de estos valores están en la siguiente tabla:

La correlación de Spearman es equivalente a calcular el coeficiente de correlación de Pearson en los datos clasificados. Entonces, ρ siempre será un valor entre -1 y 1. Cuanto más lejos ρ sea de cero, más fuerte es la relación entre las dos variables. El signo de ρ corresponde a la dirección de la relación. Si es positivo, entonces a medida que aumenta una variable, la otra tiende a aumentar. Si es negativo, entonces a medida que aumenta una variable, la otra tiende a disminuir.

Es posible que desee utilizar la correlación de Spearman si sus datos tienen una relación no lineal (como una relación exponencial) o si tiene uno o más valores atípicos. Sin embargo, la correlación de Spearman solo es apropiada si la relación entre sus variables es monotónica, lo que significa que a medida que aumenta una variable, la otra tiende a aumentar o disminuir (no ambas):

Puede determinar si ρ es significativamente diferente de cero ejecutando una prueba t de correlación de Pearson en las filas de las dos variables.

¿Cuándo se utiliza la prueba de Spearman?

La prueba de Spearman es una versión no paramétrica del coeficiente de correlación bivariada de Pearson paramétrico. ¿Qué significa esto? Bueno, las pruebas paramétricas y las pruebas no paramétricas se distinguen sobre la base de los supuestos que hacen sobre la naturaleza de los datos a analizar. Una prueba estadística paramétrica es una prueba que hace supuestos claros sobre las propiedades de definición o parámetros del conjunto de datos. Para que un conjunto de datos sea apropiado para la versión paramétrica del análisis correlacional (es decir, la correlación de Pearson), se deben cumplir los siguientes supuestos:

  • Cada variable debe ser de naturaleza continua. En otras palabras, cada variable puede asumir un número potencialmente infinito de valores, como evaluaciones de edad, ingresos o puntajes.
  • La forma de la relación entre las variables debe ser lineal. Esto significa que cuando se dibuja una gráfica de dispersión de las dos variables, la forma de la línea de mejor ajuste debería aproximar una línea recta en lugar de una curva.

Si se violan cualquiera de estos supuestos, debe usar la versión no paramétrica de la técnica de correlación, conocida como correlación de Spearman, prueba de orden de rango de Spearman o Rho de Spearman.

Al igual que la prueba de Pearson, la prueba de correlación de Spearman examina si dos variables están correlacionadas entre sí o no. La prueba de Spearman se puede utilizar para analizar el nivel ordinal, así como los datos de nivel continuo, porque utiliza rangos en lugar de supuestos de normalidad. Esto hace que la correlación de Spearman sea excelente para preguntas de escala Likert de 3, 5 y 7 puntos o preguntas de la encuesta ordinal.

¿Qué es el método de Spearman?

La correlación es una medida estadística que indica la medida en que dos variables fluctúan juntas. Una correlación positiva indica la medida en que esas variables aumentan o disminuyen en paralelo. Una correlación negativa indica la medida en que una variable aumenta a medida que la otra disminuye. La correlación de rango de Spearman es una medida de la correlación entre dos variables clasificadas (ordenadas). Este método mide la fuerza y ​​la dirección de la asociación entre dos conjuntos de datos cuando se clasifican por cada una de sus cantidades.

Calculemos el coeficiente de correlación de rango de Spearman entre dos variables clasificadas X e Y que ilustrarán una correlación positiva:

Beneficio comercial: esto
El análisis ayudará a la organización a evaluar la consistencia de las calificaciones
proporcionados por las dos fuentes de clasificación y observación de estudiantes. Si el ranking
Dado por ambos observadores es similar, la organización puede poner más fe en el
calificaciones que si la clasificación del observador varía ampliamente de uno a otro. Este
También reducirá la posibilidad de sistemas de clasificación sesgados o poco éticos.

Problema comercial: un
La agencia de investigación de mercado quiere agrupar a varios encuestados en grupos en grupos
Basado en la salida de correlación de rango.

Datos de entrada: respuestas
en la lealtad de la marca que contiene valores en una escala de 1 a 5, con 1 representación
desleal, 2 que significan algo desleal, y así sucesivamente, y la frecuencia de los encuestados de
Las visitas a la marca por mes (aquí los respondedores con visitas superiores a 10 por trimestre pueden ser
clasificado como «1», entre 8 y 10 como «2», y así sucesivamente).

¿Qué tipo de prueba es Spearman?

Esta página ofrece toda la información básica que necesita sobre Rho de Spearman y su prueba de significado. Es parte del módulo wiki de Statkat, que contiene páginas de información estructuradas de manera similar para muchos métodos estadísticos diferentes. Las páginas de información brindan información sobre hipótesis nulas y alternativas, suposiciones, estadísticas de prueba e intervalos de confianza, cómo encontrar valores P, SPSS y más.

Para comparar el Rho de Spearman con otros métodos estadísticos, vaya a Statkat’s o practique con Spearman’s Rho en Statkat’s

Decidir qué método estadístico usar para analizar sus datos puede ser una tarea desafiante. Si un método estadístico es apropiado para sus datos está determinado en parte por el nivel de medición de sus variables.
RHO de Spearman requiere los siguientes tipos de variables:
Tipos de variables requeridos para Rho de Spearman:

Tenga en cuenta que teóricamente, siempre es posible ‘degradar’ el nivel de medición de una variable. Por ejemplo, una prueba que se puede realizar en una variable del nivel de medición ordinal también se puede realizar en una variable de nivel de medición de intervalo, en cuyo caso la variable de intervalo se degrada a una variable ordinal. Sin embargo, la degradación del nivel de medición de variables es generalmente una mala idea, ya que significa que está tirando información importante en sus datos (una excepción es la rebaja de la relación al nivel de intervalo, que generalmente es irrelevante en el análisis de datos).

Aquí $ rho_s $ es la correlación de Spearman en la población. La correlación de Spearman es una medida para la fuerza y ​​la dirección de la relación monotónica entre dos variables del nivel de medición ordinal al menos.

¿Cuándo se usa Spearman?

El Rho de Spearman (ρ) es el coeficiente de correlación que se usa cuando las variables no son variables de intervalo sino variables ordinales. Es una prueba no paramétrica (sin hipótesis en los parámetros). De hecho, el principio de este coeficiente es aplicar la fórmula del coeficiente Bravais-Pearson no en los valores observados sino en las filas (para cada variable reemplazamos la puntuación observada por su rango). Dadas ciertas propiedades de las filas (por ejemplo, el promedio de las puntuaciones de N expresadas en la fila es igual a (n+1)/2), a menudo damos como una fórmula para calcular el Rho de Spearman una versión simplificada:

Con: di la brecha entre las filas (para cada par de observación)

■ Cuando hay ex-ecuaciones que afectamos como un rango, el promedio de los rangos que se habrían asignado a cada sujeto si no hubieran sido ex-equivo (por ejemplo, si entre el rango 4 y 9 hay 4 ex-aquos, El rango para estas cuatro observaciones será 5+6+7+8 dividido por 4, es decir, fila 6.5). Sin embargo, si el número de ecuaciones ex es importante, el coeficiente de Spearman debe corregirse (cf. el cálculo de la corrección: Rakotomalala, 2015). Tenga en cuenta: si usamos la fórmula Bravais -Pearson en los rangos (siempre afecta el rango promedio para ex -quos), no hay necesidad de corregir (¡es más simple!).

■ Este coeficiente puede hacer posible evaluar un enlace no lineal a diferencia de Bravais-Pearson, siempre que el enlace sea monótono. Cuando esta función no es monótona, el Rho de Spearman es ineficaz (como el coeficiente de Bravais Pearson).

¿Cómo se aplica la prueba de correlación de Spearman?

La prueba de correlación de rango de Spearman es una medida no paramétrica de correlación de rango. Es una prueba estadística utilizada para determinar la fuerza y ​​la dirección de la asociación entre dos variables clasificadas.

La salida se da como el coeficiente de correlación de Spearman (RS), que es un valor que varía de -1 a 1 para indicar la resistencia de la asociación.

Los siguientes valores de RS indican la dirección y la fuerza de la asociación.

  • Rs = -1: una asociación negativa perfecta
  • Rs = 0: Sin asociación
  • Rs = +1: una asociación positiva perfecta

En Excel, no hay una función para calcular el coeficiente de correlación de Spearman. En primer lugar, necesitamos clasificar las dos variables para poder calcular el coeficiente de correlación en las filas.

Este coeficiente de correlación se puede usar para crear una estadística T, que luego se puede usar para determinar el valor P.

El primer paso es crear dos nuevas variables, que serán los rangos. Aquí, le diré a Excel que clasifique los datos en orden ascendente. Esto asignará un rango de 1 al valor más pequeño y así sucesivamente.

Para hacer esto, usaremos la fórmula Rank.avg. Esta fórmula clasificará los valores en orden ascendente. Tenga en cuenta que si hay dos valores iguales, su rango se promediará.

En una columna vacía, haga clic en la primera celda y agregue la siguiente fórmula.

= Rank.avg (número, ref, [orden])
  • Rs = -1: una asociación negativa perfecta
  • Rs = 0: Sin asociación
  • Rs = +1: una asociación positiva perfecta
  • Número: la celda que contiene el primer valor de datos que desea clasificar
  • ¿Cuándo se aplica la correlación de Spearman?

    Una vez que la confiabilidad de los datos que desea analizar,
    Es importante evaluar cuánto se extraen los parámetros de las señales detectadas
    A través de los sensores inerciales colocados en el cuerpo del paciente están en
    relación con las evaluaciones proporcionadas por los médicos a través de la escala
    Clínica de prueba de control del tronco. Este aspecto asume importancia
    Fundamental, como la elección del uso de sensores inerciales
    tiene entre sus principales propósitos para reducir el
    componente subjetivo típico de la escala médica, proporcionando así datos
    más confiable y capaz de reflexionar de una manera más veraz que
    Sucede. Sin embargo, está claro que si los datos proporcionados fuera del sensor y yo
    Los puntajes asignados por el médico a través de la escala médica no presentan
    Ningún tipo de correlación entre ellos, no es posible rastrear estos
    mismos puntajes mediante el uso de sensores inerciales, como
    Esto significaría detectar un tipo diferente de información en los dos
    casos. Por lo tanto, es importante asegurarse de que estos dos métodos de evaluación,
    Aunque son diferentes, están en relación entre sí.

    La evaluación de este tipo de relación tiene lugar a través del análisis.
    Correlación [45] [46]. La correlación representa un índice en
    capaz de medir la asociación presente entre dos variables,
    permitiendo así comprender si y en qué medida cada valor
    de la primera variable corresponde a un valor del segundo. Existir
    varios coeficientes de correlación que se pueden calcular un
    dependiendo de la situación particular con la que uno está tratando [47]
    [48], incluido el coeficiente de correlación de Pearson [46]. Da
    información sobre una posible relación de linealidad entre
    Las variables comparadas y se expresan a través de (2.13).

    58
    =
    ( — ̅) ( — ̅)
    √ ̅ ( — ̅)
    2
    ( — ̅) 2
    (2.14)

    El coeficiente de correlación de Pearson ρxy puede tomar valores

    ¿Cómo se calcula la correlación de Spearman?

    ¿Cuál de las siguientes fórmulas es la del coeficiente de correlación de las filas de Spearman?

    • = 1 – 6∑ ( – 1) 
    • = 1 – 6∑ ( – 1) 
    • = 6∑ ( – 1) 
    • = 1 – 6∑ ( – 1) 
    • = 1−∑ ( – 1) 

    La fórmula del coeficiente de correlación de los rangos de Spearman (a veces simplemente llamado correlación de Spearman) es la siguiente: = 1-6∑ ( -1)  en él,  representa el coeficiente y representa El número de puntos en la serie de datos. El cuadrado de la diferencia en las filas de las dos coordenadas de cada punto ( ; ) está representado por , y la expresión   indica que debemos calcular la suma de cada uno de estos cuadrados. La fórmula fue desarrollada por Charles Spearman, un psicólogo inglés conocido por su trabajo en estadísticas. El cálculo de la correlación de los rangos es equivalente a determinar la correlación de Pearson en una nueva serie de variables: los valores de los rangos de los datos.

    La fórmula del coeficiente de correlación de los rangos de Spearman es = 1-6∑ ( – 1) , donde  es el coeficiente y es el número de puntos en la serie de datos. Para cada punto ( ; ) , el cuadrado de la diferencia en las filas de las dos coordenadas está representada por , y la suma de cada uno de estos cuadrados está representada por la expresión  .

    Ahora que tenemos una fórmula general, podemos usarla para resolver problemas. Comencemos considerando cuál es el valor del coeficiente de correlación de los rangos de Spearman cuando los elementos correspondientes en dos grupos de datos tienen los mismos rangos.

    Artículos Relacionados:

    Más posts relacionados:

    Deja una respuesta

    Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *