La formula de Spearman es una herramienta poderosa para el analisis de datos

La fórmula para el coeficiente de correlación de rango de Spearman
es
= 1 – 6∑ ( – 1) , donde  es el
coeficiente y es el número de puntos en
el conjunto de datos. Para cada punto ( , ) ,
la plaza del
La diferencia en las filas de las dos coordenadas está representada por ,
y la suma de cada uno de estos
cuadrados está representado por la expresión
 .

Ahora que tenemos una fórmula general, podemos usarla para resolver problemas. Comencemos por considerar lo que
El valor del coeficiente de correlación de rango de Spearman será cuando los elementos correspondientes en dos
Los grupos de datos tienen los mismos rangos.

Verdadero o falso: cuando las filas de cada dos elementos correspondientes en dos grupos
de datos y
son idénticos, el coeficiente de correlación de rango de Spearman es igual a 1.

Para ayudar a responder la pregunta, veamos un
Ejemplo del mundo real. Suponer que,
en la tabla a continuación,
R y r representan las filas otorgadas a cinco perros
en una exhibición de perros de jueces
y ,
con 1 siendo el
Perro mejor clasificado y 5 siendo el perro de fondo. Las filas de los dos jueces son
idéntico, así
Podemos ver que la diferencia en las filas para cada perro, que está representada por
Rr-, o , es
igual a 0. desde 0 = 0, también podemos ver que 
es igual a 0 para cada perro.

¿Cómo se calcula el coeficiente de Spearman?

Wikihow es un «wiki»; Esto significa que muchos de nuestros artículos son el resultado de la colaboración de múltiples autores. Para crear este artículo, 37 personas, algunas de forma anónima, colaboraron haciendo cambios con el tiempo para mejorarlo.

El coeficiente de correlación para los rangos de Spearman permite identificar el grado de correlación entre dos variables en una función monótona (por ejemplo, en el caso de un aumento proporcional o proporcional inverso entre dos números). Siga esta guía simple para calcular manualmente, o saber cómo calcular el coeficiente de correlación en Excel o en el programa R.

  • Si dos (o más) dados en una columna son idénticos, encuentre el promedio de los rangos, como si los datos se hubieran clasificado normalmente, entonces clasifica los datos utilizando este promedio. En el ejemplo que se muestra correctamente, hay dos 5 que teóricamente tendrían un rango de 2 y 3. Dado que hay dos 5, usan el promedio de sus filas. El promedio de 2 y 3 es 2.5, luego asigna el rango 2.5 a ambos números 5.
  • D <- read.csv ("name_del_tuo_csv.csv") y presione enviar
  • correlación (rango (d [, 1]), rango (d [, 2]))
  • La mayoría de los datos deben contener al menos 5 parejas de datos para identificar una tendencia (se usaron 3 pares de datos en el ejemplo para facilitar la demostración).
  • El coeficiente de correlación de Spearman identificará solo el grado de correlación donde hay un aumento o disminución constante de los datos. Si utiliza un diagrama de dispersión de datos, el coeficiente de Spearman no proporcionará una representación precisa de esta correlación.
  • Esta fórmula se basa en el supuesto de que no hay correlaciones entre las variables. Cuando hay correlaciones como la ilustrada en el ejemplo, es necesario usar el índice de correlación de Pearson basado en Ran.

¿Qué mide el coeficiente de determinación?

Una vez que obtenga R, podemos calcular R2 (R-Quadrato), simplemente elevando R al cuadrado. R2 también se llama coeficiente de determinación y es un índice rico en significado, ya que expresa la variabilidad en la variable dependiente explicada por la variable independiente.

La pintura se evalúa tanto como las observaciones individuales son desviadas de la tarifa de regresión. En general, si construye dos modelos de regresión en el mismo conjunto de datos, el modelo con la mayor cantidad de pintura será el que tendrá menos discrepancias entre los valores observados y esperados de Y.

En la recolección, en las evaluaciones de rareza, la abreviatura R2 (o RR) indica que un objeto se considera muy raro.

El coeficiente de correlación es una medida específica utilizada en el análisis de la correlación para cuantificar la resistencia de la relación lineal entre dos variables. En los informes, este coeficiente se indica con la letra r.

El signo del coeficiente de regresión B indica el «verso» de la relación: el signo positivo indica una concordancia entre las variables (a un aumento en la x corresponde a un aumento en la y), el signo negativo es una discordancia (a un aumento en la x corresponde a una disminución en y).

Los coeficientes de regresión son los parámetros (v.) BI. Si la regresión es lineal, el B0 constante se llama interceta (v.), Mientras que los otros coeficientes indican la variación de la variable del empleado y en correspondencia con la variación de una unidad de las variables (v.)

¿Cuándo se usa correlación de Spearman?

Debes usar Spearman’s Rho en el siguiente escenario:

  • Quieres saber la relación entre dos variables
  • Sus variables de interés son continuas con valores atípicos u ordinales
  • Tienes solo dos variables

Aclaremos esto para ayudarlo a saber cuándo usar el rho de Spearman

Está buscando una prueba estadística para ver cómo están relacionadas dos variables. Otros tipos de análisis incluyen la prueba de una diferencia entre dos variables o predecir una variable usando otra variable (predicción).

Su variable de interés debe ser continua u ordinal. Continua significa que su variable de interés básicamente puede adquirir cualquier valor, como frecuencia cardíaca, altura, peso, número de barras de helado que puede comer en 1 minuto, etc. Spearman’s Rho a menudo se usa en datos continuos cuando los datos tienen valores atípicos .

Las variables ordinales son categorías que tienen un orden inherente. Por ejemplo, nivel de educación (GDE/Bachelors/Masters/PhD), Nivel de ingresos (si se agrupa en alto/medio/bajo), etc.

En este ejemplo, estamos interesados ​​en investigar la relación entre las horas promedio de una persona trabajadas por semana y los ingresos. Para comenzar, recopilamos estos datos de un grupo de personas.

Dependiendo de la población, una o ambas variables probablemente esté sesgada o no se ajusta a una curva de campana. Por esta razón, utilizamos Rho de Spearman en lugar de la correlación de Pearson. Comprobamos que se cumplan los otros supuestos de Rho de Spearman.

¿Qué mide la prueba de Spearman?

Los coeficientes de correlación de rango de Spearman se calculan para verificar el acuerdo sobre la clasificación de los resultados entre dos grupos, y este método se ha adoptado en este libro para comparar las clasificaciones de un sujeto entre proyectos de construcción verdes y convencionales. Sin la consideración de la normalidad o la igualdad de datos de los datos, los coeficientes de correlación de rango de Spearman se centran en las diferencias en las órdenes de rango de datos en lugar de las diferencias en las medias (Hwang et al., 2015a). La hipótesis nula H000 es que existe una correlación positiva entre las medias de los resultados para los dos grupos. El valor del coeficiente varía de – 1 a 1, con 1 y – 1 es la correlación positiva y negativa más fuerte, respectivamente. Todas las pruebas de hipótesis se realizaron a un nivel de confianza del 95% con un valor p de .05. Si un valor p es inferior a .05, la hipótesis nula fue rechazada.

La correlación de Spearman se conoce como el coeficiente de «correlación de rango» de Spearman, ya que se encuentra calculando la correlación de Pearson en los datos clasificados dentro de dos características. La correlación de Spearman a menudo se denota por la letra griega ρ y proporciona una medida de la fuerza y ​​la dirección de las asociaciones monotónicas entre las filas de las dos características. A veces se usa como alternativa al coeficiente de correlación de Pearson, ya que es menos sensible a los valores atípicos debido a la utilización de rangos en lugar de valores de datos reales en el cálculo y puede capturar la fuerza de las relaciones monotónicas más allá de las asociaciones lineales (Conover, 1999).

Se eligirá un umbral entre 0 y 1 de tal manera que si el valor absoluto de la correlación entre un par de características excede el umbral, se eliminará una de las características en el par. Sin embargo, el umbral de correlación depende de muchos factores, incluida la opinión de expertos en dominio, la calidad de los resultados finales, etc. En el Capítulo 9, se presenta la implementación del código para la eliminación automática de las características correlacionadas.

¿Cuándo se usa la prueba de Spearman?

La correlación de Spearman es el equivalente no paramétrico de la correlación de Pearson. Mide el enlace entre dos variables. Si las variables son ordinales, discretas o no siguen una ley normal, se usa la correlación de Spearman. Esta correlación no usa valores de datos sino su rango. La interpretación del coeficiente de correlación obtenido sigue siendo la misma que cuando se usa una correlación de Pearson. El coeficiente de correlación varía entre -1 y +1, 0 reflejando una relación cero entre las dos variables, un valor negativo (correlación negativa), lo que significa que cuando una de las variables aumenta, la otra disminuye; Mientras que un valor positivo (correlación positiva) indica que las dos variables varían juntas en la misma dirección.

Antes de calcular la correlación de Spearman, es necesario transformar los datos en filas. Para hacer esto, ordenamos los datos en orden creciente y reemplazamos los valores con sus filas. Cuando los valores son idénticos, se utilizará el promedio de sus filas.
Una vez que los datos se transforman en filas, podemos calcular el coeficiente de correlación de Spearman por medio de la misma fórmula que la utilizada para calcular el coeficiente de correlación de Pearson pero usando las rangos.

Como recordatorio, aquí está la fórmula para calcular el coeficiente de correlación de Spearman:

El resto del razonamiento es idéntico al coeficiente de correlación de Pearson:
El valor de RS obtenido es una estimación de la correlación entre dos variables en la población. En consecuencia, su valor fluctuará de una muestra a otra. Por lo tanto, queremos saber si, en la población, estas dos variables están realmente correlacionadas o no. Por lo tanto, debemos realizar una prueba de hipótesis.

Artículos Relacionados:

Más posts relacionados:

Deja una respuesta

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *