Coeficiente de Kendall: la medida perfecta para el orden en tus datos

Intuitivamente, la correlación de Kendall entre dos variables será alta cuando las observaciones tienen una correlación similar (o idéntica para una correlación de 1) rango (es decir, etiqueta de posición relativa de las observaciones dentro de la variable: 1 °, 2 °, 3 °, etc.) entre los dos variables y bajas cuando las observaciones tienen un rango diferente (o completamente diferente para una correlación de −1) entre las dos variables.

Let (x1, y1),…, (xn, yn) { displaystyle (x_ {1}, y_ {1}),…, (x_ {n}, y_ {n})} ser un conjunto de observaciones de las variables aleatorias conjuntas x e y, de modo que todos los valores de (xi { displaystyle x_ {i}}) y (yi { displaystyle y_ {i}}) son únicos (los lazos se descuidan por simplicidad). Cualquier par de observaciones (xi, yi) { displaystyle (x_ {i}, y_ {i})} y (xj, yj) { displayStyle (x_ {j}, y_ {j})}, donde i xj { displaystyle x_ {i}> x_ {j}} y yi> yj { displaystyle y_ {i}> y_ {j}} Holds o ambos xi

El coeficiente de rango de Kendall a menudo se usa como una estadística de prueba en una prueba de hipótesis estadística para establecer si dos variables pueden considerarse estadísticamente dependientes. Esta prueba no es paramétrica, ya que no se basa en ninguna suposición en las distribuciones de x o y o la distribución de (x, y).

¿Cómo se interpreta el coeficiente de Kendall?

¿Qué pasa con la correlación de rango de Kendall (también conocida como Kendall’s Tau-B)? ¿Qué es? ¿Cómo empiezo? ¿Cuándo uso el Tau-B de Kendall? Oye, solo enséñame todo lo que sabes sobre la correlación de Kendall Rank. “ – Una mente curiosa.

La correlación es un análisis bi-variado que mide la fuerza de asociación entre dos variables y la dirección de la relación. En términos de la fuerza de la relación, el valor del coeficiente de correlación varía entre +1 y -1. Un valor de ± 1 indica un grado perfecto de asociación entre las dos variables. A medida que el valor del coeficiente de correlación va hacia 0, la relación entre las dos variables será más débil. La dirección de la relación se indica mediante el signo del coeficiente; El signo A + indica una relación positiva y un signo indica una relación negativa.

También comúnmente conocido como «Coeficiente Tau de Kendall». El coeficiente TAU de Kendall y el coeficiente de correlación de rango de Spearman evalúan las asociaciones estadísticas basadas en las filas de los datos. La correlación de rango de Kendall (no paramétrica) es una alternativa a la correlación de Pearson (paramétrica) cuando los datos con los que está trabajando han fallado uno o más supuestos de la prueba. Esta es también la mejor alternativa a la correlación de Spearman (no paramétrica) cuando el tamaño de su muestra es pequeño y tiene muchos rangos empatados.

La correlación de rango de Kendall se utiliza para probar las similitudes en el orden de los datos cuando se clasifica por cantidades. Otros tipos de coeficientes de correlación utilizan las observaciones como base de la correlación, el coeficiente de correlación de Kendall utiliza pares de observaciones y determina la resistencia de la asociación en función del patrón sobre la concordancia y la discordancia entre los pares.

¿Cuándo se usa Tau de Kendall?

El tau de Kendall se usa para comprender la fuerza de la relación entre dos variables. Sus variables de interés pueden ser continuas u ordinales y deben tener una relación monotónica. Ver más a continuación.

El TAU de Kendall también se llama coeficiente de correlación de rango de Kendall, y el Tau-B de Kendall.

Cada método estadístico tiene suposiciones. Los supuestos significan que sus datos deben satisfacer ciertas propiedades para que los resultados del método estadístico sean precisos.

Continuo u ordinal

Las variables que le importan deben ser continuas u ordinales. Continuo significa que la variable puede asumir cualquier valor razonable. Algunos buenos ejemplos de variables continuas incluyen edad, peso, altura, puntajes de las pruebas, puntajes de encuestas, salario anual, etc. El tau de Kendall a menudo se usa para la correlación en los datos continuos si hay valores atípicos en los datos.

Las variables ordinales son categorías que tienen un orden inherente. Por ejemplo, nivel de educación (GDE/Bachelors/Masters/PhD), Nivel de ingresos (si se agrupa en alto/medio/bajo), etc.

Tus dos variables deben tener una relación monotónica. Esto significa que la dirección de la relación entre las variables es consistente. Por ejemplo, cuando sube una variable, la otra sube (en general). En este caso, una gráfica de las dos variables se movería consistentemente en la dirección de la derecha. La relación también sería monotónica si cuando suba una variable, la otra cae (en general). En este caso, la gráfica de las dos variables se movería consistentemente en la dirección hacia abajo.

¿Cuál es el rango del coeficiente de correlacion?

La función de coeficiente. La correlación devuelve el coeficiente de correlación de dos playas celulares. Use el coeficiente de correlación para determinar la relación entre dos propiedades. Por ejemplo, puede examinar la relación entre la temperatura promedio de un lugar y el uso del aire acondicionado.

La sintaxis de la función de coeficiente. La correlación contiene los siguientes argumentos:

Matriz2 obligatorio. Un segundo rango de valores celulares.

Si una matriz o una referencia como argumento contiene texto, valores lógicos o celdas vacías, estos valores no se ignoran. Por otro lado, se incluyen celdas con valores cero.

Si Matrix1 y Matrix2 tienen un número diferente de puntos de datos, #N/A.

Si Matrix1 o Matrix2 está vacío, o si la desviación estándar) de sus valores es igual a cero, ¡el #div/0! error.

En la medida en que el coeficiente de correlación está más cerca de +1 o -1, indica una correlación positiva (+1) o negativa (-1) entre las matrices. Una correlación positiva significa que si aumentan los valores de una matriz, los valores de la otra matriz también aumentan. Un coeficiente de correlación cercano a 0 indica una baja correlación o sin correlación.

La ecuación del coeficiente de correlación es la siguiente:

son los promedios de las muestras promedio (matriz1) y media (matriz2).

El siguiente ejemplo devuelve el coeficiente de correlación de los dos juegos de datos en las columnas A y B.

¿Qué valora el test de Kendall?

Descripción:

( frac {y_j – y_i} {x_j – x_i} )
<0 - el par es discordante

( frac {y_j – y_i} {x_j – x_i} )
= 0 – El par se considera un empate

( tau = frac {n_c – n_d} {n_c + n_d} )

con nc y nd denotando el
número de pares concordantes y el número de pares discordantes,
respectivamente, en la muestra. Los lazos agregan 0.5 a los concordantes
y recuentos discordantes. Existen
( izquierdo ( begin {array} {c} n \ 2 end {array} right) )
Posibles pares en la muestra bivariada.

Un valor de +1 indica que todos los pares son concordantes, un
El valor de -1 indica que todos los pares son discordantes y
Un valor de 0 indica que no hay relación (es decir, independencia).

La prueba de independencia de Kendall Tau es una prueba de si el
El coeficiente Kendall Tau es igual a cero.

Para N más grande (por ejemplo, n> 60) o el caso donde hay
son muchos lazos, el cuantil superior del p-th de Kendall Tau
La estadística puede ser aproximada por

(w_ {p} = z_ {p} frac { sqrt {2 (2n + 5)}} {3 sqrt {n (n-1)}} )

con zp y n denotando el p-th
cuantil de la distribución normal estándar y el tamaño de la muestra,
respectivamente. El cuantil inferior es el negativo de la parte superior
cuantil.

¿Cuándo se utiliza la prueba de Kendall?

El propósito de la prueba de Mann-Kendall (MK) (Mann
1945, Kendall 1975, Gilbert 1987) debe evaluar estadísticamente si
Hay una tendencia monotónica hacia arriba o hacia abajo de la variable de interés
tiempo extraordinario. Una tendencia monotónica hacia arriba (hacia abajo) significa que la variable
aumenta constantemente (disminuye) a través del tiempo, pero la tendencia puede o
puede no ser lineal. La prueba MK se puede usar en lugar de un lineal paramétrico
Análisis de regresión, que se puede usar para probar si la pendiente de la estimada
La línea de regresión lineal es diferente de cero. El análisis de regresión
requiere que los residuos de la línea de regresión ajustado sean normalmente
repartido; una suposición no requerida por la prueba MK, es decir, el MK
La prueba es una prueba no paramétrica (sin distribución).

Hirsch, Slack y Smith (1982, página 107)
indicar que la prueba MK se ve mejor como un análisis exploratorio y
se usa más apropiadamente para identificar estaciones donde los cambios son significativos
o de gran magnitud y para cuantificar estos hallazgos.

Cuando no hay tendencia presente, las medidas
(observaciones o datos) obtenidos a lo largo del tiempo son independientes e idénticamente
repartido. La suposición de independencia significa que las observaciones
no están correlacionados en serie con el tiempo.

Las observaciones obtenidas con el tiempo
son representativos de las verdaderas condiciones en los tiempos de muestreo.

La recolección de muestras, manejo y
Los métodos de medición proporcionan observaciones imparciales y representativas
de las poblaciones subyacentes a lo largo del tiempo.

¿Cómo interpretar el coeficiente de Kendall?

Como se sabe, el coeficiente de concordancia (W) de Kendall indica el grado de asociación de evaluaciones ordinales realizadas por múltiples tasadores al evaluar las mismas muestras.

Los valores del coeficiente de Kendall pueden variar de 0 a 1. Cuanto mayor sea el valor de Kendall, más fuerte es la asociación. Por lo general, los coeficientes de Kendall de 0.9 o más se consideran muy buenos. Un coeficiente de Kendall alto o significativo significa que los tasadores están aplicando esencialmente el mismo estándar al evaluar las muestras.

Kappa, otra estadística, mide el grado de acuerdo de las evaluaciones nominales u ordinales realizadas por múltiples tasadores al evaluar las mismas muestras. Los valores de Kappa varían de -1 a +1. Cuanto mayor sea el valor de Kappa, más fuerte es el acuerdo. No todos estarían de acuerdo en si, por ejemplo, 0.57 constituye un acuerdo «bueno».

Su documento citado en sí llama a esas divisiones «claramente arbitrarias». Por lo tanto, no son más científicos que cualquier otra partición que desee hacer y se usan simplemente para la discusión. Si desea seguir el modelo de ese documento, simplemente haga una división usted mismo para su discusión.

De todos modos, no podría existir una partición científica correctamente aplicable a cada situación. Si estuviera midiendo el acuerdo en la clasificación de los vinos, esperaría que sea un valor mucho más bajo que la clasificación de longitudes observadas. Por lo tanto, consideraría que los números son notablemente altos entre los catadores de vino potencialmente muy bajos entre los evaluadores de longitud.

¿Qué es el coeficiente de Spearman y Kendall?

Los análisis de correlación miden la fuerza de la relación entre dos variables.

El coeficiente de correlación de rango de Kendall y Spearman evalúa las asociaciones estadísticas basadas en las filas de los datos. Los datos de clasificación se llevan a cabo en las variables que se ordenan por separado y están numeradas.

Alinear el marco teórico, la recopilación de artículos, sintetizar brechas, articular una metodología y plan de datos claros, y escribir sobre las implicaciones teóricas y prácticas de su investigación son parte de nuestros servicios integrales de edición de tesis.

Rastree todos los cambios, luego trabaje con usted para lograr una escritura académica.
Apoyo continuo para abordar los comentarios del comité, reduciendo las revisiones.

Los coeficientes de correlación toman los valores entre menos uno y más uno. La correlación positiva significa que las filas de ambas variables están aumentando. Por otro lado, la correlación negativa significa que a medida que aumenta el rango de una variable, el rango de la otra variable disminuye.

Los análisis de correlación se pueden utilizar para evaluar las asociaciones en las pruebas de hipótesis. La hipótesis nula es que no hay asociación entre las variables en estudio. Por lo tanto, el propósito es investigar la posible asociación en las variables subyacentes. Sería incorrecto escribir la hipótesis nula como una correlación de rango entre las variables.

TAU de Kendall: generalmente valores más pequeños que la correlación Rho de Spearman. Cálculos basados en pares concordantes y discordantes. Insensible al error. Los valores de P son más precisos con tamaños de muestra más pequeños.

¿Qué indica el coeficiente de Spearman?

Una correlación de rango es cualquier estadística que mida la relación entre las clasificaciones. Una «clasificación» es la asignación de «primero», «segundo», «tercero», etc. a diferentes observaciones de una variable. [1] Un coeficiente de correlación de rango mide el grado de similitud entre dos clasificaciones.

¿Uno podría probar las universidades con un programa de baloncesto de mayor clasificación tienden a tener un programa de fútbol de mayor clasificación? Una pregunta bastante importante es ¿Las personas con educación de mayor clasificación tienden a obtener niveles más altos de ingresos?

Dave Kerby recomendó el rango-biserial como la medida para presentar a los estudiantes a la correlación de rango, porque la lógica general puede explicarse a nivel introductorio. [2]

Kerby demostró que esta correlación de rango puede expresarse en términos de dos cifras: el porcentaje de datos que respaldan una hipótesis establecida y el porcentaje de datos que no lo admiten. La fórmula de diferencia simple de Kerby establece que la correlación de rango puede expresarse como la diferencia entre la proporción de evidencia favorable (f) menos la proporción de evidencia desfavorable (U).

Suponga que un entrenador entrena a los corredores de larga distancia durante un mes utilizando dos métodos. El Grupo A tiene 5 corredores, y el Grupo B tiene 4 corredores. La hipótesis es que el método A produce corredores más rápidos. La carrera para evaluar los resultados encuentra que los corredores del Grupo A realmente corren más rápido, con los siguientes rangos: 1, 2, 3, 4 y 6. Los corredores más lentos del Grupo B tienen rango de 5, 7, 8, y 9.

El análisis se realiza en pares, un miembro de un grupo en comparación con un miembro del otro grupo. Por ejemplo, el corredor más rápido en el estudio es un miembro de cuatro pares: (1,5), (1,7), (1,8) y (1,9). Los cuatro pares respaldan la hipótesis, porque en cada par del corredor del Grupo A es más rápido que el corredor del Grupo B. Hay un total de 20 pares, y 19 pares respaldan la hipótesis. El único par que no respalda la hipótesis son los dos corredores con los rangos 5 y 6, porque en este par, el corredor del Grupo B tuvo el tiempo más rápido. Según la fórmula de diferencia simple de Kerby, el 95% de los datos respaldan la hipótesis (19 de 20 pares), y el 5% no admite (1 de 20 pares), por lo que la correlación de rango es r = .95 – .05 = .90 .

¿Qué mide el coeficiente de Kendall?

El coeficiente de correlación Tau-B (τb) de Kendall (Kendall’s Tau-B, para abreviar) es una medida no paramétrica de la fuerza y la dirección de asociación que existe entre dos variables medidas en al menos una escala ordinal. Se considera una alternativa no paramétrica a la correlación de productos de productos de Pearson cuando sus datos han fallado uno o más de los supuestos de esta prueba. También se considera una alternativa al coeficiente de correlación de orden de rango de Spearman no paramétrico (especialmente cuando tiene un tamaño de muestra pequeño con muchos rangos atados). Si considera una de sus variables como una variable independiente y la otra como una variable dependiente, podría considerar ejecutar una prueba D de Somers en su lugar.

Por ejemplo, podría usar el Tau-B de Kendall para comprender si existe una asociación entre la calificación del examen y el tiempo dedicado a la revisión (es decir, donde hubo seis calificaciones de examen posibles: A, B, C, D, E y F-y la revisión del tiempo de revisión se dividió en cinco categorías: menos de 5 horas, 5-9 horas, 10-14 horas, 15-19 horas y 20 horas o más). Alternativamente, puede usar el Tau-B de Kendall para comprender si existe una asociación entre la satisfacción del cliente y el tiempo de entrega (es decir, donde el tiempo de entrega tenía cuatro categorías: al día siguiente, 2 días hábiles, 3-5 días hábiles y más de 5 trabajadores días – y la satisfacción del cliente se midió en términos del nivel de acuerdo que los clientes tenían con la siguiente declaración: «Estoy satisfecho con el tiempo que me tomó mi paquete en entregar», donde el nivel de acuerdo tenía cinco categorías: muy de acuerdo, De acuerdo, ni de acuerdo ni en desacuerdo, en desacuerdo y en desacuerdo totalmente).

Esta guía de «inicio rápido» le muestra cómo llevar a cabo la tau-B de Kendall usando estadísticas SPSS. Le mostramos el procedimiento principal para llevar a cabo el Tau-B de Kendall en la sección de procedimientos. Sin embargo, primero le presentamos las suposiciones que debe considerar al llevar a cabo el Tau-B de Kendall.

Cuando elige analizar sus datos utilizando el TAU-B de Kendall, parte del proceso implica verificar para asegurarse de que los datos que desea analizar realmente se puedan analizar utilizando Kendall’s Tau-B. Debe hacer esto porque solo es apropiado usar el tau-B de Kendall si sus datos «pasan» los supuestos que se requieren para que el tau-b de Kendall le brinde un resultado válido. En la práctica, la verificación de estos supuestos solo agrega un poco más de tiempo a su análisis, lo que requiere que haga clic en algunos botones más en las estadísticas de SPSS al realizar su análisis, así como pensar un poco más sobre sus datos, pero no lo es. una tarea difícil. Estos dos supuestos son:

Asunción #1: Sus dos variables deben medirse a escala ordinal o continua. Los ejemplos de variables ordinales incluyen escalas Likert (por ejemplo, una escala de 7 puntos desde totalmente de acuerdo hasta totalmente en desacuerdo), entre otras formas de clasificar categorías (por ejemplo, una escala de 5 puntos que explica cuánto le gustó un cliente, desde «desde» desde » No mucho «para» sí, mucho «). Los ejemplos de variables continuas (es decir, variables de intervalo o relación) incluyen el tiempo de revisión (medido en horas), inteligencia (medida con puntaje IQ), rendimiento del examen (medido de 0 a 100), peso (medido en kg), etc. Puede obtener más información sobre las variables ordinales y continuas en nuestro artículo: tipos de variables.

¿Qué significa el coeficiente de correlación?

El coeficiente de correlación es una medida estadística que calcula la fuerza de la relación entre los movimientos relativos de dos variables. Los valores del coeficiente de correlación varían de -1.0 a 1.0. Si un número calculado es mayor que 1.0 o menor -1.0, esto indica que ha habido un error en la medición de la correlación. Esto se debe a que una correlación de -1.0 muestra una correlación negativa perfecta, mientras que una correlación de 1.0 muestra una correlación positiva perfecta. Una correlación de 0.0 significa que no existe una relación entre el movimiento de las dos variables.

Las estadísticas de correlación se pueden usar tanto en finanzas como en inversiones. Por ejemplo, se podría determinar un coeficiente de conexión para decidir el grado de relación entre el costo del aceite crudo y el costo de las acciones de una organización que proporciona aceite, por ejemplo, la Corporación Exxon Mobil. Dado que las organizaciones petroleras obtienen beneficios más notables con el aumento en el costo del petróleo, la relación entre los dos factores es profundamente positiva.

Existen algunos tipos de coeficientes de conexión, sin embargo, el más común es el Informe Pearson (R). Esto estimula la calidad y la incidencia de la conexión directa entre dos variables. No puede capturar relaciones no lineales entre dos variables y no puede distinguir entre variables dependientes e independientes. Una estimación de los métodos exactamente 1.0 permite una conexión positiva ideal entre las dos variables. Para un aumento positivo en una variable, también hay un aumento positivo en la siguiente variable. Una estimación de los métodos: 1.0 permite una conexión negativa ideal entre las dos variables. Esto muestra que los factores se mueven en reversa: para un aumento positivo en una variable, hay una reducción en la siguiente variable. En la posibilidad remota de que la conexión entre dos factores sea 0, no hay conexión entre ellos.