¿Qué es la prueba de correlación y cómo se realiza?

Las pruebas de correlación se utilizan para probar la asociación entre dos variables cuantitativas. Disponible en Excel utilizando el software estadístico de complemento XLSTAT.

Esta herramienta para calcular diferentes tipos de coeficientes de correlación, entre dos o más variables, y para determinar si las correlaciones son significativas o no.

XLSTAT propone tres coeficientes de correlación para calcular la correlación entre un conjunto de variables cuantitativas, ya sean continuas, discretas u ordinales:

El coeficiente de Pearson corresponde al coeficiente de correlación lineal clásico. Este coeficiente es muy adecuado para datos continuos. Su valor varía de -1 a 1, y mide el grado de correlación lineal entre dos variables.

Nota: El coeficiente de correlación de Pearson al cuadrado da una idea de cuánto de la variabilidad de una variable se explica por la otra variable. Los valores p que se calculan para cada coeficiente permiten probar la hipótesis nula de que los coeficientes no son significativamente diferentes de 0. Sin embargo, uno debe ser cauteloso al interpretar estos resultados, como si dos variables fueran independientes, su coeficiente de correlación es cero, Pero el recíproco no es cierto.

El coeficiente de Spearman se basa en las filas de las observaciones y no en su valor. Por lo tanto, puede considerarse como no paramétrico. Este coeficiente se adapta a los datos ordinales. Uno puede interpretar este coeficiente en términos de variabilidad explicada de los rangos.

¿Cómo se hace un análisis de correlación?

Para realizar el análisis de correlación, debe haber datos suficientes para las variables bajo cuestión. Una vez que hay suficientes datos, estos datos se conectaron a una fórmula desarrollada por Karl Pearson. Esta fórmula se llamaba famosa coeficiente de correlación de Karl Pearson. Esto implicó un cálculo complejo y exigió la presencia de un estadístico en el equipo Six Sigma.

Sin embargo, afortunadamente hoy en día la mayoría de los cálculos son realizados por una herramienta de software. Los humanos involucrados simplemente deben saber cómo agregar datos a la herramienta y cómo interpretar los resultados.

El análisis de correlación generalmente nos da un resultado número que se encuentra entre +1 y -1. El signo +VE o VE denota la dirección de la correlación. El signo positivo denota la correlación directa, mientras que el signo negativo denota la correlación inversa.

Cero no significa correlación. Y cuanto más cerca se mueve el número hacia 1, más fuerte es la correlación. Por lo general, para que la correlación se considere significativa, la correlación debe ser 0.5 o más en cualquier dirección.

El análisis de correlación solo confirma el hecho de que algunos datos dados se mueven en conjunto. Una implicación peligrosa que hacen los gerentes es de causalidad. Según el análisis de correlación, es imposible decir qué variable es la causa y cuál es el efecto. También es probable que ambas variables se muevan en conjunto porque se ven afectadas por una tercera variable común. Sin embargo, estos son solo casos y el hecho es que hay otros análisis disponibles para descubrir la relación causal. Sin embargo, en la mayoría de los casos, el hecho de que las variables tienen una correlación es suficiente para tomar medidas relevantes.

¿Cómo se hace correlación?

Para realizar el análisis de correlación, debe haber datos suficientes para las variables bajo cuestión. Una vez que hay suficientes datos, estos datos se conectaron a una fórmula desarrollada por Karl Pearson. Esta fórmula se llamaba famosa coeficiente de correlación de Karl Pearson. Esto implicó un cálculo complejo y exigió la presencia de un estadístico en el equipo Six Sigma.

Sin embargo, afortunadamente hoy en día la mayoría de los cálculos son realizados por una herramienta de software. Los humanos involucrados simplemente deben saber cómo agregar datos a la herramienta y cómo interpretar los resultados.

El análisis de correlación generalmente nos da un resultado número que se encuentra entre +1 y -1. El signo +VE o VE denota la dirección de la correlación. El signo positivo denota la correlación directa, mientras que el signo negativo denota la correlación inversa.

Cero no significa correlación. Y cuanto más cerca se mueve el número hacia 1, más fuerte es la correlación. Por lo general, para que la correlación se considere significativa, la correlación debe ser 0.5 o más en cualquier dirección.

El análisis de correlación solo confirma el hecho de que algunos datos dados se mueven en conjunto. Una implicación peligrosa que hacen los gerentes es de causalidad. Según el análisis de correlación, es imposible decir qué variable es la causa y cuál es el efecto. También es probable que ambas variables se muevan en conjunto porque se ven afectadas por una tercera variable común. Sin embargo, estos son solo casos y el hecho es que hay otros análisis disponibles para descubrir la relación causal. Sin embargo, en la mayoría de los casos, el hecho de que las variables tienen una correlación es suficiente para tomar medidas relevantes.

¿Cómo hacer un análisis de correlación de Pearson?

Se utiliza una matriz de correlación para evaluar las dependencias entre varias variables al mismo tiempo. El resultado es una tabla que contiene los coeficientes de correlación entre cada variable y las demás.

Existen diferentes métodos de prueba de correlación: la prueba de correlación de Pearson, la correlación de Kendall y la de Spearman que son pruebas de fila. Estos métodos se discuten en las siguientes secciones.

La matriz de correlación se puede visualizar utilizando un correlograma. El objetivo de este artículo es mostrarle cómo calcular y visualizar una matriz de correlación en R.

Como puede saber, R Cor () de R se puede usar para calcular la matriz de correlación. Un formato simplificado de la función es:

# X es una variable de la matriz o tipo de datos
Cor (x, método = c ("Pearson", "Kendall", "Spearman"))))

El argumento del método indica el tipo de coeficiente de correlación a calcular. El valor predeterminado es el coeficiente de correlación de Pearson, que mide una dependencia lineal entre dos variables. Los métodos de correlación de Kendall y Spearman son pruebas de correlación no paramétricas basadas en una prueba de fila.

La tabla de datos MTCARS disponible en R se usa en los siguientes ejemplos para calcular la matriz de correlación.

En la tabla anterior, los coeficientes de correlación se muestran entre los diferentes pares posibles de variables.

¿Que permite la prueba de correlación?

* Escribí este libro para mis alumnos en la Universidad de Hawai que, como era cuando era estudiante, quedó perplejo por este extraño animal llamado coeficiente de correlación y el significado de todos esos números llamados correlaciones.

INTRODUCCIÓN

Hay pocas dudas de que el coeficiente de correlación en sus muchas formas se ha convertido en el caballo de batalla de la investigación y el análisis cuantitativos. Y bien debería ser, ya que nuestro conocimiento empírico es fundamentalmente de las cosas co-variables. Llegamos a discernir las relaciones entre las cosas en términos de si cambian juntos o por separado; Llegamos a imputar causas sobre la base de fenómenos concurrentes; Llegamos a clasificar como resultado de una variación independiente.

Por supuesto, muchos de nuestros conceptos pueden ser apriori, nuestros marcos pueden proyectarse en fenómenos y crear orden, y nuestra comprensión puede ser en parte intuitiva. Nuestro conocimiento es un equilibrio dialéctico entre esa realidad sensorial que nos orientan, y nos dirigimos e imponemos esta estructura y marco de la realidad.

Cualquiera que sea el marco dentro del cual ordenamos fenómenos, sin embargo, esa realidad que percibimos es de dependencia, concomitancia, covariación, coincidencia, concurrencia; o de independencia, disociación o desconexión. Existimos en un campo de relación: es decir, llegamos a comprender el mundo que nos rodea a través de las correlaciones múltiples, entrelazadas e cruzadas que manifiesta. A veces llamamos a estas relaciones causa y efecto, a veces las generalizamos en leyes asumidas, y a veces simplemente las llamamos uniformidades o regularidades naturales o sociales.

¿Que permite la correlación de Pearson?

La correlación de Pearson o la correlación del momento del producto de Pearson de (PPMC) o la correlación bivariada es la medida estándar de correlación en las estadísticas. Muestra la relación lineal entre dos conjuntos de datos. Responde a la pregunta en términos simples: ¿Puedo dibujar un gráfico de línea para representar los datos?

La correlación de Pearson se expresa con dos letras: la letra griega Rho (ρ) para una población, y la letra «R» para un estudio.

Para encontrar la relación entre las variables en los datos, se utilizan fórmulas de coeficiente de correlación. Las fórmulas devuelven un valor que varía de -1 a 1, donde:

1 implica una buena relación optimista. -1 se indica una relación negativa clara. Ninguna relación implica una consecuencia de cero.

Un coeficiente de correlación de 1 significa que hay un aumento positivo de una proporción fija en la otra variable para cada aumento positivo en una variable.

Cero significa que no hay un aumento positivo o negativo con ningún aumento. Los dos claramente no están relacionados.

Un coeficiente de correlación de -1 significa que existe una disminución negativa en una proporción especificada en la otra variable para cada aumento positivo en una variable. El coeficiente de correlación en valor absoluto nos da el poder de la relación. Cuanto mayor sea el número, más fuerte es la asociación. | -.75 | = .75, por ejemplo, que tiene una mejor relación que .65.

Correlación V/S Causation

¿Qué dice el principio de correlación?

El coeficiente de correlación de productos de productos de Pearson (parámetro de población ρ, estadística de muestra R) es una medida de resistencia y dirección de la asociación lineal entre dos variables. En otras palabras, evalúa en qué medida las dos variables covarias.

Aunque Pearson (1895) desarrolló la fórmula matemática que todavía se usa más comúnmente hoy en día, la teoría detrás del coeficiente fue desarrollada por Galton (1885) que publicó el primer diagrama de dispersión bivariado. Se ha sugerido que el nombre popular para el índice debería ser, por lo tanto, el coeficiente de correlación de Galton-Pearson. Hoy, el coeficiente de correlación, junto con la regresión, constituye la metodología estadística más utilizada en estudios de observación en muchas disciplinas.

Para la correlación no hay distinción entre Y y X en términos de la cual es una variable explicativa y que una variable de respuesta. El coeficiente se obtiene dividiendo la covarianza de muestra entre las dos variables mediante el producto de sus desviaciones estándar de muestra:

  • r es el coeficiente de correlación del momento del producto Pearson,
  • X e y son las observaciones individuales de las dos variables,
  • y son los medios aritméticos de los dos conjuntos de observaciones.
  • n es el número de observaciones bivariadas

Este resultado es exactamente equivalente a dividir la suma de los productos de las observaciones estandarizadas estándar (confusamente llamadas ‘puntuaciones’) de las dos medidas por los grados de libertad como se explica en el texto central.

Artículos Relacionados:

Más posts relacionados:

Deja una respuesta

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *