Interpretación de la correlación de Pearson: cómo determinar si hay una relación entre dos variables

El método de correlación de Pearson es el método más común para usar para variables numéricas; Asigna un valor entre – 1 y 1, donde 0 no es correlación, 1 es una correlación positiva total y – 1 es una correlación negativa total. Esto se interpreta de la siguiente manera: un valor de correlación de 0.7 entre dos variables indicaría que existe una relación significativa y positiva entre los dos. Una correlación positiva significa que si la variable A sube, entonces B también aumentará, mientras que si el valor de la correlación es negativo, entonces si A aumenta, B disminuye.

Teniendo en cuenta las dos variables «edad» y «salario», se esperaría una fuerte correlación positiva entre los dos: a medida que las personas envejecen, tienden a ganar más dinero. Por lo tanto, la correlación entre la edad y el salario probablemente da un valor a más de 0.7. La Figura 6.2 ilustra pares de variables numéricas trazadas entre sí, con el valor de correlación correspondiente entre las dos variables que se muestran en el eje X. La trama más correcta muestra una correlación positiva perfecta de 1.0, mientras que la trama media muestra dos variables que no tienen correlación entre ellas. La trama más izquierda muestra una correlación negativa perfecta de-1.0.

Figura 6.2. Correlaciones entre dos variables numéricas

Se puede calcular una correlación entre dos valores numéricos (por ejemplo, edad y salario) o entre dos valores de categoría (por ejemplo, tipo de producto y profesión). Sin embargo, una empresa también puede querer calcular las correlaciones entre variables de diferentes tipos. Un método para calcular la correlación de una variable numérica con una categórica es convertir la variable numérica en categorías. Por ejemplo, la edad se clasificaría en rangos (o cubos) como: 18 a 30, 31 a 40, y así sucesivamente.

Además de la correlación, a menudo se calcula la covarianza de dos variables. En contraste con el valor de correlación, que debe ser entre – 1 y 1, la covarianza puede asumir cualquier valor numérico. La covarianza indica el grado de sincronización de la varianza (o volatilidad) de las dos variables.

La Tabla 6.2 muestra correlaciones entre cuatro variables comerciales tomadas de la Tabla 6.1. Las dos variables que tienen las correlaciones más altas son la profesión con ingresos (US $), con una correlación de 0.85, y la edad con ingresos (US $), con una correlación de 0.81. Las correlaciones más bajas son el uso del teléfono celular con ingresos (0.25) y el uso de teléfonos celulares con profesión (0.28). Por lo tanto, la conclusión inicial es que el uso del teléfono celular no tiene una alta correlación con ninguna otra variable, por lo que podría considerarse para excluir el conjunto de variables de entrada. La Tabla 6.1 también muestra que el uso del teléfono celular tiene una confiabilidad significativamente menor (0.3) que las otras variables y esto podría tener repercusiones en su valor de correlación con las variables restantes. Además, la profesión solo tiene una alta correlación con los ingresos; Sin embargo, se verá que este par de correlación (ingresos, profesión) es importante para el tipo de negocio. Dado que cada variable tiene una correlación con cualquier otra variable, los valores se repiten alrededor de la diagonal. Por lo tanto, se pueden omitir los valores en un lado de la diagonal. Tenga en cuenta que todos los valores son iguales a 1 en la diagonal, porque estas son las correlaciones de las variables con ellos mismos.

¿Cómo interpretar los resultados de una correlación?

Esta página muestra una correlación de ejemplo con notas al pie de página que explican el
producción. Estos datos se recopilaron en 200 estudiantes de escuelas secundarias y son
Puntajes sobre varias pruebas, incluidas las ciencias, las matemáticas, la lectura y los estudios sociales (Socst).
La mujer variable es una variable dicotómica codificada 1 si el estudiante era
mujer y 0 si hombre.

En la sintaxis a continuación, el comando Get File se usa para cargar los datos HSB2
en SPSS. En cotizaciones, debe especificar dónde se encuentra el archivo de datos
en tu ordenador. Recuerde que necesita usar la extensión .sav y
que necesita finalizar el comando con un período. Por defecto, SPSS hace un
Deleción por pares de valores faltantes. Esto significa que mientras ambos
Las variables en la correlación tienen valores válidos para un caso, ese caso está incluido
en la correlación. El subcomando /impresión se usa para tener el
correlaciones estadísticamente significativas marcadas.

una. Correlación de Pearson: estos números miden la fuerza y
Dirección de la relación lineal entre las dos variables. los
El coeficiente de correlación puede variar de -1 a +1, con -1 que indica un perfecto
Correlación negativa, +1 que indica una correlación positiva perfecta y 0
indicando ninguna correlación en absoluto. (Una variable correlacionada consigo misma
siempre tenga un coeficiente de correlación de 1.) Puede pensar en el
El coeficiente de correlación le dice hasta qué punto puede adivinar el
valor de una variable dado un valor de la otra variable. Desde el
El diagrama de dispersión de las variables lee y escribe a continuación,
Podemos ver que los puntos tienden a lo largo de una línea que va desde la parte inferior izquierda hasta el
superior a la derecha, que es lo mismo que decir que la correlación es positiva. los
.597 es la descripción numérica de cuán estrictamente alrededor de la línea imaginaria
Los puntos mienten. Si la correlación fuera mayor, los puntos tenderían a estar más cerca del
línea; Si fuera más pequeño, tenderían a estar más lejos de la línea.
También tenga en cuenta que, por definición, cualquier variable correlacionada consigo misma tiene un
Correlación de 1.

¿Cómo interpretar la correlacion de Pearson en Minitab?

La salida de Minitab para una correlación de Pearson se muestra a continuación:

La salida contiene dos piezas importantes de información:

  • A. Coeficiente de correlación de Pearson, r. Esto evalúa la fuerza de la asociación entre las dos variables (es decir, puntaje de examen y tiempo de revisión).

En este ejemplo, el coeficiente de correlación de Pearson es 0.853 (es decir, la «correlación de Pearson de la puntuación del examen y el tiempo de revisión = 0.853» línea), lo que indica una fuerte correlación positiva entre las dos variables, el puntaje del examen y el tiempo de revisión, según Cohen (1998 )

donde | r | significa el valor absoluto o r (por ejemplo, | r |> .5 significa r> .5 y r <-.5). Por lo tanto, el coeficiente de correlación de Pearson en este ejemplo (r = .853) sugiere una fuerte correlación. Si en cambio, r = -.853, también habría tenido una correlación fuerte, aunque negativa. Este resultado muestra que más tiempo dedicado a la revisión se asocia con mejores (es decir, más altos) puntajes de examen. También puede ver que el coeficiente de correlación de Pearson es estadísticamente significativo como p <.0005 (es decir, la línea "valor p = 0.000", lo que en realidad significa p <.0005), que satisface el límite común para la importancia estadística de P <.05.

Nota: Presentamos la salida de la correlación de Pearson anterior. Sin embargo, dado que debería haber probado sus datos para obtener los supuestos que explicamos anteriormente en la sección de supuestos, también deberá interpretar la salida de Minitab que se produjo cuando probó estos supuestos. Esto incluye: (a) los gráficos de dispersión que usó para verificar si había una relación lineal entre sus dos variables (es decir, la suposición #2); (b) los mismos diagramas de dispersión que habrá usado para verificar que no hubo valores atípicos significativos (es decir, suposición #3); y (c) la prueba de Shapiro-Wilk para que la normalidad verifique si sus dos variables se distribuyeron aproximadamente normalmente (es decir, suposición #4). Además, recuerde que si sus datos fallaron alguno de estos supuestos, el resultado que obtiene del procedimiento de correlación de Pearson (es decir, la salida que discutimos anteriormente) ya no puede ser válida, y es posible que tenga que llevar a cabo una prueba estadística diferente a Analice sus datos.

¿Cómo interpretar resultados de correlación Pearson?

Entonces me parece que tienes que elegir ‘menos’ para la alternativa de prueba.
A partir de ahí, obtengo un coeficiente positivo y no significativo (mientras esperaba un coeficiente negativo).

Por lo tanto, estoy muy molesto por la interpretación: debería concluir que no podemos decir que hay una relación lineal y negativa basada en mi hipótesis inicial o más bien que parece haber una relación positiva, pero que no es significativa y propone rehacer la prueba con la alternativa ‘mayor’?

¿Cómo se llama «una prueba de Pearson»? Conozco la regresión lineal de Pearson, que no es una prueba, y la prueba de igualdad del coeficiente de regresión en 0 (por lo tanto, después de un análisis de regresión. Por otro lado, no sé qué relación negativa.
Si estos son elementos de su curso, ¿pueden recordar qué es?

También explica la oración: «¿Tengo un coeficiente positivo y no significativo»?

Este es mi problema, este es un ejercicio en la interpretación de los resultados: no tengo acceso a datos ni a la nube de puntos.
Comenzamos a partir de la siguiente hipótesis: cuantos más depredadores, menos presa hay. A partir de esta hipótesis, sabiendo que entonces tendremos un cálculo del coeficiente de Pearson, debemos dar la configuración de la prueba (aquí, por lo tanto: unilateral con alternativa menos).
Me parece la configuración lógica que podemos deducir de la hipótesis, no creo que pueda dejar «más grande».

¿Cómo sacar la correlacion de Pearson en Minitab?

Un banco requiere ocho información de los solicitantes de préstamos: ingresos, nivel de educación, edad, duración del tiempo en la residencia actual, duración del tiempo con el empleador actual, ahorros, deuda y cantidad de tarjetas de crédito. Un administrador bancario quiere analizar estos datos para determinar la mejor manera de agrupar e informarlos. El administrador recopila esta información para 30 solicitantes de préstamos.

  • El coeficiente de correlación de Pearson más alto es entre el empleo y la residencia. Este valor de 0.952 representa una relación positiva entre las variables. A medida que aumenta el empleo, la residencia también aumenta. El intervalo de confianza del 95% es 0.901 – 0.977.
  • El coeficiente de correlación de Pearson entre tarjetas de crédito y ahorros es –0.410. A medida que aumenta el número de tarjetas de crédito, los ahorros tienden a disminuir. El intervalo de confianza del 95% varía de –0.671 a –0.059.

También use la trama de matriz para buscar valores atípicos que puedan influir en gran medida en los resultados. Por ejemplo, la fila 6 contiene un punto de datos extremo que puede influir en la correlación entre las variables. Un ejemplo de esto se puede ver en la trama de deuda y edad.

Por lo general, cuando la correlación es más fuerte, el intervalo de confianza es más estrecho. Por ejemplo, las tarjetas de crédito y la edad tienen una correlación débil y el intervalo de confianza del 95% varía de -0.468 a 0.242.

¿Cuando el coeficiente de correlación es positivo?

El coeficiente de correlación R es un valor sin unidad entre -1 y 1. La significación estadística se indica mediante un valor p. En consecuencia, las correlaciones generalmente se expresan usando dos figuras clave: r = y p =.

  • Cuanto más cerca de cero, menor es la relación lineal.
  • Los valores positivos de R indican una correlación positiva cuando los valores de las dos variables tienden a aumentar.
  • Los valores negativos de R indican una correlación negativa cuando los valores de una variable tienden a aumentar y los valores de la otra variable disminuyen.
  • Los valores 1 y -1 representan cada uno las correlaciones «perfectas», positivas y negativas respectivamente. Dos variables con correlación perfecta evolucionan juntas a una velocidad fija. Se dice que la relación es lineal; Informado en una nube de puntos, todos los puntos de datos pueden conectarse mediante una línea recta.
  • El valor P indica si podemos o no concluir significativamente que el coeficiente de correlación de la población es diferente de cero, según nuestras observaciones de muestra.

El valor P es una medida de la probabilidad utilizada para probar la hipótesis. El propósito de la prueba de hipótesis es determinar si hay suficiente evidencia para respaldar una cierta hipótesis con respecto a sus datos. De hecho, formulamos dos hipótesis: la hipótesis nula y la hipótesis alternativa. En el caso del análisis de correlación, la hipótesis nula es generalmente que la relación observada entre las variables es el fruto puro del azar (el coeficiente de correlación es realmente cero, no hay relación lineal). La hipótesis alternativa es que la correlación medida está legítimamente presente en nuestros datos (el coeficiente de correlación es diferente de cero).

El valor P designa la probabilidad de observar un coeficiente de correlación diferente de cero en los datos de nuestra muestra cuando la hipótesis nula es cierta. Un valor bajo P implicaría rechazar la hipótesis nula. En general, el umbral de rechazo de una hipótesis cero es un valor de 0.05. Por lo tanto, si tiene un valor P por debajo de 0.05, rechazas la hipótesis nula a favor de la hipótesis alternativa según la cual el coeficiente de correlación es diferente de cero.

El coeficiente de correlación de la muestra puede representarse mediante una fórmula:

Veamos cómo calcular el coeficiente de correlación utilizando un ejemplo que contiene un pequeño conjunto de números simples, para simplificar las operaciones.

¿Cómo se interpreta una correlación positiva?

Una correlación perfectamente positiva significa que en el 100% de los casos, las variables en cuestión se mueven juntas exactamente en el mismo porcentaje y en la misma dirección. Se puede observar una correlación positiva entre la demanda de un producto y el precio asociado con este producto. En situaciones en las que la oferta disponible sigue siendo la misma, el precio aumentará si la demanda aumenta.

Además, las ganancias o pérdidas en ciertos mercados pueden conducir a movimientos similares en los mercados asociados. A medida que aumenta el precio del combustible, el precio de los boletos de avión también aumenta. Como los aviones necesitan combustible para funcionar, el aumento en este costo a menudo se refleja en el consumidor, lo que conduce a una correlación positiva entre el precio del combustible y el precio de los boletos de avión.

Una correlación positiva no garantiza el crecimiento o el beneficio. Se usa bastante para designar dos o más variables que evolucionan juntas en la misma dirección, de modo que cuando uno aumenta, el otro también. Si existe correlación, la causalidad puede no existir; Por lo tanto, si algunas variables pueden evolucionar juntas, es posible que no sepamos por qué ocurre este movimiento.

La correlación es una forma de dependencia, donde un cambio en una variable significa que es probable que un cambio sea en el otro, o que ciertas variables conocidas producen resultados específicos. Se puede observar un ejemplo general dentro de la solicitud de productos adicionales. Si aumenta la demanda de vehículos, la demanda de servicios relacionados con el vehículo, como los neumáticos, también aumentará. Un aumento en un área tiene un efecto en las industrias complementarias.

En ciertas situaciones, las reacciones psicológicas positivas pueden causar cambios positivos en un área. Esto se puede demostrar en los mercados financieros, en los casos en que las noticias generalmente positivas sobre una empresa conducen a un aumento en el curso de la acción.

¿Qué pasa cuando el coeficiente de correlación es negativo?

Una correlación inversa, también conocida como correlación negativa, es una relación contraria entre dos variables, de modo que cuando el valor de una variable es alto, el valor de la otra variable probablemente sea bajo.

Por ejemplo, con las variables A y B, como A tiene un valor alto, B tiene un valor bajo y como A tiene un valor bajo, B tiene un valor alto. En la terminología estadística, una correlación inversa a menudo se denota por el coeficiente de correlación «R» que tiene un valor entre -1 y 0, con r = -1 que indica una correlación inversa perfecta.

  • La correlación inversa (o negativa) es cuando se relacionan dos variables en un conjunto de datos de tal manera que cuando una es alta, la otra es baja.
  • Aunque dos variables pueden tener una fuerte correlación negativa, esto no implica necesariamente que el comportamiento de una tenga ninguna influencia causal en el otro.
  • La relación entre dos variables puede cambiar con el tiempo y también puede tener períodos de correlación positiva.

Se pueden trazar dos conjuntos de puntos de datos en un gráfico en un eje x e y para verificar la correlación. Esto se llama diagrama de dispersión, y representa una forma visual de verificar una correlación positiva o negativa. El siguiente gráfico ilustra una fuerte correlación inversa entre dos conjuntos de puntos de datos trazados en el gráfico.

La correlación se puede calcular entre variables dentro de un conjunto de datos para llegar a un resultado numérico, el más común de los cuales se conoce como R de Pearson. Cuando R es menor que 0, esto indica una correlación inversa. Aquí hay un cálculo de ejemplo aritmético de la R de Pearson, con un resultado que muestra una correlación inversa entre dos variables.

Suponga que un analista debe calcular el grado de correlación entre el X y Y en el siguiente conjunto de datos con siete observaciones en las dos variables:

  • La correlación inversa (o negativa) es cuando se relacionan dos variables en un conjunto de datos de tal manera que cuando una es alta, la otra es baja.
  • Aunque dos variables pueden tener una fuerte correlación negativa, esto no implica necesariamente que el comportamiento de una tenga ninguna influencia causal en el otro.
  • La relación entre dos variables puede cambiar con el tiempo y también puede tener períodos de correlación positiva.
  • X: 55, 37, 100, 40, 23, 66, 88
  • Artículos Relacionados:

    Más posts relacionados:

    Deja una respuesta

    Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *