Ejemplo de cálculo de la correlación de Pearson

Veamos algunos ejemplos visuales para ayudarlo a interpretar una tabla de coeficiente de correlación de Pearson:

  • Gran correlación positiva:

La figura anterior representa una correlación de casi +1. Los gráficos de dispersión casi se trazan en la línea recta. La pendiente es positiva, lo que significa que si una variable aumenta, la otra variable también aumenta, mostrando una línea lineal positiva. Esto denota que un cambio en una variable es directamente proporcional al cambio en la otra variable. Un ejemplo de una gran correlación positiva sería: a medida que los niños crecen, también lo hacen sus tamaños de ropa y zapatos. Veamos algunos ejemplos visuales para ayudarlo a interpretar una tabla de coeficiente de correlación de Pearson:

  • Gran correlación positiva:
  • Correlación positiva media:
  • La figura anterior muestra una correlación positiva. La correlación es superior a +0.8 pero por debajo de 1+. Muestra un patrón cuesta arriba lineal bastante fuerte. Un ejemplo de una correlación media positiva sería, a medida que aumenta el número de automóviles, también aumenta la demanda en la variable de combustible.

    • Gran correlación positiva:
  • Correlación positiva media:
  • Pequeña correlación negativa
  • En la figura anterior, las gráficas de dispersión no están tan cerca de la línea recta en comparación con los ejemplos anteriores, muestra una correlación lineal negativa de aproximadamente -0.5 El cambio en una variable es inversamente proporcional al cambio de la otra variable como la pendiente es negativo. Un ejemplo de una pequeña correlación negativa sería: cuanto más come alguien, menos hambriento tiene.

    • Gran correlación positiva:
  • Correlación positiva media:
  • Pequeña correlación negativa
  • Débil / sin correlación
  • ¿Cuándo se usa correlación de Pearson?

    Debe usar la correlación de Pearson en el siguiente escenario:

    • Quieres saber la relación entre dos variables
    • Tus variables de interés son continuas
    • No tienes covariables

    Aclaremos esto para ayudarlo a saber cuándo usar la correlación de Pearson

    Está buscando una prueba estadística para ver cómo están relacionadas dos variables. Otros tipos de análisis incluyen la prueba de una diferencia entre dos variables o predecir una variable usando otra variable (predicción).

    Su variable de interés debe ser continua. Continua significa que su variable de interés básicamente puede asumir cualquier valor, como frecuencia cardíaca, altura, peso, número de barras de helado que puede comer en 1 minuto, etc.

    Los tipos de datos que no son continuos incluyen datos ordenados (como el lugar de finalización en una carrera, las mejores clasificaciones comerciales, etc.), datos categóricos (género, color de ojos, raza, etc.) o datos binarios (comprados el producto o no , tiene la enfermedad o no, etc.).

    La correlación de Pearson solo se puede utilizar para comparar dos grupos en su variable de interés.

    Si tiene tres o más grupos, podría considerar los métodos de agrupación.

    Una covariable es una variable cuyos efectos desea eliminar al examinar la relación variable de interés. Por ejemplo, si está examinando la relación entre la edad y el rendimiento de la memoria, es posible que esté interesado en eliminar los efectos del nivel de educación. De esta manera, puede estar seguro de que el nivel de educación no está influyendo en los resultados.

    ¿Cuándo se utiliza r de Pearson y Rho de Spearman?

    Una relación bivariada describe una relación o correlación entre dos variables en R. En este tutorial, discutiremos el concepto de correlación y mostraremos cómo se puede usar para medir la relación entre dos variables en R.

    Hay dos métodos principales para calcular la correlación entre dos variables en la programación R:

    El coeficiente de correlación, es una medida de la fuerza de la relación lineal entre dos variables y. Se calcula de la siguiente manera:

    • , es decir, desviación estándar de
    • , es decir, desviación estándar de
    • Un valor de cerca o igual a 0 implica poca o ninguna relación lineal entre y.
    • En contraste, cuanto más se acerca a 1 o -1, más fuerte es la relación lineal.

    Podemos calcular la prueba t de la siguiente manera y verificar la tabla de distribución con un grado de libertad es igual a:

    Una correlación de rango clasifica las observaciones por rango y calcula el nivel de similitud entre el rango. Una correlación de rango tiene la ventaja de ser robusto para los valores atípicos y no está vinculada a la distribución de los datos. Tenga en cuenta que una correlación de rango es adecuada para la variable ordinal.

    La correlación de rango de Spearman siempre es entre -1 y 1 con un valor cercano a la extremidad indica una relación fuerte. Se calcula de la siguiente manera:

    con las covarianzas declaradas entre rango y. El denominador calcula las desviaciones estándar.

    En R, podemos usar la función COR (). Se necesitan tres argumentos, y el método.

    ¿Cómo se plantea una correlación de Pearson?

    Me he dado cuenta de que hay mucha confusión sobre los diferentes tipos de co-relación que puede realizar en un conjunto de datos. Permítanme aclarar el humo en este comienzo con el coeficiente de correlación de Pearson.

    La correlación es un análisis bi-variado que mide la fuerza de asociación entre dos variables y la dirección de la relación. En términos de la fuerza de la relación, el valor del coeficiente de correlación varía entre +1 y -1. Un valor de ± 1 indica un grado perfecto de asociación entre las dos variables. A medida que el valor del coeficiente de correlación va hacia 0, la relación entre las dos variables será más débil. La dirección de la relación se indica mediante el signo del coeficiente; El signo A + indica una relación positiva y el signo A indica una relación negativa.

    Por lo general, en estadísticas, medimos cuatro tipos de correlaciones:

    • Correlación de Pearson
    • Correlación de rango de Kendall
    • Correlación de Spearman
    • Correlación puntual biserial.

    Como sugiere el título, solo cubriremos el coeficiente de correlación de Pearson. Mantendré esto breve pero muy informativo para que pueda seguir adelante y hacerlo por su cuenta. El coeficiente de correlación de Pearson es una medida de la resistencia de una asociación lineal entre dos variables, denotadas por r. Te encontrarás con la correlación de Pearson R

    • Correlación de Pearson
    • Correlación de rango de Kendall
    • Correlación de Spearman
    • Correlación puntual biserial.
  • ¿Existe una relación estadísticamente significativa entre la edad y la altura?
  • ¿Existe una relación entre la temperatura y las ventas de helados?
  • Artículos Relacionados:

    Related Posts

    Deja una respuesta

    Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *