Aprende a identificar los diferentes tipos de correlación en tu estadística

La alta correlación describe una correlación más fuerte entre dos variables, en la que un cambio en el primero tiene una estrecha asociación con un cambio en el segundo. La baja correlación describe una correlación más débil, lo que significa que las dos variables probablemente no están relacionadas.

Una correlación en las estadísticas denota una relación lineal. Una correlación positiva significa que esta relación lineal es positiva, y las dos variables aumentan o disminuyen en la misma dirección. Una correlación negativa es todo lo contrario, en el que la línea de relación tiene una pendiente negativa y las variables cambian en direcciones opuestas (es decir, una variable disminuye mientras que la otra aumenta). Ninguna correlación simplemente significa que las variables se comportan de manera muy diferente y, por lo tanto, no tienen una relación lineal.

Positivo, negativo y sin correlación: representaciones gráficas. Cuando R es mayor que cero, la correlación es positiva. Cuando R es menor que cero, la correlación es negativa. Cuando r = 0, no hay correlación.

Como muestran los gráficos correspondientes, podemos concluir las siguientes correlaciones:

  • Ventas de temperatura y helado: cuanto más caliente sea el día, cuanto más altas son las ventas de helados. Esta es una correlación positiva.
  • Longitud del entrenamiento e índice de masa corporal (IMC): cuanto más tiempo sea el entrenamiento, menor es el IMC. Esta es una correlación negativa.
  • Tamaño del zapato y color del cabello: el tamaño del espectáculo no tiene relación con el color del cabello. Esto no tiene correlación.

El coeficiente de correlación es un indicador estadístico importante de una correlación y cómo las dos variables están realmente correlacionadas (o no). Este es un valor denotado por la letra R, y varía entre -1 y +1.

¿Cómo determinar el tipo de correlación?

Inmediatamente introducimos la definición de corrección del coeficiente (o índice).

Asignado la serie de datos y, se define el coeficiente de correlación de la muestra, o el índice de correlación de Pearson, el siguiente valor numérico

donde indica la covarianza de E y E e indica, respectivamente, la desviación estándar de la muestra de E.

El coeficiente de correlación es un índice siempre entre -1 y 1 y en particular:

Si, la serie de datos y se dicen directamente relacionadas, o positivamente relacionadas y cuanto más se acerca el valor 1, más fuerte es la correlación positiva;

Si, la serie de datos y se dice que están inversamente relacionadas o relacionadas negativamente y cuanto más se acerca el valor -1, más fuerte es la correlación negativa.

Se puede demostrar que el coeficiente de correlación es igual a 1 o -1 si y solo si los puntos están perfectamente alineados en la misma línea recta.

El coeficiente de correlación de la muestra es un índice estadístico adimonial, por lo tanto, debe ser favorecido con respecto a la covarianza de la muestra cuando desea comprender si hay un vínculo lineal entre dos series de datos, independientemente de las unidades de medición elegida.

Se estudió el desarrollo del fémur y el húmero de un feto a través de imágenes de ultrasonido. Los datos relacionados con la longitud de los dos huesos se transcribieron, recolectados cada cuatro semanas, a partir de la duodécima semana de gestación hasta los años cuarenta. Los datos se muestran en la tabla

¿Cómo determinar el tipo de correlación de las dos variables?

Para reanudar la definición de Wikipedia que encuentro bastante bien encontrado:

“En probabilidades y estadísticas, la correlación entre varias variables aleatorias o estadísticas es un concepto de conexión que contradice su independencia. «

Por lo tanto, el objetivo consistirá en medir el poder del enlace entre dos (o más) variables. Sin embargo, este enlace puede ser más o menos complejo. Primero pensamos en un enlace de tipo lineal… y, por extensión, recurriremos rápidamente a la regresión lineal para encontrar este enlace.

Por lo tanto, evaluaremos la relación lineal entre dos variables continuas: esta es la correlación de Pearson.

Los gráficos a continuación muestran coeficientes de Pearson (R) que muestran una correlación positiva (r> 0), negativa (r <0) o la ausencia de correlación (r = 0).

Desafortunadamente, todas las dependencias no son necesariamente lineales y, por lo tanto, tendremos que impulsar aún más las regresiones (polinomio, etc.). Por lo tanto, recurriremos a la correlación de Spearman (Rho) que evalúa la relación monótona entre dos variables. En una relación monótona, las variables tienden a cambiar juntas, pero no necesariamente a un ritmo regular.

Estudiamos la correlación de Spearman cuando dos variables estadísticas parecen estar correlacionadas sin la relación entre las dos variables del tipo afín. Consiste en encontrar un coeficiente de correlación, no entre los valores tomados por las dos variables sino entre los rangos de estos valores. Considera cuánto se puede describir la relación entre dos variables por una función monótona.

¿Cómo saber si usar correlación de Pearson o de Spearman?

Así es como podría informar los resultados del ejemplo anterior en un informe:

Se ha calculado el índice de correlación TAU-B de Kendall para evaluar la relación entre la calificación (con 4 modos: 1 elemento o mediano; 2-2 y alto en la escuela) y la puntuación alcanzada en una prueba (expresada en centavos) en una muestra que consta de 40 individuos adultos.

Las dos variables de hecho presentaron una relación monótona positiva, como lo destacan el diagrama de dispersión.

El análisis muestra que la calificación se correlaciona moderadamente con un aumento en la puntuación de prueba, Tau -B = -0.45

Al interpretar e informar los resultados, tenga cuidado de no confundir la correlación con la relación causa-efecto. De hecho, el análisis de la correlación no proporciona ninguna indicación sobre el hecho de que el enlace observado es o no de causa-efecto.

Por ejemplo, el hecho de que esté observando una relación entre la actividad física y el nivel de colesterol no significa automáticamente aumentar la actividad física causa una disminución en la concentración de colesterol en la sangre.

Por otro lado, cuando hay una relación de causa-efecto y tiene dos variables cuantitativas ordinales, recomiendo usar el índice de Somers. Los índices de Kendall o Spearman no hacen ninguna distinción entre variable dependiente y variable independiente.

¿Qué tipos de correlación positiva negativa y nula?

Un análisis correlacional tiene como objetivo evaluar si existe una relación entre dos variables y la fuerza de esa relación.

La diferencia entre el análisis correlacional y los experimentos es que se miden dos variables (dos DV conocidos como co-variables). El análisis correlacional requiere datos cuantitativos (en forma de números). Por ejemplo, podría usarse para medir la relación entre revisión y examen.

(1) Positivo: una correlación positiva se refiere a una relación donde las variables se mueven en la misma dirección. P.ej. Un aumento en una variable va acompañado de un aumento en otra variable.

Por ejemplo, un aumento en la revisión se acompaña de un aumento en el rendimiento del examen. Tenga en cuenta que esto también significa que una disminución en la revisión está acompañada de una disminución en el rendimiento del examen.

(2) Negativo: Negativo: una correlación negativa se refiere a una relación donde las variables se mueven en direcciones opuestas. P.ej. Un aumento en una variable se acompaña de una disminución en otra variable.

Por ejemplo, un aumento en las visitas al pub se acompaña de una disminución en el rendimiento del examen.

Este es un número que nos dice la fuerza y ​​la dirección de la relación entre dos variables. La correlación coeficiente varía entre 1 y +1. En esta escala -1 representa una correlación negativa perfecta, +1 representa una correlación positiva perfecta y 0 no representa correlación.

Escribir una hipótesis correlacional Escribir una hipótesis para un análisis correlacional es muy diferente a escribir una hipótesis para un laboratorio o experimento de campo. Al escribir una hipótesis correlacional, es importante que indique lo que predice la relación entre las co-variables (por ejemplo, habrá una correlación positiva significativa, una correlación negativa o no habrá una relación significativa).

¿Cuáles son los tipos de correlaciones en los diagramas de dispersión?

Los gráficos de dispersión son una forma increíble de mostrar datos de dos variables (es decir, datos con solo dos variables) y hacer predicciones basadas en los datos. Estos tipos de gráficos muestran valores de datos individuales, a diferencia de los histogramas y los gráficos de caja y bigotador.

Aquí hay una trama de dispersión de la cantidad de dinero que Mateo ganó cada semana trabajando en la tienda de su padre:

Las semanas se trazan sobre el eje X, y la cantidad de dinero que ganó para esa semana se traza sobre el eje Y. En general, la variable independiente (la variable que no está influenciada por nada) está en el eje X, y la variable dependiente (la que se ve afectada por la variable independiente) se representa en el eje y.

Usando esta trama, podemos ver que en la Semana 2 Mateo ganó alrededor de $ 125, y en la Semana 18 ganó alrededor de $ 165. Más importante es la tendencia de los datos. Por ejemplo, con este conjunto de datos, está claro que Mateo está ganando más cada semana. Tal vez su padre le está dando más horas por semana o más responsabilidades.

Con tramas de dispersión a menudo hablamos sobre cómo las variables se relacionan entre sí. Esto se llama correlación. Hay tres tipos de correlación: positivo, negativo y ninguno (sin correlación).

  • Correlación positiva: a medida que una variable aumenta, también lo hace la otra. La altura y el tamaño del zapato son un ejemplo; A medida que aumenta la altura de uno, también lo hace el tamaño del zapato.
  • Correlación negativa: a medida que aumenta una variable, la otra disminuye. El tiempo dedicado a estudiar y el tiempo dedicado a los videojuegos se correlaciona negativamente; A medida que aumenta su tiempo de estudio, disminuye el tiempo dedicado al tiempo que se dedica el tiempo.

¿Cuántos tipos de correlación existen para el diagrama de dispersión?

En este artículo, discutiremos la correlación entre las variables para observar la dispersión de los datos. Una vista amplia del gráfico de datos ofrece información para elegir el valioso algoritmo de aprendizaje automático para el mejor ajuste. Los algoritmos de aprendizaje automático se diferencian en función de lineal, no lineal, densidad y clúster.

La correlación (co-variación) dividida en partes como se muestra a continuación:

  • Observando si hay una relación entre variables o no.
  • Si la correlación existe, cuán significativos son ellos entre sí.

En dispersión, buscamos encontrar información a través del diagrama. Es la forma más simple del diagrama verificar la relación entre dos variables. El diagrama debe notar que los puntos de puntos están dispersos y nos muestran información con su movimiento.

  • Observando si hay una relación entre variables o no.
  • Si la correlación existe, cuán significativos son ellos entre sí.
  • Un movimiento incrementado de la ventaja forma una correlación positiva.
  • Un movimiento disminuyendo a la baja forma una correlación negativa.
  • La dispersión de puntos de puntos en todas partes no forma correlación entre ellos.
  • Gráfico de dispersión entre dos variables. Una foto del autor

    El único problema principal con la gráfica de dispersión es que no podemos calcular el grado adecuado de correlación porque no se basa en el método matemático.

    En este tipo de método, la correlación está relacionada con gráficos de línea o con otros tipos de gráficos. En el enfoque del gráfico, ambos puntos de la variable se colocan en el gráfico para verificar la cercanía y la dirección de ambas variables. Este tipo de método es útil en las series de tiempo.

    ¿Qué es la correlación en un diagrama de dispersión?

    Una gráfica de dispersión es una representación visual de la correlación entre dos elementos. Se relaciona con el coeficiente de correlación, ya que se usa para indicar si existe una relación lineal o no entre dos variables. Las parcelas también se utilizan para evaluar:

    • La forma funcional de la relación
    • La fuerza de la relación
    • La dirección de la relación
    • Si hay atípicos en el conjunto de datos que se está estudiando

    Antes de entrar en cada uno de estos cuatro usos de la gráfica de dispersión, primero veamos cómo se puede construir en Excel y qué los puntos de datos en la gráfica resultante nos dicen. Además, también veremos cómo se puede construir una línea de mejor ajuste para la trama dada. Esta línea de mejor ajuste se usa para evaluar, en particular, la fuerza y ​​la dirección de la relación entre dos variables.

    Para construir una parcela de dispersión, primero debemos obtener los datos históricos de la serie temporal para las variables, en este caso, la serie de tiempo de tiempo de precios del petróleo crudo de West Texas y Brent Crude Oil Spot. Para garantizar la calidad del análisis, es importante que los datos utilizados en el estudio se obtengan de fuentes confiables: recuerde siempre el viejo adagio de la computadora «basura, basura».

    A continuación, utilizando la función de gráfico de Excel, construimos gráficos de dispersión a partir de las dos series de tiempo obtenidas (es decir, insertar pestaña> gráficos> gráficos de dispersión)

    Un punto de datos en el gráfico muestra cómo el precio spot de USD X para 1 barril de Brent corresponde con el precio spot de USD Y para 1 barril del oeste de Texas en un día determinado.

    Artículos Relacionados:

    Más posts relacionados:

    Deja una respuesta

    Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *