Típicamente, una matriz de correlación es «cuadrada», con las mismas variables que se muestran en las filas y columnas. He mostrado un ejemplo a continuación. Esto muestra correlaciones entre la importancia declarada de varias cosas para las personas. La línea de 1.00s que va de la parte superior izquierda a la parte inferior derecha es la diagonal principal, que muestra que cada variable siempre se correlaciona perfectamente consigo misma. Esta matriz es simétrica, con la misma correlación se muestra sobre la diagonal principal que es una imagen espejo de las que están debajo de la diagonal principal.
- Para resumir una gran cantidad de datos donde el objetivo es ver patrones. En nuestro ejemplo anterior, el patrón observable es que todas las variables se correlacionan altamente entre sí.
- Para ingresar a otros análisis. Por ejemplo, las personas comúnmente usan matrices de correlación como entradas para el análisis factorial exploratorio, el análisis de factores confirmatorios, los modelos de ecuación estructural y la regresión lineal al excluir los valores faltantes por pares.
- Como diagnóstico al verificar otros análisis. Por ejemplo, con regresión lineal, una gran cantidad de correlaciones sugiere que las estimaciones de regresión lineal no serán confiables.
La mayoría de las matriz de correlación utilizan la correlación de productos de productos de Pearson (R). También es común usar la correlación de Spearman y el tau-b de Kendall. Ambos son correlaciones no paramétricas y menos susceptibles a los valores atípicos que R.
¿Qué es un mapa de correlación?
Pero en algunos casos queremos comprender la correlación entre más de un solo par de variables. En estos casos, podemos crear una matriz de correlación, que es una tabla cuadrada que muestra los coeficientes de correlación entre varias variables.
La matriz de correlación a continuación muestra los coeficientes de correlación entre varias variables relacionadas con la educación:
Cada celda de la tabla muestra la correlación entre dos variables específicas. Por ejemplo, la celda resaltada a continuación muestra que la correlación entre «horas dedicadas al estudio» y «puntaje de examen» es 0.82, lo que indica que están fuertemente correlacionados positivamente. Más horas dedicadas al estudio están fuertemente relacionadas con puntajes de exámenes más altos.
Y la célula resaltada a continuación muestra que la correlación entre «horas dedicadas a estudiar» y «horas dedicadas a dormir» es -0.22, lo que indica que están débilmente correlacionados negativamente. Pasadas más horas estudiando se asocian con menos horas que pasan durmiendo.
Y la celda resaltada a continuación muestra que la correlación entre «horas gastadas durmiendo» y «puntuación de IQ» es 0.06, lo que indica que básicamente no están correlacionados. Hay muy poca asociación entre la cantidad de horas que duerme un estudiante y su puntaje de coeficiente intelectual.
Observe también que los coeficientes de correlación a lo largo de la diagonal de la tabla son todos iguales a 1 porque cada variable está perfectamente correlacionada consigo misma. Estas células no son útiles para la interpretación.
Observe que una matriz de correlación es perfectamente simétrica. Por ejemplo, la celda superior derecha muestra exactamente el mismo valor que la celda inferior izquierda:
Esto se debe a que ambas células están midiendo la correlación entre «horas dedicadas a estudiar» y «calificación escolar».
¿Qué mide el diagrama de correlación?
En el capítulo 3, analizamos numéricamente los datos de una variable (univariante
datos), pero los artículos y estudios periodísticos describen con frecuencia la relación entre dos variables
(datos bivariados). Es esta segunda clase en la que nos centraremos en el capítulo
4.
Hay muchas variables que parecen estar relacionadas. Los enlaces a continuación son artículos de
Varias fuentes de noticias, todas discutiendo relaciones entre dos variables.
En cada caso, hay una variable de respuesta (GPA, salud del recién nacido, niveles de cáncer)
cuyo valor puede explicarse al menos en parte por una variable predictor (puntaje SAT,
Proximidad a las carreteras, consumo de píldoras de pérdida de peso).
Recuerde, a menos que realicemos un experimento diseñado, solo podemos
Reclamar una asociación entre las variables predictoras y de respuesta, no una causalidad.
Nuestro objetivo en este capítulo será encontrar formas de describir relaciones como la entre un
El puntaje SAT de los estudiantes y su GPA, y para describir la fuerza de esa relación.
Los diagramas de dispersión son la forma más fácil de representar gráficamente la relación entre dos cuantitativos
variables. Son solo gráficos X-Y, con la variable predictor como X y la variable de respuesta
como ellos.
Los datos a continuación son las frecuencias cardíacas de los estudiantes de una clase de estadísticas I en ECC durante la primavera
Semestre de 2008. Los estudiantes midieron sus frecuencias cardíacas (en ritmos por minuto), luego tomaron un rápido
Camina y mide sus ritmos cardíacos nuevamente.
¿Qué es un diagrama de dispersión y correlación?
También conocido como puntos o trama de la trama X-Y. Son diagramas que usan un grupo de puntos, identificados utilizando las coordenadas cartesianas (x, y) para expresar los valores de 2 variables, ya que, siguiendo una variable en cada eje, se detecta la relación o correlación entre las dos variables.
Comprenda que la dispersión en matemáticas se conoce como un valor de distancia de un valor conectado, en comparación con un valor promedio.
A partir de aquí, algunas medidas de dispersión se obtienen en el mundo de las estadísticas, como el rango, la varianza, la desviación, el coeficiente de correlación, etc.
Sin embargo, el diagrama de dispersión es la representación gráfica de una serie de datos para dos variables, se analiza la relación entre las 2 variables, sabiendo cómo se influyen entre sí o, en cualquier caso, cuán independientes pueden ser entre sí.
A través de los modelos de gráficos de dispersión, se pueden interpretar los siguientes tipos de correlación:
Ocurre cuando una variable disminuye o aumenta y, al mismo tiempo, la otra variable lo hace, con una relación proporcional, por ejemplo, en el caso de las ventas, cuando un vendedor vende un mayor número de artículos (variable 1), experimenta una mayor ganancias, ganar más dinero (variable 2).
Ocurre cuando el comportamiento de una variable es contrario al comportamiento de la otra variable, es decir, aquellos casos en los que aumenta una variable, la otra variable disminuye. Existe una relación proporcionalmente inversa, por ejemplo, en la construcción, un mayor número de trabajadores en un trabajo (variable 1), disminuye los tiempos de entrega del trabajo (variable 2).
¿Cómo hacer una gráfica de correlación?
La correlación ayuda a identificar el patrón de cambio entre dos variables. Tiene dos propiedades: resistencia y dirección. Es un concepto de estadísticas comunes que se puede representar fácilmente en Excel utilizando un gráfico de dispersión y una línea de tendencia.
La tabla de correlación es un tipo de gráfico o esquema matemático que utiliza coordenadas cartesianas para valores de visualización típicamente de dos variables para un conjunto de datos. Los datos se muestran como una colección de puntos, cada uno con el valor de una variable de posición en el eje horizontal y el valor de una segunda variable de posición en el eje vertical.
- Positivo:
Si el coeficiente de correlación es positivo, muestra una relación proporcional directa entre las variables y una pendiente ascendente del gráfico de correlación.
Si la variable 1 aumenta, la variable 2 también aumentará, y viceversa.
- Positivo:
Si el coeficiente de correlación es negativo, muestra una relación proporcional inversa entre las variables y una pendiente descendente del gráfico de correlación.
Si la variable 1 aumenta, la variable 2 también disminuirá, y viceversa.
Paso 1: cree el conjunto de datos de correlación. La variable independiente debe estar en el lado izquierdo (eje x) y la variable dependiente debe estar en el lado derecho (eje y).
¿Cómo se hace una gráfica de correlación?
La correlación básicamente significa una conexión mutua entre dos o más conjuntos de datos. En estadísticas, se utilizan datos bivariados o dos variables aleatorias para encontrar la correlación entre ellas. El coeficiente de correlación es generalmente la medición de la correlación entre los datos bivariados que básicamente denota cuánto se correlacionan entre sí dos variables aleatorias entre sí.
Si el coeficiente de correlación es 0, los datos bivariados no están correlacionados entre sí.
Si el coeficiente de correlación es -1 o +1, los datos bivariados están fuertemente correlacionados entre sí.
En general, si el coeficiente de correlación está cerca de -1 o +1, entonces podemos decir que los datos bivariados se correlacionan fuertemente entre sí.
El coeficiente de correlación se calcula utilizando el coeficiente de correlación de Pearson, que está dado por:
R: coeficiente de correlación : Valores de la variable x. : Valores de la variable y. N: Número de muestras tomadas en el conjunto de datos. Numerador: Covarianza de X e Y. Denominador: Producto de la desviación estándar de X y la desviación estándar de y.
En este artículo vamos a discutir cómo hacer gráficos de correlación en Excel utilizando ejemplos adecuados.
1. Encontremos el coeficiente de correlación para las variables y X e Y1.
Array1: Conjunto de valores de X. El rango de celda es de A2 a A6.
Array2: conjunto de valores de y1. El rango de células es de B2 a B6.
Del mismo modo, puede encontrar los coeficientes de correlación para (x, y2) y (x, y3) usando la fórmula de Excel.
Artículos Relacionados:
- ¿Qué es un cuadro de correlación y cómo se interpreta?
- Aprende a identificar los diferentes tipos de correlación en tu estadística
- ¿Qué es el análisis de correlación y cómo puede mejorar tu estrategia de marketing?
- Ejemplo de correlación: aprenda a calcular la relación entre dos variables
- 10 ejemplos de correlación en la vida cotidiana que te sorprenderán
