Otros gráficos usan líneas o barras para mostrar datos; Un diagrama de dispersión usa puntos. Esto puede ser confuso, pero a menudo es más fácil de entender.
En esta publicación de blog, explicaré el diagrama de dispersión.
Un diagrama de dispersión también se llama gráfico de dispersión, gráfico de dispersión o tabla de correlación.
Dibujamos un diagrama de dispersión con dos variables. La primera variable es independiente y la segunda variable depende de la primera.
El diagrama de dispersión es la forma más simple de estudiar la correlación entre estas variables. Después de determinar cómo están relacionados, puede predecir el comportamiento de la variable dependiente en función de la variable independiente.
Un gráfico de dispersión es útil cuando una variable es medible y la otra no.
Según la Guía PMBOK, un diagrama de dispersión es «un gráfico que muestra la relación entre dos variables. Los diagramas de dispersión pueden mostrar una relación entre cualquier elemento de un proceso, entorno o actividad en un eje y un defecto de calidad en el otro eje «.
Estás analizando patrones de accidentes en una carretera. Selecciona las dos variables, la velocidad del motor y el número de accidentes, y dibuja el diagrama.
Una vez que está completo, nota que a medida que aumenta la velocidad de los vehículos, aumenta la cantidad de accidentes. Esto muestra la correlación entre los dos.
En la mayoría de los casos, la variable independiente se traza a lo largo de la horizontal (eje x), y la variable dependiente se traza en la vertical (eje y). La variable independiente es el parámetro de control porque influye en el comportamiento de la variable dependiente.
¿Qué es un diagrama de correlación ejemplos?
Todas las correlaciones tienen dos propiedades: resistencia y dirección. La fuerza de una correlación está determinada por su valor numérico. La dirección de la correlación se determina si la correlación es positiva o negativa.
- Correlación positiva: ambas variables se mueven en la misma dirección. En otras palabras, a medida que aumenta una variable, la otra variable también aumenta. A medida que disminuye una variable, la otra variable también disminuye.
- Es decir, años de educación y salario anual se correlacionan positivamente.
- Correlación negativa: las variables se mueven en direcciones opuestas. A medida que aumenta una variable, la otra variable disminuye. A medida que disminuye una variable, la otra variable aumenta.
¿Qué significa decir que dos variables no tienen correlación? Significa que no hay una relación aparente entre las dos variables. Por ejemplo, no hay correlación entre el tamaño del zapato y el salario. Esto significa que las puntuaciones altas en el tamaño del zapato tienen la misma probabilidad de ocurrir con puntajes altos en el salario como con puntajes bajos en el salario.
¿Cómo se interpreta un diagrama de correlación?
El tamaño de la muestra (N) es el número de puntos de datos completos para un par de variables. Cualquier fila con datos faltantes para cualquiera de un par de variables no cuenta para el tamaño de la muestra.
La matriz de correlación muestra los valores de correlación, que miden el grado de relación lineal entre cada par de variables. Los valores de correlación pueden caer entre -1 y +1. Si las dos variables tienden a aumentar y disminuir juntas, el valor de correlación es positivo. Si una variable aumenta mientras que la otra variable disminuye, el valor de correlación es negativo.
Use la matriz de correlación para evaluar la fuerza y la dirección de la relación entre dos variables. Un altos valores de correlación positivos indica que las variables miden la misma característica. Si los elementos no están altamente correlacionados, los elementos pueden medir diferentes características o no pueden definirse claramente.
- Residencia y edad, 0.838
- Empleo y edad, 0.848
- Empleo y residencia, 0.952
- Deuda y ahorro, −0.393
- Tarjetas de crédito y edad, −0.130
- Tarjetas de crédito y ahorros, −0.410
Use el coeficiente de correlación de Spearman para examinar la fuerza y la dirección de la relación monotónica entre dos variables continuas u ordinales. En una relación monotónica, las variables tienden a moverse en la misma dirección relativa, pero no necesariamente a un ritmo constante. Para calcular la correlación de Spearman, Minitab clasifica los datos sin procesar. Luego, Minitab calcula el coeficiente de correlación en los datos clasificados.
¿Cómo se da un analisis de correlación?
El coeficiente de correlación fue descrito hace más de cien años por Karl Pearson [1], inspirándose en una idea similar de correlación de Sir Francis Galton, quien desarrolló una regresión lineal y era el medio primo no tan conocido de Charles Darwin [2]. En resumen, el coeficiente de correlación, denotado con el carácter griego Rho (ρ) para la verdadera población (teórica) y R para una muestra de la verdadera población, tiene como objetivo estimar la fuerza de la asociación lineal entre dos variables. Si tenemos variables x e y que se trazan entre sí en una gráfica de dispersión, el coeficiente de correlación indica qué tan bien una línea recta se ajusta a estos datos. El coeficiente varía de −1 a 1 y es adimensional (es decir, no tiene unidad). En la Figura 1A y B se muestran dos correlaciones con R = −1 y R = 1, respectivamente. Los valores de −1 y 1 indican que todas las observaciones se pueden describir perfectamente usando una línea recta, lo que a su vez significa que si se conoce x, y se puede determinar determinista y viceversa. Aquí, el signo menos indica una asociación inversa: si X aumenta, y disminuye. No obstante, los datos del mundo real a menudo no se resumen perfectamente utilizando una línea recta. En un diagrama de dispersión como se muestra en la Figura 1c, el coeficiente de correlación representa qué tan bien una asociación lineal se ajusta a los datos.
Diferentes formas de datos y sus coeficientes de correlación. (A) Asociación lineal con R = −1. (B) Una asociación lineal con r = 1. (c) Un diagrama de dispersión a través del cual se podría dibujar una línea recta, con r = 0.50. (D) Una asociación sinusoidal con r = 0. (e) Una asociación cuadrática con r = 0. (f) Una asociación exponencial con r = 0.50.
También es posible probar la hipótesis de si X e Y están correlacionados, lo que produce un valor p que indica la posibilidad de encontrar el valor observado del coeficiente de correlación o cualquier valor que indique un mayor grado de correlación, dado que las dos variables no son realmente correlacionado. Aunque el coeficiente de correlación no variará según el tamaño de la muestra, el valor p cedió con la prueba t.
El valor del coeficiente de correlación tampoco está influenciado por las unidades de medición, pero está influenciado por el error de medición. Si hay más error (también conocido como ruido) en las variables x e y, la variabilidad en x se debió en parte al error en x, y por lo tanto no es solo explicable por Y. Además, el coeficiente de correlación también es sensible al rango de observaciones, que discutiremos más adelante en este documento.
¿Cuáles son las 3 correlaciones?
Por ejemplo, considere las variables de los ingresos familiares y el gasto familiar. Es bien sabido que los ingresos y el gasto aumentan o disminuyen juntos. Por lo tanto, están relacionados en el sentido de que el cambio en cualquier variable está acompañado por el cambio en la otra variable.
Del mismo modo, el precio y la demanda de una mercancía son variables relacionadas; Cuando aumenta el precio, la demanda tenderá a disminuciones y viceversa.
Si el cambio en una variable está acompañado de un cambio en el otro, se dice que las variables están correlacionadas. Por lo tanto, podemos decir que los ingresos familiares y el gasto familiar están correlacionados, al igual que el precio y la demanda de productos básicos.
En el caso de los ingresos familiares y el gasto familiar, es fácil ver que ambos se elevan o caen juntos en la misma dirección. Esto se llama una correlación positiva.
En caso de precio y demanda, el cambio ocurre en direcciones opuestas, por lo que el aumento en uno está acompañado de una disminución en la otra. Esto se llama una correlación negativa.
La correlación estadística se mide por lo que se llama coeficiente de correlación (R). Su valor numérico varía de +1.0 a -1.0. Nos da una indicación de la fuerza y la dirección de la relación entre variables.
En general, R> 0 indica una relación positiva, r <0 indica una relación negativa y r = 0 indica que no hay relación (o que las variables son independientes entre sí y no están relacionadas). Aquí R = +1.0 describe una correlación positiva perfecta y R = -1.0 describe una correlación negativa perfecta.
Artículos Relacionados:
