Aprende a calcular la correlación y regresión lineal con estos sencillos pasos

Debido a que los exámenes visuales son en gran medida subjetivos, necesitamos una medida más precisa y objetiva para definir la correlación entre las dos variables. Para cuantificar la resistencia y la dirección de la relación entre dos variables, utilizamos el coeficiente de correlación lineal:

donde X̄ y SX son la media de muestra y la desviación estándar de muestra de las X, y ȳ y SY son la media y la desviación estándar de las Y. El tamaño de la muestra es n.

Un cálculo alternativo del coeficiente de correlación es:

El coeficiente de correlación lineal también se conoce como el coeficiente de correlación del momento del producto de Pearson en honor de Karl Pearson, quien lo desarrolló originalmente. Esta estadística describe numéricamente cuán fuerte es la relación recta o lineal entre las dos variables y la dirección, positiva o negativa.

  • Siempre es entre -1 y +1.
  • Es una medida sin unidad, por lo que «R» sería el mismo valor si midió las dos variables en libras y pulgadas o en gramos y centímetros.
  • Los valores positivos de «R» están asociados con relaciones positivas.
  • Los valores negativos de «R» están asociados con relaciones negativas.

¡La correlación no es causalidad! El hecho de que dos variables estén correlacionadas no significa que una variable haga que otra variable cambie.

Examine los próximos dos diagramas de dispersión. Ambos conjuntos de datos tienen una R = 0.01, pero son muy diferentes. La trama 1 muestra poca relación lineal entre las variables X e Y. La trama 2 muestra una fuerte relación no lineal. El coeficiente de correlación lineal de Pearson solo mide la fuerza y ​​la dirección de una relación lineal. Ignorar el diagrama de dispersión podría resultar en un grave error al describir la relación entre dos variables.

¿Qué es la regresión lineal concepto?

La regresión lineal es un tema que pertenece a las matemáticas estadísticas.

El estudio de la regresión lineal no es más que la búsqueda del promedio, o más bien de la función promedio, entre diferentes fenómenos relacionados.
En particular, en este apropiado trataremos con la regresión lineal simple, es decir, la que estudia la adicción entre una sola variable independiente y una única variable dependiente.

Veamos mejor estos conceptos a través de un ejemplo.

Supongamos que tenemos un pequeño laboratorio de cuchillos. Cuando solo hay un trabajador, produce 30 cuchillos por mes. Cuando los trabajadores tienen 2, 60 cuchillos por mes se producen. Cuando hay 3 trabajadores, pueden dividir las diversas fases del procedimiento de procesamiento y ser más productivos, obteniendo 150 cuchillos por mes. Si hay 4 trabajadores, incluso si están en mayor número, tienden a obstaculizarse, y la productividad cae. Por lo tanto, en un mes producen solo 180 cuchillos. Por lo tanto, construimos una tabla, en la que informaremos los resultados de este fenómeno (Figura 1 en el archivo adjunto).
Una vez que se ha construido la tabla, podemos usarla para crear un gráfico ortogonal cartesiano, donde en la abscisa tendremos el número de trabajadores (variables independientes) y en orden el número de cuchillos producidos (variable dependiente). Es superfluo señalar cómo la variable dependiente «Y» es única y depende de la única variable independiente «x» (Figura 2 en el accesorio).

Artículos Relacionados:

Más posts relacionados:

Deja una respuesta

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *