Ejemplos de regresión y correlación

En un diagrama de dispersión, cuanto más cerca se encuentren los puntos a una línea recta, más fuerte es la relación lineal entre dos variables. Para cuantificar la fuerza de la relación, podemos calcular el coeficiente de correlación. En notación algebraica, si tenemos dos variables x e y, y los datos toman la forma de n pares (es decir, [x1, y1], [x2, y2], [x3, y3]… [xn, yn]) , entonces el coeficiente de correlación viene dado por la siguiente ecuación:

¿Dónde está la media de los valores x, y es la media de los valores y?

Este es el coeficiente de correlación de momento del producto (o coeficiente de correlación de Pearson). El valor de R siempre se encuentra entre -1 y +1. Un valor del coeficiente de correlación cercano a +1 indica una fuerte relación lineal positiva (es decir, una variable aumenta con la otra; Fig. Fig.2) .2). Un valor cercano a -1 indica una relación lineal negativa fuerte (es decir, una variable disminuye a medida que la otra aumenta; Fig. Fig.3) .3). Un valor cercano a 0 no indica una relación lineal (Fig. (Fig. 4); 4); Sin embargo, podría haber una relación no lineal entre las variables (Fig. (Fig. 55).

Para los datos de A&E, el coeficiente de correlación es 0.62, lo que indica una relación lineal positiva moderada entre las dos variables.

Podemos usar el coeficiente de correlación para probar si existe una relación lineal entre las variables en la población en su conjunto. La hipótesis nula es que el coeficiente de correlación de la población es igual a 0. El valor de R se puede comparar con los dados en la Tabla 2,2, o alternativamente los valores de P exactos se pueden obtener de la mayoría de los paquetes estadísticos. Para los datos de A&E, r = 0.62 con un tamaño de muestra de 20 es mayor que el valor resaltado en negrita en la tabla 22 para p = 0.01, lo que indica un valor de P de menos de 0.01. Por lo tanto, hay evidencia suficiente para sugerir que el verdadero coeficiente de correlación de la población no es 0 y que existe una relación lineal entre la urea y la edad.

5% y 1% puntos para la distribución del coeficiente de correlación bajo la hipótesis nula de que la correlación de la población es 0 en una prueba de dos colas

¿Qué es la regresión y correlación?

El análisis de correlación se aplica para cuantificar la asociación entre dos variables continuas, por ejemplo, una variable dependiente e independiente o entre dos variables independientes.

El análisis de regresión se refiere a evaluar la relación entre la variable de resultado y una o más variables. La variable de resultado se conoce como variable dependiente o de respuesta y los elementos de riesgo, y los cofundadores se conocen como predictores o variables independientes. La variable dependiente se muestra mediante «Y» y las variables independientes se muestran con «X» en el análisis de regresión.

La muestra de un coeficiente de correlación se estima en el análisis de correlación. Varía entre -1 y +1, denotado por R y cuantifica la resistencia y la dirección de la asociación lineal entre dos variables. La correlación entre dos variables puede ser positiva, es decir, un nivel más alto de una variable está relacionada con un nivel más alto de otro o negativo, es decir, un nivel más alto de una variable está relacionado con un nivel más bajo del otro.

El signo del coeficiente de correlación muestra la dirección de la asociación. La magnitud del coeficiente muestra la fuerza de la asociación.

Por ejemplo, una correlación de r = 0.8 indica una asociación positiva y fuerte entre dos variables, mientras que una correlación de r = -0.3 muestra una asociación negativa y débil. Una correlación cercana a cero muestra la inexistencia de la asociación lineal entre dos variables continuas.

La regresión lineal es un enfoque lineal para modelar la relación entre los componentes escalares y una o más variables independientes. Si la regresión tiene una variable independiente, entonces se conoce como una regresión lineal simple. Si tiene más de una variable independiente, entonces se conoce como regresión lineal múltiple. La regresión lineal solo se centra en la distribución de probabilidad condicional de los valores dados en lugar de la distribución de probabilidad conjunta. En general, todos los modelos de regresiones del mundo real involucran múltiples predictores. Entonces, el término regresión lineal a menudo describe la regresión lineal multivariada.

¿Qué es regresión y correlación Cuál es la utilidad y la aplicabilidad?

El análisis de correlación es una forma de estadísticas que ayuda a determinar la relación entre dos variables donde una alta correlación indica una relación fuerte, y una correlación débil indica que no están estrechamente relacionadas.

Se pueden ver ejemplos básicos de correlación a nuestro alrededor en nuestra vida diaria cuando decimos que la demanda y el precio de una mercancía están correlacionadas, o la cantidad de lluvia y la producción de cultivos de un área están correlacionadas. Un aspecto importante es que cuando el precio de la mercancía sube y su demanda disminuye; Están correlacionados negativamente. Por otro lado, cuando la lluvia recibida en una región es alta, y su producción de cultivos aumenta; Se dice que están positivamente correlacionados. En general, el valor de R se encuentra en un rango entre –1 a 1; Y podemos decir que si el valor de R es tal que:

  • 1> r> 0 – Existe la correlación positiva
  • r = 0 – No existe correlación
  • -1

El análisis de regresión también se usa para determinar qué variables tienen un impacto específico. Una variable dependiente es el punto principal sobre el que está tratando de comprender más, y la variable independiente son los elementos que pueden tener un efecto en la variable dependiente.

Cuando combina el análisis de correlación y regresión, puede comprender mejor cómo predecir las tendencias para ajustar los productos y los servicios o las campañas de publicidad y marketing, y luego adoptar los mejores enfoques en el futuro en función de sus datos.

¿Qué es regresión y correlación y sus aplicaciones?

Hay tres usos principales para la correlación y la regresión.

  • Una es probar hipótesis sobre las relaciones de causa y efecto. En este caso, el experimentador determina los valores de la variable X y ve si la variación en X causa variación en Y. Por ejemplo, dando a las personas diferentes cantidades de un fármaco y midiendo su presión arterial.
  • El segundo uso principal para la correlación y la regresión es ver si dos variables están asociadas, sin necesariamente inferir una relación de causa y efecto. En este caso, el experimentador determina ninguna variable; Ambos son naturalmente variables. Si se encuentra una asociación, la inferencia es que la variación en x puede causar variación en y, o la variación en y puede causar variación en x, o la variación en algún otro factor puede afectar tanto X como Y.
  • El tercer uso común de la regresión lineal es estimar el valor de una variable correspondiente a un valor particular de la otra variable.

Esto significa que es libre de copiar, compartir y adaptar cualquier pieza (o todas) del texto en el artículo, siempre y cuando proporcione el crédito apropiado y proporcione un enlace/referencia a esta página.

Eso es. No necesita nuestro permiso para copiar el artículo; Solo incluya un enlace/referencia de regreso a esta página. Puede usarlo libremente (con algún tipo de enlace), y también estamos de acuerdo con las personas que reimprimen en publicaciones como libros, blogs, boletines, materiales de curso, documentos, Wikipedia y presentaciones (con clara atribución).

Artículos Relacionados:

Más posts relacionados:

Deja una respuesta

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *