Aprende a hacer regresión lineal múltiple en R

Como ejemplo, un analista puede querer saber cómo el movimiento del mercado afecta el precio de ExxonMobil (XOM). En este caso, su ecuación lineal tendrá el valor del índice S&P 500 como la variable independiente, o predictor, y el precio de XOM como la variable dependiente.

En realidad, múltiples factores predicen el resultado de un evento. El movimiento de precios de ExxonMobil, por ejemplo, depende de algo más que el rendimiento del mercado general. Otros predictores, como el precio del petróleo, las tasas de interés y el movimiento del precio de los futuros de petróleo, pueden afectar el precio de los precios de XOM y las acciones de otras compañías petroleras. Para comprender una relación en la que están presentes más de dos variables, se usa una regresión lineal múltiple.

La regresión lineal múltiple (MLR) se usa para determinar una relación matemática entre varias variables aleatorias. En otros términos, MLR examina cómo múltiples variables independientes están relacionadas con una variable dependiente. Una vez que cada uno de los factores independientes se ha determinado para predecir la variable dependiente, la información sobre las variables múltiples se puede utilizar para crear una predicción precisa en el nivel de efecto que tienen en la variable de resultado. El modelo crea una relación en forma de línea recta (lineal) que mejor se aproxima a todos los puntos de datos individuales.

Refiriéndose a la ecuación MLR anterior, en nuestro ejemplo:

  • yi = variable dependiente: el precio de XOM
  • xi1 = tasas de interés
  • xi2 = precio del petróleo
  • xi3 = valor del índice S&P 500
  • xi4 = precio de los futuros de petróleo
  • B0 = y-intersección en el tiempo cero
  • B1 = coeficiente de regresión que mide un cambio de unidad en la variable dependiente cuando XI1 cambia: el cambio en el precio de XOM cuando las tasas de interés cambian

Las estimaciones de mínimos cuadrados (B0, B1, B2… BP) generalmente son calculadas por el software estadístico. Ya que se pueden incluir muchas variables en el modelo de regresión en el que cada variable independiente se diferencia con un número: 1,2, 3, 4… p. El modelo de regresión múltiple permite a un analista predecir un resultado basado en la información proporcionada en múltiples variables explicativas.

¿Dónde se aplica la regresión lineal multiple?

La regresión lineal múltiple es la forma más común de análisis de regresión lineal. Como análisis predictivo, la regresión lineal múltiple se usa para explicar la relación entre una variable dependiente continua y dos o más variables independientes. Las variables independientes pueden ser continuas o categóricas (ficticias codificadas según corresponda).

¿El peso, la altura y la edad explican la varianza en los niveles de colesterol?

Alinear el marco teórico, la recopilación de artículos, sintetizar brechas, articular una metodología y plan de datos claros, y escribir sobre las implicaciones teóricas y prácticas de su investigación son parte de nuestros servicios integrales de edición de tesis.

  • Rastree todos los cambios, luego trabaje con usted para lograr una escritura académica.
  • Apoyo continuo para abordar los comentarios del comité, reduciendo las revisiones.

Se supone una relación lineal entre la variable dependiente y las variables independientes.

Los residuos son homoscedásticos y aproximadamente en forma rectangular.

La ausencia de multicolinealidad se supone en el modelo, lo que significa que las variables independientes no están demasiado correlacionadas.

En el centro del análisis de regresión lineal múltiple se encuentra la tarea de ajustar una sola línea a través de una gráfica de dispersión. Más específicamente, la regresión lineal múltiple se adapta a una línea a través de un espacio multidimensional de puntos de datos. La forma más simple tiene una de las variables dependientes y dos independientes. La variable dependiente también puede denominarse la variable de resultado o el regreso y. Las variables independientes también pueden denominarse variables o regresores predictoras.

¿Dónde se aplica la regresion lineal multiple?

Por ejemplo, un análisis de regresión múltiple puede revelar una relación positiva entre la demanda de gafas de sol y diferentes caracteres demográficos (edad, salario) de los compradores de este producto. La demanda aumenta y disminuye con las variaciones en estas características.

Dada una muestra (yi, xi1,…, xip) i ∈ {1, n}, buscamos explicar, con la mayor precisión posible, los valores tomados por yi, llamados variables endógenas, de una serie de una serie de Variables explicativas xi1,…, xip. El modelo teórico, formulado en términos de variables aleatorias, toma la forma

Donde εi es el error del modelo que expresa, o resume, la información faltante en la explicación lineal de los valores de yi del XI1,…, XIP (problema de especificaciones, variables no tomadas en cuenta, etc. ). Los coeficientes A0, A1,…, AP son los parámetros a estimar.

Como en la regresión simple, las hipótesis permiten determinar: las propiedades de los estimadores (sesgos, convergencia); y sus leyes de distribución (para estimaciones de intervalo y pruebas de hipótesis).

  • H6: ε∼Nn (0, σ2in) { DisplayStyle Varepsilon Sim { Mathcal {n}} _ {n} (0, sigma ^{2} i_ {n}) ,} Los errores siguen una ley Multidimensional normal (H6 implica las hipótesis H2, H3 y H4, siendo el recíproco falso porque las tres hipótesis unidas no implican que ε sea un vector gaussiano).
  • H9: n> p+1 { displayStyle n> p+1 ,} El número de observaciones es estrictamente mayor que el número de variables+1 (la constante). Si hubiera igualdad, el número de ecuaciones sería igual al número de incógnitas AJ, el derecho de regresión pasaría por todos los puntos, nos enfrentaríamos a un problema de interpolación lineal (ver interpolación digital).

¿Cómo usar la regresion lineal multiple?

Por ejemplo, un analista puede querer saber cómo el movimiento del mercado afecta el precio de ExxonMobil (XOM). En este caso, su ecuación lineal tendrá el valor del índice S&P 500 como una variable independiente, o predictor, y el precio de XOM como una variable dependiente.

En realidad, hay muchos factores que predican el resultado de un evento. El movimiento de precios de ExxonMobil, por ejemplo, no depende solo de la tendencia del mercado general. Otros predictores, como el precio del petróleo, las tasas de interés y el movimiento de los precios del futuro petróleo en el petróleo, pueden influir en el precio de XOM y los precios de las acciones de otras compañías petroleras. Para comprender una relación en la que están presentes más de dos variables, se usa una regresión lineal múltiple.

La regresión lineal múltiple (MLR) se usa para determinar una relación matemática entre una serie de variables aleatorias. En otras palabras, MLR examina la forma en que las variables más independientes están relacionadas con una variable de empleado. Una vez que cada uno de los factores independientes se ha determinado para predecir la variable dependiente, la información sobre múltiples variables se puede utilizar para crear un pronóstico preciso en el nivel de efecto que tienen en la variable de resultado. El modelo crea una relación en forma de línea recta (lineal) que aproximadamente todos los puntos de datos individuales.

Refiriéndose a la ecuación MLR anterior, en nuestro ejemplo:

  • y i = Variable dependiente: XOM Price

¿Cómo se hace la regresión lineal multiple?

La regresión lineal múltiple se refiere a una técnica estadística que se utiliza para predecir el resultado de una variable basada en el valor de dos o más variables. A veces se conoce simplemente como regresión múltiple, y es una extensión de la regresión lineal. La variable que queremos predecir se conoce como la variable dependiente, mientras que las variables que usamos para predecir el valor de la variable dependiente se conocen como variables independientes o explicativas.

  • La regresión lineal múltiple se refiere a una técnica estadística que utiliza dos o más variables independientes para predecir el resultado de una variable dependiente.
  • La técnica permite a los analistas determinar la variación del modelo y la contribución relativa de cada variable independiente en la varianza total.
  • La regresión múltiple puede tomar dos formas, es decir, regresión lineal y regresión no lineal.
  • Yi es la variable dependiente o predicha
  • β0 es la intersección y, es decir, el valor de y cuando Xi y X2 son 0.
  • β1 y β2 son los coeficientes de regresión que representan el cambio en Y en relación con un cambio de una unidad en XI1 y XI2, respectivamente.
  • βP es el coeficiente de pendiente para cada variable independiente
  • ϵ es el término de error aleatorio (residual) del modelo.

La regresión lineal simple permite a los estadísticos predecir el valor de una variable utilizando la información disponible sobre otra variable. La regresión lineal intenta establecer la relación entre las dos variables a lo largo de una línea recta.

¿Qué es el análisis de regresión múltiple?

La regresión recta múltiple es el tipo más común de análisis de regresión rectilínea. Como análisis predictivo, se utilizan múltiples regresiones rectas para aclarar la conexión entre una variable continua y dos o más variables independientes. Las variables independientes a menudo son continuas o categóricas (adecuadamente codificadas con un código ficticio).

¿Son las puntuaciones de edad y el cociente intelectual capaz de predecir de manera efectiva el AAP?

¿El peso, la altura y la edad explican la variación de los niveles de colesterol?

Los residuos de regresión deben distribuirse normalmente.

Tomamos una relación lineal entre la variable y, por lo tanto, las variables independientes.

Los residuos son omsadadastici y de forma aproximadamente rectangular.

La ausencia de multicelinealidad se toma dentro del modelo, lo que significa que las variables independientes no están demasiado relacionadas.

En el centro del análisis de regresión recta múltiple es que la tarea de insertar una línea a través de un diagrama de dispersión. Más específicamente, múltiples regresiones rectas se adaptan a una línea a través de un espacio multidimensional de puntos de conocimiento. La única forma tiene una variable de empleado y dos variables independientes. La variable también se puede mencionar porque el resultado o el regresión y la variable. Las variables independientes también se pueden mencionar porque las variables depredadoras o represoras.

Artículos Relacionados:

Más posts relacionados:

Deja una respuesta

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *