Análisis de regresión múltiple: Ejemplos y explicación paso a paso

Como su nombre indica, la regresión múltiple es una técnica estadística aplicada a conjuntos de datos dedicados a extraer una relación entre una respuesta o variable dependiente y variables independientes múltiples. De la definición, es obvio que el estudio de un evento o fenómeno tendrá varios factores que causan su ocurrencia.

La regresión múltiple funciona considerando los valores de las variables independientes múltiples disponibles y prediciendo el valor de una variable dependiente.

Ejemplo: un investigador decide estudiar el desempeño de los estudiantes en una escuela durante un período de tiempo. Observó que a medida que las conferencias proceden a operar en línea, el rendimiento de los estudiantes también comenzó a disminuir. Los parámetros para la variable dependiente «disminución en el rendimiento» son varias variables independientes como «falta de atención, más adicción a Internet, descuidar los estudios» y mucho más.

En el caso de la regresión lineal, aunque se usa comúnmente, se limita a una sola variable independiente y una dependiente. Además de eso, la regresión lineal restringe el conjunto de datos de capacitación y no predice una regresión no lineal.

Para las mismas limitaciones y para cubrirlas, usamos regresión múltiple. Se centra en superar una limitación en particular y eso está permitiendo analizar más de una variable independiente.

Comenzaremos la discusión analizando primero la ecuación de regresión lineal:

Y es una variable dependiente que necesitamos encontrar, x es una variable independiente. Las constantes A y B impulsan la ecuación. Pero de acuerdo con nuestra definición, ya que la regresión múltiple toma varias variables independientes (x), por lo que para la ecuación también tendremos múltiples valores x:

Aquí, para calcular el valor de la variable dependiente y, tenemos múltiples variables independientes x1, x2, etc. El número de variables independientes puede crecer hasta N y la constante B con cada variable denota su valor numérico. El propósito de la constante A es denotar el valor de la variable dependiente en el caso de que todos los valores variables independientes se conviertan en cero.

¿Cómo se hace un análisis de regresión multiple?

Para realizar una regresión multivariada en Stata, necesitamos usar dos comandos,
Manova y Mvreg. El comando Manova indicará si
Todas las ecuaciones, tomadas en conjunto, son estadísticamente significativas. los
F-Ratios y valores P para cuatro
Se dan criterio multivariado, incluida la lambda de Wilks, Lawley-Hotelling
Trace, Trace de Pillai y la raíz más grande de Roy. A continuación, usamos el MVREG
comandar los coeficientes, errores estándar, etc., para cada uno de los predictores en
cada parte del
modelo. También mostraremos el uso del comando de prueba después del
comando mvreg. El uso del comando de prueba es uno de los
razones convincentes para realizar un análisis de regresión multivariante.

A continuación ejecutamos el comando Manova. Tenga en cuenta el uso de c. en frente de
Nombres de las variables predictoras continuas: esto es parte de la variable de factor
Sintaxis introducida en Stata 11. Es necesario usar la c. identificar
las variables continuas, porque, por defecto, el comando MANOVA asume todos
Las variables predictoras son categóricas.

  • Las pruebas para el modo general, que se muestran en el modelo etiquetado de sección (bajo
    Fuente), indique que el modelo es estadísticamente significativo, independientemente del tipo de
    Los criterios multivariados que se usan (es decir, todos los valores p son inferiores a 0.0001). Si el
    El modelo general no fue estadísticamente significativo, es posible que desee modificarlo
    Antes de ejecutar MVREG.
  • Debajo de las pruebas generales del modelo, están las pruebas multivariadas para cada una de las variables predictoras. Cada una de las
    Los predictores son estadísticamente significativos en general, independientemente de qué prueba sea
    usó.

Podemos usar MVREG para obtener estimaciones de los coeficientes en nuestro modelo.
Normalmente MVREG requiere que el usuario especifique tanto el resultado como el predictor
Variables, sin embargo, porque acabamos de ejecutar el comando Manova, podemos usar el comando mvreg, sin
entrada adicional, para ejecutar una regresión multivariada correspondiente al modelo solo
estimado por Maova (tenga en cuenta que esta característica se introdujo en Stata 11, si
Está utilizando una versión anterior de STATA, deberá usar la sintaxis completa para MVREG).

¿Cuándo se debe aplicar el análisis de regresión múltiple?

Comenzamos desde la ecuación de regresión múltiple, que obviamente se presenta como una «expansión» de la de regresión lineal simple, y tiene esta forma general:

donde y es la variable de respuesta (N.B.: es única) a1, a2… ai son los coeficientes de regresión para las variables predictivas x1, x2… xi son las variables predictivas b es la intercepción (y también es única)

Puedo y debo, en primera instancia, comprender cuánto mis variables predictivas y combinadas están significativamente relacionadas con la variable dependiente. Y cuánto del resultado se explica por la combinación de las variables predictivas utilizadas en el modelo.

Luego tengo que entender cuánto se vincula cada variable predictiva con la variable dependiente, mientras que controlo la otra variable independiente (supongo que la simplicidad es que las variables predictivas son solo dos).

Luego debo entender cuál de mis dos predictores es el «más fuerte» en la estimación de la variable dependiente.

Estas y muchas otras cosas se pueden examinar con las herramientas disponibles por el análisis de regresión múltiple y estas primeras sugerencias ya muestran el poder y la utilidad práctica de esta técnica.

El análisis de regresión múltiple es una técnica poderosa y ampliamente utilizada, pero para poder usarlo correctamente es necesario que se respeten algunas contrataciones fundamentales:

  • La variable dependiente debe medirse en una escala de intervalo o relación, y la variable predictiva también debe ser intervalo/relación o dicotómica.

¿Cuándo se aplica la regresión múltiple?

En este artículo nos presentaremos a los conceptos de regresión multivariada. También discutiremos sobre un problema común asociado con el algoritmo, es decir, la trampa variable ficticia.

Primero nos familiarizaremos con los conceptos de regresión multivariada y luego construiremos nuestro propio modelo de regresión multivariante. Sin embargo, antes de comenzar, le recomendaría que eche un vistazo a mi artículo sobre regresión lineal simple para comprender aún mejor los conceptos.

La regresión multivariada es una extensión de regresión lineal simple. Se usa cuando queremos predecir el valor de una variable basado en el valor de dos o más variables diferentes. La variable que queremos predecir se denomina variable dependiente, mientras que las utilizadas para calcular la variable dependiente se denominan variables independientes.

La función matemática/hipótesis de una regresión multivariada es de la forma:

Donde, n representa el número de variables independientes, β0 ~ βnrepresents los coeficientes y x1 ~ xn, son la variable independiente

El uso de un modelo multivariado nos ayuda a comparar coeficientes entre los resultados. Lo que hace que una regresión lineal multivariante o múltiple sea un mejor modelo es una pequeña función de costo.

En palabras simples, es una función que asigna un costo a las instancias en las que el modelo se desvía de los datos observados. En este caso, nuestro costo es la suma de errores al cuadrado. La función de costo para la regresión lineal múltiple viene dada por:

Podemos entender esta ecuación como la suma del cuadrado de diferencia entre nuestro valor predicho y el valor real dividido por dos veces la longitud del conjunto de datos. Un error cuadrático medio más pequeño implica un mejor rendimiento. En general, se utiliza una función de costo junto con el algoritmo de descenso de gradiente para encontrar los mejores parámetros.

Artículos Relacionados:

Más posts relacionados:

Deja una respuesta

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *