Ejemplo de análisis de regresión lineal múltiple

Los modelos de regresión se utilizan para describir las relaciones entre variables ajustando una línea a los datos observados. La regresión le permite estimar cómo cambia una variable dependiente a medida que cambia las variables independientes.

La regresión lineal múltiple se utiliza para estimar la relación entre dos o más variables independientes y una variable dependiente. Puede usar una regresión lineal múltiple cuando desee saber:

  • Qué tan fuerte es la relación entre dos o más variables independientes y una variable dependiente (por ejemplo, cómo la lluvia, la temperatura y la cantidad de fertilizante agregado afectan el crecimiento de los cultivos).
  • El valor de la variable dependiente a un cierto valor de las variables independientes (por ejemplo, el rendimiento esperado de un cultivo en ciertos niveles de lluvia, temperatura y adición de fertilizantes).
    Exampyou es un investigador de salud pública interesada en factores sociales que influyen en la enfermedad cardíaca. Usted encuesta a 500 ciudades y recopila datos sobre el porcentaje de personas en cada ciudad que fuman, el porcentaje de personas en cada ciudad que andan en bicicleta al trabajo y el porcentaje de personas en cada ciudad que tienen enfermedades cardíacas.

Debido a que tiene dos variables independientes y una variable dependiente, y todas sus variables son cuantitativas, puede usar una regresión lineal múltiple para analizar la relación entre ellas.

Homogeneidad de varianza (homoscedasticidad): el tamaño del error en nuestra predicción no cambia significativamente en los valores de la variable independiente.

¿Cómo hacer un análisis de regresión lineal multiple?

Anteriormente, hemos visto situaciones en las que un resultado (la variable dependiente) se basa en una sola variable de entrada (variable independiente). Lamentablemente, la vida real rara vez es tan simple. La mayoría de los resultados en situaciones reales se ven afectados por múltiples variables de entrada. Para comprender tales relaciones, utilizamos modelos que usan más de una entrada (variables independientes) para modelar linealmente una salida única (variable dependiente).

Un modelo de regresión lineal múltiple es una ecuación lineal que tiene la forma general: y = b1x1 + b2x2 +… + c donde y es la variable dependiente, x1, x2… son la variable independiente, y C es la intersección (estimada).

En los datos anteriores, el ‘número de pasajeros semanales’ es una variable dependiente que depende del ‘precio por semana ($)’, ‘población de la ciudad’, ‘ingresos mensuales de los pasajeros ($)’, ‘tarifas promedio de estacionamiento por mes ($) ‘.

  • Precio por semana ($) – x1
  • Población de la ciudad – X2
  • Ingresos mensuales de los corredores ($) – x3
  • Tasas de estacionamiento promedio por mes ($)- x4
  • Número de corredores semanales – Y

El modelo lineal sería de la forma: y = ax1 + bx2 + cx3 + dx4 + e donde a, b, c, d son los coeficientes respectivos y E es la intercepción.

Hay dos formas diferentes de crear el modelo lineal en Microsoft Excel. En este artículo, echaremos un vistazo a la función de regresión incluida en el análisis de análisis de datos. Busque aquí para ver los detalles sobre cómo habilitar la herramienta de análisis de datos en su computadora.

¿Cómo se realiza un análisis de regresión lineal?

La regresión lineal es una técnica estadística utilizada para obtener más información sobre la relación entre una variable independiente (predictiva) y una variable de empleado (criterio). Cuando hay variables más independientes en el análisis, se habla de regresión lineal múltiple. En general, la regresión permite al investigador hacer la pregunta general «¿Cuál es el mejor predictor de…?»

Por ejemplo, digamos que estábamos estudiando las causas de la obesidad, medidas por el índice de masa corporal (IMC). En particular, queríamos ver si las siguientes variables eran predictores significativos del IMC de una persona: número de comidas consumidas por comida rápida por semana, número de horas de televisión por semana, número de minutos pasados ​​en el ejercicio por semana y Padres de BMI dei dei. La regresión lineal sería una buena metodología para este análisis.

Al realizar un análisis de regresión con una variable independiente, la ecuación de regresión es y = a + b*x donde y es la variable dependiente, x es la variable independiente, a es la constante (o interceptada) y b es la pendiente de la regresión tarifa. Por ejemplo, suponga que el GPA está mejor previsto por la ecuación de regresión de 1 + 0.02*Qi. Si un estudiante tuviera un Qi de 130, su GPA sería 3.6 (1 + 0.02*130 = 3.6).

Al realizar un análisis de regresión en el que tiene más que una variable independiente, la ecuación de regresión es y = a + b1*x1 + b2*x2 +… + bp*xp. Por ejemplo, si quisiéramos incluir más variables en nuestro análisis de GPA, como la motivación y las medidas de auto -disciplina, usaríamos esta ecuación.

¿Qué es un análisis de regresión múltiple?

Definición: El análisis de regresión múltiple es un método estadístico utilizado para predecir el valor una variable dependiente basada en los valores de dos o más variables independientes.

¿Cuál es la definición de análisis de regresión múltiple? El valor que se predice se denomina variable dependiente porque su resultado o valor depende del comportamiento de otras variables. El valor de las variables independientes generalmente se determina a partir de la población o muestra.

En los negocios, los gerentes de ventas utilizan análisis de regresión múltiple para analizar el impacto de algunas actividades promocionales en las ventas. El análisis de regresión múltiple se puede utilizar para descubrir también el impacto del incremento salarial y los incrementos en otros beneficios de los empleados en la producción de empleados. El análisis es útil cuando desea predecir el impacto de las variables independientes individuales en el resultado deseado.

Este análisis hace algunos supuestos sobre el margen de error para el análisis, que debe verificarse cuando se usa el modelo. Lo más común es que los errores son independientes y normalmente distribuidos. También supone que los errores tienen una varianza constante y la media de los errores es cero.

El análisis de regresión múltiple se puede realizar utilizando Microsoft Excel y SPSS de IBM. Otras herramientas estadísticas pueden usarse igualmente para predecir fácilmente el resultado de una variable dependiente del comportamiento de dos o más variables independientes.

Este análisis se puede utilizar para predecir qué tan bien un nuevo proceso en una empresa está respondiendo a algunos ajustes realizados a ese proceso. También se puede usar en el hogar para determinar los cambios en el costo de la energía consumida en función de algunos métodos y equipos de conservación de energía empleados en la casa. En las escuelas, este análisis se utiliza para determinar el rendimiento de los estudiantes que usan horas de clase, horas de biblioteca y horas de ocio como variables independientes.

¿Qué es el análisis de regresión ejemplos?

Si desea encontrar tendencias de datos o predecir las ventas en función de ciertas variables, entonces el análisis de regresión es el camino a seguir. En este artículo, aprenderemos sobre el análisis de regresión, los tipos de análisis de regresión, las aplicaciones comerciales y sus casos de uso. Siéntase libre de saltar a una sección que sea relevante para usted:

Para decirlo en palabras simples, es un método para identificar las variables que tienen un impacto en otra variable. Se usa principalmente en finanzas, inversiones y otras áreas para determinar la fuerza y ​​el carácter de la relación entre una variable dependiente y una serie de otras variables.

Veamos algunas de las preguntas más frecuentes sobre el análisis de regresión antes de que nos dirigamos a comprender todo al respecto.

Es un método estadístico que se utiliza para predecir el valor de una variable dependiente basada en los valores de dos o más variables independientes.

Es el nombre dado a una variable independiente que se usa en el análisis de regresión. La variable predictor proporciona información sobre una variable dependiente asociada con respecto a un determinado resultado. En esencia, las variables predictoras son aquellas que están vinculadas con resultados particulares.

Es un gráfico que muestra los residuos en el eje vertical y la variable independiente en el eje horizontal. La gráfica residual es una representación de cuán cerca está verticalmente el punto de datos del gráfico de la ecuación de predicción del modelo. Si el punto de datos está por encima o por debajo del gráfico de la ecuación de predicción del modelo, se supone que se ajusta a los datos.

¿Cómo se calcula el análisis de regresión?

La regresión se usa en el modelado estadístico, y básicamente nos dice la relación entre las variables y su movimiento en el futuro, aparte de los métodos estadísticos como la desviación estándar, la regresión, la correlación. El análisis de regresión es la medida más amplia y comúnmente aceptada para medir la varianza en la industria. Estas relaciones rara vez son exactas porque hay una variación causada por muchas variables, no solo las variables que se estudian. El método se usa ampliamente en la industria para el modelado predictivo y las medidas de pronóstico. La regresión nos dice la relación de la variable independiente en la variable dependiente y para explorar las formas de estas relaciones.

La fórmula para la intercepción «A» y la pendiente «B» se pueden calcular según lo siguiente.

El análisis de regresión es una de las técnicas estadísticas multivariadas más potentes, ya que el usuario puede interpretar los parámetros de la pendiente y la intercepción de las funciones que vinculan con dos o más variables en un conjunto de datos dado.

Hay dos tipos de regresión de regresión multilineal y regresión lineal simple. La regresión lineal simple se explica y es la misma que arriba. Mientras que la regresión multilineal se puede denotar como

  • Y – Variable dependiente
  • X1, X2, X3 – Variables independientes (explicativas)
  • A – Intercepción
  • B, C, D – Pendías
  • ϵ – residual (error)

Tomemos un ejemplo para comprender el cálculo de la fórmula de regresión de una mejor manera.

¿Qué es una análisis de regresión multiple?

Se realizó un análisis de regresión múltiple para examinar los efectos de tres factores (estrategia de toma de decisiones, grupo al que pertenecían los participantes y el tipo de agenda) en la evaluación de los individuos del proceso de discusión, la evaluación de los resultados de la discusión y la satisfacción general con el discusión. Específicamente, se realizó un análisis de regresión múltiple con la evaluación del proceso de discusión, la evaluación de los resultados de la discusión y la satisfacción general de la discusión como las variables dependientes y la estrategia de toma de decisiones, el grupo al que pertenecían los participantes, y el tipo de agenda como variables independientes. Los modelos fueron evaluados por AIC. Los modelos examinados fueron un modelo que predecía solo interceptando (número de modelo 1), un modelo que predice por estrategia de intercepción y decisión (modelo número 2), un modelo que predice por intercepción y grupo de participantes (modelo número 3), un modelo que explica por intersección y Tipo de agenda (modelo número 4), un modelo que predice por intersección, estrategia de decisión y grupo de participantes (modelo número 5), un modelo predicto por intercepción, estrategia de decisión y tipo de agenda (modelo número 6), un modelo que predice por intercepción, Los participantes del grupo pertenecen y el tipo de agenda (modelo número 7), un modelo que predice por intercepción, estrategia de decisión, participantes del grupo pertenece y tipo de agenda (modelo número 8), una interacción entre la intersección y la estrategia de decisión, el grupo a que pertenece el participante, la estrategia de decisión y el grupo al que pertenece el participante (modelo número 9), una interacción entre la intersección y la estrategia de decisión, el tipo de agenda, la estrategia de decisión y el tipo de O F agenda (modelo número 10), y una interacción entre la intersección y el grupo al que pertenece el participante, el tipo de agenda, el grupo al que pertenece el participante y el tipo de agenda (número de modelo 11). Comparamos los coeficientes de regresión parcial de la estrategia de decisión en el modelo con la AIC más baja entre los seis modelos que incluían la estrategia de decisión.

Se realizó un análisis de regresión múltiple para examinar la influencia de los tres factores de la estrategia de toma de decisiones, el grupo al que pertenecían los participantes y el tipo de agenda en la evaluación del proceso de discusión. Como resultado de comparar y clasificar el AIC de cada modelo, el modelo con el AIC más bajo fue el modelo que predijo la evaluación del proceso de discusión por la interacción de la estrategia de decisión, el grupo al que pertenecían los participantes y la decisión estrategia y el grupo al que pertenecían los participantes (modelo número 9), con una AIC de 2767.89. En otras palabras, entre los 11 modelos examinados, el modelo que predice la evaluación del proceso de discusión mediante la interacción de la estrategia de decisión, el grupo al que pertenece el participante y el grupo al que pertenece el participante con la estrategia de decisión Se puede considerar como el modelo con la capacidad predictiva más alta.

Los coeficientes de regresión parcial para las estrategias de decisión en este modelo se muestran en la Tabla 5.6. Los coeficientes de regresión parcial para DIS como referencia fueron −0.07 para WAD y −0.02 para LEX. No hubo diferencias significativas entre WAD y Dis para WAD o LEX [WAD: T (1140) = – 0.63, N.S.; Lex: t (1140) = – 0.18, n.s.]. No hubo diferencias significativas entre WAD y DIS [WAD: T (1140) = – 0.63, N.S.; Lex: t (1140) = – 0.18, n.s.]. Esto sugiere que al comparar WAD y DIS, y Lex y Dis, las calificaciones del proceso de discusión no cambiaron, respectivamente.

Se realizó un análisis de regresión múltiple para examinar la influencia de los tres factores de la estrategia de toma de decisiones, el grupo al que pertenecían los participantes y el tipo de agenda sobre la evaluación del resultado de la discusión. El modelo AIC más bajo predijo la evaluación del proceso de discusión mediante la interacción de la estrategia de toma de decisiones y el grupo al que pertenecían los participantes (Modelo número 9), con un AIC de 3439.48. En otras palabras, entre los 11 modelos examinados, el modelo que predice la evaluación del resultado de la discusión por la interacción de la estrategia de decisión, el grupo al que pertenece el participante y el grupo al que pertenece el participante con el Se puede considerar que la estrategia de decisión es el modelo con la capacidad predictiva más alta.

¿Qué es el análisis de regresión y para qué se utiliza?

¿Qué es la regresión? La regresión es una técnica de análisis estadístico que permite investigar las relaciones de dependencia entre la variabilidad variable. A diferencia de la correlación, por lo tanto, la regresión le permite estudiar relaciones de causa-efecto.

Cuando entre dos variables hay un informe de dependencia, puede intentar predecir el valor de una variable de acuerdo con el valor tomado del otro.

  • Regresión lineal simple. La regresión lineal simple se refiere a la relación causa-efecto existente entre solo dos variables; Este es el caso de cuándo se supone una relación causal entre una variable independiente (x) en la que actuamos, y el empleado (y) en el que desea producir un efecto. Al construir un modelo de regresión lineal, es posible predecir Y de acuerdo con X.
  • Regresiónmultipla. Estudios de regresión múltiple La influencia de dos o más variables explicativas en una variable de empleado; Es decir, cómo este último está determinado por al menos otras dos variables. Por ejemplo, la tendencia a comprar un determinado producto podría depender del precio y la calidad percibida. En este caso, el precio y la calidad del producto percibido representan variables capaces de predecir el comportamiento de compra.

Por supuesto, es raro que pueda identificar todas las variables capaces de explicar el progreso de otro. Para comprender cuánto las variables incluidas en el modelo de regresión múltiple pueden predecir la variable dependiente (en el ejemplo anterior, el comportamiento de compra), se observa el valor del «cuadrado R» o el índice de bondad de adaptación. Esto indica qué tan fuerte es la capacidad predictiva del modelo obtenido, es decir, cuánto las variables independientes (la x) logran predecir los valores de la variable dependiente (la y).

El índice R cuadrado varía de 0 a 1. Si el índice es igual 0, indica un modelo cuyas variables predictivas no explican la variable dependiente en absoluto. Por el contrario, si el valor del cuadrado R es 1, las variables incluidas en el modelo de regresión múltiple explican completamente dependiente del lavado.

Como se puede entender en el ejemplo que se muestra anteriormente, saber cómo llevar a cabo el análisis de regresión es muy importante para trabajar en el sector de investigación de mercado y basar los pronósticos en los datos objetivos. En una investigación de 2022 surgió cómo el análisis estadístico y la capacidad de interpretar los resultados emergentes son algunas de las habilidades clave para aquellos que desean operar en este sector.

Artículos Relacionados:

Más posts relacionados:

Deja una respuesta

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *