El análisis de regresión lineal simple es una herramienta estadística para cuantificar la relación entre una variable independiente (por lo tanto «simple») y una variable dependiente basada en la experiencia pasada (observaciones).
Basado en ingresar un número razonable de observaciones de las variables independientes y dependientes, el software de regresión calculará la mejor línea recta de ajuste (por lo tanto «lineal») que expresa la relación promedio entre la variable dependiente e independiente.
El análisis de regresión lineal simple es útil para determinar los dos componentes de un costo mixto (también conocido como costo semivariable):
- La cantidad que es fija o constante
- La tasa variable (la tasa por la cual cambia el costo total cuando hay una unidad adicional de la variable independiente)
Suponga que un fabricante quiere saber la cantidad de su factura de electricidad mensual que es una cantidad fija y cuánto cambia la factura de electricidad cuando cambia el número de horas de la máquina de producción. El fabricante analizará la cantidad de la factura de electricidad de cada mes (la variable dependiente) y luego determinará el número de horas de la máquina de producción (la variable independiente) que ocurrió entre las fechas de lectura del medidor indicadas en la factura.
El monto de cada factura y las horas relacionadas de la máquina de producción para el proyecto de ley se ingresan en el software de regresión. El software determina la mejor línea de ajuste en función de las cantidades ingresadas. La línea se expresa como y = a + bx, donde:
- La cantidad que es fija o constante
- La tasa variable (la tasa por la cual cambia el costo total cuando hay una unidad adicional de la variable independiente)
¿Qué es regresión lineal simple y múltiple?
La regresión lineal múltiple es una extensión del análisis de la correlación y la regresión lineal simple.
Al igual que el análisis de correlación, la regresión lineal permite analizar la relación entre variables. De hecho, le permite estudiar tanto su dirección como su importancia. Además, la regresión le permite cuantificar qué, en promedio, aumentará o disminuirá la Y como la puntuación de la puntuación de una variable explicativa.
En el modelo de regresión lineal simple, se estudia la relación entre la Y y la X, es decir, se puede incluir una variable explicativa única. En el modelo de regresión lineal múltiple, por otro lado, se incluyen dos o más variables explicativas para estudiar simultáneamente la mayor cantidad de x sobre el efecto Y. Si tiene claro el análisis de una regresión lineal simple, verá que la extensión del caso múltiple será fácil de entender.
La construcción de un modelo de regresión lineal múltiple permite cuantificar la relación entre la variable dependiente (y) y un conjunto de variables explicativas (la x). Además, le ayuda a predecir cuál es el valor de Y para ciertos valores de X.
Indicativamente, debe tener al menos 10-15 observaciones que cada variable independiente que inserta en el modelo, incluidas las interacciones y los términos polinomiales. Por lo tanto, cuanto más previe que su modelo sea complejo, más su muestra tendrá que ser numerosa.
Por ejemplo, si el modelo de regresión que desea construir tendrá dos variables independientes, necesitará al menos 20-30 observaciones en su muestra. Si, por otro lado, también planea evaluar la interacción entre las dos variables, entonces necesitará al menos 30-45 observaciones.
¿Qué es la regresión lineal simple y múltiple?
El análisis de regresión es un método estadístico común utilizado en la inversión. La regresión lineal es una de las técnicas más comunes de análisis de regresión. La regresión múltiple es una clase más amplia de regresiones que incluye regresiones lineales y no lineales con más variables explicativas.
La regresión como herramienta ayuda a armar datos para ayudar a las personas y las empresas a tomar decisiones informadas. Hay varias variables en juego en la regresión, incluida una variable de empleado, la variable principal que está tratando de comprender, y una variable independiente, factores que pueden tener un impacto en la variable dependiente.
Para que el análisis de regresión funcione, es necesario recopilar todos los datos relevantes. Se puede presentar en un diseñador gráfico, con un eje x y un eje Y.
Hay varias razones principales por las que las personas usan el análisis de regresión:
- Para predecir condiciones económicas, tendencias o valores futuros
- Para determinar la relación entre dos o más variables
- Para comprender cómo cambia una variable cuando otra cambia
Hay muchos tipos diferentes de análisis de regresión. Para este artículo, examinaremos dos: regresión lineal y regresión múltiple.
También se llama regresión lineal simple. Establece la relación entre dos variables usando una línea recta. La regresión lineal intenta rastrear una línea más cercana a los datos al encontrar la pendiente e interceptar que definen la línea y minimizar los errores de regresión.
¿Qué es la regresión simple y cuál es su funcionalidad?
La idea en la que se basa la identificación de la regresión recta es muy simple. Intuitivamente, la línea «correcta» tendrá que pasar lo más posible a todos los puntos en la tabla de dispersión.
Como recordamos antes, por un punto infinito recto. Entonces, en primer lugar, para encontrar una regresión directa, debe arreglar un punto. El punto en cuestión está dado por las coordenadas (promedio de X, medios de y). ¿Recuerdas lo que dijimos primero sobre la regresión hacia el promedio? Aquí, como ve, el promedio es el gran protagonista de este método.
De hecho, la tarifa de regresión siempre pasa por el valor promedio de X y para el valor promedio de Y. y esto es exactamente por qué el promedio no es un buen indicador para su variable (porque, por ejemplo, hay salidas extremas), incluso el El modelo de regresión lineal no será un buen modelo para sus datos.
Así que vamos a encontrar cuál de las líneas rectas infinitas que pasan por este punto es lo que necesitamos. En otras palabras, el que mejor se acerca a nuestros puntos.
El procedimiento matemático estándar que le permite encontrar los dos parámetros que definen la línea recta se denomina «método de cuadrados mínimos» (en inglés, OLS).
Los «cuadrados mínimos» significa que este método tiene el objetivo de encontrar dos parámetros (llamados en los modelos de regresión β0 y β1) que hacen que las distancias de los puntos individuales desde la regresión recta mínimamente. El cuadrado se usa para evitar que los desechos positivos compensen con los negativos.
¿Qué es la regresión lineal simple y para que nos sirve?
«El estadístico sabe… que en la naturaleza nunca hubo una distribución normal, nunca hubo una línea recta, pero con suposiciones normales y lineales, que se sabe que es falso, a menudo puede obtener resultados que coincidan con una aproximación útil, aquellos que encontrado en el mundo real. ”1
Hemos definido previamente la asociación entre x e y, lo que significa que la distribución de y varía con X. Discutimos la correlación como un tipo de asociación en el que los valores más grandes de Y están asociados con valores más grandes de x (tendencia aumentada) o valores más pequeños de X (Tendencia disminuida) 2. Si sospechamos una tendencia, es posible que deseemos intentar predecir los valores de una variable utilizando los valores del otro. Uno de los métodos de predicción más simples es la regresión lineal, en la que intentamos encontrar una ‘mejor línea’ a través de los puntos de datos.
La correlación y la regresión lineal están estrechamente vinculadas: ambos cuantifican las tendencias. Típicamente, en correlación, muestreamos ambas variables aleatoriamente de una población (por ejemplo, altura y peso), y en la regresión fijamos el valor de la variable independiente (por ejemplo, dosis) y observamos la respuesta. La variable predictor también puede seleccionarse aleatoriamente, pero la tratamos como fija al hacer predicciones (por ejemplo, peso predicho para alguien de una altura dada). Decimos que hay una relación de regresión entre X e Y cuando la media de y varía con X.
En una regresión simple, hay una variable independiente, x y una variable dependiente, Y. Para un valor dado de x, podemos estimar el valor promedio de y y escribir esto como una expectativa condicional e (y | x), a menudo escrita simplemente como μ (x). Si μ (x) varía con x, entonces decimos que y tiene una regresión en x (Fig. 1). La regresión es un tipo específico de asociación y puede ser lineal o no lineal (Fig. 1C, D).
Artículos Relacionados: