Definición: en estadísticas, una línea de regresión es una línea que mejor describe el comportamiento de un conjunto de datos. En otras palabras, es una línea que mejor se ajusta a la tendencia de los datos dados.
¿Cuál es la definición de la línea de regresión? Las líneas de regresión son muy útiles para los procedimientos de pronóstico. El propósito de la línea es describir la interrelación de una variable dependiente (variable y) con una o muchas variables independientes (variable x). Al usar la ecuación obtenida de la línea de regresión, un analista puede pronosticar comportamientos futuros de la variable dependiente ingresando diferentes valores para los independientes. Las líneas de regresión se utilizan ampliamente en el sector financiero y en los negocios en general.
Los analistas financieros emplean regresiones lineales para pronosticar los precios de las acciones, los precios de los productos básicos y realizar valoraciones para muchos valores diferentes. Por otro lado, las empresas emplean regresiones con el propósito de pronosticar ventas, inventarios y muchas otras variables que son cruciales para la estrategia y la planificación. La fórmula de la línea de regresión es como la siguiente:
- Y es la variable dependiente
- X son los independientes
- A es el punto de intercepción
- B es la pendiente
- u es la regresión residual
Help Appliances Co. es una compañía que fabrica electrodomésticos profesionales y de cocina para el hogar. Actualmente, la compañía se encuentra en el proceso de pronosticar sus ventas para el próximo año y, como parte de este procedimiento, el gerente nacional de ventas contrató a una compañía de consultoría para obtener algunos consejos sobre cómo mejorar la precisión del pronóstico. La compañía de consultoría proporcionó un modelo de regresión múltiple de 4 variables independientes. ¿Cómo ayudaría una línea de regresión al gerente de ventas a pronosticar la cifra de ventas del próximo año?
Como muestra el concepto previamente mostrado, una regresión lineal múltiple generaría una línea de regresión representada por una fórmula como esta: y = a + b1x1 + b2x2 + b3x3 + b4x4 + u. El gerente de ventas sustituirá cada uno de los valores con la información proporcionada por la compañía de consultoría para llegar a una cifra de ventas prevista.
¿Qué significa la recta de regresión?
Definición: La línea de regresión es la línea que mejor se ajusta a los datos, de modo que la distancia general desde la línea a los puntos (valores variables) trazado en un gráfico es la más pequeña. En otras palabras, una línea utilizada para minimizar las desviaciones al cuadrado de las predicciones se llama la línea de regresión.
Hay tantos números de líneas de regresión como variables. Supongamos que tomamos dos variables, digamos X e Y, entonces habrá dos líneas de regresión:
- Línea de regresión de y en x: Esto proporciona los valores más probables de y de los valores dados de X.
- Línea de regresión de X en y: Esto proporciona los valores más probables de x de los valores dados de Y.
La expresión algebraica de estas líneas de regresión se llama ecuaciones de regresión. Habrá dos ecuaciones de regresión para las dos líneas de regresión.
La correlación entre las variables depende de la distancia entre estas dos líneas de regresión, como las líneas de regresión más cercanas entre sí, más alto es el grado de correlación, y cuanto más lejos son las líneas de regresión entre sí, más menor es el grado de correlación.
Se dice que la correlación es perfecta positiva o negativa perfecta cuando las dos líneas de regresión coinciden, es decir, solo existe una línea. En el caso de que las variables son independientes; Entonces la correlación será cero, y las líneas de regresión estarán en ángulo recto, es decir, paralelo al eje x y el eje y.
Nota: Las líneas de regresión se cortan entre sí en el punto de promedio de X e Y. Esto significa, desde el punto en que las líneas se cruzan entre sí, la perpendicular se dibuja en el eje x. Obtendremos el valor medio de X. De manera similar, si La línea horizontal se dibuja en el eje Y, obtendremos el valor medio de Y.
¿Qué significa el modelo de regresión?
¿Cuál es la definición del modelo de regresión? En el análisis de regresión, las variables pueden ser independientes, que se utilizan como entrada predictor o causal dependiente, que se utilizan como variables de respuesta. En estudios experimentales, la variable independiente X es la variable que se puede controlar y la variable Y es la variable que refleja los cambios en la variable independiente X. Por ejemplo, el nivel de gastos publicitarios en una empresa está sujeto a la demanda de un producto particular . En las pruebas de muestreo, la distinción entre variables independientes y dependientes no es tan clara porque todas las variables son aleatorias. Por lo tanto, en las pruebas de muestreo, no hay causalidad.
La electricidad que consume una familia por un período de dos meses y la cantidad que paga por este consumo está relacionada con una relación determinista. Si la familia consume una mayor cantidad de electricidad durante un período de dos meses de lo que suele hacer, la cantidad adeudada será mayor de lo habitual. Esta es una relación determinista y causal.
Sin embargo, la relación lineal no puede describir la dependencia estocástica lineal de las variables x e y porque si por ejemplo, la variable x es el valor de un producto, y la variable y es la demanda de este producto, los valores correspondientes de y serán diferentes en diferentes iteraciones. O, si la variable X es la cantidad de fertilizante y variable y es el rendimiento de un cultivo, los valores correspondientes de y serán diferentes en diferentes iteraciones debido a factores como la temperatura, la lluvia o la calidad del suelo, que también afectan la producción.
En un modelo de regresión, la relación causal entre las variables X e Y permite a un analista predecir con precisión el valor Y para cada valor x. En una regresión simple, solo hay una variable independiente X, y la variable dependiente y puede ser aproximada satisfactoriamente por una función lineal.
¿Qué indica la pendiente de una recta de regresión?
Los dos últimos elementos en la lista anterior indican la pendiente de la línea de cuadrados mínimos de la mejor adaptación. Recuerde que la pendiente de una línea es una medida de cuántas unidades se elevan o desciende por cada unidad que nos movemos hacia la derecha. A veces, esto se indica como el aumento en la línea dividido por ejecución o modificación de los valores y divididos para la modificación de los valores X.
En general, las líneas rectas tienen pendientes positivas, negativas o nulas. Si examinamos nuestras líneas rectas de regresión de los cuadrados mínimos y comparamos los valores correspondientes de R, notaremos que cada vez que nuestros datos tengan un coeficiente de correlación negativo, la pendiente de la tarifa de regresión es negativa. De la misma manera, para cada vez que tenemos un coeficiente de correlación positivo, la pendiente de la regresión recta es positiva.
Debería ser evidente a partir de esta observación que ciertamente existe una conexión entre el signo del coeficiente de correlación y la pendiente de la línea recta de los cuadrados mínimos. Queda por explicarse por qué esto es cierto.
La razón de la conexión entre el valor de R y la pendiente de la línea recta de los cuadrados mínimos tiene que ver con la fórmula que nos proporciona la pendiente de esta línea recta. Para los datos aparecidos (x, y) indicamos la desviación estándar de los datos X con S x y la desviación estándar de los datos Y con S Y.
¿Qué es la recta de regresión y cómo se calcula?
La pendiente de una línea es el cambio en y sobre el cambio en X. Por ejemplo, una pendiente de
Medios A medida que el valor X aumenta (se mueve a la derecha) en 3 unidades, el valor Y aumenta en 10 unidades en promedio.
La intersección y es el valor en el eje y donde cruza la línea. Por ejemplo, en la ecuación y = 2x-6, la línea cruza el eje y al valor b = –6. Las coordenadas de este punto son (0, –6); Cuando una línea cruza el eje y, el valor X siempre es 0.
Para ahorrar mucho tiempo calculando la mejor línea de ajuste, primero encuentre los «Five Big», cinco estadísticas resumidas que necesitará en sus cálculos:
La desviación estándar de los valores X (denotado SX)
La desviación estándar de los valores Y (SY denotado)
¿Cómo se calcula una recta de regresión lineal?
Esta herramienta determina la ecuación de la línea de regresión lineal (o ajuste afín) de una serie estadística (o nube de puntos) de la forma (xi; yi). La ecuación de la línea de regresión lineal es la forma y = ax + b con:
donde x e y son los promedios respectivos de Xi y Yi. La ecuación de la línea de regresión se obtiene mediante el método de mínimo cuadrado. Gracias a la línea de regresión lineal, es posible proporcionar una tendencia para un valor dado X. Además, la herramienta calcula el coeficiente de correlación y las coordenadas del punto medio G (x; y).
Nota: También hablamos de interpolación lineal en lugar de regresión lineal.
El yi separado por un punto de punto*:
Ingrese el valor para el que desea extrapolar **:
Mostrar la cuadrícula:
unidades
Medias unidades
ninguna
** Por lo que quieres una tendencia
El coeficiente de correlación que notamos es igual a:
∑ [(xi – x) (yi – y)] / √ [∑ (xi – x) 2. ∑ (yi – y) 2]
Varía entre −1 y 1. cuanto más su valor absoluto es cercano a 1, más confiable se describe correctamente el modelo lineal.
Un individuo señala la evolución del valor de una acción del mercado de valores en el transcurso de un mes. Tiene 1,000 títulos de esta acción.
1) Encuentre el punto promedio de la serie, es decir, el valor promedio de la acción del mes pasado.
2) Queremos ajustar la nube de puntos. Determine la ecuación de la línea de regresión D que pasa por el punto promedio. ¿El sistema está bien lineal?
¿Cuál es la fórmula para determinar la pendiente de la recta de regresión?
Wikihow es un wiki, lo que significa que muchos artículos están escritos por varios autores. Para crear este artículo, 26 personas, algunas anónimas, participaron en su edición y su mejora con el tiempo.
Las líneas están en todas partes en matemáticas, ya sea en álgebra o geometría. Si sabe cómo encontrar la pendiente de un derecho, muchos conceptos parecerán más claros, por ejemplo, cuando se trata de encontrar si dos líneas son paralelas o perpendiculares, si tienen una intersección, etc. En realidad, es muy simple encontrar la pendiente de un derecho. Solo se necesita un poco de curiosidad para aprender el enfoque a seguir para calcular la pendiente de un derecho.
- Las líneas que aumentan de izquierda a derecha siempre tienen una pendiente positiva, incluso si la pendiente calculada se presenta en forma de fracción.
- Las líneas que descienden de la izquierda a la derecha siempre tienen una pendiente negativa, incluso si la pendiente calculada se presenta en forma de fracción.
- O un ABR derecho.
- Detalles de contacto: A (-2 y 0) y B (0 y -2)
- (y2 -y1): -2 -0 = -2 (numerator = -2)
- (x2 – x1): 0 – (-2) = 2 (denominador = 2)
- Pendiente derecha AB = numér/denominator = -1
- Una vez que haya elegido las coordenadas del punto dominante, no se confunda después o su resultado será falso.
- En la fórmula de la derecha y = ax + b, la pendiente de la derecha corresponde a la letra «a», mientras que la letra «y» corresponde a la coordenada y desde cualquier punto por el cual pasa la derecha, la letra «x» corresponde a la coordenada x desde cualquier punto a través del cual se pasa la derecha y la letra «b» corresponde a la ordenada en el origen de la derecha.
- También puede encontrar la respuesta en su libro escolar o hacerle la pregunta a su maestro.
- No confunda la fórmula de la pendiente con las otras fórmulas, como la de la fórmula del cálculo de la distancia entre dos puntos, la fórmula de la ecuación de una derecha o la fórmula de las coordenadas de un punto medio de un segmento de segmento.
- Papel milimétrico (si es posible)
- Un plan afín o un derecho con dos puntos dados, así como sus datos de contacto
- La fórmula de la pendiente
- Un lápiz, papel, una regla, una calculadora o solo tu mente
Para encontrar la pendiente de un derecho, recolecte las coordenadas de dos de los puntos de este derecho, aquellos que desea. La pendiente se obtiene restando las dos órdenes de estos puntos (y2 menos Y1), luego sus dos abscissa en el mismo orden (x2 menos x1), y finalmente dividiendo el primer resultado por el segundo. La pendiente puede ser una fracción, pero si esta última es simplificable, será un número completo o decimal.
¿Qué es una regresión y para qué sirve?
La regresión se define como un método estadístico que nos ayuda a analizar y comprender la relación entre dos o más variables de interés. El proceso que se adapta para realizar el análisis de regresión ayuda a comprender qué factores son importantes, qué factores pueden ser ignorados y cómo están influyendo entre sí.
En regresión, normalmente tenemos una variable dependiente y una o más variables independientes. Aquí tratamos de «retroceder» el valor de la variable dependiente «y» con la ayuda de las variables independientes. En otras palabras, estamos tratando de entender cómo cambia el valor de «Y» W.R.T en «X».
Para el análisis de regresión es un método exitoso, entendemos los siguientes términos:
- Variable dependiente: esta es la variable que estamos tratando de comprender o pronosticar.
- Variable independiente: estos son factores que influyen en el análisis o la variable objetivo y nos proporcionan información sobre la relación de las variables con la variable objetivo.
El análisis de regresión se utiliza para la predicción y el pronóstico. Esto tiene una superposición sustancial con el campo del aprendizaje automático. Este método estadístico se utiliza en diferentes industrias, como, como,
- Variable dependiente: esta es la variable que estamos tratando de comprender o pronosticar.
- Variable independiente: estos son factores que influyen en el análisis o la variable objetivo y nos proporcionan información sobre la relación de las variables con la variable objetivo.
¿Qué es un problema de regresión?
El problema de la regresión es cómo modelar una o varias variables/respuestas dependientes, y, por medio de un conjunto de variables predictoras, X. En el método PLS, dividimos las variables (columnas) en dos bloques denotados como X e Y. X e Y deben estar disponibles al construir el modelo, pero más tarde, cuando se usa el modelo, solo se requiere x. El uso principal de PLS es estimar las variables en y usando variables en X. Específicamente, la regresión de PLS busca un conjunto de vectores latentes que realiza una descomposición simultánea de X e Y con la restricción de que estos componentes explican la covarianza entre X e Y y Y . PLS se ha utilizado ampliamente para extraer la información relevante de los datos del proceso que representan las variables medidas y las variables de calidad [10-12].
Muchos problemas de regresión requieren la consideración de más de un predictor, y es necesario comprender cómo la respuesta Y depende simultáneamente de los predictores x1, x2,…, xp. Por ejemplo, la dependencia de RCC en LBM discutida hasta ahora ignora el hecho de que estos datos consisten en atletas masculinos y femeninos, y uno podría asumir razonablemente que las diferencias de género son importantes. Esto requerirá que se ajuste modelos separados para las dos poblaciones de hombres y hembras, o en general, incluidos los efectos de género en la función media. Otros problemas pueden requerir predictores adicionales; En los datos de los atletas, por ejemplo, incluidas la altura, el peso o algunas variables de química sanguínea pueden ser apropiadas.
Comenzamos con P Predictores X1,…, XP, y a partir de estos construiremos un conjunto de términos K U0, U1,…, Reino Unido – 1, para obtener la función media de regresión lineal múltiple
La inclusión de términos, que son funciones de los predictores, hace que este modelo sea muy general. Por ejemplo, un modelo con un predictor x podría incluir los términos U0 = 1 para la intercepción, U1 = x, u2 = x2 y u3 = x3, por lo que los modelos polinomiales se incluyen en la clase de regresión lineal múltiple. Además, los términos U pueden incluir interacciones (por ejemplo, u = x1x2), transformaciones (por ejemplo, u = log (x1)) y otras funciones de los predictores. Las variables cuantitativas como el género se pueden incluir en un modelo definiendo factores, que son conjuntos de variables indicadoras (a menudo tienen los valores 0 o 1) que corresponden a los niveles del factor. Por ejemplo, el tratamiento variable con tres niveles se puede incluir en un modelo con dos variables indicadoras, el primero con el valor 1 para las unidades que recibieron el tratamiento T1 y 0 de lo contrario; el segundo con el valor 1 para las unidades que reciben el tratamiento T2 y 0 de lo contrario; T3 se indica si ambos indicadores son iguales a 0. Dado que el género tiene solo dos niveles, solo se requiere una variable indicadora.
Artículos Relacionados:
- Cómo crear una recta de regresión en Excel Cómo utilizar la recta de regresión en Excel para predecir valores
- ¿Qué es la regresión lineal y cómo se puede utilizar para optimizar su sitio web?
- La ecuación de regresión es la fórmula matemática que se utiliza para calcular la relación entre variables.
- ¿Qué es la regresión lineal simple y para qué sirve?