Un modelo de regresión determina una relación entre una variable independiente y una variable dependiente, al proporcionar una función. Formular un análisis de regresión lo ayuda a predecir los efectos de la variable independiente en la dependiente.
Ejemplo: podemos decir que la edad y la altura se pueden describir utilizando un modelo de regresión lineal. Dado que la altura de una persona aumenta a medida que aumenta la edad, tienen una relación lineal.
Los modelos de regresión se usan comúnmente como prueba estadística de reclamos con respecto a los hechos cotidianos.
En este artículo, analizaremos más profundamente el modelo de regresión y sus tipos.
Se utiliza un modelo de regresión lineal para representar una relación entre variables que son proporcionales entre sí. Es decir, que la variable dependiente aumenta/disminuye con la variable independiente.
En la representación gráfica, tiene una línea lineal recta trazada entre las variables. Incluso si los puntos no están exactamente en línea recta (que siempre es el caso), aún podemos ver un patrón y darle sentido.
Por ejemplo, a medida que aumenta la edad de una persona, el nivel de glucosa en su cuerpo también aumenta.
En el modelo de regresión no lineal, el gráfico no muestra una progresión lineal. Dependiendo de cómo reaccione la variable de respuesta a la variable de entrada, la línea aumentará o caerá que muestra la altura o profundidad del efecto de la variable de respuesta.
Saber que un modelo de regresión no lineal es el mejor para su escenario, asegúrese de investigar sus variables y sus patrones. Si ve que la variable de respuesta muestra una salida no tan constante a la variable de entrada, puede optar por usar un modelo no lineal para su problema.
¿Dónde se utiliza la regresión?
El análisis de regresión es una herramienta de aprendizaje automático increíblemente potente utilizada para analizar datos. Aquí exploraremos cómo funciona, cuáles son los tipos principales y qué puede hacer por su negocio.
El análisis de regresión es una forma de predecir los acontecimientos futuros entre un dependiente (objetivo) y una o más variables independientes (también conocidas como predictor). Por ejemplo, se puede utilizar para predecir la relación entre la conducción imprudente y el número total de accidentes de tráfico causados por un conductor o, para usar un ejemplo comercial, el efecto en las ventas y el gasto de una cierta cantidad de dinero en publicidad.
La regresión es uno de los modelos más comunes de aprendizaje automático. Difiere de los modelos de clasificación porque estima un valor numérico, mientras que los modelos de clasificación identifican a qué categoría pertenece una observación.
Los principales usos del análisis de regresión son el pronóstico, el modelado de series de tiempo y la búsqueda de la relación de causa y efecto entre las variables.
La regresión tiene una amplia gama de aplicaciones de la vida real. Es esencial para cualquier problema de aprendizaje automático que involucre números continuos: esto incluye, entre otros, una gran cantidad de ejemplos, que incluyen:
- Pronóstico financiero (como estimaciones de precios de la vivienda o precios de acciones)
- Pronóstico de ventas y promociones
- Prueba de automóviles
- Análisis y predicción del clima
- Pronóstico de series de tiempo
Además de decirle si existe una relación significativa entre dos o más variables, el análisis de regresión puede dar detalles específicos sobre esa relación. Específicamente, puede estimar la resistencia del impacto que tendrán múltiples variables en una variable dependiente. Si cambia el valor de una variable (precio, por ejemplo), el análisis de regresión debe decirle qué efecto tendrá en la variable dependiente (ventas).
¿Que se busca con la regresión?
El análisis de regresión se utiliza para comprender, modelar, predecir y explicar fenómenos complejos. Le ayuda a responder preguntas como «¿Por qué hay lugares en los Estados Unidos con puntajes de prueba que están constantemente por encima del promedio nacional?» o «¿Por qué hay áreas de la ciudad con tasas tan altas de robo residencial?» Puede usar el análisis de regresión para explicar la obesidad infantil, por ejemplo, utilizando un conjunto de variables relacionadas como ingresos, educación y accesibilidad a alimentos saludables.
Por lo general, el análisis de regresión le ayuda a responder estas por qué las preguntas para que pueda hacer algo al respecto. Si, por ejemplo, descubre que la obesidad infantil es menor en las escuelas que sirven frutas y verduras frescas en el almuerzo, puede usar esa información para guiar la política y tomar decisiones sobre los programas de almuerzo escolar. Del mismo modo, conocer las variables que ayudan a explicar las altas tasas de criminalidad pueden permitirle hacer predicciones sobre el crimen futuro para que los recursos de prevención puedan asignarse de manera más efectiva.
Estas son las cosas que le dicen sobre el análisis de regresión.
Lo que no le dicen sobre el análisis de regresión es que no siempre es fácil encontrar un conjunto de variables explicativas que le permitirán responder a su pregunta o explicar el fenómeno complejo que está tratando de modelar. La obesidad infantil, el crimen, los puntajes de las pruebas y casi todas las cosas que quiera modelar utilizando el análisis de regresión son problemas complicados que rara vez tienen respuestas simples. Lo más probable es que, si alguna vez ha intentado construir su propio modelo de regresión, esto no es nada nuevo para usted.
Afortunadamente, cuando ejecuta la herramienta de regresión lineal generalizada (GLR), se le presenta un conjunto de diagnósticos que pueden ayudarlo a descubrir si tiene un modelo especificado correctamente; Un modelo especificado correctamente es uno en el que puede confiar. Este documento examina y explica varios de estos cheques que querrá aprobar para tener confianza en su modelo. Estos diagnósticos y las técnicas que puede usar para resolver algunos de los problemas de análisis de regresión más comunes son recursos que pueden facilitar su trabajo.
¿Qué es la regresión lineal y dónde se aplica?
Básicamente, una técnica de regresión lineal simple está tratando de dibujar un gráfico lineal entre dos variables de datos, X e Y. Como una variable independiente, X se dibuja a lo largo del eje horizontal. Las variables independientes también se denominan variables explicativas o variables predictivas. La variable dependiente, y, se dibuja en el eje vertical. También puede consultar los valores Y como variables de respuesta o variables predichas.
Para esta descripción general, considere la forma más simple de la ecuación gráfica lineal entre Y y X; Y = C*x+m, donde C y M son constantes para todos los valores posibles de X e Y. Suponga, por ejemplo, que el conjunto de datos de entrada para (x, y) es (1.5), (2.8) y (3.11). Para identificar el método de regresión lineal, debe proceder de la siguiente manera:
- Dibuje una línea recta y mida la correlación entre 1 y 5.
- Continúe cambiando la dirección de la línea recta para los nuevos valores (2.8) y (3.11) hasta que se ajusten todos los valores.
- Identifique la ecuación de regresión lineal de la siguiente manera: y = 3*x+2.
- Extrapolar o proporcionar que hay igual a 14 cuando x es
En el aprendizaje automático, los programas de TI llamados algoritmos analizan grandes conjuntos de datos y trabajan en reversa a partir de estos datos para calcular la ecuación de regresión lineal. Los científicos de datos primero conducen al algoritmo en conjuntos de datos conocidos o etiquetados, luego lo usan para predecir valores desconocidos. Los datos reales son más complejos que en el ejemplo anterior. Esta es la razón por la cual el análisis de regresión lineal debe modificar matemáticamente o transformar los valores de los datos para responder a las siguientes cuatro hipótesis.
Debe existir una relación lineal entre variables independientes y dependientes. Para determinar esta relación, los científicos de datos crean una nube de puntos, una colección aleatoria de valores X e Y, para ver si están en línea recta. Si este no es el caso, puede aplicar funciones no lineales como la raíz cuadrada o el periódico para crear matemáticamente la relación lineal entre las dos variables.
Los científicos de datos usan valores residuales para medir la precisión de los pronósticos. Un valor residual es la diferencia entre los datos observados y el valor predicho. Los valores residuales no deben presentar ningún diagrama identificable. Por ejemplo, no desea que los valores residuales aumenten con el tiempo. Puede usar diferentes pruebas matemáticas, como la prueba Durbin-Watson, para determinar la independencia residual. Puede usar datos ficticios para reemplazar cualquier variación de datos, como datos estacionales.
¿Qué es una regresión?
El análisis de la regresión es una técnica utilizada para analizar una serie de datos que consisten en una variable variable y una o más variables independientes. El objetivo es estimar una posible relación funcional existente entre la variable dependiente y las variables independientes. La variable dependiente en la ecuación de regresión es una función de variables independientes más un término de error. Este último es una variable aleatoria y representa una variación impredecible e impredecible en la variable dependiente. Se estima que los parámetros describen mejor los datos. El método más utilizado para obtener las mejores estimaciones es el método «Mínimo cuadrado» (OLS), pero también se utilizan otros métodos.
El modelado de datos se puede utilizar sin ningún conocimiento de los procesos subyacentes que han generado datos; [1] en este caso, el modelo es un modelo empírico. Además, el conocimiento de la probabilidad de errores no es necesario en el modelado. El análisis de la regresión requiere hipótesis con respecto a la distribución de la probabilidad de errores. Las pruebas estadísticas se llevan a cabo sobre la base de estas hipótesis. En el análisis de la regresión, el término «modelo» incluye tanto la función utilizada para modelar los datos que la contratación sobre la distribución de la probabilidad.
El análisis de la regresión se puede utilizar para realizar pronósticos (por ejemplo, para predecir datos futuros de una serie temporal), inferencia estadística, para probar hipótesis o modelar informes de dependencia. Estos usos de regresión dependen en gran medida del hecho de que se verifican los contrataciones iniciales. El uso del análisis de la regresión ha sido criticado en varios casos en los que no se pueden verificar las hipótesis iniciales. [1] [2] Un factor que contribuye al uso inadecuado de la regresión es que requiere más habilidades para criticar un modelo que para adaptarlo. [3]
¿Qué tipo de regresiones existen?
El término regresión se usa para indicar la estimación o predicción del valor promedio de una variable para un valor especificado de otra variable. Y el análisis de regresión es una herramienta estadística utilizada para estimar la relación entre una variable dependiente y una variable independiente. Por ejemplo, si un pesebre de una empresa quiere la relación exacta entre el gasto publicitario y las ventas para la planificación futura, la técnica de regresión será más adecuada para él.
Existen diferentes tipos de análisis de regresión, hablemos de ello en más detalles:-
La regresión lineal es un tipo de modelo donde se supone que la relación entre una variable independiente y una variable dependiente es lineal. La estimación de la variable «y» se obtiene de una ecuación, y’- y_bar = byx (x-x_bar) …… (1) y la estimación de la variable «x» se obtiene a través de la ecuación x’-x_bar = bxy (y- y_bar)… .. (2). La representación gráfica de las ecuaciones lineales en (1) y (2) se conoce como líneas de regresión. Estas líneas se obtienen a través del método de mínimos cuadrados.
- Regresión lineal simple: un modelo de regresión lineal con una variable independiente y una dependiente.
- Regresión lineal múltiple: un modelo de regresión lineal con más de una variable independiente y una variable dependiente.
- Tamaño de la muestra: n = 20 (casos por variable independiente)
- La heterocedasticidad está ausente –
- Existen relaciones lineales entre las variables.
- Observaciones de muestra independientes.
- Sin multicolinealidad y auto-correlación
- Observaciones de muestra independientes.
Es un tipo de análisis de regresión que modela la relación de los valores de la variable dependiente «x» y las variables independientes «y» como no lineales. Es un caso especial de regresión lineal múltiple a pesar de que se ajusta a un modelo no lineal a los datos. Es porque los datos pueden estar correlacionados, pero la relación entre dos variables puede no parecer lineal.
Artículos Relacionados: