Cómo determinar la ecuación de regresión

El análisis de regresión es el análisis de la relación entre la variable dependiente e independiente, ya que representa cómo cambiará la variable dependiente cuando una o más variable independiente cambia debido a los factores, la fórmula para calcularlo es y = a + bx + e, donde y es una variable dependiente, X es variable independiente, A es intercepción, B es pendiente y E es residual.

La regresión es una herramienta estadística para predecir la variable dependiente con la ayuda de una o más de una variable independiente. Mientras ejecuta un análisis de regresión, el objetivo principal del investigador es descubrir la relación entre la variable dependiente y la variable independiente. Para predecir la variable dependiente, se eligen una o múltiples variables independientes, lo que puede ayudar a predecir la variable dependiente. Ayuda en el proceso de validar si las variables predictoras son lo suficientemente buenas como para ayudar a predecir la variable dependiente.

Una fórmula de análisis de regresión intenta encontrar la mejor línea de ajuste para la variable dependiente con la ayuda de las variables independientes. La ecuación de análisis de regresión es la misma que la ecuación para una línea que es

Mientras ejecuta una regresión, el objetivo principal del investigador es descubrir la relación entre la variable dependiente y la variable independiente. Para predecir la variable dependiente, se eligen una o múltiples variables independientes, lo que puede ayudar a predecir la variable dependiente. El análisis de regresión ayuda en el proceso de validación de si las variables predictoras son lo suficientemente buenas como para ayudar a predecir la variable dependiente.

Intentemos comprender el concepto de análisis de regresión con la ayuda de un ejemplo. Intentemos averiguar cuál es la relación entre la distancia cubierta por el conductor del camión y la edad del conductor del camión. Alguien en realidad hace una ecuación de regresión para validar si lo que piensa de la relación entre dos variables también está validada por la ecuación de regresión.

¿Cómo determinar la ecuación de la recta de regresión?

A menudo, las preguntas que hacemos requieren que hagamos predicciones precisas sobre cómo un factor afecta un resultado. Si se le pide a un maestro que resuelva cómo el tiempo dedicado a escribir un ensayo afecta las calificaciones de ensayos, es fácil ver un gráfico de tiempo dedicado a escribir ensayos y grados de ensayos dicen: “Hola, las personas que pasan más tiempo en sus ensayos están obteniendo mejores calificaciones. » Lo que es mucho más difícil (y de manera realista, bastante imposible) de hacer a los ojos es tratar de predecir qué puntaje obtendrá alguien en un ensayo basado en cuánto tiempo pasaron en él. Claro, hay otros factores en juego como lo bueno que es el estudiante en esa clase en particular, pero vamos a ignorar factores confusos como este por ahora y trabajar a través de un ejemplo simple.

Nuestro maestro ya sabe que hay una relación positiva entre cuánto tiempo se dedicó a un ensayo y en la calificación que obtiene el ensayo, pero vamos a necesitar algunos datos para demostrar esto correctamente.

El segundo paso es calcular la diferencia entre cada valor y el valor medio para la variable dependiente e independiente. En este caso, esto significa que restamos 64.45 de cada puntaje de prueba y 4.72 de cada punto de datos de tiempo. Además, queremos encontrar el producto de multiplicar estas dos diferencias juntas.

Debe notar que, como algunos puntajes son más bajos que la puntuación media, terminamos con valores negativos. Al cuadrar estas diferencias, terminamos con una medida estandarizada de desviación de la media independientemente de si los valores son más o menos que la media.

Recordemos a nosotros mismos la ecuación que necesitamos calcular b.

¿Cómo se calcula la ecuación de la recta de regresión?

Por supuesto, cualquier hoja de cálculo, software de estadística o incluso calculadora le proporciona inmediatamente sus valores sin que le rompa la cabeza. Pero supongamos que todavía desea levantar el capó para apreciar esta hermosa mecánica…

El coeficiente de correlación lineal, o de Pearson, observado (r ) y establecido en las observaciones (n ), es igual a la covarianza entre una variable explicativa (x ) y una variable que se explica (y (y (y ), informado al producto de sus desviaciones estándar. Además de -1 y 1, mide la intensidad de la relación entre las dos variables estadísticas.

Otra forma de calcularlo: esta es la raíz cuadrada del producto entre el director de coeficiente del derecho de ajuste de (x ) in (y ) y el del derecho de ajuste de (y ) en (( x ) (cálculo que haremos a continuación).

El coeficiente de regresión es el director del derecho de regresión empírica (ajuste de (y ) en (x )).

El siguiente ejemplo ha sido exhumado de una prueba de bachillerato de los años 80, un sector económico.

Al comienzo de cada mes, una empresa comercial dedica una cierta suma a las operaciones publicitarias. En la tabla a continuación se resumen, para la primera mitad de 1984, las sumas dedicadas a estas operaciones y las cantidades de ventas.

Prerrequisito: atención al significado de este problema. ¡Consideramos que la publicidad varía según las ventas cuando Logic le gustaría que sea lo contrario!

¿Qué es la recta de regresión lineal?

Un paso significativo para la verificación de la existencia de una correlación entre los caracteres observados, consiste en dibujar un diagrama de dispersión, es decir, que representa las observaciones con puntos o círculos en el plano cartesiano.

Si el diagrama de dispersión sugiere una relación lineal entre los datos y, además, el valor del coeficiente de correlación en el módulo está cerca de una, incluso si no existe una relación perfectamente lineal entre los datos, tiene sentido determinar la ecuación de una recta Forre que me aproxime los datos de la «mejor manera posible».

El método de cuadrados mínimos le permite determinar la ecuación de esta línea recta, llamada tarifa de regresión o pequeños cuadrados. El estudio del fenómeno sugerirá cuál de los caracteres puede interpretarse como una variable independiente (indicada con) y cuál es una variable dependiente (indicada con).

Son y los datos experimentales observados en una población y son las parejas en el plan.

La línea recta de la ecuación se define como regresión o pequeños cuadrados

que representa la suma de los cuadrados de las distancias de cada pareja desde el punto correspondiente en la línea recta.

Si resulta que los puntos están alineados en la línea recta con

Si resulta que los puntos están alineados en la línea recta con.

Se muestra que los coeficientes y la tarifa de regresión pueden calcular a través de las siguientes fórmulas

La siguiente tabla muestra las medidas del volumen de un gas a diferentes temperaturas y en la figura se muestra el diseñador gráfico de dispersión relativa

¿Qué es una regresión en matemáticas?

La regresión es un término estadístico para describir modelos que estiman las relaciones entre las variables.

Estudio del modelo de regresión lineal La relación entre una única variable dependiente y y una variable independiente X.

Si solo hay una variable independiente, se llama regresión lineal simple, si hay más de una variable independiente, entonces se llama regresión lineal múltiple.

Se modela entre la variable dependiente y una independiente. Cuando solo hay una variable independiente en el modelo de regresión lineal, el modelo generalmente se ha denominado lineal simple
Modelo de regresión.

El algoritmo básico para predecir valores para todos los modelos de aprendizaje automático es el mismo.

Aquí (θ₀) y (θ₁) también se llaman coeficientes de regresión.

A continuación se muestra el gráfico que muestra el conjunto de datos de muestra y la hipótesis.

  • Elija valores aleatorios de (θ₀) y (θ₁).
  • Sigue actualizando simultáneamente los valores de (θ₀) y (θ₁) hasta la convergencia.
  • Si la función de costo ya no disminuye, llegamos a nuestros mínimos locales.

Como podemos ver aquí, la tasa de cambio de (θ₀) y (θ₁) depende de cuál sea la tasa de aprendizaje (α).

  • Elija valores aleatorios de (θ₀) y (θ₁).
  • Sigue actualizando simultáneamente los valores de (θ₀) y (θ₁) hasta la convergencia.
  • Si la función de costo ya no disminuye, llegamos a nuestros mínimos locales.
  • Si el valor de (α) es demasiado bajo, entonces nuestro modelo consumirá tiempo y tendrá una convergencia lenta.
  • Si el valor de (α) es demasiado alto, entonces nuestro (θ₀) y (θ₁) pueden sobrepasar el valor óptimo y, por lo tanto, la precisión del modelo disminuirá.
  • También es posible en el alto valor de (α) que (θ₀) y (θ₁) seguirán rebotando entre 2 valores y nunca pueden alcanzar el valor óptimo.
  • ¿Qué es regresión en matemáticas?

    La regresión lineal es una técnica utilizada para modelar las relaciones entre las variables observadas. La idea detrás de la regresión lineal simple es «ajustar» las observaciones de dos variables en una relación lineal entre ellas. Gráficamente, la tarea es dibujar la línea que es «mejor ajustada» o «más cercana» a los puntos (xi, yi), (x_i, y_i), (xi, yi), donde xi x_ixi y yiy_iyi son observaciones de las dos variables que se espera que dependan linealmente entre sí.

    La relación lineal mejor ajustada entre las variables XXX y YYY. [1]

    La regresión es un proceso común utilizado en muchas aplicaciones de estadísticas en el mundo real. Hay dos tipos principales de aplicaciones:

    Predicciones: después de una serie de observaciones de variables, el análisis de regresión proporciona un modelo estadístico para la relación entre las variables. Este modelo puede usarse para generar predicciones: dadas dos variables xxx e y, y, y, el modelo puede predecir valores de YYY dadas las observaciones futuras de X.X.X. Esta idea se utiliza para predecir variables en innumerables situaciones, p. El resultado de las elecciones políticas, el comportamiento del mercado de valores o el desempeño de un atleta profesional.

    Correlación: el modelo dado por un análisis de regresión a menudo se ajustará a algún tipo de datos mejor que otros. Esto se puede usar para analizar las correlaciones entre las variables y para refinar un modelo estadístico para incorporar más entradas: si el modelo describe muy bien ciertos subconjuntos de los puntos de datos, pero es un predictor pobre para otros puntos de datos, puede ser instructivo examinar el Diferencias entre los diferentes tipos de puntos de datos para una posible explicación. Este tipo de aplicación es común en las pruebas científicas, p. de los efectos de un medicamento propuesto en los pacientes en un estudio controlado.

    Artículos Relacionados:

    Related Posts

    Deja una respuesta

    Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *