La ecuación de regresión es la fórmula matemática que se utiliza para calcular la relación entre variables.

Ahora tenemos una ecuación de regresión. Pero que bien
¿La ecuación es predicción de valores de y, para valores dados de x? Para eso
evaluación, pasamos a medidas de asociación y medidas de estadística
Importancia que se usa con ecuaciones de regresión.

R2 R2 es una medida de asociación;
representa el porcentaje de la varianza en los valores de y que pueden ser
explicado por saber el valor de X. R2 varía de un mínimo de
0.0 (ninguna de la varianza se explica), a un máximo de +1.0 (todo el
Se explica la varianza).

S.E.B S.E.B es el error estándar del calculado
valor de b. Una prueba t para la significación estadística del coeficiente es
realizado dividiendo el valor de B por su error estándar. Por regla de
pulgar, un valor t de más de 2.0 suele ser estadísticamente significativo
Pero debe consultar una mesa T para estar seguro. Si
El valor t indica que el coeficiente B es estadísticamente significativo,
Esto significa que la variable independiente o X (número de patrullas desplegados)
debe mantenerse en la ecuación de regresión, ya que tiene una estadísticamente
relación significativa con la variable dependiente o y (velocidad promedio
en mph). Si la relación no fue
estadísticamente significativo, el valor del coeficiente B sería (estadísticamente
hablando) indistinguible de cero.

F F es una prueba de significación estadística
de la ecuación de regresión en su conjunto. Se obtiene dividiendo lo explicado
Varianza por la varianza inexplicable. Por regla general, un valor f mayor
que 4.0 suele ser estadísticamente significativo, pero debe consultar una mesa F
para estar seguro. Si F es significativo, entonces la ecuación de regresión nos ayuda
Para comprender la relación entre X e Y.

Para nuestro ejemplo anterior, digamos que obtuvimos
Los siguientes valores:

r2 = .9 Conocer el valor de x (el número de patrulla
Cars desplegados), podemos explicar el 90% de la varianza en Y (la velocidad promedio
de automovilistas en la autopista).

¿Cuál es el coeficiente de regresión?

Cuando los coeficientes de regresión son iguales a los coeficientes estructurales, los residuos de regresión (la diferencia entre los valores predichos y reales de y) pueden interpretarse como debido a causas no medidas de y y, por lo tanto, son iguales a los términos de error bajo una interpretación causal.

Los coeficientes de regresión, como medias y proporciones, también son estimaciones puntuales y, por lo tanto, pueden tener intervalos de confianza. Calcular los intervalos de confianza para los coeficientes de regresión lineal es sencillo y similar al método de medias y proporciones que se acaban de describir. La diferencia radica en calcular el error estándar para los coeficientes.

Los coeficientes de regresión representan estimaciones puntuales que se multiplican por valores de variables para predecir la variable dependiente. Recuerde que la ecuación de regresión lineal múltiple es

Donde Y es la variable dependiente, X1 a XK son valores de las variables independientes, α es la intercepción, y B1 a BK son los coeficientes de regresión. A diferencia de las medias y las proporciones, los coeficientes de regresión representan su efecto independiente sobre la variable dependiente después de controlar el impacto de otras variables independientes. Primero, el error estándar del coeficiente de regresión se calcula como

Donde S.E.R es la desviación estándar de la línea de regresión (llamada «error estándar de la estimación» en algunos datos de salida de regresión informática), SXK es la desviación estándar de XK y N es el tamaño de la muestra.

¿Cómo se determina la ecuación de la recta de regresion?

Los datos rara vez se ajustan exactamente a una línea recta. Por lo general, debe estar satisfecho con predicciones aproximadas. Por lo general, tiene un conjunto de datos cuya gráfica de dispersión parece «adaptarse» a una línea recta. Esto se llama una línea de mejor línea o línea de mínimos cuadrados.

Una muestra aleatoria de 11 estudiantes de estadística produjo los siguientes datos, donde X es el tercer puntaje de examen de 80, e Y es el puntaje final del examen de 200. ¿Puede predecir el puntaje final del examen de un estudiante aleatorio si conoce el tercer? puntaje de examen?

Tabla que muestra los puntajes en el examen final basados ​​en puntajes del tercer examen.

Gráfico de dispersión que muestra los puntajes en el examen final basados ​​en puntajes del tercer examen.

Los buceadores tienen tiempos de buceo máximos que no pueden exceder cuando van a diferentes profundidades. Los datos en la tabla muestran diferentes profundidades con los tiempos de buceo máximos en minutos. Use su calculadora para encontrar la línea de regresión de mínimos cuadrados y predecir el tiempo de buceo máximo durante 110 pies.

[latex] displaystyle hat {{y}} = {127.24}-{1.11} {x} [/latex]

A 110 pies, un buzo podría bucear durante solo cinco minutos.

El tercer puntaje del examen, X, es la variable independiente y la puntuación final del examen, Y, es la variable dependiente. Trazaremos una línea de regresión que mejor «se ajuste» a los datos. Si cada uno de ustedes se ajustara a una línea «a ojos», dibujarías diferentes líneas. Podemos usar lo que se llama una línea de regresión de mínimos cuadrados para obtener la mejor línea de ajuste.

Considere el siguiente diagrama. Cada punto de datos es de la forma (x, y) y cada punto de la línea de mejor ajuste usando la regresión lineal de mínimos cuadrados tiene la forma [latex] displayStyle {({x} hat {{y}}) }[/látex].

Artículos Relacionados:

Más posts relacionados:

Deja una respuesta

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *