¿Qué aporta la regresión lineal a la investigación aplicada?

El análisis de regresión es un método estadístico importante para el análisis de datos médicos. Permite la identificación y caracterización de las relaciones entre múltiples factores. También permite la identificación de factores de riesgo pronósticamente relevantes y el cálculo de las puntuaciones de riesgo para el pronóstico individual.

Este artículo se basa en libros de texto de estadísticas seleccionados, una revisión selectiva de la literatura y nuestra propia experiencia.

Después de una breve introducción de los modelos de regresión uni y multivariables, se dan ejemplos ilustrativos para explicar cuáles son las consideraciones importantes antes de que se realice un análisis de regresión y cómo se deben interpretar los resultados. El lector debe poder juzgar si el método se ha utilizado correctamente e interpretar los resultados adecuadamente.

El rendimiento y la interpretación del análisis de regresión lineal están sujetos a una variedad de dificultades, que se discuten aquí en detalle. El lector es consciente de los errores comunes de interpretación a través de ejemplos prácticos. Se presentan tanto las oportunidades para aplicar el análisis de regresión lineal como sus limitaciones.

El propósito de la evaluación estadística de los datos médicos es a menudo describir las relaciones entre dos variables o entre varias variables. Por ejemplo, a uno le gustaría saber no solo si los pacientes tienen presión arterial alta, sino también si la probabilidad de tener presión arterial alta está influenciada por factores como la edad y el peso. La variable que se explicará (presión arterial) se denomina variable dependiente, o, alternativamente, la variable de respuesta; Las variables que lo explican (edad, peso) se denominan variables independientes o variables predictoras. Las medidas de asociación proporcionan una impresión inicial de la extensión de la dependencia estadística entre las variables. Si las variables dependientes e independientes son continuas, como es el caso de la presión arterial y el peso, entonces se puede calcular un coeficiente de correlación como una medida de la resistencia de la relación entre ellos (Cuadro 1).

¿Qué es lo más importante en la regresión lineal simple?

La regresión lineal simple proporciona un medio para modelar una relación de línea recta entre dos variables. En la regresión clásica (o asimétrica), una variable (y) se denomina variable de respuesta o dependiente, y la otra (x) se llama variable explicativa o independiente. Esto contrasta con la correlación donde no hay distinción entre y y x en términos de la cual es una variable explicativa y que un
variable de respuesta.

Y = α + βx + ε
Y = β0 + β1x + ε

En el modelo de regresión tradicional, el experimentador supone que los valores de X-Variables son fijados. El modelo sigue siendo válido si X es aleatorio (como es más comúnmente el caso), pero solo si X se mide sin error. Si hay un error de medición sustancial en X, y los valores de los parámetros estimados son de interés, entonces se deben utilizar la regresión de errores en variables. Se supone que los errores en la variable de respuesta son independientes y se distribuyen de manera idéntica y normalmente.

Los parámetros del modelo de regresión se estiman a partir de los datos utilizando mínimos cuadrados ordinarios.

  • B es la estimación del coeficiente de pendiente (β),
  • X e y son las observaciones individuales,
  • y son los medios de x e y,
  • n es el número de observaciones bivariadas.
  • A es la estimación de la intersección y (α) (el valor de y donde x = 0).

Hay varias formas en que se puede probar la importancia de una regresión. Proporcionar errores se distribuyen normalmente e idénticamente, se puede utilizar una prueba paramétrica. El análisis de varianza es a menudo el enfoque preferido, aunque también se puede usar una prueba t para probar si la pendiente es significativamente diferente de cero. Si los errores no se distribuyen normalmente e idénticamente, entonces se debe usar una prueba de aleatorización.

¿Qué importancia tiene el estudio de la regresión?

En términos más generales, el análisis de regresión se refiere a un conjunto de métodos estadísticos que se utilizan para estimar las relaciones entre variables dependientes e independientes.

Sin embargo, una gran idea errónea es que el análisis de regresión se refiere únicamente a la regresión lineal, que no es el caso. Hay tantas técnicas estadísticas dentro del análisis de regresión que son extremadamente poderosas y útiles. Esto me lleva a mi primer punto:

La regresión lineal y las redes neuronales son modelos que puede usar para hacer predicciones dadas algunas entradas. Pero más allá de hacer predicciones, el análisis de regresión le permite hacer muchas cosas más que incluyen, entre otras,:

  • El análisis de regresión le permite comprender la fuerza de las relaciones entre las variables. Utilizando mediciones estadísticas como R cuadrado R / R cuadrado ajustado, el análisis de regresión puede decirle cuánto de la variabilidad total en los datos explica su modelo.
  • El análisis de regresión le dice qué predictores en un modelo son estadísticamente significativos y cuáles no. En términos más simples, si da una regresión del modelo 50 de características, puede averiguar qué características son buenos predictores para la variable objetivo y cuáles no.
  • El análisis de regresión puede dar un intervalo de confianza para cada coeficiente de regresión que estima. No solo puede estimar un solo coeficiente para cada característica, sino que también puede obtener una gama de coeficientes con un nivel de confianza (por ejemplo, 99% de confianza) en el que se encuentra el coeficiente.

¿Qué es una regresión lineal cuáles son sus componentes para qué se utiliza?

Imaginemos que, al menos en el intervalo de dosis incluidas en el experimento, el efecto de la fertilización de nitrógeno en la producción lineal. De hecho, el rendimiento de los datos confirma esta impresión y, por lo tanto, colocamos el modelo lineal en los términos habituales:

donde (y ) es la producción del paquete (i ), tratada con la dosis (x_i ), (b_0 ) es la intercepción (producción con nitrógeno igual a 0) y (b_1 ) es la pendiente, es decir, el aumento en la producción para cada aumento unitario en la dosis. El componente estocástico ( Varepsilon ) se toma omopretics y normalmente se distribuye, con medios 0 y desviación estándar ( Sigma ).

En este punto, debemos identificar los parámetros (b_0 ) y (b_1 ) de tal manera que la línea recta obtenida es la más cercana a los datos, es decir, para minimizar las desviaciones entre los valores de producción observados y los estimados por el modelo (solución de cuadrados mínimos). La función de los cuadrados mínimos es:

En lugar de llevar a cabo los cálculos a mano, podemos ajustar los cuadrados mínimos con R; La única diferencia entre este modelo de regresión y el modelo ANOVA utilizado justo arriba es que aquí usamos la variable ‘dosis’ como tal, sin transformarlo primero en un ‘factor’.

Como de costumbre, antes de cualquier otra consideración, debemos verificar la bondad del modelo y el respeto de las contrataciones básicas, con un procedimiento que, para un modelo de regresión, debe concierne a un mayor número de aspectos que un modelo ANOVA.

¿Cuáles son las partes de una regresión lineal?

Comprender qué es un modelo estadístico y qué es la estimación estadística, y conocer la diferencia, es un primer paso crítico para analizar sus datos. Ahora ese modelo y estimación se diferencian, pensaremos en cómo funcionan en concierto. Antes de comenzar con el modelado real, bajemos algunos términos.

Los términos utilizados en el modelado lineal no están estandarizados, pero en su mayor parte son consistentes. A continuación se presentan algunas definiciones y discusión sobre términos que aparecerán en este texto, o términos que pueden ser útiles para tener en cuenta.

Unidades: observaciones o puntos de datos, a menudo indexados con (i )

(x ) Variable: predictores o variables independientes en el modelo que se incluyen en el lado derecho de la ecuación del modelo

(y ) Variable: resultado, respuesta o variable dependiente en el modelo que típicamente es el término solitario en el lado izquierdo de la ecuación del modelo

Entradas: también llamados términos del modelo, estos son los elementos en el lado derecho de la ecuación del modelo; Tenga en cuenta que si bien las entradas y los predictores son a menudo lo mismo, técnicamente no son las mismas que pueden tener más entradas en el modelo de las que puede tener predictores. Los predictores se refieren a las variables independientes reales, por lo que, por ejemplo, un modelo con dos predictores podría tener tres entradas si la tercera entrada es un términos de interacción entre los dos predictores

Error residual: generalmente el término final en el lado derecho de la ecuación del modelo que se incluye para tener en cuenta cualquier información inexplicada

¿Qué importancia tiene la regresión lineal?

La importancia del análisis de regresión es que se trata de datos: datos significa números y cifras que realmente definen su negocio. Las ventajas del análisis de regresión son que puede permitirle esencialmente atacar los números para ayudarlo a tomar mejores decisiones para su negocio actualmente y en el futuro. El método de pronóstico de regresión significa estudiar las relaciones entre los puntos de datos, lo que puede ayudarlo a:

  • Predecir las ventas a cerca y a largo plazo.
  • Comprender los niveles de inventario.
  • Comprender la oferta y la demanda.
  • Revise y comprenda cómo las diferentes variables afectan todas estas cosas.

Las empresas pueden usar el análisis de regresión para comprender, por ejemplo:

  • Predecir las ventas a cerca y a largo plazo.
  • Comprender los niveles de inventario.
  • Comprender la oferta y la demanda.
  • Revise y comprenda cómo las diferentes variables afectan todas estas cosas.
  • Por qué las llamadas de servicio al cliente cayeron en el último año o incluso el mes pasado.
  • Predecir cómo se verán las ventas en los próximos seis meses.
  • Si elegir una promoción de marketing sobre otra.
  • Si expandir el negocio o crear y comercializar un nuevo producto.
  • El beneficio del análisis de regresión es que se puede utilizar para comprender todo tipo de patrones que ocurren en los datos. Estas nuevas ideas a menudo pueden ser muy valiosas para comprender lo que puede marcar la diferencia en su negocio.

    ¿Que se busca con la regresión lineal?

    El método más utilizado para calcular la regresión lineal es el método de cuadrados mínimos. Este método le permite encontrar una función (línea) que minimice la suma de los cuadrados de las distancias entre los datos observados y los de la línea misma.

    • Cuando los precios cruzan la línea de regresión y esta línea cambia la pendiente; Te enfrentas a un cambio de tendencia; Por lo tanto, hay un movimiento de precios en la dirección indicada por la tarifa de regresión.
    • Si los precios difieren de la tarifa de regresión, se entiende que es una señal de un fuerte desequilibrio y, por esta razón, se espera que un retorno de los precios se espera que la tarifa de regresión lineal.
    • Al analizar los datos en un cierto período de tiempo, el inversor es una idea de los resultados futuros y es allí donde logra identificar la mejor línea para satisfacer sus expectativas. Esto se debe a que la mejor «línea de coincidencia» es la que los comerciantes nombran tendencia.

    El análisis de este gráfico es particularmente útil para estudiar la dirección del precio en Forex. ¿Quieres saber más sobre el mercado de cambios? Leyes:

    Una línea de tendencia representa una tendencia en una serie de datos obtenidos durante un largo período. Este tipo de línea puede mostrar si un conjunto de datos particular (PIB, precio del petróleo o valor de acciones) ha aumentado o disminuido en un cierto período. Calculada con mayor precisión con la técnica estadística de regresiones lineales.

    Estas líneas de tendencia son líneas rectas, aunque algunos usan polinomas de mayor grado dependiendo de la curvatura deseada en la línea.

    ¿Qué importancia tiene el modelo de regresión lineal simple en el campo económico?

    En el artículo anterior, presentamos la motivación detrás de la economía y el papel que desempeña en el campo de la economía. También discutimos brevemente el concepto de un modelo econométrico, que era esencialmente una ecuación que captura la relación entre variables. Hoy saltaremos más a la discusión econométrica examinando el modelo más fundamental: regresión lineal simple (SLR).

    Supongamos que hemos recopilado datos para dos variables, y queremos usar un modelo de regresión lineal simple para estimar su relación. La ecuación para vincular las dos variables (llamémoslas x e y) sería la siguiente (Wooldridge 21):

    • es la variable independiente o regresión y
    • es la variable dependiente o el regresor
    • es el parámetro de intercepción
    • es el parámetro de pendiente
    • es el término de error

    Inmediatamente, puede darse cuenta de que esta fórmula es casi idéntica a la forma de la pendiente-intersección de una línea. De hecho, la idea detrás del modelo SLR es producir una línea que mejor representa la recopilación de puntos de datos (es decir, la línea de regresión). Podemos denotar la línea estimada (también llamada línea de valores ajustados) de la siguiente manera:

    Observe que mientras se estima aquí, no lo es. Esto significa que podemos conectar cualquier valor arbitrario y el modelo estimará un valor para nuestros parámetros de pendiente-intersección. Otro valor que estamos particularmente interesados ​​es el residual. Esta es esencialmente la distancia entre un punto de datos y nuestra línea ajustada.

    Artículos Relacionados:

    Más posts relacionados:

    Deja una respuesta

    Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *