¿Qué es la regresión lineal simple y para qué sirve?

Un método estadístico que nos permite resumir y estudiar relaciones entre dos variables continuas (cuantitativas):

  • Una variable, denotada (x ), se considera la variable predictor, explicativa o independiente.
  • La otra variable, denotada (y ), se considera la respuesta, el resultado o la variable dependiente.

Debido a que los otros términos se usan con menos frecuencia hoy en día, usaremos los términos «predictor» y «respuesta» para referirse a las variables encontradas en este curso. Los otros términos se mencionan solo para informarlos de ellos si los encuentra en otras arenas. La regresión lineal simple obtiene su adjetivo «simple», porque se refiere al estudio de una sola variable predictor. Por el contrario, la regresión lineal múltiple, que estudiamos más adelante en este curso, obtiene su adjetivo «múltiple», porque se refiere al estudio de dos o más variables predictoras.

Antes de continuar, debemos aclarar qué tipos de relaciones no estudiaremos en este curso, a saber, relaciones deterministas (o funcionales). Aquí hay un ejemplo de una relación determinista.

Es decir, si conoce la temperatura en grados Celsius, puede usar esta ecuación para determinar exactamente la temperatura en grados Fahrenheit.

Aquí hay algunos ejemplos de otras relaciones deterministas que los estudiantes de semestres anteriores han compartido:

Para cada una de estas relaciones deterministas, la ecuación describe exactamente la relación entre las dos variables. Este curso no examina las relaciones deterministas. En cambio, estamos interesados ​​en las relaciones estadísticas, en las que la relación entre las variables no es perfecta.

¿Qué es y para qué sirve la regresión lineal?

El análisis de regresión lineal se utiliza para predecir el valor de una variable en función del valor de otra variable. La variable cuyo valor desea proporcionar es la variable dependiente. La variable que utiliza para predecir el valor de la otra variable es la variable independiente.

Este tipo de análisis considera los coeficientes de la ecuación lineal, que involucra una o más variables independientes, que estiman mejor el valor de la variable dependiente. La regresión lineal consiste en determinar una línea o una superficie que reduce las diferencias entre los valores de salida esperados y reales. Hay calculadoras de regresión lineal simples que usan un método cuadrado más pequeño para descubrir la línea más adecuada para un conjunto de datos emparejados. El valor de x (variable dependiente) se estima a partir de Y (variable independiente).

Puede realizar una regresión lineal en Microsoft Excel o usar paquetes de software estadístico, como las estadísticas de IBM SPSS® que simplifican considerablemente el proceso de uso de ecuaciones, modelos y fórmulas de regresión lineal. Las estadísticas de SPSS se pueden utilizar en técnicas como regresión lineal simple y regresión lineal múltiple.

Puede aplicar el método de regresión lineal en varios programas y entornos, en particular:

  • Regresión lineal r
  • Regresión lineal de Matlab

¿Qué tipo de situaciones son apropiadas para aplicar la regresión lineal simple?

Mediante el uso de estadísticas, es posible recopilar una serie de datos y proceder con su análisis, para lograr respuestas a algunas preguntas planteadas, que representan la causa del problema. La «regresión» es uno de los miembros de las estadísticas, quizás la más importante. La regresión, gracias a su largo alcance, se usa en muchos campos, como química, ingeniería, biología, así como todas las ciencias aplicadas y sociales. Por su versatilidad, a menudo se ha preferido a cálculos estadísticos más efectivos, pero más caros. La regresión lineal se divide en un tipo simple y un tipo múltiple. En esta guía, se ilustran la definición y el cálculo de la regresión lineal de tipo simple. La guía en cuestión no dice ser completamente exhaustiva, para tratar la lectura, por lo tanto, para recomendar una revisión general en el campo estadístico.

  • Nociones de estadísticas y cálculo probabilístico

En primer lugar, para comprender mejor el concepto de regresión lineal, o más bien su cálculo y su definición, es apropiado haber cumplido conocimiento de otro concepto, a saber, el valor esperado, también utilizado en el cálculo de la probabilidad. Hablando del valor esperado, para dar un ejemplo claro de él, puede tomar cuál es la clasificación promedio como referencia, un poco como el promedio matemático, obtenido de la suma de todos los valores fratto el número de valores. Los académicos han aplicado la regresión lineal desde el siglo XIX y se basó en los cuadrados mínimos, o en el método de identificar una función cercana al conjunto de puntos del plan. Este método permitió, ya en esos días, la resolución de problemas intrincados, pero tenía la falta de ser muy larga y complicada.

La regresión de tipo lineal se define con una fórmula específica, a saber, «yi = b0+b1xi+ui». Pero, ¿cómo se componen? Para bajar, debe echar un vistazo a los términos individuales que conforman la ecuación. «Yi» representa la variable de tipo dependiente, «xi» la segunda variable, pero este tiempo de un tipo independiente. La suma «B0+B1X» representa la tarifa de regresión. En particular, «B0» es su intercepción, es decir, el valor numérico de la intersección entre la línea recta y el eje de las ordenadas y «B1» es el coeficiente angular. El valor «UI», por otro lado, se conoce como un error estadístico, también llamado error aleatorio, o el valor del error de medición. Siempre se debe tener en cuenta un error más o menos grande ya que cada herramienta tiene una medida mínima más allá de la cual no puede ir.

Para el cálculo de la regresión lineal, siempre se proporciona con dos variables, que generalmente son «x» y «y», entre las cuales se busca la reacción lineal. «X» y «Y» son variables deterministas. En este punto, procedemos con la redacción del informe para el cálculo de la regresión lineal. Por definición, tienes yi = a + bh (xi) + ui, donde el valor «a» representa la intercepción, mientras que «b» es el coeficiente angular. Puede escribir, siempre aprovechando el conocimiento de la definición, también como yi = a + bxi + ui. Para obtener la regresión lineal, se calculan «A» y «B». Para hacer esto, utilizamos el método de cuadrados mínimos, a saber, S = S (A; B) con B = Sxy / Sxx y A = Y – Bx. Hace uso de una calculadora o herramientas de cálculo adecuadas. Además, existen numerosos software libre capaz de hacer este cálculo y muchos otros, todo útil para aprender el método estadístico.

¿Cómo se aplica la regresión lineal en la vida cotidiana?

Aprendemos muchos conceptos interesantes y útiles en la escuela, pero a veces no está muy claro cómo podemos usarlos en la vida real.

Un concepto/herramienta que podría estar ampliamente subestimada es la regresión lineal.

Digamos que está planeando un viaje por carretera a Las Vegas con dos de sus mejores amigos. Comienzas en San Francisco y sabes que va a ser un viaje de ~ 9h. Mientras que sus amigos están a cargo de las operaciones de la fiesta, está a cargo de toda la logística involucrada. Debe planificar cada detalle: el horario, cuándo detenerse y dónde, asegúrese de llegar a tiempo…

Entonces, ¿qué es lo primero que haces? ¿Desapareces furtivamente de la faz de la tierra y dejas de responder a tus amigos, porque se divertirán mientras serás la policía de la fiesta? ¡No, obtienes una hoja de papel en blanco y comienzas a planificar!

¿El primer artículo en su lista de verificación? ¡Presupuesto! Es un viaje de 9h, aproximadamente 1200 millas, un viaje divertido, por lo que un total de 18 h en el camino. La pregunta de seguimiento: ¿Cuánto dinero debo asignar el gas?

Esta es una pregunta muy importante. ¡No querrás detenerte en el medio de la carretera y posiblemente caminar unas pocas millas solo porque te quedaste sin gasolina!

Usted aborda este problema con una mentalidad orientada a la ciencia, pensando que debe haber una manera de estimar la cantidad de dinero necesaria, según la distancia que viaja.

Has estado rastreando laboriosamente la eficiencia de su automóvil durante el último año, ¡porque quién no lo hace! – Así que en algún lugar de tu computadora hay esta hoja de cálculo

¿Dónde se aplica la regresión lineal ejemplos?

Aprendizaje automático – Historia ficticia. Una vez que hubo un médico. Miraría a la persona y predeciría si tiene falta de hemoglobina (glóbulos rojos) o no. Y casi todo el tiempo su predicción se hará realidad al probar la sangre del paciente.

¿Cómo predeciría? Supongamos que el color pálido de la cara, el cansancio en el cuerpo son síntomas de baja HB (hamoglobina). Si el peso de la persona es menor, más posibilidades de que tales síntomas se deban a la baja HB. El médico «basado en su experiencia pasada» «predecirá» después de mirar a la persona.

¿Qué pasa si podemos hacer que la computadora también aprenda cosas como esta y haga tal predicción? Suponiendo que tenemos variables cuantificadas numéricas como la palidez y el cansancio.

Hemos visto una ecuación como a continuación en las clases de matemáticas. y es la salida que queremos. x es la variable de entrada. C = constante y A es la pendiente de la línea.

y = c + axc = constante a = pendiente
  • y es la salida que está determinada por la entrada x. La cantidad de valor de X tiene impacto en y está determinado por «A». En el gráfico bidimensional que tiene el eje «x» y «y», «A» es la pendiente de la línea.
  • «C» es la constante (valor de y cuando x es cero).

Digamos que tenemos una buena cantidad de datos históricos en los que se proporcionan valores de entrada «x» y salida/resultado «y».

Queremos mirar los datos históricos y encontrar los valores de «C» y «A». Llamemos a «C» como la constante y «A» como el peso. Si podemos descubrir los valores de C y A, entonces podemos predecir el valor de y para cualquier x nueva.

¿Dónde se aplica la correlación y regresión lineal?

Una correlación mide tres características de la asociación entre X e Y:

La dirección de la relación. Una correlación positiva (+) surge cuando dos variables se mueven en la misma dirección. Si el valor de x aumenta (por ejemplo, la longitud de una persona), el valor de y también aumentó (por ejemplo, el peso de una persona). Se produce una correlación negativa cuando dos variables se mueven en diferentes direcciones. Si X aumenta, y disminuye (o viceversa).

La forma de la asociación. Puede ser, por ejemplo, lineal.

El grado de la asociación. Una correlación perfecta tiene un valor de -1 o 1. Una correlación de 0 implica que no hay asociación entre las dos variables. Por lo tanto, una correlación de 0.8 es más fuerte que una correlación de por ejemplo 0.5

La medida más conocida para la correlación es la correlación de Pearson. Esta correlación mide el grado y la dirección de una relación lineal entre dos variables. La correlación de Pearson se denota con R y se calcula de la siguiente manera:

La correlación de Pearson también se puede calcular para puntajes Z con la siguiente fórmula:

  • Zy: puntaje Z de X
  • Zy: Z-Score of Y

Con la correlación de Pearson en sí, no puede hacer tanto, porque no es una relación escalada y, por lo tanto, no es adecuada para los cálculos. Por lo tanto, tienes que multiplicarlo. El valor R2 se llama coeficiente de determinación. Este valor mide la proporción de varianza dentro de una variable, que puede explicarse por la asociación de esta variable con otra variable. Una correlación de 0.80 (r = 0.80) implica, por ejemplo, que 0.64 (R2), es decir, el 64% de la varianza de puntajes en y puede explicarse por la variable X.

Artículos Relacionados:

Más posts relacionados:

Deja una respuesta

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *