Ejemplos de regresión lineal: cómo aplicar este modelo de machine learning

El análisis de regresión utiliza modelos matemáticos para describir las relaciones. Por ejemplo, supongamos que la altura era el único determinante del peso corporal. Si tuviéramos que trazar la altura (la variable independiente o ‘predictor’) en función del peso corporal (la variable dependiente o de ‘resultado’), podríamos ver una relación muy lineal, como se ilustra a continuación.

También podríamos describir esta relación con la ecuación para una línea, y = a + b (x), donde ‘a’ es la intersección y y ‘b’ es la pendiente de la línea. Podríamos usar la ecuación para predecir el peso si supiéramos la altura de un individuo. En este ejemplo, si un individuo tenía 70 pulgadas de alto, predeciríamos que su peso es:

En esta simple regresión lineal, estamos examinando el impacto de una variable independiente en el resultado. Si la altura fuera el único determinante del peso corporal, esperaríamos que los puntos para sujetos individuales se encuentren cerca de la línea. Sin embargo, si hubiera otros factores (variables independientes) que influyeron en el peso corporal además de la altura (por ejemplo, la edad, la ingesta de calorías y el nivel de ejercicio), podríamos esperar que los puntos para sujetos individuales se dispersen más libremente alrededor de la línea, ya que nosotros Solo tienen en cuenta la altura.

El análisis de regresión lineal múltiple es una extensión del análisis de regresión lineal simple que nos permite evaluar la asociación entre dos o más variables independientes y una única variable dependiente continua.

Este es un procedimiento muy útil para identificar y ajustar por confusión. Para proporcionar una comprensión intuitiva de cómo la regresión lineal múltiple hace esto, considere el siguiente ejemplo hipotético.

Supongamos que un investigador había desarrollado un sistema de puntuación que le permitió predecir el índice de masa corporal (IMC) de un individuo en función de la información sobre lo que comió y cuánto. El investigador quería probar este nuevo «puntaje de dieta» para determinar qué tan estrechamente se asoció con las mediciones reales del IMC. La información se recopila de una pequeña muestra de sujetos para calcular su «puntaje de dieta», y el peso y la altura de cada sujeto se mide para calcular su IMC. El siguiente gráfico muestra la relación entre el nuevo «puntaje de dieta» y el IMC, y sugiere que el «puntaje de dieta» no es un muy buen predictor (es decir, hay poca o ninguna asociación entre los dos.

¿Cómo hacer una regresión lineal ejemplos?

Las ecuaciones de regresión son utilizadas con frecuencia por científicos, ingenieros y otros profesionales para predecir un resultado basado en una entrada dada servitada de un conjunto de datos basados ​​en experimentos u observaciones. Hay muchos tipos de ecuaciones de regresión, pero la más simple es la ecuación de regresión lineal.

Una ecuación de regresión lineal es simplemente la ecuación de una línea que es el «mejor ajuste» para un conjunto particular de datos. Aunque no sea un científico, ingeniero o matemático, las ecuaciones simples de regresión lineal pueden encontrar buenos usos en la vida diaria de cualquier persona.

Una ecuación de regresión lineal toma la misma forma que la ecuación de una línea, y a menudo se escribe en la siguiente forma general: y = a + bx

Aquí, «X» es la variable independiente (su valor conocido) y «y» es la variable dependiente (el valor predicho). Las letras «A» y «B» representan constantes que describen la intersección del eje y y la pendiente de la línea.

La imagen a la derecha muestra un conjunto de puntos de datos y una línea de «mejor ajuste» que es el resultado de un análisis de regresión. Como puede ver, la línea en realidad no pasa por todos los puntos. La distancia entre cualquier punto (valor observado o medido) y la línea (valor predicho) se denomina error. Cuanto más pequeños son los errores, más precisa es la ecuación y mejor será para predecir valores desconocidos. Cuando los errores se reducen a su nivel más pequeño posible, se crea la línea de «mejor ajuste».

Si tiene un programa de hoja de cálculo como Microsoft Excel, entonces crear una ecuación de regresión lineal simple es una tarea relativamente fácil. Después de ingresar sus datos en un formato de tabla, puede usar la herramienta de gráfico para hacer una gráfica de dispersión de los puntos. A continuación, simplemente haga clic derecho en cualquier punto de datos y seleccione «Agregar línea de tendencia» para mencionar el cuadro de diálogo de ecuación de regresión. Seleccione la línea de tendencia lineal para el tipo. Vaya a la pestaña ‘Opciones’ y asegúrese de verificar las casillas para mostrar la ecuación en el gráfico. Ahora puede usar la ecuación para predecir nuevos valores siempre que lo necesite.

¿Cómo se explica una regresión lineal?

  • Suposiciones de regresión lineal.
  • Cómo lidiar con la violación de los supuestos
  • Métricas de evaluación para problemas de regresión

El aprendizaje automático es una rama de la inteligencia artificial (IA) centrada en la creación de aplicaciones que aprenden de los datos y mejoran su precisión con el tiempo sin ser programado para hacerlo.

Aprendizaje automático supervisado: es una técnica ML donde los modelos están capacitados en datos etiquetados, es decir, se proporciona una variable de salida en este tipo de problemas. Aquí, los modelos encuentran la función de mapeo para mapear las variables de entrada con la variable de salida o las etiquetas. Los problemas de regresión y clasificación son parte del aprendizaje automático supervisado.

Aprendizaje automático no supervisado: es la técnica donde los modelos no se proporcionan con los datos etiquetados y tienen que encontrar los patrones y la estructura en los datos para conocer los datos. Los algoritmos de agrupación y asociación son parte de ML sin supervisión.

En las palabras más simples, la regresión lineal es el modelo de aprendizaje automático supervisado en el que el modelo encuentra la mejor línea lineal de ajuste entre la variable independiente y dependiente, es decir, encuentra la relación lineal entre la variable dependiente e independiente.

La regresión lineal es de dos tipos: simple y múltiple. La regresión lineal simple es donde solo hay una variable independiente y el modelo tiene que encontrar la relación lineal con la variable dependiente

Mientras que, en la regresión lineal múltiple, hay más de una variables independientes para que el modelo encuentre la relación.

¿Cómo se interpreta la ecuacion de regresión?

Usando la información en la tabla, estime el valor de cuando = 13. Da tu respuesta a todo el todo.

Se nos da un conjunto de datos a dos variables donde tenemos seis pares de valores para cada una de las dos variables y . Para estimar un valor para un valor dado, suponiendo que los datos son aproximadamente lineales, primero debemos encontrar la ecuación de la línea de regresión, ̂ = + . Para hacer esto, primero calculamos el coeficiente del director , usando la fórmula a continuación: = = ∑ –∑ ∑ ∑ – ∑ .

Esto requiere las sumas  ,  ,  y  , y colocando nuestros datos en una tabla con columnas para el producto y para , podemos calcularlo fácilmente como se indica a continuación.

Al sustituir las sumas necesarias en la fórmula de , esto da = 6 × 1772-90 × 1146 × 1604− (90) = 10632-102609624−8100 = 3721524 más largo0,2440945 = 0.244.

La ordenada verifica originalmente la ecuación = – y usaremos nuestro valor para calcular esto. Sin embargo, primero debemos encontrar los medios de y los valores . Estos son = ∑ = 906 = 15, = ∑ = 1146 = 19.

Con estos valores, tenemos = 19-0,2440945 × 15 más largos15.3386.

Por lo tanto, la línea de regresión tiene la ecuación ̂ = 15.3386+0.2440945 . Ahora, si sustituimos = 13, encontramos ̂ = 15.3386+0.2440945 × 13 más largo18.512.

¿Cómo interpretar los resultados de una regresión lineal en Excel?

La regresión lineal múltiple es una de las técnicas más utilizadas en todas las estadísticas.

Este tutorial explica cómo interpretar cada valor en la salida de un modelo de regresión lineal múltiple en Excel.

Supongamos que queremos saber si la cantidad de horas dedicadas a estudiar y la cantidad de exámenes de preparación realizados afecta el puntaje que un estudiante recibe en un determinado examen de ingreso a la universidad.

Para explorar esta relación, podemos realizar una regresión lineal múltiple utilizando horas estudiadas y preparar exámenes tomados como variables predictoras y puntaje del examen como variable de respuesta.

La siguiente captura de pantalla muestra la salida de regresión de este modelo en Excel:

Aquí le mostramos cómo interpretar los valores más importantes en la salida:

Múltiple R: 0.857. Esto representa la correlación múltiple entre la variable de respuesta y las dos variables predictoras.

R cuadrado: 0.734. Esto se conoce como el coeficiente de determinación. Es la proporción de la varianza en la variable de respuesta la que puede explicarse por las variables explicativas. En este ejemplo, el 73.4% de la variación en los puntajes del examen puede explicarse por el número de horas estudiadas y el número de exámenes de preparación tomados.

Cuadrado R ajustado: 0.703. Esto representa el valor cuadrado R, ajustado para el número de variables predictoras en el modelo. Este valor también será menor que el valor para R Square y penaliza modelos que usan demasiadas variables predictoras en el modelo.

Error estándar: 5.366. Esta es la distancia promedio que los valores observados caen desde la línea de regresión. En este ejemplo, los valores observados caen un promedio de 5.366 unidades de la línea de regresión.

¿Cómo se resuelve una regresión lineal?

CAT ha enseñado una variedad de temas, incluidas las comunicaciones, las matemáticas y la tecnología. CAT tiene una maestría en educación y actualmente está trabajando en su Ph.D.

Jake ha decidido comenzar un negocio de perros calientes. Él ha contratado a su primo, Noah, para ayudarlo con las ventas de perros calientes. ¡Pero hay un problema! Noah solo puede trabajar 20 horas a la semana. Jake quiere que Noah trabaje en las horas de ventas de perros calientes. ¿Cómo puede encontrar esta información? En esta lección, aprenderá cómo resolver problemas utilizando conceptos basados ​​en la regresión lineal. Primero, veremos algunos de nuestros términos clave que serán beneficiosos en esta lección.

Intente actualizar la página o comuníquese con el servicio de atención al cliente.

Como miembro, también obtendrá acceso ilimitado a más de 84,000
Lecciones en matemáticas, inglés, ciencia, historia y más. Además, obtenga pruebas de práctica, cuestionarios y entrenamiento personalizado para ayudarlo
triunfar.

Jake tendrá que recopilar datos y usar el análisis de regresión para encontrar el tiempo de venta óptimo de hot dog. El análisis de regresión es el estudio de dos variables en un intento de encontrar una relación o correlación. Por ejemplo, ha habido muchos análisis de regresión en las horas de estudio de los estudiantes y el GPA. Los estudios han encontrado una relación entre la cantidad de horas de estudios de estudiantes y su GPA general.

En otras palabras, el número de horas de estudios de estudiantes es la variable independiente y el GPA es la variable dependiente. El GPA del estudiante dependerá de la cantidad de horas de estudios de estudiantes; Por lo tanto, existe una relación entre las dos variables. Hablaremos más sobre esta relación, también conocida como correlación, en un minuto, pero definamos la regresión lineal a continuación.

¿Cómo funciona la regresión lineal?

  • Regresión polinómica
  • Regresión logística

La regresión lineal es un método de regresión estadística tranquila y simple utilizado para el análisis predictivo y muestra la relación entre las variables continuas. La regresión lineal muestra la relación lineal entre la variable independiente (eje x) y la variable dependiente (eje y), en consecuencia llamada regresión lineal. Si hay una sola variable de entrada (x), dicha regresión lineal se llama regresión lineal simple. Y si hay más de una variable de entrada, dicha regresión lineal se llama regresión lineal múltiple. El modelo de regresión lineal proporciona una línea recta inclinada que describe la relación dentro de las variables.

El gráfico anterior presenta la relación lineal entre la variable dependiente y las variables independientes. Cuando aumenta el valor de x (variable independiente), el valor de y (variable dependiente) también está aumentando. La línea roja se conoce como la mejor línea recta de ajuste. Según los puntos de datos dados, intentamos trazar una línea que modela los puntos mejor.

Como se mencionó anteriormente, la regresión lineal estima la relación entre una variable dependiente y una variable independiente. Entendamos esto con un ejemplo fácil:

Supongamos que queremos estimar el salario de un empleado en función del año de experiencia. Tiene los datos recientes de la compañía, lo que indica que la relación entre la experiencia y el salario. Aquí el año de experiencia es una variable independiente, y el salario de un empleado es una variable dependiente, ya que el salario de un empleado depende de la experiencia de un empleado. Usando esta visión, podemos predecir el salario futuro del empleado en función de la información actual y pasada.

Artículos Relacionados:

Más posts relacionados:

Deja una respuesta

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *