Cómo crear una ecuación de regresión en Excel para análisis de datos

Este ejemplo le enseña cómo ejecutar un análisis de regresión lineal en Excel y cómo interpretar la salida de resumen.

A continuación puede encontrar nuestros datos. La gran pregunta es: ¿existe una relación entre la cantidad vendida (salida) y el precio y la publicidad (entrada)? En otras palabras: ¿podemos predecir la cantidad vendida si conocemos el precio y la publicidad?

R Square equivale a 0.962, que es muy bueno. El 96% de la variación en la cantidad vendida se explica por el precio de las variables independientes y la publicidad. Cuanto más cerca de 1, mejor será la línea de regresión (leer) se ajusta a los datos.

Para verificar si sus resultados son confiables (estadísticamente significativos), mire la importancia F (0.001). Si este valor es inferior a 0.05, estás bien. Si la importancia F es mayor que 0.05, probablemente sea mejor dejar de usar este conjunto de variables independientes. Elimine una variable con un alto valor p (mayor a 0.05) y vuelva a ejecutar la regresión hasta que la importancia F caiga por debajo de 0.05.

La mayoría o todos los valores p deben estar por debajo de 0.05. En nuestro ejemplo, este es el caso. (0.000, 0.001 y 0.005).

La línea de regresión es: y = cantidad vendida = 8536.214-835.722 * precio + 0.592 * publicidad. En otras palabras, para cada unidad de aumento en el precio, la cantidad vendida disminuye con 835.722 unidades. Para cada aumento de la unidad en la publicidad, la cantidad vendida aumenta con 0.592 unidades. Esta es información valiosa.

También puede usar estos coeficientes para hacer un pronóstico. Por ejemplo, si el precio es igual a $ 4 y la publicidad equivale a $ 3000, es posible que pueda lograr una cantidad vendida de 8536.214 -835.722 * 4 + 0.592 * 3000 = 6970.

¿Cómo calcular la ecuación de regresión en Excel?

Copie los datos de ejemplo en la siguiente tabla y péguelo en la celda A1 de una nueva hoja de trabajo de Excel. Para que las fórmulas muestren resultados, seleccione, presione F2 y luego presione Entrar. Si lo necesita, puede ajustar los anchos de la columna para ver todos los datos.

Calcula la estimación de las ventas en el noveno mes, en función de las ventas en los meses 1 a 6.

En el ejemplo anterior, el coeficiente de determinación, o R2, es 0.99675 (ver Cell A17 en la salida para Linest), lo que indicaría una fuerte relación entre las variables independientes y el precio de venta. Puede usar la estadística F para determinar si estos resultados, con un valor R2 tan alto, ocurrieron por casualidad.

Suponga por el momento que, de hecho, no hay relación entre las variables, sino que ha dibujado una muestra rara de 11 edificios de oficinas que hace que el análisis estadístico demuestre una relación sólida. El término «alfa» se usa para la probabilidad de concluir erróneamente que existe una relación.

Los valores F y DF en la salida de la función Linest se pueden usar para evaluar la probabilidad de que un valor F más alto ocurra por casualidad. F se puede comparar con los valores críticos en las tablas de distribución F publicadas o la función FDIST en Excel se puede usar para calcular la probabilidad de que un valor F más grande ocurra por casualidad. La distribución F apropiada tiene grados de libertad V1 y V2. Si n es el número de puntos de datos y const = verdadero u omitido, entonces v1 = n – df – 1 y v2 = df. (Si const = falso, entonces v1 = n – df y v2 = df.) La función FDIST, con la sintaxis FDIST (F, V1, V2), devolverá la probabilidad de que ocurra un valor F más alto por casualidad. En este ejemplo, DF = 6 (celda B18) y F = 459.753674 (celda A18).

¿Cómo se calcula la ecuación de regresión?

En la regresión lineal simple, el punto de partida es la ecuación de regresión estimada: ŷ = B0 + B1x. Proporciona una relación matemática entre la variable dependiente (y) y la variable independiente (x). Además, se puede usar para predecir el valor de y para un valor dado de x. Hay dos cosas que necesitamos para obtener la ecuación de regresión estimada: la pendiente (B1) y la intersección (B0). Las fórmulas para la pendiente y la intersección se derivan del método de mínimos cuadrados: min σ (y – ŷ) 2. El gráfico de la ecuación de regresión estimada se conoce como la línea de regresión estimada.

Después de la ecuación de regresión estimada, el segundo aspecto más importante de la regresión lineal simple es el coeficiente de determinación. El coeficiente de determinación, denotado R2, proporciona una medida de bondad de ajuste para la ecuación de regresión estimada. Antes de que podamos encontrar el R2, debemos encontrar los valores de las tres suma de cuadrados: suma de cuadrados totales (SST), suma de regresión de cuadrados (SSR) y suma de error de cuadrados (SSE). La relación entre ellos viene dada por SST = SSR + SSE. Entonces, dado el valor de cualquier suma de cuadrados, el tercero se puede encontrar fácilmente.

Ahora que conocemos la suma de los cuadrados, podemos calcular el coeficiente de determinación. El R2 es la relación de la SSR al SST. Se necesita un valor entre cero y uno, con cero que indica el peor ajuste y uno que indica un ajuste perfecto. Un ajuste perfecto indica que todos los puntos en un diagrama de dispersión se encuentran en la línea de regresión estimada. Al interpretar el R2, el primer paso es convertir su valor en un porcentaje. Entonces se puede interpretar como el porcentaje de la variabilidad en y explicada por la ecuación de regresión estimada.

¿Cómo se calcula la ecuación dela recta de regresión lineal?

A
modelo de regresión lineal
corresponde a un modelo de regresión lineal que minimiza la suma de errores al cuadrado para un conjunto de pares ((x_i, y_i) ).

La ecuación de regresión lineal, también conocida como ecuación de mínimos cuadrados, tiene la siguiente forma: ( hat y = a + b x ), donde los coeficientes de regresión (a ) y (b ) se calculan mediante esta calculadora de regresión como sigue:

El coeficiente (b ) se conoce como coeficiente de pendiente, y el coeficiente (a ) se conoce como intersección y.

Si en lugar de un modelo lineal, desea usar un modelo no lineal, entonces debe considerar en su lugar un
calculadora de regresión polinómica
, que le permite usar poderes de la variable independiente.

(1) Obtenga los datos para la variable dependiente e independiente en formato de columna.

(2) Escriba los datos, ya sea en formato separado por comas o separado en el espacio.

¿Cómo evaluamos si un modelo de regresión lineal es bueno? Puede pensar «fácil, solo mira el
gráfico de dispersión
«. En realidad, las matemáticas y las estadísticas tienden a ir más allá de donde el ojo cumple con el gráfico. Por lo general, es arriesgado confiar únicamente en el diagrama de dispersión para evaluar la calidad del modelo.

En términos de bondad de ajuste, una forma de evaluar la calidad del ajuste de un modelo de regresión lineal es por
calculando el coeficiente de determinación
, indica la proporción de variación que en la variable dependiente que se explica por la variable independiente.

En la regresión lineal, el cumplimiento de los supuestos es crucial, por lo que las estimaciones del coeficiente de regresión tienen buenas propiedades (ser imparciales, varianza mínima, entre otras).

¿Cómo generar una ecuación en Excel?

Entendamos cómo escribir la fórmula en Excel con algunos ejemplos.

Paso 1: Supongamos que tenemos dos números, 120 y 240, en la celda A1 y A2, respectivamente, en la hoja de Excel. Vea la captura de pantalla a continuación:

Ahora, quiero agregar estos dos números; Veremos cómo se puede lograr esto.

Paso 2: en la celda A4, comience a escribir la ecuación simplemente usando iguales para firmar y luego use 120 + 240 para agregar estos dos valores. Vea la captura de pantalla a continuación para obtener una mejor comprensión.

Paso 3: Presione la tecla ENTER para ver el resultado. Puede ver 360 como resultado de la celda A4, como se muestra a continuación.

Así es como se puede ingresar una fórmula básica en Microsoft Excel. Ahora, ¿qué pasa si cambiamos los números en la celda A1 y A2 a algunos valores diferentes? ¿La fórmula bajo la celda A3 cambiará los valores? Bueno, veamos al hacerlo.

Paso 4: Cambie los números en la celda A1 y A2 a 120 y 240, respectivamente.

Si verifica la celda A3, todavía muestra el resultado de los valores antiguos (es decir, 120 + 140 = 360). Porque en la celda A3, hemos utilizado la ecuación como 120 + 140. Estos son valores fijos y no dinámicos. Por lo tanto, para deshacerse de tal situación, Excel también proporciona una opción para poder usar rangos dinámicos bajo una ecuación/fórmula por ese bien.

Paso 5: En la celda A3, ajuste la fórmula a = A2+ A3. Lo que intentamos hacer aquí es, en lugar de dar un número como argumento, hemos suministrado las celdas que contienen un número como argumento. Esto será beneficioso cuando cambie los números en las celdas A2, A3; Los valores en la celda A4 cambiarán automáticamente después de realizar las operaciones. Así es como hacer que funcione la dinámica de la fórmula utilizando una variedad de células.

¿Cómo insertar ecuaciones en una celda de Excel?

Excel tiene una capa para objetos. No puede poner ningún objeto, ya sea imagen, forma, gráfico, etc. dentro de una celda. Lo mejor que puede hacer es formatear el objeto para moverse y el tamaño, ya que pretende cuándo se manipulan las células subyacentes. Puede hacerlo formatando el objeto y seleccionando la pestaña o enlace «Propiedades» (dependiendo de su versión de Excel).

Si inserta un objeto (en la captura de pantalla es una forma), la configuración predeterminada es «moverse y cambiar el tamaño con las celdas

En general, esto significa que las dimensiones del objeto se extenderán fuera de proporción cuando se cambie la altura de la fila o el ancho de la columna subyacente.

En muchos casos, la configuración para «moverse pero no dimensiona con la celda» será la mejor opción, pero debe establecerse antes de aplicar cualquier cambio de fila o columna. Luego, cambiar la altura de la fila o el ancho de la columna no afectará en absoluto el tamaño del objeto.

En el último ejemplo, la esquina superior izquierda del objeto siempre se colocará exactamente en esa celda. Si las filas o columnas se redimensionan/se insertan/se eliminan, el objeto conservará su tamaño.

Con respecto al objeto de la ecuación, parece que los valores predeterminados para esto ya están configurados para «moverse pero no dimensionar con las celdas». Entonces, lo único que debe hacer es colocar el objeto donde desea que aparezca.

Consejo: si mantiene presionada la tecla ALT mientras arrastra un objeto, se ajustará a la cuadrícula de la hoja de cálculo de Excel, por lo que puede alinear fácilmente la esquina superior izquierda de un objeto a la esquina superior izquierda de una celda en particular.

¿Cómo se hace la ecuación?

Resolver una ecuación que contiene variables consiste en determinar qué valores de las variables hacen que la igualdad sea verdadera. Las variables para las cuales la ecuación debe resolverse también se llaman incógnitas, y los valores de las incógnitas que satisfacen la igualdad se denominan soluciones de la ecuación. Hay dos tipos de ecuaciones: identidades y ecuaciones condicionales. Una identidad es cierta para todos los valores de las variables. Una ecuación condicional solo es verdadera para valores particulares de las variables. [5] [6]

Una ecuación se escribe como dos expresiones, conectadas por un signo igual («=»). [2] Las expresiones en los dos lados del signo igual se denominan «lado izquierdo» y «lado derecho» de la ecuación. Muy a menudo se supone que el lado derecho de una ecuación es cero. Suponiendo que esto no reduzca la generalidad, ya que esto se puede realizar restando el lado derecho de ambos lados.

El tipo de ecuación más común es una ecuación polinomial (comúnmente llamada también una ecuación algebraica) en la que los dos lados son polinomios.
Los lados de una ecuación polinomial contienen uno o más términos. Por ejemplo, la ecuación

Ax2+bx+c-ey = 0 { displaystyle ax^{2}+bx+c-y = 0}

tiene el lado izquierdo ax2+bx+c-y { displaystyle ax^{2}+bx+c-y}, que tiene cuatro términos, y el lado derecho 0 { displayStyle 0}, que consta de un solo término. Los nombres de las variables sugieren que X e Y son incógnitas, y que A, B y C son parámetros, pero esto normalmente se fija por el contexto (en algunos contextos, y puede ser un parámetro, o A, B y C pueden ser variables ordinarias).

Artículos Relacionados:

Más posts relacionados:

Deja una respuesta

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *