¿Qué es la varianza y cómo se mide?

En una población, la varianza es la desviación cuadrada promedio de la media de la población, según lo definido por la siguiente fórmula:

Donde σ2 es la varianza de la población, μ es la media de la población, Xi es el elemento ésimo de la población y N es el número de elementos en la población.

Se pueden usar observaciones de una muestra aleatoria simple para estimar la varianza de una población. Para este propósito, la varianza de la muestra se define mediante una fórmula ligeramente diferente y utiliza una notación ligeramente diferente:

Donde S2 es la varianza de la muestra, X es la media de la muestra, Xi es el elemento ésimo de la muestra y N es el número de elementos en la muestra. Usando esta fórmula, la varianza de la muestra puede considerarse una estimación imparcial de la verdadera varianza de la población. Por lo tanto, si necesita estimar una varianza de población desconocida, basada en datos de una muestra aleatoria simple, esta es la fórmula a usar.

La desviación estándar es la raíz cuadrada de la varianza. Por lo tanto, la desviación estándar de una población es:

Donde σ es la desviación estándar de la población, μ es la media de la población, Xi es el elemento ésimo de la población y N es el número de elementos en la población.

Los estadísticos a menudo usan muestras aleatorias simples para estimar la desviación estándar de una población, basada en datos de muestra. Dada una muestra aleatoria simple, la mejor estimación de la desviación estándar de una población es:

donde s es la desviación estándar de la muestra, x es la media de la muestra, xi es el elemento ésimo de la muestra yn es el número de elementos en la muestra.

¿Qué mide la varianza ejemplo?

¿Eso es demasiado abstracto para ti? Entonces imagina el siguiente ejemplo:
Tienes dos juegos de azar diferentes: con el primero, puedes ganar € 100 o perder € 100, ganar exactamente un euro por el segundo o perder un euro. Aunque ambos juegos de azar tienen exactamente el mismo valor de expectativa, a saber, 0, su varianza es muy diferente. Esto se debe a que los posibles resultados son diferentes del valor de expectativa.

Para calcular la varianza, hay un procedimiento simple: primero debe determinar el valor de expectativa, luego insertar los valores individuales en la fórmula y luego calcular la varianza. Calcular la varianza en nuestro artículo
Vaya a más detalles sobre el procedimiento y la fórmula de la varianza.

En este ejemplo, podemos determinar fácilmente la varianza: primero necesitamos el valor de expectativa. En ambos casos, esto es 0. Calcula esto calculando los valores individuales de su probabilidad de ocurrencia y sumando. Si no está seguro de cómo puede obtenerlo, mire nuestro video sobre el valor de expectativa
en. Luego podemos insertar los valores en la fórmula para la varianza y recibir dos valores diferentes de la varianza para nuestro juego:

Entonces ya ves: aunque el valor de expectativa es el mismo, la varianza puede ser muy diferente. Esto se debe a que los posibles eventos, en caso de un billete, están más lejos del valor de expectativa que en la moneda.

La varianza es un nivel de estadísticas y estocásticos, lo que indica la dispersión de los datos por el valor medio. Dado que hay una diferencia en la fórmula, su cálculo solo es posible para los datos con escala cardinal. También puede ver en la fórmula que son valores al cuadrado, lo que dificulta la interpretación. Por lo tanto, la desviación estándar generalmente se usa para interpretar la propagación de los datos.

¿Qué es varianza y ejemplos?

La varianza, junto con la desviación promedio y estándar, es una de las piedras angulares de las estadísticas. Insertado en el cálculo de múltiples instrumentos de estadísticas inferenciales, la varianza es el compañero de viaje de muchos análisis estadísticos.

En este artículo, le mostraré en algunos y simplissemistas cómo calcular la varianza aprendiendo también el método estadístico lógico que lo subyace.

Para comprender cuál es la lógica que conduce a la definición de varianza, es en primer lugar saber que la varianza es un índice de dispersión. En términos muy inmediatos, la varianza es una medida que explica cómo se distribuyen los datos.

Si el promedio aritmético es la tendencia central por excelencia, la varianza es en importancia, el equivalente del promedio en el cálculo de la dispersión. Aunque oculta por una fórmula matemática que implica adicciones y cuadrados, la varianza es una especie de promedio. Un poco especial, pero aún mediano.

Imaginemos que tenemos que calcular la dispersión de los datos de una variable X para la cual conocemos el número total de observaciones (N) y su promedio.

Para calcular la dispersión, el pasaje más fácil es calcular la desviación de cada una de las observaciones N (XI) del promedio, agregar estas desviaciones y dividir todo por el número N de observaciones. En fórmulas, lo que acabo de describir se traduce en:

La fórmula es muy simple y, como puede ver, es una especie de promedio.

¿Cómo determinar la varianza ejemplos?

A diferencia de la extensión y los cuartiles, la varianza permite combinar todos los valores dentro de un conjunto de datos para obtener la medida de dispersión. La varianza (simbolizada por S2) y la desviación estándar (la raíz cuadrada de la varianza, simbolizada por S) son las mediciones de dispersión más utilizadas.

Sabemos que la varianza es una medida del grado de dispersión de un conjunto de datos. Se calcula tomando la diferencia promedio en el cuadrado de cada número en comparación con el promedio de un conjunto de datos. Para los números 1, 2 y 3, por ejemplo, el promedio es 2 y la varianza, 0.667.

[Suma del cuadrado al cuadrado] ÷ número de observaciones = varianza

Varianza, (s2) = diferencia promedio en el cuadrado de valores en comparación con el promedio

Como el cálculo de la varianza se realiza a partir de los cuadrados de las desviaciones, las unidades de medición no son las mismas que las de las observaciones originales. Por ejemplo, las longitudes medidas en metros (M) tienen una varianza medida en metros cuadrados (M2).

La raíz cuadrada de la varianza nos da las unidades utilizadas en la escala original.

La desviación estándar es la medida de dispersión más utilizada cuando se usa el promedio para calcular una tendencia central. Por lo tanto, mide la dispersión alrededor del promedio. Debido a sus estrechos vínculos con el promedio, la desviación estándar puede influir en gran medida si este último da una mala medida de tendencia central.

¿Cómo se puede interpretar la varianza?

La varianza mide cómo se extiende los datos sobre su media. La varianza es igual a la desviación estándar al cuadrado.

La varianza de los datos de la muestra es una estimación de la varianza de la población.

Debido a que la varianza se basa en datos de muestra y no en toda la población, es poco probable que la varianza de la muestra sea igual a la varianza de la población. Para estimar mejor la varianza de la población, use el intervalo de confianza.

El intervalo de confianza proporciona un rango de valores probables para la desviación estándar de la población o la varianza de la población. Debido a que las muestras son aleatorias, es poco probable que dos muestras de una población produzcan intervalos de confianza idénticos. Pero, si repitió su muestra muchas veces, un cierto porcentaje de los intervalos o límites de confianza resultantes contendría la desviación estándar de población desconocida o la varianza de la población. El porcentaje de estos intervalos o límites de confianza que contienen la desviación estándar o la varianza es el nivel de confianza del intervalo. Por ejemplo, un nivel de confianza del 95% indica que si toma 100 muestras aleatorias de la población, puede esperar que aproximadamente 95 de las muestras produzcan intervalos que contengan la desviación estándar de la población o la varianza de la población.

Un límite superior define un valor que la desviación estándar de la población o la varianza de la población probablemente sean menores. Un límite inferior define un valor que la desviación estándar de la población o la varianza de la población probablemente sean mayores que.

¿Qué mide la varianza estandar?

El rango es la diferencia entre los valores altos y bajos. Dado que usa
Solo los valores extremos, se ve muy afectado por valores extremos.

  • Tome el valor más grande y reste el valor más pequeño

La varianza es la desviación cuadrada promedio de la media. Es utilidad
es limitado porque las unidades están cuadradas y no son las mismas que los datos originales.
La varianza de la muestra se denota por S2, es un estimador imparcial
de la varianza de la población.

La desviación estándar es la desviación promedio de la media. Se encuentra
tomando la raíz cuadrada de la varianza y resuelve el problema de no tener
Las mismas unidades que los datos originales. La desviación estándar de la muestra se denota
por s. No es un estimador imparcial de la desviación estándar de la población.

  • Tome el valor más grande y reste el valor más pequeño
  • Encuentra la varianza
  • Tomar la raíz cuadrada
  • La suma de las desviaciones de la media siempre será cero. Necesitamos hacer
    Seguro que ninguna de las desviaciones es negativa. Podemos hacer esto cuadrando cada uno
    desviación (como lo hacemos en la varianza o desviación estándar) o tomando el
    valor absoluto (como lo hacemos en la desviación absoluta media).

    La regla general de rango dice que el rango es aproximadamente cuatro veces el
    Desviación Estándar. Alternativamente, la desviación estándar es aproximadamente un cuarto
    el rango. Eso significa que la mayoría de los datos se encuentran dentro de dos desviaciones estándar.
    de la media.

    • Tome el valor más grande y reste el valor más pequeño
  • Encuentra la varianza
  • Tomar la raíz cuadrada
  • Encuentra el rango
  • Dividelo por cuatro
  • El índice de asimetría de Pearson se puede utilizar para determinar si los datos son simétricos
    o sesgado. Si el índice está entre -1 y 1, entonces la distribución es simétrica.
    Si el índice no es más de -1, entonces está sesgado a la izquierda y si está en
    al menos 1, entonces está sesgado a la derecha.

    ¿Qué representa la varianza estandar?

    La desviación estándar se expresa en las mismas unidades que la media, mientras que la varianza se expresa en unidades cuadradas, pero para mirar una distribución, puede usar siempre que tenga claro lo que está usando. Por ejemplo, una distribución normal con media = 10 y SD = 3 es exactamente lo mismo que una distribución normal con media = 10 y varianza = 9.

    No necesitas ambos. Cada uno tiene diferentes propósitos. El SD ​​suele ser más útil para describir la variabilidad de los datos, mientras que la varianza suele ser mucho más útil matemáticamente. Por ejemplo, la suma de distribuciones no correlacionadas (variables aleatorias) también tiene una varianza que es la suma de las variaciones de esas distribuciones. Esto no sería cierto para el SD. Por otro lado, el SD tiene la conveniencia de expresarse en unidades de la variable original.

    Si John se refiere a variables aleatorias independientes cuando dice «distribuciones no relacionadas», entonces su respuesta es correcta. Sin embargo, para responder a su pregunta, hay varios puntos que se pueden agregar:

    La media y la varianza son los dos parámetros que determinan una distribución normal.

    La desigualdad de Chebyshev limita la probabilidad de que una variable aleatoria observada esté dentro de las desviaciones estándar de $ K $ de la media.

    La desviación estándar se utiliza para normalizar las estadísticas de las pruebas estadísticas (por ejemplo, la desviación estándar conocida se usa para normalizar una media de muestra para la prueba de $ Z $ que la media difiere de $ 0 $ o la desviación estándar de la muestra se usa para normalizar la media de la muestra cuando La verdadera desviación estándar es desconocida, lo que resulta en la prueba $ T $).

    ¿Cómo calcular la varianza estándar?

    Todo esto es muy hermoso, pero la unidad de medición de la varianza es diferente de la unidad de medición de nuestra serie de números iniciales. Si, por ejemplo, nuestras conversiones están en dólares, nos encontraremos con una variación en dólares en el cuadrado.

    La desviación estándar (desviación estándar) le permite eludir este problema. Simplemente consiste en la raíz cuadrada de la varianza.

    • Raíz cuadrada (0) = 0
    • Raíz cuadrada (9023,14286) = 94.9902251
    • Raíz cuadrada (226383.714) = 475,797976

    Afortunadamente, una vez más, la función estadística STDEVP de Excel nos permite calcular la desviación estándar casi automáticamente.

    Un promedio es interesante, tal vez incluso reconfortante. Pero el nivel de dispersión de los datos, la desviación estándar, comparada con el promedio, puede ser muy desestabilizador, hasta el punto de volverse monstruoso, anormal.

    Cuanto mayor sea la brecha, mayor es la dispersión de los datos, más inestable es el proceso medido.

    Cuanto menor sea la brecha, menor es la dispersión de los datos, más estable es el proceso medido.

    Al final, cuanto más estable sea un proceso medido, más probabilidades hay de obtener resultados cerca del promedio en el futuro. Y hacer predicciones confiables.

    • Raíz cuadrada (0) = 0
    • Raíz cuadrada (9023,14286) = 94.9902251
    • Raíz cuadrada (226383.714) = 475,797976
  • cómo se distribuyen los datos dispersos alrededor del promedio;
  • Lo que sucede cuando un resultado es mayor o menor que la diferencia positiva o negativa entre el promedio y la desviación estándar.
  • Artículos Relacionados:

    Más posts relacionados:

    Deja una respuesta

    Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *