El rango es la medida de variabilidad más simple. Toma el número más pequeño y lo restas del número más grande para calcular el rango. Esto muestra la propagación de nuestros datos. El rango es sensible a los valores atípicos, o valores que son significativamente más altos o más bajos que el resto del conjunto de datos, y no deben usarse cuando están presentes los valores atípicos.
Calculemos el rango para las calificaciones de exámenes a mitad de período. Aquí se muestran las calificaciones de mitad de período enumeradas en orden numérico. Dado que el rango es igual al grado medio de mediano plazo menos el grado medio de mediano plazo, podemos encontrar fácilmente el rango para este conjunto de datos. Conectando 100 para nuestro grado de mediano plazo más alto y 52 para nuestro grado más bajo en el medio plazo, encontramos que el rango es igual a 100 menos 52, o 48.
- Rango = Grado medio medio de nivel medio menos bajo Grado de Medio Medio
- Rango = 100 – 52 = 48
Entonces, ¿qué medida de variabilidad podemos usar cuando trabajamos con conjuntos de datos que contienen valores atípicos? Una solución es usar el rango intercuartil (IQR). El IQR, o el medio cincuenta, es el rango para el cincuenta por ciento del medio de los datos. El IQR solo considera los valores medios, por lo que no se ve afectado por los valores atípicos.
- Rango = Grado medio medio de nivel medio menos bajo Grado de Medio Medio
- Rango = 100 – 52 = 48
1) Enumere los datos en orden numérico. La lista de datos en orden numérico es necesario para encontrar el rango y la mediana.
¿Qué es la variabilidad en la estadística?
Una medida de variabilidad v definida en las observaciones (x1, x2,…, xn) es tal si satisface los siguientes axiomas:
- El índice V no es negativo
- El índice V es nulo cuando todas las unidades toman el mismo modo
- El índice V no cambia cuando se agrega una constante (o se resta)
- Si v (x)> v (y) entonces x es más variable que y
- El índice V aumenta a medida que crece la variabilidad
Axiomas para la definición de un índice de variabilidad.
Los índices de variabilidad se distinguen en tres categorías:
a) índices que miden la variabilidad en comparación con una medida de posición.
Estos se basan en una síntesis del desperdicio de los métodos con respecto al valor central de la referencia (es decir, el promedio)
b) índices que miden la variabilidad con respecto al sistema del sistema.
Estos se basan en la función de la distribución empírica y, por lo tanto, al orden que asume los métodos en la distribución considerados
c) índices que miden la variabilidad mutua entre todas las modalidades consideradas dos por dos.
Hacen un resumen del conjunto de desviaciones entre los valores de las distribuciones consideradas dos a la vez.
Un índice de variabilidad en comparación con un centro mide la presencia o ausencia de una cierta estabilidad de los valores tomados por las unidades con respecto a la medición de la tendencia central.
Los índices más populares se basan en el concepto de «residuos» (o desviación) de los métodos con respecto al promedio (entendido como un medio aritmético).
¿Cómo sacar la variabilidad en estadística?
Consideramos una variable aleatoria x y un conjunto de datos s = {x1, x2,…, xn} de tamaño n que contiene posibles valores de x. El conjunto de datos puede representar a la población que se está estudiando o una muestra extraída de la población. La media es la estadística utilizada con mayor frecuencia para caracterizar el centro de los datos en S. Ahora consideramos las siguientes medidas de variabilidad utilizadas de los datos en torno a la media, a saber, la desviación estándar, la varianza, la desviación al cuadrado y la desviación absoluta promedio.
Además, también exploramos otras tres medidas de variabilidad que no están vinculadas a la media, a saber, la desviación absoluta mediana, el rango y el rango intercartil.
De estas estadísticas, la varianza y la desviación estándar se emplean más comúnmente.
Funciones de Excel: si R es un rango de Excel que contiene los elementos de datos en S, entonces la función de Excel que calcula cada una de estas estadísticas se muestra en la Figura 1. Las funciones marcadas con un asterisco son funciones complementarias que se encuentran en el recurso de estadísticas reales, aunque equivalente Las fórmulas en Excel estándar se describen más adelante.
Observación: estas funciones ignoran las células vacías o no numéricas.
Definición 1: La varianza es una medida de la dispersión de los datos en torno a la media. Donde s representa una población, la varianza de la población (símbolo σ2) se calcula a partir de la media de la población µ de la siguiente manera:
Donde s representa una muestra La varianza de la muestra (símbolo S2) se calcula a partir de la media de la muestra x̄ como sigue:
La razón por la cual la expresión de la varianza de la población involucra la división por N, mientras que la de la varianza de la muestra involucra la división por N – 1 se explica en la propiedad 3 de los estimadores, donde la división por N – 1 debe obtener un estimador imparcial de la varianza de la población.
¿Qué es variabilidad y su importancia?
La variabilidad (también llamada dispersión o dispersión) se refiere a cómo es un conjunto de datos. La variabilidad le brinda una forma de describir la cantidad de conjuntos de datos que varían y le permite usar estadísticas para comparar sus datos con otros conjuntos de datos. Las cuatro formas principales de describir la variabilidad en un conjunto de datos son:
El rango es la cantidad entre su artículo más pequeño y más grande del conjunto. Puede encontrar el rango restando el número más pequeño del más grande. Por ejemplo, supongamos que ganó $ 250 una semana, $ 30 la semana siguiente y $ 800 la tercera semana. El rango de su pago (es decir, cuánto varía) es de $ 30 a $ 800.
El rango intercuartil es casi el mismo que el rango, solo que en lugar de declarar el rango para todo el conjunto de datos, está dando la cantidad para los «Cincuenta medios». A veces es más útil que el rango porque le dice dónde se encuentran la mayoría de sus valores. La fórmula es IQR = Q3 – Q1, donde Q3 es el tercer cuartil y Q1 es el primer cuartil. Básicamente, está tomando uno de los valores más pequeños (en el percentil 25) y restando de uno de los valores más grandes (en el percentil 75). El siguiente diagrama de caja muestra el rango intercuartil, representado por el cuadro. Los bigotes (las líneas que salen de cada lado de la caja) representan el primer trimestre de los datos y el último cuarto.
La varianza de un conjunto de datos le brinda una idea aproximada de cómo se extienden sus datos. Un pequeño número para la varianza significa que su conjunto de datos está bien agrupado y un gran número significa que los valores están más separados. La varianza rara vez es útil, excepto para calcular la desviación estándar.
¿Qué son las aplicaciones de la estadística?
Hay una premisa que hacer. Muchos de los que abren un sitio, no tienen la pelota de Internet, por lo que incluso aprender a leer las estadísticas al respecto será algo para aprender para los títulos. Si usted es de la escuela «Internet para negarse», le recomendamos que confíe a aquellos que también han construido el control de su sitio sobre los movimientos de este último, al menos durante el primer período.
Dicho esto, todavía podemos decir que Google Analytics no es particularmente difícil de usar. Simplemente cree o acceda a una cuenta de Google vinculada a su sitio web.
Una vez que ingrese al sitio con su cuenta de Google en la sección correspondiente, solo ingrese la URL del sitio que tiene la intención de monitorear. Analytics generará un código HTML (un script) para usted que tendrá que insertar dentro de las páginas de su sitio web.
Una vez que ingrese, el código comenzará el escaneo del sitio y ya después de unos minutos puede verificar el acceso en tiempo real. Obviamente, cuanto más sea el intervalo de tiempo, más las estadísticas serán útiles para sacar conclusiones.
La estructura del sitio, y también de la aplicación, se establece en dos columnas: el menú izquierdo y la parte principal que podríamos decir Central con los datos. En el menú hay 3 áreas, a saber, las relacionadas con el público, la de la adquisición y la del comportamiento.
Para verificar los datos de cada sección, deberá elegir el intervalo de tiempo que se examinará. Se le propondrán las estadísticas de los primeros 30 días. En la esquina superior derecha, puede abrir un panel para establecer el intervalo que necesita.
¿Qué aplicaciones tiene la estadística hoy en día?
Facebook, destino social principal Si consideramos la navegación web, damos paso a otros servicios si evaluamos el uso a través de aplicaciones de la misma. El trabajo nuevo con múltiples usuarios activos en el mundo (2.500 millones) es el líder entre las aplicaciones de las 3 naciones: Estados Unidos, Suecia y Vietnam. Los principales contendientes de uso a través de la aplicación son WhatsApp y Facebook Messenger, sin embargo, parte del ecosistema de Zuckerberg. La novedad es que WhatsApp continúa conquistando nuevas naciones en el mundo. Hoy tiene 2 mil millones de usuarios activos y es el sistema de mensajería más utilizado en 37 naciones, en los territorios de Europa occidental, en los de Rusia, América Latina, pero también en India y África. En el último año, Bélgica, Croacia, Francia, Portugal, Kuwait, Nigeria y Keny ganaron. Facebook Messenger, spin-off de la famosa red social que cuenta con 1.300 millones de usuarios, gana en 16 naciones, incluidas Canadá, Australia, Dinamarca, Noruega y algunos países de Europa del Este.
Pero también hay poblaciones que resisten la influencia occidental y prefieren los servicios más en línea con su cultura nacional. La línea, la aplicación de mensajes instantáneos de Corea del Sur con más de 200 millones de usuarios activos, continúa manteniendo su dominio en Japón, Taiwán y Tailandia. Es una plataforma real, que hace útil vender juegos y calcomanías, así como ofrecer perfiles comerciales a través de los cuales las empresas pueden enviar mensajes directos a sus seguidores (por una tarifa).
En China, Spopola Wechat, del gigante de Tencent, empató doble cable al gobierno, con más de 1.100 millones de usuarios mensuales. WeChat se caracteriza por ser una plataforma innovadora que ofrece mensajes de texto, audio y video, pero también la posibilidad de realizar pagos para varios servicios públicos y privados chinos.
Finalmente, Viber, propiedad de Rakutten, quien también produce el libro electrónico de Kobo Reader, preferido en Ucrania y Kakaotalk en Corea del Sur.
Va a observar las primeras 10 aplicaciones más utilizadas en los países occidentales, está claro que el podio siempre es la prerrogativa de los productos de la familia de Facebook. Pero cada nación tiene sus propias especificidades. Los franceses son aficionados a Waze, los alemanes en Ebay y el comercio electrónico de Amazon, los británicos usan Tiktok y UberEats, al estadounidense también ama a Snapchat, Pinterest y Pandora.
¿Cuándo se utiliza la variabilidad?
Descubra cuáles son los índices de variabilidad (campo de variación, desperdicio medio simple, varianza y desviación estándar) y para qué se usan para: describir brevemente tanto como los valores se dispersan (es decir, distante) en comparación con el valor central (promedio) . ¡Encuentra todo esto en la lección, lleno de ejemplos y ejercicios realizados!
¿Pensaste que después de aprender a calcular el promedio, todo había terminado? Pero no. O al menos, solo el promedio aritmético (o ponderado) no es suficiente para analizar los datos estadísticos. También debe saber cómo se distribuyen los datos, es decir, cómo varían. Y aquí es donde entran en juego los índices de variabilidad.
Los índices de variabilidad, como la desviación estándar, el desperdicio simple promedio y el campo de variación son muy importantes para resumir algunas características de los datos recopilados. El campo de variación de una secuencia de números (que son los datos) es la diferencia entre el valor más grande y menor. Hasta aquí, está bien… el simple desperdicio medio £ $ S $ £ £ de una secuencia de $ $ n $ £ £ $ x_1, x_2,…, x_n $ £ es el promedio aritmético de los valores absolutos de las diferencias entre cada valor individual de la secuencia y el promedio aritmético £ $ m $ £ de la secuencia:
¡Atención! El valor absoluto de la diferencia entre cada valor individual y el promedio aritmético £ $ m $ £ representa la distancia de cada valor individual del promedio. La varianza estándar y la desviación están muy relacionadas: la varianza es el promedio aritmético de los cuadrados de la diferencia entre cada valor individual de la secuencia y el promedio aritmético de la secuencia:
£ $ sigma^{2} = fracc {(x_1- m)^2+…+(x_n-m)^2} {n} $ £
¿Cuáles son las formas de medir la variabilidad?
Las medidas de variación en las estadísticas son formas de describir la distribución o dispersión de sus datos. En otras palabras, muestra cuán lejos están los puntos de datos entre sí. Los estadísticos utilizan medidas de variación para resumir sus datos. Puede sacar muchas conclusiones utilizando medidas de variación, como la alta y baja variabilidad. La alta variabilidad puede significar que los datos son menos consistentes, mientras que los datos de baja variabilidad son más consistentes. Puede usar medidas de variación para medir, analizar o describir las tendencias en sus datos, que pueden aplicarse a muchas carreras que usan estadísticas.
Aquí hay algunos tipos de medidas de estadísticas que puede usar para describir sus datos:
El rango es una de las medidas de variación más simples. Es el punto más bajo de datos restados desde el punto más alto de datos. Por ejemplo, si su punto más alto es 10 y su punto más bajo es 3, entonces su rango sería 7. El rango le dice una idea general de cuán ampliamente se extiende sus datos. Debido a que el rango es tan simple y solo usa dos datos, considere usarlo con otras medidas de variación para que tenga una variedad de formas de medir y analizar la variabilidad de sus datos.
La varianza es la variaciones cuadradas promedio de los valores de la media. Compara cada pieza de valor con la media, por lo que la varianza difiere de las otras medidas de variación. La varianza también muestra la propagación del conjunto de datos. Por lo general, cuanto más se extienden sus datos, mayor es la varianza. Los estadísticos utilizan la variación para comparar datos entre sí para ver cómo se relacionan. La varianza es la desviación estándar al cuadrado, lo que denota que los valores de varianza son mayores que los otros valores. Para calcular la varianza, simplemente cuadra su desviación estándar:
Los cuartiles dividen sus datos en cuatro secciones iguales o cuartos. Dividan los datos en orden ascendente, lo que significa que hay dos cuartiles inferiores y los dos cuartiles más altos. Los estadísticos dividen sus datos por porcentaje: el 25% más bajo y el segundo más bajo y el 25% más alto y más alto, que se denominan respectivamente el primer cuartil, segundo cuartil, tercer cuartil y cuarto cuartil. Los símbolos Q1, Q2, Q3 y Q4 representan los cuartiles. Los estadísticos usan cuartiles para organizar datos, y a menudo usan cuartiles en muchas ecuaciones diferentes.
¿Cuántas medidas de variabilidad hay?
Los promedios ilustrados en los dos capítulos anteriores no son suficientes para describir una distribución de frecuencias unidimensionales. Consideremos el siguiente ejemplo:
Tiempo libre y vacaciones mensuales (en DM):
El promedio aritmético à en ambos casos 404 dm, pero cómo se puede deducir la gráfica, la distribución de los datos muy diferentes. Los datos sobre familias con cuatro componentes están dispuestos cerca del promedio, por lo tanto, la variabilidad es menor.
La variabilidad (o dispersión) indica la actitud de un carácter para asumir diferentes formas cuantitativas. Los índices de variabilidad resumen esta actitud numéricamente. Los índices de variabilidad, junto con los de localización, son fundamentales para la descripción de distribuciones unidimensionales.
El campo de variación constituye el índice de variabilidad más simple:
(1) Variables no divididas en clases El campo de variación (R) se define como la diferencia entre el máximo y el mínimo de los valores observados. R = xmax –xmin = x (n) −x (1) { splatyle r = x_ {max} -x_ {min} = x _ {(n)} -x _ { (1)}} donde x (1),…, x (n) { displaysle x _ {(1)}, dots, x _ {(n)}} se observan valores se ordenan.
(2) Variables divididas en clases
En este caso, el campo de variación (r) se define como la diferencia entre el extremo superior de la última clase xku { splawyle x_ {k}^{u}} y el inferior de la primera clase x1l { displaystyle x_ {{ 1}^{l}}: r = xku -x1l { splatyle r = x_ {k}^{u} -x_ {1}^{l}} propiedad:
La diferencia intercuartil es la diferencia entre el tercer trimestre x0.75 { dongestyle x_ {0.75}} y el primer x0.25 { displaysstyle x_ {0.25}}: qa = x0.75 – x0, 25 { Pantalla qa = x_ {0.75} -x_ {0.25}} representa el ancho del intervalo en el centro de la distribución, incluido el 50% de los valores observados (la distribución debe ser ordenada).
La diferencia intercuartil relativa en comparación con la mediana à: qar = qa/x0.5 { splatyle qa_ {r} = qa/x_ {0.5}}.
Propiedad:
El promedio aritmético de residuos en valor absoluto de un cierto origen c à definido como un desecho medio absoluto { displayStyle d}. El origen C puede ser cualquier valor, generalmente elige la mediana x0.5 { dongestyle x_ {0.5}} o el promedio aritmético xsto { displaystyle { bar {x}}}. El desperdicio absoluto medio es un índice de variabilidad lineal que considera todos los valores de la distribución. La primera fórmula a continuación es aplicable a los datos no divididos en clases, donde xi { splatyle x_ {i}} son los valores observados, mientras que la segunda fórmula à aplicable a los datos divididos en clases y xj { displaystyle x_ {j}} son los valores centrales de las clases: d = 1n∑i = 1n | xi – c | { splatyle d = { franc {1} {n}} sum limits _ {i = 1}^{ n} | x_ {i} -c |} d = 1n∑j = 1k | xj -h (xj) = ∑j = 1k | xj –c | f (xj) { displayStyle d = { franc {1} {n}} sum limits _ {j = 1}^{k} | x_ {j} -c | h (x_ {j}) = sum limits _ {j = 1}^ {K} | x_ {j} -c | f (x_ {j})} propiedad:
Las propiedades de la mediana implican que: d (x0.5) <(c) { splatyle d (x_ {0.5}) <(c)}. Cià significa que no hay otro origen C, para el cual los residuos promedio adquieren un valor más bajo a los desechos de la mediana (c = x0.5 { displayStyle c = x_ {0.5}}).
¿Cómo se miden y analizan la variabilidad de los datos?
Hay muchas medidas de variabilidad para ayudar a los investigadores a determinar cuánta variabilidad se contiene dentro de un conjunto de datos. Una simple medida de variabilidad es el rango, la diferencia entre los puntajes más altos y más bajos en un conjunto. Para el ejemplo dado anteriormente, el rango de drogas A es 40 (100-60) y el medicamento B es 10 (85-75). Esto muestra que las puntuaciones de drogas A se dispersan en un rango más grande que el medicamento B.
Una preocupación al usar una medida de rango simple es la existencia de valores atípicos, puntajes individuales que no se agrupan con el resto de los puntajes. Considere el caso de los 100 puntos de datos en el medicamento A, solo 1 puntaje fue del 60% y solo 1 puntaje fue del 100%, mientras que todo el resto fue entre el 78% y el 82%. En este caso, el rango es realmente 40, debido a los valores atípicos, pero la mayoría de los puntos de datos se agrupan alrededor de un rango mucho más pequeño de solo 4 (82-78), lo que indica menos variabilidad que el medicamento B anterior.
Por esta razón, hay tres medidas principales de variabilidad que ayudan a los investigadores a calcular la variabilidad teniendo en cuenta los posibles valores atípicos en los datos. El rango intercuartil, la varianza y la desviación estándar son los cálculos estadísticos utilizados para medir la variabilidad. Si bien no existe una fórmula de variabilidad única, estas tres medidas tomadas juntas ofrecen la mejor respuesta a cómo calcular la variabilidad en un conjunto de datos.
Artículos Relacionados:
- ¿Qué es la variabilidad estadística? ¿Cómo se puede calcular?
- 3 tipos de variables estadísticas que debes conocer
- Los 3 tipos de variables en estadística que todos deben conocer
- Estadísticas y ejemplos de estudios
- La variabilidad en las medidas es una herramienta importante para comprender los datos