Una medida de tendencia central (también denominadas medidas de ubicación central o central) es una medida resumida que intenta describir un conjunto completo de datos con un valor único que representa el medio o centro de su distribución.
Hay tres medidas principales de tendencia central: el modo, la mediana y la media. Cada una de estas medidas describe una indicación diferente del valor típico o central en la distribución.
¿Cuál es el modo?
El modo es el valor más común en una distribución.
Considere este conjunto de datos que muestra la edad de jubilación de 11 personas, en años enteros:
54, 54, 54, 55, 56, 57, 57, 58, 58, 60, 60
Esta tabla muestra una distribución de frecuencia simple de los datos de la edad de jubilación.
Ventaja del modo:
El modo tiene una ventaja sobre la mediana y la media, ya que se puede encontrar para datos numéricos y categóricos (no numéricos).
Limitaciones del modo:
Hay algunas limitaciones para usar el modo. En algunas distribuciones, el modo puede no reflejar muy bien el centro de la distribución. Cuando la distribución de la edad de jubilación se ordena del valor más bajo a más alto, es fácil ver que el centro de la distribución es de 57 años, pero el modo es más bajo, a los 54 años.
También es posible que haya más de un modo para la misma distribución de datos (bi-modal o multimodal). La presencia de más de un modo puede limitar la capacidad del modo para describir el centro o el valor típico de la distribución porque no se puede identificar un valor único para describir el centro.
¿Cómo se utilizan las medidas de tendencia central?
Medidas de tendencia central. Las medidas de tendencia central tienen como objetivo resumir la «posición del centro ideal» en el que tienden a gravitar los elementos de la distribución de una variable aleatoria y deben proporcionar, en relación con el fenómeno que se conoce, una visión general de todos los elementos .
- Identifique la posición en la clasificación de la unidad central: si N es impar, la ubicación es (n+1)/2. La mediana será el modo presentado por la unidad central; Si N es igual, hay dos unidades centrales con la posición N/2 y N/2 +1.
Los índices de posición, o las medidas de la tendencia central o media, resumen la posición de una distribución estadística reemplazando los datos recopilados con un único valor real (número), como proporcionar una representación efectiva del fenómeno en su totalidad y resumir el aspectos considerados más importantes.
Los índices de forma de una preocupación de distribución 2 características: simetría y curiosidad. A diferencia de lo que sucedió en el estudio de la variabilidad, en el análisis de la forma de una distribución estadística, las medidas elaboradas permanecieron rudimentarias y las mismas definiciones a menudo son equívocas.
Introducción. El dispositivo es un índice de dispersión de datos, que determina la suma de los cuadrados de los promedios del promedio de una variable que representa una distribución de datos: en términos más simples, proporciona un grado de dispersión de una cierta variable de su valor medio.
Los índices de variabilidad relativos son los índices de variabilidad absoluta en comparación, por ejemplo, con su valor promedio (por ejemplo, el coeficiente de variación) o al máximo. La relación de concentración de Gini es un caso particular.
¿Cómo se aplica el uso de las medidas de tendencia central en datos agrupados?
La medición de tendencia central de los datos agrupados que se utilizan en estadísticas para describir ciertos comportamientos de un grupo de datos proporcionado, como el valor al que están cerca, el promedio de los datos recopilados, entre otros.
Cuando se toma una gran cantidad de datos, es útil agruparlo para tener un mejor orden y, por lo tanto, poder calcular ciertas medidas de tendencia central.
Entre las tendencias centrales más utilizadas se encuentran el promedio aritmético, mediano y modo. Estas cifras indican ciertas cualidades de los datos recopilados en una experiencia dada.
Para usar estas medidas, primero debe saber cómo agrupar un conjunto de datos.
Para agrupar los datos primero, debe calcular la playa de datos, obtenida restando el valor más alto menos el valor más bajo de los datos.
Luego elija un número «K», que corresponde al número de clases en las que desea agrupar los datos.
Estamos dividiendo la playa entre «K» para obtener la amplitud de las clases a agrupar. Este número es c = r / k.
Finalmente, se lanza la agrupación, para lo cual se elige un número menor que el valor más bajo de los datos obtenidos.
Este número será el límite inferior de la primera clase. A esto se agrega el C. El valor obtenido será el límite superior de la primera clase.
¿Cuál es la importancia de las medidas de tendencia central?
Las medidas de tendencia central proporcionan una medida resumida que intenta describir un conjunto completo de datos con un valor único que representa el medio o centro de su distribución. Hay tres medidas principales de tendencia central: la media, la mediana y el modo.
La media de un conjunto de datos también se conoce como valor promedio. Se calcula dividiendo la suma de todos los valores en un datos establecidos por el número de valores.
Entonces, en un conjunto de datos de 1, 2, 3, 4, 5, calcularíamos la media agregando los valores (1+2+3+4+5) y dividiendo por el número total de valores (5). Nuestra media es entonces 15/5, lo que equivale a 3.
Las desventajas de la media como medida de la tendencia central son que es altamente susceptible a los valores atípicos (observaciones que están notablemente distantes de la mayor parte de las observaciones en un conjunto de datos), y que no es apropiado usar cuando los datos están sesgados, más bien que ser de una distribución normal.
La mediana de un conjunto de datos es el valor que se encuentra en el medio de un conjunto de datos organizado de más pequeño a mayor.
En un conjunto de datos con un número par de observaciones, la mediana se calcula dividiendo la suma de los dos valores medios por dos. Entonces en: 1, 2, 3, 4, 5, 6, la mediana es (3+4)/2, que es igual a 3.5.
La mediana es apropiada para usar con variables ordinales y con variables de intervalo con una distribución sesgada.
El modo es la observación más común de un conjunto de datos, o el valor en el conjunto de datos que ocurre con mayor frecuencia.
¿Cuál es la importancia de la media mediana y moda?
- Alrededor del 75% de las personas que son trabajadores de la confección en la industria de la moda en todo el mundo son mujeres.
- Hasta 75 millones de personas están empleadas por la industria de la moda en todo el mundo en este momento. En 2000, solo se creía que la industria empleaba 20 millones de personas.
- En los EE. UU., Los recolectores de algodón ganan un promedio de $ 40,000 por año. En India, el empleado promedio gana $ 730 por año. En Uzbekistán, los trabajadores no pueden ganar nada en absoluto.
- En 2004, se estimó que la economía informal dentro de la industria de la moda generó el 35% del PIB mundial; La cifra es probablemente más alta ahora.
- 6.9 millones de mujeres en los EE. UU. Compan ropa en línea de forma regular.
- El 58% de las mujeres que compran ropa en línea en todo el mundo están en la demografía de 25 a 45 años.
Pocas industrias realmente pueden decir que son de naturaleza global, pero la industria de la moda es una de ellas. Aunque la mayoría de la fabricación se produce fuera de los Estados Unidos y Europa, mientras que la mayoría de las ventas ocurren dentro de los Estados Unidos y Europa, las economías de todas partes pueden beneficiarse de lo que esta industria contribuye. Ya sea que haya tendencias de moda étnicas, culturales o nacionales que se enfatizan, siempre hay un nicho disponible para diseñadores, fabricantes y minoristas. Aunque Estados Unidos a menudo domina la industria de la moda en términos de importaciones e influencia, realmente hay algo para cada grupo demográfico si está dispuesto a mirar lo suficiente.
- Alrededor del 75% de las personas que son trabajadores de la confección en la industria de la moda en todo el mundo son mujeres.
- Hasta 75 millones de personas están empleadas por la industria de la moda en todo el mundo en este momento. En 2000, solo se creía que la industria empleaba 20 millones de personas.
- En los EE. UU., Los recolectores de algodón ganan un promedio de $ 40,000 por año. En India, el empleado promedio gana $ 730 por año. En Uzbekistán, los trabajadores no pueden ganar nada en absoluto.
- En 2004, se estimó que la economía informal dentro de la industria de la moda generó el 35% del PIB mundial; La cifra es probablemente más alta ahora.
- 6.9 millones de mujeres en los EE. UU. Compan ropa en línea de forma regular.
- El 58% de las mujeres que compran ropa en línea en todo el mundo están en la demografía de 25 a 45 años.
Como puede ver, la moda es más que lo que decidas agregar a tu guardarropa. Es una industria que proporciona empleos de fabricación, empleos contables e incluso trabajos minoristas de nivel de entrada para que todos tengan la oportunidad de involucrarse. Las posiciones especializadas, como un contador, ganan un HHI promedio de $ 83,000. Cuando hay habilidades involucradas, las personas pueden obtener un ingreso en los EE. UU. Que está o por encima del HHI anual promedio y que ayude a aumentar las economías, satisfacer las necesidades que las familias tienen y contribuir al crecimiento de otras industrias.
¿Cuál es la importancia de las medidas de posición?
Aunque no es un aspecto requerido de describir las distribuciones de una variable cuantitativa, a menudo estamos interesados en dónde cae un valor particular en la distribución. ¿Es el valor inusualmente bajo o alto o sobre lo que esperaríamos?
Las respuestas a estas preguntas dependen de las medidas de posición (o ubicación). Estas medidas dan información sobre la distribución, pero también dan información sobre cómo los valores individuales se relacionan con la distribución general.
Una medida común de posición es el percentil. Aunque hay algunas consideraciones matemáticas involucradas en el cálculo de percentiles que no discutiremos, debe tener una comprensión básica de su interpretación.
Los cuartiles Q1 y Q3 son casos especiales de percentiles y, por lo tanto, son medidas de posición.
La combinación de los cinco números (Min, Q1, M, Q3, Max) se denomina resumen de cinco números, y proporciona una descripción numérica rápida tanto del centro como de la distribución de una distribución.
Cada uno de los valores representa una medida de posición en el conjunto de datos.
El Min y el máximo proporcionan los límites y los cuartiles y la mediana que proporcionan información sobre los percentiles 25, 50 y 75.
Los puntajes estandarizados, también llamados puntajes Z, utilizan la desviación media y estándar como las medidas primarias del centro y la propagación y, por lo tanto, son más útiles cuando la media y la desviación estándar son apropiadas, es decir, cuando la distribución es razonablemente simétrica sin valores atípicos extremos.
¿Cuál de las tres medidas de tendencia central es la más pertinente?
La media de la población está representada por ( mu ) y la media de una muestra está representada por ( bar {x} ).
El problema con la media es que se ve afectado por valores extremos y eso hace que otros métodos (modo y mediano), a veces más importante que la media.
Por ejemplo, si en el ejemplo anterior, en lugar de 14 si tiene 140, esto va a cambiar el valor de la media drásticamente.
A diferencia de la media, la mediana no se ve afectada por el valor extremo en los datos.
Para calcular la mediana, debe poner sus datos en orden ascendente o descendente. La mediana es el número medio en los datos dispuestos.
Paso 1: Organice los datos en orden ascendente (o orden descendente, si lo desea).
Paso 2: en esta secuencia 10 es el número medio; Por lo tanto, la mediana es 10.
Lo anterior fue el caso cuando sus datos tenían el número impar de lecturas. Veamos otro ejemplo en el que tenga un número de lecturas.
Ejemplo 2: Encuentre la mediana de 10, 11, 14, 9, 6, 11.
Paso 2: En esta secuencia, no hay un número único en el medio. Por lo tanto, encontramos el promedio de dos números (10 y 11) en el número medio; Por lo tanto, la mediana es 10.5
Y como dije anteriormente que la mediana no se ve afectada por valores extremos. Por ejemplo, en este caso también en lugar de 14, si fuera 140, eso no habría hecho ninguna diferencia en el valor de la mediana.
¿Qué es mejor utilizar la media o la mediana?
La media aritmética es lo que la mayoría de la gente simplemente conoce como el promedio. Sin embargo, para ser exactos, debemos tener en cuenta que la media es solo un tipo de promedio. Antes de perderse en las complejidades de estos términos, pasemos a la definición de la media
Dado un vector (x ) con entradas (n ), la media se define como
Suponga que tenemos (x = (30, 25, 40, 41, 30, 41, 50, 33, 40, 1000) ), ¿cuál sería la media? Podemos calcularlo de las siguientes maneras:
Como puede ver, simplemente puede usar la función media en lugar de tener que implementar la media sola.
La mediana se refiere al valor más central en una lista de números. Si bien es fácil de explicar, la mediana es más difícil de calcular que la media. Esto se debe a que para encontrar la mediana, es necesario ordenar los números en la lista. Además, tenemos que diferenciar dos casos. Si la lista tiene un número impar de elementos, entonces la mediana es el miembro más central de la lista. Sin embargo, si la lista tiene un número par de elementos, necesitamos determinar la media aritmética de los dos números más centrales.
Podemos formalizar esto de la siguiente manera. Sea (x ) un vector ordenado de números. Entonces la mediana es
Habiendo definido ambos tipos de promedios, ahora podemos analizar la diferencia entre los dos. Mientras que la media aritmética considera todos los valores en un vector, el valor medio solo considera un subconjunto de valores. Esto se debe a que la mediana básicamente descarta todos los elementos vectoriales, excepto los valores más centrales. Esta característica de la mediana puede marcar una gran diferencia. Como hemos visto en nuestro ejemplo, la media de (x ) (133) era mucho más grande que su mediana (40).
En este caso, esto se debe a que la mediana descarta el valor 1000 en (x ), mientras que la media aritmética lo considera.
¿Qué medida de tendencia central permite seleccionar el dato más representativo?
Al describir una variable cuantitativa, siempre es una buena regla asociarse con los índices de tendencia central de los índices de variabilidad. Estas medidas proporcionan una indicación resumida de cuánto los valores de las unidades estadísticas individuales están cerca o lejos del centro de la distribución.
En general, le aconsejo que informe la desviación estándar al elegir usar el promedio como índice de posición. En comparación con la varianza, la desviación estándar de hecho tiene la misma unidad de medición del promedio y, por lo tanto, es más fácil de interpretar.
Si, por otro lado, elija la mediana, entonces es mejor referirse al intervalo. Sin embargo, en este caso le recomiendo que prefiera el intervalo intercuartil al absoluto que Excel presenta. El intervalo es, de hecho, la diferencia entre el valor máximo y el valor mínimo (también llamado rango absoluto) pero, precisamente debido a esta característica de considerar los extremos, se ve afectado por los valores anómalos. El intervalo intercuartil, que puede calcular como una diferencia entre el tercer y primer trimestre, excluye los valores extremos y, por lo tanto, es una medida más robusta.
Cuanto más sean diferentes estos dos índices, más significa que la distribución de la variable que está analizando se aleja de la normalidad. Por lo tanto, puede usarlos para convertirlo en una primera idea de la forma de su distribución. En cualquier caso, para decidir de manera más objetiva si una distribución puede considerarse normal o no, le recomiendo que confíe en otros análisis tanto gráficos (por ejemplo, los gráficos de caja) como numéricos (por ejemplo, pruebas normales).
Artículos Relacionados:
- ¿Qué son las medidas de tendencia no central? ¿Por qué son importantes?
- Conoce las principales medidas de tendencia central: media, mediana y moda
- Cómo calcular medidas de tendencia central para datos estadísticos
- Tendencias de la moda para la temporada primavera-verano 2022
- Tendencias no lineales: cómo detectarlas y aprovecharlas para tu negocio
- Las 3 mejores medidas de tendencia central para estadística descriptiva
- Aplicaciones de las medidas de tendencia central: beneficios y desventajas
- Medidas de tendencia central: cómo usarlas y cuáles son las mejores
- Las medidas de tendencia central son importantes porque ayudan a resumir datos y proporcionar información útil para tomar decisiones.
