La mediana es una medida estadística que determina el valor medio de un conjunto de datos enumerado en orden ascendente (es decir, del valor más pequeño a mayor). La medida divide la mitad inferior de la mitad más alta del conjunto de datos. Junto con la media y el modo, la mediana es una medida de tendencia central.
Aunque la media es la medida más utilizada de la tendencia central de los datos cuantitativos, la mediana se puede usar en su lugar si los datos contienen grandes valores atípicos. Los valores atípicos generalmente sesgaron la media, mientras que la mediana no se ve afectada por valores extremos. A veces, las dos medidas se usan simultáneamente para determinar el valor que describe el valor central mejor.
La mediana se puede encontrar fácilmente. En algunos casos, no requiere ningún cálculo en absoluto. Los pasos generales de encontrar la mediana incluyen:
1. Organice los datos en orden ascendente (del valor más bajo a mayor).
2. Determine si hay un número par o impar de valores en el conjunto de datos.
3. Teniendo en cuenta los resultados del paso anterior, el análisis posterior puede seguir dos escenarios distintos:
- Si el conjunto de datos contiene un número impar de valores, la mediana es un valor central que dividirá el conjunto de datos en mitades.
- Si el conjunto de datos contiene un número par de valores, encuentre los dos valores centrales que dividen el conjunto de datos en mitades. Luego, calcule la media de los dos valores centrales. Esa media es la mediana del conjunto de datos.
Eres un analista de investigación de capital. Actualmente, está trabajando en la valoración de una de las compañías de TI de gran capitalización en el mercado. Ya ha creado un modelo DCF, pero desea verificar los resultados del modelo utilizando un análisis comparable.
¿Cómo interpretar el valor de la mediana?
Al décimo más cercano, ¿cuál es la media del siguiente conjunto de datos? 14, 14, 15, 16, 28, 28, 32, 35, 37, 38
Al décimo más cercano, ¿cuál es la mediana del siguiente conjunto de datos? 6, 12, 22, 18, 16, 4, 20, 5, 15
Para encontrar la mediana, ponga los números de más pequeños a más grandes:
4, 5, 6, 12, 15, 16, 18, 20, 22
Debido a que este conjunto de datos tiene un número impar de valores (nueve), la mediana es simplemente el número medio en el conjunto de datos: 15.
Al décimo más cercano, ¿cuál es la mediana del siguiente conjunto de datos? 14, 2, 21, 7, 30, 10, 1, 15, 6, 8
1, 2, 6, 7, 8, 10, 14, 15, 21, 30
Debido a que este conjunto de datos tiene un número par de valores (diez), la mediana es el promedio de los dos números medios:
Compare la media y la mediana de un conjunto de datos que tiene una distribución que está sesgada correctamente.
Respuesta: La media tendrá un valor más alto que la mediana.
Una distribución del conjunto de datos que está sesgada a la derecha es asimétrica y tiene una gran cantidad de valores en el extremo inferior y pocos números en el extremo superior. En este caso, la mediana, que es el número medio cuando ordene los datos de más pequeños a más grandes, se encuentra en el rango más bajo de valores (donde la mayoría de los números están).
Sin embargo, debido a que la media encuentra el promedio de todos los valores, tanto altos como bajos, los pocos puntos de datos periféricos en el extremo superior provocan que la media aumente, lo que lo hace más alto que la mediana.
¿Cómo se interpreta el resultado de la mediana?
Las tres medidas de tendencia central utilizadas para describir las distribuciones de puntajes son la media, mediana y modo. Cada uno tiene sus propias ventajas y desventajas particulares dependiendo de la forma de la distribución de puntaje. La media es la más familiar y es el promedio aritmético, calculado al agregar todas las puntuaciones y dividir por el número total de puntajes. La mediana es el punto en la escala que divide la distribución de puntajes en la mitad (la mitad de los puntajes caen por encima de la mediana y la mitad caen por debajo). El modo es simplemente la puntuación que ocurre con mayor frecuencia. Tenga en cuenta que tanto la media como la mediana son puntos en una escala y se encuentran por cálculo; No son necesariamente números enteros.
Si la distribución de puntaje tiene forma de campana, la media, la mediana y el modo son idénticas y caen en el medio de la escala. Debido a la forma en que se calculan, los medios están influenciados por puntajes extremos, mientras que las medianas no lo están. Si una distribución está sesgada, la media se extrae hacia la cola de la distribución, mientras que la mediana permanece en el medio. Las calificaciones del curso tienden a ser sesgadas de izquierda, y por esta razón las calificaciones promedio de IAS se informan en forma de medianas.
El cálculo de las medianas de IAS se basa en el método descrito por Guildford (1965) 1 e ilustrado a continuación. Puede reconocer este método como el utilizado más comúnmente para calcular la mediana de los datos agrupados. Este método representa las calificaciones reales con mayor precisión que la mediana «ordinal» calculada utilizando datos no agrupados.
¿Qué es el valor que representa la mediana?
El promedio es un indicador útil, capaz de resumir una multitud de información en una figura. Es un indicador suficiente en caso de que los datos también se distribuyan. Pero es insuficiente cuando no es el caso y luego enmascara la realidad. Para averiguar si una distribución es igualitaria o desigual, es necesario calcular la mediana y observar si la mediana es casi igual a la promedio (distribución «igualitaria») o si la mediana se desvía del promedio (distribución «desigual)) .
Si la mediana es más baja que la promedio, las desigualdades están en la parte superior de la escala. En el caso opuesto, las desigualdades están en la parte inferior de la escala.
La comparación entre mediana y promedio no nos permite determinar si la distribución es igualitaria o desigual. Esta es la desviación estándar que lo permite.
Ejemplo: Joe tiene un ingreso de 1 euro, John de 5 euros y Jack de 9 euros => promedio y mediana será 5.
Buenos dias,
¿Cómo es posible que, para todas las secciones (excepto «salario promedio» y «salario medio»), las cifras «conjuntos» siempre sean más bajas que las de «hombres» pero también para «mujeres»?
Además, ¿las cifras «50% de los empleados ganan menos» deberían ser las mismas que las del «salario mediano»? Sin embargo, éste no es el caso. Atentamente.
- Siéntete más cómodo con los problemas financieros.
- Comprender los problemas económicos del mundo en el que vivimos.
- Asegúrese de las decisiones que nos conciernen.
¿Cuándo se utiliza la mediana ejemplos?
La media, la mediana y el modo son tres métricas que se usan comúnmente para describir el centro de un conjunto de datos.
- Media: el valor promedio en un conjunto de datos.
- Mediana: el valor medio en un conjunto de datos.
- Modo: los valores (s) más frecuentes en un conjunto de datos.
Las personas y las empresas usan estas métricas todo el tiempo en diferentes campos para obtener una mejor comprensión de los conjuntos de datos.
Los siguientes ejemplos explican cómo se usan la media, mediana y el modo en diferentes escenarios de la vida real.
La media, la mediana y el modo son ampliamente utilizados por analistas de seguros y actuarios en la industria de la salud.
- Media: el valor promedio en un conjunto de datos.
- Mediana: el valor medio en un conjunto de datos.
- Modo: los valores (s) más frecuentes en un conjunto de datos.
La media, la mediana y el modo también son utilizadas a menudo por agentes inmobiliarios.
- Media: el valor promedio en un conjunto de datos.
- Mediana: el valor medio en un conjunto de datos.
- Modo: los valores (s) más frecuentes en un conjunto de datos.
¿Dónde se usa la moda o la mediana?
Digamos que tiene 99 personas seleccionadas al azar en una habitación con Jeff Bezos. El patrimonio neto promedio de todos en la sala será de aproximadamente $ 2 mil millones, porque Jeff Bezos tiene un valor de $ 200 mil millones y hay 100 personas allí, y las otras personas tienen efectivamente cero dinero (en comparación con $ 200 mil millones). Pero decir «el patrimonio neto promedio en la sala es de $ 2 mil millones» no tiene sentido porque en realidad es solo una persona que menciona el promedio para todos los demás. Entonces, una imagen más significativa podría ser la mediana o el modo… la mediana es el patrimonio neto de la persona intermedia. El modo es el patrimonio neto más común. Estos le dan una mejor imagen de cómo se ve la persona «promedio» en la habitación, de lo que le dice el promedio real.
¿Por qué es esto interesante? La mediana es buena porque funciona algo similar a tomar un promedio, pero generalmente elimina los valores atípicos, ya que anteriormente tenía 87 como uno de los valores. El promedio de lo anterior es 22.8. Pero, ¿es incluso interesante cuando todos sus valores, excepto 1 atípico, es mucho más bajo que eso? La mediana ayuda a tratar con series que tienen valores atípicos. También te dice un punto medio, por ejemplo, ¿qué pasa si agrego otro número? Bueno, solo por el bien de la teoría, puedes decir que hay un 50% de posibilidades de que esté por debajo de la mediana de 10.
La mediana es buena para decir cuánto tiempo lleva a las personas pagar facturas.
Si dije que el tiempo promedio que tomó pagar una factura es de 22.8 días, pero mira arriba, ese es un valor sin sentido, nada tomó 22.8 días, de hecho, 4/5 de ellos tomaron 11 o menos. Pero si dice que la cantidad media es de 10 días, puede decir que probablemente haya un 50% de posibilidades de que se pague en 10 días o menos. Ese 87 es probablemente un caso especial, por lo que no queremos usar un método que se ajuste a eso
El modo es el número más común de una serie. 1, 2, 2, 3, 4, 5, 6, 7
¿Cuando no se puede usar la mediana?
Tengo dificultades para encontrar una instancia en la que la media sea en realidad una mejor medida de tendencia central que la mediana. El propósito de la media o mediana (o modo) es proporcionar un resumen de un número de un conjunto de datos. Toda la idea de la media es bastante complicada, como puedes leer en una de mis primeras publicaciones sobre explicar cuál es la media. En general, el valor resumido se utiliza para comparar con otra muestra o población. En mis conferencias a menudo ilustré los momentos en que la mediana es una mejor medida resumida de una muestra o población que la media. Esto es bastante común en las notas y los videos de YouTube. ¡Ni una sola vez mostré dónde se prefería la media a la mediana! Entonces, ¿por qué/somos tan leales a la media, sacando la mediana para ocasiones especiales y bienes raíces? Creo que hay dos respuestas, ambas ya no son válidas. Es una cuestión de legado.
A pesar de las primeras apariciones, para cualquier cosa más grande que una muestra trivial, la media es realmente más fácil de calcular que la mediana. Poner un conjunto de 100 valores en orden a mano no es una tarea fácil. (El dolor en el trasero, como mi amigo lo expresó con tanta elegancia). Sumar puntajes y dividir por 100 es un paseo por el parque en comparación. A principios de la década de 1980, cuando aprendí la programación (en Fortran, Pascal y Cobol), escribir un programa de clasificación estaba lejos de ser trivial y un gran conjunto de números tomaría una gran cantidad de tiempo en ordenar. Solo en años posteriores, a medida que la potencia informática se ha expandido, ha sido posible obtener una computadora para calcular una mediana.
Significa comportarse bien y dar buenos resultados matemáticos cuando se manipulan. Debido a esto, podemos calcular los intervalos de confianza utilizando una pequeña fórmula ingeniosa y tablas estadísticas. Hasta que el arranque de la computadora se hiciera factible a gran y pequeña escala, no había una forma práctica de realizar una inferencia en una serie de estadísticas muy útiles, incluida la mediana y el rango intercartil.
Una mediana es intrínsecamente comprensible. Es el número medio cuando los valores se ordenan. Fin de la historia. – Bueno, no del todo, tienes esa cosa un poco complicada donde la muestra está par y tienes que promediar los dos términos del medio, ¡pero aparte de eso es fácil! Una mediana no se ve afectada por los valores atípicos. Aprendí un nuevo término para esto cuando estaba leyendo en preparación para escribir esta publicación. El término es «resistente» y lo aprendí de uno de los videos del Sr. Tarrou para estadísticas AP. Encontré estos videos después de mi diatriba contra videos en intervalos de confianza. Los videos de Tarrou son largos y un poco más matemáticos de lo que me gustaría. (No puede evitarlo: es un maestro de matemáticas y el programa de estadísticas de AP parece haber sido ideado por estadísticos matemáticos que intentan poner a los estudiantes que toman la materia nuevamente). Pero son buenos. Los videos de Tarrou son sólidos, interesantes y bien organizados. Los recomendaré como complementarios a mis propias ofertas. (Porque estoy seguro de que no quiero tener que hacer todas esas cosas matemáticas desagradables). Pero yo divago. La mediana es «resistente» porque no está a merced de los valores atípicos. Hay muchos ejemplos excelentes, incluso en el video del Sr. Tarrou. Si tiene una mediana de 5 y luego agregue otra observación de 80, es poco probable que la mediana se desvíe lejos del 5. Sin embargo, una media es una bestia voluble y fácilmente influida por un atípico llamativo. La principal desventaja que puedo ver para la mediana es que puede ser un poco nervioso en pequeñas muestras compuestas de valores discretos. Supongo que si tienes dos poblaciones de bienestar que son muy similares y quieres ver diferencias precisas, entonces las medias podrían ser mejores, pero incluso entonces posiblemente estarías en exceso de pequeñas diferencias. Me ha encontrado muy interesante observar el comportamiento de los intervalos de confianza para la diferencia de dos medianas, en comparación con los intervalos de confianza para la diferencia en dos medios. Mientras preparaba materiales para nuestro recurso en línea, realicé nueve pruebas de este tipo en diferentes datos reales tomados de estudiantes de la universidad. Los puntajes son muy nerviosos, y las diferencias entre las medianas a menudo incluyen exactamente cero. En consecuencia, los intervalos de confianza de la diferencia de dos medianas a menudo tienen cero como límite inferior. Esto proporciona un desafío en la interpretación, ya que no había cumplido con esto a menudo cuando miraba las diferencias entre medias. Sin embargo, también ilumina la relación extraña que tenemos con cero. El hecho de que un intervalo de confianza para una diferencia de dos medios sea (-0.13, 3.98) e incluye un cero, es tentador concluir que no hay diferencias significativas. ¿Pero es -0.13 es realmente diferente de cero en términos prácticos? El otro punto es que debemos dejar el intervalo de confianza tal como es, en lugar de estirarlo en una inferencia adicional.
Artículos Relacionados:
