Este es realmente un nombre elegante para preguntar qué es un valor típico de la variable. Por ejemplo, ¿cuál es un peso típico de los estudiantes? En un lenguaje común, llamamos a una medida de tendencia central un promedio. Sin embargo, en las estadísticas hay más de una medida de tendencia central o promedio. Los más utilizados son la media aritmética (a menudo solo llamada media) y la mediana. De vez en cuando puede encontrarse con el modo, que es la frecuencia más común; por ejemplo, en el conjunto de datos de pesas de los estudiantes, el modo era de 50-59 kg. Sin embargo, debido a que el modo es muy difícil de manejar matemáticamente, tendemos a no usarlo mucho.
La media es la medida más utilizada de tendencia central o valor típico. Es muy fácil de manejar matemáticamente, simple de calcular y generalmente cae en el medio del conjunto de datos. Para calcular la media, simplemente agregamos todos los valores y dividimos por el tamaño de la muestra. Para nuestros pesos de los estudiantes:
En estadísticas, a menudo usamos la abreviatura para facilitar la fórmula (al menos para los estadísticos) de leer. Por ejemplo, en lugar de «suma de valores», usamos la letra griega Sigma (σ). Por lo tanto, puede encontrar la fórmula anterior escrita en un libro de texto como:
Volvamos ahora al histograma y la forma de las distribuciones. Eche un vistazo nuevamente a la Figura 2. Imagínese si puede, en lugar de tener 10 kg de categorías para el peso, teníamos categorías de 1 kg y un tamaño de muestra de 1,000. Ahora imagine si tuviéramos categorías de 1 gm y un tamaño de muestra de 100,000. A medida que el tamaño de la categoría se vuelve cada vez más pequeño, y el tamaño de la muestra se vuelve cada vez más grande, el número de barras en la Figura 1 se volvería cada vez mayor, y el contorno cambiaría de una forma irregular a una hermosa curva suave. Eventualmente, puede parecerse a la forma que ve en la Figura 3. Esta forma de distribución se conoce como la distribución normal o gaussiana, y se encuentra muy comúnmente en variables relacionadas con la salud.
¿Cómo se determinan las medidas de tendencia central?
La capacidad de resumir visualmente los datos es efectiva, pero alguien como María probablemente necesitará presentar algunos resúmenes numéricos de sus datos para usar en sus informes. Las medidas más comunes para describir los datos son medidas de tendencia central.
Una medida de la tendencia central es un aspecto importante de los datos cuantitativos. Es una estimación de un valor «típico». A María se le puede pedir el número típico de niños vistos por mes.
Tres de las muchas formas de medir la tendencia central son la media, la mediana y el modo.
Hay otras medidas, como una media recortada, que no discutimos aquí.
Nota: En este punto, comenzaremos a usar algunas notaciones básicas para representar números a medida que presentamos fórmulas y formas de calcular. Cuando lees «Deja que (algunos símbolos confusos) representen» estamos tratando de transmitir la fórmula de una manera «genérica». Si esto se vuelve confuso, pase por encima de las fórmulas y preste más atención al ejemplo detallado a continuación.
Sea nuestra muestra (x_1, x_2, ldots, x_n ). (Según la nota anterior, todo lo que estamos haciendo es tener el (x_1, x_2, ldots, x_n ) representan números. Podríamos haberlo ilustrado fácilmente con valores reales como (1,2,3,4 y 5 )
La media de la muestra generalmente se denota por ( bar {x} ) (si sigue esto correctamente, para los valores de 1,2,3,4 y 5) ( bar {x} ) serían 3!)
( bar {x} = sum_ {i = 1}^n dfrac {x_i} {n} = dfrac {1} {n} sum_ {i = 1}^n x_i )
¿Qué es estadística Descriptiva media mediana y moda?
Sí, ese valioso es tratar y procesar datos con la precisión requerida para que pueda servir a sus clientes/consumidores de manera efectiva y responsable.
En estadísticas aplicadas, intentamos asegurarnos de que los datos sean confiables y limpios para ayudarnos a construir un modelo que funcione bien para encontrar los patrones ocultos. Para analizar el conjunto dado de conjuntos de datos de entrada, el campo de las estadísticas aplicadas hace uso de:
Hoy cubriremos estadísticas descriptivas en detalle y un poco de conceptos básicos de estadísticas inferenciales. Estadísticas inferenciales cubriremos con más detalle en la siguiente, parte de las estadísticas aplicadas en ciencia de datos
Permite una interpretación de datos más significativa y simple, para ayudarlo a visualizar los datos de una mejor manera (en forma de gráficos simples)
Las estadísticas descriptivas son breves coeficientes descriptivos que resumen un conjunto de datos dado, que puede ser una representación de todo o una muestra de una población. Las estadísticas descriptivas se descomponen en medidas de tendencia central y medidas de variabilidad (dispersión). Las medidas de tendencia central incluyen la media, mediana y modo, mientras que las medidas de variabilidad incluyen la desviación estándar, la varianza, las variables mínimas y máximas, y la curtosis y la asimetría.
Como puede encontrar en la definición dada anteriormente, las estadísticas descriptivas son simplemente una forma de describir nuestros datos. Sin embargo, no nos permite llegar a conclusiones más allá de los datos que hemos analizado (esta parte se maneja utilizando estadísticas inferenciales)
Artículos Relacionados:
