10 ejemplos de estadística descriptiva

Esta introducción en realidad no introduce el tema, sino que se entiende como un recordatorio sobre cómo se estructurará este y los capítulos posteriores. La primera mitad describirá los conceptos utilizados en el capítulo y por qué son útiles. No se mostrará ninguna codificación en esa parte del capítulo, pero habrá ejemplos del tipo de salida que estamos discutiendo. El texto está destinado a ser leído como cualquier otro libro.

La segunda mitad del capítulo, la sección de práctica, acompañará a los estudiantes creando todas las estadísticas que describimos en la primera mitad usando R. La segunda mitad del capítulo debe leerse «activamente» mientras practica el código usted mismo. La mayor parte de aprender a codificar es solo tomar el código que alguien más ha producido y practicándolo hasta que lo conozca.

Las estadísticas descriptivas son un primer paso para tomar datos sin procesar y hacer que algo sea más significativo. Las estadísticas descriptivas más comunes identifican el medio de los datos (media, mediana) o cómo se extienden los datos alrededor del medio (percentiles, desviación estándar). Las estadísticas que calculamos como estadísticas descriptivas serán útiles para muchas de las lecciones más avanzadas que encontraremos más tarde, pero también son importantes por sí mismas.

Las estadísticas descriptivas son útiles para lo que parece ser: describir algo. Específicamente, describiendo datos. ¿Por qué deben describirse los datos? Debido a que los datos sin procesar son difíciles de digerir y un solo punto de datos no nos dice mucho.

¿Qué es estadística descriptiva y ejemplos?

El índice llamado moda proporciona información sobre los personajes de
Tipo cualitativo: indica el modo de un carácter que aparece con el
Frecuencia máxima. A veces puede haber dos o más formas con uno
Frecuencia máxima. En general, puedes tener una moda (sin imagen), pero también más
Modo (plurimodal).

En el ejemplo con respecto al color de los ojos, la moda es la
color marrón como aparece con la frecuencia máxima, como se observa de
Tabla siguiente:

El promedio (o promedio aritmético) es un índice de posición que
Se utiliza en el caso de caracteres cuantitativos.

Se calcula agregando todos los valores de los datos registrados
y dividir esta suma por el número total de datos.

(x_m = dfrac {x_1+x_2+…+x_n} {n} = dras { sum^n_ {i = 1} {x_i}} {n}
)

Un ejemplo clásico es el cálculo del promedio de los votos.

El promedio armónico es otro tipo de promedio. El promedio armonioso de (n ) números ( {x_1, x_2,…, x_n } ) se define como el número:

La mediana es otro índice de posición utilizado para
caracteres cuantitativos. Para calcular la mediana, los datos se ordenan en orden
creciente; En este punto, la mediana es:

  • el valor central (si el número total de datos es impar)
  • el promedio de los dos valores centrales (si el número total de
    Los datos son iguales)

Una característica de la mediana es dividirse
el conjunto de datos en dos partes de igual número, una parte con valores
Todo más bajo que la mediana, la otra parte con valores más altos que él.

¿Qué es estadística descriptiva y ponga tres ejemplos de aplicación?

Cada vez que obtiene una nueva base de datos para examinar, una de las primeras tareas que debe hacer es encontrar formas de resumir los datos de manera sintética y fácil de entender. Esto es lo que sirven las estadísticas descriptivas (en oposición a las estadísticas inferenciales). De hecho, para muchas personas, el término «estadísticas» es sinónimo de estadísticas descriptivas. Este es este tema al que nos acercaremos en este capítulo, pero antes de entrar en detalles, tómese un momento para comprender por qué necesitamos estadísticas descriptivas. Para hacer esto, abra el archivo AFLSmall Madenins y ver qué variables se almacenan en el archivo.

Figura 4-1 Captura de pantalla de Jamovi que muestra las variables almacenadas en el archivo AFLSMAL_MARGINS.CSV

De hecho, solo hay una variable aquí, las AFL.Margins nos centraremos un poco en esta variable en este capítulo y especificaré qué es. A diferencia de la mayoría de los conjuntos de datos en este libro, estos son datos reales relacionados con la Australian Football League (AFL) .20 La variable AFL.Margins contiene el margen ganador (número de puntos) para 176 juegos jugados en casa y fuera durante la temporada 2010 .

Este resultado no le permite tener una idea de lo que realmente dicen los datos. El simple hecho de «mirar los datos» no es una forma muy efectiva de comprender los datos. Para tener una idea de lo que realmente nos dicen los datos, debemos calcular algunas estadísticas descriptivas (este capítulo) y dibujar algunas imágenes hermosas (Capítulo 5). Dado que las estadísticas descriptivas son las más fáciles de los dos sujetos, comenzaré con ellas, sin embargo, le mostraré un histograma de los datos de AFL.Margins, ya que debería ayudarlo a tener una idea de cómo los datos se ven los datos. Intenta describir (ver Figura 4-2). Hablaremos con más detalle sobre cómo dibujar histogramas en la Sección 5.1. Por el momento, solo mire el histograma y tenga en cuenta que proporciona una representación bastante interpretable de los datos de los márgenes de AFL.

Figura 4-2: un histograma de datos del margen ganador de la AFL 2010 (la variable AFL.Margins). Como puede esperar, cuanto mayor sea el margen ganador, menos tiende a verlo con frecuencia.

¿Cuáles son los principales estadísticos descriptivos?

Si tiene referencias o elementos de referencia o si conoce sitios web de calidad que se ocupan del tema abordado aquí, complete el artículo dando las referencias útiles a su verificabilidad y vinculándolos a las «Notas y referencias»

Cualquier descripción de un fenómeno requiere observar o saber ciertas cosas sobre este fenómeno.

  • Las observaciones disponibles siempre están formadas por un conjunto de observaciones sincrónicas. Por ejemplo: una temperatura, presión y una medición de densidad en un momento dado en un tanque específico. Estas tres variables síncronas se pueden observar varias veces (en varias fechas) en varios lugares (en varios tanques).
  • El conocimiento disponible está compuesto por fórmulas que conectan ciertas variables. Por ejemplo, la ley de gas perfecta PV = nrt { displayStyle pv = nrt}.

Es bastante complicado definir la mejor descripción posible de un fenómeno. Como parte de las estadísticas, será una cuestión de proporcionar toda la información disponible sobre el fenómeno en menos figuras y posibles palabras.

Por lo general, la ley de gas perfecto es una muy buena descripción del fenómeno compuesto por el comportamiento de un equilibrio en equilibrio que solo observamos la presión, la temperatura y el volumen. El valor de la constante r { displayStyle r} puede verse como una estadística asociada con esta descripción.

La cuestión de la descripción visual también surge, pero la dejaremos de lado temporalmente. La visualización de datos de los datos responde más directamente.

¿Qué son los metodos estadísticos descriptivos?

Esta es la suma de todas las observaciones divididas por el número de observaciones (no faltantes). Use la siguiente fórmula para calcular el promedio de cada celda o margen utilizando los datos que corresponden a esta celda o margen.

La mediana es el valor intermedio en un archivo de datos clasificado. En consecuencia, al menos la mitad de las observaciones son menores o iguales a la mediana, y al menos la mitad de las observaciones son mayores o iguales.

Si el número de observaciones en un archivo de datos es impar, la mediana es el valor en el medio. Si el número de observaciones en un archivo de datos es un par, la mediana corresponde al promedio de los dos valores intermedios.

N es extraño
Por ejemplo, cuando n = 5 y usted ha clasificado datos (de lo más bajo a lo más alto), x1, x2, x3, x4 y x5, la mediana = x3.
N es par
Por ejemplo, cuando n = 6 y usted ha clasificado datos (de la más alta a la más alta a la más alta), x1, x2, x3, x4, x5 y x6, luego::

Valor de datos más bajo en una celda o margen de tabla.

Valor de datos más alto en una celda o margen de tabla.

La suma es el total de todos los valores de datos que están en una celda o un margen de tabla.

La desviación estándar es la medición más común de la dispersión o distribución de datos durante el promedio. Cuanto mayor sea la distribución de valores, mayor es la desviación estándar. La desviación estándar se calcula tomando la raíz cuadrada de la varianza.

Artículos Relacionados:

Más posts relacionados:

Deja una respuesta

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *