Estadística descriptiva: la introducción

  • Introducción
  • Medida de tendencia central (media, modo, mediana)
  • Medidas de variabilidad (rango, IQR, varianza, desviación estándar)
  • Probabilidad (ensayos de Bernoulli, distribución normal)
  • Teorema del límite central
  • Puntajes z

En las estadísticas descriptivas que está describiendo, presentando, resumiendo y organizando sus datos, ya sea a través de cálculos numéricos o gráficos o tablas. Algunas de las mediciones comunes en las estadísticas descriptivas son la tendencia central y otras la variabilidad del conjunto de datos.

El análisis estadístico descriptivo nos ayuda a comprender nuestros datos y es una parte muy importante del aprendizaje automático. Hacer un análisis estadístico descriptivo de nuestro conjunto de datos es absolutamente crucial. Mucha gente se salta esta parte y, por lo tanto, pierde una gran visión valiosa sobre sus datos, lo que a menudo conduce a conclusiones incorrectas.

Describe un conjunto completo de datos con un solo valor que representa el centro de su distribución. Hay tres medidas principales de tendencia central:

  • Introducción
  • Medida de tendencia central (media, modo, mediana)
  • Medidas de variabilidad (rango, IQR, varianza, desviación estándar)
  • Probabilidad (ensayos de Bernoulli, distribución normal)
  • Teorema del límite central
  • Puntajes z
  • Media: es la suma de la observación dividida por el tamaño de la muestra. No es una estadística sólida, ya que se ve afectada por valores extremos. Por lo tanto, un valor muy grande o muy bajo (es decir, valores atípicos) puede distorsionar la respuesta.
  • Mediana: es el valor medio de los datos. Dirige los datos por la mitad y también se llama percentil 50. Está mucho menos afectado por los valores atípicos y los datos sesgados que la media. Si el no. De los elementos en el conjunto de datos es extraño, el elemento más intermedio es la mediana. Si el no. De los elementos en el conjunto de datos es uniforme, la mediana sería el promedio de dos elementos centrales.
  • Modo: es el valor que ocurre con más frecuencia en un conjunto de datos. Por lo tanto, un conjunto de datos no tiene modo, si ninguna categoría es la misma y también es posible que un conjunto de datos tenga más de un modo. Es la única medida de tendencia central la que puede usarse para variables categóricas.
  • Las medidas de variabilidad también conocidas como propagación de los datos describen cuán similares o variadas son el conjunto de observaciones. Las medidas de variabilidad más populares son el rango, el rango intercuartil (IQR), la varianza y la desviación estándar.

    ¿Qué es la estadística descriptiva introduccion?

    Las estadísticas descriptivas resumen, muestran y analizan los datos y lo hacen más comprensible. Si el conjunto de datos es grande, es difícil dar sentido a los datos sin procesar. Utilizando técnicas de estadísticas descriptivas, los datos pueden volverse más claros, pueden surgir patrones y algunas conclusiones pueden ser evidentes.

    Pero las estadísticas descriptivas no nos permiten llegar a ninguna conclusión más allá de esa parte del análisis. No confirma ninguna hipótesis que hemos hecho. Debe estudiar estadísticas inferenciales para eso. He agregado algunos enlaces para estudiar estadísticas inferenciales al final de esta página.

    Hay algunos tipos generales de medidas estadísticas para describir los datos:

    • Resumen de cinco números: primer cuartil, segundo cuartil, tercer cuartil, mínimo y máximo
    • La forma de los datos: simétrico, izquierda_skewed y sesgo derecho.

    En este artículo, explicaré las cuatro medidas estadísticas y sus propiedades.

    Hay tres medidas comunes que indican el centro del conjunto de datos. Esos se llaman la medida de la tendencia central.

    Este es el más básico. Probablemente la mayoría de ustedes ya lo saben.

    Calculamos la media sumando todos los valores y luego la dividimos por el número de valores. Aquí hay un conjunto de datos de ejemplo:

    La media del conjunto de datos es sensible a los valores extremos. Por ejemplo, en el conjunto de datos anterior si hay un valor más como este:

    La media cambió drásticamente debido a ese valor. La media se vuelve mucho más grande que el resto de los valores del conjunto de datos, excepto que 150. No representa el conjunto de datos total.

    ¿Cómo se define la estadística descriptiva?

    Como se mencionó anteriormente, las estadísticas descriptivas resumen las distribuciones de datos, es decir, le proporcionan un resumen de cómo se presentan los valores de una variable o una variable dada. Podemos distinguir tres tipos de resúmenes de estadísticas descriptivas, como veremos a continuación.

    Estos coeficientes dan una cierta idea del punto de datos «más típico» o «más representativo». Por ejemplo, en una escala de calificación de 0 a 100, el estudiante promedio tendría 80 puntos.

    • El promedio es la medida más común. Calcular un promedio solo tiene sentido para las variables a intervalos.
    • La mediana es el punto de datos que se encuentra en el medio de los valores «bajos» y «altos», es decir, casi el 50% de la muestra tiene valores más altos y casi el 50% tiene valores más bajos. También se puede usar con las variables a intervalos como con las variables ordinales.
    • El modo es el valor encontrado con mayor frecuencia, es decir, el punto más alto en un histograma o el sector más grande de un diagrama circular. Para ser utilizado con variables nominales u ordinales.

    Los promedios son significativos solo para datos a intervalos; La mediana se puede usar tanto para intervalos como para datos ordinales. Puede usar el modo para cualquier escala, pero generalmente se usa con datos ordinales y nominales.

    ¿Qué es estadística descriptiva concepto?

    Para resumir la información, se diseñaron diferentes fórmulas que ofrecían medidas de cierto tipo. Por lo tanto, hay quienes nos ofrecen información sobre el centro, otros sobre la dispersión o variabilidad y otros en la posición de un valor.

    • Medidas centrales de moda: llamado así porque proporcionan información sobre el centro de datos. Por ejemplo, el promedio es una medida de la tendencia o la posición central, ya que el promedio nos proporciona un valor centrado de la base de datos. ¿Dónde podríamos decir que el punto medio está ubicado? En el centro, aproximadamente la mitad. Otro ejemplo de una medida de tendencia central es la mediana.
    • Medidas de dispersión: también se conocen como medidas de variabilidad. Por ejemplo, la desviación estándar es una medida de variabilidad, ya que nos dice si los valores de un conjunto de datos son muy dispares o no. Otros dos ejemplos de medidas de dispersión podrían ser la varianza y el intervalo estadístico.
    • Medidas de posición: no son los más conocidos, pero se usan con frecuencia. Un ejemplo de esto se encuentra en percentiles o deciles. Cuando se encuentra una cifra específica en el percentil 90, significa que el 90% de los datos están por debajo de esos datos. Hay otras medidas de posición, como cuartos o algunas variantes, como el primer trimestre.

    También es interesante ver cómo se distribuyen las frecuencias. Para esto, hay algunos conceptos que debemos saber:

    • Medidas centrales de moda: llamado así porque proporcionan información sobre el centro de datos. Por ejemplo, el promedio es una medida de la tendencia o la posición central, ya que el promedio nos proporciona un valor centrado de la base de datos. ¿Dónde podríamos decir que el punto medio está ubicado? En el centro, aproximadamente la mitad. Otro ejemplo de una medida de tendencia central es la mediana.
    • Medidas de dispersión: también se conocen como medidas de variabilidad. Por ejemplo, la desviación estándar es una medida de variabilidad, ya que nos dice si los valores de un conjunto de datos son muy dispares o no. Otros dos ejemplos de medidas de dispersión podrían ser la varianza y el intervalo estadístico.
    • Medidas de posición: no son los más conocidos, pero se usan con frecuencia. Un ejemplo de esto se encuentra en percentiles o deciles. Cuando se encuentra una cifra específica en el percentil 90, significa que el 90% de los datos están por debajo de esos datos. Hay otras medidas de posición, como cuartos o algunas variantes, como el primer trimestre.
  • Frecuencia absoluta: es el número total de veces en las que se repite una observación. Las observaciones a veces se pueden presentar a intervalos.
  • Frecuencia relativa: es el número de porcentaje de repetición de una observación o un conjunto de ellos.
  • Frecuencia acumulada: se puede acumular relativo o acumulado absoluto. Indica la cantidad acumulada hasta una determinada observación.
  • Aunque las tablas y los gráficos no son exclusivos de las estadísticas descriptivas, las caracterizan. En relaciones, estudios e investigaciones, el uso de gráficos es muy común. Nos ayudan a mostrar información de una manera más simple y limitada.

    Por supuesto, dentro de las tablas y gráficos hay una inmensa cantidad de tipos. A continuación se presentan algunos ejemplos de gráficos y tablas utilizadas con frecuencia.

    Artículos Relacionados:

    Más posts relacionados:

    Deja una respuesta

    Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *