Estadística descriptiva: Ejemplos y tipos de estadísticas descriptivas

Las estadísticas descriptivas resumen y organizan las características de un conjunto de datos. Un conjunto de datos es una colección de respuestas u observaciones de una muestra o población completa.

En la investigación cuantitativa, después de recopilar datos, el primer paso del análisis estadístico es describir las características de las respuestas, como el promedio de una variable (por ejemplo, edad), o la relación entre dos variables (por ejemplo, edad y creatividad).

El siguiente paso son las estadísticas inferenciales, que lo ayudan a decidir si sus datos confirman o refutan su hipótesis y si es generalizable para una población más grande.

Puede aplicarlos para evaluar solo una variable a la vez, en el análisis univariado, o para comparar dos o más, en el análisis bivariado y multivariado.

  • Ir a una biblioteca
  • Mira una película en un teatro
  • Visite un parque nacional

Su conjunto de datos es la recopilación de respuestas a la encuesta. Ahora puede usar estadísticas descriptivas para descubrir la frecuencia general de cada actividad (distribución), los promedios para cada actividad (tendencia central) y la propagación de respuestas para cada actividad (variabilidad).

Un conjunto de datos se compone de una distribución de valores o puntajes. En tablas o gráficos, puede resumir la frecuencia de cada valor posible de una variable en números o porcentajes.

La (s) desviación estándar (s) estándar es la cantidad promedio de variabilidad en su conjunto de datos. Te dice, en promedio, cuán lejos se encuentra cada puntaje de la media. Cuanto mayor es la desviación estándar, más variable es el conjunto de datos.

¿Qué es la estadística descriptiva e inferencial ejemplos?

Todas las técnicas estadísticas se pueden dividir en dos amplias categorías: estadísticas descriptivas e inferenciales. En esta publicación, exploramos las diferencias entre los dos y cómo afectan el campo del análisis de datos.

Estadísticas. Son el corazón del análisis de datos. Nos ayudan a detectar tendencias y patrones. Nos ayudan a planificar. En esencia, dan vida a los datos y nos ayudan a obtener significado de ellas. Si bien los métodos estadísticos individuales que utilizamos en el análisis de datos son demasiado numerosos para contar, pueden dividirse ampliamente en dos campos principales: estadísticas descriptivas y estadísticas inferenciales. En esta publicación, exploramos la diferencia entre estadísticas descriptivas e inferenciales, y tocamos cómo se usan en el análisis de datos. Rompiremos las cosas en los siguientes trozos del tamaño de un bocado:

Puede parecer tonto definir un concepto como «básico» como estadísticas en un blog de análisis de datos. Sin embargo, cuando usamos estos términos a menudo, es fácil darlos por sentado.

En pocas palabras, las estadísticas es el área de matemáticas aplicadas que se ocupa de la recopilación, organización, análisis, interpretación y presentación de datos. ¿Suena familiar? Debería. Todos estos son pasos vitales en el proceso de análisis de datos. De hecho, en muchos sentidos, el análisis de datos es estadística. Cuando usamos el término «análisis de datos», lo que realmente queremos decir es «el análisis estadístico de un conjunto de datos o conjuntos de datos determinados». Pero eso es un poco bocado, ¡así que tendemos a acortarlo!

¿Qué es estadística descriptiva y inferencial ejemplos?

  • Marca de tiempo: fecha de registro
  • Edad: Edad del encuestado
  • Género: sexo
  • País: País del Demandado
  • Estado: Si vive en los Estados Unidos, ¿en qué estado o territorio vive?
  • Self_Employed: ¿Eres un autoempleado?
  • Family_History: ¿Tiene antecedentes familiares de enfermedad mental?
  • Tratamiento: ¿Ha buscado un tratamiento farmacológico o psicoterapéutico para los problemas de salud mental?
  • Work_interfere: si tiene un problema de salud mental, ¿esto interfiere con su trabajo?
  • NO_EMPLEAES: ¿Cuántos empleados tiene su empresa u organización?
  • Remote_work: ¿trabajos remotos fuera de la oficina durante al menos el 50% del tiempo?
  • Tech_Company: ¿Es su empleador principalmente una empresa o una organización tecnológica?
  • Beneficios: ¿Su empleador ofrece beneficios para la salud mental?
  • Cuidado_options: ¿Conoce las posibilidades de asistencia para la salud mental que ofrece su empleador?
  • Wellness_program: ¿Alguna vez su empleador ha discutido la salud mental como parte de un programa de bienestar para los empleados?
  • Seek_help: ¿Su empleador proporciona recursos para obtener más información sobre los problemas de salud mental y cómo pedir ayuda?
  • Anonimato: ¿Está protegida su anonimato si elige usar recursos para la salud mental o contra el abuso de sustancias?
  • Puente: ¿Qué tan fácil es para usted tomar licencia médica para un problema de salud mental?
  • MentalHealthConsequance: ¿Crees que discutir un problema de salud mental con tu empleador tendría consecuencias negativas?
  • PhyShealthConsequance: ¿Crees que discutir un problema de salud física con tu empleador tendría consecuencias negativas?
  • Compañeros de trabajo: ¿Estarías dispuesto a discutir un problema de salud mental con tus colegas?
  • Supervisor: ¿Estaría dispuesto a discutir un problema de salud mental con sus supervisores directos?
  • MentalHealthInterview: ¿Sentaría un problema de salud mental con un posible empleador en una entrevista?
  • PhyShealthInterview: ¿Saciaría un problema de salud física con un empleador potencial en una entrevista?
  • MentalVSphysical: ¿Crees que su empleador toma la salud mental tanto como la salud física?
  • Obs_Consequice: ¿Has oído o has observado consecuencias negativas para los colegas con problemas de salud mental en el lugar de trabajo?
  • Comentarios: Cualquier nota o comentario adicional

Dado que el análisis observacional y no experimental no es posible establecer relaciones de causalidad entre las variables

Como se puede ver en el siguiente gráfico en la muestra, el número de personas en tratamiento farmacológico o psicoterapéutico que tienen antecedentes familiares de enfermedad mental es mayor que las que son mentalmente saludables:

Encuesta%>%GGPLOT (AES (TRATAMIENTO, FILL = FAMILIA_HISTORY))+GEOM_BAR ()

¿Qué hace la estadística descriptiva?

Las estadísticas descriptivas utilizadas para analizar datos para una variable categórica única incluyen frecuencias, porcentajes, fracciones y/o frecuencias relativas (que son simplemente frecuencias divididas por el tamaño de la muestra) obtenidas de la tabla de distribución de frecuencia de la variable.

Por ejemplo, podemos describir la muestra de datos para la variable de estado marital de la sección anterior seleccionando algunos valores clave de su tabla de distribución de frecuencia, como:

  • (91.3 %) de la muestra son solteros o casados
  • (7 ) Las personas en la muestra identificaron su estado civil como «otro»
  • La frecuencia relativa de las personas en la muestra que están casadas es (0.36 )
  • Sobre ( frac {1} {2} ) de las personas en la muestra son solteras

Si desea practicar el análisis de datos para una sola variable categórica, intente la siguiente actividad:

Los datos continuos para una sola variable también se pueden mostrar en una tabla de distribución de frecuencia, pero los datos primero deben agruparse en contenedores (también conocidos como intervalos de clase). Estos deben elegirse en función de los datos, pero generalmente deben ser del mismo tamaño e idealmente no debería haber demasiados.

Por ejemplo, la siguiente es una tabla de distribución de frecuencia que muestra la frecuencia de las edades de una muestra de 80 personas, una vez que se han ordenado en contenedores:

En cuanto a los gráficos que muestran datos continuos para una sola variable, una de las más utilizadas es un histograma. Estos tienen las siguientes propiedades:

  • (91.3 %) de la muestra son solteros o casados
  • (7 ) Las personas en la muestra identificaron su estado civil como «otro»
  • La frecuencia relativa de las personas en la muestra que están casadas es (0.36 )
  • Sobre ( frac {1} {2} ) de las personas en la muestra son solteras
  • Como la variable es continua, las barras tocan (a menos que un intervalo tenga frecuencia cero);
  • ¿Qué hace estadística descriptiva?

    Las estadísticas descriptivas son un conjunto de técnicas utilizadas para describir las características básicas de los datos recopilados en un experimento/estudio. Proporcionan una síntesis simple de la muestra y las medidas recolectadas.

    La parte de las estadísticas descriptivas es importante porque en la mayoría de los casos no es necesario saber en detalle todos los datos experimentales para inferir algo, pero algunos números son suficientes en los que los datos se han sintetizado previamente.

    Hay dos ramas de estadísticas: estadísticas descriptivas = parte de las estadísticas que, dadas una serie de datos, extraen información de este último; Estadísticas inferenciales (o inductivas) = ​​parte de las estadísticas que, en base al estudio de una muestra, dibuja información sobre los cambios de la muestra en sí.

    Estadísticas: lo que trata: las estadísticas se ocupan del estudio de un fenómeno con el objetivo de resaltar sus aspectos esenciales, posiblemente volver a las leyes que lo regulan. En la mayoría de los casos, representa los medios más efectivos para reducir el margen de incertidumbre de nuestras elecciones.

    La estadística se especializa en recopilar, analizar e interpretar datos numéricos, para facilitar la comprensión de la realidad y proporcionar herramientas objetivas que ayudan al proceso de toma de decisiones por parte de organismos, empresas, etc., etc.

    La representación de datos en estadísticas se realiza a través de tablas y/o gráficos. Los datos sin procesar de una detección estadística no son fácilmente interpretables. Para que la información o el significado de la detección sea comprensible, es necesario operar la síntesis y representación de datos estadísticos.

    ¿Cómo se hace la estadística descriptiva?

    A/ inferencia estadística o «teoría de la estimación»: conocer un
    Muestra, queremos emitir una estimación sobre la población total.
    En este caso, no hay una idea a priori sobre el parámetro que se estimará:
    Construiremos
    Un intervalo de confianza Iα en el umbral α.
    Este intervalo Iα depende de la muestra y contiene, en
    General, el valor del parámetro, excepto en α % de los casos, es
    Di, hay
    Solo α % de las muestras que tienen un Iα que no contiene
    no el parámetro (decimos
    que tenemos un riesgo de error igual a α).

    B/ La prueba de suposición permite saber si existe un acuerdo entre la teoría y
    experiencia.
    En este caso tenemos una idea a priori sobre el valor de que el
    Parámetro: construimos la prueba de hipótesis (dos hipótesis H0 y
    H1 competirá), luego tomamos un
    muestra y miramos si esta muestra verifica la prueba que
    Le permite aceptar o rechazar la hipótesis privilegiada H0.
    Por ejemplo: queremos controlar que corresponde una fabricación
    Bueno, a lo que se ha decidido, ya que hacemos una prueba
    hipótesis, luego probamos la hipótesis H0 en una muestra de la
    producción.
    C/ La prueba de homogeneidad hace posible comparar una distribución
    experimental para una distribución teórica. Observación:
    En a/ y b/ solo comparamos o estimamos los valores
    características como frecuencias o medio, en c/ comparamos dos
    Distribuciones.

    Teorema La probabilidad de que una variable aleatoria x
    difiere de su promedio (en valor absoluto) de al menos k de su brecha
    tipo, es como máximo igual a 1/k2, es decir si x tiene como promedio
    m = e (x) y como desviación estándar σ tenemos:
    Soporte (| x -m | ≥ k σ) ≤ 1 // k2Exemple

    • Lanzamos un dado 100 veces y consideramos un evento:
      Obtenemos 6 o no obtenemos 6.
      Por experiencia hemos obtenido n1 veces el número 6
      Encuentre un aumento en la libertad condicional (| N1/100 —1/6 | ≥ 1/10).

    La probabilidad de tener un 6 es: P = 1/6 y no tener un 6 es 5/6.
    Si existe la variable aleatoria igual a la frecuencia de
    El evento favorable tenemos (y) = P = 1/6 ≃ 0.1666666666667 y
    σ (y) = sqrt (1/6*5/6/100) = sqrt (5)/60 ≃ 0.037267799625
    El teorema de Bienaymé-tchebychef nos dice que: probablemente (| n1/100 —1/6 | ≥ k σ (y)) ≤ 1 // k2
    Estamos buscando k para tener k σ (y) = ksqrt (5)/60≤ 1/10
    Tomamos k = 2.6832815732 porque k≤ 6/sqrt (5) ≃ 2.683281573
    Probablemente (| N1/100 —1/6 | ≥ 1/10) <1/2.682≃ 0.139 Esto significa que: N1/100 está en el intervalo 1/6−1/10≃ 0.06666666666667; 1/6+1/10 ≃ 0.266666666667 Probabilidad 1 - 0.139 = 0.861 o que N1 está en el intervalo 6; 26 con probabilidad 0.861.

    ¿Cómo se realiza la estadística descriptiva?

    Se calculan las estadísticas descriptivas
    por separado para cada variable y dan
    información básica como el promedio,
    valores mínimos y máximos, diferentes medidas para
    dispersión, así como indicaciones en el formulario
    La distribución de la variable. Estas estadísticas son
    presentado en esta introducción (ver también el
    Cuadro de diálogo estadístico
    Descriptivo para una lista completa). Para
    Estadísticas descriptivas, puede seleccionar todo
    Variables de sus datos y producir una tabla
    Estadísticas «descriptivas» secuenciales para estos
    Variables (una variable por línea). Las medidas de dispersión son
    compuesto por la desviación estándar
    y error estándar
    (El error estándar es la desviación estándar de la distribución
    muestreo de un promedio). Muchas pruebas de
    se le ofrece normalidad (la distribución de
    Las variables siguen la distribución
    ¿normal?). Consulte el cuadro de
    Diálogo estadístico
    Descriptivo para una descripción de todas las opciones disponibles.

    Para otras secciones sobre estadísticas descriptivas,
    ver :

    La estadística descriptiva más común es, sin duda, el promedio.
    El promedio brinda información significativa sobre el
    «tendencia central» de una variable proporcionada
    ser pospuesto con sus intervalos
    de confianza. Como ya hemos dicho, nosotros
    A menudo nos interesamos en las estadísticas (como el
    promedio) en una muestra, porque nos permite
    sacar conclusiones sobre la población. Intervalos de confianza
    del promedio nos da un intervalo de valores alrededor del
    promedio en el que podemos esperar encontrar el
    promedio «real» (es decir, el promedio
    de la población, o esperanza matemática), con un
    cierto nivel de error (ver también los conceptos
    Elemental).

    En el módulo de estadísticas
    Primaria, puedes pedir
    Intervalos de confianza para cualquier nivel P
    ; Por ejemplo, si el promedio de la muestra es 23 y si
    Los límites inferiores y superiores del intervalo
    confianza en p =
    0.05 son 19 y 27 respectivamente, podemos deducir eso
    El promedio de la población será el 95% entre
    19 y 27. más nivel P
    es bajo, cuanto más amplio sea el intervalo, lo que aumenta el
    certeza de la estimación, y viceversa; es así
    Pronósticos meteorológicos: más el
    La predicción es «vaga» (es decir más
    el intervalo de confianza es mayor), más probable es que haya tenido
    lograr.

    Tenga en cuenta que el ancho del intervalo de confianza depende de la
    Tamaño de muestra y dispersión de datos.
    Cuanto mayor es el tamaño de la muestra, más promedio
    es confiable. Cuanto mayor sea la dispersión, menos el promedio es confiable
    (Ver también, la sección Concepts
    Elemental). El cálculo de intervalos de
    La confianza se basa en la hipótesis de que la variable se distribuye
    normalmente en la población. La estimación puede ser
    incorrecto cuando esta hipótesis es violada, a menos que
    El tamaño de la muestra es lo suficientemente grande,
    es decir si n =
    100 o más.

    ¿Cómo se hace una estadística?

    Una estadística es, a primera vista, un número calculado sobre una muestra. En general, este es el resultado de aplicar un método estadístico a un conjunto de datos. En el cálculo del promedio aritmético (el promedio aritmético de una serie estadística es el promedio ordinario, es decir…), por ejemplo, el algoritmo consiste en calcular la suma de todos los valores de los datos y ser Dividido por el número (el concepto de número en lingüística se procesa en el artículo «Número…) de los datos. El promedio (el promedio es una medida estadística que caracteriza los elementos de un conjunto de…) es, por lo tanto, una estadística (las estadísticas son una ciencia formal, un método y una técnica. It…). Para ser completado en la descripción del uso de una estadística (una estadística es, a primera vista, un número calculado sobre una muestra…), es necesario describir tanto el procedimiento como el todo (en teoría de conjuntos, Un conjunto intuitivamente designa una colección…) de datos.

    Formalmente, aunque esto rara vez se usa, una estadística es una variable aleatoria (una variable aleatoria es una función definida en todos los resultados posibles de un…) de un tipo particular. De hecho, es una función de un vector (en matemáticas, un vector es un elemento de un espacio vectorial, que permite…) compuesto por varias observaciones (la observación es la acción del monitoreo atento de los fenómenos, sin la voluntad de… ) una ley. Esto permite, entre otras cosas, extender a las estadísticas un cierto número de resultados en variables aleatorias, entre otras cosas, la naturaleza independiente de dos estadísticas o calcular las densidades de estadísticas.

    Entre las estadísticas, un determinado número tiene propiedades específicas que sirven (servir es la contracción del servidor de palabras y el cliente). Entre otras cosas en la inferencia estadística (la inferencia estadística consiste en inducir las características desconocidas de una población en…) para la estimación estadística . Los estimadores se utilizan, como su nombre indica, para estimar los parámetros estadísticos. La optimización de estos estimadores también puede involucrar estadísticas auxiliares que verifican ciertas propiedades y que permiten converger estos estimadores más rápido.

    En estadísticas inferenciales (la inferencia estadística consiste en inducir las características desconocidas de una población a…), un estimador es un valor calculado en una muestra (en general, una muestra es una pequeña cantidad de material, d ‘información o. ..) y que esperamos ser una buena evaluación del valor que habríamos calculado sobre la población total. Estamos buscando un estimador para estar sin sesgo, converge (
    En astronautia, converge
    en matemáticas,
    suite convergente
    serie convergente
    …), eficiente y robusto.

    • Converge IF: tiende en probabilidad (la probabilidad (de las probabilitas latinas) es una evaluación del carácter probable de A…) hacia θ cuando aumenta el número de observaciones. Cuanto mayor sea el número de observaciones, más cerca nos acercamos al valor verdadero. Esta propiedad de un estimador es esencial si queremos poder estimar con gran precisión el parámetro (un parámetro es, en el sentido amplio, un elemento de información a tener en cuenta…) θ. De hecho, si este es el caso, para aumentar la precisión del estimador, será suficiente para realizar más medidas.
    • Sin un sesgo si: podemos ver un estimador sin un ángulo como un estimador para el cual no cometimos un error sistemático (en ciencias de la vida y en la historia natural, lo sistemático es la ciencia que tiene para…) para un tamaño de Dada la muestra (en tecnologías de información (TI), los datos son una descripción elemental, a menudo…). Por el contrario, para un estimador que tendría un sesgo, por ejemplo, podría haber valores del parámetro θ para los cuales uno consideraría o sistemáticamente bajo la grandeza que buscamos evaluar. Corresponde a él sin prejuicios que generalmente consideramos la varianza (
      En estadísticas y probabilidad, varianza
      En termodinámica, varianza
      ) cuando tienes observaciones por y no por σ2, por ejemplo.

    Estas dos propiedades son esenciales y, como regla general, consideramos que todo (todo incluido como un conjunto de lo que existe a menudo se interpreta como el mundo o…) Estimador debe verificar al menos estas dos propiedades para que podamos considerarlo lo suficientemente suficientemente preciso. También podemos querer que un estimador sea efectivo (es decir, la estimación que proporciona varía lo menos posible (alrededor del nombre que la nomenclatura aviar en francés (actualización) da…) del valor que se estimará) o robusto (es decir, no es muy sensible a las variaciones de una medida en la n). Estas dos propiedades se detallan más bajos en las secciones de optimización y robustez del estimador.

    Artículos Relacionados:

    Related Posts

    Deja una respuesta

    Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *