¿Qué es la distribución normal y cuáles son sus características?

En nuestra discusión anterior de las estadísticas descriptivas, introdujimos la media como una medida de tendencia y varianza central y desviación estándar como medidas de variabilidad. Ahora podemos usar estos parámetros para responder preguntas relacionadas con la probabilidad.

Para una variable normalmente distribuida en una población, la media es la mejor medida de tendencia central, y la (s) desviación (s) estándar (s) estándar proporciona una medida de variabilidad.

La notación para una muestra de una población es ligeramente diferente:

Podemos usar la desviación media y estándar para manejar la probabilidad. Resulta que, como se demuestra en la figura a continuación,

  • Aproximadamente el 68% de los valores en la distribución están dentro de 1 DE de la media, es decir, arriba o abajo.
  • Aproximadamente el 95% de los valores en la distribución están dentro de 2 DE de la media.
  • Aproximadamente el 99% de los valores en la distribución se encuentran dentro de 3 DE de la media.

Hay muchas variables que normalmente se distribuyen y pueden modelarse en función de la media y la desviación estándar. Por ejemplo,

  • Aproximadamente el 68% de los valores en la distribución están dentro de 1 DE de la media, es decir, arriba o abajo.
  • Aproximadamente el 95% de los valores en la distribución están dentro de 2 DE de la media.
  • Aproximadamente el 99% de los valores en la distribución se encuentran dentro de 3 DE de la media.
  • IMC: µ = 25.5, σ = 4.0
  • BP sistólica: µ = 133, σ = 22.5
  • NACIMIENTO WGT. (gms) µ = 3300, σ = 500
  • NACIMIENTO WGT. (lbs) µ = 7.3, σ = 1.1
  • La capacidad de abordar la probabilidad es complicada al tener muchas distribuciones con diferentes medios y diferentes desviaciones estándar. La solución a este problema es proyectar estas distribuciones en una distribución normal estándar que facilitará la calcular las probabilidades.

    ¿Cómo se caracteriza una distribución?

    Estos son todos los puntajes de la ronda final de los 77 golfistas que
    partidario. En otras palabras, esta es la distribución de la ronda final
    puntuaciones.

    Es difícil tener una idea de la distribución general simplemente mirando
    en los puntajes RAW. En cambio, utilizamos varios métodos estadísticos descriptivos
    Para resumir, simplificar y describir la distribución.

    Se utilizan 3 características que describen completamente una distribución:
    forma, tendencia central y variabilidad. Estaremos hablando
    sobre la tendencia central (aproximadamente, el centro de la distribución) y
    Variabilidad (qué tan amplia es la distribución) en futuros capítulos.

      La asimetría y la curtosis no se usan típicamente en psicología
      excepto como descripciones generales de distribuciones. Entonces no discutiremos como
      para calcular estas estadísticas numéricamente.

    En una distribución simétrica, es
    posible dibujar una línea vertical a través del medio para que un lado de
    La distribución es una imagen de espejo exacta del otro.

      Nota: En las figuras a continuación, la distribución normal se presenta en
      rojo para comparación.

    En una distribución sesgada, los puntajes tienden a acumularse hacia
    Un extremo de la escala y disminuir gradualmente en el otro extremo.

    La sección donde los puntajes disminuyen hacia un extremo de una distribución
    se llama la cola de la distribución.

      Se dice que una distribución sesgada con la cola en el lado derecho
      sesgado positivamente (porque la cola apunta hacia positivo
      números). Si la cola apunta a la izquierda, entonces se dice la distribución
      ser ascilado negativamente.

    ¿Cómo se caracteriza la distribución normal?

    Este texto hablará de la distribución normal o gaussiana, sus propiedades y su uso. En la primera parte, discutí cómo es posible obtener la distribución gaussiana de la distribución binomial. ¿Recuerdas el ejemplo de la nuez, ¿verdad?

    Comencemos este camino antes que todo recordando lo que es. La distribución gaussiana es una distribución de probabilidad, continúa, simétrica y completamente determinada por dos parámetros que son el promedio de $$ mu $$ y la desviación estándar $$ sigma $$. El promedio es simplemente la suma de los casos individuales dividió los casos de submade, y la desviación estándar indica la dispersión de los valores alrededor del promedio. Antes de discutir los detalles, comencemos con un ejemplo.

    Uno de los ejemplos es la distribución de las alturas de los hombres. Esta variable sigue una distribución gaussiana y si consideramos a la población de adultos italianos en 2015, esta distribución se caracteriza por un promedio de 175 cm y una desviación estándar de 10 cm.

    Esta curva representa la distribución de alturas. En el eje de abscisa hay alturas x, en el orden de las ordenadas hay probabilidad p (x)

    Pero que significa todo esto? ¿Qué información nos dan estos dos parámetros y esta función?

    Lo que nos dice es esencialmente la probabilidad de que, al tomar al azar a un hombre adulto italiano, esto tiene una cierta altura. Más específicamente, la probabilidad de que un individuo elegido al azar sea $$ 175 pm 10 $$ cm es del 68%, que es $$ 175 pm 20 $$ cm es 95% y $$ 175 pm 30 $$ cm Es 99%. Por lo tanto, habrá entendido la regla: los diversos ejemplos informados no son más que $$ mu pm sigma $$, $$ mu pm 2 sigma $$ e $$ mu pm 3 sigma $$ . Estos son solo algunos de los valores, hay tablas para cualquier desviación con un valor promedio. La razón del hecho parece que este $$ PM $$ se debe al hecho de que la distribución es simétrica en torno al valor promedio.

    ¿Cómo identificar una distribución?

    Tengo un conjunto de datos y me gustaría descubrir qué distribución se ajusta mejor a mis datos.

    Utilicé la función FitDistr () para estimar los parámetros necesarios para describir la distribución supuesta (es decir, Weibull, Cauchy, Normal). Usando esos parámetros, puedo realizar una prueba de Kolmogorov-Smirnov para estimar si mis datos de muestra son de la misma distribución que mi distribución supuesta.

    Si el valor p es> 0.05, puedo suponer que los datos de la muestra se extraen de la misma distribución. Pero el valor p no proporciona ninguna información sobre la división del ajuste, ¿no?

    Entonces, en caso de que el valor p de mis datos de muestra sea> 0.05 para una distribución normal, así como una distribución de Weibull, ¿cómo puedo saber qué distribución se ajusta mejor a mis datos?

    Los valores p son 0.8669 para la distribución de Weibull y 0.5522 para la distribución normal. Por lo tanto, puedo suponer que mis datos siguen a un Weibull y una distribución normal. Pero, ¿qué función de distribución describe mejor mis datos?

    Refiriéndose a Elevendollar encontré el siguiente código, pero no sé cómo interpretar los resultados:

    • Los valores de $ P $ de una prueba de kolmovorov-smirnov (prueba KS) con parámetros estimados pueden ser bastante incorrectos porque el valor p no tiene en cuenta la incertidumbre de la estimación. Entonces, desafortunadamente, no puede simplemente ajustar una distribución y luego usar los parámetros estimados en una prueba de kolmogorov-smirnov para probar su muestra. Existe una prueba de normalidad llamada Test Lilliefors, que es una versión modificada de la prueba KS que permite parámetros estimados.

    ¿Qué es la distribución normal y ejemplos?

    La distribución normal se usa ampliamente para comprender las distribuciones de factores en la población. Debido a que la distribución normal se aproxima a muchos fenómenos naturales tan bien, se ha convertido en un estándar de referencia para muchos problemas de probabilidad.

    La distribución normal/gaussiana es un gráfico en forma de campana que abarca dos términos básicos: media y desviación estándar. Es una disposición simétrica de un conjunto de datos en el que la mayoría de los valores se agrupan en la media y el resto disminuye simétricamente hacia cualquier extremo. Numerosos factores genéticos y ambientales influyen en el rasgo.

    La distribución normal sigue la teoría del límite central que establece que varios factores independientes influyen en un rasgo particular. Cuando todos estos factores independientes contribuyen a un fenómeno, su suma normalizada tiende a dar como resultado una distribución gaussiana.

    La media de la distribución determina la ubicación del centro del gráfico, y la desviación estándar determina la altura y el ancho del gráfico y el área total bajo la curva normal es igual a 1.

    Entendamos los ejemplos de la vida diaria de distribución normal.

    La altura de la población es el ejemplo de distribución normal. La mayoría de las personas en una población específica son de altura promedio. La cantidad de personas más alta y más corta que la altura promedio de las personas es casi igual, y un número muy pequeño de personas son extremadamente altos o extremadamente cortos. Sin embargo, la altura no es una sola característica, varios factores genéticos y ambientales influyen en la altura. Por lo tanto, sigue la distribución normal.

    ¿Qué es la distribución normal ejemplos?

    Una distribución normal o distribución gaussiana se refiere a una distribución de probabilidad donde los valores de una variable aleatoria se distribuyen simétricamente. Estos valores se distribuyen igualmente en el lado izquierdo y derecho de la tendencia central. Por lo tanto, se forma una curva en forma de campana.

    Los posibles resultados de la función se dan en términos de números reales completos que se encuentran entre -∞ a +∞. Las colas de la curva de campana se extienden en ambos lados de la tabla (+/-) sin límites.

    • Aproximadamente el 68% de todas las observaciones caen dentro de +/- una desviación estándar (σ).
    • Alrededor del 95% de todas las observaciones caen dentro de +/- dos desviaciones estándar (σ).
    • Casi el 99.7% de todas las observaciones caen dentro de +/- tres desviaciones estándar (σ).

    La distribución normal tiene las siguientes características que lo distinguen de las otras formas de representaciones de probabilidad:

    • Aproximadamente el 68% de todas las observaciones caen dentro de +/- una desviación estándar (σ).
    • Alrededor del 95% de todas las observaciones caen dentro de +/- dos desviaciones estándar (σ).
    • Casi el 99.7% de todas las observaciones caen dentro de +/- tres desviaciones estándar (σ).
  • Regla empírica: en una distribución normal, el 68% de las observaciones se limitan dentro de -/+ una desviación estándar, el 95% de los valores caen dentro de -/+ dos desviaciones estándar, y casi el 99.7% de los valores se limitan a -/+ tres desviaciones estandar.
  • ¿Qué es la distribución normal y sus características?

    Nota. Por razones de síntesis, algunas tablas de conversión comienzan desde el valor central (0) y muestran solo los valores positivos de z porque los valores negativos son valores opuestos simples (-Z). Los valores son siempre los mismos. Sin embargo, si usa estas tablas, debe considerar que algún paso aritmético cambia para calcular el área bajo la curva gaussiana.
    Por ejemplo, en este caso φ (z = 1) es igual a 0.34134 porque comienza desde cero. Por lo tanto, para calcular la probabilidad acumulada, también es necesario agregar el área a la izquierda de cero, que es igual a 0.5. Por lo tanto, la probabilidad acumulativa de z = 1 es 0.34134+0.5 = 0.84134. La devolución de las cuentas. ¿Cómo lees la mesa? Por ejemplo, para encontrar el valor asociado con Z = 1.55. Busque la línea Z = 1.5 y luego fluya hacia la derecha hasta Colonna 5 (es decir, +0.05). La celda indica el valor asociado con z = 1.55 que en este caso es 0.4394. Para encontrar el valor negativo, se usa el mismo método, agregando menos signo frente al valor o -0.4394. En ambos casos, debe agregar +0.5 al valor que recién encontrado para obtener la probabilidad de comulata φ o 0.5 +0.4394 = 0.9394 (para z = 1.55) y 0.5-0.4394 = 0.0606 (para z = -1.55).

    Cómo convertir una distribución normal en una distribución normal estandarizada

    Cualquier distribución normal se puede convertir en una distribución normal estandarizada mediante el uso de una variable en las unidades estándar (z).

    Donde x es el valor de la variable, μ es el promedio y σ es la desviación estándar.

    ¿Cómo se explica la distribución normal?

    Distribución normal, también llamada distribución gaussiana, la función de distribución más común para variables independientes generadas aleatoriamente. Su curva familiar en forma de campana es ubicua en los informes estadísticos, desde el análisis de la encuesta y el control de calidad hasta la asignación de recursos.

    El gráfico de la distribución normal se caracteriza por dos parámetros: la media o promedio, que es el máximo del gráfico y sobre el cual el gráfico siempre es simétrico; y la desviación estándar, que determina la cantidad de dispersión lejos de la media. Una pequeña desviación estándar (en comparación con la media) produce un gráfico empinado, mientras que una gran desviación estándar (nuevamente en comparación con la media) produce un gráfico plano. Ver la figura.

    La distribución normal es producida por la función de densidad normal, p (x) = e− (x – μ) 2/2σ2/σsquare raíz de √2π. En esta función exponencial está la constante 2.71828…, es la media, y σ es la desviación estándar. La probabilidad de una variable aleatoria que cae dentro de cualquier rango de valores dado es igual a la proporción del área encerrada bajo el gráfico de la función entre los valores dados y por encima del eje x. Debido a que el denominador (raíz σsquare de √2π), conocida como el coeficiente de normalización, hace que el área total encerrada por el gráfico sea exactamente igual a la unidad, las probabilidades se pueden obtener directamente del área correspondiente, es decir, un área de 0.5 corresponde a una probabilidad de 0.5. Aunque estas áreas se pueden determinar con el cálculo, las tablas se generaron en el siglo XIX para el caso especial de = 0 y σ = 1, conocido como la distribución normal estándar, y estas tablas se pueden usar para cualquier distribución normal después de que las variables sean adecuadamente reescalado restando su media y dividiendo por su desviación estándar, (x – μ)/σ. Las calculadoras ahora han eliminado el uso de tales tablas. Para obtener más detalles, la teoría de la SEPROBITability.

    El término «distribución gaussiana» se refiere al matemático alemán Carl Friedrich Gauss, quien primero desarrolló una función exponencial de dos parámetros en 1809 en relación con los estudios de errores de observación astronómicos. Este estudio llevó a Gauss a formular su ley de error de observación y avanzar la teoría del método de aproximación de mínimos cuadrados. Otra aplicación temprana famosa de la distribución normal fue por el físico británico James Secretario Maxwell, quien en 1859 formuló su ley de distribución de velocidades moleculares: Generalizado como la Ley de Distribución de Maxwell-Boltzmann.

    ¿Cómo explicar la distribución normal?

    La distribución normal es la distribución más común de todas. Sus valores adquieren esa forma familiar de campana, con más valores cerca del centro y menos a medida que te alejas. Resuelva los siguientes problemas sobre la definición de la distribución normal y cómo se ve.

    (C) Los valores más comunes están cerca de la media; Los valores menos comunes están más lejos de él.

    (D) La desviación estándar marca la distancia desde la media hasta el punto de inflexión.

    Las propiedades de la distribución normal son que es simétrica, media y mediana son los mismos, los valores más comunes son cerca de la media y los valores menos comunes están más lejos de ella, y la desviación estándar marca la distancia desde la media hasta el punto de inflexión.

    En una distribución normal, ¿sobre qué porcentaje de los valores se encuentran dentro de una desviación estándar de la media?

    La regla empírica (también conocida como la regla 68-95-99.7) dice que aproximadamente el 68% de los valores en una distribución normal están dentro de una desviación estándar de la media.

    En una distribución normal, ¿sobre qué porcentaje de los valores se encuentran dentro de dos desviaciones estándar de la media?

    La regla empírica (también conocida como la regla 68-95-99.7) dice que aproximadamente el 95% de los valores en una distribución normal están dentro de dos desviaciones estándar de la media.

    En una distribución normal, ¿sobre qué porcentaje de los valores se encuentran dentro de tres desviaciones estándar de la media?

    La regla empírica (también conocida como la regla 68-95-99.7) dice que aproximadamente el 99.7% de los valores en una distribución normal están dentro de tres desviaciones estándar de la media.

    ¿Cómo interpretar una curva de distribución normal?

    La distribución normal adquiere un papel muy importante y una función fundamental en el campo de las estadísticas y los cálculos de probabilidad.
    De hecho, la distribución normal, que también se conoce con el nombre de la distribución gaussiana, representa la distribución principal de la probabilidad de las variables continuas.

    A través de esta guía simple y rápida, puede aprender a leer la tabla de distribución estandarizada normal.
    Las indicaciones de lectura y cálculo que ilustraremos serán útiles si se requiere la ejecución de exámenes o tareas particulares de estadísticas escolares y universitarias.
    Entonces, veamos el procedimiento correcto que se adoptará.

    En primer lugar, debe decirse que la curva normal (distribución) puede leerse matemáticamente a través de una fórmula específica.
    Los dos valores de referencia para hacerlo son el promedio y los desechos, también llamados «desviación estándar».

    El promedio en la curva simétrica de la distribución normal corresponde al eje central de simetría de la curva en sí.
    El desperdicio o desviación estándar, por otro lado, está dada por la distancia entre el promedio (el eje central) y el punto flexible de la curva, que sería el punto donde la curva cambia su misma curvatura.

    Lectura de una tabla de una distribución normal estandarizada significa, por lo tanto, identifica y calcula los valores de la probabilidad en comparación con los intervalos precisos de valores, informándolos dentro de ciertas tablas.

    ¿Cuándo se aplica distribución normal?

    • Reconoce la distribución de probabilidad normal y aplíquela adecuadamente.
    • Reconoce la distribución de probabilidad normal estándar y aplíquela adecuadamente.
    • Compare las probabilidades normales convirtiendo la distribución normal estándar.

    Lo normal, una distribución continua, es la más importante de todas las distribuciones. Es ampliamente utilizado y aún más abusado. Su gráfico tiene forma de campana. Ves la curva de campana en casi todas las disciplinas. Algunos de estos incluyen psicología, negocios, economía, ciencias, enfermería y, por supuesto, matemáticas. Algunos de sus instructores pueden usar la distribución normal para ayudar a determinar su calificación. La mayoría de los puntajes de IQ normalmente se distribuyen. A menudo, los precios inmobiliarios se ajustan a una distribución normal. La distribución normal es extremadamente importante, pero no se puede aplicar a todo en el mundo real.

    En este capítulo, estudiará la distribución normal, la distribución normal estándar y las aplicaciones asociadas con ellos. La distribución normal tiene dos parámetros (dos medidas descriptivas numéricas), la media ( ( mu )) y la desviación estándar ( ( sigma )). Si (x ) es una cantidad a medir que tiene una distribución normal con media ( ( mu )) y desviación estándar ( ( sigma )), designamos esto escribiendo escribiendo

    La función de densidad de probabilidad es una función bastante complicada. No lo memorice. No es necesario.

    ¿Cuándo se puede aplicar la distribución normal?

    • Cuando los datos se agrupan alrededor de la media y existe una probabilidad igual de estar por encima o por debajo de la media (50% por encima y 50% por debajo del promedio).
    • Si podemos transformar los datos para que se comporten como una distribución normal, ¡hazlo! Mucho más fácil trabajar con datos de esta forma.
    • Ex. Si tenemos que tomar el registro de valores, o restar un número, o realizar alguna otra operación en los datos, hágalo.

    Las ecuaciones de población son diferentes de las ecuaciones de muestra porque deseamos reducir los «grados de libertad» o aumentar nuestra confianza en la muestra.

    No desea ajustar un proceso continuo para «centrarlo». Esto aumenta la variación. Cuanto más hagas esto, más influye el operador en el proceso y menos la distribución se dará forma a una campana. Ver demostración de Quincunx.

    El pico de la curva normal es una indicación del promedio, que es el centro de la variación del proceso.

    Cuando tienes una curva en forma de campana, ninguna de las 5 ms o una P influye indebidamente en el proceso.

    En el párrafo dos, describe «calificar en una curva», pero tradicionalmente las escuelas (especialmente las escuelas de derecho) centraron las curvas a mediados de C con un 10% obteniendo un A y 10% obteniendo una F. Esta técnica rara vez se usa fuera de las escuelas de derecho y Cuando lo es, generalmente se centra en un punto ligeramente más alto (como una baja B) debido a la inflación de grado que hemos visto en los últimos 40 años. Si lo desea, incluida la información sobre esto podría ser divertido. Lo que ya tienes tiene el punto importante para el lector. Sin embargo, antes de seguir adelante, aquí hay dos ejemplos de «calificar en una curva».

    ¿Cuándo es distribución normal o no normal?

    • 1 Psicología Social y Psicología Cuantitativa, Facultad de Psicología, Universidad de Barcelona, ​​Barcelona, ​​España
    • 2instituto de Neurociences, Universidad de Barcelona, ​​Barcelona, ​​España
    • 3psicobiología y metodología de ciencias del comportamiento, Facultad de Psicología, Universidad de Málaga, Málaga, España

    El análisis estadístico es crucial para la investigación y la elección de la técnica analítica debe tener en cuenta la distribución específica de los datos. Aunque los datos obtenidos de la investigación en salud, educativa y de ciencias sociales a menudo no se distribuyen normalmente, hay muy pocos estudios que detallan qué distribuciones tienen más probabilidades de representar datos en estas disciplinas. El objetivo de esta revisión sistemática fue determinar la frecuencia de la aparición de las distribuciones no normales más comunes en las ciencias de la salud, la educación y las sociales. La búsqueda se llevó a cabo en la base de datos de la Web of Science, de la cual recuperamos los resúmenes de los documentos publicados entre 2010 y 2015. La selección se realizó sobre la base del título y el resumen, y fue realizado de forma independiente por dos revisores. La confiabilidad entre evaluadores para la selección del artículo fue alta (Kappa de Cohen = 0.84), y el acuerdo con respecto al tipo de distribución alcanzó el 96.5%. Se incluyeron un total de 262 resúmenes en la revisión final. La distribución de la variable de respuesta se informó en 231 de estos resúmenes, mientras que en el 31 restantes se afirmó simplemente que la distribución no era normal. En términos de su frecuencia de apariencia, las distribuciones no normales más comunes se pueden clasificar en orden descendente de la siguiente manera: gamma, binomial negativo, multinomial, binomial, lognormal y exponencial. Además de identificar las distribuciones más utilizadas en los estudios empíricos, estos resultados ayudarán a los investigadores a decidir qué distribuciones deben incluirse en los estudios de simulación que examinen los procedimientos estadísticos.

    Los datos obtenidos en muchos campos de salud, educación y ciencias sociales producen valores de asimetría y curtosis que se desvían claramente de los de la distribución normal (Micceri, 1989; Lei y Lomax, 2005; Bauer y Sterba, 2011; Blanca et al. ., 2013). En su artículo titulado imaginativamente «The Unicornio, la curva normal y otras criaturas improbables», Micceri (1989) concluyó que los datos reales comúnmente siguen distribuciones no normales. Su análisis de las características de distribución de más de 440 logros de muestras grandes y medidas psicométricas reveló varias clases de desviación de la distribución normal, con el porcentaje más alto correspondiente a la desviación extrema. En un estudio más reciente, Blanca et al. (2013) analizaron la forma de 693 distribuciones de datos psicológicos reales al examinar los valores de los momentos centrales del tercer y cuarto y cuarto como una medición de asimetría y curtosis en pequeñas muestras. Descubrieron que la mayoría de las distribuciones no eran normales; Considerando la asimetría y la curtosis conjuntamente, los resultados indicaron que solo el 5.5% de las distribuciones estaban cerca de los valores esperados bajo normalidad. En general, el 74.4% de las distribuciones presentaron desviación leve o moderada, mientras que el 20% mostró una desviación más extrema.

    Aunque hay una amplia variedad de distribuciones de probabilidad, las distribuciones más utilizadas que involucran datos reales son mucho menos en número. El conjunto de distribuciones exponenciales es muy común en las disciplinas asociadas con la salud y las ciencias sociales. La familia exponencial incluye las distribuciones normales, exponenciales, gamma, beta y lognormales como continuas, y el binomial binomial, multinomial y negativo como distribuciones discretas. La distribución lognormal, por ejemplo, se encuentra con frecuencia en medicina, ciencias sociales y economía (Limpert et al., 2001).

    Artículos Relacionados:

    Más posts relacionados:

    Deja una respuesta

    Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *