¿Qué distribución normal corresponde a las siguientes propiedades?

Una forma de descubrir cómo se distribuyen los datos es trazarlos en un gráfico. Si los datos se distribuyen uniformemente, puede encontrar una curva de campana. Una curva de campana tiene un pequeño porcentaje de los puntos en ambas colas y el mayor porcentaje en la parte interna de la curva. En el modelo normal estándar, aproximadamente el 5 por ciento de sus datos caerían en las «colas» (naranja más oscura de color en la imagen a continuación) y el 90 por ciento estará en el medio. Por ejemplo, para los puntajes de los estudiantes de los estudiantes, la distribución normal mostraría que el 2.5 por ciento de los estudiantes obtienen puntajes muy bajos y el 2.5 por ciento obteniendo puntajes muy altos. El resto estará en el medio; No demasiado alto o demasiado bajo. La forma de la distribución normal estándar se ve así:

La distribución normal estándar podría ayudarlo a determinar en qué sujeto está obteniendo buenas calificaciones y en qué sujetos tiene que ejercer más esfuerzo debido a los bajos porcentajes de puntuación. Una vez que obtenga un puntaje en un sujeto que sea más alto que su puntaje en otro sujeto, puede pensar que es mejor en el tema donde obtuvo el puntaje más alto. Esto no siempre es cierto.

Solo puede decir que es mejor en un tema en particular si obtiene una puntuación con un cierto número de desviaciones estándar por encima de la media. La desviación estándar le dice cuán estrechamente se agrupan sus datos alrededor de la media; Le permite comparar diferentes distribuciones que tienen diferentes tipos de datos, incluidas diferentes medias.

Por ejemplo, si obtiene una puntuación de 90 en matemáticas y 95 en inglés, podría pensar que es mejor en inglés que en matemáticas. Sin embargo, en matemáticas, su puntaje es 2 desviaciones estándar por encima de la media. En inglés, es solo una desviación estándar por encima de la media. Le dice que en matemáticas, su puntaje es mucho más alto que la mayoría de los estudiantes (su puntaje cae en la cola).
Según estos datos, ¡realmente funcionó mejor en matemáticas que en inglés!

¿Cuáles son las propiedades de distribución normal?

para (- infty

Con una primera exposición a la distribución normal, la función de densidad de probabilidad por derecho propio probablemente no sea particularmente esclarecedor. Echemos un vistazo a un ejemplo de una curva normal, y luego sigamos el ejemplo con una lista de las características de una curva normal típica.

Deje que (x ) denote el IQ (según lo determine la prueba de cociente de inteligencia Stanford-Binet) de un estadounidense seleccionado al azar. Durante mucho tiempo se sabe que (x ) sigue una distribución normal con la media de 100 y la desviación estándar de 16. es decir, (x sim n (100, 16^2) ). Dibuja una imagen de la curva normal, es decir, la distribución, de (x ).

Tenga en cuenta que al dibujar la curva anterior, dije «ahora cómo se ve una curva normal estándar… se parece a esto». Resulta que el término «curva normal estándar» en realidad tiene un significado específico en el estudio de la probabilidad. Como pronto veremos, representa el caso en el que la media ( mu ) es igual a 0 y la desviación estándar σ es igual a 1. Para no causar confusión, desearía haber dicho «ahora qué curva normal típica Parece… «De todos modos, a las características de todas las curvas normales!

Por lo tanto, por la definición de simetría, la curva normal es simétrica sobre la media ( mu ).

¿Qué tipo es la distribución normal?

La distribución normal se considera el caso básico de distribuciones de probabilidad continua debido a su papel en el teorema del límite central.
Un conjunto de valores dados podría ser normal: para establecerlo, puede usar una prueba normal.
Más específicamente, suponiendo ciertas condiciones, la suma de n variables aleatorias con medios finitos y varianza tiende a una distribución normal a la tendencia de N al infinito. Gracias a este teorema, la distribución normal a menudo se encuentra en aplicaciones prácticas, que se usa en estadísticas y en ciencias naturales y sociales [3] como un modelo simple para fenómenos complejos.

La distribución normal depende de dos parámetros, el promedio μ y la varianza σ2, y se indica tradicionalmente con:

donde la variable resultante −∞

El valor y la varianza esperados (que son los únicos dos parámetros de esta variable aleatoria) son precisamente μ y σ².

No es posible expresar la integral de la px (x) { dongestyle p_ {x} (x)} en forma cerrada a través de funciones elementales, es necesario poner a disposición en forma tabular los valores de su función de distribución.
Los más utilizados son:

Los teoremas del límite central son una familia de teoremas que tienen en común la afirmación de que la suma (suma normalizada) de una gran cantidad de variables aleatorias se distribuye aproximadamente como una variable aleatoria normal.

¿Que se entiende por la función de distribución y cuáles son sus propiedades?

La función de distribución de probabilidad, para un espacio de muestra discreto, es una función de los resultados que obedece las condiciones: 0≤p (xi) ≤1 en el lugar de cualquier resultado en el espacio de muestra y∑ip (xi) = 1 donde la suma está sobre todo Resultados en el espacio muestral.

Algunas funciones de distribución de probabilidad en física varían sobre órdenes de magnitud, y las regiones de baja probabilidad pueden ser las regiones de interés. Muestreo directo como en la Sec. 15.2.3 sería muy ineficiente, ya que solo con poca frecuencia se tomaría un evento interesante. Supongamos que tenemos una función tan rápida, P (y),

donde f (y) puede ser complicado pero una función que varía lentamente, posiblemente encontrada por simulación, y la rápida dependencia es todo en el exponencial. Generar una distribución ponderada y luego ponderar los eventos simulados («muestreo de importancia» [6], p. 165) permite generar una mayor población de eventos en la región interesante. En este caso, una función de ponderación razonable y fácilmente integrable sería la parte exponencial,

y uno muestra y a partir de la distribución de la función

que en este caso simple es solo la función f (y. No importa cuán complicado sea F (y), puede ser muestreado por la técnica en la Sec. 15.2.2. Cada evento generado cuyo valor y se muestrean de esta distribución es Peso por W (Y. Este esquema es fácil de implementar y puede ser muy útil.

Completa: una familia de funciones de distribución de probabilidad {ft (t, θ), θ∈θ} se llama completa si e [u (t)] = 0 para todos θ ∈ θ implica u (t) = 0 con probabilidad 1 para todos θ ∈ θ.

¿Como sé que una distribución es normal?

La distribución normal es una función que define cómo se distribuye un conjunto de mediciones alrededor del centro de estas mediciones (es decir, la media). Muchos fenómenos naturales en la vida real pueden aproximarse mediante una distribución de frecuencia en forma de campana conocida como distribución normal o la distribución gaussiana.

La distribución normal es una distribución en forma de montura, unimodal y simétrica donde la mayoría de las mediciones se reúnen alrededor de la media. Además, cuanto más se desvía una medida de la media, menor será la probabilidad de ocurrir. En este sentido, para una variable dada, es común encontrar valores cercanos a la media, pero cada vez menos probabilidades de encontrar valores a medida que nos alejamos de la media. Por último, pero no menos importante, dado que la distribución normal es simétrica alrededor de su media, los valores extremos en ambas colas de la distribución son de manera equivalente. Por ejemplo, dado que la altura de los adultos sigue una distribución normal, la mayoría de los adultos están cerca de la altura promedio y los adultos extremadamente cortos ocurren con tanta frecuencia como adultos extremadamente altos.

En este artículo, el enfoque está en comprender la distribución normal, la regla empírica asociada, sus parámetros y cómo calcular las puntuaciones (z ) para encontrar probabilidades bajo la curva (ilustrada con ejemplos). Como es un requisito en algunas pruebas estadísticas, también mostramos 4 métodos complementarios para probar el supuesto de normalidad en R.

¿Cómo saber si es una distribución normal?

La distribución normal, también conocida como distribución gaussiana, es una distribución de probabilidad que es simétrica sobre la media, que muestra que los datos cerca de la media son más frecuentes en ocurrencia que los datos lejos de la media.

La distribución normal es el término apropiado para una curva de campana de probabilidad.
En una distribución normal, la media es cero y la desviación estándar es 1. Tiene cero sesgo y una curtosis de 3.
Las distribuciones normales son simétricas, pero no todas las distribuciones simétricas son normales.
Muchos fenómenos naturales ocurren tienden a aproximar la distribución normal.
En finanzas, la mayoría de las distribuciones de precios no son perfectamente normales.

La distribución normal es el tipo más común de distribución asumida en el análisis técnico del mercado de valores y en otros tipos de análisis estadísticos. La distribución normal estándar tiene dos parámetros: la media y la desviación estándar.

El modelo de distribución normal es importante en las estadísticas y es clave para el teorema del límite central (CLT). Esta teoría establece que los promedios calculados a partir de variables aleatorias independientes e idénticamente distribuidas tienen distribuciones aproximadamente normales, independientemente del tipo de distribución a partir de la cual se muestrean las variables (siempre que tenga una varianza finita).

La distribución normal es un tipo de distribución simétrica. Las distribuciones simétricas ocurren cuando una línea divisoria produce dos imágenes espejo. No todas las distribuciones simétricas son normales, ya que algunos datos podrían aparecer como dos jorobas o una serie de colinas además de la curva de campana que indica una distribución normal.

¿Cuándo es distribución normal y no normal?

Aunque la distribución normal toma el centro del escenario en las estadísticas, muchos procesos siguen una distribución no normal. Esto puede deberse a los datos naturalmente siguiendo un tipo específico de distribución no normal (por ejemplo, el crecimiento de bacterias sigue naturalmente una distribución exponencial). En otros casos, sus métodos de recopilación de datos u otras metodologías pueden tener la culpa.

Muchos conjuntos de datos se ajustan naturalmente a un modelo no normal. Por ejemplo, el número de accidentes tiende a adaptarse a una distribución de Poisson y la vida útil de los productos generalmente se ajustan a una distribución de Weibull. Sin embargo, puede haber momentos en que se supone que sus datos se ajustan a una distribución normal, pero no. Si este es un caso, es hora de echar un vistazo a sus datos.

Los valores atípicos pueden hacer que sus datos se vuelvan sesgados. La media es especialmente sensible a los valores atípicos. Intente eliminar cualquier valor extremo altos o bajos y probar sus datos nuevamente.
Se pueden combinar múltiples distribuciones en sus datos, dando la apariencia de una distribución bimodal o multimodal. Por ejemplo, dos conjuntos de resultados de prueba normalmente distribuidos se combinan en la siguiente imagen para dar la apariencia de datos bimodales.
Los datos insuficientes pueden hacer que una distribución normal se vea completamente dispersa. Por ejemplo, los resultados de las pruebas en el aula generalmente se distribuyen normalmente. Un ejemplo extremo: si elige tres estudiantes aleatorios y traza los resultados en un gráfico, no obtendrá una distribución normal. Puede obtener una distribución uniforme (es decir, 62 62 63) o puede obtener una distribución sesgada (80 92 99). Si tiene dudas sobre si tiene un tamaño de muestra suficiente, recopile más datos.
Los datos pueden estar gráficos de manera inapropiada. Por ejemplo, si tuviera que graficar los pesos de las personas en una escala de 0 a 1000 libras, tendría un clúster sesgado a la izquierda del gráfico. Asegúrese de que está gráficamente sus datos en los ejes etiquetados adecuadamente.

Tiene varias opciones para manejar sus datos no normales. Muchas pruebas, incluida la prueba de la prueba Z, la prueba t y ANOVA asumen normalidad. Es posible que aún pueda ejecutar estas pruebas si el tamaño de su muestra es lo suficientemente grande (generalmente más de 20 elementos). También puede optar por transformar los datos con una función, lo que lo obliga a adaptarse a un modelo normal. Sin embargo, si tiene una muestra muy pequeña, una muestra sesgada o una que naturalmente se adapte a otro tipo de distribución, es posible que desee ejecutar una prueba no paramétrica. Una prueba no paramétrica es una que no asume que los datos se ajusten a un tipo de distribución específico. Las pruebas no paramétricas incluyen la prueba de rango firmada de Wilcoxon, la prueba U de Mann-Whitney y la prueba Kruskal-Wallis.

¿Cómo se distribuye la distribución normal?

Muchos conjuntos de datos cotidianos generalmente siguen una distribución normal: por ejemplo, las alturas de los humanos adultos, las puntuaciones en una prueba dada a una clase grande, errores en las mediciones.

La distribución normal siempre es simétrica sobre la media.

los
Desviación Estándar
¿Es la medida de cómo se extiende un conjunto de datos normalmente distribuido? Es una estadística que le dice cuán estrechamente se recopilan todos los ejemplos alrededor de la media en un conjunto de datos. La forma de una distribución normal está determinada por la media y la desviación estándar. Cuanto más empinada sea la curva de campana, menor es la desviación estándar. Si los ejemplos se separan mucho, la curva de campana será mucho más plana, lo que significa que la desviación estándar es grande.

En general, sobre
68
De %
del área bajo una curva de distribución normal se encuentra dentro de una desviación estándar de la media.

Es decir, si
X
¯
es la media y
σ
es la desviación estándar de la distribución, entonces
68
De %
de los valores caen en el rango entre
(
X
¯
–
σ
)
y
(
X
¯
+
σ
)
. En la siguiente figura, esto corresponde a la región sombreada de rosa.

Sobre
95
De %
de los valores se encuentran dentro de dos desviaciones estándar de la media, es decir, entre
(
X
¯
–
2
σ
)
y
(
X
¯
+
2
σ
)
.

En datos normalmente distribuidos, sobre
34
De %
de los valores se encuentran entre la media y una desviación estándar por debajo de la media, y
34
De %
entre la media y una desviación estándar por encima de la media.

Además,
13.5
De %
de los valores se encuentran entre la primera y la segunda desviaciones estándar por encima de la media.

¿Cuál es la media de una distribución normal?

La distribución normal es una distribución simétrica en forma de campana en la que la media,
La mediana y el modo son todos iguales. Si la media, la mediana y el modo son desiguales, la distribución
Será sesgado positiva o negativamente. Considere la ilustración a continuación:

Cuando se habla de la distribución normal, es útil pensar en la desviación estándar
como estar a pasos de la media. Un paso a la derecha o un paso a la izquierda es
considerado una desviación estándar lejos de la media. Dos pasos a la izquierda o dos
Los pasos a la derecha se consideran dos desviaciones estándar de la media. Igualmente,
Tres pasos a la izquierda o tres pasos a la derecha se consideran tres estándar
desviaciones de la media. La desviación estándar de un conjunto de datos es simplemente el número
(o distancia) que constituye un paso completo de la media. Sumar o restar
La desviación estándar de la media nos dice los puntajes que constituyen una completa
paso. A continuación he reunido una distribución con una media de 58 y una desviación estándar
de 5. Por ejemplo, si agrego la desviación estándar a la media, obtendría una puntuación
de 63 (58 + 5 = 63). En la terminología de las estadísticas, diríamos que un puntaje de 63 cae exactamente
«Una desviación estándar por encima de la media». Del mismo modo, podríamos restar el estándar
desviación de la media (58 – 5 = 53) para encontrar la puntuación que cae una desviación estándar
Debajo de la media.

Las distribuciones normales son importantes debido al teorema de Chebyshev, que establece que para
una distribución normal Una desviación estándar dada por encima y/o por debajo de la media
Siempre tenga en cuenta la misma cantidad de área bajo la curva. Dejame explicar. Tomar un
Mira la foto de abajo. El área sombreada representa el área total que cae entre
Una desviación estándar por encima y una desviación estándar por debajo de la media. Esos griego
Las cartas son solo notación estadística para la media y la desviación estándar de un
población. Independientemente de cómo se ve una distribución normal o de qué tan grande o pequeño
La desviación estándar es, aproximadamente el 68 por ciento de las observaciones (o 68 por ciento
del área bajo la curva) siempre caerá dentro de dos desviaciones estándar (una
arriba y uno abajo) de la media. ¿Puedes adivinar qué proporción cae entre el
¿Medio y solo una desviación estándar por encima de ella? Si adivinaste 34, debes estar familiarizado
con división (.68/2 = .34).

Ahora eche un vistazo a la siguiente foto. Es básicamente lo mismo que la primera instancia,
Solo esta vez estamos viendo dos desviaciones estándar por encima y por debajo de la media.
Para cualquier distribución normal, aproximadamente el 95 por ciento de las observaciones caerán
Dentro de esta área.

Lo mismo es cierto para nuestra distribución con una media de 58 y una desviación estándar
de 5; El 68% de los datos se ubicarían entre 53 y 63. Dentro de este rango están todos
de los valores de datos ubicados dentro de una desviación estándar (arriba o abajo) de la media.
Además, el 95% de los datos caerían dentro de dos desviaciones estándar de la media,
o en este caso entre 48 y 68. Finalmente, el 99.7% de los valores de los datos se quedarían entre
43 y 73, o dentro de tres desviaciones estándar de la media. Los porcentajes mencionados
Aquí, constituya lo que algunos estadísticos se refieren como la regla del 68%-95%-99.7%. Estos porcentajes
Sigue siendo el mismo para todos los datos distribuidos normalmente. He ilustrado este principio
en el gráfico a continuación.

¿Cómo calcular la media de una distribución normal?

En este explicador, aprenderemos cómo encontrar una desviación media y/o estándar desconocida en una distribución normal.

Supongamos que es una variable aleatoria continua, normalmente distribuida con media y desviación estándar ,
que denotamos por ∼  , . Recuerde que podemos codificar por el cambio lineal de variables
↦ = – , donde ∼ 0,1 sigue la distribución normal estándar y
( < ) =  < - , para todos .

También podemos usar este proceso para calcular medias desconocidas y desviaciones estándar en distribuciones normales. Veamos un ejemplo en el que necesitamos encontrar la media.

Supongamos que se distribuye normalmente con la media y la varianza 196. Dado que ( ≤40) = 0.0668,
Encuentra el valor de .

Para encontrar la media desconocida , codificamos por el cambio de variables ↦ = – ,
donde la desviación estándar = √196 = 14. Ahora ∼ 0,1 sigue la distribución normal estándar y
( ≤40) =  ≤40 – 14 = 0.0668.

Ahora podemos usar nuestras calculadoras o buscar 0.0668 en una tabla de distribución normal estándar, lo que nos dice que corresponde a la probabilidad de que
≤ – 1.5.

Podemos usar exactamente la misma técnica para encontrar desviaciones estándar desconocidas.

Suponga que es una variable aleatoria normal cuya media es y la desviación estándar es . Si
( ≤39) = 0.0548 y = 63, encuentre usando la tabla de distribución normal estándar.

Para encontrar la desviación estándar desconocida , codificamos por el cambio de variables ↦ = – , donde la media = 63. Ahora ∼ 0,1 sigue la normalidad estándar
distribución y
( ≤39) =  ≤39−63  = 0.0548.

¿Cómo se calcula la media de una distribución de probabilidad?

El valor esperado de una variable aleatoria discreta X, simbolizada como E (x), a menudo se conoce como el promedio o media a largo plazo (simbolizado como μ). Esto significa que a largo plazo de hacer un experimento una y otra vez, esperaría este promedio. Por ejemplo, deje que X = el número de cabezas que obtenga cuando arroja tres monedas justas. Si repite este experimento (arroja tres monedas justas) una gran cantidad de veces, el valor esperado de X es el número de cabezas que espera obtener para cada tres lanzamientos en promedio.

Para encontrar el valor esperado, E (x) o μ media de una variable aleatoria discreta X, simplemente multiplique cada valor de la variable aleatoria por su probabilidad y agregue los productos. La fórmula se da como e (x) = μ = ∑xp (x) .e (x) = μ = ∑xp (x).

Aquí x representa los valores de la variable aleatoria x, p (x), representa la probabilidad correspondiente, y el símbolo ∑∑ representa la suma de todos los productos xp (x). Aquí usamos el símbolo μ para la media porque es un parámetro. Representa la media de una población.

Un equipo de fútbol masculino juega al fútbol cero, uno o dos días a la semana. La probabilidad de que jueguen cero días es .2, la probabilidad de que jueguen algún día es .5, y la probabilidad de que jueguen dos días es .3. Encuentre el valor promedio o esperado a largo plazo, μ, del número de días por semana que el equipo de fútbol masculino juega fútbol.

Para hacer el problema, primero deje que la variable aleatoria x = el número de días que el equipo de fútbol masculino juega fútbol por semana. X toma los valores 0, 1, 2. Construya una tabla PDF agregando una columna X*P (x), el producto del valor x con la probabilidad correspondiente p (x). En esta columna, multiplicará cada valor x por su probabilidad.