Prueba del valor z de la distribución normal: cálculo y resultados

Debido al teorema del límite central, muchas estadísticas de prueba se distribuyen aproximadamente normalmente para muestras grandes. Por lo tanto, muchas pruebas estadísticas se pueden realizar convenientemente como pruebas Z aproximadas si el tamaño de la muestra es grande o se conoce la varianza de la población. Si se desconoce la varianza de la población (y, por lo tanto, debe estimarse a partir de la muestra en sí) y el tamaño de la muestra no es grande (n <30), la prueba t del estudiante puede ser más apropiada.

  • El término «prueba Z» a menudo se usa para referirse específicamente a la prueba de ubicación de una muestra, comparando la media de un conjunto de mediciones con una constante dada cuando se conoce la varianza de la muestra. Por ejemplo, si los datos observados x1,…, xn son (i) independientes, (ii) tienen una media común μ, y (iii) tienen una varianza común σ2, entonces el promedio de la muestra X tiene media μ y varianza σ2N { displayStyle { frac { sigma ^{2}} {n}}}.
  • La hipótesis nula es que el valor medio de x es un número dado μ0. Podemos usar X como estadística de prueba, rechazando la hipótesis nula si x-μ0 es grande.
  • Para calcular el estadístico estandarizado z = (x¯-μ0) s { displayStyle z = { frac {({ bar {x}}- mu _ {0})} {s}}}, necesitamos cualquiera conocer o tener un valor aproximado para σ2, desde el cual podemos calcular s2 = σ2n { displayStyle s ^{2} = { frac { sigma ^{2}} {n}}}. En algunas aplicaciones, se conoce σ2, pero esto es poco común.
  • Si el tamaño de la muestra es moderado o grande, podemos sustituir la varianza de la muestra para σ2, dando una prueba de complemento. La prueba resultante no será una prueba Z exacta ya que la incertidumbre en la varianza de la muestra no se tiene en cuenta, sin embargo, será una buena aproximación a menos que el tamaño de la muestra sea pequeño.
  • Se puede usar una prueba t para tener en cuenta la incertidumbre en la varianza de la muestra cuando los datos son exactamente normales.
  • Diferencia entre la prueba Z y la prueba t: la prueba Z se usa cuando el tamaño de la muestra es grande (n> 50), o se conoce la varianza de la población. La prueba t se usa cuando el tamaño de la muestra es pequeño (n <50) y se desconoce la varianza de la población.
  • No existe una constante universal en la que el tamaño de la muestra generalmente se considera lo suficientemente grande como para justificar el uso de la prueba de complemento. Reglas típicas del pulgar: el tamaño de la muestra debe ser 50 observaciones o más.
  • Para tamaños de muestra grandes, el procedimiento de prueba T proporciona valores P casi idénticos como procedimiento de prueba Z.
  • Otras pruebas de ubicación que se pueden realizar como pruebas Z son la prueba de ubicación de dos muestras y la prueba de diferencia emparejada.
  • Los parámetros molestos deben ser conocidos o estimados con alta precisión (un ejemplo de un parámetro molestos sería la desviación estándar en una prueba de ubicación de una muestra). Las pruebas Z se centran en un solo parámetro y tratan que todos los demás parámetros desconocidos se fijan en sus valores verdaderos. En la práctica, debido al teorema de Slutsky, se pueden justificar «enchufar» estimaciones consistentes de los parámetros molestos. Sin embargo, si el tamaño de la muestra no es lo suficientemente grande como para que estas estimaciones sean razonablemente precisas, la prueba Z puede no funcionar bien.
  • La estadística de prueba debe seguir una distribución normal. En general, uno apela al teorema del límite central para justificar suponiendo que una estadística de prueba varía normalmente. Existe una gran cantidad de investigación estadística sobre la cuestión de cuándo una estadística de prueba varía aproximadamente normalmente. Si la variación del estadístico de prueba es fuertemente no normal, no se debe usar una prueba Z.

Si las estimaciones de los parámetros molestos se conectan como se discutió anteriormente, es importante usar estimaciones apropiadas para la forma en que se muestrean los datos. En el caso especial de las pruebas Z para uno o dos problemas de ubicación de muestra, la desviación estándar de muestra habitual solo es apropiada si los datos se recopilaron como una muestra independiente.

¿Cómo interpretar prueba Z?

La prueba t de muestra única prueba la hipótesis nula de que la población significa
es igual al número especificado por el usuario. SPSS calcula la estadística T
y su valor p bajo el supuesto de que la muestra proviene de una aproximadamente
distribución normal. Si el valor p asociado con la prueba t es pequeña (0.05 es
a menudo utilizado como umbral), hay evidencia de que la media es diferente de
el valor hipotético. Si el valor p asociado con la prueba t no es pequeño
(p> 0.05), entonces la hipótesis nula no se rechaza y puede concluir que
La media no es diferente del valor hipotético.

En este ejemplo, la estadística T es 4.140 con 199 grados de libertad. los
El valor p de dos colas correspondiente es de .000, que es inferior a 0.05. Concluimos
que la media de la escritura variable es diferente de 50.

Obtenga el archivo "C:  data  hsb2.sav".
prueba t
/testVal = 50
variables = escribir.

una. – Esta es la lista de variables. Cada variable
que figuraba en las variables = la declaración en el código anterior tendrá su propia línea en esta parte
de la salida.

b. N-Este es el número de válido (es decir, no falla)
Observaciones utilizadas para calcular la prueba t.

d. Std Desviación: esta es la desviación estándar de la variable.

mi. Std Media de error: esta es la desviación estándar estimada de
la media de la muestra. Si dibujamos muestras repetidas de tamaño 200, esperaríamos el
La desviación estándar de la muestra significa estar cerca del error estándar. los
La desviación estándar de la distribución de la media de la muestra se estima como la
Desviación estándar de la muestra dividida por la raíz cuadrada del tamaño de la muestra:
9.47859/(SQRT (200)) = .67024.

¿Cómo interpretar un valor de z?

El puntaje Z es una forma de contar el número de desviaciones estándar entre un valor de datos dado y la media del conjunto de datos. En esta lección, veremos la fórmula para el puntaje Z, cómo calcularla y un poco más de cerca esta idea de contar las desviaciones estándar.

Cuando se trata de interpretar, debe tener en cuenta que restando la media de un valor de datos, obtendremos un negativo si es más pequeño que la media y positiva si es más grande. Entonces, el letrero regala la «dirección» de la media. Al dividir esta diferencia por la desviación estándar, estamos poniendo esta distancia entre la media y el valor de los datos en términos de una serie de desviaciones estándar. Por lo tanto, podemos decir:

«El puntaje de prueba de 590 es aproximadamente 1.95 desviaciones estándar por encima de la media».

Interpretando la puntuación Z:
Para un valor de datos dado, el puntaje Z proporciona el número de desviaciones estándar por encima (positiva) o debajo (negativa) la media.

Como vio anteriormente, el valor y el signo de la puntuación Z le brindan información sobre la ubicación del valor de los datos. Específicamente:

  • Una puntuación Z positiva significa que el valor de los datos es mayor que la media.

Si un valor de datos tiene una puntuación Z de 2, eso nos dice que este valor de datos es 2 desviaciones estándar más grandes que la media.

  • Una puntuación Z positiva significa que el valor de los datos es mayor que la media.
  • Una puntuación Z negativa significa que el valor de los datos es menor que la media.
  • Si un valor de datos tiene una puntuación Z de –3.1, entonces este valor de datos es 3.1 desviaciones estándar más pequeñas que la media.

    ¿Que nos indica Z?

    Dirigiéndose desde el campo de batalla a manifestaciones a redes sociales como Wildfire, la Z blanca ahora representa sentimientos pro-invasión y se ha incorporado a la propaganda aprobada por el Kremlin. Pero, ¿de dónde vino y tiene algún significado más profundo?

    El símbolo llamó la atención internacional cuando fue vista durante la invasión de Ucrania, estampado por el lado de los vehículos militares rusos. Se vieron marcas similares hace años en tanques rusos que participan en la Guerra Civil siria, según The Evening Standard. Como tal, muchos han deducido que el símbolo está destinado a ayudar a los soldados en el suelo a diferenciar los vehículos de su lado de los del enemigo, reduciendo el fuego amistoso. También ha aparecido pintado con aerosol en puertas en regiones ucranianas capturadas con éxito por Rusia.

    La Z blanca, como se ve arriba, se ha convertido en un importante símbolo pro-Rusia en medio de la invasión en curso de Ucrania. Andrej Isakovic/AFP a través de Getty Images

    El profesor Michael Clarke, ex director del grupo de expertos, Rusi, habló con Sky News sobre el uso potencial del símbolo como un indicador estratégico.

    «A menudo, estos símbolos estarán basados ​​en la ubicación: se comunicarán hacia dónde se dirige una unidad», dijo Clarke. «Si solo tuvieran que marcar los vehículos como rusos, solo podrías usar un símbolo. El hecho de que sean diferentes te dice más: probablemente sean señales que te dicen qué unidades se dirigen al noreste o al noroeste de un distrito, por ejemplo «.

    Como Clarke mencionó, se han empleado múltiples símbolos en vehículos durante la invasión de Ucrania. Según la inteligencia militar ucraniana, estos son los símbolos y quiénes indican que las fuerzas son operadas por: z para el distrito militar oriental de Rusia, Z encerrado en una caja para Crimea, o para Bielorrusia, V para Marines, X para Chechenia y A para especial Efectivo.

    ¿Cómo saber el valor de z?

    Esta es una tarea un poco más desafiante que calcular un área, porque básicamente trabaja «al revés» desde un punto de vista algebraico. Es importante darse cuenta de que una tabla normal estándar tiene dos partes: (1) los márgenes superiores y laterales, que forman las décimas y centésimas de una puntuación Z, y (2) el cuerpo de la mesa, que son todas las áreas ( probabilidad) valores. Además, recuerde que la tabla normal estándar solo nos proporciona información sobre el área (probabilidad) a la izquierda de una puntuación Z. A continuación se muestra un pequeño extracto de la Tabla B del Apéndice A.

    Observe que los valores Z dados en la tabla están redondeados a dos decimales. El primer lugar decimal de cada valor Z se enumera en la columna izquierda, con el segundo lugar decimal en la fila superior. Cuando la fila y la columna apropiadas se cruzan, encontramos la cantidad de área bajo la curva normal estándar a la izquierda de ese valor Z particular.

    Ejemplo: encontrar el área a la izquierda de un valor z positivo usando una tabla normal acumulativa

    Encuentre el área debajo de la curva normal estándar a la izquierda de z = 1.37.

    Para leer la tabla, debemos dividir el valor Z dado (1.37) en dos partes: una que contiene el primer lugar decimal (1.3) y el otro que contiene el segundo lugar decimal (0.07). Entonces, en la Tabla B desde el Apéndice A, mire a través de la fila etiquetada 1.3 y hacia abajo en la columna etiquetada 0.07. La fila y la columna se cruzan a 0.9147. Por lo tanto, el área bajo la curva normal estándar a la izquierda de z = 1.37 es 0.9147.

    Usando una calculadora TI-83/84 Plus, podemos encontrar un valor del área a la izquierda de una puntuación Z. Para obtener la solución utilizando una calculadora TI-83/84 Plus, realice los siguientes pasos.

    ¿Cómo calcular el valor de z para un intervalo de confianza?

    Hay varias formas de calcular intervalos de confianza, como la estadística Z o la puntuación Z y la estadística T. Cuál usa, depende en gran medida de su conocimiento de los datos.

    Si el tamaño de su muestra es grande (n> 30) y conoce la desviación estándar de la población, una puntuación Z es apropiada.

    Si el tamaño de su muestra es pequeño y su variación de población es desconocida, puede usar una puntuación T.

    Ya discutimos cómo calcular las puntuaciones Z y las puntuaciones Z normalizadas en el contexto del teorema del límite central. Aquí está la fórmula para el puntaje Z normalizado nuevamente:

    Z_n =  frac { bar x_n -  mu} { frac { sigma} { sqrt {n}}}

    La puntuación Z nos da una estimación del número de desviaciones estándar que una observación se encuentra de la media. La puntuación Z exacta depende del intervalo de confianza seleccionado. En nuestro caso, queremos saber qué tan lejos está la media de la muestra de la población.

    Para estimar este intervalo de confianza, calculamos la desviación estándar normalizada y la multiplicamos por la puntuación Z apropiada. Luego, restamos y agregamos el resultado de nuestra media población.

     bar {x}  pm z  frac { sigma} { sqrt {n}}

    Calculemos la media de la población usando un ejemplo concreto.

    Suponga que queríamos estimar la distribución de alturas en la población de un país. Sabemos que la desviación estándar es de 10 cm (4 pulgadas) y tomamos una muestra de 100 personas. La media de la muestra es de 170 cm (67 pulgadas).

    El primer paso es decidir qué nivel de confianza queremos usar. Nos quedamos con el 95%. Para obtener una puntuación Z, necesitamos calcular el nivel alfa. El nivel alfa describe la probabilidad de que nuestra verdadera población significa fuera del intervalo de confianza. Dado que queremos tener un 95% seguro de que la media población verdadera se encuentra dentro de nuestro intervalo, el nivel alfa es simplemente el complemento de 0.95 a 1

    ¿Cómo calcular el valor de Z en una distribución normal en Excel?

    Tomemos un ejemplo y calculemos la puntuación Z de un elemento en Excel paso a paso.

    Digamos que las alturas de 10 estudiantes en una clase se dan como:

    Tenemos que calcular la puntuación Z de la altura de cada estudiante y tabularlo en la columna C.

    En primer lugar, tenemos que calcular la altura media del conjunto de datos en Excel con los siguientes pasos:

    • Seleccione la celda en la que se debe mostrar el valor medio.
    • La celda seleccionada aquí para mostrar el valor medio es B14.
    • Luego vaya a la pestaña Fórmulas> más funciones> Funciones estadísticas> promedio
    • La pestaña Fórmulas se puede ver en la barra de tareas y cuando se seleccionan más funciones, aparece una lista desplegable. Seleccione Funciones estadísticas de él y nuevamente Se enumera una lista desplegable de varias funciones estadísticas, seleccione el promedio de ella.
    • Después del paso 1, aparece un cuadro de diálogo de argumento de función.
    • En el campo Número1, tenemos que dar el rango de celdas en las que se muestran los elementos para encontrar su promedio.
    • En nuestro caso, este rango de células es de B2: B11.
    • El campo número2 es para la celda en la que se mostrará el valor medio.
    • Como ya hemos seleccionado la celda en el Paso 1, podemos dejar esto en blanco.
    • Haga clic en Aceptar. El valor medio se muestra en la celda B14.

    Una vez que se determina el valor medio, el segundo paso es encontrar la desviación estándar del conjunto de datos.

    • Seleccione la celda en la que se debe mostrar el valor medio.
    • La celda seleccionada aquí para mostrar el valor medio es B14.
    • Luego vaya a la pestaña Fórmulas> más funciones> Funciones estadísticas> promedio
    • La pestaña Fórmulas se puede ver en la barra de tareas y cuando se seleccionan más funciones, aparece una lista desplegable. Seleccione Funciones estadísticas de él y nuevamente Se enumera una lista desplegable de varias funciones estadísticas, seleccione el promedio de ella.
    • Después del paso 1, aparece un cuadro de diálogo de argumento de función.
    • En el campo Número1, tenemos que dar el rango de celdas en las que se muestran los elementos para encontrar su promedio.
    • En nuestro caso, este rango de células es de B2: B11.
    • El campo número2 es para la celda en la que se mostrará el valor medio.
    • Como ya hemos seleccionado la celda en el Paso 1, podemos dejar esto en blanco.
    • Haga clic en Aceptar. El valor medio se muestra en la celda B14.
  • Seleccione la celda en la que se debe mostrar el valor de desviación estándar.
  • ¿Cómo determinar el valor Z de un 95% en un estudio?

    Las tres preguntas de práctica aquí pueden ayudarlo a lograr una comprensión de la relación entre los valores de Z y el nivel de confianza necesario para un margen de error. Use la siguiente tabla para encontrar el valor Z*apropiado para los niveles de confianza dados, excepto cuando se indique.

    La tabla Z y la tabla anterior están relacionadas pero no las mismas. Para ver la conexión, encuentre el valor Z*que necesita para un intervalo de confianza del 95% utilizando la tabla Z:

    En primer lugar, si observa la Tabla Z*, ve que el número que necesita para Z* para un intervalo de confianza del 95% es 1.96. Sin embargo, cuando busca 1.96 en la tabla Z, obtienes una probabilidad de 0.975. ¿Por qué?

    En pocas palabras, la tabla Z muestra solo la probabilidad debajo de un cierto valor Z, y desea la probabilidad entre dos valores Z, –z y Z. Si el 95% de los valores deben estar entre –z y z, expande esta idea para notar que un 5% combinado de los valores se encuentran por encima de z y por debajo de –z. Entonces, el 2.5% de los valores se encuentran por encima de z, y el 2.5% de los valores se encuentran por debajo de –Z.

    Para obtener el área total por debajo de este valor Z, tome el 95% entre –z y z más el 2.5% inferior a –z, y obtendrá el 97.5%. Ese es el valor Z con un área de 97.5% debajo de él. También es el número con un 95% entre dos valores Z, –z y z.

    Para evitar todos estos pasos y dolores de cabeza adicionales, la Tabla Z*ya ha realizado esta conversión por usted. Entonces, cuando busca 1.96, encuentra automáticamente el 95% (no 97.5%).

    La Tabla Z*muestra la respuesta: un nivel de confianza del 99% tiene un valor Z*de 2.58.

    ¿Cuánto vale Z al 85%?

    Hemos pasado algún tiempo pasando por los conceptos de pruebas de hipótesis. Ahora veamos cómo podemos realizar una prueba de hipótesis, primero, utilizando la puntuación Z. Comenzaremos con una comprensión de los puntajes Z.

    Una puntuación Z es una serie de desviaciones estándar que un puntaje está por encima o por debajo de la media. En la distribución normal estándar, la media siempre es igual a 0 y la desviación estándar es igual a 1.0. Los puntajes Z nos ayudan a describir varios aspectos de la distribución, como rangos de percentiles, porcentajes de puntajes entre puntos, etc. En resumen, nos permite comparar cualquier puntaje con cualquier otra puntuación en una distribución, o en todas las distribuciones porque es está estandarizado en función de la media de distribuciones y la desviación estándar. Eche un vistazo a los siguientes diagramas de la distribución normal. Esto desglosa el porcentaje de la distribución que cae entre las puntuaciones Z. Esto es una constante. Por lo tanto, podemos ver eso casi, pero no toda la distribución se encuentra entre las puntuaciones Z de -3 y 3.

    Este diagrama de 3 partes muestra el porcentaje de una distribución normal que se encuentra entre 1, 2 y 3 desviaciones estándar de la media: entre -1 y 1 puede encontrar aproximadamente el 68%; entre -2 y 2 es aproximadamente el 95%; y entre -3 y 3 es aproximadamente del 99.7%, ¡prácticamente todo! Todos los modelos normales siguen este patrón, por lo que un nombre común para esta propiedad es la regla 68-95-99.7. Estos porcentajes también representan la probabilidad de encontrar una puntuación Z en uno de estos intervalos, por lo que esta regla puede ser útil para responder preguntas de probabilidad como encontramos en las pruebas de hipótesis.

    Aquí hay otra vista de la distribución normal estándar. En este diagrama, los porcentajes representan la cantidad de distribución entre las puntuaciones Z consecutivas (-2 y -1, -1 y 0, etc.).

    El diagrama también ilustra cómo caen los puntajes Z en la distribución normal. Cada puntaje Z representa una unidad de desviación estándar lejos de la media. Para entender esto, veamos una distribución de IQ con M = 100 y SD = 12. Una puntuación Z de 1 está a 12 unidades de la media; Un puntaje Z de 2 está a 24 unidades de la media y así sucesivamente. Debido a que la distribución normal es simétrica sobre la media, como puede ver por el desglose porcentual, entonces un puntaje Z de -2 también está a 24 unidades de la media.

    Artículos Relacionados:

    Más posts relacionados:

    Deja una respuesta

    Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *