Usos y aplicaciones de la distribución t student

Si tomamos una muestra de observaciones n { displaystyle n} de una distribución normal, entonces la distribución t con ν = n-1 { displaystyle nu = n-1} de los grados de libertad se puede definir como la distribución del Ubicación de la media de muestra en relación con la media verdadera, dividida por la desviación estándar de la muestra, después de multiplicarse por el término de estandarización n { displayStyle { sqrt {n}}}. De esta manera, la distribución T se puede utilizar para construir un intervalo de confianza para la media verdadera.

La distribución t es simétrica y en forma de campana, como la distribución normal. Sin embargo, la distribución en T tiene colas más pesadas, lo que significa que es más propenso a producir valores que caen lejos de su media. Esto lo hace útil para comprender el comportamiento estadístico de ciertos tipos de relaciones de cantidades aleatorias, en las que la variación en el denominador se amplifica y puede producir valores periféricos cuando el denominador de la relación cae cerca de cero. La distribución T del estudiante es un caso especial de la distribución hiperbólica generalizada.

En la literatura en inglés, la distribución toma su nombre del artículo de 1908 de William Sealy Gosset en Biometrika bajo el seudónimo «Estudiante». [9] Gosset trabajó en la cervecería Guinness en Dublín, Irlanda, y estaba interesado en los problemas de pequeñas muestras, por ejemplo, las propiedades químicas de la cebada donde los tamaños de muestra pueden ser tan pocas como 3. Una versión del origen del seudónimo es que Gosset’s El empleador prefirió que el personal usara los seamos llamas al publicar documentos científicos en lugar de su nombre real, por lo que usó el nombre «Estudiante» para ocultar su identidad. Otra versión es que Guinness no quería que sus competidores supieran que estaban usando la prueba t para determinar la calidad de la materia prima. [10] [11]

El documento de Gosset se refiere a la distribución como la «distribución de frecuencia de las desviaciones estándar de las muestras extraídas de una población normal». Se hizo bien conocido a través del trabajo de Ronald Fisher, quien calificó la distribución de «distribución del estudiante» y representó el valor de prueba con la letra t. [12] [13]

¿Qué es la distribución de t Student y sus principales características?

La distribución normal estándar o Z supone que conoce la desviación estándar de la población. La distribución T se basa en la desviación estándar de muestra.

La distribución t es similar a una distribución normal. Tiene una definición matemática precisa. En lugar de sumergirnos en matemáticas complejas, veamos las propiedades útiles de la distribución en T y por qué es importante en los análisis.

  • Al igual que la distribución normal, la distribución t tiene una forma suave.
  • Al igual que la distribución normal, la distribución t es simétrica. Si piensa en doblarlo por la mitad a la media, cada lado será el mismo.
  • Al igual que una distribución normal estándar (o distribución z), la distribución t tiene una media de cero.
  • La distribución normal supone que se conoce la desviación estándar de la población. La distribución t no hace esta suposición.
  • La distribución t se define por los grados de libertad. Estos están relacionados con el tamaño de la muestra.
  • La distribución T es más útil para tamaños de muestra pequeños, cuando la desviación estándar de la población no se conoce, o ambos.
  • A medida que aumenta el tamaño de la muestra, la distribución t se vuelve más similar a una distribución normal.

Considere el siguiente gráfico que compara tres distribuciones T con una distribución normal estándar:

Todas las distribuciones tienen una forma suave. Todos son simétricos. Todos tienen una media de cero.

¿Qué es una distribución t de Student y cuáles son sus características?

Definición: La distribución t, también conocida como distribución en T del estudiante, es la distribución de probabilidad que estima los parámetros de la población cuando el tamaño de la muestra es pequeño y la desviación estándar de la población es desconocida.

Se asemeja a la distribución normal y, a medida que el tamaño de la muestra aumenta, la distribución T parece más normalmente distribuida con los valores de medias y la desviación estándar de 0 y 1 respectivamente.

  • Al igual que la distribución normal estándar, la forma de la distribución del estudiante también tiene forma de campana y simétrica con la media cero.
  • La distribución del estudiante varía de –∞ a ∞ (infinito).
  • La forma de la distribución T cambia con el cambio en los grados de libertad.
  • La varianza siempre es mayor que una y se puede definir solo cuando los grados de libertad ν ≥ 3 y se dan como: var (t) = [ν/ν -2]
  • Tiene menos pico en el centro y más alto en las colas, por lo tanto, asume la forma platykurtica.
  • La distribución T tiene una mayor dispersión que la distribución normal estándar. Y a medida que aumenta el tamaño de la muestra «n», supone la distribución normal. Aquí se dice que el tamaño de la muestra es grande cuando n ≥ 30.
  • Prueba de hipótesis de la diferencia entre dos medias con muestras dependientes.
  • Prueba de hipótesis sobre el coeficiente de correlación.

Por lo tanto, la distribución del estudiante es la medida estadística que compara los datos observados con los datos esperados obtenidos con una hipótesis específica. Cumple con el teorema del límite central que dice que la distribución se acerca a la distribución normal estándar siempre que el tamaño de la muestra sea grande.

¿Cuándo se usa la prueba t de Student?

Para realizar una prueba t para muestras independientes, se requieren dos variables:

  • Una variable cualitativa independiente (nominal u ordinal) con dos modos.
  • Una variable cuantitativa (discreta o continua) dependiente.

Por ejemplo, si desea verificar que la diferencia de altura entre un grupo de hombres y una de las mujeres sea diferente de Scratch, la variable independiente será sexo, mientras que el empleado estará representado por las diferentes alturas de las personas individuales.

Pero, ¿por qué los grupos son independientes? Los grupos deben ser independientes porque los grupos no relacionados representan las dos categorías de la variable independiente en las que los casos (por ejemplo, las personas) son diferentes.

A menudo puede necesitar examinar las diferencias entre los individuos y, en consecuencia, cuando comparan dos grupos, un individuo en un grupo tampoco puede ser miembro del otro, y viceversa.

Tratemos de repensar el ejemplo que hemos mencionado anteriormente: para ser parte del análisis, un individuo debe clasificarse en el grupo de hombres o en el de las mujeres, pero no puede ser parte de ambos.

Al indicar con N1 y N2, respectivamente, el número de muestra de los dos grupos, el procedimiento para una prueba t con muestras independientes se puede resumir en 6 pasos.

Como primer paso, debe agregar los valores de la variable numérica y dividirlos por el número de su grupo. Indico tal escuela secundaria con x1 y x2.

¿Cuándo se usa t de Student y cuando Z?

La prueba z es la hipótesis estadística que se utiliza para determinar si las dos muestras significa que calculadas son diferentes en caso de que la desviación estándar esté disponible y la muestra es grande, mientras que la prueba t se usa para determinar cómo los promedios de diferentes conjuntos de datos difiere entre sí en caso de desviación estándar o la varianza no se conoce.

Aquí le brindamos las 5 diferencias principales entre la prueba Z vs. Test T que debe conocer.

  • La prueba z se usa como se da en la tabla anterior cuando el tamaño de la muestra es grande, que es n> 30, y la prueba t es apropiada cuando el tamaño de la muestra no es grande, lo que es pequeño, es decir, que n < 30.

En mayor medida, ambas pruebas son casi similares, pero la comparación solo viene a sus condiciones para su aplicación, lo que significa que la prueba t es más apropiada y aplicable cuando el tamaño de la muestra no es más de treinta unidades. Sin embargo, si es mayor de treinta unidades, uno debe usar una prueba Z. Del mismo modo, también hay otras condiciones, lo que dejará en claro qué prueba se realizará en una situación.

Bueno, también hay diferentes pruebas como la prueba F, estadísticos de dos colas versus una sola cola, etc., deben tener cuidado al aplicarlas después de analizar la situación y luego decidir cuál usar. A continuación se muestra un gráfico de muestra para lo que discutimos anteriormente.

Este artículo ha sido una guía para la prueba Z vs. T-Test. Aquí discutimos las 5 diferencias principales entre estas pruebas de hipótesis junto con infografías y una tabla comparativa. También puede echar un vistazo a los siguientes artículos –

¿Cuándo usar el estadístico z en lugar del estadístico t?

Debe conocer la desviación estándar de la población y el tamaño de su muestra debe estar por encima de los 30 para poder usar la puntuación Z. De lo contrario, use el puntaje T. Cuándo usar un puntaje T vs. Z-Score.

El cuadro anterior se basa en (desde mi experiencia), la «regla» es más probable que encuentre en una clase de estadísticas elementales. Dicho esto, esta es una de esas reglas que no se establece en piedra, por lo que siempre debe consultar con su libro de texto/maestro para asegurarse de que no sugieran algo diferente.

Sin embargo, en la vida real, es más común usar la distribución en T, ya que generalmente no conocemos Sigma (Sosci, 1999).

«Cuando una muestra tiene más de 30 observaciones, la distribución normal se puede usar en lugar de la distribución T». (Meier et.al, p. 191).

Tenga en cuenta el uso de la palabra en la cita anterior; El uso de la distribución t es teóricamente sólida para todos los tamaños de muestra, pero usted * puede * elegir usar la muestra normal para la muestra superior a 30.

Técnicamente, los puntajes Z son una conversión de puntajes individuales en una forma estándar. La conversión le permite comparar más fácilmente diferentes datos; Se basa en su conocimiento sobre la desviación estándar y la media de la población. Una puntuación Z le dice cuántas desviaciones estándar de la media es su resultado. Puede usar su conocimiento de las distribuciones normales (como la regla 68 95 y 99.7) o la mesa Z para determinar qué porcentaje de la población caerá por debajo o por encima de su resultado.

z = (x-μ)/σ

¿Cuándo se usa la prueba Z?

Verifique la igualdad de los promedios de dos poblaciones (M1 y M2) en función de muestras independientes cuando se conocen las desviaciones estándar de ambas poblaciones (S1 y S2). La hipótesis no se verifica nada H0: M1 = M2 en lugar de una de las siguientes alternativas.

Verifique la igualdad de los promedios de dos poblaciones (M1 y M2) en función de muestras independientes cuando no se conoce ninguna de las desviaciones estándar de las poblaciones (S1 o S2). La hipótesis no se verifica nada H0: M1 = M2 en lugar de una de las siguientes alternativas.

Realiza una verificación en una proporción (proporción de éxitos no conocidos usa el número de resultados favorables en la muestra X como entrada y el número de observaciones en la muestra no. 1 -Prop Z PRUEBA COMPRUEBA El no H0 H0: PROP = P0 en lugar de una de las siguientes alternativas.

Esta prueba es útil para determinar si la probabilidad de éxito observada en la muestra es significativamente diferente de la probabilidad de la población o si se debe a un error de muestreo, desvío u otros factores.

Realiza una prueba para comparar la proporción de éxitos (P1 y P2) de dos poblaciones. Utiliza el número de éxitos como entrada en cada muestra (x1 y x2) y el número de observaciones en cada muestra (N1 y N2). 2 -PROP Z PRUEBA COMPRUEBE LA NADA H0: P1 = hipótesis P2 (usando la proporción de la muestra agregada ç) en lugar de una de las siguientes alternativas.

Esta prueba es útil para determinar si la probabilidad de éxito observada en dos muestras es la misma.

Artículos Relacionados:

Más posts relacionados:

Deja una respuesta

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *