Una prueba t es la más comúnmente aplicada cuando el estadístico de prueba seguiría una distribución normal si se conociera el valor de un término de escala en la estadística de prueba. El término de escala es un parámetro molesto. Cuando el término de escala se estima en función de los datos, y las variaciones de los grupos comparados son iguales, entonces esta estadística de prueba (bajo ciertas condiciones) sigue la distribución de T de un estudiante. La prueba t se puede usar, por ejemplo, para determinar si las medias de dos conjuntos de datos son significativamente diferentes entre sí.
El término «estadístico t» se abrevia de «estadística de prueba de hipótesis». [1] En estadísticas, la distribución t se derivó primero como una distribución posterior en 1876 por Helmert [2] [3] [4] y Lüroth. [5] [6] [7] La distribución T también apareció en una forma más general como la distribución de Pearson Tipo IV en el artículo de 1895 de Karl Pearson. [8] Sin embargo, la distribución T, también conocida como Distribución T de Student, recibe su nombre de William Sealy Gosset, quien lo publicó por primera vez en inglés en 1908 en la revista científica Biometrika usando su seudónimo «Estudiante» [9] [10] porque su empleador El personal preferido para usar los seudónimos para publicar documentos científicos en lugar de su nombre real, por lo que usó el nombre «Estudiante» para ocultar su identidad. [11] Gosset trabajó en la cervecería Guinness en Dublín, Irlanda, y estaba interesado en los problemas de pequeñas muestras, por ejemplo, las propiedades químicas de la cebada con pequeños tamaños de muestra. Por lo tanto, una segunda versión de la etimología del término estudiante es que Guinness no quería que sus competidores supieran que estaban utilizando la prueba t para determinar la calidad de la materia prima (ver la distribución t de Student para una historia detallada de este seudónimo, que no debe confundirse con el estudiante de término literal). Aunque fue William Gosset después de quien el término «estudiante» está escrito, en realidad fue a través del trabajo de Ronald Fisher que la distribución se hizo bien conocida como «distribución del estudiante» [12] y «prueba t de Student».
Guinness tenía la política de permitir el personal técnico para el estudio (llamado «licencia de estudio»), que Gosset usó durante los dos primeros términos del año académico 1906-1907 en el Laboratorio Biometric de Biometric del Profesor Karl Pearson en University College de Londres. [15] La identidad de Gosset era entonces conocida por otros estadísticos y por el editor en jefe Karl Pearson. [16]
¿Qué es y para qué tipo de muestras es aplicable la distribución t de Student?
La distribución T (también conocida como la distribución t de Student)
es una distribución de probabilidad que se utiliza para estimar la población
parámetros cuando el tamaño de la muestra es pequeño y/o cuando la población
Se desconoce la varianza.
De acuerdo a
el teorema del límite central, el
distribución muestral
de una estadística (como una media de muestra) seguirá un
distribución normal,
Mientras el tamaño de la muestra sea suficientemente grande. Por lo tanto, cuando nosotros
Conocer la desviación estándar de la población, podemos calcular un
puntaje z, y use la distribución normal para evaluar
Probabilidades con la media de la muestra.
Pero los tamaños de muestra a veces son pequeños, y a menudo no sabemos el
Desviación estándar de la población.
Cuando ocurren cualquiera de estos problemas, los estadísticos confían en el
distribución del
t estadística (también conocida como la
t puntaje), cuyos valores están dados por:
donde x es la media de la muestra, μ
es la media de la población, s es la desviación estándar de la muestra y n es la
tamaño de la muestra. La distribución de la estadística t se llama la
t distribución o el
Distribución del estudiante T.
La distribución t nos permite realizar análisis estadísticos en ciertos datos
conjuntos que no son apropiados para el análisis, utilizando la distribución normal.
En realidad, hay muchas distribuciones T diferentes. La forma particular
de la distribución t está determinada por su
grados de libertad. Los grados de libertad se refieren
al número de observaciones independientes en un conjunto de datos.
Al estimar una puntuación media o una proporción de una sola muestra,
El número de observaciones independientes es igual a la muestra
tamaño menos uno. Por lo tanto, la distribución de la estadística t de
Las muestras de tamaño 8 se describirían mediante una distribución t que tiene
8 – 1 o 7 grados de libertad. Del mismo modo, la distribución de la estadística t de
Las muestras de tamaño 16 se describirían mediante una distribución t que tiene
16 – 1 o 15 grados de libertad.
¿Cuándo se usa t de Student para una muestra?
Pero, ¿siempre es posible usar una prueba t de una muestra? La respuesta es no. La prueba t de muestra, de hecho, solo se puede usar si las siguientes afirmaciones son verdaderas:
- Los datos deben ser independientes entre sí. Es decir, no debe haber correlación entre uno y otro. En general, esto se logra a través de un muestreo aleatorio de cada elemento y sin reintegración de la misma en la población después de un muestreo
- Si bien no conoce la desviación estándar de la población, la distribución de la variable dependiente debe ser aproximadamente una distribución normal. Para verificar si el conjunto de datos no tiene desviaciones importantes de lo normal, primero puede realizar una prueba normal.
- Los datos no deben contener valores atípicos. Entonces es necesario limpiar los datos antes de realizar la prueba cuando los valores atípicos tienen poco sentido estadístico y pueden derivar de una medida incorrecta y no de una desviación simple.
Dijimos que la única muestra de prueba le permite verificar si el promedio de una muestra caracterizada por su desviación estándar es comparable con el promedio de toda la población. ¿Cómo se traduce esta comparación en términos de textos de hipótesis?
Se elige el nivel de importancia de la prueba, la igualdad del promedio de la población con el promedio de la muestra se coloca como una hipótesis:
El objetivo de la prueba es verificar si es posible refutar esta hipótesis con un cierto nivel de confianza a favor de una hipótesis alternativa. En una prueba de este tipo, puede haber tres tipos de hipótesis alternativas:
- Los datos deben ser independientes entre sí. Es decir, no debe haber correlación entre uno y otro. En general, esto se logra a través de un muestreo aleatorio de cada elemento y sin reintegración de la misma en la población después de un muestreo
- Si bien no conoce la desviación estándar de la población, la distribución de la variable dependiente debe ser aproximadamente una distribución normal. Para verificar si el conjunto de datos no tiene desviaciones importantes de lo normal, primero puede realizar una prueba normal.
- Los datos no deben contener valores atípicos. Entonces es necesario limpiar los datos antes de realizar la prueba cuando los valores atípicos tienen poco sentido estadístico y pueden derivar de una medida incorrecta y no de una desviación simple.
¿Qué tipo de distribución deben de presentar cada muestra para aplicar la de Prueba T Student?
La prueba t fue desarrollada por un químico que trabajaba para la empresa Guinness Brewing como una forma simple de medir la calidad consistente de Stout. Se desarrolló y se adaptó aún más, y ahora se refiere a cualquier prueba de una hipótesis estadística en la que se espera que la estadística que se esté probando se corresponda con una distribución en T si se apoya la hipótesis nula.
Una prueba t es un análisis de dos medios de población mediante el uso del examen estadístico; Una prueba t con dos muestras se usa comúnmente con pequeños tamaños de muestra, probando la diferencia entre las muestras cuando no se conocen las variaciones de dos distribuciones normales.
La distribución en T es básicamente cualquier distribución de probabilidad continua que surja de la estimación de la media de una población normalmente distribuida utilizando un tamaño de muestra pequeño y una desviación estándar desconocida para la población. La hipótesis nula es la suposición predeterminada de que no existe una relación entre dos fenómenos medidos diferentes.
- La primera suposición hecha con respecto a las pruebas t se refiere a la escala de medición. La suposición de una prueba t es que la escala de medición aplicada a los datos recopilados sigue una escala continua u ordinal, como las puntuaciones para una prueba de IQ.
- La segunda suposición realizada es la de una muestra aleatoria simple, que los datos se recopilan de una porción representativa y seleccionada al azar de la población total.
- La tercera suposición son los datos, cuando se trazan, dan como resultado una distribución normal, curva de distribución en forma de campana. Cuando se supone una distribución normal, se puede especificar un nivel de probabilidad (nivel alfa, nivel de importancia, p) como un criterio para la aceptación. En la mayoría de los casos, se puede suponer un valor del 5%.
- La cuarta suposición es un tamaño de muestra razonablemente grande. Un tamaño de muestra más grande significa que la distribución de los resultados debe acercarse a una curva normal en forma de campana.
- La suposición final es la homogeneidad de la varianza. La varianza homogénea o igual existe cuando las desviaciones estándar de las muestras son aproximadamente iguales.
Cuando visita el sitio, Dotdash Meredith y sus socios pueden almacenar o recuperar información en su navegador, principalmente en forma de cookies. Las cookies recopilan información sobre sus preferencias y sus dispositivos y se utilizan para hacer que el sitio funcione como espere, para comprender cómo interactúa con el sitio y para mostrar anuncios dirigidos a sus intereses. Puede obtener más información sobre nuestro uso, cambiar su configuración predeterminada y retirar su consentimiento en cualquier momento con efecto para el futuro visitando la configuración de cookies, que también se puede encontrar en el pie de página del sitio.
¿Qué es la distribución t Student?
La distribución T del estudiante o la distribución en T es una distribución de probabilidad que se utiliza para calcular los parámetros de la población cuando el tamaño de la muestra es pequeño y cuando se desconoce la varianza de la población. W.S. realizó un trabajo teórico sobre distribución en T. Gosset; Ha publicado sus hallazgos bajo el seudónimo «Estudiante». Por eso se llama prueba t de Student.
Es la distribución de muestreo de la estadística T. Los valores de la estadística t están dados por:
El diagrama anterior indica que la curva de color azul es una curva de distribución normal estándar o una curva de distribución z porque el tamaño de la muestra (n) es mayor que 30. y la curva de color rojo es una curva de distribución t porque el tamaño de la muestra (n) está cerca de 30. De manera similar, la curva de color verde también es una curva de distribución en T porque el tamaño de la muestra (N) es menor que 30.
- La variable en distribución t varía de -∞ a +∞ (-∞
- La distribución T será simétrica como la distribución normal, si la potencia de T está incluso en la función de densidad de probabilidad (PDF).
- Para grandes valores de ν (es decir, el tamaño de muestra aumentable N); La distribución T tiende a una distribución normal estándar. Esto implica que para diferentes valores de ν, la forma de distribución T también difiere.
- La distribución T tiene menos máxima la distribución normal en el centro y más alto en las colas. Desde el diagrama anterior se puede observar que las curvas rojo y verde tienen menos pico en el centro, pero más alto alcanzan su punto máximo en las colas que la curva azul.
¿Cómo calcular la distribución t de Student?
La distribución T del estudiante es una familia de un parámetro de
curvas. Esta distribución se usa típicamente para probar una hipótesis con respecto al
La población significa cuando se desconoce la desviación estándar de la población.
Las estadísticas y el aprendizaje automático de Toolbox ™ ofrecen múltiples formas de trabajar con la distribución T del estudiante.
donde ν es los grados de libertad y γ (·) es el gamma
función. El resultado P es la probabilidad de que una sola observación de
la distribución t con ν grados de libertad cae en
el intervalo [–∞, x].
La distribución T del estudiante es una familia de curvas dependiendo de un solo parámetro ν (los grados de libertad). A medida que los grados de libertad se acercan al infinito, la distribución T se acerca a la distribución normal estándar.
Calcule los PDF para la distribución T del estudiante con el parámetro nu = 5 y la distribución t del estudiante con el parámetro nu = 15.
x = [-5: 0.1: 5]; y1 = tpdf (x, 5); y2 = tpdf (x, 15);
Calcule el PDF para una distribución normal estándar.
z = normpdf (x, 0,1);
Trace los T PDF del estudiante y el PDF normal estándar en la misma figura.
Distribución beta: la distribución beta es un
Distribución continua de dos parámetros que tiene parámetros
A (parámetro de primera forma) y B
(Parámetro de segunda forma). Si y tiene un estudiante
T Distribución con ν grados de
Libertad, entonces x = 12+12yν+y2 tiene distribución beta con los parámetros de forma a = ν/2 y b = ν/2. Esta relación se utiliza para calcular los valores del
t CDF y funciones inversas, y para generar
T Números aleatorios distribuidos.
Artículos Relacionados: