La distribución t de Student: características y aplicaciones

Cuando se dibujan algunas muestras
de la población normal cuya varianza se conoce, una distribución de la muestra
la media es normal. Cuando, sin embargo, se desconoce la varianza de la población, el
La distribución no es normal sino estudiante-T, cuya cola es más larga. Eso significa el
hecho de que la media de la muestra con la varianza de la población desconocida se inclina a ser un
valor extremo. Si usa la distribución normal para pruebas de hipótesis en su lugar
De la distribución t, la probabilidad de error se hace mayor.

Supongamos que tenemos un simple
Muestra aleatoria de tamaño n extraída de una población normal con media
y desviación estándar
. Dejar
denota la media de la muestra y s, el
Muestra de desviación estándar. Entonces la cantidad

Tenga en cuenta que hay un
Diferente distribución T para cada tamaño de muestra, en otras palabras, es una clase
de distribuciones. Cuando hablamos de una distribución t específica, tenemos que
especificar los grados de libertad. Los grados de libertad para estas estadísticas t
proviene de la desviación estándar de muestra en el denominador de la ecuación 1.

Las curvas de densidad t son
simétrico y en forma de campana como la distribución normal y tener su pico en
0. Sin embargo, la propagación es más que la de la distribución normal estándar.
Esto se debe al hecho de que en la fórmula (1),
El denominador es S en lugar de σ.
Dado que S es una cantidad aleatoria que varía con varias muestras, la variabilidad en
T es más, lo que resulta en una extensión más grande.

¿Cómo se calcula la distribución t Student?

Nota: tanto la distribución t como la distribución normal
Suponga que las observaciones se distribuyen normalmente en el
población. Y a medida que aumenta el tamaño de la muestra, el
La distribución T se vuelve cada vez más similar a la distribución normal. Entonces, ¿cuándo el investigador elegiría la distribución T sobre
la distribución normal? Una regla general es elegir la distribución T
Cuando (1) el tamaño de la muestra es pequeño y/o (2) se desconoce la desviación estándar de la población.

Instrucciones: para encontrar la respuesta a un
Pregunta, simplemente haga clic en la pregunta.

La calculadora de distribución t acepta dos
Estadísticas
Como entrada: un
T Marque
o una media de muestra. Elija la opción que sea más fácil. Aquí están
Algunas cosas a considerar.

  • Si elige trabajar con las estadísticas de T, es posible que deba transformar su RAW
    datos en una estadística t. Puedes lograr esta transformación usando el
    Siguiendo la ecuación:
  • donde x es la media de la muestra, μ
    es la media de la población, s es la desviación estándar de la muestra, n es la
    El tamaño de la muestra, y t es la estadística t.
  • Si elige trabajar con la media de la muestra, puede evitar la «transformación»
    paso. Pero deberá proporcionar información adicional en forma de
    Media de la población y/o la desviación estándar de muestra.

Los grados de libertad pueden describirse como el número de puntajes que
son libres de variar. Por ejemplo, suponga que arrojó tres dados. El puntaje total
agrega hasta 12. Si rodó un 3 en el primer dado y un 5 en el segundo, entonces
Sabes que el tercer dado debe ser un 4 (de lo contrario, el total no se sumaría
a 12). En este ejemplo, 2 die son libres de variar mientras que el tercero no lo es.
Por lo tanto, hay 2 grados de libertad.

¿Qué es una distribución t de Student y cuando se utiliza?

La distribución T es una distribución de probabilidad hipotética. También se conoce como distribución en T del estudiante y se usa para hacer presunciones sobre una media cuando no conocemos la desviación estándar. Es una distribución simétrica en forma de campana, similar a la curva normal estándar. Tan altos como los grados de libertad (DF), cuanto más se acerca esta distribución aproximará una distribución normal estándar con una media de 0 y una desviación estándar de 1.

Una distribución en T es todo el conjunto de valores T medidos para cada muestra aleatoria posible para un tamaño de muestra específico o un grado particular de libertad. Se aproxima a la forma de la distribución normal.

Sea X una distribución normal con la media «μ» para la muestra de tamaño «n» con media de muestra

y la muestra estándar de desviación estándar «s», entonces la variable t tiene la distribución t de Student con un grado de libertad, d.f = n-1. La fórmula para la distribución t viene dada por;

La tabla de distribución T se utiliza para determinar las proporciones conectadas con puntajes Z. Utilizamos esta tabla para encontrar la relación para las estadísticas T. La tabla de distribución T muestra la probabilidad de que T tome valores de un valor dado. La probabilidad obtenida es el área de la curva T entre las ordenadas de distribución t, el valor dado e infinito.

En la tabla de distribución T, los valores críticos se definen para grados de libertad (DF) a las probabilidades de distribución t, α.

  • Varía de −∞ a +∞.
  • Tiene una curva en forma de campana y una simetría similar a la distribución normal.

¿Cómo calcular el t?

Cuando nos movemos en coche, se enfrenta a las curvas. Tal vez no nos damos cuenta, pero en esas ocasiones describimos arcos de circunferencia. Esto significa que nos movemos a lo largo de una trayectoria circular. Los movimientos que describen arcos de circunferencia se llaman movimientos circulares; Si la velocidad permanece constante en el módulo durante el movimiento circular, estamos en un caso particular llamado movimiento circular uniforme.

Observamos que la velocidad, como tamaño del vector, no puede permanecer constante a lo largo de una trayectoria curva: de hecho, la velocidad siempre tiene una tangente a la trayectoria; Si este último está curvado, la dirección tangente continúa cambiando y, en consecuencia, la velocidad, como portador, no permanece constante. Sin embargo, lo que puede permanecer constante es el módulo de velocidad.

Ahora consideramos un punto de material animado por movimiento circular uniforme. Durante esta motocicleta, debido a la condición «módulo de velocidad constante», el punto describe arcos de circunferencia igual (movimiento realizado) en intervalos de tiempo iguales (necesarios para hacer estos movimientos). Por lo tanto, caracterizar el movimiento circular uniforme es el período, o el tiempo utilizado desde el punto que hace una vuelta completa. La unidad de medición del período, ya que este es un intervalo de tiempo, es la segunda.

En la rueda panorámica de un parque de diversiones, por ejemplo, el período es la duración de la carrera, ya que subemos cuando bajamos.

Podemos hablar de frecuencia, o el número de vueltas completas descritas en un segundo. La frecuencia se obtiene, para su definición, calculando la mutua del período, y se mide, en el sistema internacional, en $ s^{-1} $, unidad conocida como Hz (Hertz). $$ t = fracc {1} {f} quad f = franc {1} {t} $$

¿Quién desarrollo la distribución de t de Student?

Una distribución normal describe una población completa, las distribuciones T describen muestras extraídas de una población completa; En consecuencia, la distribución t para cada tamaño de la muestra es diferente, y cuanto mayor es la muestra, más se asemeja a una distribución normal.

Gosset trabajó en una cervecería y estaba interesado en los problemas de pequeñas muestras, por ejemplo, las propiedades químicas de la cebada. En los problemas que analizó, el tamaño de la muestra podría ser tan bajo como tres. Debido al pequeño tamaño de la muestra, no es posible estimar la desviación estándar. Además, en muchos casos, Gosset encontró, se desconoció la distribución de probabilidad de las muestras.

Una versión del origen del seudónimo es que el empleador de Gosset prefería el personal para usar los seudónimos (en lugar de su nombre real) al publicar artículos científicos, por lo que usó el nombre «estudiante» para ocultar su identidad. Otra versión es que la cervecería no quería que sus competidores supieran que estaban usando la prueba t para probar la calidad de la materia prima. [4]

Si tomamos una muestra de N observaciones de una distribución normal, entonces la distribución t con ν = n-1 grados de libertad se puede definir como la distribución de la ubicación de la muestra media x¯ { displaystyle { overline {x }}}, relativo a la media verdadera μ μ { displayStyle mu}, dividida por la desviación estándar de muestra s { displayStyle s} sobre el término de normalización n { displayStyle { sqrt {n}}} (es decir, t es, t es, = X¯-μs/n { displayStyle t = { tFrac {{ overline {x}}- mu} {s/{ sqrt {n}}}}}). [5] De esta manera, la distribución T se puede usar para estimar qué tan probable es que la media verdadera se encuentre en cualquier rango dado.

La distribución t es simétrica y en forma de campana, como la distribución normal, pero tiene colas más pesadas, lo que significa que es más propenso a producir valores que caen lejos de su media. [6] Esto lo hace útil para comprender el comportamiento estadístico de ciertos tipos de relaciones de cantidades aleatorias, en las que la variación en el denominador se amplifica y puede producir valores periféricos cuando el denominador de la relación cae cerca de cero. La distribución T del estudiante es un caso especial de la distribución hiperbólica generalizada.

¿Cómo surge la distribución t de Student?

En esta sección estudiaremos una distribución que tiene especial importancia en las estadísticas. En particular, esta distribución surgirá en el estudio de una versión estandarizada de la media de la muestra cuando la distribución subyacente es normal.

La distribución del estudiante (t ) está bien definida para cualquier (n gt 0 ), pero en la práctica, solo los valores enteros positivos de (n ) son de interés. Esta distribución fue estudiada por primera vez por William Gosset, quien publicó bajo el estudiante seudónimo.

La prueba de este teorema proporciona una buena forma de pensar en la distribución (t ): la distribución surge cuando la varianza de una distribución normal media se aleatoriza de cierta manera.

En el simulador de distribución especial, seleccione la distribución del estudiante (t ). Varíe (n ) y tenga en cuenta la forma de la función de densidad de probabilidad. Para valores seleccionados de (n ), ejecute la simulación 1000 veces y compare la función de densidad empírica con la función de densidad de probabilidad verdadera.

En la calculadora de distribución especial, seleccione la distribución del estudiante. Varíe el parámetro y tenga en cuenta la forma de la densidad de probabilidad, la distribución y las funciones cuantiles. En cada uno de los siguientes casos, encuentre el primer y tercer cuartilos:

  • (n = 2 )
  • (n = 5 )
  • (n = 10 )
  • (n = 20 )

Supongamos que (t ) tiene una distribución (t ). La representación en la definición se puede utilizar para encontrar la media, la varianza y otros momentos de (t ). El punto principal a recordar en las pruebas que siguen es que, dado que (v ) tiene la distribución de chi-cuadrado con (n ) grados de libertad, (e izquierdo (v^k right) = infty ) if (k le – frac {n} {2} ), mientras if (k gt – frac {n} {2} ),
[ E izquierda (v^k right) = 2^k frac { gamma (k + n / 2)} { gamma (n / 2)} ]

¿Quién inicio los trabajos de la distribución t de Student y que fórmula utiliza?

Jack ha trabajado como instructor suplementario a nivel universitario durante dos años. Se graduó Cum Laude con una licenciatura en Matemáticas de la Universidad Estatal de Iowa. También tiene dos años de experiencia en tutoría en el nivel K-12.

La historia de la distribución t de Student, o simplemente distribución t, comienza con la noción de una variable aleatoria continua. En general, una variable aleatoria {eq} x {/eq} es una función de algún espacio de muestra {eq} mathcal {s} {/eq} a {eq} mathbb {r}, {/eq} los números reales . El valor {eq} x (s), s in mathcal {s}, {/eq} asumido por {eq} x {/eq} se denota por {eq} x. {/eq} además, una variable aleatoria {eq} x {/eq} es continua, en lugar de discreta, si $$ p (x = x) = 0, $$ para todos {eq} x in mathbb { R}. {/eq} Algunos ejemplos familiares de variables aleatorias continuas son las alturas de las personas o el tiempo que lleva conducir para trabajar desde casa. Como regla general, si se mide una variable aleatoria, entonces es continuo y si se cuenta, entonces es discreto. La función de distribución acumulativa, (CDF) o la función de distribución simplemente, (df) de una variable aleatoria continua {eq} x {/eq} viene dada por $$ f (x) = p (x leq {x}). $$ Tenga en cuenta que para una variable aleatoria discreta, la función de distribución será una función de paso. Pero para una variable aleatoria continua, la función de distribución será continua. La función de distribución de una variable aleatoria continua tiene algunas propiedades importantes, a saber, que $$ f (- infty) = lim_ {y to- infty} f (y) = 0, \ f ( infty) = Lim_ {y a infty} f (y) = 1, $$ y {eq} f (x) {/eq} no es ideable, lo que significa que si {eq} a

El gráfico de una distribución t con df = 5 y el intervalo de confianza del 95% correspondiente

La distribución en T fue desarrollada por William Sealy Gosset durante su tiempo como jefe de cervecería experimental en Guinness (sí, la cerveza irlandesa) junto con varios otros métodos estadísticos bajo el estudiante de soloud. En su trabajo, Gosset trabajó con pequeñas muestras de cebada utilizadas en la producción de Guinness Beer. Los problemas que encontró aproximando la media de las distribuciones normales con pequeños tamaños de muestra motivaron su formulación de la distribución t. En la práctica, la distribución en T se usa en situaciones donde los tamaños de muestra son pequeños, la desviación estándar de la población es desconocida o ambas (léase: todo el tiempo en el mundo real). A diferencia de la distribución normal estándar, a menudo llamada distribución z, la distribución t tiene colas «más pesadas» y un pico «más opaco». Sin embargo, comparten algunas características, a saber, que ambas son simétricas sobre {eq} x = 0, {/eq} la media, y son curvas suaves en forma de campana.

Los grados de libertad (DF) es el argumento de la distribución t y está íntimamente relacionado con el tamaño de la muestra {eq} n {/eq} de la siguiente manera: $$ v = n-1. $$ Entonces, por ejemplo, una distribución en T con una muestra de 25 observaciones tiene 24 grados de libertad. Los grados de libertad se nombran como tales porque es el número de valores de una estadística que son libres de variar sin violar las restricciones iniciales impuestas a la estadística. De manera equivalente, los grados de libertad pueden considerarse como el número de información independiente que se destinan a la estimación de un parámetro. La base matemática de los grados de libertad pertenece al estudio de álgebra lineal, donde el número de grados de libertad es el número de dimensiones del dominio de un vector aleatorio.

Artículos Relacionados:

Más posts relacionados:

Deja una respuesta

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *