¿Qué es la fórmula T del estudiante?

Se muestra que la fórmula para calcular la distribución T (que también se conoce popularmente como distribución de T de Student) restando la media de la población (media de la segunda muestra) de la media de muestra (media de la primera muestra) que es [x̄ – μ] que es entonces dividido por la desviación estándar de medias que inicialmente se divide por la raíz cuadrada de N, que es el número de unidades en esa muestra [s ÷ √ (n)].

La distribución T es un tipo de distribución que se parece casi a la curva de distribución normal o a la curva de campana, pero con un poco más gordo y cola más corta. Cuando el tamaño de la muestra es pequeño, esta distribución se usará en lugar de la distribución normal.

Sin embargo, dado que no hay un rango para el cálculo de la distribución T, el valor puede ser extraño, y no podremos calcular la probabilidad, ya que la distribución T de Student tiene limitaciones de llegar a un valor y, por lo tanto, solo es útil para un tamaño de muestra más pequeño . Además, para calcular la probabilidad después de llegar a una puntuación, uno necesita encontrar el valor de la tabla de distribución T del estudiante.

Aquí se dan todos los valores. Solo necesitamos incorporar los valores.

SRH Company afirma que sus empleados a nivel de analista ganan un promedio de $ 500 por hora. Se selecciona una muestra de 30 empleados a nivel de analista, y sus ganancias promedio por hora fueron de $ 450, con una desviación de muestra de $ 30. Y suponiendo que su afirmación sea verdadero, calcule el valor de distribución t, que se utilizará para encontrar la probabilidad de distribución t.

Aquí se dan todos los valores; Solo necesitamos incorporar los valores.

¿Cómo se saca la t de Student?

Al medir la progresión social y económica, los métodos estadísticos que tienen en cuenta varias magnitudes de incertidumbres se utilizan para la inferencia y la toma de decisiones. Una de las tareas en la inferencia estadística es estimar la media de la población de una muestra de observaciones. Por ejemplo, uno puede querer estimar el valor medio del precio minorista (μ) de un galón de gasolina sin plomo basado en precios de algunas estaciones de servicio en una gran ciudad. Una estimación natural de μ es la media de muestra aritmética. El estimador X̂ tiene muchas propiedades estadísticas deseables, especialmente cuando son independientes y se distribuyen de manera idéntica como una variable aleatoria normal (gaussiana) con media μ y varianza σ2. De las propiedades de la distribución normal, la siguiente estadística Z

es una variable aleatoria normal estándar con media μ = 0 y varianza σ2 = 1. Esta estadística z se ha utilizado para tomar inferencias y decisiones estadísticas cuando se conoce la varianza σ2 o el número de observaciones n es grande. Sin embargo, en la mayoría de las aplicaciones, la varianza σ2 generalmente es desconocida y el número de observaciones n puede ser pequeño. William Sealy Gosset (1876–1937), químico de la cervecería de Arthur Guinness y Co. (Boland 1984), estudió la pequeña propiedad de muestra de

¿Dónde está la varianza de la muestra? El trabajo de Gosset resultó en el nacimiento de la estadística t de Student. Gosset publicó su trabajo en Biometrika en 1908 bajo el seudónimo de «Estudiante» de su informe de 1904 a la compañía titulada «La aplicación de la ley de error al trabajo de la cervecería». El empleador de Gosset estaba en contra del trabajo realizado para la compañía que se hizo pública, pero le permitió publicarlo bajo un seudónimo. La estadística original de Gosset era

¿Cómo se utiliza el t de Student?

Entonces, si desea comprender cómo funciona, puede ver nuestro video a continuación o simplemente desplazarse hacia abajo si prefiere leer.

Comenzaremos nuestro viaje de entenderlo contando una historia sobre su origen.

William Gosset era un estadístico inglés que trabajaba para la cervecería Guinness.

Desarrolló diferentes métodos para la selección de las mejores variedades de cebada, un ingrediente importante al hacer cerveza. Gosset encontró grandes muestras tediosas. Por lo tanto, estaba tratando de desarrollar una forma de extraer muestras pequeñas, pero aún se les ocurrió predicciones significativas.

Fue un investigador curioso y productivo y publicó varios artículos que todavía son relevantes hoy. Sin embargo, debido a la política de Guinness Company, no se le permitió firmar los documentos con su propio nombre.

Por lo tanto, todo su trabajo estaba bajo el seudónimo: estudiante.

Más tarde, un amigo suyo y un famoso estadístico, Ronald Fisher, pisó los hallazgos de Gosset. Introdujo la estadística T y el nombre que se quedó con la distribución correspondiente incluso hoy es la distribución T del estudiante.

La distribución T del estudiante es uno de los mayores avances en estadísticas, ya que permitió la inferencia a través de pequeñas muestras con una varianza de población desconocida. Esta configuración se puede aplicar a una gran parte de los problemas estadísticos que enfrentamos hoy.

Visualmente, la distribución T del estudiante se parece mucho a una distribución normal, pero generalmente tiene colas más gruesas. Las colas más gruesas, como sabrán, permiten una mayor dispersión de variables, ya que hay más incertidumbre.

¿Cómo interpretar los resultados de la prueba t de Student?

A diferencia de las tablas de lo normal, las tablas de la letra «T» son contrarias: de hecho, los percentiles se colocan en este caso en el centro de las tablas, en su lugar, la probabilidad se coloca en la parte superior y a la izquierda los grados de libertad, que son características de cada ejercicio.

Para decidir que tiene que analizar sus datos con una prueba estadística. Si la prueba «le aconseja» que rechace la hipótesis cero, entonces la diferencia observada se declara estadísticamente significativa. Si, por otro lado, la prueba «recomienda» aceptar la hipótesis cero, entonces la diferencia no es estadísticamente significativa.

El nivel de significación es el umbral que determina si un cierto resultado puede considerarse estadísticamente significativo. Por lo tanto, es un número que se decide a priori, al hacer el diseño del estudio, y en los protocolos de investigación se informa en la sección dedicada a las estadísticas.

La prueba Chi-Quadro es una prueba estadística no paramétrica destinada a verificar si los valores de frecuencia obtenidos por detección son diferentes de manera significativa de las frecuencias obtenidas con la distribución teórica. Esta prueba nos permite aceptar o rechazar una hipótesis dada.

Cuando el valor p es bajo (es decir, cerca de 0) se dice que el resultado es estadísticamente significativo. Una probabilidad muy cercana a 0 indica que es muy poco probable que observe los datos de su muestra cuando la hipótesis no lo es. El valor del valor p le dice exactamente lo improbable que es.

¿Cuándo se utiliza la distribución t de Student y cuál es la fórmula?

es la función de densidad de probabilidad de una variable aleatoria gamma con parámetros
y
:dónde

Necesitamos probar
Que yvelete
EE. UU. Comienza desde la función Integrand:
dónde
y
es la función de densidad de probabilidad de una variable aleatoria que tiene un gamma
Distribución con parámetros
y
.
Por lo tanto:

Si
es una variable aleatoria normal de cero medio con varianza
,
condicional a
,
Entonces podemos pensar en
como un
ratiowhere
tiene una distribución normal estándar,
tiene una distribución gamma y
y
son independientes.

El valor esperado de un estudiante estándar T a Random
variable
está bien definido solo para
y es igual
a

Se deduce del hecho de que la densidad
la función es simétrica alrededor
:Los
Las integrales anteriores son finitas (por lo que el valor esperado está bien definido) solo si
porque
El límite anterior es finito solo si
.

La varianza de un estudiante estándar T a Random
variable
está bien definido solo para
y es igual
a

Se puede derivar gracias a lo habitual
fórmula de varianza
()
y a la representación integral de la beta
Función: desde
La derivación anterior, debe estar claro que la varianza está bien definida
sólo cuando
.
De lo contrario, si
,
Las integrales inadecuadas anteriores no convergen (y la función beta no es
bien definido).

los
-Th.
Momento de la variable aleatoria de un estudiante estándar
está bien definido solo para
y es igual
a

Al usar la definición de momento,
Get therefore,
para calcular el
-Th.
momento y para verificar si existe y es finito, necesitamos estudiar el
siguiendo
Integral: de
la derivación anterior, debe estar claro que el
-Th.
El momento está bien definido solo cuando
.
De lo contrario, si
,
Las integrales inadecuadas anteriores no convergen (las integrales involucran la beta
función, que está bien definida y converge solo cuando sus argumentos son
estrictamente positivo: en este caso solo si
).
Por lo tanto, los
-Th.
momento de
es

¿Cuándo se debe utilizar la distribución t de Student?

Una desviación estándar de población desconocida implica que tendría que estimarse a partir de las muestras en sí, lo cual es inexacto con pequeños tamaños de muestra. Según el artículo de Wiki de prueba Z, un tamaño de muestra> = 30 implica el uso de una distribución normal, un tamaño de muestra <30 implica el uso de la distribución t. (Test T como referencia.) ¿Es esta suposición la mejor práctica común? ¿Cómo se relaciona esto con la determinación del tamaño de la muestra (estimación de una media)?

La distribución t de Student por definición es una distribución de las estimaciones medias de las muestras tomadas de la población normalmente distribuida.

La distribución en T tiene colas más gruesas y se vuelve más delgada con el aumento de grados de libertad, que a su vez depende de la distribución de la muestra. Entonces, en algún momento se parece mucho a la distribución normal y puede ser sustituido por ella.

Hasta donde recuerdo (aunque no es 100% seguro), este tamaño de muestra del umbral de 30 es válido para la prueba t con α = 0.05 (nivel de error de tipo I ampliamente aceptado). Aunque, de usted tiene α mucho más pequeño (por ejemplo, 0.0001), debe ir mucho más lejos a las colas de las distribuciones donde la diferencia entre la distribución t y la distribución normal será mucho más evidente y, por lo tanto, es mejor usar T en lugar de lo normal. Para un tamaño de muestra más grande.

Otro problema es la desviación estándar (o más bien aquí estamos hablando de error estándar). La distribución normal (y, por lo tanto, la prueba Z) requiere el conocimiento de la desviación estándar de la población. Si no lo sabe, debe estimarlo de la muestra y obviamente es solo una estimación de la desviación estándar de la población. La distribución T de los estudiantes maneja mejor la desviación estándar porque usarla con distribución normal (que debería tener solo desviación estándar de población) creará errores adicionales (estimará incorrectamente sus errores tipo I (e ii)).

¿Qué es la distribución t de Student y en qué se utiliza y cuando?

El teorema del límite central nos dice que la distribución de la media de la muestra X¯ es aproximadamente normal con la media μ (la media de la población) y la varianza σ2/N (donde σ2 es la varianza de la población y N es el tamaño de la muestra). Por lo tanto, en medida estándar, la estadística

donde σn = σ/n, se distribuye aproximadamente normalmente con la varianza media cero y unitaria para N grande. Sin embargo, en situaciones experimentales, ni se puede conocer la media ni la varianza de la población, en cuyo caso deben ser reemplazados por estimaciones de la muestra. Mientras que σ2 puede ser reemplazado de forma segura por la varianza de la muestra S2 para N≥30 grandes, para n estadística U no se distribuirá aproximadamente normalmente y se producirá una pérdida grave de significado en la interpretación. Entonces tenemos que considerar la distribución de la variable

Vemos en el teorema del límite central que el numerador se distribuye como una variable normal estándar y el denominador se distribuye como una variable χ2 con (n – 1) o n grados de libertad, dependiendo de si μ se estima o no a partir de los datos ( ver ecuación (5.16a)). La distribución de T se llama distribución T del estudiante. Permite que uno use la varianza de la muestra, así como la media de la muestra, para hacer declaraciones sobre la media de la población. La discusión se concentrará en torno a tres resultados importantes, pero en primer lugar derivaremos la función de densidad de t.

Deje que tenga una distribución normal con la varianza media cero y unitaria. Además, tenga W una distribución χ2 con n grados de libertad, y se distribuya de forma independiente. Debido a que U y W están distribuidos de forma independiente, su densidad articular es el producto de sus densidades individuales. Por lo tanto, a partir de la forma de la distribución de chi-cuadrado (6.2) y la distribución normal estandarizada (4.10), la función de densidad articular de U y W es

Esta integral puede evaluarse directamente utilizando la definición de la función gamma (6.3) con el resultado de que la variable aleatoria

Artículos Relacionados:

Más posts relacionados:

Deja una respuesta

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *