Prueba t de Student para una muestra: cómo optimizar su resultado

En 1908, William Sealy Gosset, un inglés que publica bajo el estudiante seudónimo, desarrolló la Test T y T Distribution. (Gosset trabajó en la cervecería Guinness en Dublín y descubrió que las técnicas estadísticas existentes que utilizan muestras grandes no eran útiles para los pequeños tamaños de muestra que encontró en su trabajo). La distribución es una familia de curvas en la que el número de grados de libertad ( El número de observaciones independientes en la muestra menos una) especifica una curva particular. A medida que aumenta el tamaño de la muestra (y por lo tanto los grados de libertad), la distribución T se acerca a la forma de la campana de la distribución normal estándar. En la práctica, para las pruebas que involucran la media de una muestra de tamaño mayor de 30, la distribución normal generalmente se aplica.

Primero es habitual formular una hipótesis nula, que establece que no hay una diferencia efectiva entre la media de muestra observada y la media de la población hipotética o declarada, es decir, que cualquier diferencia medida se debe solo al azar. En un estudio agrícola, por ejemplo, la hipótesis nula podría ser que una aplicación de fertilizante no ha tenido ningún efecto sobre el rendimiento del cultivo, y se realizaría un experimento para probar si ha aumentado la cosecha. En general, una prueba t puede ser de dos lados (también denominada dos colas), indicando simplemente que las medias no son equivalentes, o unilaterales, especificando si la media observada es más grande o más pequeña que la media hipotética. Luego se calcula la estadística de prueba t. Si la estadística T observada es más extremo que el valor crítico determinado por la distribución de referencia apropiada, se rechaza la hipótesis nula. La distribución de referencia apropiada para la estadística T es la distribución T. El valor crítico depende del nivel de significación de la prueba (la probabilidad de rechazar erróneamente la hipótesis nula).

Por ejemplo, suponga que un investigador desea probar la hipótesis de que una muestra de tamaño n = 25 con media x = 79 y desviación estándar s = 10 se dibujó al azar de una población con media μ = 75 y desviación estándar desconocida. Usando la fórmula para la estadística T, la T calculada es igual a 2. Para una prueba de dos lados a un nivel común de significación α = 0.05, los valores críticos de la distribución T en 24 grados de libertad son −2.064 y 2.064. La T calculada no excede estos valores, por lo tanto, la hipótesis nula no puede ser rechazada con una confianza del 95 por ciento. (El nivel de confianza es 1 – α.)

Una segunda aplicación de la distribución T prueba la hipótesis de que dos muestras aleatorias independientes tienen la misma media. La distribución T también se puede utilizar para construir intervalos de confianza para la media verdadera de una población (la primera aplicación) o para la diferencia entre dos medias de muestra (la segunda aplicación). Ver también Estimación de Interval.

¿Qué es t de Student para una muestra?

En esta tabla informé tanto la información obtenida utilizando la fórmula de la prueba t para las mismas variaciones y la de diferentes variaciones. En este caso, dado que el número de muestra es el mismo en los dos grupos y las variaciones fueron homogéneas, como puede ver que los resultados son idénticos. La única diferencia viene dada por los grados de libertad (GDL) que son más bajos en el caso de diferentes variaciones. En la práctica, elija no informar la línea correspondiente a la misma varianza.

Le aconsejo que informe tanto la diferencia en la escuela intermedia (en este caso igual a 3) como el error estándar que le permite calcular el intervalo de confianza. Luego se muestra el valor de las estadísticas t y el número de grados de libertad del estudiante t. Esta información sería necesaria si tuviera que calcular la probabilidad utilizando las tablas de distribución t de Student. Afortunadamente, el software ya hace este trabajo para nosotros y para fines interpretativos solo necesita mirar las dos últimas columnas, relacionadas con el valor p y el cohen D

La muestra consta de 40 estudiantes, 20 hombres y 20 mujeres que están matriculadas en cierta facultad universitaria.

Se realizó una prueba t para muestras independientes para determinar si había diferencias en los votos logrados en el examen de matemáticas. Los análisis preliminares realizados a través de la construcción de los gráficos de caja no resaltaron la presencia de valores atípicos. Se descubrió que la votación se distribuye de acuerdo con una normal en ambos grupos, según lo verificado por la prueba de Shapiro-Wilk (P> 0.05).

¿Qué es la prueba t Student para una muestra?

Supongamos que ha cuestionado dos muestras de 500 clientes de dos ciudades diferentes sobre su experiencia de compra en su tienda. El Grupo A (clientes de Lyon) le dio un promedio de 8/10 para la calidad de su servicio al cliente, mientras que el Grupo B (Marsella) le ha dado una puntuación de 5/10.

Luego debe responder a la siguiente pregunta: «¿Se brindó el servicio al cliente en Lyon o el Grupo Lyonnais contenía a muchos clientes que habían tenido una experiencia positiva? ».

Las pruebas t estadísticas le permiten responder esta pregunta. Le dice cuál es la probabilidad de que las diferencias observadas se deban al azar. Si esta probabilidad es muy baja, se dice que la diferencia es significativa o estadísticamente significativa.

En una prueba t, comienza estableciendo una hipótesis cero, es decir que las dos poblaciones son idénticas y que no hay diferencias significativas entre ellas. La prueba de estudiante probará o invalidará su hipótesis nula.

Existen varios tipos de pruebas t que satisfacen diferentes necesidades y le permiten obtener resultados estadísticos específicos.

En lugar de comparar sus datos de muestra con los de un segundo segmento de marketing, puede ejecutar esta prueba (prueba t de 1 muestra) para comparar estos datos con un valor o número definido. Esto es particularmente útil para comparar tendencias o identificar fluctuaciones.

¿Qué significa la prueba t?

Las pruebas t son pruebas de hipótesis estadística que usa para analizar una o dos medias de muestra. Dependiendo de la prueba t que use, puede comparar una media de muestra con un valor hipotético, los medios de dos muestras independientes o la diferencia entre las muestras emparejadas. En esta publicación, le muestro cómo las pruebas t usan valores T y distribuciones T para calcular las probabilidades y probar hipótesis.

Como de costumbre, proporcionaré explicaciones claras de los valores T y las distribuciones T utilizando conceptos y gráficos en lugar de fórmulas. Si necesita un manual en lo básico, lea mi descripción general de las pruebas de hipótesis.

El término «prueba t» se refiere al hecho de que estas pruebas de hipótesis usan valores T para evaluar los datos de su muestra. Los valores T son un tipo de estadística de prueba. Pruebas de hipótesis Use la estadística de prueba que se calcula a partir de su muestra para comparar su muestra con la hipótesis nula. Si la estadística de prueba es lo suficientemente extrema, esto indica que sus datos son tan incompatibles con la hipótesis nula que puede rechazar el nulo. Obtenga más información sobre las estadísticas de prueba.

No te preocupes. Encuentro que estas definiciones técnicas de términos estadísticos son más fáciles de explicar con los gráficos, ¡y llegaremos a eso!

Cuando analiza sus datos con cualquier prueba t, el procedimiento reduce toda su muestra a un solo valor, el valor t. Estos cálculos tienen en cuenta el tamaño de su muestra y la variación en sus datos. Luego, la prueba t compara sus medias de muestra con la condición de hipótesis nula de la siguiente manera:

Si los datos de la muestra equivalen a la hipótesis nula con precisión, la prueba t produce un valor t de 0.

¿Cuándo se aplica la prueba t de Student?

«La prueba t de Student se utiliza para comparar la media de dos muestras normalmente distribuidas, preferiblemente de igual tamaño y varianza. Más específicamente, la prueba t de Student le brinda una estimación probabilística de la probabilidad de que sus muestras se seleccionaran aleatoriamente de la misma población, es decir, que la hipótesis nula es cierta. Si la prueba t de Student sugiere que sus muestras probablemente no fueron tomadas de la misma población, puede concluir, con cierta certeza (cómo depende de su valor P), que sus muestras fueron tomadas de diferentes poblaciones.

Pensando en la prueba t de Student en términos de relaciones de «señal a ruido», la «señal» es la diferencia entre la media de dos muestras (similar a la prueba Z). En igualdad de condiciones, las grandes diferencias en las medias tienen más probabilidades de ser estadísticamente significativas. Sin embargo, si la distribución de valores en la población (o, en este caso, las muestras) es grande (es decir, hay mucho ruido), es menos probable que la diferencia en las medias sea significativa y sea más probable a variación aleatoria. Para la prueba t de Student, la raíz cuadrada de la suma de las variaciones de la muestra cuadradas, divididas por los tamaños de muestra, se usa como una estimación del ruido.

sqrt (s1^2/n1 + s2^2/n2) donde s = varianza y n = número en cada muestra

t = [ABS (media de población – media de muestra)]/[SQRT (S1^2/N1 + S2^2/N2)]]

¿Cuándo se utiliza la prueba t de Student?

La prueba de pares de estudiantes le permite comparar el promedio de dos conjuntos de valores con un enlace.

Por ejemplo, 20 ratones recibieron x tratamiento durante 3 meses. Nos hacemos la pregunta de si el tratamiento X tiene un impacto en el peso de los ratones después de 3 meses. Por lo tanto, el peso de los 20 ratones se midió antes y después del tratamiento. Esto nos da 20 series de valores antes del tratamiento y otras 20 series de valores después del tratamiento proveniente de la medición del peso de los mismos ratones.

En este ejemplo, esta es una prueba de estudiante clara porque las dos series de valores tienen un enlace (ratones). Para cada ratón, tenemos dos mediciones (una antes y la otra después del tratamiento).

Para comparar los promedios de dos series emparejadas, primero calculamos la diferencia en las dos medidas para cada par.

O la serie de valores correspondientes a las diferencias en las medidas entre pares de valores. El promedio de la diferencia D se compara con el valor 0. Si hay una diferencia significativa entre las dos series emparejadas, el promedio de D debería estar muy lejos del valor 0

M y S representan el promedio y la desviación estándar de la diferencia d. n es el tamaño de la serie D.

Para averiguar si la diferencia es significativa, primero debe leer en la tabla T, el valor crítico correspondiente al riesgo alfa = 5% para un grado de libertad:

Si el valor absoluto de t (| t |) es mayor que el valor crítico, entonces la diferencia es significativa. De lo contrario, no lo es. El grado de significatividad (o valor p) corresponde al riesgo indicado por la tabla del estudiante para el valor | t |.

¿Cómo se interpreta la prueba t?

Las pruebas se usan comúnmente en estadísticas y ecconometría para establecer que los valores de dos resultados o variables son diferentes entre sí.

Las hipótesis comunes realizadas al realizar una prueba t incluyen las relacionadas con la escala de medición, el muestreo aleatorio, la normalidad de la distribución de los datos, la adecuación del tamaño de la muestra y la igualdad de varianza en la desviación estándar.

Una prueba T es un método estadístico utilizado para determinar si existe una diferencia significativa entre los promedios de dos grupos sobre la base de una muestra de datos.
La prueba se basa en una serie de condiciones que se interpretarán correctamente y con validez.
Entre estas hipótesis, los datos deben ser campeonatos al azar por la población de interés y que las variables de los datos siguen una distribución normal.

La prueba t fue desarrollada por un químico que trabaja para la empresa Guinness Brewer como una forma simple de medir la calidad constante de la cerveza oscura. Se ha desarrollado y adaptado aún más y ahora se refiere a cualquier prueba de una hipótesis estadística en la que se espera que las estadísticas de la cabeza correspondan a una distribución t si la hipótesis no es compatible.

Una prueba t es un análisis de dos medios de poblaciones mediante el uso del examen estadístico; Una prueba t con dos muestras se usa comúnmente con pequeñas muestras, probando la diferencia entre las muestras cuando no se conocen las variaciones de dos distribuciones normales.

¿Qué es la prueba t de Student para muestras independientes?

La prueba t de Student permite comparar dos medios independientes con pequeñas muestras y sin conocer la varianza de la población.

Vimos en una publicación anterior cómo William Sealy Gosset, con la ayuda de algunos amigos, diseñó una distribución de probabilidad para llevar a cabo su noble esfuerzo para mejorar la producción de destilerías de Guinness.

Esta distribución se publicó bajo un seudónimo, por lo que se conoce como distribución T de Student, en lugar de la T de Gosset, o algo similar.

La distribución de probabilidad de T de los estudiantes permite comparar dos medios cuando las muestras son pequeñas y la varianza de la población es desconocida, una situación que es bastante frecuente.

Entonces, usando una historia que es el fruto de mi imaginación (aunque bien podría ser cierto), veamos cómo Gosset aprovechó esta nueva distribución.

Supongamos que un fertilizante dado se ha utilizado hasta ahora en la granja de la destilería, que llamaremos para no esforzarnos demasiado, pero que alguien ha estado haciendo algunos experimentos con una nueva, que llamaremos B.

El fertilizante B aumenta la producción de malta, pero Gosset cree que la cerveza hecha con esta malta es un poco más ácida, lo que, si es cierto, la descartaría como un sustituto del fertilizante clásico A.

Para aclarar cualquier duda, Gosset decide dividir una sección de la tierra de la granja en 50 parcelas diferentes, sembrar cada una de ellas y usar, al azar, el fertilizante A en 25 de las parcelas y B en las otras 25.

¿Cuándo se utiliza la prueba t de Student para datos independientes?

La prueba t de Student para muestras independientes se usa para determinar si hay una diferencia estadísticamente significativa entre los promedios de dos grupos independientes. Por ejemplo, puede usar esta prueba para evaluar si hay una diferencia en los tiempos de espera promedio en la sala de emergencias entre dos hospitales diferentes.

La prueba t se puede usar para determinar si un solo grupo difiere de un valor conocido (prueba t a una muestra), si dos grupos difieren entre sí (prueba t a dos campeones independientes), o si hay una diferencia significativa en el Medidas que han aparecido (prueba T a muestras dependientes o aparecieron).

Estas pruebas se usan cuando se viola al menos una de las contrataciones en la base de la prueba de estudiante T o EVA. Se llaman «no patétricos» porque no implican la estimación de los parámetros estadísticos (medios, desviación estándar, varianza, etc.).

La prueba de chi-quadrato se usa para verificar la hipótesis de que los datos corresponden a los esperados. La idea detrás de la prueba es comparar los valores observados en los datos y los esperados si la hipótesis no es cierta.

En la teoría de la probabilidad, la distribución del estudiante, o T del estudiante, es una distribución de probabilidad continua que rige la relación entre dos variables aleatorias, la primera con la distribución normal y la segunda, en el cuadrado, sigue a una distribución que cuadrada.

Hoy, de hecho, la prueba t se realiza en la computadora con la ayuda de software especial, incluida en los paquetes estadísticos o disponible en la red. Por ejemplo, al final de esta unidad encontrará una hoja de cálculo con la cual calcular el valor T en una serie de datos que puede ingresar.

¿Cómo se hace la prueba t de Student?

Este artículo describe la prueba t de Student Independent, que se utiliza para comparar los promedios de dos grupos independientes. Esta prueba también se llama prueba t de Student y prueba t de prueba. Por ejemplo, es posible que desee comparar los pesos promedio de las personas reunidas por sexo: grupos de hombres y mujeres, que son dos grupos no relacionados o independientes.

La prueba t para muestras independientes se presenta en dos formas diferentes:

Prueba estándar del estudiante, que supone que la varianza de los dos grupos es igual.
Prueba t de Welch, que es menos restrictiva que la prueba original del estudiante. Esta prueba se describe en un capítulo dedicado.

Tenga en cuenta que la prueba t de Welch se considera la más prudente. Por lo general, los resultados de la prueba t de estudiante clásica y la prueba t Welch son muy similares, a menos que el tamaño de los grupos y las desviaciones estándar sean muy diferentes.

Prueba estándar del estudiante, que supone que la varianza de los dos grupos es igual.
Prueba t de Welch, que es menos restrictiva que la prueba original del estudiante. Esta prueba se describe en un capítulo dedicado.

Fórmula e hipótesis de prueba t de Student

Cómo calcular, interpretar e informar la prueba t de Student en R.

La clásica prueba t de Student es más restrictiva. Se supone que los dos grupos tienen la misma varianza de la población. Si las variaciones de los dos grupos son equivalentes (homoscedasticidad), el valor de la prueba t, que comparan las dos muestras (A y B), se puede calcular de la siguiente manera.

Prueba estándar del estudiante, que supone que la varianza de los dos grupos es igual.
Prueba t de Welch, que es menos restrictiva que la prueba original del estudiante. Esta prueba se describe en un capítulo dedicado.

Fórmula e hipótesis de prueba t de Student

Cómo calcular, interpretar e informar la prueba t de Student en R.

(M_a ) y (m_b ) representan el valor promedio de los grupos A y B, respectivamente.

(n_a ) y (n_b ) representan los tamaños de los grupos A y B, respectivamente.

(S^2 ) es un estimador de la varianza de agrupación de los dos grupos. Se puede calcular de la siguiente manera:

[
S^2 = frac { sum {(x-m_a)^2}+ sum {(x-m_b)^2}} {n_a+n_b-2}
]

¿Cómo se realiza una prueba t de Student?

Ahora consideramos tener que lidiar con 2 muestras acopladas juntas X e Y. Esto significa que cada elemento de x corresponde a un elemento de Y. Por lo tanto, las dos muestras tendrán el mismo tamaño n = m. Este es el caso, por ejemplo, en UCI, desea verificar la efectividad de un tratamiento al monitorear una característica antes y después del tratamiento.

Imaginemos que los dos campeones normalmente se distribuyen. Dentro de cada muestra, los datos son independientes entre sí. Luego, para cada pareja, XI y YI podemos calcular la diferencia:

Y podemos calcular el promedio de estas diferencias:

Para este promedio, imaginamos un valor teórico δ con el que queremos comparar nuestro promedio. Entonces, la forma:

No es más que una distribución estandarizada normal donde σd representa la desviación estándar de los pares de parejas. Dado que σd no se conoce en la mayoría de las aplicaciones, aproximadamente aproximadamente con la desviación estándar de la muestra. Luego tenemos la variable t tan definida:

Esta variable T sigue una distribución de estudiante T con grados de libertad N-1. A menudo en aplicaciones prácticas δ = 0. En el caso de muestras acopladas, por lo tanto, al poder fluir a una sola distribución de diferencias D, la prueba t para comparar los dos grupos es una prueba t de una muestra. Recuerde que, cuando se trata de campeones muy grandes, la prueba t de dos muestras emparejada también puede ser reemplazada por una prueba Z de dos muestras emparejada.

¿Cómo se hace la prueba de t de Student?

Vaya al análisis de datos (barra multifunción)> de datos. Desde el diálogo que se abre, encuentra tres tipos de pruebas t, para llevar a cabo pruebas más elaboradas. Las tres pruebas t (acopladas, varianza idéntica y diferente) presentes aquí son las mismas que la función Testt.

Lo primero que debe hacer para responder a esta pregunta es calcular la diferencia promedio entre los votos de los hombres y los de las mujeres. Esta operación es muy simple. En este caso, los hombres obtuvieron un voto promedio de 26/30 y las mujeres de 23/30. La diferencia entre los dos promedios es, por lo tanto, igual a 26-23 = 3.

La forma de distribución t depende de los grados de libertad. Las curvas con más grados de libertad son más altas y tienen colas más delgadas. Las tres distribuciones T tienen más colas «pesadas» que la distribución Z. Es posible observar cómo las curvas con más grados de libertad tienden a parecerse a la distribución Z.

Si el valor p> α, la evidencia empírica no es suficientemente contraria a la hipótesis, nada que por lo tanto no se puede rechazar; Si el valor p ≤ α, la evidencia empírica es fuertemente contraria a la hipótesis, nada que, por lo tanto, debe rechazarse. En este caso se dice que los datos observados son estadísticamente significativos.

¿Cómo se realiza la Prueba T para muestras independientes?

Este artículo describe la fórmula de prueba t independiente, que se utiliza para comparar los promedios de dos grupos independientes. La fórmula de prueba t independiente también se llama:

fórmula de prueba t no remunerada,
Test Formula T para muestras independientes,
Fórmula de prueba con dos muestras,
Fórmula de prueba T para 2 muestras y
Ecuación de prueba T con dos muestras

La prueba t para muestras independientes se presenta en dos formas diferentes:

fórmula de prueba t no remunerada,
Test Formula T para muestras independientes,
Fórmula de prueba con dos muestras,
Fórmula de prueba T para 2 muestras y
Ecuación de prueba T con dos muestras

Prueba estándar del estudiante, que supone que la varianza de los dos grupos es igual.

Prueba t de Welch, que es menos restrictiva que la prueba original del estudiante. Esta es la prueba en la que no supone que la varianza es la misma en los dos grupos, lo que da los siguientes grados fraccionales de libertad.

En este artículo, aprenderá la fórmula de prueba t de Student y el formulario de prueba t de Weltch.

fórmula de prueba t no remunerada,
Test Formula T para muestras independientes,
Fórmula de prueba con dos muestras,
Fórmula de prueba T para 2 muestras y
Ecuación de prueba T con dos muestras