Por ejemplo, puede voltear una moneda 1,000 veces y encontrar que el número de cabezas sigue una distribución normal para todas las pruebas. Por lo tanto, puede calcular la varianza de la muestra a partir de estos datos, pero la varianza de la población es desconocida. O bien, una compañía farmacéutica puede querer probar un nuevo medicamento contra el cáncer para averiguar si mejora la esperanza de vida. En un experimento, siempre hay un grupo de control (un grupo que recibe un placebo o «píldora de azúcar»). Entonces, si bien el grupo de control puede mostrar una esperanza de vida promedio de +5 años, el grupo que toma el nuevo medicamento podría tener una esperanza de vida de +6 años. Parece que la droga podría funcionar. Pero podría deberse a una casualidad. Para probar esto, los investigadores usarían la prueba t de un estudiante para averiguar si los resultados son repetibles para toda una población.
Sin embargo, tenga en cuenta que solo puede usar una prueba t para comparar dos medios. Si desea comparar tres o más medios, use un ANOVA en su lugar.
La puntuación T es una relación entre la diferencia entre dos grupos y la diferencia dentro de los grupos.
- Puntajes T más grandes = más diferencia entre grupos.
- Puntuación T más pequeña = más similitud entre los grupos.
Una puntuación T de 3 te dice que los grupos son tres veces más diferentes entre sí que en el otro. Entonces, cuando se ejecuta una prueba t, los valores T más grandes equivalen a una mayor probabilidad de que los resultados sean repetibles.
¿Cómo utilizar la distribución t?
La distribución T es una distribución de probabilidad continua que es simétrica y en forma de campana, como la distribución normal, pero con un pico más corto y colas más gruesas. Fue diseñado para tener en cuenta la mayor incertidumbre asociada con pequeños tamaños de muestra.
La distribución T describe la variabilidad de las distancias entre las medias de la muestra y la media de la población cuando se desconoce la desviación estándar de la población y los datos siguen aproximadamente la distribución normal. Esta distribución tiene solo un parámetro, los grados de libertad, basados en (pero no igual) en el tamaño de la muestra.
La distribución T, también conocida como Distribución de T Students, fue desarrollada por William Sealy Gosset en 1908 para su uso con pequeños tamaños de muestra. En aquel entonces, la distribución Z y la prueba Z correspondiente estaban disponibles para probar medios, pero son válidos para grandes tamaños de muestra. No hubo distribución diseñada para muestras pequeñas.
Gosset fue el principal cervecero de la cervecería Guinness en Dublín y se dedicó a aplicar el método científico a la producción de cerveza. Necesitaba un procedimiento para analizar estadísticamente pequeños lotes de cebada. Después de desarrollar la distribución T para este propósito, la cervecería quería que Gosset publicara usando un seudónimo para que los competidores no aprendieran sobre sus métodos. Por lo tanto, publicó usando el seudónimo de estudiante. ¡Por eso tenemos la «prueba t de Student» hoy!
- Valores críticos que definen los límites superior e inferior de un intervalo de confianza.
Use la distribución T cuando necesite evaluar la media y no conozca la desviación estándar de la población. Es particularmente importante usarlo cuando tiene un tamaño de muestra pequeño (n <30). ¡Más sobre este aspecto a continuación!
¿Cómo se usa la distribución t?
La distribución T fue introducida en 1908 por un químico llamado William Sealy Gosset. Contratado por la célebra cervecería Guinness en su búsqueda de formular mejores procesos industriales a través de la aplicación de bioquímica, Gosset no perdió el tiempo en la disposición de la prueba t como un método rentable para monitorear la calidad de Stout. Sin embargo, fue la política de la compañía en Guinness durante ese tiempo para prohibir que los químicos publiquen sus hallazgos. Esto no disuadió a Gosset y rápidamente publicó su trabajo estadístico bajo el estudiante del seudónimo. Para comprender los principios básicos detrás de una distribución T, consideremos un tamaño de muestra de N observaciones elegidas de una distribución de población normal estándar con una media denotada por m y una desviación estándar denotada por D. ahora, se observará que la muestra media M y la desviación estándar de la muestra D difieren de M y D. Esta varianza puede atribuirse a la aleatoriedad de la muestra. De las consideraciones anteriores, será posible calcular una puntuación Z mediante el uso de la siguiente fórmula. Z = (m m)/{d/sqrt (n)} El puntaje Z calculado usando la fórmula anterior tiene un valor de distribución normal con una media de 0 y una desviación estándar de 1. Ahora, consideremos la misma Z- puntaje calculado aplicando la desviación estándar estimada con la siguiente fórmula t = (m m)/{d/sqrt (n)} Se observará que la diferencia entre d y d convierte la distribución normal en una distribución t que exhibe (n (n – 1) Grados de libertad.
El teorema del límite central postula que en tamaños de muestra grandes, la distribución de muestreo de una estadística se inclina a seguir una distribución normal. Como tal, es un proceso directo para calcular una puntuación Z, siempre que se conozca la desviación estándar de la población. Esto, a su vez, permite a los estadísticos evaluar las probabilidades con la media de la muestra utilizando la distribución normal. Sin embargo, en el caso de muestras más pequeñas, la desviación estándar de la población a menudo se desconoce y, como tales, los estadísticos utilizan la distribución de la estadística T. En resumen, la distribución T permite a los estadísticos realizar análisis estadísticos en conjuntos de datos más pequeños que de otro modo no se pueden analizar utilizando la distribución normal. Según los estadísticos, Frederick Mosteller y John Tukey, el valor del trabajo de los estudiantes no tiene un gran cambio numérico, sino en el supuesto de que es posible tener en cuenta las incertidumbres de pequeñas muestras, incluso en estudios que difieren enormemente de los estudiantes de los estudiantes. problema original. Según Mosteller y Tukey, el valor del trabajo de los estudiantes también se basa en la provisión de una evaluación numérica de cuán pequeños fueron los ajustes numéricos de los puntos de confianza en el problema de los estudiantes y cómo se basaron en la extremidad de las probabilidades involucradas. Por último, el valor del trabajo de los estudiantes también establece en la presentación de tablas que podrían usarse para evaluar la incertidumbre asociada con muestras de datos incluso minuciosas.
Según Mosteller y Tukey, la distribución T también sufrió ciertos inconvenientes y limitaciones. Para empezar, los estadísticos que usan la distribución T eran fácilmente propensos a descuidar la condición de que las soluciones serían ciertas si y solo si se mantuvieran supuestos apropiados. En segundo lugar, una distribución T generalmente tiende a enfatizar demasiado la precisión de la solución de los estudiantes para su problema idealizado. Por último, la distribución T ayudó a desviar la atención de los estadísticos teóricos al desarrollo de formas exactas de tratar otros problemas.
¿Cómo se utiliza la t de Student?
La supuesta relación entre el director y el alumno del Liceo de Roma. A.S., 18 años: «Me aconsejaron que no hiciera declaraciones». Los compañeros de escuela: «Continúa llegando a las lecciones, él es su derecho. Este es el año de madurez «
Cara limpia, actitud compuesta. A. S., un estudiante adulto de la Escuela Secundaria Eugenio Montale en Via Bravetta, parecería un adolescente como los demás si no fuera eso, en estos días cuando su escuela ha terminado el centro de la atención de los medios, mira nerviosamente. La razón es que no quiere hablar más de la relación sentimental que habría tenido con la gerente de la escuela Sabrina prestada y que él mismo denunció hace unas semanas al ex vicepresidente y su maestra italiana.
«Me aconsejaron que no me exponiera y no hiciera declaraciones sobre esta historia», es su única respuesta. «La misma línea, especifica, están siguiendo a mis padres». No es una palabra, hasta que no se determine la realidad de los hechos. En primer lugar, por el inspector designado la semana pasada por la Oficina de la Escuela Regional de Lazio para llevar a cabo las investigaciones al Montale. De la relación se entenderá si el director, que niega haber tenido algún tipo de relación ambigua con el niño, tendrá que ser despedido o si el alumno lo ha inventado todo. Mientras tanto, a pesar de la tormenta que estalló dentro del Instituto, A. S. como estudiante modelo que continúa ir a la escuela todos los días. ¿Es porque se siente callado sobre lo que le dijo a sus amigos y maestros? Para responder por él son los compañeros de escuela a su alrededor a la salida de las 12:40. «Él continúa llegando porque afortunadamente es su derecho, sigue siendo el año de madurez. Esta historia y el derecho a estudiar son dos cosas que deben permanecer separadas », Informe.
Pero más allá de la pregunta en sí, ¿cómo es la experiencia del niño en estos días? Permanece en el vago en este caso, pero la respuesta sarcástica y la tensa sonrisa sugieren que hay una cierta tensión. «¿Como estoy? Muy bueno. Dormí bien, la mañana ha pasado, y ahora solo espero el almuerzo ». La descripción de un día como los demás, como estudiante de secundaria normal. Lo que probablemente A. S. quiera volver a ser lo antes posible.
Si desea mantenerse actualizado sobre las noticias de Roma, regístrese gratis en el boletín «The Seven Hills of Rome» de Giuseppe di Piazza. Llega todos los sábados en su buzón a las 7 de la mañana. Simplemente haga clic aquí.
¿Cuándo se utiliza la Prueba T de Student?
En el área de las estadísticas, la prueba t de un estudiante se menciona como un método para probar la teoría sobre la media de una pequeña muestra extraída de una población normalmente distribuida donde se desconoce la desviación estándar de la población dada.
Podemos definir la prueba t de Student como un método que le dice cuán significativas pueden ser las diferencias entre diferentes grupos. Una prueba t de Student se define como una estadística y esto se usa para comparar los medios de dos poblaciones diferentes.
Es un método que a menudo se usa en las pruebas de hipótesis para descubrir si un proceso o si un tratamiento dado realmente tiene algún efecto en la población de interés, o si dos poblaciones son o no diferentes entre sí. Desea saber si la longitud media del pétalo de las flores de iris difiere de acuerdo con sus especies distintas. Encuentra dos especies diferentes de flores de iris que crecen en un jardín y miden 25 pétalos de cada especie. Puede probar la diferencia entre estos dos grupos con la ayuda de la prueba t de Student.
La hipótesis nula (H0) es una que dice la verdadera diferencia entre estos grupos.
La hipótesis alternativa (HA) es una que dice que la verdadera diferencia es diferente de cero.
En el año 1908, un inglés llamado William Sealy Gosset desarrolló la prueba T y la distribución T. (Gosset trabajó en la cervecería Guinness en Dublín y descubrió que las técnicas estadísticas existentes con muestras grandes no eran útiles para los pequeños tamaños de muestra que encontró en su trabajo).
¿Cómo calcular la distribución t?
La distribución T es un método estadístico utilizado en la fórmula de distribución de probabilidad, y varios estadísticos lo han recomendado y utilizado ampliamente en el pasado. El método es apropiado y se utiliza para estimar los parámetros de la población cuando el tamaño de la muestra es pequeño y cuando se desconoce la varianza de la población.
El ingeniero de una compañía de agua que fabrica bombas de agua afirma que la bomba de agua promedio puede durar 200 días. Sin embargo, mientras buscaba, un investigador descubrió que una bomba de agua promedio puede durar solo 180 días con una desviación estándar de 40 cuando se selecciona de una muestra aleatoria de 15 bombas con el propósito de las pruebas. Entonces, si las afirmaciones del ingeniero fueran ciertas, ¿debemos determinar la probabilidad de que 15 bombas seleccionadas al azar tengan una vida promedio de más de 200 días?
Primero, para resolver este problema, necesitamos identificar las variables en el problema.
La distribución t se calcula utilizando la fórmula que se proporciona a continuación
- T Distribución = (200 – 180) / (40 / √15)
- T Distribución = 20 / 10.32
- T Distribución = 1.94
El CEO de una startup está evaluando los términos de la licencia de sus contratos y encuentra que el contrato promedio dura 300 días. Un auditor, mientras audita los términos de la licencia de los contratos, descubre que un contrato promedio dura 260 días con una desviación estándar de 35 cuando se selecciona de una muestra aleatoria de 12 contratos a los fines de las pruebas. Si las afirmaciones del auditor fueran ciertas, ¿necesitamos averiguar la probabilidad de que 12 contratos seleccionados al azar tengan una vida promedio de más de 300 días?
¿Cómo se distribuye t?
La distribución T describe las distancias estandarizadas de las muestras promedio del promedio de la población cuando se desconoce la desviación estándar de la población y las observaciones se derivan de una población de distribución normal.
La distribución Z (o distribución estandarizada normal) establece que la desviación estándar de la población lo sabe. La distribución T se basa en la desviación estándar de la muestra.
La distribución T es similar a una distribución normal y tiene una definición matemática precisa. En lugar de entrar en cálculos complejos, veamos cuáles son las propiedades útiles de la distribución t y porque es importante en la fase de análisis.
- La distribución T tiene una forma armoniosa como la distribución normal.
- La distribución T es simétrica como distribución normal. Si te imaginas doblarlo por la mitad en el promedio, las dos partes serán idénticas.
- La distribución T tiene un promedio de cero, como la distribución normal estandarizada (o distribución z).
- La distribución normal establece que la desviación estándar de la población sabe, a diferencia de la distribución t.
- La distribución T está definida por los grados de libertad, que dependen de la dimensión de la muestra.
- La distribución T es más útil cuando se reducen las dimensiones de la muestra, cuando no se conoce la desviación estándar de la población o en el caso de que ambas condiciones valgan.
- Con el aumento en el tamaño de la muestra, la distribución T es cada vez más similar a una distribución normal.
Observamos el siguiente gráfico en el que se comparan tres distribuciones t con una distribución normal estandarizada:
Todas las distribuciones tienen una forma armoniosa, son simétricas y tienen un promedio de cero.
¿Qué es la tabla de distribución t?
Nivel de significancia (Alpha α): elija la columna en la tabla de distribución T que contenga el nivel de significancia para su prueba. Asegúrese de elegir el alfa para una prueba t de una o dos colas basada en la metodología de su prueba t. Obtenga más información sobre el nivel de significancia y las pruebas de una y dos colas.
Grados de libertad (DF): elija la fila de la tabla t que corresponde a los grados de libertad en su prueba t. La fila final en la tabla enumera los valores críticos de la distribución z para la comparación. Obtenga más información sobre grados de libertad.
Valores críticos: en la tabla de distribución t, encuentre la celda en la columna y la intersección de fila. Cuando realizas un:
- Prueba t de dos colas: use el valor crítico positivo y la forma negativa para cubrir ambas colas de la distribución.
- Prueba t de una cola: use el valor crítico positivo o el valor negativo dependiendo de si está utilizando una prueba superior (+) o inferior (-) del lado.
Supongamos que realiza una prueba t de dos colas con un nivel de significancia de 0.05 y 20 grados de libertad, y necesita encontrar los valores críticos.
En la tabla de distribución T, encuentre la columna que contiene alfa = 0.05 para la prueba de dos colas. Luego, encuentre la fila correspondiente a 20 grados de libertad. La table T truncada a continuación muestra el valor t crítico.
La tabla T indica que los valores críticos para nuestra prueba son -2.086 y +2.086. Use los valores positivos y negativos para una prueba de dos lados. Sus resultados son estadísticamente significativos si su valor T es menor que el valor negativo o mayor que el valor positivo. El siguiente gráfico ilustra estos resultados.
Artículos Relacionados: