Paso 4: Seleccione la variable dependiente del panel de la ventana izquierda y luego haga clic en el botón de flecha superior para mover las variables a las variables de prueba (s): ventana. Para este ejemplo, estamos comparando GPA, por lo que la variable de prueba que queremos seleccionar es GPA.
Paso 5: Seleccione la variable independiente en la ventana izquierda y luego haga clic en la flecha a la izquierda de la caja «Variable de agrupación». La variable de agrupación es la variable que dividió en grupos cuando definió variables. Para este ejemplo, los grupos son «masculinos» y «femeninos», por lo que la variable de agrupación que desea seleccionar es «sexo».
Paso 6: haga clic en «Definir grupos». Para este ejemplo, escriba «1» en el cuadro del Grupo 1 (para mujeres) y luego escriba «2» en el cuadro del Grupo 2 (para hombres).
Paso 7: haga clic en «Continuar» y luego haga clic en «Aceptar». La prueba se calcula y los resultados aparecerán en una nueva ventana.
- La prueba de Levine para igual varianza (la primera sección del cuadro de prueba de muestras independientes). Si el nivel de significancia es mayor que .05, debe usar la primera línea en la tabla de salida, se asumieron las variaciones iguales. Si el valor es .05 o menor, use la segunda fila de resultados.
- Sig (2 colas): use el valor indicado en la prueba de Levine. Si este valor p está por encima de .05, entonces no hay una diferencia significativa en los puntajes de las pruebas.
(Σa) 2: Suma del conjunto de datos A, cuadrado (paso 2).
(Σb) 2: Suma del conjunto de datos B, cuadrado (paso 2).
μA: Media del conjunto de datos A (paso 3)
μB: media del conjunto de datos B (paso 3)
ΣA2: suma de los cuadrados del conjunto de datos A (paso 4)
Σb2: suma de los cuadrados del conjunto de datos B (paso 4)
NA: Número de elementos en el conjunto de datos un
NB: Número de elementos en el conjunto de datos B
¿Cuándo se aplica Prueba T?
La prueba t es un tipo de estadísticas inferenciales. Se utiliza para determinar si hay una diferencia significativa entre las medias de dos grupos. Con todas las estadísticas inferenciales, suponemos que la variable dependiente se ajusta a una distribución normal. Cuando asumimos que existe una distribución normal, podemos identificar la probabilidad de un resultado particular. Especificamos el nivel de probabilidad (nivel alfa, nivel de importancia, p) que estamos dispuestos a aceptar antes de recopilar datos (p <.05 es un valor común que se usa). Después de recopilar datos, calculamos una estadística de prueba con una fórmula. Comparamos nuestra estadística de prueba con un valor crítico que se encuentra en una tabla para ver si nuestros resultados se encuentran dentro del nivel aceptable de probabilidad. Los programas de computadora modernos calculan la estadística de prueba para nosotros y también proporcionan la probabilidad exacta de obtener esa estadística de prueba con el número de sujetos que tenemos.
Cuando se investiga la diferencia entre dos promedios de población, se utiliza una prueba t. En otras palabras, se usa una prueba t cuando deseamos comparar dos medios (los puntajes deben medirse en una escala de medición de intervalo o relación). Usaríamos una prueba t si quisiéramos comparar el logro de lectura de niños y niñas. Con una prueba t, tenemos una variable independiente y una variable dependiente. La variable independiente (género en este caso) solo puede tener dos niveles (hombre y mujer). La variable dependiente sería leer el logro. Si el independiente tuviera más de dos niveles, entonces usaríamos un análisis de varianza unidireccional (ANOVA).
La estadística de prueba que produce una prueba t es un valor t. Conceptualmente, los valores T son una extensión de los puntajes Z. En cierto modo, el valor T representa cuántas unidades estándar se separan los medios de los dos grupos.
¿Cuándo se utiliza el estadístico t para prueba de hipótesis?
Una prueba t mide la diferencia en las medias grupales divididas por el error estándar agrupado de las dos medias de grupo.
De esta manera, calcula un número (el valor T) que ilustra la magnitud de la diferencia entre los dos medios de grupo que se comparan, y estima la probabilidad de que esta diferencia exista puramente por casualidad (valor p).
La estadística de prueba le dice cuán diferentes o más grupos son de la población general de la población, o cuán diferente es una pendiente lineal de la pendiente predicha por una hipótesis nula. Se utilizan diferentes estadísticas de prueba en diferentes pruebas estadísticas.
La significación estadística es arbitraria: depende del umbral, o valor alfa, elegido por el investigador. El umbral más común es P <0.05, lo que significa que es probable que los datos ocurran menos del 5% del tiempo bajo la hipótesis nula.
Cuando el valor p cae por debajo del valor alfa elegido, entonces decimos que el resultado de la prueba es estadísticamente significativo.
Su elección de la prueba t depende de si está estudiando un grupo o dos grupos y si le importa la dirección de la diferencia en los medios grupales.
Si está estudiando un grupo, use una prueba t pareada para comparar la media del grupo con el tiempo o después de una intervención, o use una prueba t de una muestra para comparar la media del grupo con un valor estándar. Si está estudiando dos grupos, use una prueba t de dos muestras.
Si desea saber solo si existe una diferencia, use una prueba de dos colas. Si desea saber si un grupo de grupo es mayor o menor que el otro, use una prueba de cola de cola izquierda o de cola derecha.
¿Qué es la prueba de hipótesis para dos muestras independientes?
La prueba t de dos muestras (también conocida como prueba t de muestras independientes) es un método utilizado para probar si los medios de población desconocidos de dos grupos son iguales o no.
Sí, se utiliza una prueba t de dos muestras para analizar los resultados de las pruebas A/B.
Puede usar la prueba cuando sus valores de datos son independientes, se muestrean aleatoriamente de dos poblaciones normales y los dos grupos independientes tienen variaciones iguales.
Use un método de comparación múltiple. El análisis de varianza (ANOVA) es uno de esos métodos. Otros métodos de comparación múltiple incluyen la prueba de Tukey-Kramer de todas las diferencias por pares, el análisis de las medias (ANOM) para comparar las medias de grupo con la media general o la prueba de Dunnett para comparar cada media de grupo con una media de control.
Todavía puede usar la prueba t de dos muestras. Utiliza una estimación diferente de la desviación estándar.
Si sus tamaños de muestra son muy pequeños, es posible que no pueda probar la normalidad. Es posible que deba confiar en su comprensión de los datos. Cuando no puede asumir de manera segura la normalidad, puede realizar una prueba no paramétrica que no asuma normalidad.
Las secciones a continuación discuten lo que se necesita para realizar la prueba, verificando nuestros datos, cómo realizar la prueba y los detalles estadísticos.
Para la prueba t de dos muestras, necesitamos dos variables. Una variable define los dos grupos. La segunda variable es la medición de interés.
También tenemos una idea o hipótesis de que los medios de las poblaciones subyacentes para los dos grupos son diferentes. Aquí hay un par de ejemplos:
- Tenemos estudiantes que hablan inglés como su primer idioma y estudiantes que no. Todos los estudiantes toman una prueba de lectura. Nuestros dos grupos son los hablantes nativos de inglés y los hablantes no nativos. Nuestras mediciones son los puntajes de las pruebas. Nuestra idea es que los puntajes medios de las pruebas para las poblaciones subyacentes de hablantes de inglés nativos y no nativos no son los mismos. Queremos saber si la puntuación media para la población de hablantes nativos de inglés es diferente de las personas que aprendieron inglés como segundo idioma.
¿Qué son muestras independientes en una prueba de hipótesis?
Una prueba T de muestras independientes evalúa si 2 poblaciones tienen medias iguales en alguna variable.
Si las medias de la población son realmente iguales, entonces las medias de muestra probablemente diferirán un poco, pero no demasiado. Las medias de muestra muy diferentes son muy poco probables si las medias de población son iguales. Por lo tanto, este resultado de la muestra sugiere que la población significa que no era igual después de todo.
Las muestras son independientes porque no se superponen; Ninguna de las observaciones pertenece a ambas muestras simultáneamente. Un ejemplo de libro de texto es las encuestadas masculinas versus mujeres.
Alguna isla tiene 1,000 hombres y 1,000 habitantes femeninas. Un investigador quiere saber si los hombres pasan más o menos minutos en el teléfono cada mes. Idealmente, preguntaría a los 2.000 habitantes, pero esto lleva demasiado tiempo. Entonces muestra 10 hombres y 10 hembras y les pregunta. Parte de los datos se muestran a continuación.
A continuación, calcula los medios y las desviaciones estándar de las actas telefónicas mensuales para los encuestados masculinos y femeninos por separado. Los resultados se muestran a continuación.
Estas medias de muestra difieren en algunos (99 – 106 =) -7 minutos: en promedio, las mujeres pasan unos 7 minutos menos en el teléfono que los hombres. Pero esas son solo nuestras pequeñas muestras. ¿Qué podemos decir sobre todas las poblaciones? Lo descubriremos comenzando con la hipótesis nula.
¿Qué es la prueba de hipótesis de dos muestras?
A menudo se quiere comparar dos tratamientos o poblaciones y determinar
Si hay una diferencia. Esto se puede hacer con o sin
pareo. La coincidencia produce dependencia entre los dos
muestras y se discutirán después del caso inigualable/independiente.
Los diversos supuestos realizados en esta situación afectan principalmente
El número apropiado de grados de libertad para ser utilizado. Este
puede variar de una muestra menos que la muestra más pequeña a dos menos
que la suma de los tamaños de muestra con varios valores entre
posible. La elección refleja la conservaduría del
investigador y la atención tomada al evaluar el subyacente
supuestos. Parece haber conflicto entre varios
fuentes que aún tengo que resolver.
dos poblaciones distintas (la coincidencia negaría la independencia);
y ambas poblaciones se distribuyen normalmente con desconocido
medias y desviaciones estándar.
Nuestra hipótesis nula se vería como
H0: µ1 = µ2 o es posible que queramos dar
Un intervalo de confianza para la diferencia µ1-µ2.
Utilizamos las medias de muestra y las desviaciones estándar para estimar lo desconocido
parámetros. Aunque la estadística
1 –
2
tiene una distribución normal en términos de la varianza de población combinada,
Cuando usamos la varianza de muestra combinada, no obtenemos una t
distribución. No obstante, utilizamos la distribución T
para pruebas de hipótesis en este caso.
La estadística T de dos muestras es la siguiente:
La expresión en el denominador refleja la forma en que se suma las variaciones
(Las desviaciones estándar no suman).
Hay dos opciones para obtener un valor para los grados de libertad.
Calcule un grado fraccional de libertad como se da a continuación,
o use el más pequeño de N1-1 o N2-1.
Este último valor siempre resulta en resultados conservadores.
A medida que aumenta el tamaño de la muestra, este último procedimiento también se vuelve más preciso.
Los procedimientos T de dos muestras son más robustos que el
Los métodos de una muestra, especialmente cuando las distribuciones no son simétricas.
Si los dos tamaños de muestra son iguales y las dos distribuciones tienen
formas similares, puede ser preciso a los tamaños de muestra tan pequeños como
n1 = n2 = 5.
El procedimiento T de dos muestras es más robusto contra la no normalidad
Cuando las dos muestras son de igual tamaño. Así cuando planea tal
Estudia, debes hacerlos iguales.
Supongamos que en lugar de dos poblaciones distintas que seleccionamos al azar
nuestra muestra y luego asignar al azar la mitad de los sujetos a un
Grupo experimental (tratamiento) y la otra mitad a un grupo de control.
En este caso y otros, las variaciones de la población son iguales
y el error estándar estimado de la diferencia
utilizado en la fórmula anterior:
SQRT (S12/N1 +
S22/N2)
simplifica
SQRT (S2 (1/N1 +
1/n2)).
Sin embargo, S2 es el
Estimación agrupada de la varianza de la población
que proviene de la suma de las sumas de cuadrados para el
Dos grupos divididos por N1 + N2 – 2,
que son los grados de libertad en este caso.
También se puede obtener de las dos variaciones de muestra
como s2 =
((N1 – 1) S12 +
(N2 – 1) S22)/
(N1 + N2 – 2)
¿Cómo saber si dos muestras son independientes?
Se puede ejecutar una prueba t independiente de dos muestras en datos de muestra de una variable de resultado Numérico Normalmente distribuido para determinar si su media difiere en dos grupos independientes. Por ejemplo, podríamos ver si el GPA medio difiere entre estudiantes universitarios de primer año y senior al recolectar una muestra de cada grupo de estudiantes y registrar sus GPA.
Hipótesis: HO: La media de la población de un grupo es igual a la media de la población del otro grupo, o μ1 = μ2 ha: la media de la población de un grupo no es igual a la media de la población del otro grupo, o μ1 ≠ μ2
Esta prueba también se puede realizar con una hipótesis alternativa direccional: HO: la media de la población de un grupo es igual a la media de la población del otro grupo, o μ1 = μ2 ha: la media de la población de un grupo es mayor que la media de la población del otro grupo, o μ1> μ2
La estadística de prueba para una prueba t independiente de dos muestras se calcula tomando la diferencia en las dos medias de muestra y dividiendo por el error estándar estimado agrupado o no en marcha. El error estándar estimado es una medida agregada de la cantidad de variación en ambos grupos.
Grados de libertad: varía según las condiciones, pero la regla general básica para los cálculos manuales es la menor de N1 – 1 y N2 – 1, donde N es el tamaño de la muestra para cada grupo.
Si no se cumple la tercera suposición, la prueba alternativa es la prueba U de Mann-Whitney, que se puede ejecutar para ver si hay una diferencia entre dos grupos para una variable con cualquier tipo de distribución.
¿Cómo saber si dos muestras son independientes o dependientes?
La prueba es el método
Más extendido para evaluar las diferencias en los promedios entre dos grupos.
Los grupos pueden ser independientes (por ejemplo, presión arterial
Pacientes que han tomado medicamentos vs. Un grupo de control que recibió
un placebo) o emparejado (por ejemplo, presión arterial de los pacientes «antes»
vs. «Después de» tomar un medicamento, ver más abajo). Teóricamente,
La prueba se puede usar si
Los tamaños de muestra son muy pequeños (por ejemplo, del orden de
10; Algunos investigadores incluso afirman que n
son posibles más pequeños), siempre que las variables permanezcan aproximadamente
distribuido normalmente y que la dispersión en los resultados de los dos
los grupos no son muy diferentes (ver también la sección de conceptos
Elemental).
Prueba para muestras emparejadas.
La prueba de muestras
emparejado se puede utilizar para analizar los planes en los que
Dispersión intragrupo (que normalmente contribuye al error de medición)
se puede identificar y eliminar fácilmente del análisis. Mas presisamente,
Si las dos medidas a comparar se basan en la misma muestra
Observaciones (por ejemplo, sujetos) probadas dos veces (por ejemplo,
antes y después de un tratamiento), entonces una parte considerable de la dispersión
intragrupo en los dos resultados se puede atribuir a los grupos
diferencias individuales iniciales entre observaciones y así explicadas
(es decir, arraigado el error). Esto aumenta la sensibilidad
plan.
Compare un promedio con un estándar.
En la prueba de prueba de SO (t) de
Comparación con un estándar, el promedio observado (de una muestra)
se compara con el promedio teórico (o referencia) de la población (por
ejemplo, esperanza matemática), y la dispersión de la población es
estimado a partir de la dispersión de la muestra observada.
¿Cuáles son las muestras independientes?
En muestras independientes, los sujetos en un grupo no proporcionan información sobre sujetos en otros grupos. Cada grupo contiene diferentes temas y no hay una forma significativa de emparejarlos. Los grupos independientes son más comunes en las pruebas de hipótesis.
Por ejemplo, los siguientes experimentos usan muestras independientes:
- Un ensayo de medicamentos tiene un grupo de control y un grupo de tratamiento que contiene diferentes sujetos.
- Un estudio evalúa la fuerza de una parte hecha de diferentes aleaciones. Cada muestra de aleación contiene diferentes partes.
Los estudios que usan muestras independientes estiman los efectos entre sujetos. Estos efectos son las diferencias entre grupos, como la diferencia media. Por ejemplo, en el estudio de medicamentos, el efecto es la diferencia media entre los grupos de tratamiento y control. El enfoque está en comparar las propiedades del grupo en lugar de los individuos. El tamaño de la muestra para este tipo de estudio es el número total de sujetos en todos los grupos.
En muestras dependientes, los sujetos en un grupo proporcionan información sobre sujetos en otros grupos. Los grupos contienen el mismo conjunto de sujetos o diferentes sujetos que los analistas han emparejado de manera significativa.
Los grupos con frecuencia dependen porque contienen los mismos sujetos, ese es el ejemplo más común. Sin embargo, ese no es siempre el caso. Los grupos con diferentes sujetos pueden ser muestras dependientes si los sujetos en un grupo proporcionan información sobre los sujetos en el otro grupo. Por ejemplo, los estadísticos a menudo consideran diferentes muestras que incluyen pares de hermanos para ser dependientes porque un hermano puede proporcionar información sobre otro hermano para algunas mediciones. Otros estudios usan pares coincidentes. En estos estudios, los investigadores emparejan deliberadamente sujetos con características muy similares. Si bien los pares coincidentes son personas diferentes, el análisis estadístico los trata como la misma persona porque son intencionalmente muy similares.
Artículos Relacionados: