Pruebas de bondad de ajuste: ejemplos y explicación

Simplemente, la corrección de Bonferroni, también conocida como ajuste de tipo Bonferroni, es uno de los métodos más simples que se usan durante las pruebas de comparación múltiples. El nombre de su curador italiano, Carlo Emilio Bonferroni, el método de corrección de Bonferroni se utiliza para compensar el error tipo I.

El error tipo I, en el contexto de las pruebas de hipótesis, es la probabilidad de descubrir un resultado falso positivo, rechazando así una verdadera hipótesis nula.

Por lo general, la tasa de error tipo I (el nivel alfa) en las pruebas de hipótesis se establece en 5% (es decir, el valor p es 0.05). Esto significa que el 5% del tiempo, está dispuesto a aceptar un resultado falso positivo.

Sin embargo, cuando se hacen múltiples comparaciones, la tasa de error tipo I aumentará. Por ejemplo, supongamos que hay una hipótesis con 7 comparaciones que se realizan: ¿cuál es la probabilidad de descubrir un resultado falso positivo?

Por lo tanto, en lugar de una tasa del 5%, la tasa de error tipo I es ahora del 30%. En otras palabras, en esta situación, hay un 30% de posibilidades de descubrir un resultado falso positivo.

Ahora puede comprender la importancia de controlar las comparaciones múltiples.

El método de corrección de Bonferroni se refiere a un enfoque más simple, pero más conservador, para controlar el error tipo I.

Para realizar la corrección, simplemente divida el nivel alfa original (la mayoría de los que se establece en 0.05) por el número de pruebas que se realizan.

La salida de la ecuación es un valor de P con corrección de Bonferroni, que será el nuevo umbral que debe llegar a una sola prueba para clasificarse como significativa.

¿Cuáles son las pruebas de bondad de ajuste?

Por ejemplo, recolectamos tulipanes silvestres y descubrimos que 81 eran rojos, 50 eran amarillos y 27 eran blancos.

  • Pregunta 1:

Si estos colores se distribuyan por igual, la proporción esperada sería 1/3 para cada uno de los colores.

  • Pregunta 1:
  • Pregunta 2:
  • Suponga que, en la región donde recopiló los datos, la relación de tulipán rojo, amarillo y blanco es 3: 2: 1 (3+2+1 = 6). Esto significa que la proporción esperada es:

    • Pregunta 1:
  • Pregunta 2:
  • 3/6 (= 1/2) para rojo
  • 2/6 (= 1/3) para amarillo
  • 1/6 para blanco
  • Queremos saber, si hay alguna diferencia significativa entre las proporciones observadas y las proporciones esperadas.

    • Pregunta 1:
  • Pregunta 2:
  • 3/6 (= 1/2) para rojo
  • 2/6 (= 1/3) para amarillo
  • 1/6 para blanco
  • Hipótesis nula ( (H_0 )): no hay diferencias significativas entre el valor observado y el valor esperado.
  • Hipótesis alternativa ( (H_A )): hay una diferencia significativa entre el valor observado y el esperado.
  • El valor p de la prueba es 8.80310^{-7}, que es menor que el nivel de significancia alfa = 0.05. Podemos concluir que los colores no se distribuyen significativamente con un valor p = 8.80310^{-7}.

    Tenga en cuenta que la prueba de chi-cuadrado debe usarse solo cuando todos los valores esperados calculados son mayores que 5.

    El valor p de la prueba es 0.9037, que es mayor que el nivel de significancia alfa = 0.05. Podemos concluir que las proporciones observadas no son significativamente diferentes de las proporciones esperadas.

    El resultado de la función chisq.test () es una lista que contiene los siguientes componentes:

    • Pregunta 1:
  • Pregunta 2:
  • 3/6 (= 1/2) para rojo
  • 2/6 (= 1/3) para amarillo
  • 1/6 para blanco
  • Hipótesis nula ( (H_0 )): no hay diferencias significativas entre el valor observado y el valor esperado.
  • Hipótesis alternativa ( (H_A )): hay una diferencia significativa entre el valor observado y el esperado.
  • Estadística: el valor de la prueba de prueba de chi cuadrado.
  • ¿Cuál es la aplicación práctica de las pruebas de bondad?

    La prueba de bondad de ajuste de chi-cuadrado evalúa si las proporciones de resultados categóricos o discretos en una muestra siguen una distribución de población con proporciones hipotéticas. En otras palabras, cuando dibuja una muestra aleatoria, las proporciones observadas siguen los valores que sugiere la teoría.

    Los analistas usan con frecuencia la prueba de bondad de ajuste de chi-cuadrado para determinar si las proporciones de los resultados categóricos son todas iguales. O el analista puede especificar el conjunto de proporciones a incluir en la prueba. Alternativamente, esta prueba puede evaluar si los resultados observados siguen una distribución de probabilidad discreta, como la distribución de Poisson.

    Como prueba de hipótesis, la prueba de bondad de ajuste de chi-cuadrado le permite usar su muestra para sacar conclusiones sobre una población completa. Por ejemplo, use esta prueba para responder las siguientes preguntas. ¿Fue su muestra extraída de una población donde las proporciones de:

    • ¿Los dulces rojos, verdes, azules y amarillos son iguales?
    • ¿Las cartas de un mazo sin fondo en un juego de póker en línea siguen las expectativas de un juego justo?

    Supongamos que teorizamos que el proceso de fabricación de un dulce produce un número igual de dulces rojos, verdes, azules y amarillos. Si esta sospecha es correcta, cada color comprende el 25% de la población. Sin embargo, si tuviéramos que probar al azar los dulces, nuestra muestra no coincidirá exactamente con las proporciones de la población, gracias al error de muestreo aleatorio. Podríamos encontrar 35% de dulces rojos, 15% verdes, 22% azul y 28% amarillo.

    ¿Es esta diferencia de nuestras expectativas lo suficientemente grandes como para refutar nuestra hipótesis? ¿O podemos marcar la diferencia con el error de muestreo aleatorio? ¡La prueba Chi-Square Goodness of Fit puede ayudarnos!

    ¿Qué son los indices de bondad de ajuste?

    CHISQ: El modelo Chi-cuadrado evalúa el ajuste general y la discrepancia
    entre la muestra y las matrices de covarianza ajustadas. Su valor p debería ser>
    .05 (es decir, la hipótesis de un ajuste perfecto no puede ser rechazada). De todos modos, eso
    es bastante sensible al tamaño de la muestra.

    GFI/AGFI: la bondad (ajustada) de ajuste es la proporción de la varianza
    contabilizado por la covarianza de población estimada. Análogo a R2. los
    GFI y el AGFI deben ser> .95 y> .90, respectivamente.

    NFI/NNFI/TLI: el índice de ajuste (no) normado. Un NFI de 0.95, indica el
    El modelo de interés mejora el ajuste por 95
    Nnfi (también llamado tucker lewis índice; tli) es preferible para más pequeño
    muestras. Deben ser> .90 (Byrne, 1994) o> .95 (Schumacker y Lomax,
    2004).

    CFI: el índice de ajuste comparativo es una forma revisada de NFI. No muy
    Sensible al tamaño de la muestra (Fan, Thompson y Wang, 1999). Compara el ajuste de un
    modelo objetivo al ajuste de un modelo independiente o nulo. Debería ser>
    .90.

    RMSEA: el error de aproximación de raíz cuadrada media es
    Índice ajustado a parsimonia. Los valores más cercanos a 0 representan un buen ajuste. Debería
    ser <.08 o <.05. El valor p impreso con él prueba la hipótesis de que RMSEA es menor o igual a .05 (un corte a veces utilizado para un buen ajuste), y por lo tanto no debería ser significativo.

    RMR/SRMR: la raíz (estandarizada) la media cuadrada residual representa el
    raíz cuadrada de la diferencia entre los residuos de la covarianza de la muestra
    matriz y el modelo hipotetizado. Como el RMR a veces puede ser difícil de
    interpretar, mejor usar SRMR. Debería ser <.08.

    ¿Qué son las pruebas de bondad de ajuste y cuáles son?

    Los estadísticos usan la prueba ‘bondad de ajuste‘ para determinar si los datos de la muestra son realmente representativos. Por ejemplo, ¿el grupo de muestra es verdaderamente representativo de la población más amplia? En otras palabras, ¿la prueba determina si los datos de la muestra representan los datos que esperaríamos encontrar en la población real?

    Hay muchos tipos diferentes de pruebas. Según «Estadísticas de cómo hacerlo», las pruebas más comunes de «bondad de ajuste» son:

    • El chi-cuadrado.
    • Kolmogorov-Smirnov.
    • Anderson-Darling.
    • Shipiro-Wilk.

    Este tipo de prueba es común en muchos campos y profesiones diferentes. De hecho, las personas que toman decisiones comerciales a menudo usan pruebas de bondad de ajuste.

    Las personas también usan el término en psicología y crianza. Describe la compatibilidad del temperamento de un individuo con las características de su entorno social particular.

    Todos los entornos tienen características y demandas únicas. Por entornos, estamos hablando de estilo de vida y familia. El entorno también incluye el lugar de trabajo.

    De hecho, la bondad del ajuste es un componente crucial en el ajuste emocional de una persona.

    «Los niños con temperamentos difíciles o temperamentos que están en desacuerdo con los de sus padres, y crecen con padres que rechazan o son inconsistentes, tienen más dificultades con el ajuste y el desarrollo que los niños con padres de apoyo y consistentes (por ejemplo, un» geek » niño que crece en una familia que valora el logro atlético tendrá problemas si la familia rechaza los talentos e intereses únicos de ese niño).

    ¿Cómo se mide la bondad de ajuste?

    El trastorno de ajuste (AJD) es un diagnóstico frecuente pero poco investigado debido en parte a la falta de criterios específicos de síntomas y herramientas adecuadas de medición. El ICD -11 por primera vez propone un catálogo de síntomas positivo para definir AJD. Este estudio presenta una validación del trastorno de ajuste: nuevo módulo (ADNM), la primera medida de gravedad de los síntomas para AJD de acuerdo con el concepto ICD -11. La validez y la sensibilidad al cambio se investigaron en una muestra de 190 individuos con un diagnóstico de AJD de DSM -IV. Las escalas ADNM demostraron validez convergente y discriminante para los síntomas de ansiedad (escala de ansiedad de Hamilton; ansiedad psíquica R = 0.18-0.31), deterioro funcional (escala de discapacidad de Sheehan; r = 0.18-0.47) y depresión (escala de depresión de Montgomery -Tasberg; R = R = R = R = R = 0.13–0.30). Al inicio, el 78% de las personas con un diagnóstico de AJD de AJD también fueron clasificados por el ADNM. El ANOVA de las medidas repetidas indicó una disminución significativa del síntoma ADNM durante el tratamiento, replicando los patrones de la escala de ansiedad de Hamilton, la escala de discapacidad de Sheehan y la escala de impresión global clínica. Este artículo presenta el primer uso de la ADNM como una medida para ICD – 11 AJD en un estudio de intervención controlada aleatorizada de AJD. Proporciona apoyo para la validez de constructo y la sensibilidad al cambio de síntomas de esta escala durante el tratamiento farmacológico.

    El trastorno de ajuste (AJD) es uno de los trastornos mentales más frecuentes en la práctica clínica, que representa hasta el 30% de todos los casos en muestras psiquiátricas y de enlace (Casey, 2014; Evans et al., 2013; Stirman, Derubeis, Crits -Cristoph Y Rothman, 2005). La Clasificación Internacional de Enfermedades, 11a propuesta de revisión (ICD – 11) es para que AJD se incluya, por primera vez, en una agrupación separada de trastornos específicamente asociados con el estrés, junto con el trastorno de estrés postraumático, estrés postraumático complejo Trastorno y trastorno de duelo prolongado (Maercker et al., 2013a, 2013b). Este artículo presenta una evaluación del trastorno de ajuste: cuestionario del nuevo módulo (ADNM) (Einsle, Köllner, Dannemann y Maercker, 2010), una medida de autoinforme de AJD de acuerdo con el concepto ICD -11 (Maercker et al., 2013a. , 2013b) en un estudio de intervención.

    AJD se define como una perturbación emocional que se desarrolla como consecuencia de un factor estresante psicosocial significativo como el divorcio, la enfermedad o la discapacidad, los problemas socioeconómicos o los conflictos en el hogar o el trabajo. Los síntomas emocionales y de comportamiento en AJD incluyen reacciones normativas que de otro modo se manifiestan más intensamente de lo que generalmente se esperaba cuando los individuos se enfrentan con un factor estresante específico y se asocian con importantes impedimentos sociales, ocupacionales y/o académicos relacionados con el rendimiento (American Psychiatric Association, 2013; Organización Mundial de la Salud, 1992). Los conceptos de diagnóstico, tal como se implementan en el manual de diagnóstico y estadístico de los trastornos mentales, la quinta edición (DSM -5) y la ICD -10, han sido criticados por su falta de descripciones de síntomas específicas y la dificultad de distinguir entre AJD y Normal, adaptable, adaptable, adaptable, adaptable Reacciones de estrés (Baumeister y Kufner, 2009; Casey y Bailey, 2011; Casey, 2014). Aunque el DSM -5 ahora conceptualiza AJD como un síndrome relacionado con el estrés en un capítulo separado de «trastornos relacionados con el trauma y el estrés», que tal vez fue el cambio más importante con respecto al DSM -IV (Strain y Friedman, 2011), el constructo de diagnóstico actual es Depende de manera crucial de un criterio de exclusión, de modo que un diagnóstico de AJD rara vez es aplicable cuando está presente otro trastorno mental.

    El futuro concepto de diagnóstico ICD -11 de AJD implementará cambios fundamentales y por primera vez describirá un catálogo de síntomas positivo para AJD en lugar de determinarlo con criterios de exclusión (Maercker, Einsle y Kollner, 2007). Describe una reacción desadaptativa a un factor estresante psicosocial identificable o estresores múltiples (por ejemplo, evento estresante único, dificultad psicosocial continua o una combinación de situaciones de vida estresantes) con dos grupos de síntomas centrales explícitamente definidos, a saber (1) preocupación (intrusiones previamente terminadas; egg que incluye incluir a la inclinación de La preocupación excesiva, los pensamientos recurrentes y angustiantes sobre el estresor, o la rumia constante sobre sus implicaciones) y (2) no se adaptan que interfieran significativamente con el funcionamiento cotidiano manifestado, por ejemplo, por dificultades o trastornos del sueño, lo que resulta en problemas de rendimiento en el trabajo o en la escuela. Se sugiere que estos síntomas emerjan dentro de un mes posterior al inicio de los estresores y tienden a resolverse en seis meses a menos que el estresor persista durante una mayor duración. Además, también se ha propuesto que un diagnóstico AJD de AJD de ICD -11 debe estar asociado con una angustia significativa o un deterioro significativo en áreas personales, familiares, sociales, educativas, ocupacionales u otras áreas importantes de funcionamiento.

    Además de los síntomas del núcleo AJD de AJD ICD -11 propuestos, se han sugerido características asociadas que reflejan los subtipos ICD -10 y DSM -5: evitación de estímulos, pensamientos y sentimientos relacionados con el estresante, la depresión, la ansiedad o los síntomas impulsivos (Maercker ET Al., 2013b). Una propuesta anterior incluía síntomas de evitación entre los grupos de síntomas centrales (por ejemplo, Einsle et al., 2010; Maercker et al., 2007), aunque luego se reclasificaron más tarde como características asociadas (Maercker et al., 2013a, 2013b). La propuesta ICD -11 no es distinguir diferentes subtipos de AJD.

    ¿Cómo interpretar la prueba de bondad de ajuste?

    El modelo estadístico de bondad de ajuste es, como dice el modelo, el mejor ajuste a los datos obtenidos como resultados de un experimento. Las medidas de bondad de ajuste generalmente resumen las diferencias entre los valores observados y los valores esperados del modelo en cuestión. Cuando el conjunto de resultados para un experimento se limita a dos resultados (como el éxito o el fracaso, encendido o apagado, etc.), la estadística de prueba apropiada para la distribución es la variable binomial. Sin embargo, cuando son posibles más de dos resultados, la estadística preferida es la variable de chi-cuadrado. Además de proporcionar intervalos de confianza para las estimaciones espectrales y otros parámetros de medición, la variable de chi-cuadrado se usa para probar cómo de cerca la distribución de frecuencia observada de un parámetro dado corresponde a la distribución de frecuencia esperada para el parámetro. Las frecuencias esperadas representan el número promedio de valores que se espera que caigan en cada intervalo de frecuencia basado en alguna distribución de probabilidad teórica, como una distribución normal. La distribución de frecuencia observada representa una muestra de valores extraídos de alguna distribución de probabilidad. Lo que queremos saber es si las frecuencias observadas y esperadas son lo suficientemente similares como para concluir que se extraen de la misma función de probabilidad (la «hipótesis nula»). La prueba para esta similitud utilizando la variable chi-cuadrado se denomina prueba de «bondad de ajuste».

    Considere una muestra de N observaciones de una variable aleatoria X con PDF P0 (X) observado. Deje que las observaciones de N se agrupen en intervalos k (o categorías) llamados intervalos de clase, cuya distribución gráfica forma un histograma de frecuencia (Bendat y Piersol, 1986). El número real de valores observados que se encuentran dentro del intervalo de clase i -ésimo se denota por Fi, y se llama frecuencia observada en la clase IPI. El número de valores observados que esperaríamos caer dentro del intervalo de clase IPI si las observaciones realmente siguieron la distribución de probabilidad teórica, p (x), se denota Fi y se llama la frecuencia esperada en el intervalo de clase II. La diferencia entre la frecuencia observada y la frecuencia esperada para cada intervalo de clase está dada por FI – FI. La discrepancia total para todos los intervalos de clase entre las distribuciones esperadas y observadas se mide por la estadística de muestra

    donde la división por Fi transforma la suma de los cuadrados en la variable de tipo chi-cuadrado, x2.

    ¿Cómo se interpreta la bondad de ajuste?

    Use R cuadrado ajustado para comparar la bondad de ajuste para los modelos de regresión que contienen diferentes números de variables independientes.

    Supongamos que está comparando un modelo con cinco variables independientes con un modelo con una variable y el modelo de cinco variables tiene un cuadrado R más alto. ¿El modelo con cinco variables es realmente un mejor modelo, o simplemente tiene más variables? Para determinar esto, ¡compare los valores R-cuadrado ajustados!

    El R-cuadrado ajustado se ajusta para el número de términos en el modelo. Es importante destacar que su valor aumenta solo cuando el nuevo término mejora el modelo ajustado más de lo esperado solo por casualidad. El valor R-cuadrado ajustado en realidad disminuye cuando el término no mejora el ajuste del modelo en una cantidad suficiente.

    El siguiente ejemplo muestra cómo el R-cuadrado ajustado aumenta hasta un punto y luego disminuye. Por otro lado, R-cuadrado aumenta alegremente con todas y cada una de las variables independientes adicionales.

    En este ejemplo, los investigadores pueden querer incluir solo tres variables independientes en su modelo de regresión. Mi publicación de blog R-cuadrado muestra cómo un modelo bajo especificado (muy pocos términos) puede producir estimaciones sesgadas. Sin embargo, un modelo demasiado especificado (demasiados términos) puede reducir la precisión del modelo. En otras palabras, tanto las estimaciones del coeficiente como los valores predichos pueden tener márgenes de error mayores a su alrededor. ¡Es por eso que no quieres incluir demasiados términos en el modelo de regresión!

    Use el R-cuadrado predicho para determinar qué tan bien un modelo de regresión hace predicciones. Esta estadística lo ayuda a identificar casos en los que el modelo proporciona un buen ajuste para los datos existentes, pero no es tan bueno para hacer predicciones. Sin embargo, incluso si no está utilizando su modelo para hacer predicciones, el R-cuadrado predicho todavía ofrece información valiosa sobre su modelo.

    ¿Qué mide el estadístico de prueba de bondad de ajuste?

    La prueba de bondad de ajuste de chi-cuadrado es una prueba no paramétrica que se utiliza para descubrir cómo el valor observado de un fenómeno dado es significativamente diferente del valor esperado. En la prueba de bondad de ajuste de chi-cuadrado, el término bondad de ajuste se utiliza para comparar la distribución de muestra observada con la distribución de probabilidad esperada. La prueba de bondad de ajuste de chi-cuadrado determina qué tan bien la distribución teórica (como lo normal, binomial o poisson) se ajusta a la distribución empírica. En la prueba de bondad de ajuste de chi-cuadrado, los datos de la muestra se dividen en intervalos. Luego, se comparan los números de puntos que caen en el intervalo, con los números esperados de puntos en cada intervalo.

    • Establezca la hipótesis para la prueba de bondad de ajuste de chi-cuadrado:

    A. Hipótesis nula: en la prueba de bondad de ajuste de chi-cuadrado, la hipótesis nula supone que no hay diferencias significativas entre el valor observado y el esperado.

    B. Hipótesis alternativa: en la prueba de bondad de ajuste de chi-cuadrado, la hipótesis alternativa supone que existe una diferencia significativa entre el valor observado y el esperado.

    Alinear el marco teórico, la recopilación de artículos, sintetizar brechas, articular una metodología y plan de datos claros, y escribir sobre las implicaciones teóricas y prácticas de su investigación son parte de nuestros servicios integrales de edición de tesis.

    • Establezca la hipótesis para la prueba de bondad de ajuste de chi-cuadrado:
  • Grado de libertad: en la prueba de bondad de ajuste de chi-cuadrado, el grado de libertad depende de la distribución de la muestra. La siguiente tabla muestra la distribución y un grado asociado de libertad:
  • Prueba de hipótesis: las pruebas de hipótesis en la prueba de bondad de ajuste de chi-cuadrado son las mismas que en otras pruebas, como la prueba t, ANOVA, etc. El valor calculado de la prueba de bondad de ajuste de chi-cuadrado se compara con el valor de la tabla. Si el valor calculado de la prueba de bondad de ajuste de chi-cuadrado es mayor que el valor de la tabla, rechazaremos la hipótesis nula y concluiremos que existe una diferencia significativa entre la frecuencia observada y la esperada. Si el valor calculado de la prueba de bondad de ajuste de chi-cuadrado es menor que el valor de la tabla, aceptaremos la hipótesis nula y concluiremos que no hay diferencias significativas entre el valor observado y esperado.
  • Artículos Relacionados:

    Más posts relacionados:

    Deja una respuesta

    Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *