Prueba de homogeneidad: definición, pasos y ejemplos

Realice una prueba de homogeneidad de chi-cuadrado. Interpretar la conclusión en contexto.

Hemos aprendido los detalles de dos pruebas de chi-cuadrado, la prueba de bondad de ajuste y la prueba de independencia. Ahora nos centramos en la tercera y última prueba de chi-cuadrado que aprenderemos, la prueba de homogeneidad. Esta prueba determina si dos o más poblaciones (o subgrupos de una población) tienen la misma distribución de una sola variable categórica.

La prueba de homogeneidad amplía la prueba de una diferencia en dos proporciones de la población, que es la prueba Z de dos proporciones que aprendimos en inferencia por dos proporciones. Usamos la prueba Z de dos proporciones cuando la variable de respuesta tiene solo dos categorías de resultados y estamos comparando dos poblaciones (o dos subgrupos). Utilizamos la prueba de homogeneidad si la variable de respuesta tiene dos o más categorías y deseamos comparar dos o más poblaciones (o subgrupos).

Podemos responder las siguientes preguntas de investigación con una prueba de homogeneidad de Chi-cuadrado:

Realice una prueba de homogeneidad de chi-cuadrado. Interpretar la conclusión en contexto.

¿El uso de esteroides en el atletismo universitario difiere en las tres divisiones de la NCAA?

¿Fue la distribución de opiniones políticas (liberales, moderadas, conservadoras) diferentes para las últimas tres elecciones presidenciales en los Estados Unidos?

La hipótesis nula establece que la distribución de la variable categórica es la misma para las poblaciones (o subgrupos). En otras palabras, la proporción con una respuesta dada es la misma en todas las poblaciones, y esto es cierto para todas las categorías de respuesta. La hipótesis alternativa dice que las distribuciones difieren.

¿Qué es la prueba de homogeneidad?

La suposición de homogeneidad de varianza es una suposición de la prueba t de muestras independientes y ANOVA que indican que todos los grupos de comparación tienen la misma varianza. La prueba t de muestras independientes y ANOVA utilizan las estadísticas T y F respectivamente, que generalmente son robustas a las violaciones de la suposición siempre que los tamaños de grupo sean iguales. Los tamaños de grupo iguales pueden definirse por la relación del grupo más grande a más pequeño que es inferior a 1.5. Si los tamaños de grupo son muy desiguales y se viola la homogeneidad de la varianza, entonces la estadística F estará sesgada cuando las variaciones de muestra grandes se asocian con los tamaños de grupos pequeños. Cuando esto ocurre, se subestimará el nivel de significancia, lo que puede hacer que la hipótesis nula sea rechazada falsamente. Por otro lado, la estadística F estará sesgada en la dirección opuesta si grandes variaciones se asocian con grandes tamaños de grupos. Esto significaría que el nivel de significancia se sobreestimará. Esto no causa los mismos problemas que rechazar falsamente la hipótesis nula, sin embargo, puede causar una disminución en el poder de la prueba.

Alinear el marco teórico, la recopilación de artículos, sintetizar brechas, articular una metodología y plan de datos claros, y escribir sobre las implicaciones teóricas y prácticas de su investigación son parte de nuestros servicios integrales de edición de tesis.

Rastree todos los cambios, luego trabaje con usted para lograr una escritura académica.
Apoyo continuo para abordar los comentarios del comité, reduciendo las revisiones.

Para probar la homogeneidad de la varianza, hay varias pruebas estadísticas que se pueden usar. Estas pruebas incluyen: Hartley’s FMAX, Cochran’s, Levene’s y Barlett’s Test. Se ha encontrado que varias de estas evaluaciones son demasiado sensibles a la no normalidad y no se usan con frecuencia. De estas pruebas, la evaluación más común para la homogeneidad de la varianza es la prueba de Levene. La prueba de Levene utiliza una prueba F para probar la hipótesis nula de que la varianza es igual entre los grupos. Un valor de P inferior a .05 indica una violación de la suposición. Si se produce una violación, es probable que realizar el equivalente no paramétrico del análisis sea más apropiado.

¿Qué es el contraste de homogeneidad?

El presente trabajo describe un algoritmo para la segmentación automática de imágenes utilizando una medida de «homogeneidad» y una medida de «contraste» definida en la matriz de concurrencia de la imagen. La medida de contraste implica el concepto de respuesta logarítmica (adaptabilidad con la intensidad de fondo) del sistema visual humano (HVS). También se introduce un algoritmo de fusión para eliminar los umbrales no deseados.

La efectividad del algoritmo y la comparación de su rendimiento con los existentes se demuestran para un conjunto de imágenes.

En este artículo, se propone un nuevo esquema de marca de agua basado en el modelado del sistema visual humano (HVS). El enfoque consiste en la creación de modelos computacionales que tienen en cuenta las propiedades más comunes del HVS que pueden explotarse para la marca de agua. Se presentan dos esquemas para incrustar y controlar la transparencia de la marca de agua, a saber, los esquemas implícitos y explícitos. Ambos esquemas están diseñados en el marco de la descomposición piramidal que ha demostrado ser una herramienta poderosa para analizar la imagen a través de una representación a múltiples escala. Para el primer enfoque, se utiliza un mapa de visibilidad a múltiples escala para optimizar el proceso de incrustación de la marca de agua. El segundo enfoque utiliza las propiedades de HVS de una manera explícita y más sofisticada que consiste en ajustar la resistencia de la marca de agua justo debajo del umbral de detección visual. Luego se propone y evalúa un nuevo modelo JND (justo-diferencia de diferencia) para determinar este umbral. Los resultados obtenidos proporcionan un fuerte apoyo para este nuevo modelo JND.

En este documento, abordamos un problema clave en muchos campos: cómo se puede analizar un conjunto de datos estructurados para tener en cuenta el vecindario de cada dato individual. Proponemos representar el conjunto de datos como una relación difusa, asociando un título de membresía con cada elemento de la relación. Luego presentamos el concepto de contraste de intervalo, un medio para agregar información contenida en el vecindario inmediato de cada elemento de la relación difusa. El contraste de intervalo mide el rango de grados de membresía presentes en cada vecindario. Utilizamos los contraste de intervalos para definir las propiedades necesarias de una medida de contraste, construir varias medidas de contraste locales diferentes y contraste total que satisfacen estas propiedades y comparan nuestras expresiones con otras definiciones de contraste que aparecen en la literatura. Nuestros resultados teóricos se pueden aplicar a varios campos diferentes. En un Apéndice A, aplicamos nuestras expresiones de contraste a imágenes fotográficas.

¿Cómo saber si la muestra es homogenea?

Las pruebas de homogeneidad reúnen una gran cantidad de pruebas para las cuales la hipótesis nula es que una serie temporal es homogénea entre dos tiempos dados.

La variedad de pruebas proviene del hecho de que las posibles hipótesis alternativas son numerosas: cambio de distribución, cambios promedio (una o más veces) o presencia de tendencia.

Las pruebas de homogeneidad presentadas en esta herramienta corresponden a la hipótesis alternativa de un solo retraso. Para todas las pruebas, XLSTAT proporciona valores P utilizando el reenvío de Monte Carlo, los cálculos exactos son imposibles o demasiado caros en el tiempo de cálculo.

Para la presentación de las diferentes pruebas, designamos por xi (i = 1, 2,…, t) una serie de ts variables de los cuales observamos un valor xi (i = 1.2,3,…, t) con tiempo sucesivo. Deje µ el promedio de los valores observados, y o la desviación de tipo sesgada de σleur (nos dividimos por t).

Nota 1: Si tenemos una idea precisa del tiempo de cambio, las pruebas ya existentes en la sección de pruebas paramétricas o no paramétricas se pueden usar: por ejemplo, si suponemos que las variables siguen distribuciones normales, podemos usar La prueba Z (varianza conocida) o el alumno (varianza estimada) para probar la presencia de un cambio promedio en un tiempo t. Si creemos que la varianza cambia, podemos usar una prueba de comparación de variaciones (prueba de Fisher en el caso normal, por ejemplo, o Kolmogorov-Smirnov en un caso más general).

¿Qué es una prueba de independencia u homogeneidad?

Las unidades de observación se recolectan al azar de una población y
Se observan dos variables categóricas para cada unidad.
Se observan dos variables para cada unidad de observación.
Los márgenes se consideran fijos. La prueba
Condiciones en ambos márgenes: sin multiplicación cruzada de
márgenes.

Las parejas se muestrean y se miden la "satisfacción del esposo" y la "satisfacción de la esposa".

Las unidades de observación se recolectan al azar de una población y
Se observan dos variables categóricas para cada unidad.
Se observan dos variables para cada unidad de observación.
Los márgenes se consideran fijos. La prueba
Condiciones en ambos márgenes: sin multiplicación cruzada de
márgenes.

Los datos se recopilan mediante muestreo aleatorio de cada
subgrupo por separado. (Digamos, 100 negros, 100 blancos, 100
Indios americanos, etc.). La hipótesis nula es que cada subgrupo
comparte la misma distribución de otra categórica
variable. (Diga, «fumador en cadena», «fumador ocasional»,
«no fumador».)

Los márgenes de las variables se consideran aleatorios
variables distribuidas normalmente, y nosotros
multiplicado para obtener las frecuencias esperadas.

1. Los pacientes con el fármaco A y los pacientes en el fármaco B serían subgrupos de la variable ("tratamiento"), y cada uno evaluado para la variable "acidez estomacal".
2. Relación entre "sexo" y "clase". Tome muestras de ambos géneros y verifique su clase socioeconómica.

Se basa en el análisis de una clasificación cruzada en un
tabla de contingencia para probar la posible dependencia o relación
entre variables.

Existe una distinción conceptual entre la prueba de la independencia.
y el chi-cuadrado
prueba de homogeneidad, ver aquí y aquí, aunque
No hay consecuencias matemáticas prácticas. Una prueba de independencia
condicionaría en ambos márgenes, mientras que en una prueba de homogeneidad
Se supone que los marginales de una de las categorías no son variables aleatorias,
sino más bien fijado por diseño. Estas distinciones teóricas a un lado, ambas
se puede agrupar bajo los términos pruebas de asociación de chi-cuadrado
(para tablas de contingencia de dos vías) o muestras independientes de chi-cuadrado
Prueba de comparación (para más dos categorías). Esto es en
Contradistinción a la prueba de chi-cuadrado de una muestra de
Acuerdo, esencialmente una prueba GOF.

¿Qué es una prueba de independencia?

Otra aplicación interesante de la distribución de densidad de probabilidad de cuya pintura es la prueba de independencia. Es una prueba utilizada para verificar si dos clasificaciones diferentes del mismo conjunto de datos son independientes entre sí. La hipótesis de nada H0 a verificar es que la distribución del conjunto de datos en comparación con una de las clasificaciones es, por lo tanto, independiente en comparación con el criterio de segunda clasificación:

Hipótesis H0: los dos criterios de clasificación son independientes entre sí
H1: Los dos criterios están relacionados entre sí.

Dado un conjunto de bases de datos y dos criterios de clasificación X y Z, una tabla de contingencia se define como una tabla que muestra los valores de las frecuencias de los valores del conjunto de datos en comparación con las diferentes clases de los criterios X y Z .

Hipótesis H0: los dos criterios de clasificación son independientes entre sí
H1: Los dos criterios están relacionados entre sí.

x1, x2… xj son las clases con las que el conjunto de datos se ha dividido de acuerdo con Criterion X

Y1, y2… yk son las clases con las que el conjunto de datos se ha dividido de acuerdo con el criterio y

FJK representa la frecuencia en la muestra de datos que pertenece tanto a la clase XJ como a la clase YK

FJ0 es la frecuencia total de la clase XJ

F0K es la frecuencia total de la clase YK

Si la hipótesis de la independencia H0 era cierta, la probabilidad de que un datos pertenezca simultáneamente a la Clase J y la Clase K viene dada por el producto de la probabilidad de que los datos pertenezcan a la Clase J para el producto que un Data pertenece a la Clase K:

En términos de frecuencias, si H0 fuera cierto, el informe valdría la pena:

El último informe puede considerarse una buena aproximación de la frecuencia teórica prevista en el caso de la independencia entre los dos criterios de clasificación. Si H0 fuera cierto, el informe valdría la pena para cada J y K:

Converge a una distribución que es una imagen con G = (S-1)*(T-1) grados de libertad. Se corrigió el nivel de importancia α, el H0 se acepta si:

Veamos a continuación con un ejemplo de la aplicación de la prueba de independencia a un caso concreto. Queremos verificar que no haya adicción entre los grupos de edad de una muestra (que indicaremos con Criterion X) y la preferencia entre 4 canales de TV (que indicaremos con Criterion Z):

Para cada celda, la frecuencia teórica se calcula como se muestra arriba:

y posteriormente todos los componentes del resumen:

de la cual es un valor de la función Y igual a 68.172.

¿Cuál es la diferencia entre la prueba de independencia y homogeneidad?

La evaluación de los supuestos básicos es un paso fundamental en el análisis de los datos experimentales nunca se olvida. Sin embargo, la experiencia enseña que, en la práctica, es muy fácil cumplir con situaciones dudosas, en las que los resultados obtenidos con las diferentes técnicas de diagnóstico parecen contradictorias y difíciles de interpretar. ¿Cómo comportarse en estos casos? En mi opinión, siempre debe recordarse que la «verdad real» nos escapa y, en consecuencia, todas las evaluaciones siempre deben realizarse con el «sentido común» máximo.

Un aspecto importante a considerar es el tipo de datos: los recuentos y las proporciones apenas se distribuyen normalmente y se distribuyen y, con estos datos, la prudencia nunca es demasiado, cuando se trata de usar modelos lineales. De la misma manera, es necesaria una gran prudencia al analizar variables cuantitativas donde la diferencia entre las diferentes tesis es muy grande, más que un orden de magnitud. Con proporciones de conteos y variables cuantitativas con medios muy diferentes, la ingesta de homogeneidad de las variaciones casi siempre se viola y, por lo tanto, es necesario ser muy prudente antes de confirmar el cumplimiento de las contrataciones básicas.

Si los procedimientos de diagnóstico han resaltado las desviaciones en comparación con los supuestos básicos, es necesario evaluar si y cómo emprender acciones correctivas. Obviamente, la ‘terapia’ cambia a cambiar la ‘patología’.

En presencia de valores atípicos, la ‘terapia’ más apropiada es, trivialmente, eliminarlos, obteniendo así un conjunto de datos ‘desequilibrado’ (diferentes réplicas para el tratamiento). Hoy en día, tratar un conjunto de datos no balanceado no constituye un problema, obviamente si se utilizan los métodos de análisis apropiados. Hace unos años, por el contrario, estábamos tratando de evitar el desequilibrio a toda costa, utilizando técnicas de imputación para la introducción de valores ‘razonables’ para reemplazar los faltantes/aberrantes. Con las debidas excepciones, las técnicas de impuestos parecen estar obsoletas hoy, al menos en este contexto.

¿Qué significa homogéneo en estadística?

La estadística es la disciplina que estudia fenómenos a través de la recopilación de datos, su procesamiento, su análisis, la interpretación de los resultados y su presentación para que estos datos sean comprensibles por todos. Es una rama de las matemáticas aplicadas [1], un método y un conjunto de técnicas.

Tenga en cuenta que la estadística a veces se observa [2] «estadísticas» (con una letra mayúscula), lo que permite diferenciar sus aplicaciones matemáticas con una estadística (con un pequeño). El plural también se usa a menudo [3] para designarlo: «estadísticas», esto permite mostrar la diversidad de esta ciencia [ref. necesario].

Las estadísticas son un área de matemáticas y cada vez más, es parte de lo que se llama ciencia de datos hoy (en inglés: ciencia de datos). El análisis aplica leyes matemáticas más generales (conjuntos, grupos, inclusión, exclusión). Tiene un componente teórico y un componente aplicado. El componente teórico se basa en la teoría de las probabilidades y formas con este último, el análisis de fenómenos aleatorios. La estadística aplicada se utiliza en casi todas las áreas de actividad humana [4]: ingeniería, gestión, economía, biología, TI, física (fundamentos de la física cuántica, por ejemplo). Las estadísticas utilizan reglas y métodos en la recopilación de datos, para que pueda interpretarse adecuadamente, a menudo como un componente de la ayuda para la toma de decisiones. El estadístico es el desarrollo de herramientas estadísticas, en el sector privado o en el sector público, y su operación generalmente en un campo de experiencia.

¿Qué es homogéneo en estadística?

Este artículo necesita atención de un psicólogo/experto académico en el tema. Ayude a reclutar uno o mejore esta página usted mismo si está calificado. Esta pancarta aparece en artículos débiles y cuyo contenido debe abordarse con precaución académica.

La homogeneidad en estadísticas y análisis de datos se refiere a propiedades de matrices de datos lógicamente consistentes.
En el metanálisis, que combina los datos de varios estudios, la homogeneidad mide las diferencias o similitudes entre los varios estudios. [1]
Dentro de este marco, el coeficiente de homogeneidad indica que los datos de grado se aproximan a las escalas implicantes de Guttman.

El coeficiente original de homogeneidad, envuelto en consideraciones algebraicas complejas, fue introducido en 1948 por Loevinger. El interés en la homogeneidad de los datos fue revivido durante las décadas finales del siglo pasado por Cliff (1977), y por Krus y Blackman (1988). Sobre la base del análisis teórico descrito anteriormente, Krus y Blackman definieron el coeficiente de homogeneidad como

Donde MS significa Medio Square, I para individuos y RES para términos residuales del análisis de varianza. * Indica que estos índices se obtuvieron de la matriz de datos donde se maximizó la varianza de las variables. Este coeficiente de homogeneidad es numéricamente equivalente con las conceptualizaciones de Loevinger y Cliff del coeficiente de homogeneidad. Como la fórmula de Hoyt (1941) para la confiabilidad de consistencia interna es

La formulación KRU y Blackman del coeficiente de homogeneidad aporta tanto el coeficiente de confiabilidad de consistencia interna como el coeficiente de homogeneidad dentro del marco del análisis de varianza.

¿Qué es homogéneo y heterogéneo en estadística?

Consideramos un estudio agrupado que consiste en K subestudios K, con sujetos NK en el estudio k y ∑k = 1knk = n. Deje que TKI* y CKI sean el tiempo de falla y el tiempo de censura para el sujeto ésimo en el estudio k. Defina el tiempo del evento observado TKI = min (TKI*, CKI), y el indicador de ocurrencia del evento de falla ΔKi = I (TKI*

donde λ0k (·) es la función de peligro de referencia, y βK = (βK1,…, βKP) ‘es un vector p × 1 que caracteriza los efectos de las covariables z en el estudio k. Para los datos de estudio agrupados bajo el modelo (1), la probabilidad parcial de registro se expresa como

Para separar los efectos homogéneos y heterogéneos, reformulamos el modelo (1) en

donde ω0L y ω1l son pesos dependientes de datos y aquí elegidos como ω0l = 1/| μ̃l |, ω1l = 1/‖α̃L‖, donde (μ̃l, α̃L) son algunos estimadores iniciales de raíz y n-n consistentes.

Utilizamos el algoritmo de tiro iterativo (Fu, 1998; Zhang y Lu, 2007) para minimizar Qn (θ) en (2). Sea g = −∂ℓ/∂θ, h = −∂2ℓ/∂θ∂θ ′, y x′x sea la descomposición de Cholesky de H. definiendo un vector de respuesta pseudo y = (x ′) – 1 {hθ – – G}, podemos aproximar −ℓ (θ) por una forma cuadrática ½ (y – xθ) ′ (y – xθ). Además, consideramos la norma L1 como un caso especial de la norma euclidiana con un elemento y reescribe los términos de penalización compuesta en (2) como un problema de lazo de grupo adaptativo con grupos 2P