Publicado en
18 de septiembre de 2022
por
Lauren Thomas.
Revisado en
21 de julio de 2022.
En una muestra estratificada, los investigadores dividen una población en subpoblaciones homogéneas llamadas estratos (el plural del estrato) basado en características específicas (por ejemplo, raza, identidad de género, ubicación, etc.). Cada miembro de la población estudiada debe estar exactamente en un estrato.
Cada estrato se muestrean utilizando otro método de muestreo de probabilidad, como un grupo o muestreo aleatorio simple, lo que permite a los investigadores estimar las medidas estadísticas para cada subpoblación.
Los investigadores confían en el muestreo estratificado cuando las características de una población son diversas y quieren asegurarse de que cada característica esté representada adecuadamente en la muestra.
Para usar un muestreo estratificado, debe poder dividir su población en subgrupos mutuamente excluyentes y exhaustivos. Eso significa que cada miembro de la población puede clasificarse claramente en exactamente un subgrupo.
El muestreo estratificado es la mejor opción entre los métodos de muestreo de probabilidad cuando cree que los subgrupos tendrán diferentes valores medios para las variables que está estudiando. Tiene varias ventajas potenciales:
Una muestra estratificada incluye sujetos de cada subgrupo, asegurando que refleje la diversidad de su población. Es teóricamente posible (aunque poco probable) que esto no suceda al usar otros métodos de muestreo, como un muestreo aleatorio simple.
Si desea que los datos recopilados de cada subgrupo tengan un nivel de varianza similar, necesita un tamaño de muestra similar para cada subgrupo.
¿Dónde se aplica el muestreo estratificado?
Supongamos que tenemos que apreciar el número promedio de votos para cada candidato en una elección. Suponiendo que un país tiene 3 ciudades: la ciudad A tiene 1 millón de trabajadores de fábrica, la ciudad B tiene 2 millones de trabajadores de consultorio y City C tiene 3 millones de pensionistas. Podemos elegir una muestra aleatoria de tamaño 60 sobre toda la población, pero hay una cierta manera de que la muestra aleatoria resultante está mal equilibrada en estas ciudades y, por lo tanto, está distorsionada, lo que conduce a una evaluación significativa (si el resultado es un resultado diferente es Diferente distribución en relación con los parámetros entre las ciudades). Si extraemos una muestra aleatoria de 10, 20 o 30 de las ciudades A, B y C, podemos crear un error de estimación más pequeño con el mismo tamaño de muestra total. Este método generalmente se usa cuando una población no es un grupo homogéneo.
- En la asignación proporcional, se utiliza una acción de muestra en cada una de las capas que es proporcional a la de la población total. Por ejemplo, si la población consta de un total de individuos, de los cuales M son hombres y f mujeres (y con m + f = n), entonces el tamaño relativo de las dos muestras (x 1 = m/n masculina, x 2 = F/ N Las mujeres) deben reflejar esta proporción.
- Asignación óptima (o asignación desproporcionada): la proporción de muestra de cada capa es proporcional a la participación (como anterior) y la desviación estándar de la distribución de las variables. Se dibujan muestras más grandes en las capas con la mayor variabilidad para crear la varianza de muestra total más baja posible.
Un ejemplo práctico del uso de muestras en capas sería una encuesta política. Si los encuestados tuvieran que reflejar la diversidad de la población, el investigador trataría particularmente de involucrar a los participantes de varios grupos minoritarios como la raza o la religión, en función de su relación con la población total, como se mencionó anteriormente. Por lo tanto, una encuesta en capas podría aumentar el reclamo de ser más representativo de la población que una encuesta con una muestra aleatoria simple o un muestreo sistemático.
- En la asignación proporcional, se utiliza una acción de muestra en cada una de las capas que es proporcional a la de la población total. Por ejemplo, si la población consta de un total de individuos, de los cuales M son hombres y f mujeres (y con m + f = n), entonces el tamaño relativo de las dos muestras (x 1 = m/n masculina, x 2 = F/ N Las mujeres) deben reflejar esta proporción.
- Asignación óptima (o asignación desproporcionada): la proporción de muestra de cada capa es proporcional a la participación (como anterior) y la desviación estándar de la distribución de las variables. Se dibujan muestras más grandes en las capas con la mayor variabilidad para crear la varianza de muestra total más baja posible.
Si la densidad de población fluctúa fuertemente dentro de una región, la muestra en capas asegura que las estimaciones en diferentes partes de la región se puedan hacer con la misma precisión y comparaciones de subregiones se pueden hacer con el mismo significado estadístico. En Ontario, por ejemplo, una encuesta realizada en toda la provincia podría usar una mayor participación de la muestra en el norte menos poblado, ya que la diferencia de población entre el norte y el sur es tan grande que una proporción de muestra basada en toda la muestra provincial es la recopilación de solo un puñado de datos al norte.
¿Cómo se realiza el muestreo estratificado?
El muestreo para la aleatorización estratificada se lleva a cabo al estudiar un personaje que, presumiblemente o notablemente, está influenciado por un cierto factor presente en la población.
En la práctica, antes de llevar a cabo la muestra, la población se divide en capas basadas en el factor que influye en el personaje a estudiar. Entonces, dentro de cada capa, elige una muestra con un método que garantice la aleatoriedad, como, por ejemplo, el método de aleatorización simple o sistemática.
El siguiente esquema resume el procedimiento de selección de muestra, en el que se supone que la raza de animales es un factor que influye en el factor que deberá estudiarse.
Una muestra obtenida por estratificación tiene la ventaja de representar mejor la población de la que se extrajo. Sin embargo, el número reducido de las diversas capas puede hacer que las estimaciones referidas a las capas individuales no sean muy confiables.
El muestreo para la aleatorización estratificada es más flexible que el realizado con una aleatorización simple, ya que se puede elegir un porcentaje diferente en las diferentes capas (por ejemplo, 2% en una capa, 5% en otra, etc.).
La estratificación trae, en general, otra ventaja importante: obtener, dentro de cada capa, una varianza (y, en consecuencia, un error estándar) inferior a la varianza general de la población. Es una ventaja que, a primera vista, puede parecer sin importancia, pero que es esencial para aumentar la precisión de la estima que se obtendrá del estudio de la muestra. Este tema se mencionará en una unidad posterior.
¿Cuándo puede aplicarse una estratificación efectiva?
La estratificación a menudo se usa en diseños de muestras complejas. En un diseño de muestra aleatorio estratificado, las unidades en el marco de muestreo se dividen primero en grupos, llamados estratos, y se toma un SRS separado en cada estrato para formar la muestra total. Los estratos se forman para mantener juntas unidades similares, por ejemplo, un estrato femenino y un estrato masculino. En este diseño, las unidades no necesitan tener las mismas posibilidades de ser seleccionados y algunos estratos pueden exagerar deliberadamente. Por ejemplo, en la primera Encuesta Nacional de Examen de Salud y Nutrición (NHANES I), las personas mayores, las personas en las áreas de pobreza y las mujeres en edad fértil fueron sobremollados para proporcionar un número suficiente de estos grupos para el análisis en profundidad (NCHS 1973). Si se hubiera utilizado un SRS, es probable que muy pocas personas en estos grupos hubieran sido seleccionadas para permitir cualquier análisis en profundidad de estos grupos.
Otra ventaja de la estratificación es que puede reducir la variabilidad de las estadísticas de muestra sobre la de un SRS, reduciendo así el tamaño de la muestra requerido para el análisis. Esta reducción en la variabilidad ocurre cuando las unidades en un estrato son similares, pero hay variación entre los estratos. Otra forma de decir esto es que la reducción ocurre cuando la variable utilizada para formar los estratos está relacionado con la variable que se mide. Consideremos un pequeño ejemplo que ilustra este punto.
En este ejemplo, deseamos estimar el peso promedio de las personas en la población. La población contiene seis personas: tres mujeres y tres hombres. Los pesos de las hembras en la población son 110, 120 y 130 libras, y los pesos de los machos son 160, 170 y 180 libras. Formaremos nuestra estimación del peso promedio de la población tomando una muestra de tamaño dos sin reemplazo.
Si usamos un SRS, la estimación más pequeña posible es 115 libras (= [110 + 120]/2), y la estimación más grande posible es 175 (= [170 + 180]/2). Como alternativa, podríamos usar una muestra aleatoria estratificada donde los estratos se forman en función del género. Si una persona se selecciona aleatoriamente de cada estrato, la estimación más pequeña es de 135 libras (= [110 + 160]/2), y la estimación más grande es de 155 libras (= [130 + 180]/2). Las estimaciones del enfoque de muestra estratificado tienen menos variación, es decir, tienen una mayor precisión que el enfoque SRS en este caso.
¿Cuándo es muestreo estratificado?
Los tipos de muestreo se pueden distinguir de acuerdo con diferentes criterios. Esto significa que se puede hacer una distinción de acuerdo con la tecnología para seleccionar el subgrupo:
Las observaciones se seleccionan sobre la base del azar, es decir, accidentalmente. En esta categoría encontramos:
- Muestra aleatoria simple: todos los individuos de la población tienen la misma probabilidad de ser incluidas en la muestra. Tiene ventajas como el hecho de que los sistemas informáticos lo pueden hacer fácilmente. Sin embargo, se requiere una lista completa de toda la población, y si la muestra es muy pequeña, la selección puede no ser representativa.
- Sistemático: una observación se selecciona intervalos numéricos aleatorios y se utilizan para seleccionar la muestra restante. Eso significa, suponiendo que tengo una población de 10,000 y elijo al azar 600, según los cuales puedo tener en cuenta los intervalos de 30 observaciones. En este caso, tomaría las observaciones 600, 630, 660, 690, 720, 750, 780, etc.
- Coincidencia estratificada: la población se divide en capas, estos son grupos con características comunes e incluso más homogéneas que la población total. Luego, se seleccionó al azar o seleccionó sistemáticamente una muestra dentro de cada capa. El objetivo es lograr una representatividad de cada capa.
- Según conglomerados o grupos: consiste en la formación de grupos que son más pequeños que la población que reflejan o comparten todas las características de la población. Luego seleccionamos uno de los grupos como muestra y lo analizamos en detalle.
La selección de la muestra no depende de la probabilidad, sino de la decisión de los investigadores. Podemos distinguir algunas subcategorías:
- Muestra aleatoria simple: todos los individuos de la población tienen la misma probabilidad de ser incluidas en la muestra. Tiene ventajas como el hecho de que los sistemas informáticos lo pueden hacer fácilmente. Sin embargo, se requiere una lista completa de toda la población, y si la muestra es muy pequeña, la selección puede no ser representativa.
- Sistemático: una observación se selecciona intervalos numéricos aleatorios y se utilizan para seleccionar la muestra restante. Eso significa, suponiendo que tengo una población de 10,000 y elijo al azar 600, según los cuales puedo tener en cuenta los intervalos de 30 observaciones. En este caso, tomaría las observaciones 600, 630, 660, 690, 720, 750, 780, etc.
- Coincidencia estratificada: la población se divide en capas, estos son grupos con características comunes e incluso más homogéneas que la población total. Luego, se seleccionó al azar o seleccionó sistemáticamente una muestra dentro de cada capa. El objetivo es lograr una representatividad de cada capa.
- Según conglomerados o grupos: consiste en la formación de grupos que son más pequeños que la población que reflejan o comparten todas las características de la población. Luego seleccionamos uno de los grupos como muestra y lo analizamos en detalle.
También se debe tener en cuenta que el muestreo puede ser simple si solo se lleva a cabo una vez; Doble si se registran dos muestras (la segunda se puede usar si la primera no proporciona resultados finales); O múltiple (es similar al doble, pero con más de dos muestras).
¿Cuando un muestreo es estratificado?
El muestreo del clúster se define como una técnica de muestreo en la que la población se divide en agrupaciones existentes (grupos), por lo tanto, la población selecciona una muestra del grupo al azar. El término grupo se refiere a una agrupación natural pero heterogénea, intacta de los miembros de la población.
Las variables más comunes utilizadas en la población de agrupación son el área geográfica, edificios, escuela, etc. La heterogeneidad del clúster es una característica importante de un diseño ideal de muestras de clúster. Los tipos de muestreo del clúster se indican a continuación:
- Muestreo de muestreo con estadio único
- Muestreo de clúster de dos etapas
- Muestreo de clúster multiestadio
Las diferencias entre el muestreo estratificado y el montón de muestreo se pueden tomar claramente por las siguientes razones:
- Muestreo de muestreo con estadio único
- Muestreo de clúster de dos etapas
- Muestreo de clúster multiestadio
Para concluir la discusión, podemos decir que una situación preferible para el muestreo estratificado es cuando la identidad dentro de una capa individual y las capas significan que varían entre sí. Por otro lado, la situación estándar para muestrear el clúster ocurre cuando la diversidad dentro de los grupos y el clúster no deben variar entre sí.
Además, los errores de muestreo se pueden reducir en el muestreo estratificado si se aumentan las diferencias entre los grupos entre las capas, mientras que las diferencias entre los grupos entre los grupos deben reducirse al mínimo para reducir los errores de muestreo en el muestreo de los clústeres.
¿Qué es un análisis estratificado?
El análisis estratificado es un poderoso enfoque estadístico que le permite probar la confusión y la interacción, pero a diferencia de la regresión logística, es bastante simple y no lo distingue de sus datos. Puede ‘ver’ las asociaciones y disfrutar de las ideas obtenidas del análisis.
Este enfoque es útil cuando está interesado en probar la asociación entre dos variables categóricas, digamos la exposición y la enfermedad, ajustando una tercera variable categórica. Si se hace correctamente, también le permite investigar si la tercera variable es un factor de confusión o un modificador de efecto.
Por ejemplo, podría estar interesado en evaluar una asociación entre la obesidad y la enfermedad cardiovascular después de estratificar por edad o es posible que desee investigar las tasas de aceptación para hombres y mujeres en un programa universitario estratificado por departamento. En ambas situaciones, puede realizar un análisis estratificado para identificar la confusión y la interacción.
Un enfoque sistemático para el análisis estratificado implica los siguientes pasos:
- Prueba de asociación cruda de la variable explicativa con la variable de resultado o respuesta, es decir, realizar una prueba de chi-cuadrado para evaluar la importancia de la asociación y calcular una probabilidad cruda o riesgo relativo (junto con sus intervalos de confianza) para medir la fuerza de la asociación .
- Realice un análisis estratificado después de estratificar los datos por la tercera variable. Similar al primer paso, esto incluye probar la importancia y la medición de la resistencia de la asociación, pero para cada tabla de contingencia creada después de la estratificación.
Artículos Relacionados:
- ‘Aprende sobre los diferentes tipos de muestreo estratificado para mejorar tus investigaciones’
- Formula de muestreo estratificado: la guía completa
- El muestreo estratificado es una técnica de muestreo que permite obtener una muestra representativa de una población.
- Ejemplo de muestreo estratificado: guía completa para obtener resultados precisos
