Conocí las técnicas de muestreo cuando todavía estaba estudiando estadísticas. Recuerdo que fue uno de los temas que me gustaron más, ya que el profesor los explicó profundamente y me hizo entender cómo son fundamentales para muchos estudios de encuestas, pero en ese período estaba tan lleno de otros cursos y otros pensamientos que olvidé estos útiles. conceptos tan pronto como aprobé el examen.
Sin embargo, durante mi maestro de ciencia de datos y en mi trabajo de investigación real, indirectamente vi métodos de muestreo involucrados en muchos modelos de aprendizaje automático, como el bosque de decisiones, el bosque aleatorio, el bosque de aislamiento y muchos otros. También se emplean para resolver problemas, como la distribución de clases desequilibrada en el conjunto de datos, y mejorar la evaluación del rendimiento del modelo mediante el uso de un procedimiento de remuestreo, llamado validación cruzada K-Fold.
Por esta razón, decidí investigar más a fondo este sorprendente tema, que tiene un papel clave cuando se trata de una gran cantidad de datos. Comenzaré definiendo lo que está muestras. Una vez que los conceptos principales son claros, el siguiente paso es explicar diferentes técnicas de muestreo, centrándose en los métodos de muestreo probabilístico.
En un estudio estadístico, no siempre es posible obtener acceso a los datos de todos los casos. Por esta razón, la forma más práctica es incluir una parte de toda la población, llamada muestra.
Al realizar un muestreo, necesitamos definir algunos términos relevantes. Primero, la población objetivo incluye todo el conjunto de ítems en los que teóricamente interesados. Necesitamos distinguir la población objetivo de la población de estudio, a veces también llamada población de muestras, que es un subconjunto de la población objetivo que podemos obtener.
El muestreo es esencialmente el proceso de selección de una muestra de la población de estudio. Un requisito importante es que la muestra debe ser representativa de la población, tanto como sea posible, para generalizar las características de toda la población.
¿Cuáles son los tipos de muestreo probabilístico?
Una muestra en psicología empírica se define como un subconjunto de una población que se obtuvo utilizando un cierto proceso de selección. En un examen empírico, uno quiere concluir desde parámetros aleatorios hasta parámetros de población. Para que esta conclusión llegue a declaraciones válidas, la muestra para la población debe ser representativa, es decir, la muestra debe ser lo más posible para la población en su composición.
Varios procedimientos de la muestra aseguran la representatividad de la muestra a diferentes grados, por lo que se hace una distinción entre dos tipos de muestras: muestras probabilísticas y no probables. Las muestras probabilísticas se definen por el hecho de que la probabilidad de los elementos individuales es conocida y, en el mejor de los casos, lo mismo para todos los elementos, de modo que la población debe figurar lo más completa posible para muestras probabilísticas. Los elementos individuales de la muestra se seleccionan de esta lista de acuerdo con un procedimiento aleatorio. Con una muestra aleatoria simple, cada elemento de la población tiene la misma probabilidad e independiente de ser incluida en la muestra, por lo que la selección de un elemento no tiene ningún efecto en la selección de otros elementos. En una muestra en capas, la población se divide en poblaciones parciales basadas en ciertas características, la mayoría de las características sociodemográficas, como el género, la edad, la capa social y una muestra aleatoria, se extrae de cada población parcial. En el caso de la agrupación de SAB, una población que se divide en grupos naturales como las clases escolares se elige por casualidad algunos grupos y se examina en su totalidad.
En el caso de muestras no probabilísticas, no se conoce la probabilidad de seleccionar los elementos individuales. En el caso de la muestra de cuotas, la composición de la población con respecto a las características relevantes se determina y compila de tal manera que corresponde a estas características de la población en su composición. En el caso de muestras ad hoc u ocasionales, las personas están compuestas por aquellos elementos de la población que actualmente están disponibles para una investigación. Tales muestras no son representativas y pueden conducir a conclusiones distorsionadas sobre la población.
¿Qué es el muestreo no probabilístico y sus tipos?
El error de no muestreo se refiere a cualquier desviación entre los resultados de una encuesta y la verdad que no es causada por la selección aleatoria de observaciones. Es decir, el error de no muestreo es el total de todas las formas de error que no sean el error de muestreo. Los tipos comunes de error de no muestreo incluyen un error de no respuesta, error de medición, error del entrevistador, error de ajuste y error de procesamiento.
El error de no respuesta se refiere a errores causados por diferencias entre las personas que participan en encuestas versus personas que no participan en encuestas. Por ejemplo, las encuestas que preguntan a las personas sobre cómo pasan su tiempo probablemente tengan grandes cantidades de error de no respuesta, ya que las personas que pasan su tiempo haciendo encuestas son muy diferentes de las que no lo hacen.
El error de no respuesta se puede definir estrechamente en relación con si las personas seleccionadas para participar realmente participan (por ejemplo, la diferencia entre las personas que abrieron su invitación por correo electrónico y completaron una encuesta versus las que no lo hicieron); O puede definirse más ampliamente para incluir todos los aspectos no aleatorios del muestreo (por ejemplo, la selección de la lista que se utilizará en la investigación). Los errores relacionados con si las listas utilizadas en la investigación son representativas también se conocen como error de selección de listas y error de cobertura.
El error de medición se refiere a todos los errores relacionados con la medición específica de cada unidad de muestreo (en oposición a los errores relacionados con cómo se seleccionaron para medirse). Por ejemplo, estos podrían incluir palabras de preguntas confusas, datos de baja calidad debido a la fatiga de los encuestados y las escalas múltiples de baja calidad que se utilizan para medir conceptos abstractos.
El error del entrevistador ocurre cuando un entrevistador comete un error en cómo administra la encuesta o las respuestas registradas. Por ejemplo, en la investigación cualitativa, un entrevistador puede «liderar» a un encuestado a una determinada respuesta, y en la investigación cuantitativa, un entrevistador aburrido puede optar por hacer una pregunta en palabras que consideren superior a las del cuestionario.
Artículos Relacionados:
- Ejemplos de muestreo probabilístico: cómo seleccionar muestras aleatorias y cómo usarlas para estimar parámetros
- Los diferentes tipos de muestreo probabilístico y sus ventajas
- El muestreo probabilistico estratificado es una tecnica de muestreo utilizada para mejorar la precision de las estimaciones.
- Ejemplos de muestreo no probabilístico
- Ejemplo de muestra probabilística estratificada
