Los conjuntos de datos estadísticos son la recopilación de datos mantenidos en forma organizada. La base de cualquier análisis estadístico debe comenzar con la recopilación de datos, que luego se analiza utilizando herramientas estadísticas.
Por lo tanto, los conjuntos de datos estadísticos forman la base a partir de la cual se pueden extraer inferencias estadísticas.
Los conjuntos de datos estadísticos pueden registrar tanta información como lo requiere el experimento.
Por ejemplo, para estudiar la relación entre altura y edad, solo estos dos parámetros podrían registrarse en el conjunto de datos.
Sin embargo, si se requiere un estudio más completo en el experimentador, entonces el experimentador puede querer registrar la altura al nacer, el peso, los antecedentes nutricionales, los antecedentes familiares, etc.
Por lo tanto, el investigador debe determinar de antemano qué tipos de datos se requieren para registrarse en los conjuntos de datos estadísticos.
Ciertas cosas son comunes a todos los conjuntos de datos estadísticos. Por ejemplo, el orden de los datos no importa, lo que significa que la disposición de los datos dentro del conjunto de datos no es importante. Por lo tanto, el investigador tiene la libertad de organizar los sujetos en estudio en cualquier orden que lo encuentre conveniente.
Crear un conjunto de datos estadísticos es solo el primer paso en la investigación. La interpretación y validez de las inferencias extraídas de los datos es lo más importante. Sin embargo, esta tarea no es posible sin los conjuntos de datos. Por lo tanto, este es el punto de partida para la mayoría de las investigaciones en ciencias sociales, ciencias médicas y ciencias físicas.
¿Cómo se obtiene un conjunto de datos en estadística?
La codificación representa una fase del proceso de producción estadística que se incluirá en la organización de la misma cuando el cuestionario de detección contiene variables de texto, es decir, preguntas cuya respuesta es un texto libre. Estas son generalmente variables textuales para las cuales existe una clasificación oficial (actividad económica, profesión, calificación, municipio y/o estado de nacimiento o residencia) que permite la comparabilidad de los datos recopilados a nivel nacional y/o internacional. Codificar significa asociar el texto detectado con un código único sobre la base del esquema de referencia de referencia. El nivel de detalle del código que se atribuirá al texto depende de los objetivos de la investigación y/o el nivel de detalle requerido para la fase de difusión. La codificación se puede realizar manualmente o mediante sistemas automatizados. En el primer caso, al final de la fase de recolección, mientras que en el segundo caso también puede tener lugar durante la fase de recolección de datos (también asistido por computadora): hablamos, de codificación asistida si se lleva a cabo durante la adquisición y codificación automática fase si se lleva a cabo en retrospectiva.
En términos de GSBPM, la codificación es un subcool 5.2 «Clasificar y código» del «proceso» de fase 5 que incluye todas las actividades a las que sometes los datos para prepararlos para la fase de análisis posterior (fase 6 «Analizar»). En realidad, parte de las actividades de la fase 5 puede comenzar incluso antes de que la fase 4 anterior «recolecte» esté terminada, al igual que en el caso de la codificación asistida. Esto permite mejorar la puntualidad en la liberación de datos.
Al administrar una investigación, la fase de codificación de las respuestas textuales es muy costosa y si se realiza manualmente tampoco es muy estandarizable ya que el resultado está fuertemente influenciado por la codificación. De hecho, aunque los empleados de codificación están capacitados en los principios y criterios con los que se construye cada clasificación, la atribución de un código siempre está sujeta al factor de interpretación, lo que puede implicar que, con la misma formación, dos códigos de Atributo de codificación a los diferentes códigos para el mismo texto.
La adopción de software específico para la codificación implica ventajas no solo en términos de ahorro de tiempos y recursos para dedicarse a esta actividad, sino que sobre todo garantiza la estandarización del proceso que implica un mayor nivel de calidad del proceso en sí. La codificación a través de la computadora puede tener lugar en dos modos:
- Automático: el software analiza (en lote) un archivo que contiene el conjunto de respuestas textuales recopiladas al final de la investigación;
- Asistido: el software constituye un soporte interactivo para la codificación/encuestado, facilitando la navegación en la clasificación de referencia.
Los objetivos de la codificación automática y la codificación asistida son diferentes: en el caso de la codificación automática, el objetivo es identificar y extraer del diccionario una descripción única que realiza la coincidencia con la codificación; Sin embargo, en la codificación asistida, puede ser apropiado extraer un conjunto de descripciones del diccionario, incluso muy similar entre sí, luego dejando la codificación de la selección de la correcta.
Artículos Relacionados: