Los datos numéricos recopilados en un proyecto de investigación se pueden analizar cuantitativamente utilizando herramientas estadísticas de dos maneras diferentes. El análisis descriptivo se refiere a describir, agregar y presentar estadísticamente las construcciones de interés o asociaciones entre estas construcciones. El análisis inferencial se refiere a las pruebas estadísticas de hipótesis (pruebas de teoría). En este capítulo, examinaremos las técnicas estadísticas utilizadas para el análisis descriptivo, y el próximo capítulo examinará las técnicas estadísticas para el análisis inferencial. Gran parte del análisis de datos cuantitativos de hoy se realiza utilizando programas de software como SPSS o SAS. Se aconseja a los lectores que se familiaricen con uno de estos programas para comprender los conceptos descritos en este capítulo.
En proyectos de investigación, los datos se pueden recopilar de una variedad de fuentes: encuestas por correo, entrevistas, datos experimentales de prueba previa o posterior, datos de observación, etc. Estos datos deben convertirse en un formato numérico legible por máquina, como en una hoja de cálculo o un archivo de texto, para que puedan ser analizados por programas de computadora como SPSS o SAS. La preparación de datos generalmente sigue los siguientes pasos.
Codificación de datos. La codificación es el proceso de convertir datos en formato numérico. Se debe crear un libro de códigos para guiar el proceso de codificación. Un libro de códigos es un documento integral que contiene una descripción detallada de cada variable en un estudio de investigación, elementos o medidas para esa variable, el formato de cada elemento (numérico, texto, etc.), la escala de respuesta para cada elemento (es decir, si es así. medido en una escala nominal, ordinal, de intervalos o de relación; si dicha escala es un tipo de escala de cinco puntos, siete o algún otro tipo), y cómo codificar cada valor en un formato numérico. Por ejemplo, si tenemos un elemento de medición en una escala Likert de siete puntos con anclajes que van desde «totalmente en desacuerdo» hasta «totalmente de acuerdo», podemos codificar ese ítem como 1 para totalmente en desacuerdo, 4 para neutral y 7 por muy de acuerdo , con los anclajes intermedios en el medio. Los datos nominales como el tipo de industria se pueden codificar en forma numérica utilizando un esquema de codificación como: 1 para fabricación, 2 para el comercio minorista, 3 para financiero, 4 para atención médica, etc. (por supuesto, los datos nominales no se pueden analizar estadísticamente). Los datos de la escala de relación, como la edad, los ingresos o los puntajes de las pruebas, se pueden codificar según lo ingresado por el encuestado. A veces, es posible que los datos necesiten agregarse en una forma diferente al formato utilizado para la recopilación de datos. Por ejemplo, para medir una construcción como «beneficios de las computadoras», si una encuesta proporcionó a los encuestados una lista de verificación de B enefita de la que podrían seleccionar (es decir, podrían elegir tantos beneficios como quisieran), entonces el total El número de elementos marcados se puede utilizar como una medida agregada de beneficios. Tenga en cuenta que muchas otras formas de datos, como las transcripciones de la entrevista, no pueden convertirse en un formato numérico para el análisis estadístico. La codificación es especialmente importante para grandes estudios complejos que involucran muchas variables y elementos de medición, donde el proceso de codificación es realizado por diferentes personas, para ayudar a los datos del código de codificación de manera consistente, y también para ayudar a otros a comprender e interpretar los datos codificados.
Entrada de datos. Los datos codificados se pueden ingresar en una hoja de cálculo, base de datos, archivo de texto o directamente en un programa estadístico como SPSS. La mayoría de los programas estadísticos proporcionan un editor de datos para ingresar datos. Sin embargo, estos programas almacenan datos en su propio formato nativo (por ejemplo, SPSS almacena datos como archivos .SAV), lo que dificulta compartir esos datos con otros programas estadísticos. Por lo tanto, a menudo es mejor ingresar datos en una hoja de cálculo o base de datos, donde se pueden reorganizarse según sea necesario, compartir en los programas y los subconjuntos de datos se pueden extraer para su análisis. Los conjuntos de datos más pequeños con menos de 65,000 observaciones y 256 elementos se pueden almacenar en una hoja de cálculo como Microsoft Excel, mientras que el conjunto de datos más grande con millones de observaciones requerirá una base de datos. Cada observación se puede ingresar como una fila en la hoja de cálculo y cada elemento de medición se puede representar como una columna. Los datos ingresados deben verificarse con frecuencia para determinar la precisión, a través de verificaciones spot ocasionales en un conjunto de elementos u observaciones, durante y después de la entrada. Además, al ingresar los datos, el codificador debe tener cuidado con la evidencia obvia de datos malos, como el encuestado que selecciona la respuesta de «totalmente de acuerdo» a todos los elementos, independientemente del contenido, incluidos los elementos codificados por inversiones. Si es así, dichos datos se pueden ingresar pero deben excluirse del análisis posterior.
¿Qué estudia la estadística descriptiva ejemplos?
Las estadísticas descriptivas permiten a los investigadores proporcionar un resumen básico de los conjuntos de datos. Las pruebas generalmente se llevan a cabo antes de llevar a cabo un análisis estadístico que prueba la hipótesis. Estas pruebas son beneficiosas al proporcionar a los investigadores información sobre posibles relaciones entre variables e información sobre qué pruebas estadísticas serían apropiadas para probar la hipótesis propuesta.
Es importante tener en cuenta que las estadísticas descriptivas proporcionan información sobre el conjunto de datos y no es apropiado generalizar a la población general.
El propósito de las estadísticas de frecuencia es calcular la aparición de variables, por ejemplo, el número de participantes en un grupo de prueba frente a un grupo de control, o el número de hombres versus mujeres en una muestra. Estos datos generalmente se producen en forma de tablas de frecuencia.
Un ejemplo de salida de tabla de frecuencia podría proporcionar estadísticas de frecuencia para dos variables: género y etnia. La tabla indicaría el número de participantes clasificados en cada subgrupo de la investigación (N). La tabla también proporcionaría información estadística sobre cuánto N (para cada variable) representa la muestra total en forma de porcentajes. Un ejemplo de cómo se informaría esto en la investigación es «la muestra de estudio consistió en 216 mujeres y 259 hombres (n = 474)».
Hay muchas pruebas estadísticas diferentes utilizadas para medir la tendencia central. Las medidas de tendencia central dan un valor único que es un promedio de todo el conjunto de datos, esto es beneficioso para grandes conjuntos de datos. Los tres más utilizados son: media, mediana y modo.
Artículos Relacionados: