- Planificación del estudio: comience haciendo una pregunta de investigación comprobable y decidiendo cómo recopilar datos.
- Examinando los datos: ¿Cuáles son las formas apropiadas de examinar los datos?
El conocimiento estadístico lo ayuda a utilizar los métodos adecuados para recopilar los datos, emplear los análisis correctos y presentar efectivamente los resultados. Las estadísticas son un proceso crucial detrás de cómo hacemos descubrimientos en la ciencia, tomamos decisiones basadas en datos y hacemos predicciones.
Discutimos dos tipos de investigaciones estadísticas: el estudio observacional y el experimento. Cada tipo de investigación implica un enfoque diferente para recopilar datos. También veremos que nuestro enfoque para recopilar datos determina lo que podemos concluir de los datos.
Las herramientas estadísticas más conocidas son la media, el promedio aritmético de números, mediana y modo, rango, dispersión, desviación estándar, rango inter cuartil, coeficiente de variación, etc. También hay paquetes de software como SAS y SPSS que son útiles en Interpretando los resultados para un tamaño de muestra grande.
1: Una rama de las matemáticas que trata de la recopilación, análisis, interpretación y presentación de masas de datos numéricos. 2: Una colección de datos cuantitativos.
Los métodos estadísticos son fórmulas matemáticas, modelos y técnicas que se utilizan en el análisis estadístico de los datos de investigación sin procesar. Las herramientas estadísticas están involucradas en la realización de un estudio que incluyen planificar, diseñar, recopilar datos, analizar, dibujar una interpretación significativa e informes de los resultados de la investigación.
¿Cuáles son los componentes de una investigación estadística?
Considere las estadísticas como un proceso de resolución de problemas y examine sus cuatro componentes: hacer preguntas, recopilar datos apropiados, analizar los datos e interpretar los resultados. Esta sesión investiga la naturaleza de los datos y sus posibles fuentes de variación.
Los pasos en un estudio científicamente riguroso son los siguientes:
- Fase de investigación. Defina el problema y la pregunta de investigación. Revisión de literatura.
Un ciclo que se utiliza para llevar a cabo una investigación estadística. El ciclo consta de cinco etapas: problema, plan, datos, análisis, conclusión.
Se utilizan dos tipos de métodos estadísticos para analizar datos: estadísticas descriptivas y estadísticas inferenciales.
Conjunto de datos. Organización y presentación de los datos numéricos. Análisis de los datos numéricos. Interpretación de los datos numéricos.
Los métodos de investigación estadística se utilizan para estudiar los fenómenos de masa concretos y diversificar el acceso a las etapas de investigación estadística: recopilación de datos, procesamiento de datos y análisis. Todos los procesos de operación y métodos de investigación estadística constituyen la metodología de las estadísticas.
La materia de las estadísticas incluye dos componentes: estadísticas descriptivas y estadísticas inferenciales.
- Fase de investigación. Defina el problema y la pregunta de investigación. Revisión de literatura.
Las estadísticas tratan solo con grupos y agregados. 2) Los métodos estadísticos son mejor aplicables a los datos cuantitativos. (3) Las estadísticas no se pueden aplicar a datos heterogéneos. (4) Si no se ejerce suficiente atención al recopilar, analizar e interpretar los datos, los resultados estadísticos podrían ser engañosos.
¿Qué es la investigación estadística y cuáles son sus etapas?
Proporcionar una visión general de varias consideraciones importantes relacionadas con los datos en la etapa de diseño de un proyecto de investigación y revisar los niveles de medición y su relación con la técnica estadística elegida para el análisis de datos.
Al planificar un estudio, el investigador debe definir claramente el problema de la investigación y reducirlo a preguntas específicas y comprobables. Los siguientes pasos son identificar las variables en el estudio, decidir cómo agrupar y tratar a los sujetos, y determinar cómo medir, y el nivel subyacente de medición de las variables dependientes. Luego, la técnica estadística apropiada se puede seleccionar para el análisis de datos.
Los cuatro niveles de medición en el aumento de la complejidad son nominales, ordinales, intervalos y relación. Los datos nominales son datos categóricos o de «contar», y los números se tratan como etiquetas. Los datos ordinales se pueden clasificar en un orden significativo por magnitud. Los datos de intervalo poseen las características de los datos ordinales y también tienen distancias iguales entre los niveles. Los datos de la relación tienen un punto cero natural. Los datos nominales y ordinales se analizan con técnicas estadísticas no paramétricas y datos de intervalo y relación con técnicas estadísticas paramétricas.
Comprender los cuatro niveles de medición y cuando es apropiado usar cada uno es importante para determinar qué técnica estadística usar al analizar los datos.
¿Qué es conjunto formado por todos los elementos que serán parte de una investigación estadística?
- Planificación del estudio: comience haciendo una pregunta de investigación comprobable y decidiendo cómo recopilar datos. Por ejemplo, ¿cuánto tiempo fue el período de estudio del estudio del café? ¿Cuántas personas fueron reclutadas para el estudio, cómo fueron reclutados y de dónde? ¿Qué edad tenían? ¿Qué otras variables se registraron sobre las personas, como los hábitos de fumar, en los cuestionarios integrales de estilo de vida? ¿Se hicieron cambios en los hábitos de café de los participantes durante el curso del estudio?
- Examinando los datos: ¿Cuáles son las formas apropiadas de examinar los datos? ¿Qué gráficos son relevantes y qué revelan? ¿Qué estadísticas descriptivas se pueden calcular para resumir aspectos relevantes de los datos y qué revelan? ¿Qué patrones ves en los datos? ¿Hay alguna observación individual que se desvíe del patrón general y qué revelan? Por ejemplo, en el estudio del café, ¿diferían las proporciones cuando comparamos a los fumadores con los no fumadores?
- Inferir de los datos: ¿Cuáles son los métodos estadísticos válidos para dibujar inferencias «más allá» de los datos que recopiló? En el estudio del café, ¿la reducción del 10% al 15% en el riesgo de muerte es algo que podría haber sucedido por casualidad?
- Dibujo de conclusiones: según lo que aprendió de sus datos, ¿qué conclusiones puede extraer? ¿A quién crees que se aplican estas conclusiones? (¿Estaban las personas en el café más viejas? ¿Saludas? ¿Viviendo en ciudades?) ¿Puedes sacar una conclusión de causa y efecto sobre tus tratamientos? (¿Los científicos ahora dicen que el café para beber es la causa de la disminución del riesgo de muerte?)
Observe que el análisis numérico («números de crujido» en la computadora) comprende solo una pequeña parte de la investigación estadística general. En este módulo, verá cómo podemos responder algunas de estas preguntas y qué preguntas debe hacer sobre cualquier investigación estadística sobre la que lea.
Cuando se recopilan los datos para abordar una pregunta particular, un primer paso importante es pensar en formas significativas de organizar y examinar los datos. El principio más fundamental de las estadísticas es que los datos varían. El patrón de esa variación es crucial para capturar y comprender. A menudo, la presentación cuidadosa de los datos abordará muchas de las preguntas de investigación sin requerir análisis más sofisticados. Sin embargo, puede señalar preguntas adicionales que deben examinarse con más detalle.
Ejemplo 1: Los investigadores investigaron si los folletos de cáncer están escritos en un nivel apropiado para ser leídos y entendidos por pacientes con cáncer (Short, Moriarty y Cooley, 1995). Las pruebas de capacidad de lectura se dieron a 63 pacientes. Además, se determinó el nivel de legibilidad para una muestra de 30 folletos, basadas en características como la longitud de las palabras y las oraciones en el folleto. Los resultados, informados en términos de niveles de grado, se muestran en la Tabla 1.
Estas dos variables revelan dos aspectos fundamentales del pensamiento estadístico:
- Planificación del estudio: comience haciendo una pregunta de investigación comprobable y decidiendo cómo recopilar datos. Por ejemplo, ¿cuánto tiempo fue el período de estudio del estudio del café? ¿Cuántas personas fueron reclutadas para el estudio, cómo fueron reclutados y de dónde? ¿Qué edad tenían? ¿Qué otras variables se registraron sobre las personas, como los hábitos de fumar, en los cuestionarios integrales de estilo de vida? ¿Se hicieron cambios en los hábitos de café de los participantes durante el curso del estudio?
- Examinando los datos: ¿Cuáles son las formas apropiadas de examinar los datos? ¿Qué gráficos son relevantes y qué revelan? ¿Qué estadísticas descriptivas se pueden calcular para resumir aspectos relevantes de los datos y qué revelan? ¿Qué patrones ves en los datos? ¿Hay alguna observación individual que se desvíe del patrón general y qué revelan? Por ejemplo, en el estudio del café, ¿diferían las proporciones cuando comparamos a los fumadores con los no fumadores?
- Inferir de los datos: ¿Cuáles son los métodos estadísticos válidos para dibujar inferencias «más allá» de los datos que recopiló? En el estudio del café, ¿la reducción del 10% al 15% en el riesgo de muerte es algo que podría haber sucedido por casualidad?
- Dibujo de conclusiones: según lo que aprendió de sus datos, ¿qué conclusiones puede extraer? ¿A quién crees que se aplican estas conclusiones? (¿Estaban las personas en el café más viejas? ¿Saludas? ¿Viviendo en ciudades?) ¿Puedes sacar una conclusión de causa y efecto sobre tus tratamientos? (¿Los científicos ahora dicen que el café para beber es la causa de la disminución del riesgo de muerte?)
Abordar la pregunta de investigación de si los panfletos de cáncer están escritos a niveles apropiados para los pacientes con cáncer requieren comparar las dos distribuciones. Una comparación ingenua podría centrarse solo en los centros de las distribuciones. Ambas medianas resultan ser noveno grado, pero considerando solo las medianas ignora la variabilidad y las distribuciones generales de estos datos. Un enfoque más esclarecedor es comparar todas las distribuciones, por ejemplo, con un gráfico, como en la Figura 1.
¿Qué etapas tiene una investigación estadística?
Los siguientes métodos de análisis, por ejemplo, son particularmente populares, que a menudo también permiten conclusiones sobre la población:
- Las condiciones y la dependencia entre los valores discretos (categóricos) independientes (por ejemplo, el número de participantes de la encuesta que han cruzado una cierta categoría Likert) se examinan utilizando una tabla cruzada a la que se usa una prueba de Chi Square para verificar su dependencia. Sin embargo, la prueba de Chi Square está vinculado al cumplimiento de ciertas condiciones. Si estas condiciones no se cumplen, se utiliza la prueba exacta de Fisher, que es más generalmente aplicable pero también es más difícil de calcular.
- Los tamaños discretos de las muestras conectadas se analizan con la prueba McNemar.
- Se comparan dos muestras con datos continuos (estacionados) distribuidos normales con la ayuda de la prueba t (prueba del estudiante) o con más de dos muestras con la prueba ANOVA o un análisis de varianza. La prueba T y la prueba ANOVA están disponibles en la variante no remunerada para muestras independientes y en la variante emparejada para muestras de salida.
- La conexión lineal entre dos variables estables normalmente distribuidas se examina, por ejemplo, con la prueba de correlación de Pearson.
- La prueba de correlación según Spearmann también puede examinar las dependencias entre datos distribuidos ordinales y no normales.
- Si los datos continuos no se distribuyen normalmente, usted usa, por ejemplo, para…
- Dos muestras independientes: prueba de hombre-whitney (prueba de u),
- Más de dos muestras independientes: prueba de Kruskal Wallis
- Dos muestras conectadas: prueba de wilcoxon (en diferentes variantes para muestras emparejadas o no apareadas),
- Más de dos muestras conectadas: prueba de Friedmann.
Además, hay una variedad de otros métodos para el análisis de estadísticas, como los modelos de ecuación estructural. Las pruebas estadísticas que se pueden usar para verificar ciertas condiciones también son muy comunes (por ejemplo, prueba Shapiro-Wilk, prueba de Kolmogorov-Smirnov, prueba de Leven sobre homogeneidad de varianza y mucho más). Los datos textuales se evalúan utilizando métodos de análisis de texto o la minería de texto. Los procedimientos de minería de datos de WohingGen se utilizan para aplicaciones de big data.
Solo podemos presentar los procedimientos de análisis más importantes y sus diferencias. Las estadísticas son una ciencia con una gran cantidad de métodos, existe la adecuada para cada propósito. Sin embargo, los diferentes métodos de análisis de datos difieren y deben seleccionarse sabiamente. Por lo general, los diferentes procedimientos estadísticos para los mismos datos conducen a diferentes resultados y conclusiones para la población. Ya sea descriptivo o inductivo: no debe cubrirse al elegir el método.
¿Cómo se clasifica la investigación estadística?
La información que se indica que está archivada se proporciona para referencia, investigación o fines de retención de documentos. No está sujeto a los estándares web del Gobierno de Canadá y no se ha cambiado ni actualizado desde su archivo. Para obtener esta información en otro formato, contáctenos.
La frecuencia acumulativa se usa para determinar el número de observaciones que están por encima (o debajo) de un valor particular en un conjunto de datos. La frecuencia acumulativa se calcula utilizando una tabla de distribución de frecuencia, que se puede construir a partir de diagramas de tallo y hoja o directamente a partir de datos.
La frecuencia acumulativa se calcula agregando cada frecuencia extraída de una tabla de distribución de frecuencia a la suma de los anteriores. El último valor siempre será igual al total de observaciones, ya que todas las frecuencias ya se han agregado al total anterior.
Las variables se pueden caracterizar dentro de un cálculo utilizando el valor atribuido a ellas. Una variable discreta consiste en categorías separadas e indivisibles. No puede haber valor entre una variable y su vecino. Por ejemplo, si observara las prepuestas en clase grabadas de un día al siguiente, podría descubrir que la clase tiene 29 estudiantes un día y 30 más. Sin embargo, es imposible que el número de presencia de presencia sea entre 29 y 30. (Simplemente no hay espacio para observar un valor entre estas dos variables, ya que es absolutamente imposible tener una clase con 29 y medio estudiantes).
No caracterizamos todas las variables como variables discretas. Algunos (como el tiempo, el tamaño y el peso) no se limitan a un conjunto fijo de categorías indivisibles. Estas variables se llaman variables continuas; Estos son divisibles en un número infinito de valores posibles. Por ejemplo, puede medir el tiempo en partes fraccionales de horas, minutos, segundos y milisegundos. Entonces, en lugar de completar una carrera en 11 o 12 minutos, un jinete y su caballo pueden cruzar la línea de meta en 11 minutos y 43 segundos.
¿Cómo se clasifica la estadística ejemplo?
Los datos pueden ser clasificados como restringidos, privados o públicos por una organización. En este caso, los datos públicos se consideran los datos menos sensibles con los requisitos de seguridad más bajos, mientras que los datos restringidos son los datos más confidenciales con la clasificación de seguridad más alta. Muchas empresas comienzan con este tipo de clasificación de datos, seguido de procedimientos de identificación y etiquetado adicionales que etiquetan datos en función de su relevancia para el negocio, la calidad y otras clasificaciones. Los procesos de clasificación de datos más exitosos utilizan procesos de seguimiento y marcos para mantener datos confidenciales donde pertenece.
Regex es un sistema de análisis de cadenas que define detalles sobre los patrones de búsqueda. Es corto para la expresión regular. Particularmente, si desea encontrar todos los números de tarjeta de crédito Visa en sus datos, puede usar el Regex:
Esta secuencia busca un número de 16 caracteres que comienza con un ‘4’ y tiene cuatro cuartetos separados por un ‘-. Un resultado positivo se genera solo cuando una cadena de caracteres coincide con la regex. Se puede usar un algoritmo Luhn para validar este resultado más.
En este caso, un regex solo no será suficiente. Este Regex encuentra direcciones de correo electrónico válidas, pero no puede notar la diferencia entre los correos electrónicos personales y comerciales:
Una política de clasificación de datos más avanzada podría usar una matcher de patrones regex y una búsqueda de diccionario para reducir los resultados utilizando una biblioteca de servicios de dirección de correo electrónico personal como Gmail, Outlook y otros.
Artículos Relacionados:
- Cómo usar la estadística en la investigación para mejorar los resultados
- 5 elementos de la estadística que debes saber
- Estadística en la investigación: ¿por qué es importante?
- Proyecto de investigación estadística: métodos y aplicaciones
- Las limitaciones y aportaciones del uso de la estadística en la investigación
