Muchos enfoques para el análisis de datos pueden verse como datos
«Resumen». El efecto más inmediato de resumir los datos es
tomar datos que pueden ser abrumadores para trabajar y reducirlos a un
Pocos valores de resumen clave que se pueden ver, a menudo en una tabla o gráfico.
Como hemos enfatizado antes, el análisis de datos siempre debe apuntar a
abordar preguntas de investigación específicas y explícitas. Este principio continúa teniendo cuando
Trabajando con resúmenes de datos. Hay muchos resúmenes de datos en común
El uso, y se continúan desarrollándose nuevos enfoques para resumir datos.
Sin embargo, no todos los resúmenes de datos son igualmente relevantes para abordar un
pregunta particular. Al realizar un análisis de datos, es importante
identificar resúmenes de datos que son informativos para abordar el
Pregunta en cuestión.
Anteriormente tenemos
introdujo las nociones clave de muestras y poblaciones. Nuestros datos
(la «muestra») refleja una población que no podemos
observar completamente. El objetivo de un análisis de datos es siempre aprender
sobre la población, no solo sobre la muestra. Al realizar un
Análisis de datos que involucra resúmenes de datos, calcularemos el
resúmenes que usan los datos para nuestra muestra (ya que eso es todo con lo que tenemos que trabajar), pero
sacar conclusiones (con cuantificación de incertidumbre apropiada) sobre
la población.
No existe (y probablemente nunca existirá) una receta o
algoritmo que nos dice automáticamente qué resúmenes de datos se pueden usar
Para abordar una pregunta particular. Por lo tanto, es importante
Comprender la motivación y las propiedades teóricas detrás de una serie de diferentes
enfoques de resumen. Con experiencia, puedes desarrollar el
Capacidad para resumir de manera efectiva los datos de una manera que brinde información
con respecto a sus objetivos de investigación.
¿Qué es un resumen de datos?
Las tablas de resumen de datos, el Formulario I y el Formulario IE (TICS) se proporcionan en el DUSR e incluyen el límite de informes para cada compuesto no detectado.
Protocolo para la evaluación y comparación de la tolerabilidad y aceptabilidad de diferentes RubsJ de mano basado en el alcohol) Instrucciones de análisis de análisis de entrada) Instrucciones para la entrada y análisis de datos) Resumen de datos Marco Marco Nota: Se pueden obtener herramientas del sitio web de la Organización Mundial de la Salud en www.who.Int /GPSC/EN 8.4 Los recordatorios en los placeres de trabajo son importantes para recordar y impulsar a todos los profesionales de la salud sobre la importancia de la higiene de las manos y los 5 momentos de la OMS a la higiene a mano.
Hoja de datos significa una parte integral de las instrucciones para los consultores (ITC) Sección 2 que se utiliza para reflejar las condiciones específicas de país y asignación para complementar, pero no para escribir exceso de escritura, las disposiciones del ITC.
Conjunto de datos significa una colección de registros de datos individuales, ya sea en archivos electrónicos o manuales.
Usuario de datos significa una persona natural o jurídica que tiene acceso legal a ciertos datos personales o no personales y tiene el derecho, incluso bajo regulación (UE) 2016/679 en el caso de datos personales, para usar esos datos para comerciales o no no propósitos comerciales;
Informe resumido significa el informe de fin de año que contiene el resumen de las contribuciones y gastos de una entidad informante.
Sitio de datos significa un sitio de datos de protegido de contraseña electrónica mantenido por el prestatario (o por el gerente colateral en nombre del prestatario) en Merrill Corporation, Intralinks, Syndtrak Online o cualquier otro sistema de distribución electrónica similar razonablemente aceptable para el agente administrativo.
¿Qué son los datos resumen?
El primer aspecto importante de cualquier análisis estadístico es un resumen apropiado de las variables analíticas clave. Esto implica primero identificar el tipo de variable que se analiza. Este paso es extremadamente importante ya que los resúmenes numéricos y gráficos apropiados dependen del tipo de variable que se analiza. Las variables son dicotómicas, ordinales, categóricas o continuas. Los mejores resúmenes numéricos para variables dicotómicas, ordinales y categóricas implican frecuencias relativas. Los mejores resúmenes numéricos para variables continuas incluyen la media y la desviación estándar o el rango mediano y intercuartil, dependiendo de si hay valores atípicos en la distribución o no. La desviación media y estándar o el rango mediano e intercuartil resumen la tendencia central (también llamada ubicación) y la dispersión, respectivamente. El mejor resumen gráfico para variables dicotómicas y categóricas es un gráfico de barras y el mejor resumen gráfico para una variable ordinal es un histograma. Tanto los gráficos de barras como los histogramas pueden diseñarse para mostrar frecuencias o frecuencias relativas, siendo este último la exhibición más popular. Los gráficos de bigotes de caja proporcionan un resumen muy útil e informativo para las variables continuas. Los gráficos de bigotes de caja también son útiles para comparar las distribuciones de una variable continua entre los grupos de comparación mutuamente excluyentes (es decir, no superpuestas).
La siguiente tabla resume las estadísticas clave y las pantallas gráficas organizadas por tipo variable.
- Ordinal
- El panel de expertos. Panel de expertos sobre detección, evaluación y tratamiento del colesterol alto en sangre en adultos: resumen del segundo informe del panel de expertos de NCEP (panel de tratamiento de adultos II). Revista de la Asociación Médica Americana. 1993; 269: 3015-3023.
¿Cómo hacer un resumen de datos?
En este escenario, estaba específicamente interesado en la generación de electricidad por tipo de fuente y por el estado de EE. UU. La EIA proporciona esta información, así como los valores generales de generación de electricidad total. Al enfrentar valores crudos como estos, pregúntese: «¿A qué puedo comparar estos valores para comprender mejor su importancia?» Esta es una gran pregunta porque su audiencia comprenderá la información mucho más fácilmente si se compara con otra información. [1] Tare una serie de estadísticas que puede calcular para responder a esta pregunta:
Totales: sumar valores para obtener una perspectiva de panorama general a menudo es útil.
Porcentaje de cambio: una buena manera de comparar el tamaño por el cual los valores han cambiado.
Según los datos de la EIA, decidí que comparar la electricidad generada por el tipo de fuente con el total electricidad total generada generada era mucho más significativa. Así que calculé porcentajes para cada tipo de fuente contra el número total de megavatios. De esa manera, podría medir cuánto del total de electricidad de cada estado fue generada por el carbón, el viento, el gas natural, etc. ¡Los resultados fueron mucho más fáciles de entender y particularmente esclarecedores! Una vez que se mapearon los datos, vi que un gran porcentaje de la generación eléctrica del Medio Oeste se debió a la energía eólica, un resultado interesante teniendo en cuenta que los estados vecinos se han adherido al carbón y al petróleo.
Sí, ese es un gran N-O. Use el mejor juicio cuando calcule las estadísticas. Cualquiera de las estadísticas en la sección anterior debe calcularse con valores de la misma unidad de medida. Así que no vaya a agregar valores y porcentajes en dólares porque eso no tiene sentido. Del mismo modo, tenga cuidado con los valores de datos faltantes o los valores de datos incorrectos que puedan tirar sus cálculos (¡aunque su análisis según lo revisado en mi primera publicación de esta serie debería ayudarlo a darse cuenta de ellos!). En caso de duda, solicite ayuda de un recurso confiable como su instructor, bibliotecario o colega.
¿Cómo realizar un resumen de datos?
- Con una celda seleccionada en un complemento para la tabla de Excel,
Haga clic en la pestaña ACL Addent y seleccione Resumir> Resumir. - Seleccione una columna de cualquier tipo de datos para resumir.
- Opcional para omitir el recuento o porcentaje
Para los valores únicos en la columna, claro incluir
contar o incluir porcentaje.
Si borra incluir el recuento, incluya
El porcentaje también se borra automáticamente.
- Con una celda seleccionada en un complemento para la tabla de Excel,
Haga clic en la pestaña ACL Addent y seleccione Resumir> Resumir. - Seleccione una columna de cualquier tipo de datos para resumir.
- Opcional para omitir el recuento o porcentaje
Para los valores únicos en la columna, claro incluir
contar o incluir porcentaje.
Para definir el formato de salida, seleccione una de las siguientes opciones de salida y luego haga clic en Finalizar:
- Con una celda seleccionada en un complemento para la tabla de Excel,
Haga clic en la pestaña ACL Addent y seleccione Resumir> Resumir. - Seleccione una columna de cualquier tipo de datos para resumir.
- Opcional para omitir el recuento o porcentaje
Para los valores únicos en la columna, claro incluir
contar o incluir porcentaje.
una tabla de complementos ACL definida
Excel es fundamental
Excel Pivotchart con el acompañante Pivottable
Los resultados de la salida aparecen en una nueva hoja de trabajo de complementos de ACL. Si genera los resultados a un pivottable o pivotchart,
Puede resumir mediante columnas adicionales (resumen anidado), o
Agregue columnas subtotales adicionales:
- Con una celda seleccionada en un complemento para la tabla de Excel,
Haga clic en la pestaña ACL Addent y seleccione Resumir> Resumir. - Seleccione una columna de cualquier tipo de datos para resumir.
- Opcional para omitir el recuento o porcentaje
Para los valores únicos en la columna, claro incluir
contar o incluir porcentaje.
una tabla de complementos ACL definida
Excel es fundamental
Excel Pivotchart con el acompañante Pivottable
El Pivotchart.
¿Cómo se resumen los datos en estadistica?
¿Por qué resumimos? Resumimos datos para «simplificar» los datos e identificar rápidamente lo que parece «normal» y lo que parece extraño. La distribución de una variable muestra qué valores toma la variable y con qué frecuencia la variable toma estos valores.
Las dos formas más útiles de describir la distribución de datos son:
- Lo típico: esto describe el centro, o medio, de los datos. Esta forma de describir el centro también se llama una «medida de tendencia central».
- La propagación de los valores alrededor del centro: esto describe cuán densamente se distribuyen los datos alrededor del centro. Esto también se llama una «medida de dispersión».
Estas dos formas de describir los datos también se denominan estadísticas descriptivas.
Las tres formas comunes de ver el centro son promedio (también llamado media), modo y mediana. Los tres resumen una distribución de los datos al describir el valor típico de una variable (promedio), el número repetido (modo) más frecuentemente o el número en el medio de todos los demás números en un conjunto de datos (mediana) .1 en Este módulo, nos vamos a centrar en el promedio. El promedio es la forma más apropiada de medir el centro de datos de intervalo/continuo (por ejemplo, números de votantes registrados). Para calcular el promedio, sumamos todos los números para una variable y luego nos dividimos por cuántos números hay. Dicho de otra manera, el promedio (media) es la suma dividida por el recuento.
En el conjunto de datos de ejemplo a continuación, tenemos información sobre los nombres de algunos animales. También tenemos mediciones de la altura de cada animal. El conjunto de datos tiene dos variables (nombre y altura) y cinco observaciones. Aquí está el conjunto de datos:
Aquí hemos hecho una tabla rápida que traza la altura de cada animal:
Para calcular la altura promedio (en cm) resumimos todos los valores y nos dividimos mediante el recuento total de observaciones:
Altura promedio = (181 + 175 + 159 + 177 + 165) ÷ 5 = 857 ÷ 5 = 171.4
¿Qué es el resumen de datos en estadística?
Hay una variedad de estadísticas descriptivas. Números como medios, mediana, moda, asimetría, curiosidad, desviación estándar, primer trimestre y tercer cuartil, solo por nombrar algunos, nos cuéntanos algo sobre nuestros datos. En lugar de mirar estas estadísticas descriptivas individualmente, a veces combinarlas ayuda a darnos una imagen completa. Con este propósito en mente, el resumen de los cinco no ingresos es una forma conveniente de combinar cinco estadísticas descriptivas.
Está claro que debe haber cinco números en nuestro resumen, pero ¿cuáles cinco? Los números elegidos nos ayudan a conocer el centro de nuestros datos y cuán distribuidos están los puntos de datos. Con esto en mente, el resumen de los cinco no ingresos está compuesto por lo siguiente:
- El mínimo: este es el valor más pequeño en nuestro conjunto de datos.
- El primer trimestre: este número se indica con Q 1 y el 25% de nuestros datos caen por debajo del primer trimestre.
- La mediana: este es el punto intermedio de los datos. El 50% de todos los datos caen por debajo de la mediana.
- El tercer trimestre: este número se indica con Q 3 y el 75% de nuestros datos caen por debajo del tercer trimestre.
- El máximo: este es el valor más grande en nuestro conjunto de datos.
La desviación promedio y estándar también se puede usar juntas para transmitir el centro y la difusión de un conjunto de datos. Sin embargo, ambas estadísticas son susceptibles a valores anómalos. La mediana, el primer trimestre y el tercer cuarto no están tan fuertemente influenciados por valores anómalos.
¿Por qué se deben resumir los datos en estadística?
Cuando resumimos los datos, necesariamente estamos desechando información, y uno podría objetarlo plausiblemente a esto. Como ejemplo, volvamos al estudio puro que discutimos en el Capítulo 1. ¿No se supone que debamos creer que todos los detalles sobre cada asunto individual, más allá de los que se resumen en el conjunto de datos? ¿Qué pasa con los detalles específicos de cómo se recopilaron los datos, como la hora del día o el estado de ánimo del participante? Todos estos detalles se pierden cuando resumimos los datos.
Una razón por la que resumimos los datos es que nos proporciona una forma de generalizar, es decir, hacer declaraciones generales que se extienden más allá de observaciones específicas. La importancia de la generalización fue destacada por el escritor Jorge Luis Borges en su cuento «Div lasciva el memorio», que describe a un individuo que pierde la capacidad de olvidar. Borges se centra en la relación entre la generalización (es decir, tirar datos) y pensar: “Pensar es olvidar una diferencia, generalizar, abstracto. En el mundo de diversión demasiado repleto, no había nada más que detalles «.
Los psicólogos han estudiado durante mucho tiempo todas las formas en que la generalización es fundamental para pensar. Un ejemplo es la categorización: podemos reconocer fácilmente diferentes ejemplos de la categoría de «aves» a pesar de que los ejemplos individuales pueden ser muy diferentes en sus características de superficie (como un avestruz, un robin y un pollo). Es importante destacar que la generalización nos permite hacer predicciones sobre estas personas; en el caso de las aves, podemos predecir que pueden volar y comer semillas, y que probablemente no pueden conducir un automóvil o hablar inglés. Estas predicciones no siempre serán correctas, pero a menudo son lo suficientemente buenas como para ser útiles en el mundo.
Una forma simple de resumir los datos es generar una tabla que representa los recuentos de varios tipos de observaciones. Este tipo de tabla se ha utilizado durante miles de años (ver Figura 3.1).
Artículos Relacionados:
- Reporte de datos: nuevas formas de analizar y comprender la información
- Serie de datos: 10 trucos para mejorar tu web
- Plantilla de datos: cómo optimizar su sitio web para el mejor rendimiento
- 6 ejemplos de datos para optimizar tu estrategia de marketing
- Base de datos: conclusiones y recomendaciones para el futuro
