Comparación de datos años o cifras: ¿Cuál es el mejor método?

Cuando compara dos o más conjuntos de datos, concéntrese en cuatro características:

  • Centro. Gráficamente, el centro de una distribución es
    el punto donde aproximadamente la mitad de las observaciones están en cualquiera
    lado.
  • Untado. La propagación de una distribución se refiere a la variabilidad
    de los datos. Si las observaciones cubren un amplio rango, el
    La propagación es más grande. Si las observaciones se agrupan
    Un valor único, la propagación es más pequeña.
  • Forma. La forma de una distribución se describe por
    simetría,
    oblicuidad,
    número de picos, etc.
  • Características inusuales. Características inusuales se refieren a los huecos (áreas de la
    distribución donde no hay observaciones) y
    valores atípicos.

El resto de esta lección muestra cómo usar
Varios gráficos para comparar conjuntos de datos en términos de centro, propagación, forma e inusual
caracteristicas. (Esta es una habilidad que se espera que los estudiantes dominen para el
Examen de estadísticas de colocación avanzada)

Cuando
gruesas
se utilizan para comparar conjuntos de datos, se colocan uno encima del otro,
Usando la misma escala de medición, como se muestra a continuación.

Los Dotplots muestran la propiedad de mascotas en las casas
en dos cuadras de la ciudad. Aquí le mostramos cómo interpretar los Dotplots. Cada punto representa un hogar. Como se muestra en los gráficos, el Bloque A y el Bloque B tienen 15 puntos.
Eso significa que cada bloque tiene 15 hogares. Los números a lo largo del eje representan el número de mascotas propiedad de un hogar.

La propiedad de mascotas es un poco más baja en el bloque A. en el bloque A,
La mayoría de los hogares tienen cero o una mascota; En el bloque B, la mayoría
Los hogares tienen dos o más mascotas. En el bloque A, la propiedad de las mascotas es
sesgado a la derecha; En el bloque B, tiene forma de campana. En bloque
B, la propiedad de mascotas varía de 0 a 6 mascotas por hogar versus
0 a 4 mascotas en el bloque A; Entonces hay más variabilidad en el
Bloque B Distribución.
No hay valores atípicos ni brechas en ninguno de los conjuntos de datos.

¿Qué gráfico usar para comparar datos?

Por ejemplo, en la tabla a continuación, los «órdenes» y la «tasa de conversión» tienen diferentes unidades de medición. El «pedido» de la serie de datos es de tipo de tipo. Mientras que la serie de datos «tasa de conversión» es de porcentaje de tipo:

Lo mejor que puede hacer cuando la serie de datos que desea comparar tiene diferentes unidades de medición es usar el gráfico de combinación:

Por ejemplo, en el cuadro a continuación, los valores de las «sesiones de sitio web» de la serie de datos eclipsan por completo los valores de la serie de datos llamado «órdenes»:

Lo mejor que puede hacer en tal situación es usar la tabla de combinación:

Use un gráfico de barras cuando las etiquetas del eje sean demasiado largas para caber muy bien en un gráfico de columna:

Use un gráfico de línea cuando desee comparar las tendencias de datos, especialmente las tendencias a largo plazo entre los valores de la serie de datos:

Una tabla de combinación es una combinación de dos o más gráficos. Por ejemplo, la combinación de un gráfico de columna y un gráfico de línea.

#1 Desea comparar dos o más series de datos que tienen diferentes unidades de medición:

#2 Desea comparar dos o más series de datos que no son de tamaños comparables:

Dominar los elementos esenciales del análisis de marketing por correo electrónico
Este libro se centra únicamente en el «análisis» que alimenta su programa de optimización de marketing por correo electrónico y lo ayudará a reducir drásticamente su costo por adquisición y aumentar el ROI de marketing al rastrear el rendimiento de los diversos KPI y métricas utilizadas para el marketing por correo electrónico.

¡Modelado de atribución en Google Analytics y Beyondsecond Edition ahora!
El modelado de atribución es el proceso de determinar los canales de comercialización más efectivos para la inversión. Este libro ha sido escrito para ayudarlo a implementar el modelado de atribución. Le enseñará cómo aprovechar el conocimiento del modelado de atribución para asignar el presupuesto de marketing y comprender el comportamiento de compra.

¿Qué tipo de gráfico se utiliza para comparar?

La visualización de un cambio para una medida de duración es una de las categorías fundamentales de visualizaciones. Muchas opciones permiten explorar los cambios con el tiempo, incluidos los gráficos de las curvas, los gráficos de pendiente y las tablas de resaltar.

Para mostrar un cambio con el tiempo, debemos saber el valor que anticipamos que cambiará y controlará el funcionamiento de los campos de fecha en Tableau.

Puede suceder que tenga dos variables y esté buscando la relación entre ellas. Por ejemplo, puede encontrar la relación entre el tamaño de la clase y la clasificación escolar, o la relación entre la capacidad pulmonar y la resistencia. (Sin embargo, tenga en cuenta que la correlación no siempre es sinónimo de causalidad).

Los gráficos de desviación muestran en qué medida un valor varía en relación con una referencia básica, por ejemplo, un promedio o una mediana. Si desea saber qué artículos tienen márgenes de ganancia particularmente altos o débiles, debe usar un gráfico de brecha.

Puede usar gráficos de pulgas, gráficos de barras y gráficos de combinación para mostrar la brecha. También puede encontrar la importancia estadística de la brecha utilizando una puntuación Z.

Cuando intenta encontrar la frecuencia de los eventos dentro de una población, examina la distribución. Si muestra el número de participantes en una encuesta de edad, o la frecuencia de las llamadas entrantes por día, un gráfico de distribución puede ser la opción más juiciosa.

¿Cuál es el mejor gráfico para representar edades?

En su mayor parte, los gráficos de barras y los gráficos de columna se pueden usar indistintamente. Sin embargo, si desea comparar el cambio en algunas métricas con el tiempo, es mejor seguir con un gráfico de columna para que el tiempo se represente de izquierda a derecha.

Si tiene etiquetas largas para cada punto de datos (como cuando se registra los resultados de la encuesta, por ejemplo), el gráfico de barras horizontal es una mejor opción. Permite espacio adicional para cada etiqueta para evitar el texto vertical o en ángulo difícil de leer:

Tenga en cuenta el orden de las barras aquí, ya que el conjunto de datos no tiene un orden inherente, clasificando las barras de mayores a menos agrega una dimensión adicional de información. Además, tenga en cuenta la relación entre el ancho de la barra y el espaciado de la barra. El espacio entre las barras debe ser aproximadamente la mitad del ancho de la barra para una legibilidad óptima.

Si bien los gráficos de barras y columnas son la mejor opción en términos de legibilidad de datos, las infografías a veces requieren algo un poco más único y atractivo.

En una tabla de burbujas, los valores se representan en el área del círculo en lugar de la longitud de la barra. Dado que no somos particularmente buenos para hacer juicios precisos del área del círculo, es solo una buena idea usar gráficos de burbujas cuando hay valores atípicos claros o grandes brechas entre cada valor. También recomendaría etiquetar explícitamente cada burbuja con su valor.

¿Qué gráfico es el más adecuado para representar los datos?

Tiene una montaña de datos valiosos, pero ¿cómo puede usarlo para transmitir un mensaje conmovedor? La respuesta: un gráfico simple pero poderoso de barra, línea o pastel que ayudará a su audiencia a comprender rápidamente el significado de sus datos. Aquí hay algunos tipos básicos de gráficos:

Se utiliza un gráfico de barras cuando hay dos variables, y es útil al comparar grupos o seguir los cambios con el tiempo. Las barras pueden ser verticales u horizontales y representar un valor o frecuencia relativa. También se puede usar un gráfico de línea en estas situaciones, pero es preferible un gráfico de barras al ilustrar la magnitud en lugar de la dirección.

En este caso, el período de tiempo es constante, pero se comparan la mayor fuente de ingresos por porcentaje, lo que subraya el hecho de que el flujo de ingresos de Google (línea superior de cuadro) es el menos diversificado.

También se usa un gráfico de línea cuando hay dos variables, pero solo tiene sentido cuando rastrea los cambios en una medición continua (por ejemplo, tiempo, temperatura, distancia). Los gráficos de línea son especialmente útiles para ilustrar la dirección (es decir, picos y salsas) en lugar de magnitud.

En este gráfico de línea, la caída en los meses de verano y el comienzo/fin de año ilustran la estacionalidad del negocio de esta compañía.

A diferencia de un gráfico de barra o línea, se usa un gráfico de pastel cuando solo hay una variable y es mejor para comparar partes de un todo. La suma de las piezas siempre es igual al 100 por ciento, y el visual transmite un valor o frecuencia relativa. Un gráfico de pastel no es particularmente perspicaz si todas las partes son casi las mismas o si hay demasiadas piezas discretas.

¿Cómo hacer un gráfico de edades?

Recientemente trabajé con una agencia estatal de salud pública que quería representar cuántos hombres y mujeres fueron diagnosticados con una enfermedad y la edad a la que fueron diagnosticados. En otras palabras, solo había dos variables simples: edad y sexo.

Nuestro conjunto de datos se veía algo así. Enumeramos los rangos de edad en la primera columna y luego registramos el número de hombres y hembras en las otras columnas.

Incluso si no trabaja en salud pública, probablemente tenga conjuntos de datos similares, una variable ordinal (como los rangos de edad) junto con una variable categórica (como el sexo).

La versión «antes» del gráfico de la Agencia de Salud Pública se veía así. Habían diseñado una tabla de columna apilada con una columna por soporte de edad.

Para empezar, eliminamos los títulos del eje. Raramente elimino los títulos del eje de productos escritos como informes y folletos, pero en este caso, el orador estaría físicamente presente para explicar qué variables estaban en cada eje. Y, el título hace que los ejes sean obvios: los ejes literalmente muestran nuevos diagnósticos por edad y sexo.

En las siguientes ediciones. Continuemos eliminando tinta innecesaria.

Reenviamos la escala vertical (de 0 a 50 en lugar de de 0 a 60).

Continuamos desordenando la escala vertical solo etiquetando los puntos de inicio y finalización (solo 0 y 50). En un momento, vamos a agregar valores a cada una de las columnas, lo que significa que no necesitaremos una escala demasiado marcada.

Decidimos etiquetar cada columna con el número específico de personas que tenían la enfermedad.

¿Qué gráfico está especialmente recomendado para comparar un conjunto de datos con dos características diferentes?

Dar sentido a los hechos, números y mediciones es una forma de arte: el arte de la visualización de datos. Hay una carga de datos en el mar de ruido. Para convertir sus números en conocimiento, su trabajo no es solo separar el ruido de los datos, sino también presentarlo de la manera correcta.

Muchos de nosotros provienen de la «generación de PowerPoint»: aquí es donde se encuentran las raíces de nuestra comprensión de la visualización de datos y la presentación. Desafortunadamente, está lejos de ser relacionado con el bien, y me paro ante ti como culpable.

Y si crees que soy demasiado cínico sobre esto, no tomes solo mi palabra.

PowerPoint podría ser la herramienta más potente en su computadora. Pero no lo es.
Innumerables innovaciones fallan porque sus campeones usan PowerPoint como Microsoft quiere que lo hagan, en lugar de la forma correcta. – Seth Godin, experto en marketing

No hay duda de que PowerPoint ha sido al menos una parte del problema porque ha afectado a una generación.
Debería haber venido con una etiqueta de advertencia y un buen conjunto de instrucciones de diseño en los años 90. Pero también es una copia para culpar a PowerPoint: es solo un software, no un método. – Garr Reynolds, experto en presentación

Para evitar dificultades comunes en sus presentaciones, no estaría de más revisar los conceptos básicos de la visualización de datos.

En este artículo, intentaré deshacer parte del daño al compartir algunas de las mejores prácticas para la visualización y representación de datos y, con suerte, ahorrar algunos gatitos en el proceso.

¿Qué tipo de gráfico sería más adecuado para representar la relación entre dos variables?

Los datos constituyen el pilar de la eficiencia comercial. Sin los datos, no puede obtener la información necesaria para llevar a cabo sus tareas. Además, la lectura y el análisis rápido de sus datos le permiten comprender la influencia que juegan ciertos factores en su éxito global y en la toma de decisiones proactivas. Es por eso que la visibilidad de los datos es esencial. La creación de un gráfico o un diagrama le ayuda (así como a otros empleados) a interpretar los datos y las preguntas subyacentes.

Este recurso descargable le ayuda a elegir el gráfico más adecuado para ver sus datos a través de casos de uso relevantes. ¡Agregue esta página a sus favoritos o imprima una copia!

Gráfico en áreas: se utiliza un gráfico en áreas para mostrar datos cuantitativos. Se basa en el gráfico de curvas (consulte la definición a continuación). El área entre el eje y la curva se resalta comúnmente mediante colores, texturas y eclosiones. En la mayoría de los casos, el usuario usa el gráfico en áreas para comparar al menos dos valores. Un gráfico de curvas es generalmente más fácil de leer cuando hay muchos valores para presentar. Este tipo de gráfico es particularmente apropiado cuando tiene que comparar la evolución de 2 a 5 valores diferentes que evolucionan con el tiempo, como la evolución durante varios años de ventas en comparación con los costos.

Gráficos de barras: un gráfico de barras presenta datos agrupados en forma de barras rectangulares, cuyas longitudes son proporcionales a los valores que representan. Estas barras están dispuestas horizontalmente. Un caso de uso relevante para este tipo de gráfico es cuando tiene datos comparativos organizados en 10 o más categorías, cuyas etiquetas son largas. Por ejemplo, un gráfico de ventas por representante, donde un gran número de representantes identificados por su nombre completo es.

Gráficos de burbujas: los gráficos de burbujas son similares a los gráficos de punto de punto, pero tienen un atributo adicional. Al igual que con el gráfico Point -Cloud, dos atributos indican aquí las posiciones X e Y de la burbuja. Los gráficos de burbujas agregan un tercer atributo que influye en el tamaño de la burbuja. Un caso de uso de este tipo de gráfico, por ejemplo, sería hacer una comparación entre costos y ganancias, el tamaño de la burbuja que varía según el porcentaje de ventas globales.

¿Cuál es la mejor gráfica para comparar datos en Excel?

#1 Use cuadros de línea cuando desee mostrar/centrarse en las tendencias de datos (tendencia alcista, tendencia bajista, tendencia a corto plazo, tendencia lateral, a largo plazo), especialmente tendencias a largo plazo (es decir, cambios durante varios meses o años) entre los valores de los datos serie:

#2 Use gráficos de línea cuando tenga demasiados puntos de datos para trazar, y el uso de una columna o gráfico de barras aplastan el gráfico.

#3 Use un gráfico de línea en lugar de una tabla de columna agrupada si el orden de las categorías es importante:

#4 En un gráfico de línea, el eje X representaría las categorías, y el eje Y representaría los valores de medición que se representarían periódicamente.

#5 Se debe usar un gráfico de línea cuando desee enfatizar los cambios para los valores de una variable que se representa en el eje vertical a la otra variable representada en el eje horizontal.

Los gráficos de línea #6 son mejores que los gráficos de barras cuando hay cambios más pequeños.

#7 Para leer un gráfico de línea, primero examine los dos ejes y comprenda los puntos de valor representados en el gráfico. La segunda cosa es averiguar si había un aumento o una caída en los datos.

#1 Use un cuadro de columna agrupado cuando desee comparar dos a cuatro series de datos. En otras palabras, evite usar gráficos de columna si tiene solo una serie de datos para trazar:

Alternativamente, evite crear un gráfico de columna con más de cuatro series de datos.

Por ejemplo, el siguiente cuadro contiene solo cinco series de datos, y ya ha comenzado a parecer desordenado:

El cuadro a continuación contiene 11 series de datos y es muy difícil de leer y comprender:

Si desea crear un gráfico de columna que contenga muchas series de datos, puede intentar cambiar de «fila» y «columna» del gráfico y ver si hace alguna diferencia:

Por ejemplo, después de cambiar la fila y la columna del gráfico (con 11 series de datos), se parece a la siguiente:

Aunque todavía se ve desordenado, este gráfico es mucho más fácil de leer y comprender.

¿Qué tipo de gráfico es útil para datos de mayor precisión?

El gráfico de barras es el gráfico más simple y común. Está diseñado para mostrar comparaciones entre categorías y a menudo se usa para comparar información. Dado que los gráficos de barras tratan con categorías, los datos de entrada también deben ser categóricos o discretos, lo que significa valores completos. Además de tener categorías en el eje X, también hay un tipo específico de gráfico de barras llamado gráfico de barras apiladas, donde puede dividir aún más cada barra en categorías.

Por ejemplo, los ingresos generados por una empresa podrían separarse en ventas en efectivo, ventas de crédito, etc. Por lo tanto, se puede usar un gráfico de barras para diseccionar información compleja en piezas más manejables para comparar.

Al igual que el gráfico de línea, el gráfico de barras tiene un eje horizontal (x) y un eje vertical (y). El eje X representa la variable independiente (la variable cambia, como años o unidades vendidas), mientras que el eje y representa la variable dependiente (la que se mide, como la ganancia).

Los puntos de datos se trazan en cualquier eje como barras que se cruzan con ambos ejes en sus extremos. En otras palabras, este tipo de gráfico muestra diferencias entre categorías al mostrar líneas paralelas con longitudes proporcionales a los valores que se miden.

Los gráficos de barras son útiles para mostrar cambios con el tiempo porque uno puede ver fácilmente cómo los valores han aumentado o disminuidos durante un período determinado. También son útiles para comparar dos conjuntos de datos simultáneamente.

Artículos Relacionados:

Más posts relacionados:

Deja una respuesta

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *