Medidas de tendencia central: un mapa conceptual

If ( vec {x} = langle x_1, dots, x_n rangle ) es un vector de (n ) observaciones con (x_i in mathbb {r} ) para todos (1 le i le n ), la media (aritmética) de (x ), escrita ( mu _ { vec {x}} ), se define como

La media aritmética se puede entender intuitivamente como el centro de la gravedad. Si colocamos un mármol en una tabla de madera por cada (x_i ), de modo que cada mármol es igualmente pesado y las diferencias entre todas las mediciones de datos son idénticas a las distancias entre las canicas, la media aritmética es donde puede equilibrar la tabla con la punta de tu dedo.

Ejemplo. La media del vector ( vec {x} = langle 0, 3, 6, 7 rangle ) es ( mu _ { vec {x}} = frac {0 + 3 + 6 + 7} {4} = frac {16} {4} = 4 ,. ) Los puntos negros en el gráfico a continuación muestran las observaciones de datos, y la Cruz Roja indica la media. Observe que la media claramente no es el punto medio entre el máximo y el mínimo (que aquí sería 3.5).

Para calcular la media de un vector grande, R tiene una media de función incorporada, que de hecho hemos usado con frecuencia antes. Usémoslo para calcular la media de la variable promedio_price para diferentes tipos de aguacates:

Como era de esperar, la media general de los precios observados es (numéricamente) más alta para los aguacates orgánicos que para los convencionales.

Excursión. También es posible conceptualizar la media aritmética como el valor esperado al muestrear a partir de los datos observados. Esto es útil para vincular la media de una muestra de datos con el valor esperado de una variable aleatoria, un concepto que presentaremos en el Capítulo 7. Suponga que ha reunido los datos ( vec {x} = Langle 0, 3, 6 , 7 rangle ). ¿Cuál es el valor esperado que cree que obtendrá si muestra de este vector de datos una vez? – ¡Esperar! ¿Y eso que significa? ¿Valor esperado? ¿Muestreo una vez?

¿Qué son las medidas de tendencia central mapa conceptual?

La estadística utiliza notación matemática para definir sus conceptos. Esto significa que
La notación es muy importante. Un uso inadecuado de la notación en matemáticas (y por lo tanto también
en estadísticas) es equivalente a cometer errores de ortografía gruesa al escribir.

El uso de notación aproximada se notará cómo perder valor también a
contenido que son potencialmente correctos.

La población es cualquier conjunto de elementos, real o hipotético, presente o futuro, que se forma
sujeto de un estudio estadístico. En este sentido, se destaca entre la población real (en realidad
existente y visible) y la población virtual (definitivamente con precisión pero no observada ni
observable).

También se puede definir como un conjunto dado de unidades estadísticas, en las que se lleva a cabo, a través de
Observación y experimentación, la detección de uno o más caracteres.

Ejemplo:
Todos los estudiantes se inscribieron en una determinada universidad,
Todos los estudiantes se inscribieron en una determinada facultad,

Todas las alumnas,
Todos los estudiantes se inscribieron en el segundo año, todos los estudiantes, etc.

El ejemplo muestra cómo, como se agregan adjetivamente, la población sujeta a
Estudiar esquemas exclusivamente.

– Unidades estadísticas
La unidad individual estadística o estadística es el elemento básico de la población en el que se produce
llevó a cabo la detección o medición de uno o más fenómenos sujetos a la investigación.

¿Qué son las medidas de tendencia central?

En general, la tendencia central de un conjunto de datos se puede describir utilizando las siguientes medidas:

  • Media (promedio): representa la suma de todos los valores en un conjunto de datos dividido por el número total de los valores.
  • Mediana: el valor medio en un conjunto de datos que se organiza en orden ascendente (desde el valor más pequeño hasta el valor más grande). Si un conjunto de datos contiene un número par de valores, la mediana del conjunto de datos es la media de los dos valores medios.
  • Modo: define el valor más frecuente en un conjunto de datos. En algunos casos, un conjunto de datos puede contener múltiples modos, mientras que algunos conjuntos de datos pueden no tener ningún modo en absoluto.

Aunque las medidas anteriores son las más utilizadas para definir la tendencia central, hay otras medidas, incluidas, entre otros, media geométrica, media armónica, rango medio y mediana geométrica.

La selección de una medida de tendencia central depende de las propiedades de un conjunto de datos. Por ejemplo, el modo es la única medida de tendencia central para los datos categóricos, mientras que una mediana funciona mejor con los datos ordinales.

Aunque la media se considera la mejor medida de la tendencia central de los datos cuantitativos, ese no es siempre el caso. Por ejemplo, la media puede no funcionar bien con conjuntos de datos cuantitativos que contienen valores extremadamente grandes o extremadamente pequeños. Los valores extremos pueden distorsionar la media. Por lo tanto, puede considerar otras medidas.

Las medidas de tendencia central se pueden encontrar utilizando una fórmula o definición. Además, se pueden identificar utilizando un gráfico de distribución de frecuencia. Tenga en cuenta que para conjuntos de datos que siguen una distribución normal, la media, mediana y modo se encuentran en el mismo lugar en el gráfico.

¿Cómo se hace las medidas de tendencia central?

En la enseñanza de estadísticas descriptivas, las medidas de tendencia central ocurren temprano, p. B. Antes de medidas para la distribución. Por supuesto, es suficiente para mí conocer la tendencia o posición central de los datos antes de aprender muchas otras propiedades, pero esto podría deberse a cómo me enseñaron.
Sin embargo, ¿hay una buena motivación para por qué la tendencia central debería ser la primera en aprender?

Creo que no se puede decir que un cierto nivel para la tendencia central (como media, mediana o modo) contenga la mayor parte de la información sobre los datos. Tampoco puede decir que contenga la información más importante (ya que el significado relativo realmente depende del uso previsto de los datos). Pero, ¿qué podrías decir en su lugar?

Una razón por la cual enseñamos mediciones de la tendencia central antes de las mediciones de la propagación porque muchas mediciones de la propagación de la tendencia central incluyen: la desviación estándar contiene la media, la desviación absoluta promedio de la mediana. Podríamos enseñar el área sin enseñar la media, pero el área no es exactamente un proyecto a largo plazo.

De hecho, la media se usa en casi todas partes en estadísticas.

Creo que, según los estándares de tendencia central, primero enseñamos los medios aritméticos porque es conocido: «promedio» ocurre en todas partes y generalmente significa «medios aritméticos».

¿Cómo realizar las medidas de tendencia central?

La media, la mediana y el modo son descriptivos
estadísticas que están diseñadas para decirnos
algo sobre el centro de una distribución.
Es decir, donde están la mayoría de los datos.

Entonces, ¿cómo sabes qué medida de Central
¿Se debe usar tendencia?

La respuesta depende de una serie de factores,
incluyendo la forma del
distribución y la escala de
medición que usa.

La media es la preferida
medida de tendencia central para el intervalo y
Datos de nivel de relación. Se necesita cada artículo en el
distribución en cuenta y es más estable
que la mediana y el modo. En este contexto, estable
se refiere a la tendencia a obtener resultados similares
Cuando dibuja varias muestras de la misma
población y calcular una estadística. En uno
Muestra de números que van de 0 a 24, la media
podría ser 10.4 y en otra muestra la media
podría ser 10.3. 10.4 y 10.3 son similares a cada uno
otro. Si dibujamos muchas muestras de la misma
población y la media era aproximadamente la misma
Cada vez, diríamos que la media de la muestra es
estable. En muestras pequeñas, el modo es muy
inestable. Es decir, de una muestra al texto,
El modo es muy diferente cada vez. La mediana
es más estable que el modo, pero típicamente menos
estable que la media, especialmente en más pequeño
muestras.

  • Si cambia un puntaje dado, agregue un
    observación, eliminar una observación y luego
    la media cambiará.
  • Si agrega (o restas) una constante a cada
    puntaje, entonces la media cambiará agregando
    esa constante.

¿Qué son las medidas de tendencia central media mediana y moda )?

Este artículo Base Toque Concepto muy básico de estadísticas para aquellos lectores que estarían interesados ​​en la ciencia de datos y que no tienen antecedentes, explica con facilidad pocas medidas básicas de tendencia central (media, modo, mediana) que es requisitos previos mientras usted Comience a explorar los datos.

Digamos que hemos recopilado algunos datos que pueden estar en cualquier dominio aleatorio, por ejemplo, en los datos de Tesales de Minorista, o pueden ser el dominio de publicidad en la línea de los datos de la campaña (cuántas impresiones sirvieron/CTR/CPM, etc.) o decir en el dominio del automóvil el dato de producción (número de producción (número de automóviles fabricados). Puede ser cualquier datos en cualquier dominio si nos gustaría resúmenes o describir los datos con valor único como punto de partida, ¿cómo podemos hacerlo? Esto es cuando la medida de la tendencia central entra en la imagen.

Si queremos describir datos completos o resúmenes de datos con un valor típico único, utilizaremos estas medidas básicas como media o modo o mediana que nos ayudarán a comprender dónde se agrupan los datos en la distribución.

Pasemos por debajo de la medida más común de la tendencia central.

  • Significar
  • Mediana
  • Modo

La media no es más que promedio o también llamada media aritmética. Para calcular la media, solo necesitamos sumar todos los números dados y dividirlos por recuento de números.

Consideremos que tenemos datos de ventas {10,20,25,50,35,40}, ¿cómo calculamos la media de los datos dados o las ventas promedio que ocurren?

En promedio, típicamente, alrededor de 30 unidades de ventas ocurren W.R.T estos datos. Se utiliza la medida más común de la tendencia central de los datos. Nota que considere cada valor en los datos establecidos para calcular la media.

¿Cómo se calcula las medidas de tendencia central media mediana y moda?

El «centro» de un conjunto de datos también es una forma de describir la ubicación. Las dos medidas más utilizadas del «centro» de los datos son la media (promedio) y la mediana. Para calcular el peso medio de 50 personas, agregue los 50 pesos juntos y divida en 50. Para encontrar el peso medio de las 50 personas, ordene los datos y encuentre el número que divide los datos en dos partes iguales. La mediana generalmente es una mejor medida del centro cuando hay valores o valores atípicos extremos porque no se ve afectado por los valores numéricos precisos de los valores atípicos. La media es la medida más común del centro.

Las palabras «media» y «promedio» a menudo se usan indistintamente. La sustitución de una palabra por la otra es una práctica común. El término técnico es «media aritmética» y «promedio» es técnicamente una ubicación central. Sin embargo, en la práctica entre los no estadísticos, el «promedio» se acepta comúnmente para la «media aritmética».

Cuando cada valor en el conjunto de datos no es único, la media se puede calcular multiplicando cada valor distinto por su frecuencia y luego dividiendo la suma por el número total de valores de datos. La letra utilizada para representar la media de la muestra es una (x ) con una barra sobre ella (pronunciada » (x ) bar»): ( overline {x} ).

La letra griega ( mu ) (pronunciada «mew») representa la media de la población. Uno de los requisitos para la media de la muestra es una buena estimación de la media de la población es que la muestra tomada sea verdaderamente aleatoria.

Para ver que ambas formas de calcular la media son las mismas, considere la muestra:

[ bar {x} = dfrac {1+1+1+2+2+3+4+4+4+4+4} {11} = 2.7 ]

¿Qué conclusiones se pueden hacer sobre las medidas de tendencia central?

La estadística es una rama importante de las matemáticas que se usa ampliamente en una variedad de disciplinas tradicionales como economía, comercio, investigación, encuestas, etc. En esta era digital actual, las tecnologías emergentes como la ciencia de datos y el aprendizaje automático han aumentado. Estas tecnologías también se centran en las estadísticas. Después de todo, las estadísticas tienen que ver con la recopilación, interpretación y presentación de datos. Básicamente, las estadísticas proporcionan información sobre los datos.

Un concepto estadístico esencial es la «medida de la tendencia central». Esta medida es una forma importante de resumir el conjunto de datos con un valor representativo. Esta medida proporciona una imagen aproximada de dónde se centran los puntos de datos. Las medidas de tendencia central comúnmente utilizadas son:

  • Significar
  • Mediana
  • Modo

El valor «promedio» se denomina la media del conjunto de datos. Es muy fácil calcular la media.

El valor medio del conjunto de datos ordenado se llama mediana. Considere un conjunto de datos que comprende elementos «n».

  • Significar
  • Mediana
  • Modo
  • Paso 1. El conjunto de datos se organiza en orden aumentando o disminuyendo.
  • Paso 2. Si el conjunto de datos tiene un número ODD de valores de datos (n = ODD), entonces el valor más intermedio del conjunto de datos ordenado se calcula como mediana. En otras palabras, los datos en el lugar (n + 1)/2 son la mediana del conjunto de datos.
  • Paso 3. Si el conjunto de datos tiene un número par de valores de datos (n = par), el promedio de dos valores medios se calcula como mediana. es decir, la media de (n/2) y {(n/2) + 1} th es la mediana del conjunto de datos.
  • El valor más frecuente en el conjunto de datos se llama modo.

    ¿Que se puede concluir de las medidas de dispersión?

    «La dispersión es la medida de la variación entre ítems». – Dr. Browley

    La dispersión dará una idea de la propagación de los datos (propagación más delgada o extensión más amplia). Se pueden sacar otras conclusiones de la propagación basada en el enfoque matemático descrito en el blog.

    Continuando con el último blog, el próximo término que los estadísticos usan con frecuencia es la dispersión. El significado gramatical se dispersa o se distribuye a una distancia más amplia. Cuando observamos los datos, podemos decir que cómo se dispersan los datos y cómo uniremos la dispersión dentro de un límite con un valor más bajo y un valor más alto. En otras palabras, podemos decir que la dispersión es la propagación de los datos.

    Podemos obtener innumerables conclusiones cuando mencionamos la propagación de los datos. Porque, dará una perspectiva diferente a los diferentes usuarios de los datos. Para un inversor, puede estar vinculado al riesgo y al retorno, a un ingeniero, puede dar una opción más amplia para un determinado producto o para un examinador de un documento, puede dar la indicación de sabiduría o puntaje de la clase. En el lenguaje estadístico, la dispersión significa en qué medida los datos pueden variar sobre un valor de datos de valor promedio o tendencia central. Por lo tanto, ayuda a comprender la distribución de los datos. En el ejemplo de Covid-19, da una indicación del rango de los pacientes afectados.

    Las medidas de dispersión ayudan a comprender e interpretar la variabilidad de los datos. Saber si los datos son del mismo tipo o tipo diferente (homogéneo o heterogéneo), o cómo se exprimen o dispersan los datos. La medición es siempre de dos tipos.

    Artículos Relacionados:

    Más posts relacionados:

    Deja una respuesta

    Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *