Dado que el tamaño de una muestra siempre es más pequeño que el tamaño de la población, parte de la población no es capturada por datos de muestra. Esto crea un error de muestreo, que es la diferencia entre los valores de población verdaderos (llamados parámetros) y los valores de muestra medidos (llamados estadísticas).
El error de muestreo surge cada vez que use una muestra, incluso si su muestra es aleatoria e imparcial. Por esta razón, siempre hay cierta incertidumbre en las estadísticas inferenciales. Sin embargo, el uso de métodos de muestreo de probabilidad reduce esta incertidumbre.
- Una estadística es una medida que describe la muestra (por ejemplo, media de muestra).
- Un parámetro es una medida que describe a toda la población (por ejemplo, media de la población).
El error de muestreo es la diferencia entre un parámetro y una estadística correspondiente. Dado que en la mayoría de los casos no conoce el parámetro de población real, puede usar estadísticas inferenciales para estimar estos parámetros de una manera que tenga en cuenta el error de muestreo.
Hay dos tipos importantes de estimaciones que puede hacer sobre la población: estimaciones puntuales y estimaciones de intervalo.
- Una estadística es una medida que describe la muestra (por ejemplo, media de muestra).
- Un parámetro es una medida que describe a toda la población (por ejemplo, media de la población).
Ambos tipos de estimaciones son importantes para recopilar una idea clara de dónde es probable que se encuentre un parámetro.
¿Cuáles son los tipos de muestreo en estadística inferencial?
El uso de la aleatorización en el muestreo permite el análisis de resultados utilizandoLos métodos de inferencia estadística. La inferencia estadística es
basado en las leyes de probabilidad y permite a los analistas inferir conclusiones
Acerca de una población dada basada en los resultados observados a través del muestreo aleatorio.
Dos de los términos clave en la inferencia estadística son el parámetro y
estadística:
Un parámetro es un número que describe una población, como un
porcentaje o proporción.
Una estadística es un número que se puede calcular a partir de los datos
observado en una muestra aleatoria sin requerir el uso de ningún desconocido
Parámetros, como una media de muestra.
Supongamos que un analista desea determinar el porcentaje de elementos defectuosos que son
producido por una fábrica en el transcurso de una semana. Dado que la fábrica produce
Miles de elementos por semana, el analista toma una muestra de 300 elementos y observa
que 15 de estos son defectuosos. Basado en estos resultados, el analista calcula
la estadística, 15/300 = 0.05,
como una estimación del parámetro p, o
verdadera proporción de elementos defectuosos en toda la población.
Suponga que el analista toma 200 muestras, del tamaño 300 cada uno, del mismo grupo
de elementos y logra los siguientes resultados:
Estos resultados se aproximan a una distribución de muestreo para el
estadística o la distribución
de valores tomados por la estadística en todas las muestras posibles del tamaño 300
de la población de artículos de fábrica. La distribución parece ser
aproximadamente normal, con media entre 0.05 y 0.06. Con repetido
muestreo, la distribución de muestreo se aproximaría más a un
distribución normal, aunque permanecería discontinua debido a la
Granularidad causada por el redondeo a puntos porcentuales.
¿Qué es una muestra estadística inferencial?
La mayoría de los datos utilizados a menudo corresponden no a toda la población sino solo a una muestra. Siempre que se verifiquen ciertas hipótesis, las estadísticas inferenciales permiten estimar el promedio de la población del promedio de una muestra, saber si dos muestras (o más) pueden considerarse como de la misma población y, por lo tanto, comparar sus promedios, sus variaciones…
Desde la desviación promedio y estándar de los datos de una muestra para una variable cuantitativa, es posible estimar el promedio de esta variable para la población subyacente y proporcionar un intervalo que pueda contener este valor. Este intervalo es un intervalo designado de confianza en el francés, la confianza del intervalo en el inglés. Del mismo modo, para los datos de muestra correspondientes a una variable cualitativa binaria, es posible estimar un intervalo de confianza para la proporción en la población. Vea el wiki francés y el wiki inglés para descubrir cómo se calcula y también para ver la diferencia entre estos dos wikis. Además, nuestra página de estimación le permite calcular rápidamente estos intervalos.
Estas son las fórmulas asociadas que es bueno saber para comprender qué hacen las funciones R que calculan estos intervalos:
Para calcular un intervalo de confianza, debe usar un nivel de confianza, que vale 0.95, lo que significa que tiene una confianza del 95 % en este intervalo (y sobre todo, estrictamente sensuamente que la probabilidad de contener el promedio de la población en este intervalo es 0.95). Dejamos que el lector experimente la dirección de variación del ancho del intervalo de acuerdo con este nivel de confianza, utilizable a través del parámetro de nivel conf. En la función de prueba de R.
¿Qué es una muestra en estadística inferencial?
Las estadísticas inferenciales ayudan a estudiar una muestra de datos y llegar a conclusiones sobre su población. Una muestra es un conjunto de datos más pequeño extraído de un conjunto de datos más grande llamado población. Si la muestra no representa a la población, no se puede hacer estimaciones precisas relacionadas con esta última. El propósito de estudiar estadísticas inferenciales es inferir el comportamiento de una población.
A diferencia de las estadísticas inferenciales, las estadísticas descriptivas simplemente describen un conjunto de datos sin ayudar a dibujar inferencias. En este contexto, se dice que las estadísticas inferenciales van más allá de las estadísticas descriptivas. Se usa particularmente cuando no es posible examinar cada punto de datos de la población.
- Las estadísticas inferenciales implican hacer inferencias para la población a partir de la cual se ha extraído una muestra representativa. Las inferencias se dibujan en función del análisis de la muestra.
- El procedimiento incluye elegir una muestra, aplicar herramientas como análisis de regresión y pruebas de hipótesis, y hacer juicios utilizando razonamiento lógico.
- Los resultados incluyen el error de muestreo. Este error ocurre cuando el investigador no elige una muestra que represente a la población. Para evitar el error de muestreo, uno debe seleccionar una muestra aleatoria antes de aplicar las herramientas de estadísticas inferenciales.
- Las estadísticas descriptivas e inferenciales son dos ramas de las estadísticas. El primero describe el conjunto de datos, mientras que el segundo ayuda a llegar a conclusiones.
Las estadísticas inferenciales permiten a los investigadores hacer generalizaciones sobre una población mediante el uso de una muestra representativa. Sin embargo, dado que uno no puede predecir el comportamiento de una población con precisión en casi todos los casos, se dice que los resultados se basan en la incertidumbre.
¿Qué es la muestra definición corta?
¿Recuerdas el famoso acertijo, pesa más un kilo de hierro o un kilo de paja? Probablemente todos piensen que saben cómo responder, pero (en realidad) no era obvio que los dos kilogramos siempre pesaban de la misma manera a cada uno. Pero la era de la imperfección (al menos para el tamaño de la masa) ha terminado.
El 20 de mayo de 2019, la nueva definición de kilogramo se inauguró oficialmente, basada no en un campeón físico, como lo había sido durante casi un siglo y medio, pero en una constante física, elegida precisamente porque, al ser una constante, no cambia tiempo extraordinario. Para el nuevo bautismo del kilogramo, el Día Mundial de la Metrología (Día Mundial de la Metrología, ADM) había sido elegido, un aniversario que el 20 de mayo de cada año celebra el aniversario de la Convención Metro, el Tratado Internacional que sentó los fundamentos de la Internacional Sistema de unidad de medición, firmado el 20 de mayo de 1875. A continuación, un poco de historia y un análisis en profundidad sobre la nueva definición de kilogramo.
Hasta 2019, el kilogramo se refería a un objeto físico: un cilindro de platino e iridio preservado en el BIPM (Bureau International des Poids et Mesures) de Sèvres (Francia). Pero la muestra de peso, aunque conservada con el máximo cuidado, sufre microvarias debido al polvo, el calor, el frío y otros elementos, que hacen que (micro) varíen con el tiempo sus características, tanto que desde 1889 hasta todos sus años parece que su masa parece han variado en aproximadamente 50 microgramos.
Esto pudo establecerlo con extrema precisión comparando la muestra con un tamaño de volumen utilizado en el pasado (1 decímetro cúbico de agua destilada a 3.98 ° C), luego libre de kilogramo y con otros 18 objetos similares (a menudo esféricos En lugar de solo cilíndrico y de silicio) que, almacenados en varios lugares del planeta, actúan como una copia de seguridad para la muestra de Sèvres, creada para no arriesgarse a permanecer sin referencias si el original desaparece o daños.
¡Suficiente con objetos de 1 kg! Dado que la unidad de medición debe ser estable, de lo contrario puede haber complicaciones en muchos sectores de física y química, se ha pensado que introduce un sistema de referencia que puede prescindir de un objeto material, como se hace ahora todas las demás unidades de medición.
¿Qué es muestreo y qué es inferencia?
Una muestra se define como un método para seleccionar una sección pequeña de una población o datos grandes. El proceso de dibujar una muestra de grandes datos se conoce como muestreo. Se utiliza en varias aplicaciones, como matemáticas, comunicación digital, etc.
Es esencial que una muestra seleccionada sea una selección aleatoria para que cada miembro tenga la misma oportunidad de aparecer en el proceso de selección. Por lo tanto, la suposición fundamental basada en el muestreo se llama muestreo aleatorio.
En general, calculamos la media del número de N de las muestras tomadas de la población. Los medios de varias muestras son diferentes. Si estas medias diferentes se agrupan de acuerdo con sus frecuencias, se denomina distribución de muestreo de la media. Del mismo modo, si agrupamos estas diferentes desviaciones estándar de acuerdo con sus frecuencias, se denomina la distribución de muestreo de la desviación estándar.
Es un caso especial de muestreo aleatorio. Aquí, cada evento tiene la misma probabilidad de éxito, que es independiente entre sí. Significa que la ocurrencia de uno no depende de la ocurrencia del otro y sus ensayos anteriores. Los parámetros estadísticos de la población son la desviación media y estándar.
El muestreo tiene como objetivo recopilar información máxima dentro de un tiempo mínimo, costos y esfuerzos. Obtiene los mejores valores posibles. Según la lógica de muestreo de inducción, se pasa una muestra particular a la población general. Tal generalización de una muestra a la población se denomina inferencia estadística.
Artículos Relacionados: