¿Cuál es la diferencia entre una muestra finita e infinita?

Concluimos la sección proporcionando evidencia de simulación de que el
Las ganancias de eficiencia al usar nuestro estimador son considerables, que su
La sensibilidad a algunas violaciones de tendencias paralelas no es más grande que eso
de las alternativas, y que nuestras herramientas de inferencia funcionan bien en
muestras finitas

El muestreo de una población infinita se maneja con respecto al
población representada por una distribución…. una muestra aleatoria de
Por lo tanto, una población infinita se considera una muestra aleatoria de
una distribución

Me parece que con respecto a la «muestra finita», elegimos aleatoriamente una muestra en una población y analizamos esta muestra y llegamos a una conclusión para una población, y en una «muestra infinita», probamos que todos los datos de la población lleguen a una conclusión Para la población, ¿es correcto?

La frase «muestra finita» es una especie de pleonams, ya que cada muestra es (por definición) finita.

A lo que probablemente se refieren con la frase «muestra finita» es una muestra pequeña o moderada.

Una gran parte de la inferencia estadística se basa en grandes aproximaciones de muestra. Por ejemplo, si el tamaño de la muestra crece muy grande, el promedio de la muestra converge (en probabilidad) con la expectativa y la diferencia entre el promedio de la muestra y la media verdadera (tiempos $ sqrt {n} $) converge (en distribución) a un Distribución gaussiana (normal).

En realidad, sin embargo, las muestras son finitas, por lo que estas aproximaciones pueden no funcionar muy bien si el tamaño de la muestra es pequeño. Para demostrar que las aproximaciones también funcionan bien incluso para muestras que no son demasiado grandes, una generalmente realiza un ejercicio de Monte-Carlo (es decir, simulación). Creo que esto es a lo que se refiere el documento.

¿Cuando una muestra es finita?

El objetivo estadístico en la investigación de encuestas y en varias otras aplicaciones es generalmente estimar los parámetros de una población finita en lugar de estimar los parámetros de un modelo estadístico. Como ejemplo, la población finita para una encuesta realizada para estimar la tasa de desempleo podría ser todos los adultos de 18 años o más que viven en un país en una fecha dada. Si se producen estimaciones válidas de los parámetros de una población finita, la población finita debe definirse con mucha precisión y el método de muestreo debe diseñarse e implementarse cuidadosamente. Esta entrada se centra en la estimación de tales parámetros de población finitos utilizando lo que se conoce como aleatorización o enfoque basado en el diseño. Otro enfoque que es particularmente relevante cuando los datos de la encuesta se utilizan para fines analíticos, como para el análisis de regresión, se conoce como el enfoque de superpoblación (ver los modelos de superpoblación de entrada en el muestreo de la encuesta*).

Esta entrada considera solo métodos para dibujar muestras de probabilidad de una población finita; Los métodos de muestreo de no probabilidad* se revisan en otra entrada. La teoría básica y los métodos de muestreo de probabilidad de poblaciones finitas se desarrollaron en gran medida durante la primera mitad del siglo XX, motivados por el deseo de usar muestras en lugar de censos para caracterizar las poblaciones humanas, comerciales y agrícolas. El documento de Neyman (1934) es ampliamente reconocido como una contribución seminal porque explica los méritos del muestreo de probabilidad en relación con la selección del propósito. Se publicaron varios textos de longitud completa sobre teoría y métodos de muestreo de encuestas en la década de 1950 y 1960, incluidas las primeras ediciones de Cochran (1977), Deming (1960), Hansen, Hurwitz y Madow (1953), Kish (1965), Murthy (1967), Raj (1968), Sukhatme et al. (1984) y Yates (1981). Varios de estos todavía se usan ampliamente como libros de texto y referencias. Los textos recientes sobre la teoría y los métodos de muestreo de encuestas incluyen Fuller (2009), Lohr (2010), Pfeffermann y Rao (2009), Särndal, Swensson y Wretman (1992), Thompson (1997) y Valliant, Dorfman y Royall (2000 (2000 ).

Deje que el tamaño de una población finita se denote por n y deje $ y_i » » » ‘{ rm (} i { rm = 1,2,…,} n { rm)} $ denota al individuo valores de una variable de interés para el estudio. Para llevar adelante el ejemplo dado anteriormente, en una encuesta para estimar la tasa de desempleo, $ Y_i $ podría ser el estado de la fuerza laboral de la persona (elemento) i. Considere la estimación de la población total $ y { rm =} { sigma}^n_iy_i $ basada en una muestra de probabilidad de n elementos extraídos de la población mediante muestreo sin reemplazo para que los elementos no se puedan seleccionar más de una vez. Deje que $ { pi} _i $ denote la probabilidad de que el elemento i esté seleccionado para la muestra, con $ { pi} _i { rm>} 0 $ para todo i, y deje $ { pi} _ {ij} $ denota la probabilidad de que los elementos I y J se incluyan conjuntamente en la muestra. El estimador de muestra de y se puede representar como $ hat {y} { rm =} { sigma}^n_iw_iy_i $ donde $ w_i $ es una variable aleatoria que refleja la selección de muestra, con $ w_i { rm = 0} $ para elementos que no fueron seleccionados. La condición para $ hat {y} $ para ser un estimador imparcial de y es que $ e { rm (} w_i { rm) = 1} $. Ahora $ E { rm (} w_i { rm) =} { pi} _iw_i { rm +(1-} { pi} _i { rm) 0} $ para que por $ hat {y} $ ser imparcial $ w_i { rm =} { pi}^{{ rm -} { rm 1}} _ i $. El recíproco de la probabilidad de selección, $ w_i { rm =} { pi}^{{ rm -} { rm 1}} _ i $, se conoce como el peso base. El estimador imparcial para y, $ hat {y} { rm =} { sigma}^n_iw_iy_i $, se conoce ampliamente como el estimador Horvitz-Thompson (ver estimador Horvitz-Thompson*, este volumen.) La varianza de $ hat {y} $ está dado por
[ begin {array} {l}
V { rm (} hat {y} { rm) =} { sigma}^n_iv { rm (} w_i { rm)} y^{{ rm 2}} _ i { rm +2} { Sigma}^n_i { sigma}^n_ {j { rm>} i} cov { rm (} w_i, w_j { rm)} y_iy_j \ \
{ rm} { rm } { rm =} { sigma}^n_i { pi}^{{ rm -} { rm 1}} _ i { rm (1 -} { pi } _i { rm)} y^{{ rm 2}} _ i { rm +2} { sigma}^n_i { sigma}^n_ {j { rm>} i} { pi}^{ { rm -} { rm 1}} _ i { pi}^{{ rm -} { rm 1}} _ j { rm (} { pi} _ {iJ} { rm -} { pi} _i { pi} _j { rm)} y_iy_j end {array}
]

Estos resultados generales cubren un rango de los diferentes diseños de muestra descritos a continuación según los valores de $ { pi} _i $ y $ { pi} _ {ij} $. Las probabilidades de selección $ { pi} _i $ aparecen en el estimador y, además, las probabilidades de selección conjunta $ { pi} _ {ij} $ aparecen en la varianza. Tenga en cuenta que al estimar los parámetros de una población finita utilizando el enfoque basado en el diseño para la inferencia, los valores de $ Y_I $ se consideran fijos; Es el $ w_i { rm ‘s} $ quienes son las variables aleatorias.

La selección de una muestra de probabilidad de una población finita requiere la existencia de un marco de muestreo para esa población. La forma más simple de marco de muestreo es una lista de los elementos de población individuales, como una lista de establecimientos comerciales (cuando son las unidades de análisis). El marco puede ser alternativamente una lista de grupos de elementos, como una lista de hogares cuando los elementos son personas. El marco inicial puede ser una lista de áreas geográficas que se muestrean en la primera etapa de selección. Estas áreas se denominan unidades de muestreo primarias (PSU). En la segunda etapa, se pueden seleccionar subáreas o una segunda etapa, dentro de las PSU muestreadas, etc. Este diseño, que se conoce como muestra de área, es una forma de muestreo de varias etapas (ver más abajo).

¿Cuando una muestra es finita o infinita?

La población de palabras o la población estadística se usa para todos los individuos u objetos que debemos estudiar. Podemos estar interesados ​​en aprender sobre la calidad de las bombillas producidas en una fábrica. Todos los productos de la fábrica en cierto período se denominan población. Podemos estar interesados ​​en el nivel de educación en las escuelas primarias. Todos los niños en las escuelas primarias constituirán una población. La población puede contener cosas vidas o no vivas. Todo el lote de cualquier cosa en estudio se llama población. Todos los árboles frutales en un jardín, todos los pacientes en un hospital y todo el ganado en un rebaño son ejemplos de poblaciones en diferentes estudios.

Una población se llama finita si es posible contar a sus individuos. También puede llamarse una población contable. El número de vehículos que cruzan un puente todos los días, el número de nacimientos por año y la cantidad de palabras en un libro son poblaciones finitas. El número de unidades en una población finita se denota por $$ n $$. Por lo tanto, $$ n $$ es el tamaño de la población.

A veces no es posible contar las unidades contenidas en la población. Tal población se llama infinita o incontable. Supongamos que queremos examinar si una moneda es justa o no. Lo lanzaremos una gran cantidad de veces para observar el número de cabezas. Todos los lanzamientos harán una población infinita infinita o incontable. El número de gérmenes en el cuerpo de un paciente enfermo es quizás algo que no es contundente.

Supongamos que tenemos que realizar un estudio sobre los problemas experimentados por las familias que viven en casas alquiladas en cierta gran ciudad. Todas las familias que viven en casas alquiladas son nuestra población objetivo. Es posible que toda la población objetivo no se considere con el fin de seleccionar una muestra. Es posible que algunas familias no estén interesadas en ser incluidas en la muestra. Podemos ignorar parte de la población objetivo para reducir el costo de estudio. La población de la cual se selecciona la muestra se llama población muestreada o la población estudiada.

¿Cómo se calcula una muestra finita?

Considere ( hat { theta} ) como una variable aleatoria. En general, el PDF
de ( hat { theta} ), (f ( hat { theta}) ), depende de los PDF del
Variables aleatorias ( {r_ {t} } _ {t = 1}^{t} ). La forma exacta de (f ( hat { theta}) )
puede ser muy complicado. A veces podemos usar cálculos analíticos
para determinar la forma exacta de (f ( hat { theta}) ). Esto se puede hacer, por ejemplo,
Cuando ( hat { theta} = hat { mu} ). En general, el
La forma exacta de (f ( hat { theta}) ) a menudo es demasiado difícil de derivar
exactamente. Cuando (f ( hat { theta}) ) es demasiado difícil de calcular que podemos
a menudo aproximado (f ( hat { theta}) ) usando cualquiera de la simulación de Monte Carlo
técnicas o el teorema del límite central (CLT). En Monte Carlo
simulación, usamos la computadora para simular muchas realizaciones diferentes
del aleatorio devuelve ( {r_ {t} } _ {t = 1}^{t} ) y en cada simulado
muestra evaluamos el estimador ( hat { theta} ). El Monte Carlo
La aproximación de (f ( hat { theta}) ) es la distribución empírica de
( hat { theta} ) sobre las diferentes muestras simuladas. Para una dada
Tamaño de muestra (t ), la simulación de Monte Carlo ofrece una aproximación muy precisa
a (f ( hat { theta}) ) Si el número de muestras simuladas es muy grande.
La aproximación CLT de (f ( hat { theta}) ) es una distribución normal
aproximación que se vuelve más precisa a medida que el tamaño de la muestra (t ) obtiene
muy grande. Una ventaja de la aproximación de CLT es que a menudo es
fácil de calcular. La desventaja es que la precisión de la aproximación
depende del estimador ( hat { theta} ) y el tamaño de la muestra (t ).

Para fines de análisis, a menudo nos centramos en ciertas características de
(f ( hat { theta}) ), como su valor esperado (centro), varianza y
Desviación estándar (extensión sobre el valor esperado) (. ) La esperada
El valor de un estimador está relacionado con el concepto de sesgo estimador,
y la varianza/desviación estándar de un estimador está relacionada con
El concepto de precisión estimadora. Diferentes realizaciones
de las variables aleatorias ( {r_ {t} } _ {t = 1}^{t} ) producirá diferente
valores de ( hat { theta} ). Algunos valores de ( hat { theta} ) serán
Más grande que ( theta ) y algunos serán más pequeños. Intuitivamente, un buen estimador
de ( theta ) es uno que es en promedio correcto (imparcial)
y nunca se aleja demasiado de ( theta ) (pequeña varianza). Que
Es, un buen estimador tendrá un sesgo pequeño y alta precisión.

El sesgo se refiere a la ubicación o centro de (f ( hat { theta}) ) en relación
a ( theta ). Si (f ( hat { theta}) ) se centra lejos de ( theta ),
Entonces decimos ( hat { theta} ) es un estimador sesgado de ( theta ).
Si (f ( hat { theta}) ) está centrado en ( theta ), entonces decimos que ( hat { theta} )
es un estimador imparcial de ( theta ). Formalmente, tenemos
las siguientes definiciones:

Definición 4.1 El error de estimación es la diferencia entre el estimador y el parámetro que se estima:

Definición 2.4 El sesgo de un estimador ( hat { theta} ) de ( theta )
es el error de estimación esperado:
[ begin {ecuación}
mathrm {bias} ( hat { theta}, theta) = e [ mathrm {error} ( hat { theta}, theta)] = e [ hat { theta}]- theta. tag {7.3}
end {ecuación} ]

¿Qué es una población finita e infinita?

Si desea continuar leyendo esta publicación en «Ejemplos de población», haga clic en el botón «Mostrar todos» y puede leer el resto del contenido de forma gratuita. Ebstomasborba.pt es un sitio especializado en tecnología, noticias, juegos y muchos otros temas que pueden interesarle. Si desea leer más información de manera similar a los ejemplos de población finita, continúe navegando por la web y suscríbase a las notificaciones del blog para no perderse las últimas noticias.

La noción de finita expresa la limitación de las cosas, los fenómenos, los procesos concretos en el espacio y el tiempo. La noción de Infinito traduce la naturaleza ilimitada de la materia al espacio y el tiempo.

La población es el conjunto de personas o animales de la misma especie que se encuentran en un momento y lugar determinado. Es decir, aunque la población de palabras generalmente se usa más para referirse a una comunidad humana, también puede aplicarse a otros animales.

Población estadística sobre: ​​es aquel en el que el número de valores lo compensan. Por ejemplo, la población estadística que nos dice el número de árboles en una ciudad ha terminado. Es cierto que puede variar con el tiempo, pero en un instante dado está terminado, tiene un final.

Las fórmulas clásicas para determinar ‘n’, el tamaño de la muestra son los siguientes: para poblaciones ‘infinitas’ (más de 100,000 personas o elementos): para poblaciones ‘finitas’ (menos de 100,000 personas o elementos):

Población terminada: es aquel cuyo número de elementos se puede determinar. Ejemplo: conjunto de librerías en la ciudad de Lima. Población infinita: es aquella cuyo número de elementos es imposible de determinar. Ejemplo: conjunto de lápices producidos en un proceso continuo.

Artículos Relacionados:

Más posts relacionados:

Deja una respuesta

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *