En esta sección, trabajamos a través de un problema de muestra para mostrar cómo aplicar
la teoría presentada anteriormente. En este ejemplo,
Usaremos Stat Trek’s
Calculadora de distribución normal
para calcular las probabilidades.
La calculadora de distribución normal resuelve problemas estadísticos comunes, basado en lo normal
distribución. La calculadora calcula las probabilidades acumulativas, basadas en tres
Entradas simples. Las instrucciones claras lo guían a una solución precisa, rápidamente
y fácilmente. Si algo no está claro, preguntas y muestras frecuentes
Los problemas proporcionan explicaciones directas. los
La calculadora es gratuita. Se puede encontrar en el stat trek
Menú principal en la pestaña Herramientas de estadísticas. O puede tocar el botón de abajo.
- Encuentra la probabilidad. Este problema requiere que encontremos el
probabilidad de que el número promedio de ausencias en la muestra de niño
menos el número promedio de ausencias en la muestra de niña
es menos de 3.
Para encontrar esta probabilidad, usamos Stat Trek’s
Calculadora de distribución normal.
Específicamente, ingresamos las siguientes entradas: 3, para la variable aleatoria normal;
5, para la media; y 1.1, para la desviación estándar.
Encontramos que la probabilidad de la diferencia media (ausencias masculinas menos ausencias femeninas) es 3 o menos
es aproximadamente 0.035.
Alternativamente, podríamos haber trabajado con las puntuaciones Z (que tienen una media de 0 y
una desviación estándar de 1). Aquí está la solución de puntaje Z:
- Encuentra la probabilidad. Este problema requiere que encontremos el
probabilidad de que el número promedio de ausencias en la muestra de niño
menos el número promedio de ausencias en la muestra de niña
es menos de 3.
Para encontrar esta probabilidad, usamos Stat Trek’s
Calculadora de distribución normal.
Específicamente, ingresamos las siguientes entradas: 3, para la variable aleatoria normal;
5, para la media; y 1.1, para la desviación estándar.
puntaje z
que se produce cuando los niños tienen tres días más de ausencias que
muchachas. Cuando los niños tienen tres días más de ausencias, el número de
Ausencias masculinas menos las ausencias femeninas son tres.
Y la puntuación Z asociada
es
Calculadora de distribución normal.
Específicamente, ingresamos las siguientes entradas: -1.818, para la variable aleatoria normal;
0, para la media; y 1, para la desviación estándar.
Encontramos que la probabilidad de probabilidad de que un puntaje Z sea -1.818 o menos
es aproximadamente 0.035. Por supuesto, el resultado es el mismo, ya sea que trabaje con puntajes brutos o con puntajes Z.
¿Qué es una distribución muestral de diferencia de medias?
Definición de la distribución de muestreo de la diferencia entre dos muestras significa $ bar {y} _1 – bar {y} _2 $, y su error estándar
Cuando dibujamos una muestra de tamaño $ n_1 $ de la población 1, y una muestra de tamaño $ n_2 $ de la población 2, podemos calcular la media de una variable $ y $ en la muestra 1 y en la muestra 2, y luego calcular la diferencia Entre las dos medias de muestra: $ bar {y} _1 – bar {y} _2 $. Ahora suponga que repitimos estos pasos muchas veces. Específicamente, supongamos que obtuvimos un número infinito de muestras del Grupo 1 y Grupo 2, cada vez del tamaño $ N_1 $ y $ N_2 $. Cada vez que tenemos una muestra del Grupo 1 y el Grupo 2, podríamos calcular la diferencia entre las dos medias de muestra: $ bar {y} _1 – bar {y} _2 $. Diferentes muestras darían diferentes medias de muestra y diferencias. La distribución de todas estas diferencias $ bar {y} _1 – bar {y} _2 $ es la distribución de muestreo de $ bar {y} _1 – bar {y} _2 $. Tenga en cuenta que esta distribución de muestreo es puramente hipotética. Realmente nunca dibujaríamos un número infinito de muestras del Grupo 1 y Grupo 2, pero hipotéticamente, podríamos.
Suponga que los supuestos de las dos pruebas de muestra $ T $ (suponiendo variaciones de población iguales) tienen:
- Dentro de la población 1, la variable $ y $ se distribuye normalmente con la media $ mu_1 $ y la desviación estándar $ sigma_1 $; Dentro de la población 2, la variable $ y $ se distribuye normalmente con la media $ mu_2 $ y la desviación estándar $ sigma_2 $
- Las desviaciones estándar de la población $ sigma_1 $ y $ sigma_2 $ son las mismas: $ sigma_1 = sigma_2 = sigma $
- La muestra del grupo 1 es una muestra aleatoria simple (SRS) de la población 1, la muestra del grupo 2 es un SRS independiente de la población 2. es decir, dentro y entre los grupos, las observaciones son independientes entre sí
- Estime $ Sigma $ con $ S_P $: la desviación estándar agrupada, calculada a partir de las desviaciones estándar de muestra $ S_1 $ y $ S_2 $. Es decir, las dos desviaciones estándar de muestra se combinan en una sola estimación $ S_P $ de $ Sigma $
¿Qué es una distribución de muestreo de medias?
Lo que hace que las estadísticas funcionen es que los estadísticos han descubierto cómo las muestras están relacionadas con las poblaciones. Esto significa que los estadísticos (y, al final del curso, usted) sabe que
Si se toman todas las muestras posibles de una población y se calcula algo (genéricamente llamado una «estadística») para cada muestra, se sabe algo sobre cómo la nueva población de
Las estadísticas calculadas de cada muestra están relacionadas con la población original. Por ejemplo, si todas las muestras de un tamaño dado se toman de una población, se calcula la media de cada muestra,
Y luego se encuentra la media de esas medias de muestra, los estadísticos saben que la media de las medias de muestra es igual a la media de la población original.
Hay muchas posibles distribuciones de muestreo. Se pueden calcular muchas estadísticas diferentes a partir de las muestras, y cada población original diferente generará un conjunto diferente de muestras. los
Lo sorprendente, y lo que hace posible hacer inferencias sobre las poblaciones de muestras, es que hay algunas estadísticas que tienen sobre la misma distribución de muestreo
cuando se calcula a partir de las muestras de muchas poblaciones diferentes.
Probablemente todavía esté un poco confundido acerca de lo que es una distribución de muestreo. Se discutirá más en el capítulo sobre las distribuciones normales y en T. Un ejemplo aquí ayudará. Imaginar
que tienes una población, los tamaños de calcetines de todos los jugadores de voleibol en la Conferencia del Atlántico Sur. Toma una muestra de cierto tamaño, digamos seis y encuentra la media de esa muestra.
Luego tome otra muestra de seis tamaños de calcetines y encuentre la media de esa muestra. Siga tomando diferentes muestras hasta que haya encontrado la media de todas las muestras posibles de seis. Usted tendrá
Generó una nueva población, la población de medias de muestra. Esta población es la distribución de muestreo. Porque los estadísticos a menudo pueden encontrar qué proporción de miembros de esta nueva población
Tomará ciertos valores si saben ciertas cosas sobre la población original, podremos hacer ciertas inferencias sobre la población original de una sola muestra.
¿Qué forma toma la distribución muestral de diferencias?
Hasta este punto en estadísticas, probablemente haya estado trazando gráficos para un conjunto de números. Por ejemplo, es posible que haya graficado un conjunto de datos y haya encontrado que sigue la forma de una distribución normal con una puntuación media de 100. donde las distribuciones de probabilidad difieren es que no está trabajando con un solo conjunto de números; Estás tratando con múltiples estadísticas para múltiples conjuntos de números. Si encuentra ese concepto difícil de comprender: no está solo.
Si bien la mayoría de las personas pueden imaginar cómo se ve el gráfico de un conjunto de números, es mucho más difícil imaginar cómo se ven las pilas de, por ejemplo, los promedios. Una explicación…
Comencemos con una media, como las alturas de los estudiantes en la caricatura anterior. Como probablemente sepa, las alturas (y muchos otros fenómenos naturales) siguen una forma de curva de campana. Entonces, si encuestó a su clase, probablemente encontraría algunas personas cortas, algunas personas altas y la mayoría de las personas caerían en el medio. Digamos que la altura promedio fue de 5’9 ″. Encuesta todas las clases en su escuela y probablemente llegará a algún lugar cerca del promedio. Si tuviera 10 clases de estudiantes, podría obtener 5’9 ″, 5’8 ″, 5’10 ”, 5’9 ″, 5’7 ″, 5’9 ″, 5’9 ″, 5’10” , 5’7 ″ y 5’9 ″. Si grafica todos esos promedios, probablemente obtendrá un gráfico que se asemeja al «Sporkahedron». Para otros conjuntos de datos, puede obtener algo que se vea plano, como una distribución uniforme. Es casi imposible predecir cómo se verá ese gráfico, pero el teorema del límite central nos dice que si tiene un montón de datos, eventualmente se verá como una curva de campana. Esa es la idea básica: tomas tu promedio (u otra estadística, como la varianza) y trazas esas estadísticas en un gráfico.
Este video introduce el teorema del límite central a medida que se aplica a estas distribuciones. La «media de la distribución de muestreo de los medios» es solo un punto de matriz para trazar un gráfico de promedios (como lo describí anteriormente) y luego encontrar el promedio de ese conjunto de datos.
En pocas palabras, esto es lo mismo que la media de la población. Por ejemplo, si la media de su población (μ) es 99, entonces la media de la distribución de muestreo de la media, μm, también es 99 (siempre que tenga un tamaño de muestra suficientemente grande). Si desea entender por qué, mire el video o lea a continuación.
Dicho aproximadamente, el teorema del límite central nos dice que si tenemos una gran cantidad de variables independientes e idénticamente distribuidas, la distribución seguirá aproximadamente una distribución normal. No importa cuál sea la distribución subyacente.
¿Qué es la diferencia de las medias?
En pocas palabras, las medias son una prenda de mujer, típicamente hecha de nylon o seda translúcida, que se ajusta de cerca al pie y es mantenida por tirantes o una tira elástica en la parte superior del muslo. En este caso, ambas piernas se usan por separado.
Las pantimedias (llamadas «medias» en el Reino Unido y algunos otros países) son desgaste de piernas transparentes y ajustadas, cubriendo el cuerpo del usuario desde la cintura hasta los pies. En el lenguaje laico, son ropa de pierna que consiste en calzoncillos y medias que vienen como un conjunto.
- Los términos a menudo se usan indistintamente o sinónimo; Pero como acabamos de explicar, hay una buena cantidad de diferencia. Las pantimedias son la versión más «evolucionada» de las medias y se prefieren más en estos días.
- Aunque las medias se elogian por el atractivo sensual, las pantimedias se consideran la contraparte más utilitaria y funcional, ya que las estadías hacen que sea conveniente mantenerlas en su lugar.
- Si bien ambos son aceptables en el lugar de trabajo, sería aconsejable recortar sus medias con cinturones de suspender, de lo contrario, se arriesga a que se deslicen en momentos de mal tiempo, como en medio de una presentación.
- El negro y el desnudo son los colores más populares para ambos. Aunque el desnudo es a menudo difícil de comprar. Asegúrese de que coincida exactamente con su tono de piel; ¡De lo contrario, arriesga que sus piernas parezcan un tono que está muy alejado del resto de su piel! Y también compre la versión más pura que puede encontrar cuando se trata de desnudo. Una vez que tenga su negro y desnudo básicos en su lugar, también puede experimentar con otros colores. (Popxo recomienda: Amor Charm Anklet Pantyhose, Rs 499)
- Una vez que tenga estos conceptos básicos en su lugar, puede experimentar con variaciones. Hay muchas opciones para elegir (tanto para medias como para pantimedias): encaje, encaje, red de pescado, texturizado y otros patrones. Fishnet es un no-no en el lugar de trabajo, ¡pero un gran sí fuera de horario! (Popxo recomienda: medias de red de pescado negro N-Gal, Rs 250)
- Puede experimentar con patrones más recatados, como encaje floral minucioso o lunares de polka para el lugar de trabajo. (Popxo recomienda: Bastantes secretos de calcetín negro en Jabong, Rs 399)
Generalmente, entre 40-120 denier, las medias generalmente se ponen en pie, lo que significa que cubren toda la pierna desde los dedos de los pies hasta la cintura. Piense en ello como una segunda piel. A diferencia de las leggings, que se pueden usar como una forma de pantalones por sí solo, el propósito de las medias es colocar en capas.
- Los términos a menudo se usan indistintamente o sinónimo; Pero como acabamos de explicar, hay una buena cantidad de diferencia. Las pantimedias son la versión más «evolucionada» de las medias y se prefieren más en estos días.
- Aunque las medias se elogian por el atractivo sensual, las pantimedias se consideran la contraparte más utilitaria y funcional, ya que las estadías hacen que sea conveniente mantenerlas en su lugar.
- Si bien ambos son aceptables en el lugar de trabajo, sería aconsejable recortar sus medias con cinturones de suspender, de lo contrario, se arriesga a que se deslicen en momentos de mal tiempo, como en medio de una presentación.
- El negro y el desnudo son los colores más populares para ambos. Aunque el desnudo es a menudo difícil de comprar. Asegúrese de que coincida exactamente con su tono de piel; ¡De lo contrario, arriesga que sus piernas parezcan un tono que está muy alejado del resto de su piel! Y también compre la versión más pura que puede encontrar cuando se trata de desnudo. Una vez que tenga su negro y desnudo básicos en su lugar, también puede experimentar con otros colores. (Popxo recomienda: Amor Charm Anklet Pantyhose, Rs 499)
- Una vez que tenga estos conceptos básicos en su lugar, puede experimentar con variaciones. Hay muchas opciones para elegir (tanto para medias como para pantimedias): encaje, encaje, red de pescado, texturizado y otros patrones. Fishnet es un no-no en el lugar de trabajo, ¡pero un gran sí fuera de horario! (Popxo recomienda: medias de red de pescado negro N-Gal, Rs 250)
- Puede experimentar con patrones más recatados, como encaje floral minucioso o lunares de polka para el lugar de trabajo. (Popxo recomienda: Bastantes secretos de calcetín negro en Jabong, Rs 399)
¿Cómo se pueden comparar dos medias?
Fondo. Las medias de compresión elástica (EC) son efectivas para prevenir y reducir el edema ocupacional (OE), pero la presión óptima de acuerdo con la posición de trabajo prevalente durante el día sigue siendo controvertida. Objetivo. Para comparar la efectividad de las CE con diferentes presiones (15-20 mmHg o 20-30 mmHg) para reducir el OE en individuos que trabajan en diferentes posturas prolongadas. Métodos. Este estudio transversal comprendió 116 miembros inferiores de 58 individuos divididos en tres grupos de acuerdo con sus posturas prevalentes durante el día (sentado, de pie o combinación). Las mediciones volumétricas se tomaron al principio y al final de tres días consecutivos. El primer día, las personas no usaron medias de compresión; En el segundo y tercer día, utilizaron, respectivamente, medias de 15 a 20 mmHg y 20-30 mmHg hasta la rodilla. Las diferencias entre los volúmenes de la mañana y la tarde (edema medido) se calcularon, compararon y se correlacionaron. Resultados. Las variaciones volumétricas fueron significativamente más bajas en el segundo en comparación con el primer día cuando los individuos en los tres grupos usaron medias de compresión de 15 a 20 mmHg (valor P <0.001). Las mediciones fueron aún más bajas cuando usaron medias de 20 a 30 mmHg: esta disminución fue más significativa para la sesión (valor p <0.001) que el de pie (valor p <0.05) y grupos combinados (valor p <0.05). La reducción del edema medido fue más significativa en las personas que trabajaban en una posición sentada prolongada. No se encontraron diferencias significativas solo al comparar grupos sentados y en pie después del uso de las medias de compresión de 15-20 mmHg. Conclusiones. El uso de ECS durante una jornada laboral reduce a OE en posiciones prolongadas, de pie y combinadas, con las reducciones mayores con la presión más alta.
El edema ocupacional (OE) de las extremidades inferiores (LL) se ha asociado con enfermedades venosas desde 1960 [1–4]. Sin embargo, algunos autores informaron que hay datos inconsistentes relacionados con esta asociación, argumentando que estudios anteriores habían incluido individuos sin enfermedades venosas como tales, pero con algunos síntomas sugerentes, especialmente la sensación de pesadez e hinchazón [5–7]. Ahora está claro que las posturas ocupacionales adoptadas durante largos períodos durante un día laboral dan como resultado un aumento de los volúmenes de la LL, incluso en individuos sanos [8-10], y que este aumento es más intenso al final de la mañana en comparación con la ganancia. observado al final de la tarde [11, 12]. También se ha sugerido recientemente que un mayor OE es más común en las personas que trabajan durante tramos más largos en la posición sentada que en aquellos que representan largos períodos [13].
El hecho es que OE es incómodo; Causa una sensación de pesadez y cansancio y puede conducir a una reducción de la productividad, un mayor trabajo ausentismo y una mala calidad de vida, además de ser quizás una de las primeras manifestaciones de descompensación de los sistemas venosos y linfáticos [12], en particular en individuos con índices de masa corporal más altos [14].
Aunque caminar, muscular [15] y ejercicios de agua [16] ayudan a reducir OE, las mejores mediciones preventivas se logran con el uso de medias de compresión elástica (EC) [17-25], incluso cuando se usan solo media Día de trabajo [22]. Sin embargo, para los efectos más beneficiosos de las CE, es necesario establecer la mejor presión de compresión, ya que las recomendaciones consensuadas aún se refieren más a las enfermedades linfáticas y venosas crónicas [24]. En una revisión sistemática, Amsler et al. [21] concluyó que la compresión de 10-15 mmHg es efectiva para prevenir las quejas de OE y los pacientes; Menos presión es ineficaz y las presiones más altas pueden no tener un beneficio adicional.
¿Qué es diferencia muestral?
A menudo nos gustaría comparar conjuntos de muestras. Tales comparaciones incluyen
Si las muestras de tipo salvaje tienen una expresión diferente en comparación con los mutantes o si son saludables
Las muestras son diferentes de las muestras de enfermedad en alguna característica medible (recuento sanguíneo,
Expresión génica, metilación de ciertos loci). Dado que hay variabilidad en nuestro
Medidas, debemos tener eso en cuenta al comparar los conjuntos de muestras.
Simplemente podemos restar los medios de dos muestras, pero dada la variabilidad
de muestreo, al menos necesitamos decidir un valor de corte para las diferencias
de medios; Pequeñas diferencias de medias pueden explicarse por casualidad aleatoria debido a
muestreo. Eso significa que debemos comparar la diferencia que obtenemos con un valor que
es típico de obtener si la diferencia entre dos medias de grupo se debió solo a
muestreo. Si siguió la lógica anterior, aquí presentamos dos núcleo
ideas de algo llamado «prueba de hipótesis», que simplemente está usando
estadística
Determine la probabilidad de que una hipótesis dada (ex: si se establecen dos muestras
son de la misma población o no) es cierto. Formalmente, la versión ampliada de esas dos ideas principales es la siguiente:
- Decide una hipótesis para probar, a menudo llamada «hipótesis nula» ( (h_0 )). En nuestro
El caso, la hipótesis es que no hay diferencia entre los conjuntos de muestras. Una «hipótesis alternativa» ( (h_1 )) es que hay una diferencia entre el
muestras. - Decide una estadística para probar la verdad de la hipótesis nula.
- Calcule la estadística.
- Compare con un valor de referencia para establecer la importancia, el valor p. Según eso, rechace o no rechace la hipótesis nula, (h_0 ).
Hay una forma intuitiva de hacerlo. Si creemos que no hay
diferencias entre muestras, eso significa las etiquetas de muestra (prueba versus control o
saludable frente a enfermedad) no tienen sentido. Entonces, si asignamos al azar etiquetas al
muestras y calcule la diferencia de los medios, esto crea un nulo
distribución para (h_0 ) donde podemos comparar la diferencia real y
Medir lo poco probable que sea obtener tal valor bajo la expectativa de la
hipótesis nula. Podemos calcular todas las permutaciones posibles para calcular
La distribución nula. Sin embargo, a veces eso no es muy factible y el
El enfoque equivalente generaría la distribución nula al tomar un
menor número de muestras aleatorias con membresía del grupo barajado.
A continuación, estamos haciendo este proceso en R. Primero estamos simulando dos muestras
de dos distribuciones diferentes.
Estos serían equivalentes a las mediciones de expresión génica obtenidas en
diferentes condiciones. Luego, calculamos las diferencias en los medios
y hacer el procedimiento de aleatorización para obtener una distribución nula cuando
Suponga que no hay diferencia entre las muestras, (H_0 ). Luego calculamos cómo
A menudo obtendríamos la diferencia original que calculamos bajo el
suponiendo que (h_0 ) es verdadero. La distribución nula resultante y el valor original se muestra en la Figura 3.9.
Figura 3.9: La distribución nula para las diferencias de medias obtenidas mediante aleatorización. La diferencia original está marcada a través de la línea azul. La línea roja marca el valor que corresponde al valor p de 0.05
p.val = sum (exp.null [, 1]> org.diff)/longitud (exp.null [, 1]) P.Val
¿Cómo identificar media muestral de medias?
Wikihow es un «wiki», similar a Wikipedia, lo que significa que muchos de nuestros artículos están coescritos por múltiples autores. Para crear este artículo, 14 personas, algunas anónimas, trabajaron para editarlo y mejorarlo con el tiempo.
La calcetería viene en una variedad de grosor y peso. El término «negador» mide tanto el peso como el grosor del hilo (es una combinación de los términos densidad y lineal). [1] Fuente de XResearch Es útil comprender el diferente negador de la salud porque el peso y el grosor afectan el estilo, la comodidad , calor y apariencia.
- 15 denier o menos, a menudo denominado «ultrasheer»: esto casi parece no usar calcetería en absoluto. Esta gama Denier es ideal para el clima cálido y para la translucencia de la noche glamorosa. La desventaja es que este negador tiende a ser frágil, así que mantenga las uñas claras cuando se ponga y tenga cuidado de engancharlo mientras usa. Los culpables comunes involucrados en el arrebato incluyen sillas ásperas, cepillarse contra el follaje y la parte inferior de las mesas.
- Denier de 15 a 30, a menudo denominado «transparente»: este rango es el negador de calcetería bastante estándar y clásico. Es obvio que llevas calcetería, pero las calcetines de buena calidad le darán a tus piernas una apariencia uniforme y completa. Dado que este negador es más fuerte, es mucho menos probable que se enganche, y es el peso típico para el uso de la oficina y también es adecuado para el uso informal y de la noche.
- No descarte las versiones más baratas. Vale la pena comprar en este negador: puede sorprenderse gratamente por la calidad de una marca más barata.
- 30-40 Denier: a menudo denominado «semi-opaco»: este rango aún no es opaco y tiene la ventaja de ser más fuerte que pura pero aún mostrar su piel a través de la textura. Es otra elección ideal para la ropa de oficina y asistente minorista, especialmente durante largos días. Nuevamente, puede estar bien para el uso de la noche.
- 40 Denier Up: a menudo denominado «opaco»: estos son los miembros gruesos de la familia Hosiery (y se les conoce como «medias»). Cualquier cosa 40 Denier y arriba no mostrará su piel debajo a menos que esté realmente estirada cuando se dobla la rodilla. Ideal para el clima frío, esta calcetería mantendrá las piernas calientes debajo de una falda o pantalones de pantalón (¡o incluso pantalones cortos!). Este negador tiende a venir en una variedad de colores y patrones que se pueden llevar bien debido al grosor de la calificación.
- Tenga cuidado al comprar todas las medias de lana: pueden tener picazón realmente y también hacer que se sobrecaliente en entornos interiores constantemente cálidos.
- Otro beneficio de muchos negadores más gruesos es la capacidad de repararlos alrededor de las áreas del dedo del pie y el talón si están hechos de materiales duraderos como algodón, lana o encaje. Esto significa que duran y duran, incluso varios años, si se cuidan bien.
- Denier necesita cambiar según la temporada: si considera que mantenerse fresco o cálido es importante, tenga esto en cuenta.
- Algunas tendencias de moda verán medias de moda por completo y ¡eso también está bien!
- Hay muchos consejos sobre no usar ciertos colores y patrones. Algunos de ellos son un buen consejo si le preocupa los problemas de peso (consulte «Consejos» a continuación) pero nuevamente, pruebe el aspecto. Simplemente porque un blogger de moda o un editor de moda de revista no puede cumplir con un estilo de media no significa que no funcione para usted. ¡La única barra real podría ser el costo, ya que algunas de las calcetines importadas tienen un precio astronómico cuando se trata de probarlo!
¿Cómo sacar la media de las medias muestrales?
Vamos a comenzar construyendo un modelo generativo, una simulación del proceso IM-Shoping-Out-Socks-de la llaundry. Primero tenemos un par de parámetros para los que estoy solo por ahora darán valores arbitrarios:
n_socks <-18# El número total de calcetines en el laverryn_picked <-11# el número de calcetines que vamos a elegir
Entonces, para esta ejecución particular de la simulación de selección, terminamos con dos pares y siete calcetines únicos. Hasta ahora todo bien, pero ¿qué pasa con el problema inicial? ¿Cómo estimar el número real de calcetines en la lavandería de Karl? ¡Oh, pero lo que quizás no te das cuenta es que casi hemos terminado! :)
El cálculo bayesiano aproximado (ABC) es un método súper genial para ajustar modelos con los beneficios de que (1) es bastante intuitivo y (2) solo requiere la especificación de un modelo generativo, y con las desventajas de (1) ser extremadamente computacionalmente ineficientes si Implementado ingenuamente y (2) requiriendo bastante ajustes para funcionar correctamente cuando se trabaja incluso con conjuntos de datos bastante pequeños. Pero no estamos trabajando con datos bastante pequeños, ¡estamos trabajando con pequeños datos! Por lo tanto, podemos pagar una implementación ingenua e ineficiente (pero directa). Ferozmente ondeando a mano, el simple algoritmo de rechazo de ABC es así:
- Construya un modelo generativo que produzca el mismo tipo de datos que intenta modelar. Suponga distribuciones de probabilidad previas sobre todos los parámetros que desea estimar. Al igual que cuando se realiza un modelado bayesiano estándar, estas distribuciones representa la información del modelo con respecto a los parámetros antes de ver cualquier dato.
¿Qué es la media muestral y la media población?
La figura ( PageIndex {1} ) muestra una comparación de lado a lado de un histograma para la población original y un histograma para esta distribución. Mientras que la distribución de la población es uniforme, la distribución de muestreo de la media tiene una forma que se acerca a la forma de la curva de campana familiar. Este fenómeno de la distribución de muestreo de la media que toma una forma de campana a pesar de que la distribución de la población no tiene forma de campana en general. Aquí hay un ejemplo algo más realista.
Supongamos que tomamos muestras de tamaño (1 ), (5 ), (10 ) o (20 ) de una población que consiste completamente en los números (0 ) y (1 ) , mitad de la población (0 ), mitad (1 ), de modo que la media de la población es (0.5 ). Las distribuciones de muestreo son:
Los histogramas que ilustran estas distribuciones se muestran en la Figura ( PageIndex {2} ).
A medida que (n ) aumenta la distribución de muestreo de ( sobreline {x} ) evoluciona de manera interesante: las probabilidades en el extremo inferior y el extremo superior se encogen y las probabilidades en el medio se hacen más grandes en relación con ellas. Si continuamos aumentando (n ), la forma de la distribución de muestreo se volvería más suave y más en forma de campana.
Lo que estamos viendo en estos ejemplos no depende de las distribuciones de población particulares involucradas. En general, uno puede comenzar con cualquier distribución y la distribución de muestreo de la media de la muestra se parecerá cada vez más a la curva normal en forma de campana a medida que aumenta el tamaño de la muestra. Este es el contenido del teorema del límite central.
¿Qué es la media de las medias muestrales?
Finalmente lograremos lo que nos propusimos hacer en esta lección, a saber, determinar la media teórica y la varianza de la variable aleatoria continua ( bar {x} ). Al hacerlo, descubriremos las principales implicaciones del teorema que aprendimos en la página anterior.
Sea (x_1, x_2, ldots, x_n ) una muestra aleatoria de tamaño (n ) de una distribución (población) con media ( mu ) y varianza ( sigma^2 ). ¿Cuál es el medio, es decir, el valor esperado, de la media de muestra ( bar {x} )?
Comenzando con la definición de la media de la muestra, tenemos:
(E ( bar {x}) = e left ( dfrac {x_1+x_2+ cdots+x_n} {n} right) )
Luego, utilizando la propiedad lineal del operador de la expectativa, obtenemos:
(E ( bar {x}) = dfrac {1} {n} [e (x_1)+e (x_2)+ cdots+e (x_n)] )
Ahora, los (x_i ) están distribuidos de manera idéntica, lo que significa que tienen la misma media ( mu ). Por lo tanto, reemplazando (e (x_i) ) con la notación alternativa ( mu ), obtenemos:
Ahora, debido a que hay (n ) ( mu ) s en la fórmula anterior, podemos reescribir el valor esperado como:
Hemos demostrado que la media (o el valor esperado, si lo prefiere) de la media de muestra ( bar {x} ) es ( mu ). Es decir, hemos demostrado que la media de ( bar {x} ) es la misma que la media del individuo (x_i ).
Sea (x_1, x_2, ldots, x_n ) una muestra aleatoria de tamaño (n ) de una distribución (población) con media ( mu ) y varianza ( sigma^2 ). ¿Cuál es la varianza de ( bar {x} )?
Artículos Relacionados:
