Ejercicios resueltos de tablas de contingencia

Use la tabla de contingencia a continuación para responder las siguientes preguntas.

( text {80} ) Las personas tienen cabello negro y de esas,
( text {50} ) Las personas también tienen ojos marrones.
Por lo tanto, la probabilidad de que alguien con cabello negro
tiene ojos marrones es ( frac {50} {80} = frac {5} {8} ).

Nota: Esto es diferente de pedir el
probabilidad de tener cabello negro y
Ojos cafés.
(Esta probabilidad se calcula en la parte (d) a continuación).
La pregunta fue formulada para pedir la probabilidad de
tener ojos marrones dado que una persona
tiene el pelo negro.

  • El cabello negro es ( frac {8} {23} ); y
  • Brown Eyes es ( frac {12} {23} ).

Concluimos que tener cabello negro y ojos marrones son
Eventos dependientes desde ( frac {5} {23} ne frac {8} {23}
Times frac {12} {23} ).

Dada la siguiente tabla de contingencia, identificar los eventos y
Determinar si son dependientes o independientes.

Los eventos son si un autobús sale del lugar a o no y
si un autobús se fue tarde o no.

Probamos si la ubicación A y los eventos tardíos izquierdos son
independiente.
El número total de autobuses en la tabla de contingencia es
( text {100} ).
Determinamos las probabilidades de los diferentes eventos de la
valores en la tabla –

  • El cabello negro es ( frac {8} {23} ); y
  • Brown Eyes es ( frac {12} {23} ).
  • saliendo de la ubicación a: ( frac {40} {100} = text {0,4} );
  • dejando tarde: ( frac {55} {100} = text {0,55} );
  • Saliendo de la ubicación A y saliendo tarde: ( frac {15} {100} =
    Text {0,15} ).
  • ¿Cómo se resuelve una tabla de contingencia?

    Una tabla de contingencia es una forma de volver a dibujar los datos y ensamblarlos en una tabla. Y muestra el diseño de los datos originales de una manera que permite al lector obtener un resumen general de los datos originales. La función Tabla () se usa en R para crear una tabla de contingencia. La función Tabla () es una de las funciones más versátiles en R. Puede tomar cualquier estructura de datos como argumento y convertirla en una tabla. Cuanto más complejos son los datos originales, más complejo es la tabla de contingencia resultante.

    En R, un vector es una recopilación ordenada de tipos de datos básicos de una longitud dada. La única cosa clave aquí es que todos los elementos de un vector deben ser del tipo de datos idéntico, por ejemplo, estructuras de datos homogéneas. Los vectores son estructuras de datos unidimensionales. Es el objeto de datos más simple del que puede crear una tabla de contingencia.

    VEC
    1 2 3 4 5 6
    2 2 2 2 1 1

    En el programa dado, lo que sucede es primero cuando ejecutamos el comando table () en el vector, clasifica el valor del vector y también imprime las frecuencias de cada elemento dado en el vector.

    Ahora veremos un ejemplo simple que proporciona un marco de datos que contiene valores de caracteres en una columna y que también contiene un factor en una de sus columnas. Esta columna de factores contiene variables de caracteres. Para crear nuestra tabla de contingencia a partir de datos, utilizaremos la tabla (). En el siguiente ejemplo, la función Tabla () devuelve una tabla de contingencia. Básicamente, devuelve un resultado tabular de las variables categóricas.

    ¿Cómo hacer un gráfico de una tabla de contingencia?

    ¿Cuál es la mejor trama, desde el punto de vista estadístico, para mostrar una tabla de contingencia, que generalmente se analiza mediante la prueba de chi-cuadrado? ¿Es una pelota de barcas esquivada, placa de barras apilada, mapa de calor, diagrama de contorno, diagrama de dispersión de múltiples líneas, trazado de múltiples líneas o algo más? ¿Debería uno mostrar valores o porcentajes absolutos?

    EDITAR: O como sugiere @forecaster en los comentarios, la tabla de números es en sí misma una trama simple y debería ser suficiente.

    No habrá una solución única para todos aquí. Si tiene una tabla muy simple (por ejemplo, $ 2 veces 2 $), simplemente presentar la tabla es probablemente la mejor. Si desea una cifra real, las gráficas de mosaicos (como sugiere @xan) son probablemente un buen lugar para comenzar. Hay algunas otras opciones que son análogas a las gráficas de mosaico, incluidos los gráficos de tamiz, los gráficos de asociación y los gráficos de presión dinámicos (vea mi pregunta aquí: alternativa a los gráficos de tamiz / mosaico para tablas de contingencia); El libro de Michael Friendly, visualización de datos categóricos, sería un buen recurso (basado en SAS) para este tema y el paquete VCD es un buen recurso para implementar esas ideas en R.

    Sin embargo, a medida que las tablas tienen un mayor número de filas y columnas, en mi opinión, estas se vuelven más difíciles de usar. Un tipo diferente de opción de visualización es realizar / trazar un análisis de correspondencia. Un análisis de correspondencia es análogo a ejecutar un análisis de componentes principales tanto en las filas como en las columnas de la tabla de contingencia. Entonces ambos se trazan junto con un biplot. Aquí hay un ejemplo basado en R usando los datos de la respuesta de @Xan:

    Para interpretar esta gráfica, cuanto más cercanos son los dos puntos del mismo tipo, cuanto más similares son los dos perfiles de fila / columna. Y cuanto más cercanos sean dos puntos de diferentes tipos, más de su masa de probabilidad está en la celda que representa su intersección.

    ¿Cómo se hace una tabla de probabilidades?

    Una curva de distribución normal es un tipo de distribución de probabilidad.
    Una distribución de probabilidad es básicamente un gráfico de cuál es la probabilidad de que sea un evento. Es una forma de ver rápidamente el evento y la probabilidad de ese evento. Los gráficos de distribución de probabilidad pueden ser bastante complejos en las estadísticas. Por ejemplo, una tabla de distribución normal o distribución en T generalmente requiere alguna forma de tecnología (como Microsoft Excel o la calculadora TI-83) para crear. Sin embargo, puede construir una distribución de probabilidad básica que muestre eventos y probabilidades en algunos pasos sencillos.

    Pregunta de muestra: Construya una distribución de probabilidad para el siguiente escenario: la probabilidad de una máquina de fabricación de salchichas que produce 0, 1, 2, 3, 4 o 5 salchichas de deformación por día son 0.09, 0.07, 0.1, 0.04,0.12 y 0.02.

    • Paso 1: Escriba el número de widgets (cosas, artículos, productos u otra cosa nombrada) dada en una línea horizontal. En este caso, los widgets en esta pregunta son las «salchichas de deformación».
      Haciendo la primera línea de la tabla de distribución de probabilidad.
    • Paso 1: Escriba el número de widgets (cosas, artículos, productos u otra cosa nombrada) dada en una línea horizontal. En este caso, los widgets en esta pregunta son las «salchichas de deformación».
  • Paso 2: directamente debajo de la primera línea, escriba la probabilidad de que ocurra el evento.
  • La probabilidad de que la máquina de salchichas que produce 0 salchichas de deformación al día es 0.09. Escriba «0.09» directamente en «0».
  • La probabilidad de que la máquina de salchichas produzca 1 salchichas de deformación al día es 0.07. Escriba «0.07» directamente en «1».
  • La probabilidad de que la máquina de salchichas produzca 2 salchichas deformes al día es 0.1. Escriba «0.1» directamente en «2».
  • La probabilidad de que la máquina de salchichas produzca 3 salchichas deformes al día es 0.04. Escriba «0.04» directamente en «3».
  • La probabilidad de que la máquina de salchichas produzca 4 salchichas de deformación al día es 0.12. Escriba «0.12» directamente en «4».
  • La probabilidad de que la máquina de salchichas produzca 5 salchichas deformes al día es 0.02. Escriba «0.02» directamente en «5».
  • ¿Cómo hacer una tabla de probabilidades?

    • La probabilidad de que ocurran dos eventos nunca puede ser mayor que la probabilidad de que cada evento ocurra por separado.
    • Si dos posibles eventos, A y B, son independientes, entonces la posibilidad de que ambos sucedan viene dada por el producto de su probabilidad individual.
    • Si un evento puede tener un cierto número de resultados posibles y distintos posibles (A, B, C, etc.), entonces la probabilidad de suceder A o B es igual a la suma de las posibilidades individuales de A y B, y la suma de las probabilidades de todos los resultados posibles (A, B, C, etc.) es igual a 1, es decir, 100%.

    La probabilidad condicional de un anuncio de evento con respecto a un evento B es la probabilidad de que ocurra A, dado que ha ocurrido B.

    Si una probabilidad se basa en una variable, es una probabilidad marginal, si en dos o más variables se llama probabilidad conjunta.

    • La probabilidad de que ocurran dos eventos nunca puede ser mayor que la probabilidad de que cada evento ocurra por separado.
    • Si dos posibles eventos, A y B, son independientes, entonces la posibilidad de que ambos sucedan viene dada por el producto de su probabilidad individual.
    • Si un evento puede tener un cierto número de resultados posibles y distintos posibles (A, B, C, etc.), entonces la probabilidad de suceder A o B es igual a la suma de las posibilidades individuales de A y B, y la suma de las probabilidades de todos los resultados posibles (A, B, C, etc.) es igual a 1, es decir, 100%.
  • La probabilidad condicional del resultado para dar la aparición de la condición B es: ( fracc {p (a y b)} {p (b)} \ )
  • Una probabilidad conjunta es la probabilidad de que alguien seleccionado de todo el grupo tenga dos características particulares al mismo tiempo. Es decir, ambas características tienen lugar conjuntamente. Existe una probabilidad conjunta que toma el valor de la intersección de A y B y se divide por el total general.

    Para encontrar una probabilidad condicional, considero el valor de la celda que está en la intersección de A y B y la divido para el total marginal de B, es decir, de la variable que expresa el evento que ocurrió.

    Ha llegado el momento de un segundo ejemplo. Tomo los datos de: Ellis GJ y Stone LH. 1979. Uso de marihuana en la universidad: una evaluación de una explicación de modelado. Juventud y Sociedad 10: 323-334.

    ¿Qué es una probabilidad y 5 ejemplos?

    El lanzamiento de uno o más dados, el dibujo de tarjetas o números son experiencias aleatorias: conocemos los posibles resultados, pero no sabemos cuál ocurrirá antes de que se realice la experiencia.

    Los posibles resultados de la experiencia aleatoria se denominan posibilidades o desde.

    Todas las eventualidades se llaman universo; A menudo se observa Ω.

    El evento «Obtener un número de menos de 10» es igual al universo Ω: este es el evento determinado.

    La probabilidad de un evento es un número entre 0 y 1.

    0 es la probabilidad del evento imposible, y 1 es la probabilidad del evento determinado.

    Cuanto más cerca sea la probabilidad de un evento, más el evento tiene «posibilidades» de hacerse realidad.

    La probabilidad de un evento es igual a la probabilidad de los eventos elementales que lo componen.

    Definimos una ley de probabilidad de todas las N de una experiencia aleatoria, al asociar con cada resultado señaló Xi un número positivo para que la suma p1+p2+p3+…+pn = 1.

    1. Las estadísticas realizadas en nacimientos le permiten estimar que nace 100 niñas para 205 nacimientos, o alrededor del 48.8% de los nacimientos de las niñas. Podemos definir una probabilidad en el universo vinculado a los dos eventos f: «El niño no nacido es una niña» y G: «El niño biológico es un niño», usando estas estadísticas: p (f) = 0.488 y p (g) = 0.512.

    ¿Cuando la tabla es contingencia?

    Las tablas de contingencia resumen las frecuencias observadas para describir la relación entre dos variables categóricas.

    En estadísticas, una tabla de contingencia (también conocida como tabulación cruzada o crosstab) es un tipo de tabla en un formato de matriz que muestra la distribución de frecuencia (multivariada) de las variables

    Supongamos que estamos en la exposición de pintura. Esta exposición presenta pinturas de tres períodos: renacimiento temprano, renacimiento tardío y barroco. En estas pinturas, puedes ver frutas, flores, o una mezcla de ambas. Le gustaría contar cuántas pinturas de cada uno de los períodos mencionados tienen frutas, cuántas tienen flores y cuántas tienen una mezcla de ambos. Esto es lo que obtienes:

    Tabla 1 (observaciones)

    Los valores en el interior se denominan frecuencias conjuntas porque se relacionan con ambas variables categóricas: a un cierto período de tiempo (renacimiento temprano, renacimiento tardío y barroco) y con cierto objeto dibujado (frutas, flores o una mezcla de ambos). Las frecuencias marginales son una suma de cada fila y cada columna de nuestra tabla, como se marca en color gris a continuación. También puede ver cuántas pinturas ha observado en total mirando la esquina inferior derecha de una mesa (64):

    Tabla 2 (con suma para cada dimensión)
    • Suma (1) – Marcado como rosa: contiene la cantidad de la cantidad de observaciones (imágenes) por período (para cada fila)
    • Y puede ver, el número total de imágenes, marcadas en el círculo rojo, se puede encontrar en la conjunción de la suma (1) y la suma (2) que es 64

    ¿Qué es una tabla de contingencia o tabla de 2×2?

    La tabla de contingencia de dos o cuatro veces representa dos clasificaciones de un conjunto de recuentos o frecuencias. Las filas representan dos clasificaciones de una variable (por ejemplo, resultado positivo/resultado negativo) y las columnas representan dos clasificaciones de otra variable (por ejemplo, intervención/sin intervención). Estas clasificaciones deben ser independientes. Los resultados emparejados (por ejemplo, los resultados para el mismo grupo de individuos antes y después de la intervención) deben analizarse utilizando una prueba para pares coincidentes. La estadística de chi-cuadrado calculado a partir de la tabla prueba la independencia entre las dos clasificaciones.

    Cada observación puede clasificarse en una célula (en la tabla) solo

    – Donde, para las filas R y las columnas C de N observaciones, O es una frecuencia observada y E es una frecuencia esperada estimada. La frecuencia esperada para cualquier celda se estima como la fila total de tiempos de columna en total luego dividido por el total total (n).

    Verá otro coeficiente, Phi (ϕ, correlación), dado por la función R por C Chi-cuadrado. Esto es igual a una versión sin firmar de V con 2 por 2 tablas.

    La prueba exacta de Fisher debe usarse como una alternativa a la prueba de chi-cuadrado cuádruple si el número total de observaciones es inferior a veinte o cualquiera de las frecuencias esperadas es inferior a cinco. En términos prácticos, sin embargo, tiene poco sentido usar el chi-cuadrado cuádruple para probar la independencia cuando StatsDirect proporciona una prueba exacta de Fisher que puede hacer frente a grandes números.

    Artículos Relacionados:

    Más posts relacionados:

    Deja una respuesta

    Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *