Discreta o continua, la diferencia entre nominal y ordinal

La ciencia de datos se trata de experimentar con datos sin procesar o estructurados. Los datos son el combustible que puede llevar a un negocio a la ruta correcta o al menos proporcionar información procesable que puede ayudar a estrategias de estrategias actuales, organizar fácilmente el lanzamiento de nuevos productos o probar diferentes experimentos.

Todas estas cosas tienen un componente de conducción común y esto son datos. Estamos entrando en la era digital donde producimos muchos datos. Por ejemplo, una empresa como Flipkart produce más de 2 TB de datos diariamente.

En términos simples, los datos son un registro sistemático de información digital recuperada de las interacciones digitales como hechos y cifras. Los tipos de datos estadísticos funcionan como una visión para futuras predicciones y mejorar los servicios preexistentes. El flujo de datos continuo ha ayudado a millones de organizaciones a alcanzar el crecimiento con decisiones respaldadas por hechos. Los datos son un gran registro de información segmentada en varias categorías para adquirir diferentes tipos, calidad y características de los datos, y estas categorías se denominan tipos de datos.

Cuando estos datos tienen tanta importancia en nuestra vida, se vuelve importante almacenar y procesar correctamente esto sin ningún error. Al tratar con conjuntos de datos, la categoría de datos juega un papel importante para determinar qué estrategia de preprocesamiento funcionaría para un conjunto particular para obtener los resultados correctos o qué tipo de análisis estadístico se debe aplicar para los mejores resultados. Vamos a sumergirnos en algunas de las categorías de datos comúnmente utilizadas.

¿Qué es nominal u ordinal discreta o continua?

Por lo general, solo es interesante para el manejo práctico de los datos si se trata de datos discretos o constantes, ya que esta distinción determina qué métodos utiliza. Los datos discretos se definen como datos que finalmente o contables un número infinito de formularios. El infinito contable significa que en su mayoría cuentan los datos que teóricamente pueden entrar en infinito, como el número de hijos de una persona.

Los datos constantes, como el tamaño del cuerpo, se caracterizan por el hecho de que el número teóricamente infinito de valores diferentes puede ocurrir dentro de un intervalo. En el caso de la altura, este intervalo es el de números reales (aunque puede limitarse al intervalo de 0 cm a 300 cm), en este intervalo, cualquier número concebible con cualquier número de lugares decimales puede ocurrir como forma, por ejemplo 178.42525342… cm.

Un caso especial de los llamados datos cuasi sabrosos, que son teóricamente estables pero solo son redondeados, como el ingreso neto que se redondea en Cent. Sin embargo, en casi todos los casos, son tratados y datos constantes.

Además, ocasionalmente se encuentra con datos clasificados constantemente, es decir, datos que en realidad están constantemente en forma sin procesar pero se han resumido en grupos. Esto puede suceder, por ejemplo, por razones de anonimato: en cuestionarios, por ejemplo, casi nunca se trata de los ingresos exactos en Euros, pero siempre dio una lista de selección que se ve así, por ejemplo:

  • hasta 800 euros
  • 801 a 1500 euros
  • 1501 a 2500 euros
  • Más de 2500 euros

Las clases no tienen que ser igualmente amplias, pero por supuesto no pueden superponerse.

¿Cómo saber si una variable es nominal ordinal discreta o continua?

¡Bien explicado! Sobre todo, me gusta la pista de que las pruebas de distribución normales a menudo son demasiado estrictas («conservadoras»). Por cierto, hay una declaración en la prueba t de que, según los estudios de Monte Carlo, reacciona con bastante robusta en caso de lesiones a sus condiciones. Puede confiar en Jürgen Bortz (estadísticas para los científicos humanos y sociales).

Bien explicado. Muchas gracias y ¿qué haces si tienes dos SP independientes, uno de los cuales normalmente se distribuye y el otro normalmente no se distribuye?

Si ambos se examinan juntos en una prueba, tome la prueba no paramétrica. Las pruebas no paramétricas generalmente también se permiten en datos distribuidos normalmente. Solo tienen una resistencia de prueba ligeramente menor, por lo que las pruebas paramétricas son preferibles si es posible (= todas las variables normalmente distribuidas).

Tengo la siguiente situación: 3 (grupos de intervención) con 5 tiempos de medición. Básicamente, una situación independiente y dependiente con la misma ponderación. ¿Qué prueba es la correcta? Necesitaría una «mezcla» de Kruskal-Wallis y Friedman. Puede alguien ayudarme por favor ?

En el caso paramétrico, ese sería un diseño de diagrama dividido. Sin embargo, deben aplicarse algunos requisitos previos: distribución normal en los grupos, homogeneidad de las variaciones, esfericidad… Si esto no está herido aproximadamente y el número de casos no es demasiado pequeño, puede usar esto (en SPSS, por ejemplo, > Modelo lineal general -> rede de medición). Si el número de casos es demasiado pequeño o no se cumplen los requisitos, primero vería los datos en un descriptivo (media, mediana, diversificación, dispersión, cifras) y luego, dependiendo de la pregunta, considere aspectos individuales con pruebas (por ejemplo, compare los grupos individualmente para cada vez, o diferencias (la última menos primera vez) compare para los grupos o…).

¿Qué es variable discreta y nominal?

Objetivo 1.2 Los datos de DISCRITE a menudo se denominan datos categóricos debido a la forma en que las observaciones se pueden recopilar en categorías. Las variables que producen dichos datos pueden ser de cualquiera de los siguientes tipos:

  • Variables cuantitativas con relativamente pocos valores (por ejemplo, número de veces casado)

Técnicamente, una variable cuantitativa puede asumir cualquier número de valores y aún así considerarse discreto, pero debe ser «contable». Entonces, por ejemplo, el número de accidentes de tráfico en un período de tiempo dado puede considerarse discreta, pero la cantidad de tiempo entre dos accidentes consecutivos se consideraría continuo. Sin embargo, incluso una variable continua puede usarse para producir datos discretos si su rango se divide o se «engrasa» en intervalos.

Tenga en cuenta que muchas variables pueden considerarse como nominales u ordinales, dependiendo del propósito del análisis. Considere especializaciones en inglés, psicología e informática. Esta clasificación puede considerarse nominal u ordinal, dependiendo de si existe una creencia intrínseca de que es «mejor» tener una especialización en informática que en psicología o en inglés. En términos generales, para una variable binaria como Pass/Fail, la consideración ordinal o nominal no importa.

También se debe tener en cuenta que las variables numéricamente significativas pueden asociarse con cualquiera de los tipos de datos anteriores, incluso con el tipo nominal. Por ejemplo, las categorías de género de «hombre» y «mujer» no serían numéricamente significativos, pero si dejamos que (x ) sea el número de hombres en una muestra aleatoria, se consideraría una variable cuantitativa (aleatoria) .

¿Qué es una variable nominal y discreta?

Todos los experimentos examinan algún tipo de variable (s). Una variable no es solo algo que medimos, sino también algo que podemos manipular y algo que podamos controlar. Para comprender las características de las variables y cómo las usamos en la investigación, esta guía se divide en tres secciones principales. Primero, ilustramos el papel de las variables dependientes e independientes. En segundo lugar, discutimos la diferencia entre la investigación experimental y no experimental. Finalmente, explicamos cómo las variables pueden caracterizarse como categóricas o continuas.

Una variable independiente, a veces llamada variable experimental o predictor, es una variable que se está manipulando en un experimento para observar el efecto en una variable dependiente, a veces llamada variable de resultado.

Imagine que un tutor pide a 100 estudiantes que completen un examen de matemáticas. El tutor quiere saber por qué algunos estudiantes se desempeñan mejor que otros. Si bien el tutor no sabe la respuesta a esto, cree que podría ser por dos razones: (1) algunos estudiantes pasan más tiempo revisando para su prueba; y (2) algunos estudiantes son naturalmente más inteligentes que otros. Como tal, el tutor decide investigar el efecto del tiempo de revisión e inteligencia en el rendimiento de la prueba de los 100 estudiantes. Las variables dependientes e independientes para el estudio son:

La variable dependiente es simplemente esa variable que depende de una variable (s) independiente (s). Por ejemplo, en nuestro caso, la marca de prueba que logra un estudiante depende del tiempo de revisión e inteligencia. Si bien el tiempo de revisión e inteligencia (las variables independientes) puede (o no) causar un cambio en la marca de prueba (la variable dependiente), el reverso es inverosímil; En otras palabras, mientras la cantidad de horas que un estudiante pasa revisando y cuanto más alto en el puntaje de coeficiente intelectual de un estudiante puede (o no) cambiar la marca de prueba que un estudiante logra, un cambio en la marca de prueba de un estudiante no tiene relación si un estudiante revisa Más o es más inteligente (esto simplemente no tiene sentido).

Por lo tanto, el objetivo de la investigación del tutor es examinar si estas variables independientes, el tiempo de revisión y el coeficiente intelectual, dan como resultado un cambio en la variable dependiente, los puntajes de las pruebas de los estudiantes. Sin embargo, también vale la pena señalar que, si bien este es el objetivo principal del experimento, el tutor también puede estar interesado en saber si las variables independientes, el tiempo de revisión y el coeficiente intelectual, también están conectados de alguna manera.

¿Qué es una variable discreta?

Una variable discreta es un tipo de variable estadística que solo puede asumir valores específicos discretos. La variable no es continua, lo que significa que hay infinitamente muchos valores entre el máximo y el mínimo que simplemente no se pueden alcanzar, sin importar qué.

Por ejemplo, los puntajes de prueba en una prueba estandarizada son discretos porque solo hay muchos valores que se pueden obtener en una prueba. Sería imposible, por ejemplo, obtener una puntuación de 342.34 en SAT.

Muchos estudios implican el uso de una variable discreta. Muchos estudios que involucran sujetos humanos donde la experiencia cualitativa se convierte en datos cuantitativos implica el uso de una variable discreta.

Por ejemplo, suponga que una compañía está lanzando una nueva línea de papas fritas. Para tener una idea de cómo estos nuevos chips se clasifican en comparación con los que ya están presentes en el mercado, la compañía necesita realizar pruebas que involucren catadores humanos. Estas personas calificarán este nuevo producto y un producto antiguo en la misma categoría y calificarán los productos en una escala, generalmente en una escala de 1-10. En este caso, la puntuación dada por cada catador para cada uno de los productos es una variable discreta.

También hay casos más simples de estadísticas que involucran variables discretas para el estudio. Por ejemplo, un lanzamiento de monedas puede ser una cabeza o colas. Si desea cuantificar estos datos, puede asignar 1 para cabezas y 0 para colas y calcular la puntuación total de un experimento de lanzamiento de monedas aleatorias. En este caso, la variable que realiza un seguimiento del resultado es una variable discreta.

Artículos Relacionados:

Related Posts

Deja una respuesta

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *