Validez de contenido: Ejemplo

El término validez de contenido se refiere a qué tan bien una encuesta o prueba mide la construcción que se establece para medir.

Por ejemplo, suponga que un profesor quiere probar el conocimiento general de sus alumnos en el tema de las estadísticas primarias. Su prueba tendría validez de contenido si:

  • La prueba cubre cada tema de estadísticas elementales que enseñó en la clase.
  • La prueba no cubre temas no relacionados como historia, economía, biología, etc.

Una prueba carece de validez de contenido si no cubre todos los aspectos de una construcción que se establece para medir o si cubre temas que no están relacionados con la construcción de ninguna manera.

En la práctica, la validez del contenido a menudo se usa para evaluar la validez de las pruebas que evalúan el conocimiento del contenido. Ejemplos incluyen:

Un examen final al final de un semestre para un curso de estadísticas tendría validez de contenido si cubre todos los temas discutidos en el curso y excluye todos los demás temas irrelevantes.

Un examen que prueba si las personas tienen suficiente conocimiento o no para adquirir su licencia de piloto tendría validez de contenido si incluye preguntas que cubren todos los temas posibles discutidos en un curso de piloto y excluyan todas las demás preguntas que no son relevantes para la licencia.

Un examen que prueba si las personas poseen o no suficiente conocimiento para obtener una licencia de bienes raíces tendría validez de contenido si cubre todos los temas que deben ser entendidos por un agente inmobiliario y excluye todas las demás preguntas que no son relevantes.

¿Qué es la validez de un contenido?

Una medida puede considerarse «buena» si es confiable, sensible y válida (tab. 3.is); La fiabilidad (confiabilidad) depende de la consistencia del instrumento (cuyo elemento debe siempre y de la misma manera que la misma entidad), la sensibilidad es su capacidad para discriminar entre diferentes fenómenos, la validez (validez) depende de la precisión con la cual las medidas de lo que se mide presunto debe medir. La falta de confiabilidad y validez es responsable, respectivamente, de errores aleatorios y errores sistemáticos.

La validez es la capacidad de un RS para medir realmente lo que el autor propuso medir. Se distinguen diferentes tipos de validez: por contenido, por criterio, para construir, competidor, predictivo, discriminado, factorial, nominal (tab. 3.iii).

La validez del contenido se refiere al hecho de que los elementos exploran completamente el área que tiene la intención de investigar. Dada la gran variabilidad de la experiencia humana, normal y patológica, no sería posible, en la práctica, explorar todos los aspectos de un cierto problema para cada paciente; Por esta razón, un RS se considera válido para el contenido cuando sus elementos cubren un área suficientemente representativa del sector psicopatológico que está destinado a medirse. La validez del contenido debe evaluarse sobre la base de los criterios adoptados por el autor de la escala para la elección de elementos y su contenido para explorar completamente el problema específico. En algunos casos, esta información se informa en el manual de escala o en los artículos en los que se presenta la herramienta, la mayoría de las veces, sin embargo, esta información no está disponible y, por lo tanto, debemos recurrir a una evaluación empírica y subjetiva, basada en la Examen del contenido de la escala. Cuando se trata de juzgar la validez por contenido de herramientas que miden, por ejemplo, habilidades específicas, como la adquisición de ciertas nociones (matemáticas, física, etc.), el juicio puede ser relativamente fácil, pero cuando se trata de RS que Evaluar los síndromes clínicos, el juicio es más difícil y complejo ya que los elementos que lo componen pueden medir un síntoma como síndrome o síntomas que son bastante característicos cuando están presentes, pero cuya presencia no es particularmente frecuente. Por lo tanto, es necesario que los elementos que componen la escalera exploran los síntomas que se manifiestan con buena frecuencia en la imagen clínica exploradas para decir que expresan completamente el síndrome que tenemos la intención de explorar y que, por lo tanto, la escala es válida.

¿Cómo realizar la validez de contenido?

Aqui hay unas ideas para que puedas comenzar. Para una inmersión más profunda, el Markmark tiene varios documentos blancos que ayudarán, y también recomiendo el excelente libro «Desarrollo de pruebas referenciados por criterios» de Shrock & Coscarelli.

  • Realice un análisis de tareas de trabajo (JTA). Una JTA es una encuesta que pregunta a los expertos en el papel de trabajo qué tareas son importantes y con qué frecuencia se realizan. Una JTA le brinda la información para definir temas de evaluación en términos de lo que el trabajo necesita. PreguntMark tiene un tipo de pregunta JTA que facilita la entrega e informa sobre JTA.
  • Puede encuestar a los expertos de la materia para verificar la validez del contenido para una prueba existente. Si tiene una evaluación existente y necesita verificar su validez de contenido, obtenga un panel de PYME (expertos) para calificar cada pregunta sobre si es «esencial», «útil, pero no esencial» o «no necesario». al rendimiento de lo que se está mediante. Cuantas más pymes estén de acuerdo en que los elementos son esenciales, mayor será la validez del contenido. Consulte la validez de la evaluación de la evaluación: la validez del contenido para una forma de hacerlo dentro del software de cuestionarios.
  • Utilice informes de análisis de elementos. El análisis de elementos informa las preguntas de los indicadores que no se correlacionan bien con el resto de la evaluación. PreguntMark tiene un informe de análisis de elementos fáciles de entender que marcará las posibles preguntas para su revisión. Una de las razones por las que se podría señalar una pregunta es porque los participantes que lo hacen bien en otras preguntas no funcionan bien en esta pregunta: esto podría indicar que la pregunta carece de validez de contenido.
  • Involucrar expertos en la materia (PYME). Puede sonar obvio, pero cuanto más involucre las PYME en el desarrollo de su evaluación, más validez de contenido tendrá. Use un sistema de gestión de evaluación que sea fácil de usar para las PYME ocupadas e involucre a las PYME en la escritura y la revisión de preguntas.
  • Revise y actualice las pruebas con frecuencia. Las habilidades requeridas para los trabajos cambian rápidamente con la tecnología cambiante y las regulaciones cambiantes. Muchas pruebas en el lugar de trabajo que fueron válidas hace dos años, no son válidas hoy. Use un banco de artículos con un centro de búsqueda para administrar sus preguntas y revisar y actualizar o retirar preguntas que ya no son relevantes.

Espero que esta publicación de blog le recuerde por qué la validez del contenido es importante y ofrece consejos útiles para mejorar la validez de contenido de sus pruebas. Si está utilizando un sistema de gestión de aprendizaje para crear y entregar evaluaciones, puede tener dificultades para obtener y demostrar la validez de contenido. Si desea ver cómo el software QuestionMark puede ayudar a administrar sus evaluaciones, solicite una demostración hoy.

¿Qué es la validez de contenido y ejemplo?

Por ejemplo, una prueba educativa con una fuerte validez de contenido representará a las materias que realmente enseñan a los estudiantes, en lugar de hacer preguntas no relacionadas.

La validez del contenido a menudo se ve como un requisito previo para la validez del criterio, porque es un buen indicador de si se mide el rasgo deseado. Si los elementos de la prueba son irrelevantes para la construcción principal, entonces están midiendo algo más por completo, creando un sesgo potencial.

La validez del contenido es de naturaleza cualitativa y pregunta si un elemento específico mejora o resta valor a una prueba o programa de investigación.

La validez del contenido está relacionada con la validez aparente, pero difiere enormemente en cómo se evalúa.

La validez aparente requiere un juicio personal, como preguntar a los participantes si pensaban que una prueba estaba bien construida y útil. La validez del contenido llega a las mismas respuestas, pero utiliza un enfoque basado en estadísticas, asegurando que se considera un tipo sólido de validez.

Para encuestas y pruebas, cada pregunta se da a un panel de analistas expertos, y lo califican. Dan su opinión sobre si la pregunta es esencial, útil o irrelevante para medir la construcción en estudio.

Sus resultados se analizan estadísticamente y la prueba se modifica para mejorar la validez racional.

Veamos un ejemplo del empleo, donde a menudo se usa la validez de contenido.

Una escuela quiere contratar a un nuevo profesor de ciencias, y un panel de gobernadores comienza a revisar a los diversos candidatos. Elaboran una lista corta y luego establecen una prueba, eligiendo al candidato con el mejor puntaje. Lamentablemente, demuestra ser un maestro de ciencias extremadamente pobre.

¿Cuándo se utiliza la validez de contenido?

La validez del contenido es la medida en que los elementos dentro de un procedimiento de medición son relevantes y representativos de la construcción que se utilizarán para medir (Haynes et al., 1995). Establecer la validez del contenido es una tarea necesariamente inicial en la construcción de un nuevo procedimiento de medición (o revisión de uno existente). Sin embargo, la validez (por ejemplo, la validez de constructo) y la confiabilidad (por ejemplo, consistencia interna) del contenido (es decir, elementos) seleccionados deben probarse antes de que se pueda realizar una evaluación de la validez del contenido. Si no está familiarizado con la idea de conceptos y construcciones en la investigación, probablemente valga la pena leer por primera vez la sección sobre conceptos, construcciones y variables. En este artículo, explicamos qué es la validez del contenido, proporcionando algunos ejemplos. Hacemos esto discutiendo la relación entre construcciones y validez del contenido, así como destacando aspectos importantes de la validez del contenido: relevancia y representatividad.

La definición operativa de algunas construcciones puede ser muy sencilla, lo que hace que sea relativamente fácil seguro de que un procedimiento de medición (por ejemplo, una encuesta, observación estructurada, entrevistas estructuradas) es válido. Por ejemplo, podemos sugerir medir la altura de la construcción usando centímetros, o el peso de una persona usando kilogramos. Estas son definiciones operativas de construcciones que son bastante obvias, donde es fácil encontrar una sola definición operativa. Sin embargo, a menudo es mucho más difícil crear definiciones operativas confiables para construcciones más complejas como ira, depresión, motivación y rendimiento de la tarea [consulte la sección sobre conceptos, construcciones y variables]. La complejidad relativa de estos tipos de construcción refleja una serie de factores: (a) el número de dimensiones y medidas que tiene una construcción; (b) el número de formas en que las construcciones se pueden definir operacionalmente; y (c) el potencial para que una construcción sea confundida. Cada uno se discute a su vez:

Las construcciones simples como el peso y la altura son bastante unidimensionales, pero otras construcciones más complejas son multidimensionales. Por multidimensional, queremos decir que estas construcciones más complejas (por ejemplo, ira, depresión, motivación, calidad del sueño, etc.) consisten en una serie de componentes, cada uno de los cuales describe un aspecto diferente de la construcción.

Por ejemplo, tome la construcción, la calidad del sueño, cuya validez de contenido se ha demostrado a través de un cuestionario conocido como el índice de calidad del sueño de Pittsburgh (PSQI), un cuestionario de 19 ítems que consta de 7 componentes: (1) Calidad de sueño subjetivo, (2 ) Latencia del sueño, (3) duración del sueño, (4) eficiencia habitual del sueño, (5) trastornos del sueño, (6) uso de medicamentos para dormir y (7) disfunción diurna (Buysse et al., 1989). Cada uno de estos 7 componentes tiene como objetivo medir una dimensión diferente de la construcción, la calidad del sueño.

Esto conduce a la idea del número de medidas que tiene una construcción. Las construcciones simples como el peso y la altura pueden tener solo una medida (por ejemplo, kilogramos, centímetros, etc.). Sin embargo, para construcciones más complejas, se pueden requerir múltiples medidas, cada una con diferentes elementos. Tenga en cuenta que los elementos son todos esos aspectos del procedimiento de medición que afectan los datos que se recopilan. En términos de medidas, estos elementos incluyen cosas como elementos del cuestionario (por ejemplo, el número de preguntas utilizadas para cada dimensión de una construcción) y criterios de codificación (es decir, qué tipos de medidas se utilizan, incluidos factores como los tipos de variables: nominales y nominales y nominales y Variables continuas, y las escalas utilizadas, escalas continuas, escalas Likert, etc.). Cuantas más dimensiones y medidas tengan una construcción, más difícil será asegurarse de que el procedimiento de medición que está tratando de crear sea válido.

¿Qué es validez de constructo ejemplos?

La validez de constructo se relaciona con la solidez de las inferencias que extrae de los puntajes de las pruebas y otras mediciones. Específicamente, aborda si una prueba mide la construcción prevista. Por ejemplo, ¿una prueba que evalúa la autoestima realmente mide esa construcción o algo más?

Una construcción es una idea compleja que se forma combinando ideas más simples. Los investigadores los crean para comprender una variable latente que no es directamente observable. La ansiedad, la autoestima y la persistencia son ejemplos de construcciones psicológicas. Las construcciones son un concepto único, pero son complejos y se manifiestan de diferentes maneras. Los investigadores no pueden medir ninguno de ellos directamente, sino que los infieren de múltiples elementos en una prueba.

La validez de la construcción es particularmente importante en psicología, estudios de idiomas y ciencias sociales porque estos campos funcionan con conceptos intangibles, como rasgos de personalidad, estados emocionales, niveles de inteligencia, habilidades, habilidades, etc. Estas ideas no son directamente observables porque existen solo en el cerebro humano. Con frecuencia, ni siquiera tienen unidades de medición de concreto.

Los instrumentos y pruebas de medición hacen preguntas que evalúan colectivamente estas construcciones. Los investigadores usan estos instrumentos para hacer inferencias y responder sus preguntas de investigación. Sin embargo, si la prueba no mide el concepto que dice medir, las conclusiones de los investigadores no son válidas. Por ejemplo, si una prueba de autoestima realmente mide la felicidad, todos los hallazgos que los investigadores hacen usando esa prueba ahora son sospechosos. ¡Es por eso que evaluar la validez de constructo es crucial!

¿Qué es el constructo ejemplo?

Cuando habla de una construcción en relación con la prueba y la validez de la construcción, no tiene nada que ver con la forma en que se diseña o construye una prueba. Una construcción es algo que sucede en el cerebro, como una habilidad, nivel de emoción, habilidad o competencia. Por ejemplo, la competencia en cualquier idioma es una construcción.

La validez de la construcción es una forma de probar la validez de una prueba; Se usa en educación, ciencias sociales y psicología. Demuestra que la prueba en realidad está midiendo la construcción que afirma que está midiendo. Por ejemplo, puede tratar de averiguar si un programa educativo aumenta la madurez emocional en los niños de la edad primaria. La validez de construcción mediría si su investigación realmente mide la madurez emocional.

No es tan fácil medir la validez de constructo, generalmente se requieren medidas se requieren para demostrarla, incluidos estudios piloto y ensayos clínicos. Una de las razones por las que es tan difícil de medir es una de las razones por las que existe: en las ciencias sociales, hay mucha subjetividad y la mayoría de las construcciones no tienen una unidad real de medición. Incluso aquellas construcciones que tienen una escala de medición aceptable (como IQ) están abiertas al debate.

Después de la Segunda Guerra Mundial, se hicieron muchos esfuerzos para aplicar estadísticas para construir validez, pero las soluciones fueron tan complicadas que no podían usarse en la vida real. La experiencia y el juicio del investigador son las normas aceptables para probar la validez de construcción. En algunas circunstancias, como en los ensayos clínicos, las pruebas estadísticas como la prueba t de un estudiante pueden usarse para determinar si hay una diferencia significativa entre las pruebas previas y posteriores.

¿Cuál es la importancia de la validez de constructo?

La validez de constructo se refiere al grado en que las inferencias pueden hacerse legítimamente a partir de las operacionalizaciones en su estudio a las construcciones teóricas en las que se basaron esas operacionalizaciones. Encuentro que me ayuda a dividir los problemas en dos territorios amplios que llamo la «tierra de la teoría» y la «tierra de la observación». La tierra de la teoría es lo que sucede dentro de su mente, y su intento de explicar o articular esto a los demás. Son todas las ideas, teorías, arordillos e hipótesis que tienes sobre el mundo. En la tierra de la teoría, encontrará su idea del programa o tratamiento como debería ser. Encontrará la idea o construcción de los resultados o medidas que cree que está tratando de afectar. La tierra de la observación consiste en lo que ves que sucede en el mundo que te rodea y las manifestaciones públicas de ese mundo. En la tierra de la observación, encontrará su programa o tratamiento real, y sus medidas reales u procedimientos de observación. Presumiblemente, ha construido la tierra de observación basada en sus teorías. Usted desarrolló el programa para reflejar el tipo de programa que tenía en mente. Creaste las medidas para llegar a lo que querías llegar.

La validez de constructo es una evaluación de qué tan bien tradujo sus ideas o teorías en programas o medidas reales. ¿Porque es esto importante? Porque cuando piensas en el mundo o hablas con los demás (tierra de la teoría), estás usando palabras que representan conceptos. Si le dice a alguien que un tipo especial de tutoría de matemáticas ayudará a su hijo a mejorar en matemáticas, se está comunicando a nivel de conceptos o construcciones. No está describiendo en detalle operativo las cosas específicas que el tutor hará con su hijo. No está describiendo las preguntas específicas que estarán en la prueba de matemáticas en la que a su hijo le irá mejor. Estás hablando en términos generales, utilizando construcciones. Si basó su recomendación en una investigación que mostró que el tipo especial de tutoría mejoró los puntajes de las matemáticas de los niños, desea asegurarse de que el tipo de tutoría a la que se refiere es el mismo que ese estudio implementó y que el tipo de resultado Estás diciendo que debería ocurrir el tipo que midieron en su estudio. De lo contrario, estaría mal etiquetando o tergiversando la investigación. En este sentido, la validez de constructo puede verse como un tipo de problema de «verdad en el etiquetado».

Realmente hay dos formas generales de ver la idea de la validez de constructo. Llamaré a la primera perspectiva «definicionalista» porque esencialmente sostiene que la forma de asegurar la validez de construcción es definir la construcción tan precisamente que puede operacionalizarlo de manera directa. En una visión definitionalista, ha operacionalizado la construcción correctamente o no lo ha hecho, es un tipo de pensamiento. O este programa es un «programa de tutoría tipo A» o no lo es. O estás midiendo la autoestima o no lo eres.

La otra perspectiva que llamaría «relacionalista». Para un relacionalista, las cosas no son ni en blanco y negro: los conceptos están más o menos relacionados entre sí. El significado de los términos o construcciones difiere relativamente, no absolutamente. El programa en su estudio podría ser un «programa de tutoría tipo A» de alguna manera, mientras que en otros no lo es. Podría ser más ese tipo de programa que otro programa. Su medida podría estar capturando gran parte de la construcción de la autoestima, pero puede no capturarlo todo. Puede haber otra medida más cercana a la construcción de la autoestima que la suya. El relacionalismo sugiere que el significado cambia gradualmente. Rechaza la idea de que podemos confiar en las definiciones operativas como base para la definición de construcción.

Para tener una idea más clara de esta distinción, podría pensar en cómo la ley aborda la construcción de la «verdad». La mayoría de ustedes han escuchado el juramento estándar de que se espera que un testigo en un tribunal de los Estados Unidos jure. Deben decir «la verdad, toda la verdad y nada más que la verdad». ¿Qué significa esto? Si solo los hicimos jurar para decir la verdad, podrían optar por interpretar eso como «Asegúrese de que lo que usted dice sea cierto». Pero eso no garantizaría que dirían todo lo que sabían que era verdad. Podrían dejar algunas cosas importantes. Todavía estarían diciendo la verdad. Simplemente no lo estarían contando todo. Por otro lado, se les pide que digan «nada más que la verdad». Esto sugiere que podemos decir simplemente que la declaración X es verdadera y la declaración Y no es cierta.

Artículos Relacionados:

Más posts relacionados:

Deja una respuesta

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *