La validez es la medida en que los puntajes de una medida representan la variable a la que están destinados. Pero, ¿cómo hacen los investigadores este juicio? Ya hemos considerado un factor que tienen en cuenta: la fiabilidad. Cuando una medida tiene una buena confiabilidad de prueba y consistencia interna, los investigadores deben estar más seguros de que los puntajes representan lo que se supone que deben hacerlo. Sin embargo, tiene que haber más porque una medida puede ser extremadamente confiable pero no tiene validez alguna. Como un ejemplo absurdo, imagine a alguien que cree que la longitud del dedo índice de las personas refleja su autoestima y, por lo tanto, trata de medir la autoestima al mantener a un gobernante a los dedos índice de las personas. Aunque esta medida tendría una confiabilidad muy buena test-retest, no tendría absolutamente ninguna validez. El hecho de que el dedo índice de una persona sea un centímetro más largo que el de otra indicaría nada sobre cuál tenía una mayor autoestima.
Las discusiones de validez generalmente lo dividen en varios «tipos» distintos. Pero una buena manera de interpretar estos tipos es que son otros tipos de evidencia, además de la confiabilidad, que debe tenerse en cuenta al juzgar la validez de una medida. Aquí consideramos tres tipos básicos: validez aparente, validez de contenido y validez de criterio.
La validez aparente es la medida en que aparece un método de medición «en su cara» para medir la construcción de interés. La mayoría de las personas esperarían que un cuestionario de autoestima incluya elementos sobre si se ven a sí mismos como una persona de valor y si creen que tienen buenas cualidades. Entonces, un cuestionario que incluía este tipo de artículos tendría una buena validez aparente. El método de longitud de los dedos para medir la autoestima, por otro lado, parece no tener nada que ver con la autoestima y, por lo tanto, tiene una validez cara de baja. Aunque la validez aparente puede evaluarse cuantitativamente, por ejemplo, al tener una gran muestra de personas califican una medida en términos de si parece medir lo que está destinada, generalmente se evalúa de manera informal.
La validez aparente es, en el mejor de los casos, un tipo de evidencia muy débil de que un método de medición está midiendo lo que se supone que debe. Una razón es que se basa en las intuiciones de las personas sobre el comportamiento humano, que con frecuencia son incorrectos. También es el caso de que muchas medidas establecidas en psicología funcionan bastante bien a pesar de la falta de validez facial. El Inventario de personalidad multifásico de Minnesota-2 (MMPI-2) mide muchas características y trastornos de personalidad al hacer que las personas decidan si cada una de las más de 567 declaraciones diferentes se aplica a ellos, donde muchas de las declaraciones no tienen ninguna relación obvia con la construcción de que miden . Por ejemplo, los elementos «disfruto de las historias de detectives o misteriosos» y «La vista de la sangre no me asusta ni me enferma» miden la supresión de la agresión. En este caso, no son las respuestas literales de los participantes a estas preguntas las que son de interés, sino más bien si el patrón de las respuestas de los participantes a una serie de preguntas coincide con las de las personas que tienden a suprimir su agresión.
¿Cuáles son los tipos de validez para un instrumento?
Validez (un mapa conceptual muestra los diversos tipos de validez)
Un instrumento es válido solo en la medida en que sus puntajes permiten que se realicen inferencias apropiadas sobre
1) Un grupo específico de personas para
2) propósitos específicos.
Un instrumento que es una medida válida de las habilidades matemáticas de tercer grado probablemente no sea una medida válida de las habilidades matemáticas del estudiante de cálculo de la escuela secundaria. Un instrumento que es un predictor válido de qué tan bien los estudiantes podrían hacerlo en la escuela, puede no ser una medida válida de qué tan bien lo harán una vez que completen la escuela. Por lo tanto, nunca decimos que un instrumento es válido o no válido… decimos que es válido para un propósito específico con un grupo específico de personas. La validez es específica de la idoneidad de las interpretaciones que deseamos hacer con los puntajes.
En la sección de confiabilidad, discutimos una escala que constantemente informó un peso de 15 libras para alguien. Si bien puede ser un instrumento confiable, no es un instrumento válido para determinar el peso de alguien en libras. Así como una cinta de medición es un instrumento válido para determinar la altura de las personas, no es un instrumento válido para determinar su peso.
Hay tres categorías generales de validez del instrumento. Evidencia relacionada con el contenido (también conocida como validez aparente)
Se pide a los especialistas en el contenido medido por el instrumento que juzguen la idoneidad de los elementos en el instrumento. ¿Cubren el aliento del área de contenido (el instrumento contiene una muestra representativa del contenido que se está evaluando)? ¿Están en un formato apropiado para aquellos que usan el instrumento? Una prueba destinada a medir la calidad de la instrucción científica en quinto grado, debe cubrir el material cubierto en el curso de ciencia de quinto grado de una manera apropiada para los alumnos de quinto grado. Una prueba de ciencia nacional podría no ser una medida válida de la instrucción de ciencias locales, aunque podría ser una medida válida de los estándares de ciencias nacionales.
Evidencia relacionada con el criterio
La evidencia relacionada con el criterio se recopila comparando el instrumento con algunos criterios futuros o actuales, por lo que el criterio de nombre está relacionado con los criterios. El propósito de un instrumento dicta si se justifica la validez predictiva o concurrente.
¿Cuáles son los tipos de validez que debe tener un instrumento?
Durante una evaluación de la dependencia, los instrumentos de evaluación validados se eligirán de acuerdo con la calidad de su validación y el propósito de la evaluación. La determinación de las capacidades de un individuo para los gestos comunes con respecto al cuerpo utilizará la escala de las actividades de la vida diaria (actividades de la vida diaria ADL) (cuidado corporal, ropa, inodoro, transferencia, continencia, comida) (Anexo I). Esta cuadrícula simple y fácil de informar está bien validada. Se considera una referencia en la literatura internacional. Esta red predice fuertemente el pronóstico en términos de morbilidad y mortalidad. Al evaluar la dependencia de los sujetos de edad avanzada que viven en su hogar, es necesario evaluar las actividades actuales que requieren el uso de funciones cognitivas instrumentales calificadas SO (cálculo, desarrollo de estrategias ejecutivas). Las actividades instrumentales de la vida instrumental (ADL Instrumental) (Apéndice II) son las más utilizadas. Las actividades así evaluadas son la capacidad de usar el teléfono, hacer las compras, preparar una comida, limpiar, lavar la lavandería, hacer un viaje o transporte urbano, tomar un tratamiento de drogas y administrar un presupuesto personal. Esta escala se refiere. Cabe señalar que el sujeto evalúa sus capacidades él mismo. Puede ser necesaria una verificación con familiares, incluso una situación (preparación de medicamentos, uso del teléfono, manipulación de la moneda). La implementación u observación de actividades instrumentales permite detectar trastornos de las funciones ejecutivas, a veces el primer signo de demencia degenerativa del tipo de Alzheimer.
Se han propuesto otras cuadrículas para varios usos, como la evaluación del cargo de atención de un servicio o el monitoreo de un sujeto. En este contexto podemos citar la de la Sociedad Francesa de Gérontologie (Kuntzmann Grid) o La Grille Géronte.
Actividades del duque de la vida diaria
Apunte objetivamente a evaluar las actividades de la vida diaria. Descripción La autonomía para una actividad de la vida diaria está del lado 1. Una puntuación de 6 indica autonomía completa. Un sujeto anciano cuyo puntaje es <3 se considera dependiente. Notas - Simplicidad y Briéveté de Pasaje - Muy usado en la literatura internacional - No tiene en cuenta los viajes - El 20 % de los pacientes no siguen siendo referencias clasificadas Katz S., Dowtn T.D., Cash H.R. Progress en el desarrollo del índice de ADL. Gerontólogo 1970; 10: 20-30
Una escala de actividades instrumentales de la vida diaria
¿Qué es la validez de los instrumentos?
En medicina, identificar o excluir una condición patológica, se confían las pruebas de diagnóstico o detección. Las pruebas, en una medida variable, tienen límites tanto en la capacidad de reconocer todos los enfermos como en la identificación de todos los saludables.
La sensibilidad [1] de una prueba es la capacidad de prueba para identificar a los sujetos que presentan la enfermedad y corresponden a la proporción de sujetos verdaderamente enfermos identificados como tales por la prueba. La sensibilidad es importante cuando el objetivo no es perder los casos de enfermedad, como en el caso de enfermedades graves evolutivas rápidamente, en las que la intervención oportuna puede ser crucial. Si una prueba muy sensible es negativa, se puede creer razonablemente que la enfermedad no está allí y que no es necesario proceder generalmente con exámenes adicionales.
La especificidad [1] de una prueba es la capacidad de prueba para identificar a los sujetos que no presentan la enfermedad y corresponden a la proporción de sujetos verdaderamente sanos que son identificados como tales por la prueba. La especificidad es importante cuando es necesario estar seguro del diagnóstico realizado, como en el caso de un diagnóstico que indica una cirugía de demolición. Si una prueba muy específica es positiva, se puede creer razonablemente que la enfermedad está presente y generalmente puede proceder con los tratamientos esperados.
En general, las pruebas muy sensibles no son muy específicas (pueden producir más fácilmente falsos positivos). Por el contrario, las pruebas muy específicas generalmente no son muy sensibles (pueden producir más fácilmente falsos negativos)
¿Qué es la validez y confiabilidad de una investigación?
Si un experimento no es válido debido a que se utiliza un método inapropiado, el resultado aún puede ser confiable, simplemente no abordará el objetivo del experimento.
Sin embargo, si un experimento no es válido porque las variables de control no son constantes, entonces pueden estar afectando las mediciones de una manera impredecible, lo que hace que el resultado sea poco confiable.
La precisión es mucho más fácil de definir: la precisión de un experimento es qué tan cerca está el resultado final al valor correcto o aceptado. Cuanto más cerca esté, más preciso es el experimento.
La precisión se puede mejorar a través del método experimental si cada sola medición se hace más precisa, p. a través de la elección del equipo. La implementación de un método que reduce los errores sistemáticos mejorará la precisión.
Tenga en cuenta que la precisión es un aspecto separado que no está directamente relacionado con la precisión. La precisión se refiere a la resolución máxima o al número de cifras significativas en una medición. Por ejemplo, un reloj tiene una precisión de 1 s, mientras que un cronómetro tiene una precisión de 0.01 s. Si una medición es precisa o no depende de la precisión.
- Comparación de la medición con el valor esperado de la teoría para mediciones individuales
- Comparando el resultado experimental final con el valor aceptado para el resultado completo del experimento
La fiabilidad y la precisión son aspectos separados de un experimento y la relación entre ellos a veces se malinterpreta.
Un resultado puede ser confiable e inexacto si obtiene la misma respuesta incorrecta todo el tiempo (por ejemplo, su amigo siempre llega 10 minutos tarde), y también puede ser preciso y poco confiable (por ejemplo, su amigo es más o menos a tiempo, pero a veces temprano , a veces tarde).
¿Por qué es importante la validez y confiabilidad en un instrumento de investigación?
La validez describe si los resultados de una experiencia realmente miden el concepto probado.
La validez describe si el instrumento se mide la construcción que debe medirse. Una medida válida también es siempre una medida confiable, pero lo contrario no es cierto: si un instrumento proporciona un resultado coherente, es confiable, pero no tiene que ser válido.
La confiabilidad es necesaria pero no suficiente para la validez. Si usara una escala normal y no rota para medir su tamaño, le daría la misma puntuación y, por lo tanto, sería confiable (suponiendo que su peso no fluctúe), pero aún no sería válido.
Puede aumentar la validez de una experiencia controlando más variables, mejorando la técnica de medición, aumentando la aleatorización para reducir el sesgo de la muestra, enmascarando la experiencia y agregando testigos o grupos placebo.
La fiabilidad se refiere a la consistencia de los resultados de la investigación. La fiabilidad es muy importante para la investigación psicológica. De hecho, prueba si el estudio cumple sus objetivos y su hipótesis proporcionada y también garantiza que los resultados se deban al estudio y no a posibles variables extranjeras.
La validez de la construcción es la más importante de las medidas de validez. Según el American Educational Research Associate (1999), la validez conceptual se refiere a «la medida en que la evidencia y la teoría respaldan las interpretaciones de los resultados de las pruebas capacitadas por los usos propuestos de las pruebas».
¿Cómo se mide la validez y confiabilidad de una investigación cualitativa?
La confiabilidad en la investigación cualitativa se refiere a la estabilidad de las respuestas a múltiples codificadores de conjuntos de datos. Se puede mejorar mediante notas de campo detalladas utilizando dispositivos de grabación y transcribiendo los archivos digitales. Sin embargo, la validez en la investigación cualitativa podría tener términos diferentes que en la investigación cuantitativa. Lincoln y Guba (1985) utilizaron la «confiabilidad» de un estudio como el equivalente del naturalista para la validación interna, la validación externa, la confiabilidad y la objetividad. La confiabilidad se logra por credibilidad, autenticidad, transferibilidad, confiabilidad y confirmabilidad en la investigación cualitativa. Para operacionalizar estos términos, una larga participación en el campo y la triangulación de fuentes de datos, métodos e investigadores para establecer credibilidad. Para confirmar que los resultados son transferibles entre el investigador y los estudiados, se necesita una descripción gruesa. En la investigación cualitativa, los investigadores buscan confiabilidad de que los resultados estén sujetos a cambios e inestabilidad en lugar de buscar confiabilidad. En investigación cualitativa.
En lugar de utilizar la validación de la palabra, Eisner (1991) construyó estándares, como la corroboración estructural, la validación consensuada y la adecuación referencial como evidencia para afirmar la credibilidad de la investigación cualitativa. En la corroboración estructural, el científico utiliza varias fuentes de datos para apoyar o negar la interpretación. Según Lather (1991) identificó cuatro tipos de validación (triangulación, validación de constructo, validación facial y validación catalítica) como una «reconceptualización de la validación».
Whittemore, Chase y Mandle (2001), analizaron 13 escritos sobre la validación y se les ocurrieron criterios de validación clave de estos estudios. Clasificaron estos criterios en criterios primarios y secundarios. Encontraron 4 criterios primarios que son:
- Credibilidad (¿son los resultados una interpretación precisa del significado de los participantes?)
- Autenticidad (¿se escuchan diferentes voces?)
- Crítica (¿Existe una evaluación crítica de todos los aspectos de la investigación?)
- Integridad (¿Los investigadores son autocríticos?)
Los criterios secundarios están relacionados con la explicidad, la viveza, la creatividad, la minuciosidad, la congruencia y la sensibilidad.
Artículos Relacionados:
- Confiabilidad y validez de las pruebas de software: una revisión
- Validez y confiabilidad del instrumento: Ejemplos prácticos
- 3 tipos de confiabilidad que todos los negocios necesitan
- La validez y confiabilidad del instrumento de tesis fue evaluada por un panel de expertos
- Alfa de Cronbach: Confiabilidad y Validez
