Når vi kaller noen eller noe pålitelig, mener vi at de er konsistente og pålitelige. Pålitelighet er også en viktig del av en god psykologisk test. Tross alt ville en test ikke være veldig verdifull hvis den var inkonsekvent og produserte ulike resultater hver gang. Hvordan definerer psykologer pålitelighet? Hvilken påvirkning har det på psykologisk testing?
Pålitelighet refererer til konsistensen til et mål. En test anses pålitelig hvis vi får det samme resultatet gjentatte ganger. For eksempel, hvis en test er utformet for å måle et trekk (for eksempel introversjon ), må resultatet hver gang testen administreres til et emne, være omtrent det samme. Dessverre er det umulig å beregne påliteligheten nøyaktig, men det kan estimeres på en rekke forskjellige måter.
Test-Retest Pålitelighet
Test-retest pålitelighet er et mål for konsistensen til en psykologisk test eller vurdering. Denne typen pålitelighet brukes til å bestemme konsistensen av en test over tid. Test-retest pålitelighet er best brukt til ting som er stabile over tid, for eksempel intelligens .
Test-retest-pålitelighet måles ved å administrere en test to ganger på to forskjellige punkter i tide. Denne type pålitelighet forutsetter at det ikke vil bli endret i kvaliteten eller konstruksjonen som måles.
I de fleste tilfeller vil påliteligheten bli høyere når det er lite tid mellom tester.
Test-retest-metoden er bare en av måtene som kan brukes til å bestemme påliteligheten til en måling. Andre teknikker som kan brukes inkluderer inter-rater pålitelighet, intern konsistens og parallellformer pålitelighet.
Det er viktig å merke seg at test-retest-pålitelighet bare refererer til konsistensen av en test, ikke nødvendigvis gyldigheten av resultatene.
Inter-rater Pålitelighet
Denne type pålitelighet vurderes ved å ha to eller flere uavhengige dommere score testen. Resultatene blir deretter sammenlignet for å fastslå konsistensen av raters estimatene.
En måte å teste inter-rater pålitelighet på er å ha hver rater tildele hvert testelement en poengsum. For eksempel kan hver rater score på en skala fra 1 til 10. Deretter beregner du sammenhengen mellom de to karakterene for å bestemme nivået på inter-rater pålitelighet.
En annen måte å teste inter-rater pålitelighet på er å ha ratere avgjøre hvilken kategori hver observasjon faller inn i og deretter beregne prosentandelen av avtale mellom ratene. Så, hvis raterne er enige om 8 av 10 ganger, har testen en pålitelighetsgrad på 80%.
Parallell-Forms Pålitelighet
Parallelle former for pålitelighet måles ved å sammenligne to forskjellige tester som ble opprettet ved hjelp av det samme innholdet. Dette oppnås ved å opprette et stort basseng av testelementer som måler den samme kvaliteten og deretter tilfeldig deles elementene i to separate tester. De to testene skal da administreres til de samme fagene samtidig.
Intern konsistens Pålitelighet
Denne form for pålitelighet brukes til å bedømme konsistensen av resultatene på tvers av elementer på samme test. I hovedsak sammenligner du testelementer som måler samme konstruksjon for å bestemme testens interne konsistens. Når du ser et spørsmål som ser veldig ut som et annet testspørsmål, kan det tyde på at de to spørsmålene brukes til å måle påliteligheten. Fordi de to spørsmålene er like og utformet for å måle det samme, bør testtakeren svare på begge spørsmålene, noe som vil indikere at testen har intern konsistens.
Faktorer som kan påvirke pålitelighet
Det finnes en rekke forskjellige faktorer som kan påvirke påliteligheten til et tiltak.
Først og kanskje tydeligvis er det viktig at tingen som blir målt, er ganske stabil og konsistent. Hvis den målte variabelen er noe som endres regelmessig, vil resultatene av testen ikke være konsistente.
Aspekter av testsituasjonen kan også påvirke påliteligheten. For eksempel, hvis testen blir administrert i et rom som er ekstremt varmt, kan respondentene bli distrahert og ikke klarer å fullføre testen til det beste av deres evne. Dette kan påvirke tiltakets pålitelighet. Andre ting som tretthet, stress, sykdom, motivasjon, dårlige instruksjoner og miljøforstyrrelser kan også skade påliteligheten.
Pålitelighet vs. Gyldighet
Det er viktig å merke seg at bare fordi en test har pålitelighet betyr det ikke at den har gyldighet. Gyldighet refererer til om en test virkelig måler hva det hevder å måle. Tenk på pålitelighet som et mål på presisjon og validitet som et mål for nøyaktighet. I noen tilfeller kan en test være pålitelig, men ikke gyldig. For eksempel tenk at jobbsøkere tar en test for å avgjøre om de har en bestemt personlighetstrekk . Mens testen kan gi konsistente resultater, kan det egentlig ikke være å måle egenskapen som den har til hensikt å måle.