V oblastech vědy a techniky se pojmy spolehlivost a validita používají k popisu robustnosti kvalitativních a kvantitativních výzkumných metod. I když tato kritéria spolu souvisí, termíny nejsou zaměnitelné.
Co je spolehlivost ve výzkumu?
Spolehlivost je způsob, jak popsat konzistenci měření, testu, studie nebo experimentu. Pokud někdo dokáže shromáždit vlastní data, opakovat postup a pokaždé získat konzistentní výsledky, test je považován za spolehlivý. Pokud například oční test prováděný různými lékaři po dobu několika týdnů u stejných pacientů přináší stejné výsledky, je test pravděpodobně vědecky spolehlivý, protože výsledky jsou konzistentní.
Co je validita ve výzkumu?
Validita popisuje přesnost měření – pokud studie měří to, co zamýšlí. Pokud má například test požadující, aby si účastníci zapamatovali názvy ovoce, výsledky rozlišené podle úrovně vzdělání, může to být měření vzdělání nebo slovní zásoby spíše než paměť, a i když je opakovatelné, nebude platný. Platná metoda bude odpovídat i dalším známým a ověřeným proměnným a teoriím.
4 typy spolehlivosti
Spolehlivost neboli konzistence studie je zásadní v kvantitativním i kvalitativním výzkumu. Existuje mnoho typů spolehlivosti a robustní test by měl splňovat všechny vhodné typy.
1. Spolehlivost test-retest : Tento typ spolehlivosti se vyznačuje schopností reprodukovat výsledky v průběhu času. Pokud je test nebo měření prováděno opakovaně, přičemž se mění pouze čas testu a odpověď je stejná nebo velmi podobná, výsledný korelační koeficient by naznačoval, že máte instanci spolehlivosti test-retest.
2. Spolehlivost alternativní formy : Tato forma spolehlivosti je, když je test dán v pozměněné formě dalším účastníkům. Pokud stejný test podávaný v různých formách poskytuje konzistentní výsledky, má spolehlivost alternativní formy. To může pomoci zvýšit spolehlivost testu a je důkazem dobrého návrhu výzkumu.
3. Spolehlivost mezi hodnotiteli : Toto kritérium spolehlivosti se týká lidí, kteří provádějí test nebo provádějí měření. Pokud získáte velmi blízko skóre testů napříč řadou různých administrátorů testů, pak máte dobrou spolehlivost mezi hodnotiteli, která je často vyjádřena mírou známou jako Cohenův kappa.
4. Spolehlivost vnitřní konzistence : Pomocí vnitřní konzistence hledáte vysokou spolehlivost v různých částech stejného testu nebo v různých testech určených k měření stejné věci. Například v průzkumu nebo dotazníku určeném k identifikaci úrovně zákaznické spokojenosti by spolehlivost vnitřní konzistence znamenala, že spokojení zákazníci neustále odpovídají „Ano“ na několik kladných otázek (jako například: Líbilo se vám vaše zkušenosti, doporučili byste naši společnost přátelům? , atd.), zatímco nespokojení zákazníci by neustále odpovídali „Ne“. Vnitřní konzistence se často měří pomocí Cronbachova alfa, čísla mezi nulou a 1, přičemž 0,7 nebo vyšší indikuje vysokou spolehlivost.
8 Typy platnosti
Stejně jako u spolehlivosti existují různé kategorie platnosti. V závislosti na tom, co hodnotíte, můžete měřit platnost svých testů pomocí jednoho nebo více typů uvedených níže.
1. Konstrukční validita : Míra nebo test ukazuje konstruktovou validitu, když je v souladu s přijatými a zavedenými teoriemi nebo mírami vlastnosti, kterou se pokouší měřit. Studie emoční zralosti by měla dobrou konstruktivní validitu, pokud by přesně měřila známé rysy, které naznačují emoční zralost, nikoli faktory, které se emoční zralosti podobají, ale nenaznačují ji.
2. Platnost kritéria : Test má platnost související s kritériem, pokud se jeho výsledky buď shodují s výsledky jiných platných testů (souběžná validita), nebo předpovídají budoucí výsledky testu (prediktivní validita). Pokud například nový test silně koreluje aktuální pracovní výkon zaměstnanců s úrovní jejich pracovní spokojenosti – a dělá to stejně dobře jako přijatá verze testu – lze říci, že má validitu kritéria, konkrétně souběžnou validitu. Pokud přesně předpovídá budoucí výkon zaměstnanců, ukáže platnost kritéria, konkrétně prediktivní platnost.
3. Platnost obsahu : Platnost obsahu se týká schopnosti vašich opatření pokrýt všechny relevantní aspekty měřené nebo testované věci. Pokud by test všeobecných matematických schopností v určitém ročníku obsahoval otázky na sčítání, odčítání, násobení, ale ne dělení, postrádal by dostatečnou obsahovou validitu, protože v testu chyběla významná funkce v matematice.
4. Face validita : Tento typ validity se snaží zjistit, zda se míra nebo test jeví jako rozumné. Je poněkud méně formální než ostatní měření, protože se spoléhá na dojmy těch, kteří se na měření dívají, a na výsledky, které poskytuje, ale je užitečný jako rychlý způsob, jak test dimenzovat.
5. Vnitřní validita : Vnitřní validita se týká toho, jak dobře test stanoví jasný kauzální vztah mezi faktory. Pokud se pokoušíte změřit vliv úrovně příjmu na úroveň úzkosti subjektů, měření musí prokázat, že dominantní příčinou úzkosti je nízký příjem, a nikoli jiné faktory, jako jsou pracovní podmínky nebo faktory prostředí.
6. Externí validita : Externí validita se dívá na to, jak dobře lze výsledky testů zobecnit na jiné kontexty. Pokud je test příliš úzký a pracuje pouze s malým souborem dat, nebude mít v reálném světě moc velkou hodnotu, a proto nemá jako platné měřítko velké využití.
7. Konvergentní validita : Podkategorie konstruktové platnosti, konvergentní validita měří míru, do jaké teoreticky příbuzné konstrukty skutečně souvisí v praxi.
8. Diskriminační validita : Také podkategorie konstruktové validity, diskriminační validita měří míru, do jaké teoreticky nesouvisející konstrukty skutečně nesouvisí v praxi.
Spolehlivost vs. Validita: Jak jsou propojeny?
Zatímco spolehlivost a validita jsou příbuzné pojmy, měří různé věci. Test může být vysoce spolehlivý, ale není platný. Pokud například požádáte zaměstnance, aby vyplnili průzkum týkající se pracovní spokojenosti a získali stejné výsledky vícekrát, průzkum projde testem spolehlivosti. Pokud se však ve skutečnosti otázky týkají spíše obecné úrovně štěstí nebo pracovního výkonu než spokojenosti, průzkum není platný.
Na druhou stranu validita téměř vždy zahrnuje spolehlivost. Pokud něco testujete a získáváte výsledky, které přesně měří věci ve světě, budou také opakovatelné. Problémy s reprodukcí testu budou souviset s náhodnou chybou ve sběru dat nebo ze strany těch, kdo test provádějí, nikoli s testem samotným.