Message
- Tieteelliset Artikkelit
- 12-11-11
- Matti Vanhanen & Rauni Laulumaa
WAIS-R ja WAIS-III testistöjen vertailututkimus: normiongelma ja ratkaisuehdotus

Kun uusia versioita vakiintuneista älykkyyden arviointimenetelmistä otetaan käyttöön, on niiden luotettavuutta syytä tutkia. Tämä tulisi tehdä, jotta käyttäjät kykenisivät perustelemaan asiakkailleen testin perusteella tehdyt päätelmät. Vertasimme WAIS-R ja WAIS-III testistöjen älykkyysosamäärä (ÄO) arvioita 125 henkilön (18–64 vuotta) aineistossa. Koko aineistoa tutkittaessa ei havaittu tilastollisesti merkitseviä eroja versioiden välillä millään ÄO-asteikolla. Kun asiaa tutkittiin ikäryhmittäin havaittiin, että 18–24 vuotiaiden ikäryhmissä suoriutuminen WAIS-III:ssa oli parempaa kuin WAIS-R:ssä, mutta vanhemmissa ikäryhmissä asia oli päinvastoin. Tämän tutkimuksen mukaan WAIS-III antaa laskentatavasta riippuen noin 7–11 pistettä liian korkeita ÄO-pistemääriä 18–24 vuotiaiden ikäryhmissä kaikilla asteikoilla, vaikka testin kustantajan esittämä korjaus normitaulukoihin huomioidaan. Tutkimus tuo esille testien standardointiin liittyvän ongelman yleisemmällä tasolla. Muun muassa älyllisen tason arvioiminen testistön avulla perustuu ns. ”normaaliaineistoon” vertaamiseen, jonka oletetaan edustavan riittävän hyvin kyseisen kielialueen väestöä. Mikäli näin ei ole, ovat testin perusteella tehdyt arvioinnit vääristyneitä. Tämä herättää kysymyksen siitä, onko ylipäätään hyödyllistä julkaista uusia versioita älykkyysasteikoista ilman riittävän laajapohjaista standardointia.
Avainsanat: WAIS-III, WAIS-R, älykkyys, validiteetti
Johdanto
Älyllistä suoriutumista joudutaan arvioimaan monista syistä. Kouluttautumis- ja työkykyisyyttä sekä kuntoutumista arvioidaan mm. kognitiivista toimintaa ja älyllistä suoriutumista arvioivilla testisarjoilla. Myös oikeudelle annettavissa mielentilatutkimuksissa arvioidaan aina tutkitun henkilön älyllistä tasoa psykologisten testimenetelmien avulla. Kliininen psykologinen arviointi ei perustu yksinomaan testeihin perustuvaan tietoon, mutta luonnollisesti testimenetelmien asianmukainen toiminta helpottaa olennaisesti päätelmien tekemistä. Asianmukaisten menetelmien käyttöä suositellaan Suomen Psykologiliiton ammattieettisissä ohjeissa, mutta yksityiskohtaisia vaatimuksia menetelmien toimivuudesta ja tieteellisestä tasosta ei ole asetettu. Yleisellä tasolla oleva ohjeistus toisaalta sallii monenlaisten menetelmien käyttämisen, mutta se voi myös mahdollistaa liian subjektiivisten arviointien tekemisen. Koska psykologien tekemillä arvioinneilla voi olla suuriakin vaikutuksia tutkittujen henkilöiden tulevaisuuden kannalta, tulisi arviointien perustua mahdollisimman luotettavien menetelmien käyttöön. Pahimmassa tapauksessa virheellinen arviointi positiiviseen suuntaan johtaa yhteiskunnan tarjoaman tukipalvelun, etuuden, kuntoutuksen tai hoidon epäämiseen. Myös liian sairaaksi ja kognitiivisesti heikkotasoiseksi leimaamista voi tapahtua arviointimenetelmien puutteiden takia. Yksilön oikeusturva voi vaarantua, ja lisäksi yhteiskunnalle aiheutuu ylimääräisiä kustannuksia väärin perustein tehdyistä tukipäätöksistä.
Suomessa psykologien eniten käyttämä menetelmä aikuisten älyllisen suoriutumisen arviointiin on Wechslerin älykkyysasteikko, jonka ensimmäinen versio julkaistiin vuonna 1971 (Wechsler Adult Intelligence Scale, WAIS) (Wechsler, 1971), toinen 1992 (WAIS-R) (Wechsler, 1992) ja kolmas, nykyään käytössä oleva versio WAIS-III 2005 (Wechsler, 2005). WAIS-III älykkyysasteikkoa on edeltäjäänsä verrattuna muokattu paljon, se on uudelleen normitettu, uusia osioita on lisätty ja uusi nelifaktorimalli indeksipisteineen on otettu käyttöön. Käytännön psykologin työssä on syytä tietää, miten hyvin testin uudistettu versio vastaa edeltäjäänsä ja mitkä seikat mahdollisia eroja selittävät. Tämän vuoksi vertasimme WAIS-R ja WAIS-III -testistöjen antamia ÄO-arvioita ikä- ja älykkyysryhmittäin.
AINEISTO JA MENETELMÄT
Tutkittavina oli 125 18–64-vuotiasta suomenkielistä henkilöä (87 miestä, 38 naista), joiden älyllisen suoriutumisen taso vaihteli erittäin heikosta erittäin hyvään (WAIS-III ÄO vaihteluväli 46–138). Tutkimukseen kerättiin vapaaehtoisia osallistujia kolmesta lähteestä. Ensimmäisen ryhmän muodostivat Niuvanniemen sairaalaan mielentilatutkimukseen määrätyt henkilöt (n = 73). Toisen ryhmän muodostivat kuopiolaiset päiväkeskuksessa terapiatyössä käyvät kehitysvammahuollon asiakkaat (n = 16). Kolmas ryhmä koostui työssäkäyvistä terveistä vapaaehtoisista (n = 36). Esteenä osallistumiselle pidettiin jonkun Wechslerin älykkyysasteikon tekemistä vuoden sisällä tai useampaan kuin kahteen testaukseen osallistumista aiemmin. Tutkimukseen pyydettyjen kehitysvammahuollon asiakkaiden huoltajille kerrottiin tutkimuksesta. Kaikki tutkimukseen osallistuneet antoivat tietoon perustuvan kirjallisen suostumuksen tutkimuksen suorittamiseen ja tutkimukselle annettiin Kuopion yliopistollisen sairaalan tutkimuseettisen toimikunnan lupa. Kahdeksan tutkimukseen lupautunutta henkilöä joutui keskeyttämään tutkimuksen testauskertojen välillä tapahtuneen huomattavasti heikentyneen psyykkisen tilan takia.
Osallistujien keski-ikä oli 32,7 ± 12,7 vuotta ja keskimääräinen koulutus 11,8 ± 2,6 vuotta. 108 (86,4 %) osallistujista oli oikeakätisiä. Kahdellatoista (9,6 %) oli diagnosoitu lieväasteinen älyllinen kehitysvammaisuus ja kymmenellä (8 %) vanhan tautiluokituksen mukainen ”älyllinen heikkolahjaisuus”. Psykiatrisia diagnooseja oli vain mielentilatutkimukseen osallistuneilla henkilöillä; 41:llä (32,8 %) oli persoonallisuushäiriödiagnoosi ja 21:llä (16,8 %) psykoottistasoinen häiriö. Yleisimmät psykiatriset diagnoosit olivat antisosiaalinen tai epävakaa persoonallisuushäiriö tai jokin skitsofreniaryhmän psykoosi. Kaikki diagnoosit tehtiin kansainvälisen tautiluokituksen (ICD-10) mukaan (World Health Organization, 1992).
Tutkimushenkilöistä 47 (37,6 %) kertoi joskus osallistuneensa tutkimukseen, jossa oli käytetty jotakin Wechlserin älykkyystestin kaltaista testiä. Tutkimukseen osallistuneista 64 (51,2 %) suoritti ensin WAIS-R:n ja 61 (48,8 %) WAIS-III:n. Testin versiot esitettiin osallistujille tasapainotetussa järjestyksessä. Keskimääräinen aika testausten välillä oli 4,2 ± 6,0 päivää. Kaikkien osallistujien kokonais-, kielellinen ja suoritusasteikon ÄO laskettiin kummastakin testin versiosta. Samojen tehtävien toistamista pyrittiin välttämään oppimisvaikutuksen vähentämiseksi. Numerosarjat, kuutiotehtävä ja merkkikoe tehtiin yksinomaan WAIS-III:n materiaaleilla, koska kaikki WAIS-R:n tehtävät sisältyvät WAIS-III:n vastaaviin osioihin. Merkkikokeessa suoritus 90 sekunnin kohdalla kirjattiin ylös apulomaketta käyttäen. Edellä mainitut WAIS-III osioista saadut pistemäärät siirrettiin WAIS-R lomakkeelle ja pisteytettiin WAIS-R käsikirjan mukaisesti. Vaikka kuutiotehtävässä osioiden järjestyksessä on testiversioiden välillä pieniä eroja, katsottiin pisteiden kirjaamisen WAIS-III:sta kuitenkin olevan parempi ratkaisu kuin koko osion uudelleen esittäminen. Kuvien täydentäminen ja kuvasarjojen järjestäminen tehtiin kokonaisuudessaan molempien versioiden materiaaleilla.
Raakapisteiden muuttaminen asteikkopisteiksi tehdään eri tavoin kyseisissä WAIS-versioissa, eikä asteikkopisteiden suora vertaaminen siten ole mahdollista. WAIS-R:n raakapisteet muunnetaan asteikkopisteiksi käyttäen iällä korjaamattomia normeja kussakin osatehtävässä ja yhteenlasketut asteikkopisteet muutetaan ÄO-pisteiksi ikänormitettujen taulukkojen avulla. WAIS-III:n raakapisteet muutetaan sen sijaan suoraan ikäkorjatuiksi asteikkopisteiksi osatehtäväkohtaisesti, ja yhteenlasketut asteikkopisteet muunnetaan ÄO-pisteiksi käyttäen muunnostaulukoita, joissa puolestaan ei ole ikäkorjausta. (Wechsler, 1997).
Tutkittavat jaettiin kolmeen älykkyystasoryhmään WAIS-III kokonais-ÄO-pistemäärän perusteella. Ensimmäisen ryhmän (n = 18) muodosti ns. ”lieväasteisen kehitysvammaisuuden” ryhmä. Siihen otettiin mukaan henkilöt, joiden WAIS-III -ÄO oli 46–69 pistettä. Toiseen ryhmään (n = 12), ns. ”heikkolahjaisuuden ryhmään” otettiin henkilöt, joiden WAIS-III -ÄO vaihteli välillä 70–79. Kolmannen ryhmän (n = 95) muodostivat ”älyllisesti normaalit” henkilöt, joiden WAIS-III -ÄO oli 80 tai yli. Ryhmät muodostettiin näin koska em. rajoilla on merkitystä kliinisessä käytännössä, vaikka pisterajat sinänsä eivät ole riittäviä älyllisen toiminnan häiriön tai kehitysvammaisuuden diagnosoimiseksi. Aineisto oli liian pieni, jotta WAIS-III testikäsikirjan mukaista älykkyysluokitusta olisi voitu käyttää. Myös älykkyysjakauman yläpää oli edustettuna tutkimuksessa; WAIS-III -ÄO 121–130 (n = 11) ja WAIS-III -ÄO yli 131 (n = 4 ). Toisessa analyysissa tutkittavat jaettiin ikäryhmiin käsikirjoissa kuvatun ryhmittelyn mukaan (Wechsler, 1992; 2005), sillä poikkeuksella että 45–54-vuotiaiden (n = 13) ja 55–64-vuotiaiden (n = 12) ikäryhmät yhdistettiin ryhmien pienen koon takia.
Tilastoajot tehtiin SPSS ohjelmistolla. WAIS-R – WAIS-III ÄO-pistemääriä sekä niiden erotuksia verrattiin yksisuuntaisella varianssianalyysilla (ANOVA) ja kovarianssianalyysilla (ANCOVA). Ikäryhmittäisten erojen vertaamiseen käytettiin Scheffen post-hoc -testiä.
TULOKSET
WAIS-R ja WAIS-III testistöjen antamat ÄO-pistemäärät eivät poikenneet toisistaan koko aineistossa (n = 125). WAIS-R ja WAIS-III asteikkojen keskiarvot ja -hajonnat on sisällytetty taulukkoon 1. WAIS-R:n ja WAIS-III:n erotukset keskihajontoineen (WAIS-R – WAIS-III ± keskihajonta) olivat seuraavat: kokonaisasteikko 0.1 ± 7.2, kielellinen asteikko 0.1 ± 7.3 ja suoritusasteikko -0.5 ± 7.9.

Kun WAIS-R – WAIS-III (kokonaisasteikko) erotuksia tarkasteltiin ikä- ja älykkyystasoryhmittäin (kolme ryhmää), ikäryhmittäiset erotukset poikkesivat toisistaan tilastollisesti merkitsevästi F(5,124) = 30.2, p < .01, mutta älykkyystasoryhmittäin erotukset eivät poikenneet toisistaan F(2,124) = 0.7, p = .48.1 Yhteys WAIS-R – WAIS-III erotuksen ja ikäryhmän välillä säilyi tilastollisesti merkitsevänä kun testien esitysjärjestys, testin aiempi esittäminen ja psyykkinen sairaus oli vakioitu F(4,124) = 12.4, p < .01. Tilastollisesti merkitseviä yhdysvaikutuksia ikäryhmän ja esitysjärjestyksen, WAIS-testistön aiemman esittämisen tai psyykkisen sairauden välillä ei esiintynyt. Vastaavanlainen yhteys kuin kokonaisasteikolla, havaittiin myös sekä kielellisellä, F(4,124) = 6.9, p < .01 että suoritusasteikolla F(4,124) = 8.4, p < .01 kun edellä mainittujen sekoittavien tekijöiden vaikutus oli huomioitu. Kaikkien älykkyysasteikkojen (kielellinen, suoritus ja kokonaisasteikko) erotukset (WAIS-R – WAIS-III) 18–19-vuotiaiden ja 20–24-vuotiaiden ikäryhmissä. poikkesivat vanhempien ikäryhmien vastaavista erotuksista. Ikäryhmittäiset WAIS-R ja WAIS-III asteikkojen ÄO-pistemäärät on esitetty taulukossa 1 ja asteikkojen väliset erotukset taulukossa 2.
ÄO-pistemäärät WAIS-III asteikoille laskettiin myös käyttäen testin kustantajan esittämää 15–24-vuotiaiden korjattua muunnostaulukkoa (Psykologien Kustannus Oy, 2009). Yhdistetyssä ikäryhmässä (18–24-vuotiaat, n = 44) WAIS-R – WAIS-III erotukset olivat lähes samoja kuin korjaamatonta muunnostaulukkoa käytettäessä; kokonaisasteikko -7.1 ± 4.0, kielellinen asteikko -7.1 ± 4.7 ja suoritusasteikko -6.6 ± 6.1.

POHDINTA
Aineistoa kokonaisuutena tarkasteltaessa WAIS-R ja WAIS-III testiversioiden ÄO-pistemäärät eivät poikenneet toisistaan. Tämä poikkeaa Flynnin (1987; 2009) esittämästä näkemyksestä, jonka mukaan ÄO-pistemäärä kasvaa keskimäärin noin 0.3 pistettä vuodessa vakiintuneita älykkyystestejä käytettäessä. Tämän ns. Flynnin efektin on esitetty aiheutuvan älyllisen suoriutumisen kannalta edullisista muutoksista ympäristötekijöissä, mm. parantuneesta ruokavaliosta ja yleisestä terveydentilasta, pienemmistä perheistä, kehittävämmistä lasten kasvatustavoista ja koulutuksesta ja yleistyneestä visuaalisen median käytöstä (Neisser, 1998). Flynn (2009) esittää, ettei vanhoja normistoja tulisi ainakaan ilman korjausta käyttää. Testiversioiden julkaisemisen välinen aika on 13 vuotta, joten erotuksen pitäisi olla 3.9 pistettä WAIS-R:n hyväksi, kun testiversiot esitetään suurin piirtein samanaikaisesti.
Vastoin odotuksia testiversioiden välinen ÄO-pistemäärien erotus vaihteli iän mukaan. 18–19 ja 20–24-vuotiaiden ikäryhmissä suoriutuminen oli parempaa WAIS-III:ssä kuin WAIS-R:ssa, mutta vanhemmissa ikäryhmissä asia oli päinvastoin. 25–64-vuotiaiden ikäryhmissä uusitun testin mukaiset ÄO-pistemäärät olivat tämän tutkimuksen mukaan suhteellisen hyvin linjassa edeltävän version kanssa. Mikäli laskennallinen Flynnin efekti huomioidaan ja siihen lisätään havaittu erotus testiversioiden välillä (WAIS-R – WAIS-III), osoittaisi se WAIS-III testin antavan noin 11 pistettä (noin kolme neljäsosa keskihajontaa) korkeamman ÄO-pistemäärän kuin WAIS-R 18–24-vuotiaiden ikäryhmissä. Vaikka Flynnin efektiä ei huomioitaisi lainkaan, olisi WAIS-III testin mukainen kokonais- ÄO yli 7 pistettä (noin puoli keskihajontaa) liian korkea kyseisissä ikäryhmissä. Roivaisen (2010a) mukaan suomalaisten nuorten älykkyysosamäärät olivat 5–10 pistettä matalammat amerikkalaisilla normeilla laskettuna kuin amerikkalaisilla tai espanjalaisilla ikätovereilla, mikä tukee tämän tutkimuksen tulosta. Testin kustantajan verkkosivuillaan (Psykologien Kustannus Oy, 2009) esittämän korjauksen huomioiminen vaikutti hyvin vähän testiversioiden väliseen erotukseen, joten sen merkitys asian korjaamisen kannalta vaikuttaa riittämättömältä. Aiemmin tehdyissä ulkomaisissa WAIS-R ja WAIS-III -testistöjen vertailuissa ei ole raportoitu ikäriippuvaisia eroja versioiden välillä älykkyydeltään normaaleilla (Wechsler, 1997) tai älykkyystasoltaan keskimääräistä heikommilla henkilöillä (Fitzgerald ym., 2007). Tähän on vaikuttanut todennäköisesti suppea ikäjakauman kyseisissä tutkimusaineistoissa.
Flynnin efektillä tarkoitetaan siis pitkien ajanjaksojen kuluessa tapahtunutta testisuoriutumisen parantumista älykkyystesteissä (Flynn, 1987; 2009). Esimerkiksi jos nykyään käytetäisiin vuonna 1971 julkaistua WAIS -testistöä, olisi Flynnin (1987; 2009) mukaan keskimääräinen ÄO-pistemäärä noin 12 pistettä parempi kuin testistön julkaisun aikana. Flynnin efektin jatkuva lineaarinen eteneminen ei kuitenkaan ole varmaa. Kaksi suuriin aineistoihin perustuvaa pohjoismaista tutkimusta, Sundet ym. (2004) Norjassa ja Teasdale ym. (2005) Tanskassa, osoitti että Flynnin efekti voi olla pysähtynyt tai jopa kääntynyt päinvastaiseksi. Tämän aiheuttajaksi on esitetty vähentynyttä tottumusta tehdä kynä-paperi tehtäviä ja lievää koulutustason laskua (Teasdale ym., 2005). Älykkyystestien pistemäärissä havaittu kohoaminen testien vanhenemisen myötä on yleisesti tunnettua, mutta muutoksen aste on kiistanalainen asia. (Denkowski & Denkowski, 2007; Weiss, 2007). Mitenkään itsestäänselvyytenä Flynnin esittämää älykkyystestinormien 0.3 pisteen vuosittaista liukumaa ei siis voi Suomessa pitää pohjoismaisten esimerkkien valossa.
Miksi ÄO-pistemäärien erotus testiversioiden välillä ei ole sama kaikissa ikäryhmissä? Sekoittavat tekijät, kuten älykkyystaso (kolme tasoa), versioiden esitysjärjestys, Wechslerin älykkyystestin aiempi suorittaminen tai psyykkinen sairaus oli tilastollisesti vakioitu, joten niiden vaikutus asiaan on epätodennäköinen. On kuitenkin olemassa eräitä tekijöitä, jotka asiaa voisivat selittää. Normitaulukkojen peräkkäisten ikäryhmien ÄO-pisteiden muutokset ikäryhmästä seuraavaan voivat olla erilaisia eri testiversioissa ja ikäryhmissä (Braken, 1988). Esimerkiksi WAIS-R:n kokonaisasteikon standardipistemäärällä 150 saa 45–54-vuotiaiden ikäryhmässä ÄO:n 129 ja 55–56-vuotiaiden ikäryhmässä vastaavasti ÄO:n 140. Samalla standardipistemäärällä 22–24-vuotiaiden ikäryhmässä saa ÄO:n 122 ja seuraavassa 25–34-vuotiaiden ikäryhmässä 123, eli vain yhden pisteen enemmän. Jos muutokset ikäryhmästä seuraavaan siirryttäessä eivät ole yhtä suuria vertailtavissa testistöissä, vaikuttaa se ÄO-pistemäärien väliseen erotukseen eri ikäryhmissä. Erilainen raakapisteiden muunnostapa asteikkopisteistä standardipisteiksi (Wechsler, 1997) voi myös vaikuttaa ikäryhmittäiseen erotukseen ÄO-pistemäärissä. Tämän tutkimuksen tulosten yhtenä selittäjänä voidaan lisäksi pitää standardointitutkimuksen ongelmia.
Suomenkielisessä WAIS-III -käsikirjassa kerrotaan standardointitutkimukseen osallistuneiden sukupuoli, kätisyys, koulutustaso (peruskoulutus, jatkokoulutus) ja ammattiasema (työntekijä, alempi toimihenkilö, ylempi toimihenkilö) sekä asuinpaikan laatu (Helsingin seutukaava-alue, muu ”suurkaupunki”, muu kaupunki, maaseutu). Toisin kuin alkuperäisessä yhdysvaltalaisessa WAIS-III normiaineistossa (Wechsler, 1997), vertailua väestön demografisiin tietoihin ei ole kuvailtu suomenkielisessä WAIS-III:ssa. Tämän vuoksi on mahdotonta tietää miten hyvin WAIS-III:n normiaineisto edustaa suomenkielistä väestöä. Tieto normiaineiston ja suomenkielisen väestön koulutustason vastaavuudesta eri ikäryhmissä olisi olennaista testin tulkinnan kannalta. Suuri osa WAIS-III:n standardointitutkimuksen aineistosta on kerätty työvoimatoimistojen asiakkaista, mikä saattaa olla ongelma etenkin nuorimmissa ikäryhmissä, joissa yhteiskunnasta syrjäytyneiden osuus on todennäköisesti suurempi kuin saman ikäisessä väestössä keskimäärin. On tunnettu tosiasia, että koulutustaso korreloi voimakkaasti ÄO-pistemäärän kanssa (Wechsler, 1997; Longman ym., 2007). Maan todellisesta tilanteesta poikkeava normiaineiston koulutustaso johtaa vääristyneisiin älykkyystasoarviointeihin.
Yksi suomalaisen WAIS-III normiaineiston ongelma on sen koko (n = 511), joka on vain puolet edeltäneen WAIS-R:n (n = 1023) vastaavasta. Erityisen suuri ero normiaineistojen koossa on 18–24-vuotiaiden ikäryhmissä; WAIS-R (n = 308) vs. WAIS-III (n = 71). Myös alkuperäiseen yhdysvaltalaiseen normiaineistoon (n = 2450) verrattuna suomenkielisen normiaineisto on hyvin pieni, tosin maiden asukasluvutkin ovat aivan eri luokkaa. Teoreettisena mahdollisuutena voisi ajatella pienenkin otoksen edustavan riittävässä määrin jonkin alueen väestöä, mutta mitä pienemmästä otoksesta on kysymys, sen suuremmaksi muodostuu satunnaisvaihtelusta aiheutuvan virheen mahdollisuus. Ongelmallista on myös se, ettei tämän tyyppinen virhe tule käytännön psykologin työssä mitenkään näkyviin ellei asiaa nimenomaisesti tutkita.
Kuinka parantaa heikon normiaineiston käyttökelpoisuutta? Tämän tutkimuksen perusteella WAIS-III normiongelman korjaus edellyttää noin 7–11 ÄO-pisteen vähentämistä nuorimpien tutkittujen ikäryhmissä kullakin testin ÄO-asteikolla. Tämän jälkeen WAIS-R ja WAIS-III testien ÄO-arviot ovat suhteellisen hyvin linjassa toisiinsa nähden tutkituissa ikäryhmissä.
Yleisemmällä tasolla kaikkien normiaineistojen käyttökelpoisuutta parantaisi demografisten tietojen ilmoittaminen ikäryhmittäinen ja myös vastaavien tietojen ilmoittaminen maan suomenkielisen väestön osalta. Keskeistä olisi tietää ikäryhmittäinen koulutustaso ja ammattiasema. Tämän tiedon avulla pystyisi paremmin arvioimaan yksittäisen tutkittavan henkilön ja normiaineiston vastaavuutta. Iän lisäksi myös muilla demografisilla tekijöillä on havaittu olevan vaikutusta suoriutumiseen WAIS-III:n alkuperäisessä yhdysvaltalaisessa versiossa (Heaton, Taylor & Manly, 2003). Yhdysvaltalaiseen standardointiaineistoon perustuvassa analyysissä todettiin koulutustasolla ja etnisellä taustalla (afroamerikkalaiset vs. kaukaasialaiset) olevan selvä yhteys suoritustasoon. Pelkän ikäkorjauksen sisältävää standardointiaineistoa käytettäessä tulisi huomioida etnisten vähemmistöjen ja vähän koulutettujen heikompi suoriutumistaso, jotta voitaisiin välttää asiaankuulumaton poikkeavaksi tai heikentyneeksi leimaaminen (Heaton ym., 2003). Suomessa USA:n afroamerikkalaisia vastaavassa tilanteessa ovat lähinnä romanit. Vieraskielisten normiaineistojen käyttäminen voi tuntua kokeilemisen arvoiselta ajatukselta, mutta siihen liittyy merkittäviä riskejä. Jopa suoritusasteikon tehtävissä (tehtävissä jotka tehdään näönvaraisesti, kieltä käyttämättä) on havaittu huomattavaa maiden välistä vaihtelua testaukseen suhtautumisen takia (Roivainen, 2010b), joten niihin perustuvat arvioinnit ovat epäluotettavia.
Tämä tutkimus korostaa asianmukaisen normiaineiston merkitystä testien luotettavuuden kannalta. Testejä kehitettäessä olisi huolehdittava resurssien riittävyydestä. Mikäli kunnollisen standardointitutkimuksen tekeminen ei ole mahdollista, on hyöty uudistetun version käyttöönotosta kyseenalainen. Koska kaikki arvioinnit älyllisestä tasosta perustuvat vertailuun normiaineiston kanssa, vinoutuneet normiaineistot johtavat väistämättä vääristyneisiin arvioihin (Flynn, 2009). Tämän takia vanha testiversio ei ole välttämättä huonompi kuin uusi, ainakaan kaikissa ikäryhmissä. Testin kustantajan edustaja (Heiskari, 2010) on esittänyt hyvin ymmärrettäviä syitä standardoinnin vaikeudelle pienessä maassa. Viittaukset testiä käyttävän psykologin viimekätisestä vastuusta arviointimenetelmien toimivuudesta ovat kuitenkin epärealistisia. Käytännön työtä tekevillä psykologeilla ei ole mahdollisuuksia arvioida käyttämiensä menetelmien, esimerkiksi niiden standardoinnin, toimivuutta työnsä ohessa. Yksittäisellä psykologilla on luonnollisesti vastuu siitä, että hän käyttää tutkittuja menetelmiä asianmukaisesti, ts. tekee esimerkiksi tietyn ikäiseen suomenkieliseen väestöön standardoidusta testistä johtopäätöksiä vain kyseiseen ryhmään kuuluville henkilöille. Mikäli ryhmään kuulumattomia arvioidaan, on tuloksia pidettävä lähinnä suuntaa antavina. Psykologeilla ammattikuntana ja yksittäisinä ammattilaisina on velvollisuus huolehtia siitä, että käytetyt arviointimenetelmät toimivat asianmukaisesti (American Psychological Association Ethics Code 2002: standard 9.01). Virhelähteitä sisältävien menetelmien käyttäminen voi johtaa vääriin johtopäätöksiin ja heikentää asiakkaiden oikeusturvaa.
1 Ns. ”lievän kehitysvammaisuuden” ryhmässä oli pääasiassa vain 25–54-vuotiaita henkilöitä, jonka vuoksi vertailu muihin älykkyystasoryhmiin tehtiin vain 25–54-vuotiaiden osalta. WAIS-III kokonaispistemäärät ja WAIS-R – WAIS-III erotukset (suluissa) olivat seuraavat: ÄO alle 70: 58.3 ± 7.4 ( 4.3 ± 4.2), ÄO 70 -79: 75.8 ± 2.6 (4.7 ± 4.9), ÄO 80 tai yli: 104.2 ± 14.0 (3.0 ± 3.5); erotukset eivät poikkea toisistaan ANOVA; p = ns.
Kiitokset
Tämän tutkimuksen tekemiseen on saatu rahoitusta Niuvanniemen sairaalan EVO -rahoituksesta (Sosiaali- ja terveysministeriö). Kirjoittaja haluaa kiittää seuraavia henkilöitä, jotka ovat avustaneet tutkimuksen eteenpäin saattamisessa: Pekka Heiskari, Pirkko Peltokorpi, Raili Miettinen, Antti Kauppi, Heli Määttä, Riitta Kuokkanen, Johanna Väänänen, Sari Komonen, Ville Matti Jokinen, Teija Rissanen, Timo Hokkanen, Marko Kontkanen, Merja Niiranen, Tarja Koskela, Aija Räsänen, Tuomo Hänninen.
Artikkeli on saapunut toimitukseen 9.2.2011 ja hyväksytty julkaistavaksi 13.9.2011.
Lähteet
American Psychological Association (2002). Ethical principles of psychologists and code of conduct. American Psychologist, 57, 1060–1073.
Bracken, B.A. (1988). Ten psychometric reasons why similar tests produce dissimilar results. Journal of School Psychology, 26, 155–166.
Denkowski, G.C., Denkowski, K.M. (2007). WAIS-III IQs of criminal defendants with a mental retardation claim should not be reduced for the “Flynn effect”. American Journal of Forensic Psychology, 25, 41–63.
Fitzgerald, S., Gray, N.S. & Snowden, R.J. (2007). A comparison of WAIS-R and WAIS-III in the lower IQ-range: Implications for learning disability diagnosis. Journal of Applied Research in Intellectual Disabilities, 20, 323–330.
Flynn, J.R. (1987). Massive IQ gains in 14 nations: What IQ tests really measure. Psychological Bulletin 101, 171–191.
Flynn, J.R. (2009). The WAIS-III and WAIS-IV: Daubert Motions Favour the Certainly False over the Approximately True. Applied Neuropsychology, 16, 98–104.
Heaton R.K., Taylor M.J. & Manly J. (2003). Demographic effects and use of demographically corrected norms with the WAIS-III and WMS-III. Teoksessa Tulsky D.S., Saklofske D.H., Chelune G.J., Heaton R.K., Ivnik R.J., Bornstein R., Prifitera A., Ledbetter M.F. (toim.), Clinical interpretation of the WAIS-III and WMS-III (s. 181–210). San Diego, CA: Academic Press.
Heiskari, P. (2010). Kommentti Eka Roivaisen artikkeliin suomalaisten WAIS-III normien arvioinnista. Psykologia 45, 90–92.
Longman, R.S., Saklofske D.H., Fung T.S. (2007). WAIS-III Percentile Scores by Education and Sex for U.S. and Canadian populations. Assessment, 14, 426–432.
Neisser,U. (toim.) (1998). The rising curve. Long term gains in IQ and related measures (s. 183–206). Washington, DC: American Psychological Association.
Psykologien Kustannus (2009). Korjaus WAIS-III käsikirjaan. www.psykologienkustannus.fi. Psykologien Kustannus Oy.
Roivainen, E. (2010a). Suomalaisten WAIS-III normien arviointia. Psykologia 45, 86–89.
Roivainen, E. (2010b). European and American WAIS-III norms: Cross-national differences in performance subtests. Intelligence 38, 187–192. doi:10.1016/j.intell.2009.10.001
Sundet J.M., Barlaug D.G., Torjussen T.M. (2004). The end of the Flynn effect? A study of secular trends in mean intelligence test scores of Norwegian conscripts during a half century. Intelligence, 32, 349–362.
Teasdale T.W. & Owen D.R. (2005). A long term rise and recent decline in intelligence test performance: The Flynn effect reverse. Personality and Individual Differences 39, 837–843.
Wechsler, D. (1971). Wechslerin aikuisten älykkyysasteikko, käsikirja. Helsinki: Psykologien Kustannus Oy.
Wechsler, D. (1992). WAIS-R: Wechslerin aikuisten älykkyysasteikko. Helsinki: Psykologien Kustannus Oy.
Wechsler, D. (1997). Technical Manual for the Wechsler Intelligence Scale, 3rd ed. San Antonio, TX: The Psychological Corporation.
Wechsler, D. (2005). WAIS-III –käsikirja. Helsinki: Psykologien Kustannus Oy.
Weiss L. (2007). Technical report: response to Flynn. San Antonio TX, Harcourt Assessment, Inc.
World Health Organization. (1992). International Classification of Diseases and Health Related Problems (ICD-10) (10. painos). Geneva, Switzerland: Author.


