Message

06-11-kes1.jpg

Psykologia-lehti julkaisi edellisessä numerossa Matti Vanhasen ja Rauni Laulumaan Wechslerin testistöjen WAIS-R:n ja WAIS-III:n vertailututkimuksen, jossa he käsittelivät normiongelmaa ja esittivät ratkaisuehdotuksen. Aihe on erityisen ajankohtainen, koska WAIS-IV:n normiaineiston keruu ja menetelmän sopeuttaminen Suomen olosuhteisiin ovat parhaillaan käynnissä. Wechslerin testien uudistaminen on välttämätöntä, jotta testeillä arvioitavat ominaisuudet perustuvat uusimpaan tutkimustietoon ihmisen kognitiivisista toiminnoista ja diagnostiikasta. Testien rakenteelliset muutokset näkyvät uusina indekseinä, osatesteinä ja testiosioina. Rakenteeltaan erilaiset testiversiot eivät välttämättä ole vertailukelpoisia, edes perinteisen normituksen jälkeen (Kolen & Brennan, 2004). Testistöön on WAIS-III versiosta alkaen lisätty osatestejä, joilla arvioidaan joustavaa päättelykykyä (engl. fluid reasoning), työmuistia ja prosessointinopeutta. Nämä muutokset rakenteissa tekevät mahdolliseksi kognitiivisen kyvykkyyden eri osa-alueiden monipuolisen arvioinnin ja siten lisäävät menetelmän luotettavuutta niin psykometristen ominaisuuksien osalta kuin käytännön arviointityössä.

06-11-kes1-t1.jpg

TAULUKKO 1. Jatkokoulutuksen prosenttiosuudet WAIS-III normiaineistossa ja suomalaisessa väestössä vuonna 2004.

Vanhanen ja Laulumaa esittävät artikkelissaan kysymyksen siitä, onko hyödyllistä julkaista uusia versioita kognitiivisista testistöistä ilman riittävän laajapohjaista standardointia. Mikä sitten on riittävä standardointi? Suomessa WAIS:n normiaineistot ovat olleet varsin suuria (WAIS-R, n = 1023 ja WAIS-III, n = 511) suhteutettuna Suomen asukaslukuun ja muihin demograafisiin tietoihin verrattuna, esimerkiksi yhdysvaltalaisiin versioihin (WAIS-R, n = 1880, WAIS-III, n = 2450). Toisaalta Ruotsissa ja Tanskassa WAIS-III:een ei ole laadittu lainkaan maakohtaisia normeja. Kun normiaineistoa ei kerätä lainkaan vaan käytetään toisen maan normeja tai estimoituja arvoja, on todennäköistä, että saadaan jopa visuaalisissa osatesteissäkin kulttuurista riippuvia tuloksia, jotka poikkeavat toisen maan normeista (Roivainen, 2010).

Yksi WAIS-III:n normiaineiston kritiikin aihe on ollut nuorimpien ikäryhmien pieni otoskoko. Otoksen koko sinällään ei kuitenkaan takaa onnistunutta normitusta vaan keskeisintä on otoksen edustavuus suhteessa normaaliväestöön. Koska WAIS-III:n normiaineistoon kuuluvat ovat olleet pääosin työvoimatoimistojen asiakkaita, on esiin nostettu myös epäily siitä, että erityisesti nuorten ryhmässä olisi enemmän ”syrjäytyneitä” kuin valtaväestössä. Nuoret oli valittu WAIS-III otokseen samoilla perusteilla kuin WAIS-R:n normituksessa (Heiskari, 2010). Koska koulutustaso on merkittävin tekijä, joka vaikuttaa erityisesti kielellisten osatestien tuloksiin (Kaufman, 2000; 2001), verrattiin WAIS-III:n normiaineiston koulutustasoa väestön vastaavaan vuonna 2004. Kun WAIS-III:n normiaineiston koulutustasoa tarkastellaan ikäryhmittäin Tilastokeskuksesta saatuun suomenkielisen väestön vastaavaan koulutustasoon normienkeruun aikana (Taulukko 1), havaitaan että suomalaisten koulutusjakauma oli varsin lähellä WAIS-III:n eri ikäryhmien koulutusjakaumaa.

WAIS-III:n normiaineistossa 18–19-vuotiaista oli 22,2 prosenttia lukion suorittaneita, kun osuus koko väestössä oli 21,7 prosenttia. Jatkokoulutuksen osalta normiaineistossa oli vähemmän ammattikoulun tai opistoasteen koulutuksen suorittaneita (3,7 %) kuin suomalaisessa väestössä (11,3 %) keskimäärin. Keskiasteen koulutuksen osalta 18–19-vuotiaiden osalta normiotos ei edustanut täysin suomenkielistä väestöä, mutta lukiokoulutuksen suorittaneiden osuuden perusteella ei voi tehdä päätelmää, että normiaineistoon olisi tästä ikäluokasta valikoitunut enemmän ”syrjäytyneitä” kuin väestössä keskimäärin.

Toiseksi nuorimpien, 20–24-vuotiaiden, ikäryhmässä WAIS-III:n normiaineistoon oli valikoitunut koulutetumpia tutkittavia kuin väestössä keskimäärin. Normiaineistossa oli keskiasteen tutkinnon suorittaneita 52,2 ja 11,4 prosenttia korkea-asteen tutkinnon suorittaneita, kun vastaavat osuudet suomenkielisessä väestössä keskimäärin olivat 33,9 ja 4 prosenttia. Näyttääkin siltä, että myöskään 20–24-vuotiaiden normiaineistoon ei ole valikoitunut väestöön suhteutettuna heikommin koulutettua otosta. Normiaineistossa vähemmän koulutetut kuin väestössä keskimäärin löytyivät 25–34-vuotiaiden ja 35–44-vuotiaiden ikäryhmistä. Vanhimmat ikäryhmät olivat saaneet enemmän keski- ja korkea-asteen koulutusta kuin väestö keskimäärin. Normiaineiston koulutustaso ei havaintomme mukaan selitä Vanhasen ja Laulumaan raportoimaa eroa nuorempien ikäryhmien testituloksissa WAIS-III:n hyväksi verrattuna WAIS-R:n tulokseen. Koska tutkijoiden raportoimat ikäryhmät olivat erittäin pieniä ja sisälsivät tutkittavia erityisryhmistä, saattoi näillä tekijöillä olla myös vaikutusta heidän saamaansa tulokseen.

Edellä esitetyn tarkastelun rajoituksena on, että peruskoulutuksen osalta ei tähän kirjoitukseen ehditty saada Tilastokeskuksesta tietoja, joissa olisi ollut peruskoulutustiedot eroteltuina myös jatkokoulutukseen osallistuneilta. Edellä verrataan ainoastaan 18–19-vuotiaiden lukiokoulutuksen suorittaneiden suomenkielisten osuutta normiaineistoon. Vaikka WAIS-III:n otosta voidaan otoskoon pienuudesta huolimatta pitää keskeisimpien taustatekijöiden suhteen suhteellisen edustavana, ei mahdollisia muita yleistettävyyttä haittaavia väliin tulevia tekijöitä voida luonnollisesti täysin sulkea pois.

Vanhasen ja Laulumaan havaitsema nuorimpien ikäluokkien parempi suoritustaso WAIS-III:ssa verrattuna WAIS-R:n tuloksiin on vastaava kuin Kaufmanin (2001) tulos yhdysvaltalaisissa normiaineistoissa. Erotus kokonaisälykkyysosamäärän osalta on 18–19-vuotiaiden aineistossa 98,6:sta (WAIS-R) 109,3:een (WAIS-III) eli 10,7 pistettä. Kaufmanin (1983; 2000; 2001) mukaan yhdysvaltalaisen WAIS-R:n tulokset 16–17- ja 18–19-vuotiaiden normiotoksissa ovat liian heikot, koska otosten välillä ei tapahdu tulosten paranemista, vaikka koulutustaso paranee jälkimmäisessä ikäryhmässä. Koska WAIS-III:ssa ei käytetä ikäryhmäkohtaista kokonaisälykkyysosamäärän muunnostaulukkoa, poimimme suomalaisesta normiaineistosta 18–19- ja 20–24-vuotiaiden ikäryhmien tulokset erikseen. Kuten yhdysvaltalaisessakin aineistossa, tulokset näissä ikäryhmissä ovat hieman koko normiaineiston keskiarvoa paremmat (Suomi 102,1 ± 3,5 (Yhdysvallat 109,3) ja Suomi 103,0 ± 2,8 (Yhdysvallat 108,5).

Yksi selitys nuorten ikäryhmien parempiin suorituksiin WAIS-III:ssa voi liittyä muutoksiin testin rakenteessa. Testistön rakennetta on muutettu Cattell-Horn-Carrollin (CHC)-teorian mukaisesti, niin että WAIS-III:een on lisätty muun muassa matriisipäättelytehtävä, jossa koulussa opitulla aineksella tai kokemuksella on vähemmän vaikutusta. Suoritus joustavan päättelyn tehtävissä on parhaimmillaan noin 20-vuotiaana, mistä suoritus heikkenee iän myötä. Sitä vastoin koulutuksen ja kokemuksen myötä suoritukset kielellisissä kiteytynyttä tietämystä arvioivissa tehtävissä paranevat aina noin 50–60 ikävuoteen saakka. Roivasen (2010) mukaan eurooppalaiset saavat merkittävästi paremmat tulokset havainnon organisointia arvioivissa tehtävissä kuin amerikkalaiset. Vanhasen ja Laulumaan tuloksissa nuorimman ikäluokan suoritusosan tulokset ovat selkeästi parempia kuin vanhempien ikäluokkien, mikä nostaa myös nuorimman ikäryhmän kokonaisälykkyysosamäärää. Testin rakenteen muutoksilla saattaa siis olla valikoivia vaikutuksia eri ikäryhmiin. Eri versioiden pistemäärien korjaaminen tietyn pistemäärän suoralla lisäyksellä tai vähennyksellä voi olla yksilötutkimuksessa ongelmallista, koska eri testiversioiden pistemäärien ikäryhmäkohtaiset jakaumat saattavat poiketa toisistaan. Tällöin suora lineaarinen muunnos ei eri versioiden vertailun ongelmaa ratkaise.

Nyt Suomessa normienkeruuvaiheessa olevassa WAIS-IV:ssa (Wechsler, 2008) on pyritty entistä paremmin huomiomaan normiaineiston edustavuus suhteessa suomalaiseen väestöön, ja sen raportointiin kiinnitetään erityistä huomiota. Normiaineistoa kerätään viidellä paikkakunnalla perustuen normaaliväestöstä tehtyyn otantaan sukupuolen, iän ja koulutuksen mukaan. Uuden version suomalaisessa normituksessa pyritään siis noudattamaan korkeampia standardeja verrattuna esimerkiksi WAIS-IV:n pohjoismaiseen normiaineistoon. Pohjoismaiset normit on kerätty siten, että kustakin Pohjoismaasta on tehty noin 260 henkilön väestöpohjainen otanta sukupuolen, iän ja koulutustason mukaan. Muissa Pohjoismaissa aineisto on kerätty ainoastaan kunkin maan pääkaupungista.

Lisäksi uudistetussa versiossa on huomattavasti suurempia muutoksia testin rakenteessa verrattuna aikaisempiin versioihin, esimerkiksi visuaalisen päättelyn osatehtävät ovat kuutiotehtäviä lukuun ottamatta muuttuneet täysin. Pisteityksen osalta keskeisin muutos uudessa versiossa on se, että kielellisen ja suoritusosan laskemisesta on luovuttu. Uuden version osatestien tulokset muodostavat neljä tulkinnallista indeksiä: kielellisen ymmärtämisen, visuaalisen päättelyn, työmuistin ja prosessointinopeuden. Kokonaisälykkyysosamäärän laskeminen WAIS-IV:ssä perustuu siis teoreettisesti hyvin erilaisiin lähtökohtiin ja konkreettisesti eri osatestien tuloksiin kuin esimerkiksi WAIS-R:n kokonaisosamäärä. Uudistetun WAIS-IV:n ja testin aikaisempien versioiden vertailu ei tule olemaan suoraviivaista, sillä eri versiot eivät ole yhteismitalliset.

Lopuksi

Wecslerin testistöjen uusien versioiden tuominen Suomeen on välttämätöntä, jotta psykologit voivat käyttää ajanmukaisia ja uusimpiin tutkimustuloksiin perustuvia menetelmiä. Vanhoilla testiversioilla saatavat tulokset eivät ole suoraan verrattavissa uusien tuloksiin, koska testien rakenteet eli siis se, mitä niillä arvioidaan, muuttuvat. Uusien versioiden kehittämisen ja normittamisen keskeisin anti ei siis ole ainoastaan Flynn-efektin huomioiminen, joka ei välttämättä edes ole Pohjoismaissa ratkaisevassa asemassa testipistemäärien muutoksissa (Sundet ym., 2004; Teasdale ym., 2005).

Wechslerin testit on normitettu ensisijaisesti antamaan vertailukohta ns. normaaliväestön tuloksiin verrattuna. Testistön normiaineistossa ainoastaan 2,28 prosenttia sijoittuu älykkyysosamäärän 70 alapuolelle ja 0,13 prosenttia sijoittuu 55:n alapuolelle. Normiaineistoa kerättäessä käytetään myös poissulkukriteereitä, joihin sisältyvät kognitiivisiin toimintoihin vaikuttavat lääkitykset, raskaat hoitotoimenpiteet ja useat diagnosoidut sairaudet, oppimisvaikeudet tai mielenterveyden häiriöt (Wechsler, 2008), joten esimerkiksi kehitysvammadiagnoosien arvioinneissa tarvitaan Wechslerin testien lisäksi myös muita arviointimenetelmiä.

Vanhanen ja Laulumaa ovat keränneet tutkimukseensa kaksi erityisryhmää: kehitysvammaiset ja mielentilatutkimukseen määrätyt henkilöt, joista useilla oli psykiatrisia diagnooseja sekä pienen ryhmän työssäkäyviä vapaaehtoisia. Olisikin kiinnostavaa, jos tutkijat olisivat raportoineet tulokset erityisryhmistä erikseen, jolloin tulokset palvelisivat kyseessä olevien erityisryhmien arviointeja tekevien psykologien työtä. Tällaisten erityisryhmien keräämiseen ei yleensä ole mahdollisuutta testien eri maiden versioiden normituksessa. Uuden WAIS-IV:n yhdysvaltalaisen alkuperäisversion normitutkimuksen yhteydessä on tehty vastaavanlaisia luotettavuustutkimuksia, joissa uutta testiversiota oli vertailtu WAIS-III:n tuloksiin myös erityisryhmissä. Esimerkiksi lieväasteisesti kehitysvammaisten ryhmässä (n = 25) WAIS-IV:n tulokset olivat työmuisti-indeksiä lukuunottamatta heikommat kuin edellisellä versiolla saadut tulokset.

Testien validiteettitutkimusta tarvitaan lisää Suomessa myös erityisryhmien osalta. Alkuperäisten kognitiivisten testistöjen sopeuttamisessa muihin maihin ei vaadita erityisryhmien tarkastelua, koska testin julkaiseminen viivästyisi kohtuuttomasti ja joka tapauksessa täytyisi tehdä valintaa ja arvioida, mitä eritysryhmiä tutkitaan ja mistä saadaan heistä edustava otos. Erityisryhmien tarkastelun osalta onkin tärkeää hyödyntää yhteistyömahdollisuuksia tutkimuksissa ja menetelmien kehittämisessä.

Lähteet

Heiskari, P (2010). Kommentti Eka Roivaisen artikkeliin suomalaisten WAIS-III normien arvioinnista. Psykologia, 45, 90–92.

Kaufman, A. S. (1983). Test review: Wechsler, D. manual for the Wechsler Adult Intelligence Scale, Revised. New York: psychological Corporation, 1981. Journal of Psychoeducational Assessment, 1, 209–319.

Kaufman, A. S. (2000). Seven questions about the WAIS-III regarding differences in abilities across the 16 to 89 year life span. School Psychology Quarterly, 15, 3–29.

Kaufman, A. S. (2001). WAIS-III IQs, Horn’s theory, and generational changes from young adulthood to old age. Intelligence, 29, 131–167.

Kolen, M. & Brennan, R. (2004). Test equating, scaling, and linking: methods and practices. New York: Springer.

Roivainen, E. (2010). European and American WAIS III norms: Cross-national differences in performance subtest scores. Intelligence, 38, 187–192.

Sundet, J. M., Barlaug, D. G. & Torjussen, T. M. (2004). The end of the Flynn effect? A study of secular trends in mean intelligence test scores of Norwegian conscripts during a half century. Intelligence, 32, 349–362.

Teasdale, T. W. & Owen, D. R. (2005). A long-term rise and recent decline in intelligence test performance: The Flynn effect reverse. Personality and Individual Differences, 39, 837–843.

Wechsler, D. (2008). WAIS-IV: technical and interpretive manual. San Antonio: NCS Pearson.