Mittausvirheiden huomioiminen tutkimuksissa tärkeää
Lähestyvien eduskuntavaalien alla julkaistaan monenlaisia kansalaisten mielipiteitä kuvaavia lukuja mm. puoluekannatuksesta ja vastaajien asenteista. Tietojen keräämiseksi ei ole mielekästä haastatella kaikkia kansalaisia, vaan päädytään tarkastelemaan pienempää osajoukkoa, jonka perusteella saadut tulokset pyritään yleistämään koskemaan koko perusjoukkoa. Osajoukon poimintatavalla ja asenteiden mittaustavalla voi olla suuri merkitys tulosten luotettavuuteen.
Välineitä tiedonkeruun haasteisiin tarjoaa tilastotiede. Kehittyneiden otantamenetelmien avulla voidaan nykyisin tiedonkeruusta johtuvia epävarmuuksia hallita yhä paremmin. Kyselytutkimuksessa (eng. survey) otantaepävarmuuden lisäksi on huomioitava mittauksesta johtuva epävarmuus. Jos tutkittava asia tai ilmiö tunnetaan hyvin, tiedetään mitä mitataan ja millä mitataan. Toisaalta tarkasteltava asia voi olla hyvinkin abstrakti, jolloin mitattava ilmiö ei ole helposti määriteltävissä, esimerkiksi asenteiden mittaamiseen ei ole suoraan välinettä.
Epätarkat mittaukset ja niistä johtuvat mittausvirheet ovat tutkimuksessa yleisiä. Jos mittauksen epävarmuus jätetään huomioimatta, voidaan päätyä harhaisiin tuloksiin ja näin ollen virhepäätelmiin. Tämä on yksi 27.3.2015 tarkastetun väitöstutkimukseni(Avautuu uuteen välilehteen) tulos.
Tutkin ja vertailin väitöskirjassani kolmen menetelmän toimivuutta mittausvirheiden oikaisemiseksi. Mittausvirheiden oikaisumenetelmien käytön edellytyksenä on, että mittausvirheestä on saatavilla lisätietoa. Tarkasteltavana on tilastollisen malli, jossa yksi tai useampi mallin selittäjä sisältää mittausvirhettä. Tavoitteena kaiken kaikkiaan on estimoida malli niin hyvin kuin mahdollista.
Tilastollisten menetelmien tarkasteluun voidaan käyttää simulointia. Simulointi on menetelmä, jolla pyritään jäljittelemään todellisuutta. Mittausvirheiden oikaisumenetelmien tarkastelun tapauksessa on muodostettu erilaisia koeasetelmia, joilla oikaisumenetelmien ominaisuuksia voidaan tarkastella.
Kahdessa ensimmäistä simulointikokeessa aineisto on muodostettu tilastollisella mallilla. Tämä mahdollistaa mittausvirheiden oikaisumenetelmien tilastollisten ominaisuuksien vertailun täysin kontroloidussa asetelmassa. Kolmannessa simulointikokeessa käytetään ECHP-aineistoa (European Community Household Panel). Menetelmien ‘’hyvyyden’’ vertailuun käytetään tilastollisia tunnuslukuja: ARB % (absolute relative bias percentages) ja RRMSE % (relative root mean-squared error percentages) lukuja. Simulointikokeista saatujen tulosten perusteella lisätietoa hyödyntävien oikaisumenetelmien käyttö parantaa tuloksia.
Maria Valaste
tutkija
etunimi.sukunimi@kela.fi
Lähde: Valaste, Maria. Adjustment for Covariate Measurement Errors in Complex Surveys: A Simulation Study of Three Competing Methods.(Avautuu uuteen välilehteen) Doctoral dissertation, University of Helsinki.