9  Merkitsevyysluvut

Tässä luvussa käydään läpi merkitsevyyslukujen määritelmät, käyttö ja toteuttaminen Excelissä.

Merkitsevyysluvut kertovat jotain mittarin luotettavuudesta. Kuinka paljon me luotamme siihen, että mitattu arvo ei ole syntynyt satunnaisen vaihtelun vuoksi, vaan edustaa todellista eroa populaatiossa?

Merkitsevyyslukuja, joita tässä kirjassa käydään läpi ovat: keskiarvon keskivirhe, Z-arvo, luottamusväli ja virhemarginaali. P-arvon voi myös laskea merkitsevyysluvuksi, mutta se edustaa todennäköisyyttä aina tietyssä kontekstissa. Täten sen läpikäyminen sopii paremmin hypoteesitestauksen yhteyteen (ks. Luku 5).

Eksakti vai asymptoottinen: Miksi p-arvoni on hieman väärässä?

Kun käsittelemme otantoja, teemme usein approksimaatioita eli lähestymisiä. Todennäköisyyslaskennan kannalta asia on erittäin olennainen, ja voi helposti vaikuttaa mm. todennäköisyysarvojen \(p\) laskentaan.

Todennäköisyysarvon laskenta voi olla eksakti tai asymptoottinen. Eksaktissa laskennassa p-arvo lasketaan tarkalleen kaikesta datasta. Suurissa datamäärissä tämä voi olla hyvin työlästä (joskin modernit tietokoneet pärjäävät yleensä ihan hyvin), joten sivulle on kehitetty asymptoottiset todennäköisyysarvot. Asymptoottiset arvot lähestyvät todellista arvoa suurissa otoksissa.

Eksakti ja asymptoottinen p-arvo voi suurissa otoksissa olla hyvinkin samankokoisia, mutta erot korostuvat pienemmissä otoksissa. Tämän takia voit nähdä hieman eri todennäköisyysarvoja riippuen siitä, mitä menetelmää mikäkin sovellus käyttää. SPSS-sovellus on selkeä valintojensa kanssa - Excel ei niinkään.

9.1 Keskiarvon keskivirhe

Keskiarvon keskivirhe (engl. standard error of the mean), tai vain keskivirhe1, on osittaisesti merkitsevyysmitta. Keskivirhe estimoi kuinka hyvin otoksen keskiarvo edustaa todellista populaation keskiarvoa. Keskivirhe ilmaistaan useimmiten kirjaimilla \(SE\) (englannin nimestä), mutta vaihtoehtoisesti voi myös käyttää matemaattisia symboleja \(\hat{\sigma}_x^{-}\) tai \(s_x^{-}\) . Keskivirhe lasketaan jakamalla keskihajonta datamäärän neliöjuurella:

1 Keskivirhe voidaan laskea mille tahansa estimoidulle parametrille.

\[ \text{SE} = \frac{s}{\sqrt{N}} \tag{9.1}\]

Jos otos on tarpeeksi iso, keskivirhe edustaa suhteellisen luotettavasti keskiarvon edustavuuden laatua otoksessa. Mitä isompi keskivirhe, sitä huonommin otoksen keskiarvo edustaa populaation keskiarvoa. Voidaan sanoa, että keskivirhe edustaa mitatun keskiarvon etäisyyttä todellisesta keskiarvosta.

Keskivirhettä voidaan käyttää mm. luottamusvälin laskemiseen.

Aikasemmassa luvussa (Luku 8) käytettiin esimerkkinä datajakaumaa \([1, 2, 3, 4, 5]\). Sille laskettiin keskiarvo sekä hajontaluvut seuraavasti:

  • \(\bar{x} = 3\)

  • \(\text{min} = 1\), \(\text{max} = 5\)

  • \(\text{range} = 4\)

  • \(SS = 10\)

  • \(s^2 = 2.5\)

  • \(s \approx 1.58\)

Näiden lukujen pohjalta datajakauman keskiarvon keskivirhe olisi \(SE = \frac{1.58}{\sqrt{5}} \approx 0.71\). Koska datapisteitä on vain viisi, keskivirhe ei kuitenkaan ole hirveän luotettava mittari tässä tilanteessa; sen on osoitettu aliarvioivan todellista virhemittausta pienissä otoksissa.

Funktiot Excelissä:

Excelissä ei ole sisäänrakennettua keskivirheen laskufunktiota. Voit kuitenkin laskea sen seuraavasti:

  • VAR.S(alue) / NELIÖJUURI(datamäärä)

Datamäärän voit hakea käsin tai käyttäen LASKE.A-funktiota (ks. Alaluku 19.7.1.1).

9.2 Z-arvo

Z-arvo on tietyn datapisteen standardisoitu arvo. Jos kyseinen arvo on peräisin normaalijakautuneesta mittarista, Z-arvoa voidaan käyttää merkitsevyysmittarina.

Z-arvo mitataan samalla asteikolla kuin normaalijakauma: Z-arvo \(0\) edustaa normaalijakauman keskipistettä, positiiviset arvot edustavat datapisteitä normaalijakauman oikealla puolella ja negatiiviset jakauman vasemmalla puolella.

Z-arvo lasketaan jakamalla datapisteen ja keskiarvon ero datajakauman keskihajonnalla:

\[ Z = \frac{x_i - \bar{x}}{s} = \frac{x_i - \bar{x}}{\sqrt{s^2}} \tag{9.2}\]

Jatketaan aikaisemmalla esimerkkijakaumalla. Z-arvo voidaan laskea jokaiselle datapisteelle erikseen. Ensimmäisen datapisteen Z-arvo olisi tällöin \(Z = (1-3)/1.85 \approx -1.1\). Kaikki datapisteet saavat järjestyksessä Z-arvon: \([-1.1, -0.5, 0, 0.5, 1.1]\). Voit kokeilla laskea nämä itse, tai vain luottaa minuun.

Z-arvon yksikkö ilmaistaan keskihajonnoissa: yllä olevan esimerkin ensimmäisen arvon Z-arvo on -1.1 keskihajontaa, eli se on noin yhden keskihajonnan verran alle keskiarvon.

Voimme hyödyntää normaalijakauman muotoa tulkinnassa: normaalijakaumassa 95 prosenttia kaikesta datasta jää arvon \(\pm 1.96\) sisälle; 99 prosenttia datasta on arvon \(\pm 2.58\) sisällä, ja vain yksi promille (99,9 %) datasta on arvon \(\pm 3.29\) ulkopuolella. Koska arvomme \(1\) Z-arvo on alle \(\pm 1.96\), sen (tai isomman) todennäköisyys (jos ottaisimme ääretön määrä otantoja populaatiosta) on suht iso esiintyä. Jos tämä johtopäätös jää epäselväksi, lue Luku 5 tarkasti uudelleen!

Funktiot Excelissä:

  • NORMITA(x; keskiarvo; keskihajonta)

    • Syötä funktiolle arvon jonka haluat kääntää z-arvoksi x, keskiarvon sekä keskihajonnan.

Funktiot: Alaluku 19.7.2.7.

9.3 Luottamusväli

Luottamusväli (engl. confidence interval) on yleisesti käytetty merkitsevyysmitta, joka ilmaistaan väliestimaattina (kaksi arvoa) piste-estimaatin (yksi arvo) sijaan. Tulkinta on monimutkainen - jatka lukemista!

Luottamusväli ilmaistaan kirjaimilla \(\text{CI}\), jotka tulevat englanninkielisestä nimestä. Sen lisäksi luottamusvälille ilmaistaan myös luottamustaso \(1-p\) prosenteissa. Esimerkiksi \(p = 0.05\) (5 prosenttia), jolloin luottamusväli ilmaistaisiin \(95 \% \text{ CI}\).

Luottamusvälille löytyy kaksi laskentatapaa, yleiselle otannalle sekä pienelle otannalle. Yleinen kaava on:

\[ \text{CI}_p = \bar{x} \pm (z_{\frac{1-p}{2}} \times \text{SE}) \tag{9.3}\]

ja pienen otannan kaava on:

\[ \text{CI}_p = \bar{x} \pm (t_{n-1} \times \text{SE}) \tag{9.4}\]

Molemmissa tilanteissa laskukaava tuottaa kaksi arvoa: ylemmän ja alemman luottamusvälin rajan.

Yleiselle luottamusvälille tarvitaan jokin luottamustaso, jolle haetaan kaksisuuntainen z-arvo. Luottamusvälin voi laskea mille tahansa luottamustasolle, mutta yleisimmät tasot ovat 95 prosenttia, 99 prosenttia sekä 99,9 prosenttia. Näiden z-arvot ovat \(1.96\), \(2.58\) ja \(3.29\) (ks. Alaluku 9.2). Korvaa siis \(z_{ \frac{1-p}{2} }\) yllä olevassa kaavassa (Yhtälö 9.3) valitsemallasi luottamustason z-arvolla.

Pienen otannan luottamusvälille käytetään z-arvon sijaan t-testin koko valitulle luottamustasolle. Tätä varten tarvitset määritellä luottamustason (esim. 95 prosenttia, \(p = 0.05\)) sekä testin vapausasteen, \(\text{df} = n-1\).

Lasketaan esimerkkijakaumallemme molemmat luottamusvälit 95 prosentin luottamustasolla, aloittaen yleisestä luottamusvälistä:

\[ \begin{split} \begin{align} \text{CI}_{95 \%} &= 3 \pm (1.96 \times 1.58) \\ &= 3 \pm 3.0968 \\ &= [3-3.0968; 3+3.0968] \\ &\approx [0.1; 6.1] \end{align} \end{split} \]

Tekstissä sanoisimme, että “jakauman keskiarvo on 3, 95% CI [0,1; 6,1]”2. Tällä tarkoitamme siis:

2 Suomeksi desimaalierottajana käytetään pilkkua, jolloin erotamme luottamusvälin kaksi arvoa hakasuluissa puolipilkulla. Jos kirjoitat englanniksi, käytä pistettä desimaalierottimena ja pilkkua kahden arvon erottimena.

Jos jakauman tuottanut otanta toistettaisiin äärettömästi uudelleen, niin 95 % kaikista lasketuista luottamusväleistä sisältäisi todellisen populaatiokeskiarvon.

Luottamusvälissä on erittäin tärkeä huomata nyanssierot. Luottamusväli ei kerro mitään yksittäisen keskiarvon todennäköisyydestä olla oikein! Luottamusväli onkin hyödyllinen työkalu niin sanotussa meta-analyysissa, jolloin tutkijat tarkastavat useamman tutkimuksen tulokset yhdessä. Jos sama tutkimus toteutettaisiin uudelleen, niin jossain vaiheessa uskaltaisimme väittää jotain todellisen keskiarvon sijainnista, koska meillä olisi tarpeeksi luottamusvälejä nähdäksemme, mitkä arvot yleisimmin sisältyvät näihin väleihin.

Koska otoksemme on erittäin pieni (\(n = 5\)), yleinen kaava ei kuitenkaan ole hyvin luotettava. Lasketaan luottamusväli uudelleen käyttäen pienen otannan luottamusväliä. Voimme laskea, että \(\text{df} = n -1 = 5-1 = 4\), ja tarkistaa t-suureen raja-arvo taulukosta3.

3 Hain t-suureen raja-arvot Scribbr-verkkosivun valmiista taulukosta. Muista käyttää tässä kontekstissa kaksi-häntäistä t-suuretta (engl. two-tailed t-test)

\[ \begin{split} \begin{align} \text{CI}_{95 \%} &= 3 \pm (2.776\times 1.58) \\ &= 3 \pm 4.38608 \\ &= [3-4.38608; 3+4.38608] \\ &\approx [-1.4; 7.4] \end{align} \end{split} \]

Kuten tuloksesta näkee, luottamusväli kasvoi kun käytimme pienen otoksen kaavaa. Tämä tarkoittaa vain, että meidän otantakoolla ei voida hyvin luotettavasti rajata aluetta, jonka sisälle todellinen keskiarvo mahdollisesti osuisi. Tarvitsemme enemmän dataa.

Luottamusvälille ei löydy suoraa kaavaa Excelissä. Sen sijaan voit implementoida yllä olevat yhtälöt itse - pystyt kyllä siihen!

9.4 Virhemarginaali

Virhemarginaali on monelle tuttu merkitsevyysmitta. Virhemarginaali onkin hyvin lähellä luottamusväliä - mutta virhemarginaali ilmaistaan useimmiten prosenttieroille ja vain yhtenä arvona.

Virhemarginaali voidaan nähdä symmetrisenä luottamusvälinä, eli sen sijaan, että laskettaisiin kaksi arvoa (jotka voivat olla eri etäisyydellä parametrista), lasketaan vain yksi arvo, joka tulkitaan sijaitsevan molemmin puolin parametria. Toisin sanoen: jos parametri olisi vaikka 5 %, CI = [3%, 7%] tarkoittaa samaa kuin että virhemarginaali olisi 2 %.

Kuten luottamusväli, virhemarginaali lasketaan tietylle luottamustasolle. Virhemarginaalin laskentakaava on hyvin yksinkertainen:

\[ \text{MOE}_p = z_p * SE \tag{9.5}\]

Toisin sanoen, muunnamme ensin prosenttiluvun z-arvoksi, sitten kerromme tuloksen prosenttiluvun keskivirheellä. Jos kyseessä on keskiarvo, käytämme keskiarvon keskivirhettä; muissa tapauksissa laskemme kyseiselle parametrille (esim. kahden ryhmän prosenttierolle) oman keskivirheen.

Useasti, varsinkin viranomaisraporteissa ja median toteuttamissa gallup-tutkimuksissa, ilmaistaan vain yksi virhemarginaali. Tämä on jokseenkin harhaanjohtavaa. Todellisuudessa virhemarginaali voidaan laskea kaikille mittareille, joita on mitattu tutkimuksessa.

Kun kyseessä on vain yhden virhemarginaalin raportointi, tavan mukaan raportoidaan suurin tutkimuksessa esiintyvä virhemarginaali. Prosenttieroille tämä on suhteellisen helppoa määritellä. Suurin virhemarginaali on aina se marginaali, joka laskettiin prosenttierolle joka on lähimpänä 50 prosenttia.

Virhemarginaalia tulkitaan kuitenkin hyvin helposti väärin. Oiva esimerkki on miten virhemarginaali, aivan samoin kuin luottamusväli, ei mittaa yksittäisen mittauksen todennäköisyyttä. Sehän lasketaan melkein tismalleen samalla tavalla - joten sen tulkinta on myös sama!

Virhemarginaali edustaa siis pitkän jakson todennäköisyyttä. Jos toistaisimme otannan ääretön määrä kertoja, näkisimme todellisen prosenttieron virhemarginaalin sisällä (esimerkiksi) 95 prosenttia kerroista.

Virhemarginaali on vaihtoehto luottamusvälille, mutta luottamusväli on tarkempi mitta jota myös käytetään useammin tieteellisessä tutkimuksessa. Suosittelen siis lukijalle, että välttäisit virhemarginaalin käyttöä sen harhaanjohtavuuden takia.

Virhemarginaalille ei löydy suoraa kaavaa Excelissä. Sen implementointi on kuitenkin yksinkertaista - NORMITA(x; keskiarvo; keskihajonta) * (``VAR.S(alue) / NELIÖJUURI(datamäärä)) . Laske siis ensin x-arvon z-arvo, kerro se sitten keskivirheellä (joka lasketaan jakamalla varianssi datamäärän neliöjuurella).