Kolmogorov-testi - Smirnoff (K-S)

Sisällysluettelo:

Kolmogorov-testi - Smirnoff (K-S)
Kolmogorov-testi - Smirnoff (K-S)
Anonim

Kolmogorov-Smirnoff (K-S) -testi on ei-parametrinen testi, jonka tarkoituksena on selvittää, noudattavatko kahden eri tietojoukon taajuudet samaa jakaumaa keskiarvonsa ympäri.

Toisin sanoen Kolmogorov-Smirnoff (K-S) -testi on testi, joka sopeutuu tietojen muotoon ja jota käytetään tarkistamaan, seuraavatko kaksi eri näytettä samaa jakaumaa.

Miksi se on ei-parametrinen testi?

"Ei-parametristen" ominaisuuksien kauneus on se, että ne sopivat dataan ja siten jakaumiin, jotka voivat seurata datan taajuutta. Lisäksi tämä ominaisuus säästää meitä ottamasta a priori mitä jakaumaa näyte seuraa.

K-S-testin merkitys

Kuinka monta kertaa meille on annettu kaksi näytettä ja laskettu Pearsonin korrelaatiokerroin ajattelematta kahdesti? Toisin sanoen, jos haluamme nähdä lineaarisen suhteen kahden tietojoukon välillä, olisi oikeudenmukaista laskea korrelaatio, eikö?

Tämä johtopäätös olisi totta, jos kahden näytteen jakaumat noudattavat normaalijakaumaa. Korrelaatiokerroin olettaa, että jakaumat ovat normaaleja, jos ohitamme tämän oletuksen, korrelaatiokertoimen tulos on väärä. Hypoteesitestien ja luottamusvälien osalta oletamme myös, että populaatio jakautuu normaalijakauman kautta.

Kuten kaikki hypoteesitestit, joihin liittyy tilastoja, on tärkeää, että tilastollisesti merkitsevät tulokset ovat suuret tietomäärät. Voimme virheellisesti hylätä nullhypoteesin, koska otos on pieni. Lisäksi on myös tärkeää, että tässä otoksessa on joitain äärimmäisiä tapauksia (poikkeavia(englanniksi) testituloksen johdonmukaisuuden lisäämiseksi.

TESTAUSMENETTELY

Seuraavien vaiheiden menettely.

Hypoteesi

Ensimmäinen vaihe on tarkistaa, onko molemmilla näytteillä sama jakauma. Tätä varten teemme hypoteesitestin olettaen, että molemmilla näytteillä on sama jakauma vaihtoehtoista hypoteesia vastaan, että ne ovat erilaisia.

Tilastollinen

Työskentelemme kahden näytteen, F: n, kumulatiivisten jakelutoimintojen kanssa1(x) ja F2(x):

Älä hätäänny! Analysoimme yllä olevaa kaavaa rauhallisesti:

  • Tärkeä osa kaavaa on ero merkki (-). Etsimme vertikaalisia eroja jakaumissa. Joten vähennämme molemmat kumulatiiviset jakelutoiminnot.
  • operaattori "max". Olemme kiinnostuneita löytämään suurin tai suurin ero nähdäksesi kuinka erilaiset kaksi jakaumaa voivat olla.
  • absoluuttinen arvo. Käytämme absoluuttista arvoa, jotta operaattorien järjestys ei muuta tulosta. Toisin sanoen sillä ei ole väliä, millä F (x): llä on negatiivinen merkki:

Kriittinen arvo

Suurille näytteille on arvioitu K-S: n kriittinen arvo, joka riippuu merkitsevyystasosta (%):

Missä1 ja n2 ovat F-näytteen otoskoko1(x) ja F2(x).

Jotkut lasketut kriittiset arvot:

Hylkäsääntö

Sovellus

Hyvin usein haluamme testata, ovatko kaksi jakaumaa riittävän erilaisia ​​toisistaan, kun haluamme rakentaa ennusteskenaarioita (toimimme kahden näytteen kanssa) tai kun haluamme arvioida, mikä jakauma parhaiten sopii tietoihin (toimimme vain yhden otoksen kanssa).