Riittävä tilasto parametrille Θ pystyy keräämään tai tiivistämään kaiken informaation, jonka satunnaismuuttujan X näyte sisältää.
Tiedämme, että tilasto on todellinen otoksen funktio. Eli se ottaa otokseen sisältyvät todelliset arvot. Siitä lähtien, kuten olemme nähneet artikkelissa, jossa tilastokäsite on määritelty, meidän on varmistettava, että tilastotieteilijällä on tiettyjä ominaisuuksia. Miksi vaatia tällaisia ominaisuuksia? Sen varmistamiseksi, että tilasto on hyödyllinen tarkoituksellemme.
Riittävyys on yksi niistä ominaisuuksista. Paljon yksinkertaisemmalla tavalla sanotaan, että tilastotiedot ovat riittävät, jos ne käyttävät kaikkia näytteen sisältämiä tietoja.
Kuinka tietää, riittääkö tilasto?
Loogisesti esiin nouseva kysymys on: Mistä tiedän, täyttääkö T-tilasto riittävyysominaisuuden? Tai miten löydän tilastotiedot, jotka täyttävät riittävyysominaisuuden, jos sellainen on olemassa. Vastaus näihin kahteen kysymykseen löytyy kahdesta lauseesta:
- Fisher-Neyman-faktorointikriteeri: Tämän kriteerin mukaan tilastolla T on riittävä tilasto, jos se täyttää tietyt ehdot.
- Darmois'n lause: Tämä lause vastaa toiseen kysymykseen. Toisin sanoen se antaa meille mahdollisuuden löytää riittävä tilasto useiden menettelyjen avulla.
Esimerkki riittävästä tilastosta
Oletetaan, että haluamme laskea Chilessä asuvien perheiden keskimääräiset vuotuiset tulot. Tätä varten noudatamme seuraavaa prosessia:
- Kerää tietoja (näyte): Koska emme voi kysyä jokaiselta Chilessä asuvalta perheeltä, kuinka paljon he ansaitsevat vuosittain, otamme edustavan otoksen esimerkiksi 1 000 perheestä.
- Määritä tutkittava satunnaismuuttuja: Tutkittava satunnaismuuttuja on perheen tulot. Siten: X → Perhetulo
- Valitse oikea tilasto: Keskimääräisen tulon laskemiseen sopiva tilasto ei ole mikään muu kuin X: n odotus. Toisin sanoen X: n otoskeskiarvo.
- Mistä tiedän, onko otoksen keskimääräinen tilasto riittävä tilasto? Koska meillä on jo tilastojen matemaattinen ilmaisu, käytämme Fisher-Neyman-faktorointikriteeriä. Tai Darmois'n lause. Ne ovat tätä tarkoitusta varten luotuja kaavoja.
Asianmukaisten laskelmien soveltamisen jälkeen päätellään, että otoksen keskimääräinen tilasto täyttää riittävyysvaatimuksen tai -ominaisuuden. Varmistamalla, että se täyttää tämän vaatimuksen, varmistamme, että tämä (tilastollinen) toiminto, jonka avulla voimme syntetisoida tiedot (keskimääräiset tulot), käyttää kaikkia otokseen sisältyviä tietoja (1000 perhettä).
Miksi on tärkeää, että käytän kaikkia näytteen tietoja?
Oletetaan nyt tapaus, kun tiedämme, että otoskeskiarvo on riittävä tilasto. Mitä järkeä olisi haluta laskea keskimääräinen tulo näiden 1000 chileläisen perheen perusteella ja että käytämme vain 500 perheen tietoja?
Tietenkään sillä ei olisi mitään järkeä. Haluamme yhteenvedon kaikista tiedoista. Toisin sanoen, mitä olemme määrittäneet riittäviksi tilastoiksi.