Gauss-Markov-lause on joukko oletuksia, jotka OLS (Ordinary Least Squares) -estimaattorin on täytettävä, jotta häntä voidaan pitää ELIO: na (Optimal Linear Unbiased Estimator). JAGauss-Markov-lauseen muotoilivat Carl Friederich Gauss ja Andrei Markov.
Carl Friederich Gauss ja Andréi Márkov perustivat joitain oletuksia, jotta OLS-estimaattorista voisi tulla ELIO.
Jos nämä 5 oletusta täyttyvät, voimme vahvistaa, että estimaattori on se, jolla on kaikkien lineaaristen ja puolueettomien estimaattoreiden vähimmäisvarianssi (tarkin). Siinä tapauksessa, että jokin kolmen ensimmäisen oletuksesta epäonnistuu (lineaarisuus, tyhjä keskiarvo-tiukka eksogeenisuus tai Ei täydellistä monikollinaarisuutta), OLS-estimaattori ei ole enää puolueeton. Jos vain 4 tai 5 epäonnistuu (Homoscedasticity ja Ei autokorrelaatiota), estimaattori on edelleen lineaarinen ja puolueeton, mutta se ei ole enää tarkin. Yhteenvetona Gauss-Markov-lauseessa todetaan, että:
- Oletusten 1, 2 ja 3 mukaan OLS-estimaattori on lineaarinen ja puolueeton. Nyt, ei niin kauan kuin kolme ensimmäistä oletusta täyttyvät, voidaan varmistaa, että estimaattori on puolueeton. Jotta estimaattori olisi johdonmukainen, meillä on oltava suuri otos, sitä enemmän, sitä parempi.
- Oletuksissa 1, 2, 3, 4 ja 5 OLS-estimaattori on lineaarinen, puolueeton ja optimaalinen (ELIO).
Gauss-Markov-lauseen oletukset
Erityisesti on 5 oletusta:
1. Lineaarinen malli parametreissa
Se on melko joustava oletus. Sen avulla voidaan käyttää kiinnostavien muuttujien toimintoja.
2. Tyhjä keskiarvo ja tiukka eksogeenisuus
Se tarkoittaa, että selityksistä riippuvan virheen keskiarvo on yhtä suuri kuin ehdoton odotettu arvo ja yhtä suuri kuin nolla. Tiukka eksogeenisuus edellyttää lisäksi, että mallivirheitä ei korreloida havaintojen kanssa.
Tyhjä keskiarvo:
Tiukka eksogeenisuus:
Tyhjä keskiarvo ja tiukka eksogeenisuus epäonnistuvat, jos:
- Malli on huonosti määritelty (esimerkiksi asiaankuuluvien muuttujien jättäminen pois).
- Muuttujissa on mittausvirheitä (tietoja ei ole tarkastettu).
- Aikasarjassa tiukka eksogeenisyys epäonnistuu viivästyneissä endogeenisuusmalleissa (vaikka samanaikaista eksogeenisyyttä saattaa olla olemassa) ja tapauksissa, joissa on palautteen vaikutuksia.
Poikkileikkaustiedoissa eksogeenisuuden olettaman saavuttaminen on paljon helpompaa kuin aikasarjojen tapauksessa.
3. Ei tarkkaa monikolineaarisuutta
Otoksessa mikään selittävistä muuttujista ei ole vakio. Selittävien muuttujien välillä ei ole tarkkoja lineaarisia suhteita. Se ei sulje pois muuttujien välistä (ei täydellistä) korrelaatiota. Gaussin ja Markovin mukaan, kun mallilla on tarkka monikollinaarisuus, se johtuu yleensä analyytikkovirheestä.
4. Homoscedastisuus
Virheen ja siten Y: n varianssi on riippumaton selittävistä arvoista ja lisäksi vakion virheen varianssista. Matemaattisesti se ilmaistaan seuraavasti:
Tässä on joukko tietoja, joilla on homoscedastinen ulkonäkö.
5. Ei autokorrelaatiota
Kahden eri X: stä riippuvan havainnon virhetermit eivät liity toisiinsa. Jos näyte on satunnainen, autokorrelaatiota ei tapahdu.
Minulla on oltava erilainen arvo kuin h. Jos näyte on satunnainen, data ja havaintovirheet "i" ja "h" ovat riippumattomia havaintopareille "i" ja "h".