Merkityksellisen muuttujan poisjättäminen on tärkeän selittävän muuttujan sisällyttämättä jättämistä regressioon. Ottaen huomioon Gauss-Markovin oletukset tämä laiminlyönti aiheuttaisi puolueellisuutta ja epäjohdonmukaisuutta arvioissamme.
Toisin sanoen merkityksellisen muuttujan poisjättäminen tapahtuu, kun sisällytämme sen virhetermiin u, koska emme ota sitä huomioon. Tämä aiheuttaa riippuvaisen muuttujan ja virhetermin u välisen korrelaation.
Matemaattisesti oletamme, että:
Cov (x, u) = 0
Jos sisällytämme asiaan liittyvän muuttujan virhetermiin tai, sitten:
Cov (x, u) ≠ 0
Gauss-Markovin oletusten perusteella tämä korrelaatio:
(ρ (x, u) ≠ 0)
Se ei täyttäisi sitä:
E (u | x) = E (u) = 0
Toisin sanoen selittäviin virheisiin liittyvien virheiden odotus on yhtä suuri kuin virheen odotus ja että se on myös nolla. Nämä ovat oletuksia puolueettomuudesta (tiukka eksogeenisuus + nollakeskiarvo)
Jos asiaankuuluva muuttuja jätetään pois, OLS-estimaattori on puolueellinen ja siitä tulee epäjohdonmukainen. Joten se rikkoo kahta estimaattorin ominaisuutta ja aiheuttaa arviomme väärän.
Teoreettinen esimerkki
Oletamme, että haluamme tutkia kausihiihtäjien lukumäärää (t) ottaen huomioon useat tekijät: hiihtopassien (hiihtopassit) ja avoimien rinteiden (rinteet) määrän sekä lumen (lumen) laadun.
Malli 0
Oletetaan, että selittävät muuttujat (hiihtopassit, rinteet ja lumi) ovat mallin 0 kannalta merkityksellisiä muuttujia, koska ne kuuluvat populaatiomalliin. Toisin sanoen mallin 0 selittävillä muuttujilla on osittainen vaikutus populaatiomallin riippuvaisiin vaihteleviin hiihtäjiin. Sitten sekä populaatio- että otosmalleissa (malli 0) kertoimet ovat muut kuin nolla.
Tulkinta
Lumen (lumen) laadun ja avoimien ajojen (ratojen) määrän kasvu lisää β-estimaattien määrää2 ja P3. Näin ollen tämä heijastuu hiihtäjien (hiihtäjien) lukumäärään.
Hiihtopassin prosentuaalinen nousu aiheuttaa β: n laskun1/ 100 hiihtäjien (hiihtäjien) lukumäärä
Prosessi
Käsittelemme lumimuuttujaa jätetyksi mallista pois. Sitten:
Malli 1
Erotamme virhetermin u mallista 0 ja virhetermin v mallista 1, koska yksi ei sisällä asiaankuuluvaa lumimuuttujaa ja toinen.
Mallissa 1 olemme jättäneet merkityksellisen muuttujan pois mallista ja esittäneet sen virhetermillä u. Se tarkoittaa, että:
- Cov (lumi, v) ≠ 0 → ρ (lumi, v) ≠ 0
- E (v | lumi) ≠ 0
Jos jätämme merkityksellisen vaihtelevan lumen pois mallistamme 1, saamme OLS-estimaattorin esittämään harhaa ja epäjohdonmukaisuutta. Joten arvio kausihiihtäjien lukumäärästä on väärä. Hiihtokeskus voi olla vakavissa taloudellisissa vaikeuksissa, jos otat huomioon mallin 1 arvion.