Binaarivalintamallit ovat malleja, joissa riippuvainen muuttuja saa vain kaksi arvoa: 1 tarkoittaa "menestys" tai "0" osoittaa epäonnistumista. Konkreettiset estimointimallit ovat: lineaarinen todennäköisyys, logit ja probit.
Yksinkertaisessa tai moninkertaisessa regressiomallissa, jota opetetaan johdantokurssilla Econometrics, riippuvaisella muuttujalla on yleensä taloudellinen tulkinta (kuten BKT: n kasvu, investoinnit tai kulutus) muista selittävistä muuttujista.
Mutta mitä mallia käytämme, kun haluamme selittää tapahtumia, joilla on vain kaksi mahdollisuutta? Esimerkiksi: aiheen läpäiseminen tai hylkääminen, yliopiston valmistuminen tai valmistumisen lopettaminen, työllistyminen tai työttömyys jne. Tähän binaarivalintamallit vastaavat.
Jokaisessa näistä tapauksista voit tehdä Y = 1 tarkoittaa "menestys"; Y = 0 tarkoittaa "epäonnistumista". Tästä syystä niitä kutsutaan binäärivalintamalleiksi ja sen käyttämä yhtälö on seuraava:
Tällä tavalla saamme tietyn muuttujan onnistumisen todennäköisyyden.
Toistaiseksi sillä ei ole suuria komplikaatioita. Parametrien arviointi ja tulkinta vaatii kuitenkin suurempaa huolellisuutta.
RegressiomalliMallit binaaristen parametrien arvioimiseksi
Ottaen huomioon edellä mainitut riippumattoman muuttujan ominaisuudet on kolme mallia parametrien arvioimiseksi:
- Lineaarinen todennäköisyysmalli. Se lasketaan normaalin OLS: n avulla.
- Logit-malli. Se lasketaan tavallisella logistisella jakelutoiminnolla.
- Probit-malli. Se lasketaan normaalilla normaalijakautumistoiminnolla.
Lineaarinen todennäköisyysmalli
Lineaarinen todennäköisyysmalli (MPL) on niin nimetty todennäköisyyden vuoksi
vaste on lineaarinen yhtälön parametrien suhteen. Käytä estimaattiin tavallisia vähiten neliöitä (OLS)
Arvioitu yhtälö kirjoitetaan
Riippumaton muuttuja (ja hattu) on ennustettu onnistumisen todennäköisyys.
B0 korkki on ennustettu onnistumisen todennäköisyys, kun jokainen x: stä on nolla. Kerroin B1 cap mittaa ennustetun onnistumisen todennäköisyyden vaihtelua, kun x1 lisää yhden yksikön.Lineaarisen todennäköisyysmallin oikein tulkitsemiseksi meidän on otettava huomioon, mitä pidetään onnistuneena ja mikä ei.
Esimerkki binäärivalintamallista
Taloustieteilijä Jeffrey Wooldridge arvioi ekonometrisen mallin, jossa binäärimuuttuja osoittaa, osallistuiko naimisissa oleva nainen työvoimaan (selitetty muuttuja) vuonna 1975. Tässä tapauksessa Y = 1 tarkoitti, että e osallistui Y = 0 mikä ei.
Malli käyttää aviomiehen tulotasoa selittävinä muuttujina (hinc), vuosien koulutus (kouluttaa), vuosien kokemus työmarkkinoista (kokemus), ikä (ikä), alle kuuden vuoden ikäisten lasten lukumäärä (kidslt6) ja 6–18-vuotiaiden lasten lukumäärä (lapset 6).
Voimme varmistaa, että kaikki muuttujat paitsi kidsge6 ovat tilastollisesti merkitseviä ja että kaikilla merkittävillä muuttujilla on odotettu vaikutus.
Parametrien tulkinta on nyt seuraava:
- Jos kasvatat yhden vuoden koulutusta, ceteris paribus, todennäköisyys liittyä työvoimaan kasvaa 3,8%.
- Jos kokemus kasvaa yhden vuoden aikana, todennäköisyys olla osa työvoimaa kasvaa 3,9%.
- Jos sinulla on alle 6-vuotias lapsi, ceteris paribus, todennäköisyys olla osa työvoimaa vähenee 26,2%.
Joten näemme, että tämä malli kertoo meille jokaisen tilanteen vaikutuksen todennäköisyyteen, että nainen palkataan virallisesti.
Tätä mallia voidaan käyttää julkisen politiikan ja sosiaalisten ohjelmien arviointiin, koska "ennustetun onnistumisen todennäköisyyden" muutos voidaan kvantifioida selittävien muuttujien yksikkö- tai marginaalimuutosten suhteen.
Lineaarisen todennäköisyysmallin haitat
Tällä mallilla on kuitenkin kaksi päähaittaa:
- Se voi antaa todennäköisyyksiä, jotka ovat alle nolla ja suurempia kuin yksi, mikä ei ole järkevää näiden arvojen tulkinnassa.
- Osittaiset vaikutukset ovat aina vakioita. Tässä mallissa ei ole eroa nollasta yhden lapsen välillä siirtymisen välillä kuin kahden tai kolmen lapsen välillä.
- Koska selittävä muuttuja ottaa vain arvot nolla tai yksi, heteroskedastisuus voidaan tuottaa. Tavallisia virheitä käytetään tämän ratkaisemiseksi.
Kahden ensimmäisen ongelman ratkaisemiseksi, jotka ovat lineaarisen todennäköisyysmallin tärkeimmät, suunniteltiin Logit- ja Probit-mallit.
Viitteet:
Wooldridge, J. (2010) Johdatus ekonometriaan. (4. painos) Meksiko: Cengage Learning.