Määrityskerroin (R-neliö)

Määrityskerroin on muuttujan kokonaisvarianssin osuus, joka selitetään regressiolla. Määrityskerroin, jota kutsutaan myös R-neliöksi, heijastaa mallin sopivuutta muuttujaan, jonka se aikoo selittää.

On tärkeää tietää, että määrityskertoimen tulos värähtelee välillä 0 ja 1. Mitä lähempänä sen arvo on 1, sitä suurempi malli sopii muuttujaan, jota yritämme selittää. Ja päinvastoin, mitä lähempänä nollaa, sitä vähemmän malli on tiukka ja siksi sitä vähemmän luotettava.

Edellisessä lausekkeessa meillä on murto-osa. Joten, mennään osittain. Ensinnäkin analysoimme osoitinta, eli yläosaa.

Niille, jotka eivät tiedä varianssin ilmaisua, suosittelen, että luet artikkelin siitä. Niille, jotka tietävät sen, he saattavat ymmärtää, että se on varianssin ilmaus, mutta kahdella perustavanlaatuisella erolla.

Ensimmäinen ero on se, että Y: llä on ympärysmitta tai mitä opettajat didaktisesti kutsuvat "hatuksi". Se, mitä hattu sisältää, on se, että Y on arvio mallista siitä, mikä selittävien muuttujien mukaan on Y: n arvoinen, mutta se ei ole Y: n todellinen arvo, vaan arvio Y: sta.

Toiseksi olisi tarpeen jakaa T.: llä, joka muissa tapauksissa on merkitty N: llä tai havaintojen lukumäärällä. Koska nimittäjäkaava kantaisi sitä myös, poistamme nimittäjät (pohja) molemmista kaavoista lausekkeen yksinkertaistamiseksi. Näin on helpompaa työskennellä sen kanssa.

Seuraavaksi aiomme suorittaa saman analyysin nimittäjäosan (alaosan) kanssa.

Tällöin ainoa ero alkuperäisestä varianssikaavasta on sen nimittäjän puuttuminen. Eli emme jaa T: llä tai N.: llä. Tällä tavoin, kun R-neliön tai määrityskertoimen yleisen lausekkeen kaksi osaa on selitetty, näemme esimerkin.

VariaatiokerroinLineaarinen korrelaatiokerroinTaantumisanalyysi

Määrityskertoimen tulkinta

Oletetaan, että haluamme selittää maalien määrän Cristiano Ronaldo sen perusteella, kuinka monta peliä hän pelasi. Oletamme, että mitä enemmän pelejä pelataan, sitä enemmän maaleja hän tekee. Tiedot koskevat viimeisiä 8 vuodenaikaa. Siten tietojen saamisen jälkeen malli antaa seuraavan arvion:

Kuten käyrästä voimme nähdä, suhde on positiivinen. Mitä enemmän pelejä pelataan, tietysti, sitä enemmän maaleja hän tekee kaudella. Sovitus R-neliön laskennan perusteella on 0,835. Tämä tarkoittaa, että kyseessä on malli, jonka arviot sopivat varsin hyvin muuttujaan. Vaikka teknisesti se ei olisi oikein, voimme sanoa jotain sellaista, että malli selittää 83,5% todellisesta muuttujasta.

Määrityskertoimen ongelma

Määrityskertoimen ongelma ja syy, miksi oikaistu määrityskerroin syntyy, on se, että se ei rankaise merkityksettömien selittävien muuttujien sisällyttämistä. Toisin sanoen, jos malliin lisätään viisi selittävää muuttujaa, jotka eivät juurikaan liity niihin tavoitteisiin, jotka Cristiano Ronaldo tekee kauden aikana, R-neliö kasvaa. Siksi monet ekonometriset, tilastotieteilijät ja matemaattiset asiantuntijat vastustavat R-neliön käyttöä edustavana mittana todellisen istuvuuden hyvyydestä.

Mukautettu määrityskerroin

Mukautettu määrityskerroin (oikaistu R-neliö) on mitta, joka määrittää prosenttiosuuden, joka selitetään regressiovarianssilla suhteessa selitetyn muuttujan varianssiin. Toisin sanoen sama kuin R-neliö, mutta erolla: Säädetty määrityskerroin rankaisee muuttujien sisällyttämistä.

Kuten olemme aiemmin sanoneet, mallin määrityskerroin kasvaa, vaikka sisällyttämämme muuttujat eivät olekaan merkityksellisiä. Koska tämä on ongelma, yritetään ratkaista se, säädetty R-neliö on sellainen, että:

Kaavassa N on otoskoko ja k on selittävien muuttujien lukumäärä. Matemaattisella johtopäätöksellä, mitä korkeammat k: n arvot, sitä enemmän säädetty R-neliö on normaalista R-neliöstä. Vastaavasti k: n pienemmillä arvoilla, mitä lähempänä keskiosa on 1: een, ja siksi säädetty R-neliö ja normaali R-neliö ovat samanlaisia.

Muistamalla, että k on selittävien muuttujien määrä, päätellään, että tämä ei voi olla nolla. Jos se olisi nolla, mallia ei olisi. Ainakin meidän on selitettävä yksi muuttuja toisella muuttujalla. Koska k: n on oltava vähintään 1, säädetyllä R-neliöllä ja normaalilla R-neliöllä ei voi olla sama arvo. Lisäksi säädetty R-neliö on aina pienempi kuin normaali R-neliö.

Suosittu Viestiä

Joseph Schumpeter - Elämäkerta, kuka hän on ja mitä hän teki

Joseph Schumpeter (1883-1950), joka on syntynyt Tšekin tasavallassa, oli tunnettu itävaltalais-ekonomisti ja politologi. Hänen työnsä leimasi innovaation tutkimus ja sen vaikutus suhdanteisiin. Akateemikko korosti liike-elämän roolia uusien prosessien ja tuotteiden luojana. Innovaatiot muuttavat liiketoimintamalleja eri Lue lisää…

Nicholas Gregory Mankiw - Elämäkerta, kuka hän on ja mitä hän teki

Amerikan Trentonin kaupungissa vuonna 1958 syntynyt Nicholas Gregory Mankiw on tunnettu amerikkalainen taloustieteilijä ja professori Harvardin yliopistossa. Taloudellisen ajattelunsa perusteella häntä voidaan pitää uudena keynesiläisenä. Opettajansa ohella hän tuli neuvomaan USA: n presidentti George W. Bushia vuosina 2003–2005. Treenattuaan ekonomistiksiLue lisää…

Yanis Varoufakis - Biografia, kuka hän on ja mitä hän teki

Yanis Varoufakis, syntynyt vuonna 1961 Ateenassa, on yksi Kreikan vaikutusvaltaisimmista taloustieteilijöistä. Ennen kaikkea hän on monipuolinen mies, koska hän on ekonomisti, kirjailija, bloggaaja, professori ja yliopiston professori. Hän on koulutettu ekonomistiksi Essexin yliopistossa, jossa hän on suorittanut tohtorin tutkinnon. Hän on opettanut useissa yliopistoissa, kuten: Cambridge, AngliaLue lisää…

Ray Dalio - Elämäkerta, kuka hän on ja mitä hän teki

Ray Dalio on sijoittaja, hedge-rahastojen hoitaja ja hyväntekijä, syntynyt vuonna 1949 New Yorkissa, Yhdysvalloissa. Ray Dalio on Bridgewater Associates -yhtiön omistaja. Toisin sanoen maailman suurin hedge-rahasto. Tammikuussa 2018 hän nousi maailman 100 rikkaimman ihmisen listalle. Raymond DalioLue lisää…