Lineaarinen erotteleva analyysi tai Linear Discriminant Analysis (LDA) on tilastollinen tekniikka, joka luo toiminnon, joka kykenee luokittelemaan ilmiöt ottaen huomioon joukon erottavia muuttujia ja todennäköisyyden kuulua.
Siksi kyseessä on eräänlainen tilastollinen menettely, joka pyrkii ryhmittelemään tiettyjen yhtäläisyyksien perusteella. Tällä tavoin se voi kvantifioida todennäköisyyden kuulua yhteen tai toiseen ryhmään. Nämä ryhmät tunnetaan a priori, toisin kuin klusterianalyysi.
Diskriminanttianalyysin matemaattinen malli
Katsotaanpa, miltä erottelevan analyysin matemaattinen malli näyttäisi.
Se on hyvin yksinkertainen, koska se perustuu lineaaristen yhtälöiden järjestelmään. Analyysi on tietysti monimutkaisempi, mutta tämä olisi Economy-Wiki.comin, yksinkertaisen talouden, työn ulkopuolella.
Kuten voimme nähdä, ne ovat joukko yhtälöitä, joiden riippuva muuttuja (y) edustaa tiettyjä pisteitä. Nämä puolestaan ovat muiden erilaisten muuttujien (X) ja parametrisarjojen (a) lineaarisia funktioita.
Näiden lineaaristen yhdistelmien avulla tavoitteena on maksimoida ryhmien välinen varianssi ja minimoida ryhmien välinen varianssi. Tällä tavalla uudet tapaukset voidaan ryhmitellä tietyllä todennäköisyydellä, jonka tiedämme niiden arvon, jos ne täyttävät nämä kriteerit.
Seurattava prosessi erottelevan analyysin suorittamiseksi
Katsotaanpa, kuinka tämän tyyppinen analyysi voidaan suorittaa:
- Ensin on luotava tietotaulukko, jossa on tapauksia ja muuttujia. Mukana on myös kategorinen muuttuja, joka määrittelee kaikki ryhmät.
- Seuraavaksi luodaan matemaattinen malli numeerisilla tiedoilla. Tämä perustuu edellisessä osassa näkemäämme. Tilastolliset ohjelmistot, kuten SPSS tai ilmainen R, automatisoivat koko prosessin.
- Lopuksi tämän analyysin avulla voimme selittää, miksi kukin tapaus kuuluu yhteen tai toiseen ryhmään, ja lisäksi määritellä jäsenyyskriteeri uusille tapauksille. Tämä perustuu todennäköisyyteen kuulua jommankumman sisällä.
Esimerkkejä syrjintäanalyysin soveltamisesta
Lopuksi tarkastellaan joitain esimerkkejä syrjintäanalyysin soveltamisesta.
Muistakaamme myös, että kaikissa niissä tavoitteena on luoda erottava toiminto, joka ryhmittelee jokaisen uuden tapauksen todennäköisyyden mukaan.
- Haluamme luokitella eri maat niiden makrotaloudellisten tietojen perusteella: Alikehittyneet, nousevat tai kehittyneet maat (ryhmät). Luomme erottelevan funktion, jotta voimme laskea maan todennäköisyyden kuulua yhteen tai toiseen ryhmään.
- Haluamme toteuttaa markkinointikampanjan ja olemme kiinnostuneita tietämään, mihin ryhmiin yksilöt luokitellaan: Voimme siis vastata tiettyihin kysymyksiin, kuten esimerkiksi satunnaisen asiakkaan ominaisuuksiin.
- Haluamme tietää tiettyjen asiakkaiden riskitason (ryhmä) lainan myöntämisessä: Käytämme muuttujia, jotka liittyvät tuloihisi, kuukausikuluihisi, historiaasi tai työn tyyppiin. Eristävä toiminto tarjoaa meille olennaisia tietoja vakavaraisuudesta.
Kuten näemme, syrjivä analyysi on erittäin hyödyllinen monissa tilanteissa. Mutta ei vain talouden alalla, sitä käytetään myös lääketieteessä, geologiassa tai biologiassa muiden alojen ohella.