Tiedon louhinta - mikä se on, määritelmä ja käsite

Sisällysluettelo:

Tiedon louhinta - mikä se on, määritelmä ja käsite
Tiedon louhinta - mikä se on, määritelmä ja käsite
Anonim

Tiedon louhinta on prosessi, jossa etsitään suurista tietokannoista hyödyllistä tietoa, jota voidaan käyttää päätöksentekoon. Myös englanninkielistä termiä "data mining" käytetään.

Se voidaan ymmärtää tekniikaksi ja ohjelmistoksi, jota käytetään käyttäytymismallien löytämiseen tietokannasta. Tämän perustana on, että nämä mallit auttavat päätöksentekoa. Se voi esimerkiksi auttaa yrityksiä ymmärtämään asiakkaidensa käyttäytymismalleja. Sillä tavalla, että se helpottaisi strategioiden laatimista myynnin lisäämiseksi tai kustannusten alentamiseksi.

Tiedon louhinnan edut

Tämän data-analyysin tärkein etu on suuri joukko liiketoimintaskenaarioita, joihin sitä voidaan soveltaa, esimerkkinä meillä on:

  • Ennustus: Ennuste yhtiön myynnistä.
  • Todennäköisyys: Parhaiden asiakkaiden valinta suoraa yhteyttä varten joko puhelimitse tai sähköpostitse.
  • Sekvenssianalyysi: Asiakkaiden ostamien tuotteiden analyysi ja tarkista niiden välinen suhde.

Tiedon louhinnan vaiheet

Tiedonlouhintaprosessista löytyy viisi vaihetta:

  • Tavoite ja tiedonkeruu: Ensinnäkin on keskityttävä siihen, minkä tyyppistä tietoa haluamme saada. Kuvitelkaamme esimerkkiä siitä, että supermarket haluaa tietää, mihin aikaan päivästä on eniten asiakkaita. Tämä olisi tavoite ja tiedot, jotka kauppa haluaa saada tässä tapauksessa.
  • Tietojenkäsittely ja hallinta: Kun tiedämme kerättävät tiedot, laitamme tiedot toimimaan. Tämä on ehkä prosessin vaikein vaihe. No, se vaatii edustavan otoksen valitsemisen, jolle analyysi tehdään. Kun näyte on valittu, on analysoitava, minkä tyyppiset muuttujat tai regressiomalli aiotaan suorittaa näytteelle.
  • Mallin valinta: Se liittyy läheisesti edelliseen vaiheeseen. Kyse on mallin tai algoritmin luomisesta, joka antaa meille parhaan mahdollisen tuloksen. Tätä varten on suoritettava tyhjentävä analyysi malliin sisällytettävistä muuttujista. Tästä tulee monimutkainen tehtävä, koska se riippuu analysoitavan tiedon tyypistä. Siksi tiedonlouhijat suorittavat erilaisia ​​algoritmin testejä, kuten: lineaarinen regressio, päätöspuu, aikasarjat, hermoverkko jne.
  • Analyysi ja tulosten tarkastelu: Periaatteessa on analysoida tuloksia, jotta saadaan selville, antavatko ne loogisen selityksen. Selitys, joka helpottaa päätöksentekoa tulosten antamien tietojen perusteella.
  • Mallipäivitys: Prosessin viimeinen vaihe olisi mallin päivitys. On erittäin tärkeää, että se tehdään ajan myötä, jotta se ei vanhene. Mallin muuttujat saattavat muuttua merkityksettömiksi, joten mallia on ajoittain valvottava.