Tietojenkäsittely - mikä se on, määritelmä ja käsite

Datatiede on tieteenala, joka tutkii, mistä tietty tietokanta tulee. Siinä keskustellaan myös siitä, miten näitä resursseja voidaan tulkita ja edustaa tuottavaan käyttöön.

Eli datatiede liittyy tietokantojen hallintaan, jotka on tallennettu digitaalisiin tiedostoihin, joista paljon hyödyllistä tietoa voidaan poimia tilastollisina indikaattoreina. Nämä voivat auttaa yritystä tekemään esimerkiksi liiketoimintapäätöksiä.

Samoin datatiede tarjoaa työkaluja, jotka antavat paitsi tulkita myös edustaa esimerkiksi kuvissa käytettävissä olevaa dataa. Siten meillä on muun muassa histogrammi, pylväsdiagrammi, ympyräkaavio.

Kuten voidaan päätellä, tämä tiede on monialainen, koska se kattaa lähinnä matematiikan, tilastojen ja tietojenkäsittelytieteen tuntemuksen.

Datatiede ja tietotyypit

On myös huomattava, että datatiede voi toimia kahden tyyppisen datan kanssa:

  • Rakenteinen: Ne ovat järjestettyjä, kuten taulukot, joissa on eri sarakkeet, joista jokaisella on eri luokka, kuten nimi, sukunimi, ikä, henkilöllisyystodistuksen numero jne.
  • Rakentamaton: Ne, jotka eivät vastaa tiettyä muotoa, kuten vapaasti kirjoitettu teksti. Tällöin sinun on tulkittava hallittavaa sisältöä ja purettava tietoja.

Ottaen huomioon kaikki selitetyt, tietojenkäsittelyyn erikoistuneilla ammattilaisilla on oltava paitsi analyyttiset taidot myös heidän on voitava välittää käsittelemiensä tietojen sisältö.

Datatieteen merkitys

Datatiede on tärkeää yrityksille tai laitoksille, joiden on työskenneltävä suuren datamäärän kanssa. Näin ollen niistä voi tulla arvokasta tietoa.

Voimme yhdistää datatieteen Big Data -tietoon, joka koostuu mekanismien kehittämisestä, jotka pystyvät käsittelemään ja hallitsemaan eri lähteistä peräisin olevaa massiivista tietoa. Tavoitteena on muuntaa ne tiedoksi, jonka ihminen voi tulkita ja joka auttaa häntä tekemään päätöksiä.

Käsiteltävät tiedot voivat olla peräisin yksilöiden ja organisaatioiden välisistä tapahtumista (kuten pankkitoiminnot), ihmisten päivittäisistä toimista (kuten Internet-haut), koneista (kuten matkapuhelimen GPS, joka tallentaa käyttäjän käyntitiedot) tai tiedoista. biometrinen (kuten sormenjälki).

Datatieteen historia

Voidaan sanoa, että amerikkalainen tilastotieteilijä John Wilder Tukey oli tietotekniikan edelläkävijä 1960-luvulla korostaen tietojen analysoinnin merkitystä tilastollisten mallien testaamisen sijaan.

Vasta vuonna 1996 termiä datatiede käytettiin kuitenkin ensimmäisen kerran luennon otsikossa, puheessa "Tietotiede, luokittelu ja siihen liittyvät menetelmät". Tämä tapahtui kansainvälisen luokituslaitosten kansainvälisen federaation (IFCS) jäsenten kokouksen yhteydessä Kobessa, Japanissa.

Toinen tärkeä virstanpylväs tuli vuonna 2005, kun National Science Board julkaisi "Pitkään eläneet digitaaliset tietokokoelmat, jotka mahdollistavat tutkimuksen ja koulutuksen 2000-luvulla". Kyseisessä asiakirjassa datatieteilijät määritellään tietotekniikan asiantuntijoiksi, tietokanta- ja ohjelmisto-ohjelmoijiksi sekä muiden tieteenalojen ammattilaisille (kuten kirjastonhoitajat ja arkistoijat), joilla on ratkaiseva merkitys digitaalisen tiedonkeruun onnistuneelle hallinnalle.

Tämä on kuitenkin edelleen kehitysvaiheessa oleva tutkimusala.