Både private bedrifter, universiteter, høyskoler, frivillige organisasjoner og myndigheter benytter enorme ressurser på datavitenskap eller «data science». Det er selvfølgelig ikke uten grunn, men hvorfor er datavitenskap så viktig? Det må selvfølgelig finnes et nytteformål bak de store investeringene.
Skape orden i kaos og ustrukturert data
Datavitenskap henger tett sammen med statistikk, noen vil til og med mene at datavitenskap egentlig bare er en mer konkret og praktisk rettet variant av klassiske statistisk metode. Samtidig henger datavitenskap tett sammen med de utrolige datamengdene som er tilgjengelige i digital form i 2022. Uansett om det dreier seg om radiosignaler fra rommet eller kjøpshistorikk fra en dagligvarebutikk, det genereres ekstreme mengder data hvert eneste sekund. Utfordringen er at slik data per definisjon er ustrukturert og kaotisk. En gigantisk datafil med millioner av datapunkter i råformat gir ingen som helst innsikt i hva dataene egentlig representerer.
Den nevnte kjøpshistorikken fra dagligvarebutikken kan være et godt eksempel. I sin opprinnelige form dreier det seg bare om en database med mange millioner produkter, kjøpstidspunkt, priser, betalingsinformasjon og lignende. Ved hjelp av datavitenskap er det mulig å gjøre denne dataen om til noe helt annet:
- Det er mulig å lage aggregerte modeller av for eksempel utvikling i salg eller trender innenfor ulike varekategorier, prisnivåer eller lignende. Slik innsikt kan gi grunnlag for sortimentsendringer, bemanningsplanlegging og lignende.
- Datavitenskap åpner også for analyse og innsikt på mikronivå, ned på enkeltkunder og enkeltkjøp. Det kan for eksempel gjøre det mulig å skreddersy markedsføring og tilbud til utvalgte kunder.
Datavitenskap dreier seg om å oppdage slike skjulte skatter i tilsynelatende verdiløse fjell med ustrukturerte data.
Store muligheter for verdiskapning
Datavitenskap dreier seg ikke bare om å oppdage tilfeldige mønstre eller interessante sammenhenger i ustrukturerte data. Denne disiplinen tar seg også for konkret problemløsning og vurdering av hva som egentlig har forretningsverdi. Det finnes egne utdanningsprogram for dette, som spesifikt kombinerer data science og bedriftsøkonomiske fag.
Det er særlig de enorme datamengdene, kombinert med potensialet for å benytte innsikt og mønstre på detaljnivå, som gir store muligheter for verdiskapning. Et menneske kan se enkle mønstre i data, for eksempel forskjellen mellom en butikks omsetning på en hverdag og helg. En algoritme kan se mye mer finstemte variasjoner og trender. På samme måte kan et menneske ikke lage det optimale tilbudet til flere millioner kunder, noe en modell trent med datavitenskap klarer på noen sekunder. Derfor er også datavitenskap helt avgjørende i 2022.