Til å begynne med er det greit å avklare en ting: når jeg skriver om «datavitenskap», så mener jeg det i betydningen «data science» på engelsk. Disse to begrepene benyttes ofte om hverandre både i akademiske sammenheng og i jobbannonser, men det er likevel greit å presisere det. Begrepet datavitenskap kan være litt ullent, og høres kanskje dessuten litt gammeldags ut? Samtidig bruker for eksempel NMBU og UiB det om sine studieprogram.
En tverrfaglig vitenskap
Noen fagfelter er enkle å avgrense, både når det gjelder tematikk, innhold og eventuelle arbeidsoppgaver, profesjoner og roller. Datavitenskap befinner seg ikke i denne kategorien. Grovt beskrevet er datavitenskap en tverrfaglig vitenskap som benytter vitenskapelige metoder, prosesser, algoritmer og ulike systemer til å finne innsikt og kunnskap basert på ustrukturerte store datasett.
Allerede her ser vi altså at datavitenskap per definisjon er tverrfaglig, gitt at det bygger på både statistikk, informatikk, matematikk og forretningsfag som økonomi og finans. Legg likevel merke til at det, som seg hør og bør innen vitenskap, finnes delte meninger når det gjelder forholdet mellom statistikk og datavitenskap. Noen vil mene at datavitenskap eller data science egentlig bare er en variant av statistikk, med et litt mer praktisk preg rettet mot problemløsning.
Datavitenskap og utdanning
Utdanningsløp, studieprogrammer og grader kan ofte benyttes til å avgrense forskjellige fagområder og kompetanser. Det er for eksempel åpenbart at legeutdanningen leder frem til en karriere som lege, og at du trenger å gå på Politihøgskolen for å kunne jobbe som politi. Bildet er ikke like enkelt når det gjelder datavitenskap eller data science.
- Tradisjonelle studieprogrammer på både master- og bachelornivå gir deg et solid fundament innen datavitenskap, samtidig som et slikt langt utdanningsløp vil kunne gå både i dybden og bredden når det gjelder en mengde forskjellige overlappende og tilstøtende temaer.
- Det finnes også mer kompakte utdanningsløp, for eksempel er det mulig å utdanne seg til dataanalytiker i løpet av 12 ukers intensiv undervisning. Det er åpenbart at forskjellen er stor sammenlignet med mange års studier, men det sier også noe om bredden til fagfeltet og profesjonen.
- I tillegg er det også mulig å velge fra et gigantisk utvalg nettstudier tiltenkt en karriere innen datavitenskap og data science. Praktisk talt alt du trenger av ressurser, systemer og undervisning finnes åpent tilgjengelig på noen måte, slik at du kan utforske et helt univers av datavitenskap på egen hånd.
Men hva betyr dette helt konkret?
Begreper som tverrfaglig, datadrevet og lignende «buzz words» benyttes hyppig innen datavitenskap, men hva er egentlig hensikten med datavitenskap? NMBU velger å beskrive sitt masterprogram som en vei til verktøyene som lar deg finne verdifull innsikt og mønstre i komplekse og store datasett. Legg merke til at det altså ikke finnes noen begrensning når det gjelder hvilken type data, men det finnes et åpenbart fokus på å forstå, skape noe og gi innsikt og verdi. Mange jobber med datavitenskap i det private næringsliv, men det finnes også stor etterspørsel etter analyse av enorme datasett innen både offentlig forvaltning, akademia og forskning.
Legg merke til at de helt konkrete verktøyene som benyttes, som et hypotetisk programmeringsspråk X for scripting eller programvare Y for analyse, ikke er veldig relevante på et overgripende nivå. Disse verktøyene vil med automatikk forandre seg over tid, og datavitenskap er per definisjon et fagfelt som er i stadig forandring. Det fører frem til enda en definisjon av hva en «data scientist» egentlig driver med: å lage kode og systemer som kombinert med kunnskap om statistikk gjør det mulig å skape ny innsikt fra ustrukturert data. Det er en spennende og åpen beskrivelse – med et løfte om mange muligheter og få begrensninger.