Den akademiske og vitenskapelige verden er full av diskusjoner på metanivå, om hva som egentlig kan kategoriseres som forskning. Datavitenskap eller data science er ikke noe unntak, og det finnes delte meninger om både datavitenskap som fagfelt og forholdet til andre disipliner som statistikk. Det er umulig å finne et svar med to streker under på komplekse spørsmål som dette, men jeg vil diskutere noen av temaene som har å gjøre med hvorvidt datavitenskap er skikkelig forskning.
Tverrfaglighet vs. et eget fagfelt
Til å begynne med vet vi at datavitenskap per definisjon er en tverrfaglig disiplin, som bygger på vitenskapelige metoder, prosesser, algoritmer og sammenhenger hentet fra både matematikk, statistikk, programmering og andre fagfelt. Dessuten er det engelske begrepet «domain knowledge» interessant. Det betyr at kunnskap om det som forskes på, enten det er prissetting, markedsføring, helse eller det ytre rom, også er nødvendig når de gjelder datavitenskap. Det er egentlig logisk, selv om noen annen bestiller analyser og modeller, vil det være vanskelig å skape et godt resultat uten å kunne forstå i hvert fall hovedtrekkene i et datasett.
På mange måter tegner dette da et bilde av datavitenskap som en type praktisk forskning, som benytter eksisterende verktøy og konsepter til å finne ny innsikt i store datasett. Betyr det at datavitenskap ikke er forskning i seg selv? Ikke nødvendigvis, noen forskere velger også å snu på sammenhengen og heller plassere datavitenskap som et overgripende paradigme. Det kan da være mulig å se på datadrevet forskning som det fjerde paradigmet, etter empirisk, teoretisk og databasert forskning.
Problemløsning og nytte sett opp mot teoretisk forskning
Den brede definisjonen av datavitenskap kan også gjøre det noe mer komplisert å definere hvorvidt det egentlig er snakk om skikkelig forskning. På enkelte andre områder, som teoretisk fysikk eller matematikk, er det relativt åpenbart at det dreier seg om forskning – i hvert fall hvis vi ser på teoretisk oppdagelse og vitenskapelig arbeid som noe som kjennetegner skikkelig forskning.
Det er selvfølgelig ikke gitt at et slikt skille mellom teori og praksis egentlig er det som bør utgjøre skillet mellom forskning og ikke-forskning, men det vil definitivt være noe mange ser på. Det kan også i noe grad sammenlignes med for eksempel undervisende forskere og tradisjonelle lærere, eller på et helt annet felt kunstneren og håndverkeren som lager en skulptur.
Mange vil si at en utvikler med mastergrad rettet spesifikt mot datavitenskap, og som dessuten er ansatt ved enten et universitet eller avdeling for FoU, driver med forskning. I en slik rolle vil det kanskje være mulig å jobbe mer teoretisk, uten at det finnes et helt konkret praktisk formål med den enkelte oppgaven.
På den andre siden vil en junior dataanalytiker som har gjennomgått et akselerert utdanningsprogram neppe drive med forskning den første dagen på jobben. Han eller hun vil uten tvil drive med datavitenskap, men innenfor en ramme med fastsatte oppgaver og verktøy. Oppsummert er derfor bildet mangefasettert når det gjelder spørsmålet forskning eller ikke, det er også en naturlig del av bredden til dette fagområdet.