November 21, 2024

Det kan være vanskelig å skille mellom datavitenskap og dataanalyse, og det er egentlig helt fint. Datavitenskap er per definisjon et tverrfaglig felt, og dataanalyse favner også svært bredt. Dessuten benyttes de to begrepene i noe grad om hverandre. Det finnes likevel noen nyanser som kan benyttes til å prøve å skille de to ad.

Fagfeltet datavitenskap og metoden data-analyse?

Til å begynne med er det mulig å prøve å rangere datavitenskap og data-analyse, og da se for seg at datavitenskap befinner seg på et noe høyere nivå. Det dreier seg ikke om å trykke ned eller kritisere data-analyse, men om at datavitenskap ofte rettes mer mot de større spørsmålene. Det er også mulig å beskrive denne forskjellen slik:

  • Dataanalyse dreier seg om å analysere, systematisere og presentere data. Utgangspunktet er ofte spørsmål som allerede er stilt, og de skal besvares med data som allerede eksisterer.
  • Datavitenskap kan i tillegg handle om å faktisk finne de riktige spørsmålene å stille. Det betyr at oppgaven ikke er begrenset til en hypotese som skal testes, men kan være en bredere tilnærming med et relativt ullent mål.

Å si at datavitenskap er et fagfelt og at data-analyse bare er en metode er sannsynligvis å strekke dette bildet vel langt. Likevel finnes det et poeng i at data-analyse må ses på som noe mer begrenset enn datavitenskap.

Digitale og datadrevne aspekter ved datavitenskap

Mange av de samme verktøyene, programmeringsspråkene og modellene benyttes i forbindelse med både datavitenskap og data-analyse. Likevel er det kanskje mulig å hevde at datavitenskap har en tydeligere forbindelse til at analysen faktisk skal være digital og datadrevet? Det er selvfølgelig ingen som driver med analyse på papir, men i utgangspunktet kan det være mulig å argumentere for at selv analog analyse kan inkluderes i dette begrepet.

For datavitenskap er det mer tydelig at prosessene spesifikt bygger på informatikk og bruk av dataverktøy, kombinert med statistikk og en rekke andre fagfelt. Det er i denne forbindelse som bruk av maskinlæring, artifisiell intelligens og big data også kommer inn i bildet.

Ved en enkel analyse av for eksempel salgstall, er oppgaven ofte begrenset til å vise til grove hovedtrekk fra den eksisterende dataen. Det er selvfølgelig mulig å trekke konklusjoner fra resultatene, og avkrefte eller bekrefte en hypotese. Ved bruk av datavitenskap kan det være at en slik prosess også utvides med modeller bygget på maskinlæring, som for eksempel kan lage en avansert prognose for hvordan salget vil utvikles i fremtiden.

Oppsummert finnes det ikke noe helt klart skille mellom analyse og datavitenskap, men datavitenskap som metode er i stort bredere, mer åpen og mer fremtidsrettet. Det er også denne åpenheten som gjør datavitenskap så spennende.