Data Scientist i Skatteetaten

Christian Alm Grindheim bruker data og maskinl?ringsmodeller til ? hindre skattekriminalitet og ? gj?re det lettere for vanlige innbyggere ? betale riktig skatt.

Christian sitter foran PC p? kontoret.

Foto: Aina Louise C. Haukeland/UiO

Som data scientist bruker Christian programmering, matematikk og statistikk til ? finne vise frem resultater og m?nstre i store datasett. Jobben er prosjektbasert, og frem til n? har han jobbet med to ulike prosjekter. Det f?rste handlet om ? finne ut om norske innbyggere melder inn feil fradrag p? skatten.

– Fradrag gj?r at man kan betale mindre skatt. Et eksempel er reisefradrag, der man kan f? litt mindre skatt hvis man pendler til jobb.

– Noen skriver for lite fradrag, mens andre pr?ver ? lure til seg mer. Modellene vi bruker klassifiserer folk og finner de som har st?rst sannsynlighet for ? ha meldt inn feil. Disse personene blir plukket ut til kontroll.

Det neste prosjektet han startet p? handler om bedrifter som g?r konkurs. Skattetetaten f?lger med p? bedrifter med spesielt h?y risiko for dette.

– N? jobber jeg med konkursprediksjon, der m?let er ? forutsi om en bedrift vil g? konkurs. Skatteetaten m? v?re oppdatert p? de ?konomiske forholdene til hver enkelt bedrift, slik at de kan sikre en riktig gjennomf?ring av konkursprosessen.

Modeller som viser risiko for skattesvindel

Maskinl?ringsmodeller er nyttige verkt?y n?r saksbehandlere i Skatteetaten skal kontrollere om innbyggerne betaler riktig mengde skatt. I stedet for ? gj?re tilfeldige stikkpr?ver, kan man gj?re kontroller blant de personene hvor sannsynligheten for skatteunndragelse er st?rst.

– Maskinl?ringsmodellen bruker mye forskjellig informasjon til ? finne ut av hvem som har h?yere sannsynlighet for skattesvindel. Men det er ikke s? enkelt ? si at disse personene er mer tilb?yelig til ? unndra skatt. Det er ikke bare én type personer som pr?ver seg p? det, forklarer Christian. 

Sjekker og renser data

– For at maskinl?ringsmodellene skal fungere, m? dataene de mates med v?re i riktig format. Mesteparten av jobben min g?r ut p? ? rense data. Vi sjekker at dataene er riktige og m? kanskje endre litt p? dem. Vi bruker programmeringsspr?k som Python og SQL til dette, forteller Christian.

Christian studerte Matematikk med informatikk og bruker i dag maskinl?ring og IT til ? bekjempe skattekriminalitet. Foto: Aina Louise C. Haukeland/UiO

I stedet for ? utvikle maskinl?ringsmodeller fra bunnen av, trener Skatteetaten modeller basert p? kodebibliotek. Kodebibliotek inneholder ferdigskrevet kode og er tilgjengelig for alle p? internett. Christian l?rte mye om ? bruke slike biblioteker da han studerte ved Universitetet i Oslo.

– Vi bruker gjerne biblioteker som vi l?rte fra studiet. XGBoost er den type kodebibliotek som vi har brukt mest. 

Brukes innen alt fra s?ppelt?mming til finans

Skatteetaten er et av Norges st?rste IT-milj?er, med over 1000 ansatte i IT-avdelingen. Det store arbeidsmilj?et gj?r at Christian er omgitt av kollegaer med mye kunnskap om IT og utvikling.

– Jeg jobber alltid i team, og det er aldri soloprosjekter. Man har sine egne oppgaver, og s? utveksler vi erfaring og hjelper hverandre hvis det er behov for det.

– Milj?et er variert, og siden data science er et s?pass nytt fagfelt, er gjennomsnittsalderen rundt 32 ?r. Mange er utdannet innenfor informatikk, men noen kommer ogs? fra kjemi eller kybernetikk. Fellesnevneren er realfag og IT.

Selv har Christian en bachelor i matematikk og en mastergrad i data science. Han anbefaler sterkt de som vil jobbe med maskinl?ring ? studere matematikk.

– Matematikk gir et godt grunnlag for ? forst? modellene og det som blir gjort!

– Jeg visste at det var analyse jeg ville jobbe med, og synes at data science gj?r den kuleste formen for analyse. Jeg kan ikke komme p? en eneste industri hvor ikke data science kan bidra. Det kan brukes innen alt fra s?ppelt?mming til finans!

 

Christian Alm Grindheim

Yrke: Data Scientist hos Skatteetaten
Bachelorutdanning ved UiO: Matematikk med informatikk, studieretning Statistikk og Data Science
Dette studieprogrammet er n? erstattet av: Matematikk: data, modellering og beregninger.
Masterutdanning ved UiO: Data Science
Fullf?rt grad: 2022.

Les om flere ting du kan bli med utdanningen Matematikk: data, modellering og beregninger.

Emneord: Matematikk, Data science, skattekriminalitet, Maskinl?ring, modellering Av Malene Langvik-Hansen
Publisert 3. juni 2024 12:18 - Sist endret 5. juni 2024 11:31