Fra sammensurium til struktur
Tekst er en ustrukturert form for informasjon, en l?pende sekvens av ord som kan stokkes om p? utallige ulike m?ter og likevel formidle det samme budskapet. Spr?kmodeller er prim?rt laget for ? prosessere og gjengi slike sekvenser, i motsetning til mer strukturerte data som tabeller, grafer, nettverk og liknende.
Sondre forsker p? teknikker for ? f? spr?kmodeller til ? resonnere og utnytte strukturert informasjon sammen med tekst. Eksempler p? strukturert informasjon kan v?re relasjonell informasjon som hovedsteder, hvem som bor hvor, slektskap og s? videre. For ? dra nytte av slik informasjon n?r den er representert i et strukturert format, m? de n?v?rende spr?kmodellene endres.
– Det krasjer veldig, for det er to ulike m?ter ? jobbe med informasjon p?. Derfor forsker jeg p? hvordan vi kan ha kontroll p? hva slags kunnskap som er i modellen. S?nn som det er n?, er alt et slags sammensurium av tekstmateriale modellene har sett under treningsfasen. Det er ingen garantier, forklarer Sondre.
Variert arbeidshverdag som stipendiat
Sondre beskriver hverdagene som varierte, men ogs? avhengige av hva slags arbeidsprosess han er i. Prosessen med ? f? publisert forskningsartikler starter ofte med en idéfase hvor mye av tiden g?r til ? s?ke i forskningsdatabaser etter artikler som ser relevante ut.
– Jeg synes det er helt topp ? kunne sitte og f? betalt for ? lese om kule ting og spennende ideer, r?per Sondre.
– Noen artikler leser jeg overfladisk, andre leser jeg n?ye. Kanskje diskuterer jeg en av artiklene med noen av de jeg deler kontor med, eller h?rer om veilederne mine har noen tanker om hva som st?r der.
I oppstartsfasen til et nytt prosjekt tar han gjerne fram en god gammeldags notatbok og skriver ned stikkord, tanker, formler og l?se ideer. Etterhvert g?r han over til ? programmere, for ? teste ut mulige l?sninger.
Det hender ofte at han 亚博娱乐官网_亚博pt手机客户端登录er med noen av de andre stipendiatene han deler kontor med. Da st?r de som regel ved tavlen og tester ut ideer, eller sitter sammen og parprogrammerer.
– Hvis jeg ikke jobber med en artikkel, s? underviser jeg. Det bruker jeg en del tid p?. Det tar mye lengre tid enn man tror, presiserer han.
Sondre har ogs? en del undervisningsoppgaver med ansvar for forelesninger, obligatoriske innleveringer og eksamen. I tillegg er det en del fagaktiviteter internt i forskningsgruppen som han kan v?re med, slik som forskningsseminarer og diskusjoner. Og kanskje er det foredrag ved andre institutter han har lyst til ? h?re p?.
– Det er lange dager og jobben er tidvis veldig frustrerende. Men om du har en indre motivasjon og en genuin faglig interesse, vil jeg absolutt anbefale en ph.d., erkl?rer Sondre entusiastisk.
Informatikk, lingvistikk og batikk
亚博娱乐官网_亚博pt手机客户端登录sgruppen teller omtrent 15 stykker og er ganske sammensveiset. Halvparten er stipendiater og i samme livssituasjon, s? de er flinke til ? finne p? mye sosialt utenom jobb.
– Det kan v?re alt fra ? dra ut og spise og ta en ?l til at vi har h?ndverksverksteder. En gang i m?neden gj?r vi et eller annet h?ndverk som ? male, tove, drive med leire eller batikk.
Ellers har de faste faglig-sosiale arrangementer som forskningsseminarer og lesegrupper. I lesegruppen er det en kollega som presenterer en artikkel som de synes er interessant, og s? diskuterer de artikkelen i plenum. P? den m?ten l?rer de mer om hva de andre driver p? med og kanskje finner de synergier som gj?r at de kan 亚博娱乐官网_亚博pt手机客户端登录e om et prosjekt. Selv om fellesnevneren er spr?kteknologi, driver de med ulike ting som ofte ber?rer andre fagfelt enn informatikk.
– Det er ikke s?nn at alt vi gj?r handler om ? utforme en mest mulig effektiv algoritme, for s? ? kvantifisere ytelsen til den algoritmen. Et vel s? stort sp?rsm?l innen spr?kteknologien er hvordan man skal vurdere spr?kmodeller. Hvordan vet man egentlig om en maskin forst?r spr?k? Er det en forskjell p? gjengivelse og forst?else? Dette er sp?rsm?l som ber?rer andre fagfelt enn informatikken, men som vi m? ta hensyn til n?r vi kommer med p?stander om hva et system kan eller ikke kan.
– En hellig gral av tverrfaglighet
– I gruppen for spr?kteknologi kan vi tilby hele pakka. Du kan jobbe med sp?rsm?l og teknikker fra statistikk, matematikk, lingvistikk, spr?kfilosofi og psykologi. Alle disse omr?dene er ul?selig knyttet til spr?k, for spr?k er en av de prim?re m?tene vi som mennesker uttrykker oss selv.
– Den spesifikke tekniske l?sningen som ligger til grunn for de fleste systemene for maskinl?ring i dag ble opprinnelig utviklet for ? forbedre oversettelsen mellom spr?k, men etterhvert viste det seg at den ogs? kunne brukes til ? generere tekst, tale, bilde og video. Det sier noe om hvor kraftig spr?k og tekst er som informasjonsstruktur.
Etter doktorgraden ?nsker Sondre ? fortsette med forskning hvis han f?r mulighet til det. Han ser ogs? for seg muligheter innenfor privat oppdragsforskning hos institusjoner som Sintef, Simula eller Norsk regnesentral.
– En eller annen forskningsn?r jobb, konkluderer Sondre.
Sondre Wold
Bachelorutdanning: NTNUMasterutdanning ved UiO: Informatikk: spr?kteknologi
Jobb: doktorgradsstipendiat i spr?kteknologi ved UiO