Nynorskrobot styrker mediespråket

No image

Automatisk oversettelse fra bokmål til nynorsk er gull verdt for nyhetsbyråene. Med hjelp fra Nasjonalbiblioteket kan også andre dra nytte av denne språkteknologiske nyvinningen.

AV ERLEND LØNNUM

Nasjonalbiblioteket fortsetter samarbeidet med Nynorsk pressekontor, NTB og Språkrådet om å videreutvikle den såkalte nynorskroboten, som oversetter nyhetstekster fra bokmål til nynorsk. I 2020 gir Nasjonalbiblioteket ytterligere 500 000 kroner til språkprosjektet.

Resultatet er at nyhetsbyråene bruker mindre tid på å oversette og mer tid på å lage redaksjonelt stoff. Tilbudet av nynorsk byråstoff har med dette blitt mye større.

Enestående verktøy

– Vi er svært glade for at Nasjonalbiblioteket vil være med på videreutviklingen av nynorskroboten vår og ser verdien av arbeidet vårt for å styrke det norske språket generelt. At nyhetssakene våre kan legge grunnlaget for innovasjon og språkteknologi, er enestående, sier tidligere redaktør i Nynorsk pressekontor, Karoline Riise Kristiansen, i en pressemelding fra sitt eget byrå og søsterbyrået NTB.

– I tillegg samsvarer det godt med samfunnsoppdraget til Nynorsk pressekontor, som har et eget ansvar for å styrke det nynorske mediespråket.

Karoline Riise Kristiansen understreker at roboten aldri vil bli helt ferdig utviklet. Så lenge språket utvikler seg, må teknologien følge med i tiden. Hun understreker også at roboten ikke vil klare å oversette alt helt perfekt, selv om de nærmer seg et optimalt nivå.

– En ting roboten ikke får gjort noe med, er dårlig bokmål!

Dessuten er det noen navn og ord som kan skape problemer for automatikken. For eksempel ville «Sigurd Høst» bli oversatt med «Sigurd Haust» og «Moses» med «blir mosa». I slike tilfeller trengs det fortsatt manuelle justeringer.

Verdiskaping for fellesskapet

Nynorsk pressekontor fikk Nasjonalbiblioteket med på laget i høst, da så mange som 37 000 parallelltekster på nynorsk og bokmål, til sammen 74 000 saker, ble overført til biblioteket for videre bruk i språkteknologisk forskning og tjenesteutvikling. Tekstene er nyhetsartikler produsert av NTB og oversatt av Nynorsk pressekontor.

Hege Stensrud Høsøien, direktør for fag og forskning i Nasjonalbiblioteket, sier at hun er stolt over å få være med på dette aktverdige prosjektet, som er viktig for blant annet Språkbanken.

– Språkbanken er en tjeneste i Nasjonalbiblioteket som tilbyr data til språkforskere og virksomheter som utvikler språkteknologiske produkter. Parallelltekst av høy kvalitet er gull verdt for språkteknologisk utvikling. Slike data blir brukt til en rekke formål, blant annet til å utvikle digitale læremidler tilpasset nynorskbrukere. Nynorskroboten er utviklet med åpen kildekode, slik at tjenesten på sikt vil kunne brukes av både private og offentlige virksomheter, sier Høsøien.

Samarbeidet vil øke produksjonen av parallelltekster på nynorsk og bokmål, styrke kvaliteten til nynorskroboten og gjøre det enklere for andre å bruke den til egne formål.

Fakta om nynorskroboten

Seks ansatte ved Nynorsk pressekontor har fått et hjelpemiddel ingen har hatt før. En robot oversetter daglig 100 nyhetsartikler fra NTB. Fortsatt må et menneske med god kompetanse i nynorsk sjekke robotens oversettelse før teksten kan sendes ut.

I en gjennomsnittlig artikkel oversetter roboten 95 prosent av tekstens ord korrekt. Men i korte, enkle saker om vanlige emner får den ofte 100 prosent treff.

Hvis skribenten velger å ordlegge seg mer kunstferdig, gjør roboten flere bommerter. Ualminnelige språkstykker viser seg å være kinkige for den digitale pressepersonen.

Noe av utfordringen er at roboten må trenes ved at den ser eksempler fra det aktuelle saksområdet. Nynorsk pressekontor viste seg å være en aldri så liten gullgruve for denne typen kunstig intelligens, for byrået satt på en bank av oppdaterte parallelltekster.

Kilde: Aftenposten 12.10.2019

Del denne siden

Del på Facebook Del på Twitter