Sikker som Språkbanken

I hvelvet til Språkbanken finnes det store verdier som nå også kommersielle aktører kan ha utbytte av i utviklingen av digitale tjenester på norsk.

AV ARNE MARTINUS LINDSTAD

I en digitalisert verden dominert av engelsk legger Språkbanken til rette for å utvikle digitale tjenester og produkter for talt og skrevet norsk. Det er avgjørende for at norsk språk også i framtiden skal være i bruk på alle samfunnsområder.

Gullet i hvelvet

I Nasjonalbibliotekets tjeneste Språkbanken ligger Norsk ordbank, selve gullet i bankhvelvet. Ordbanken er en omfattende samling normerte ord med bøyingsformer på nynorsk og bokmål. Samlingen eies og forvaltes av Språkrådet og Universitetet i Bergen og ligger til grunn for de populære nettordbøkene Bokmålsordboka og Nynorskordboka.

Ordbanken gir store muligheter for å utvikle norsk språkteknologi. Nylig ble det mulig også for kommersielle utviklere å benytte seg av samlingen. Det kan bidra til bedre stavekontroller og skrivestøtteprogrammer for nynorsk og bokmål og til bedre undervisningstjenester.

Tilgjengelig for alle

Språkbanken samler inn, tilrettelegger og produserer språklige databaser og datasett som er tilgjengelige i en nettkatalog. Målet er at utviklere av tjenester, programmer og apper skal kunne laste ned nødvendige grunnlagsdata fra Språkbanken.

For å lage for eksempel en talegjenkjenner – et dataprogram som gjør at man kan snakke til en datamaskin som så skriver det man sier – trenger man enorme mengder forhåndsanalyserte data som kan «lære» datamaskinen de mange måtene mennesker snakker på. Det gjelder blant annet toneleie, volum og dialekt. For at telefonene våre skal kunne foreslå hvilke ord vi skal skrive, må de ha innebygd statistisk analyserte ordlister, der ord velges etter hvor hyppig de forekommer i løpende tekst. Slike data og ordlister finnes i Språkbanken (se språkbanken.no).

Språkbankens tjenester kan benyttes av alle, men de er først og fremst beregnet på private og offentlige aktører og språkforskere ved universiteter og høyskoler.

 

-- Arne Martinus Lindstad er forskningsbibliotekar for Språkbanken ved Nasjonalbiblioteket.

Del denne siden

Del på Facebook Del på Twitter