Talegjenkjenning i de tusen hjem

No image

Norske hjem, biler og arbeidsplasser fylles i disse dager av teknologi for talegjenkjenning. Utfordringen er å lage gode tjenester som fungerer på norsk.

AV BENEDICTE FROSTAD OG ÅSE WETÅS

«Ring onkel Arne», sier du på kav arendalsk til Siri på telefonen din. Men Siri finner ikke onkel Arne, selv om han er oppført i kontaktene dine. Leksikonet til talegjenkjenningen i Siri mangler nemlig en transkripsjon som ligger nær nok opp til arendalsdialekten.

Tidkrevende og kostbar utvikling

Flere datautviklere tilbyr talegjenkjenning for sentral østlandsdialekt, men systemet gjenkjenner ikke dialekter som skiller seg mye fra den. Skal flere dialekter kunne gjenkjennes, kreves det mer kunnskap og flere og bedre språkteknologiressurser i talegjenkjenningsproduktene. Vi trenger først og fremst

  • uttaleleksikon med transkripsjoner som dekker flere uttalevarianter per ord
  • store taledatabaser som dekker en større del av dialektmangfoldet
  • lingvister som har god kunnskap om norske dialekter, bokmål og nynorsk, og som kan utvikle ressursene

Dette er også nødvendig for at dikteringsverktøyene skal holde et høyt presisjonsnivå. Presisjon er avgjørende blant annet for universell utforming, og dermed en forutsetning for at flere kan delta i arbeidslivet.

Vi er allerede mange som tar i bruk talegjenkjenning når vi kommuniserer med digitale assistenter: Vi slår av og på lys, åpner og lukker vinduer og styrer andre funksjoner i hjemmet ved hjelp av f.eks. Google Home. Slike digitale assistenter er særlig praktiske for mennesker med begrenset bevegelighet.

Vi er enda flere som styrer funksjoner på datamaskiner og håndholdte enheter ved hjelp av f.eks. Google Assistant og Siri: De åpner og lukker programmer for oss og sender dikterte meldinger og e-poster. I en velutstyrt moderne bil kan vi med de integrerte assistentene styre temperatur, bilstereo og en rekke andre funksjoner. Talestyringen gjør at føreren kan holde blikket på veibanen, og det gjør trafikken tryggere.

Automatisk diktering og teksting

Mange land bruker allerede automatisk diktering i offentlige og private institusjoner, som nasjonalforsamlinger, domstoler og helsevesen. Det sparer samfunnet for mange arbeidstimer og mye penger og frigjør tid til mer krevende oppgaver. Det gjør det også mulig å produsere tekster raskere, til og med i sanntid. Med teksting av video- og lydopptak i sanntid kan de som ikke hører så godt, følge med på mange flere direktesendinger.

Europeiske pressebyråer har god erfaring med å bruke talegjenkjenning til automatisk diktering og teksting av lyd og video. Med denne teknologien kan man blant annet lettere sjekke fakta i nyhetssendinger og partilederdebatter på direkten.

Offentlig sektor må stille opp

Hvis taleteknologien skal være inkluderende i Norge, må den ta hensyn til norske dialekter. Hvis vi ikke kan bruke vårt eget språk og vår egen dialekt når vi snakker til bilen, smarthøytaleren og dikteringsverktøyet, kan det føre til frustrasjon og fremmedgjøring. I verste fall kan vi komme til å velge bort de nye teknologiske løsningene. Eller kanskje like ille: Vi mister vårt eget språk i møtet med teknologien.

De store utviklerne av talegjenkjenning i inn- og utland er klar over utfordringene dialektmangfoldet i Norge byr på, men de får ikke tak i taledatabaser og andre nødvendige ressurser. De sliter også med å finne nok medarbeidere med kompetanse i norske dialekter og målformer.

Utviklerne kan ikke alene bære ansvaret med å utvikle taleteknologi. Norsk er et lite språk. Det er minst like dyrt å utvikle gode digitale grunnlagsressurser for norsk som for de store verdensspråkene. Derfor må vi alle være med på å dra lasset: Offentlige organer sitter på store mengder taledata som de må gjøre tilgjengelige for utviklerne. Universitetene må sørge for at språkteknologien kommer inn i relevante studieprogrammer. Næringslivet må få tak i lingvister med rett kompetanse. Og Språkrådet og Nasjonalbiblioteket må fortsette å lage databaser og leksika slik at det kan utvikles gode tjenester og produkter for alle.

Ellers gir vi opp å ringe onkel Arne.

 

-- Benedicte Frostad er seniorrådgiver og Åse Wetås direktør i Språkrådet.

Innlegget stod på trykk i Computerworld 27/9.

Del denne siden

Del på Facebook Del på Twitter