EUROMAP

AV KOLBJØRN HEGGSTAD

EU har i perioden frå 1992 og fram til i dag hatt ei rekkje utviklingsprogram innanfor området språkteknologi (på engelsk ofte kalla language engineering). Dei første åra vart det satsa mykje på grunnutvikling av teknologi og metodar. I den siste perioden har innsatsen vore meir retta mot utvikling av prototypar for språkverktøy med tanke på seinare kommersiell utnytting. I heile perioden har også innsamling av språktilfang og retningslinjer for tilrettelegging av ulike typar språkdata vore sentralt, både tale og tekst. Det er ein viktig føresetnad for utvikling av gode språkverktøy.

Arbeidet har vore bygd opp som prosjektarbeid, der kravet har vore at fleire nasjonar måtte delta, og at både forsking, industri og brukarar var representerte.

38 prosjekt

Til saman har 38 prosjekt vore gjennomførte i perioden, og det samla tilskottet til arbeidet frå EU har vore på om lag 900 millionar kroner.

Sjølv om no Europa sett under eitt kan seiast å ha bygd opp ein god kompetanse innanfor språkteknologi, ikkje minst med hjelp frå EU, er det enno langt igjen før vi kan seie at dei europeiske språka har språktekniske verktøy på nivå med det amerikansk-engelske nivået. Eit par av dei større europeiske språka har no fått ein del, men mykje vantar. Dessutan er kompetansemiljøa for vidare arbeid ulikt spreidde.

EU har ved fleire høve gjennom åra peikt på at dei nasjonale språka spelar ei nøkkelrolle sosialt, kulturelt, og for handel og politisk liv i Europa. Målet har vore å få fram ein språkteknologi som kan dekkje dei områda og brukarinteressene ein i dag kan sjå, og også at dei europeiske språka skal ha dei same vilkåra i informasjonssamfunnet.

Språktekniske produkt er oftast ikkje sjølvstendige produkt som kan seljast over disk, det er språktekniske funksjonar som skal innarbeidast i eller brukast saman med ei lang rekkje andre produkt, og som gjerne er internasjonalt utvikla, t.d. program for tekstbehandling, e-postsystem med omsetjing, søkjeprogram som finn informasjon på tvers av språk, osv. Dette er kommersielle produkt der produsentane ser på marknad og lønnsemd, og då fell gjerne små språkområde ut på grunn av økonomiske vurderingar. Då er det viktig at små europeiske nasjonar sjølv legg tilhøva til rette for eit eige språkteknisk utviklingsprogram. EU har med sine forskings- og utviklingsprogram prøvd å vise vegen og inviterer til ein europeisk dugnad.

EUROMAP

Med dette som bakgrunn vart det i regi av programområdet Language Engineering i EUs telematikkprogram sett i gang prosjektet EUROMAP. Dette var eit fellestiltak for alle medlemslanda i EU, supplert med EØS-landa Island og Noreg.

EUROMAP skulle styrast av ein prosjektleiar i kvart land som kunne knyte til seg medarbeidarar til ulike oppgåver. I Noreg var prosjektet formelt knytt til ID-gruppen, Oslo, men vart utført i praksis av IDE AS med Kolbjørn Heggstad som prosjektleiar. På sentralt europeisk nivå vart prosjektarbeidet koordinert av konsulentfirmaet Equipe Ltd., London.

Dei overordna måla for prosjektet var å finne ut korleis ein kunne byggje bruer mellom forskarmiljøa, brukarinteressene og industrien, få i stand ei betre samordning av forskings- og utviklingsmiljøa innanfor språkteknologi både på nasjonalt og europeisk plan, og stimulere til betre deltaking i felles europeiske prosjekt.

Dei praktiske oppgåvene som dei nasjonale prosjektgruppene fekk, var å kartleggje status innanfor språkteknologisk forskingsarbeid. Målet var vidare å finne moglege kommersielle utviklingsmiljø og leverandørar av språkprogramvarer, og – ikkje minst – få fram aktuelle og framtidige behov for informasjonstekniske språkprodukt og tenester i offentleg verksemd, i næringsliv og tenestesektorar og til privat bruk.

Dei resultata som arbeidet gav, skal brukast både i det strategiske planarbeidet i EU-kommisjonen og i medlemslanda.

Arbeidet i Noreg

I Noreg har det vore lite målretta forskings- og utviklingsarbeid med tanke på konkrete språkverktøy for marknaden. Det generelle opplegget frå EU for å kartleggje desse miljøa i Noreg gav få resultat, både i dei akademiske og frittståande forskings- og utviklingsmiljøa, og hjå kommersielle produsentar. Fleire forskingsmiljø stilte seg dessutan undrande til slike spørsmål frå EU som i kva grad brukarbehov og marknadsanalysar hadde spela inn ved val av forskingsoppgåver. Sjølvsagt var det visse unntak, men her var det tydeleg at mangelen på løyvingar til denne typen arbeid gjorde arbeidet vanskeleg.

I intervju og samtalar med statlege institusjonar og moglege industrikundar gjekk det tydeleg fram at språkteknologi var eit lite kjent emne.

Ein stor del av innsatsen i det norske EUROMAP-prosjektet vart derfor sett av til å spreie kunnskap om språkteknologi generelt, peike på at det var eit viktig nasjonalt satsingsområde, mellom anna fordi det ville vere ein viktig føresetnad for bruken av norsk språk på mange område i framtida. Dette har vore gjort gjennom foredrag, gjennom media og mange samtalar. Rapportane frå det norske arbeidet går inn i ein felles europeisk rapport som vil vere tilgjengeleg i haust. Rapporten tek for seg både status for språkteknologien i Europa, peikar på kommande utfordringar og gir tilrådingar med tanke på vidare arbeid.

Første fasen i EUROMAP-prosjektet vart avslutta i februar 1998. Neste steg er alt starta og vil vere ei vidareføring av prosjektet i eitt år framover. Det byggjer på det same nettverket med nasjonale aktørar. Ein skal no utnytte kontaktnettet og den felles europeiske kunnskapsbasen om språkteknologi som er bygd opp. Hovudaktivitetane vil vere å spreie kunnskap om språkteknologien, kva som er mogleg, og nytteverdien til potensielle brukarar, både nasjonalt og til tverrnasjonale verksemder.

I denne perioden skal EUs femte rammeprogram setjast i gang. EUROMAP har derfor fått som oppgåve å vise korleis og kvifor språkteknologi kan gå inn i ulike utviklingsprosjekt i det nye programmet, og kva nye krav som blir stilte til deltakarane.

EUROMAP vil i haust setje opp norske sider på Internett og byggje opp ei eiga informasjonsteneste der ein kan finne opplysningar om nasjonale og internasjonale språktekniske prosjekt, produkt og tenester. Ein skal også få hjelp til å etablere kontakt med internasjonale brukarar, utviklarar og produsentar på området.

 

-- Kolbjørn Heggstad er Noregs representant for språkteknologi i EU-programmet Telematikk og norsk koordinator for EUROMAP. Han var tidlegare førsteamanuensis ved Universitetet i Bergen og arbeidde med datalingvistikk.

Del denne siden

Del på Facebook Del på Twitter