Å navigere i skriftspråkets rom

Hvilke deler av de offisielle rettskrivningsnormene blir faktisk benyttet, og hvordan henger de sammen med hverandre? Det skal nå undersøkes.

AV HELGE DYVIK

Det er vanskeligere å telle språk enn å telle sauer – og derfor også mindre søvndyssende. Mens en saueflokk består av klart adskilte individer med tellbare hoder og ben, minner telling av språk ofte mer om telling av skyer på himmelen. Bare delvis adskilte svever de der, noen store og massive, andre små og tynne, og der én person ser to skyer i intim kontakt, ser en annen én langstrakt sky med tynn midje. Et spørsmål som «Hvor mange norske skriftspråk finnes det?» kan da minne om spørsmålet «Hvor mange skyer er det på himmelen i dag?» Det er vanskelig å finne et klart svar i begge tilfeller.

Det vil si: Hvis man søker et offisielt svar, er det ikke vanskelig i det første tilfellet. En viktig oppgave for offisielle lover og regler er å påtvinge en flytende og graduell virkelighet en tellbar og håndterlig struktur. Offisielt har vi nøyaktig to norske skriftnormaler: bokmål og nynorsk. Men disse to navnene dekker over adskillig variasjon, og langt mer enn i de fleste andre etablerte skriftspråk; dette er en følge av norsk språkpolitikk i forrige århundre. Både i bokmål og i nynorsk kan svært mange ord skrives og bøyes på flere ulike måter.

Offisielt er all denne variasjonen enkeltordsanliggender som beskrives under de enkelte oppslagene i én ordbok for bokmål, eller én for nynorsk. Enkeltordsanliggender må det nemlig være hvis forestillingen om nøyaktig to, og ikke flere, skriftspråk skal la seg opprettholde. Selv om det finnes mange ord som tillater alternative skrivemåter innenfor hvert av de to norske skriftspråkene, legger den offisielle normen ingen føringer på de formvalg et skrivende menneske måtte treffe på tvers av ulike ord: Alle valg lar seg kombinere med alle andre uten at det støter an mot offisiell norm. En setning som «Skoa til jenten blei sparket av og kasta ut døren til gata» er offisielt like korrekt som en hvilken som helst annen kombinasjon av godkjente formvarianter av disse ordene i samme rekkefølge.

Sprekker i det offisielle skydekket

Hvis norsk bokmål faktisk hadde vært så føringsløst som dette – hvis virkelige bokmålstekster hadde truffet hvert formvalg helt uavhengig av alle andre formvalg, slik at alle logisk tenkelige kombinasjoner av formvalg hadde forekommet – så hadde bokmålet ganske riktig vært én og bare én sky, eller rettere sagt ett jevnt skydekke av den sorten som dekker hele himmelen på en tung og grå dag. Det samme gjelder nynorsken og dens himmel.

Men slik er det ikke. Hvis vi med 'korrekt' ikke mener 'offisielt korrekt', men heller 'i overensstemmelse med de uformulerte normene som i praksis styrer folks språkbruk og intuisjoner', så er eksempelsetningen ikke korrekt skriftlig norsk. Mange språkbrukere har tilnærmet sammenfallende intuisjoner om hvordan disse formvalgene henger sammen i språklig og stilistisk konsistente tekster. Ofte har sammenhengene form av ensidige implikasjoner: Hvis man på bokmål skriver kasta, skriver man helst også døra, mens døra på sin side synes forenlig med både kastet og kasta. Av dette følger at døren på sin side impliserer kastet. Blant disse fire formene har altså valg av kasta eller døren implikasjoner, mens valg av kastet eller døra ikke har det – hvis da de nevnte intuisjonene er korrekte.

På lignende måte er det nærliggende å anta at en hunkjønnsform som saka impliserer en hunkjønnsform som boka, mens boka på sin side synes forenlig med både saken og saka. Dette kan reflektere en tilbøyelighet til at valg av hunkjønnsform ved abstrakte substantiver impliserer valg av hunkjønn ved konkrete substantiver, men ikke vice versa. Et lignende implikasjonsforhold kan det se ut til å bestå mellom konkrete substantiver uten landlige konnotasjoner og konkrete substantiver med slike konnotasjoner (hytte, ku), slik at valg av hunkjønn ved de førstnevnte impliserer valg av hunkjønn ved de sistnevnte, men ikke vice versa. I den grad disse intuisjonene holder, venter vi å finne relativt mange bokmålstekster med kombinasjoner som de følgende:

saken – boken – hytten
saken – boken – hytta
saken – boka – hytta
saka – boka – hytta

Derimot venter vi å finne få eller ingen tekster med kombinasjoner som disse:

*saka – boken – hytten
*saka – boka – hytten
*saka – boken – hytta
*saken – boka – hytten

Disse tomrommene i bokmålets tekstunivers utgjør i så fall glimt av blått på en delvis skyet himmel. Slike implikasjonsforhold mellom formvalg gir variasjonen innenfor skriftnormalene en struktur som fører til mer eller mindre klart adskilte subvarieteter (undervarianter) av bokmål og nynorsk – et fremstigende mønster av skyer på blå bakgrunn.

En empirisk undersøkelse

Men stemmer intuisjonene med virkeligheten? Virkeligheten utgjøres i denne sammenheng av mengdene av faktiske skrevne bokmålstekster og nynorsktekster. Som det er vist ovenfor, har formimplikasjoner av de nevnte typene direkte konsekvenser for formvalgmønstrene i den enkelte tekst. Slike implikative sammenhenger mellom former kan derfor leses ut av valgmønstrene i tekstene. Dermed kan strukturene av intrikat overlappende subvarieteter innenfor bokmål og nynorsk gjøres til gjenstand for en empirisk undersøkelse: Vi kan gå til tekstene, bevæpnet med egnede statistiske redskaper, og se hvordan det faktisk forholder seg.

Arbeidet i Språkrådets fagråd for normering og språkobservasjon trenger nettopp slik kunnskap om forholdet mellom den offisielle normens register av muligheter og faktisk skriftspråklig praksis. Fagrådet har derfor tatt initiativ til et prosjekt av den beskrevne art. Mulighetene for å gjennomføre en slik undersøkelse er blitt betydelig bedre i de senere år, med fremveksten av store elektroniske tekstkorpora, forsynt med grammatisk informasjon om det enkelte ord, og kraftige datamaskinelle redskaper for søking i og bearbeidelse av store datamengder. I første omgang, i 2009, har vi satt i gang et mindre pilotprosjekt basert på et utvalg av avistekster, der selve metoden skal utprøves og utvikles. Vi håper å kunne presentere noen foreløpige resultater fra dette prosjektet på Språkdagen 2009 i november. Tekstutvalget i pilotprosjektet er såpass avgrenset at det først og fremst er selve metoden vi håper å kunne belyse. Men på lengre sikt er det meningen at språkobservasjonen skal kunne skje innenfor rammen av en slik registrering av normklynger i et større tekstunivers, der en 'normklynge' er en opphopning av tekster rundt visse sammenhengende sett av formvalg – kumulusskyer i de liberale offisielle normenes himmelrom.

Vi kan forestille oss at valgfriheten innenfor de offisielle normene skaper et flerdimensjonalt rom der tekstene plasserer seg. Hver ordform med valgmuligheter (det vil si hvert 'morfosyntaktisk ord') er en dimensjon i et slikt rom. For eksempel er 'bite +V +Pret' (fortid av 'bite') en dimensjon på bokmål fordi formen kan realiseres alternativt som bet eller beit, mens 'gje +V +Inf' (infinitiv av 'gje') er en dimensjon på nynorsk fordi formen kan realiseres som gjeva, gjeve, gje eller gi. På grunnlag av et grammatisk tagget tekstkorpus kan vi så automatisk registrere hvor hver enkelt tekst plasserer seg langs hver enkelt dimensjon som forekommer i teksten, gjennom å registrere hver form som kunne ha vært annerledes. Slik blir enhver konsekvent tekst et punkt i rommet, der en 'konsekvent' tekst er enhver tekst som alltid skriver det samme morfosyntaktiske ord på samme måte, og ikke varierer f.eks. mellom gata og gaten, mens tekster med inkonsekvenser av denne typen vil dekke mer enn ett punkt. Deretter kan en slags geometrisk analyse vise oss i hvilken grad tekstene danner klynger i rommet, hvordan disse klyngene fordeler seg, og hvilke dimensjoner – altså ordformvalg – som er særlig viktige for tekstenes plassering. For eksempel vil formvalg som viser seg å implisere andre formvalg, være viktigere enn slike som ikke gjør det.

Noen spørsmål å søke svar på

Hvis vi baserer en slik undersøkelse på et omfattende og representativt tekstgrunnlag, kan resultatene av analysen gi svar på mange spørsmål. For det første: Hvilke deler av den offisielle normen blir faktisk benyttet – overhodet, eller i det minste innenfor dominerende normklynger? For det annet, hvor mange normklynger kan vi identifisere innenfor de to målformene, og hvordan er de korrelert med teksttyper? For det tredje: Når vi bruker uttrykk som 'moderat bokmål', 'radikalt bokmål', 'tradisjonell nynorsk', 'normkjernenynorsk', osv., beskriver vi da realiteter eller abstraksjoner? La oss for eksempel rent hypotetisk tenke oss at 'moderat bokmål' betegner en relativt enhetlig operativ subnorm, i den forstand at relativt mange språkbrukere har tilnærmet sammenfallende intuisjoner om hvordan formvalgene henger sammen i denne varieteten, mens 'radikalt bokmål' ikke i samme grad betegner en enhetlig subnorm, men i større grad summen av et sett mulige avvik fra moderat bokmål. Dette ville i så fall sannsynligvis komme til syne som en tydelig normklynge rundt de 'moderate' formvalgene, mens tekstene ville vise større spredning i normrommet forøvrig. En slik distribusjon ville gi et empirisk grunnlag for å hevde at 'moderat bokmål' betegner en eksisterende subvarietet av bokmål, mens 'radikalt bokmål' i større grad er en abstraksjon.

Et poeng med prosjektet er å gjøre det mulig å undersøke slike antagelser empirisk. Det som her er presentert, er likevel bare tidlige ideer og planer for hvordan vi kan benytte moderne kraftige databehandlingsmetoder til å finne svar på språklige normspørsmål som det tidligere har vært vanskelig å nærme seg empirisk. Det er mye som ennå skal på plass før prosjektet kan ta av og sette kursen mot det språklige himmelrom, både av datagrunnlag og utprøvning av metoder.

 

-- Helge Dyvik er professor i allmenn språkvitenskap ved Universitetet i Bergen.

Del denne siden

Del på Facebook Del på Twitter

Publisert:23.09.2009 | Oppdatert:10.06.2015