Vokaler

Published in

Uttale.no

6 min readJun 11, 2017

I dette innlegget skal vi se på hva en vokal er. Hvordan lager du en vokal? Hvordan oppfattes den? Dere får her en kjapp introduksjon i både formanter og akustisk rom, og hvorfor disse er viktige når man snakker om vokaler. Til slutt ser vi hva som skjer når man skal lære seg et nytt vokalsystem. Dette innlegget er av teoretisk art og inneholder ikke undervisningsforslag.

Hva er egentlig en vokal?

På barneskolen lærer vi at vokaler er de lydene vi kan synge (selv om Hanson kom og ødela den regelen!). Senere får vi vite at vi som oftest trenger minst én vokal per stavelse. Nesten alle språk må ha minimum en vokal per ord, men hvor mange vokaler et språk har, varierer veldig. Spansk har for eksempel bare fem, mens norsk har hele 18 (19 om vi teller med schwa)! De fleste språk har mer enn tre, og det vanligste er mellom fem og sju vokaler.

I denne videoen fra The Ling Space (engelsk) blir vokalsystemet forklart:

Vokalen blir av Store norske leksikon definert som «en stemt lyd, med fri passasje for luftstrømmen ut gjennom munnen langs tungens midtlinje, uten hørbar friksjonslyd». Disse luftstrømmene endrer vi til forskjellige lyder ved hjelp av både tunge og lepper. Hvis du har tunga langt bak, kan du uttale en /u/ (skrevet O, som i ‘sol’), men hvis du dytter tunga fremover blir lyden nærmere en /ʉ/ (skrevet U som i ‘mur’) og deretter en /y/ (skrevet Y som i ‘lys’). På den sistnevnte lyden må du også endre leppeposisjonen din en hel del for å få til en norsk /y/-lyd.

Her kan du leke deg litt med de forskjellige posisjonene og forsøke å få frem alle de norske vokalene. Hva må du endre på for å gå fra /y/ til /u/?

Fig. 1. Munnhulen som representert hos Pink Trombone
‘bare handed speech synthesis’ *https://dood.al/pinktrombone/*

Lyden skapes i strupen, i stemmebåndene, og formes deretter i munnhulen. Her legges det på noen ekstra frekvenser, og disse kaller vi formanter. Når vi flytter rundt på tunga og endrer leppeposisjonen, endrer vi på frekvensen til formantene. Denne frekvensen måler vi i Hertz (Hz).

I denne videoen fra The Ling Space ser du hvordan formanter fungerer (engelsk). Hele videoen er interessant hvis du vil lære mer om hva formanter er. Denne lenken tar deg derimot rett til den delen hvor man former lyder.

For å finne ut hvilken lyd vi hører, trenger vi Hertzverdiene til første og andre formant. Verdien til første formant (F1) bestemmes av åpningsgraden i munnen, nærmere bestemt tungas posisjon. En åpen vokal, som /æ/, vil ha en høy verdi (ca. 800 Hz), mens en lukket vokal, som /i/, vil ha en lav verdi (ca. 200 Hz). Den andre verdien (F2) bestemmes av om tunga er langt fremme eller langt bak i munnen. En fremre vokal, som /i/, vil ha en høy verdi (ca. 2100 Hz), mens en bakre vokal, som /u/, vil ha en lav verdi (ca. 700 Hz). Hvis man runder leppene, som ved /y/, vil verdien til F2 senkes noe. En /i/ har som nevnt en verdi på ca. 2100 Hz, mens å runde leppene til en /y/ kan senke verdien til 1800 Hz.

Fig. 2. Det norske vokalsystemet som vist i en vokalfirkant i CALST (http://www.calst.no/l1-l2map/). Pilillustrasjonene er lagt til av forfatteren i ettertid.

Slike vokalfirkanter gir ofte et forenklet og strømlinjeformet bilde av hvordan systemet egentlig er. De er basert på kardinalvokaler, et referansesystem som er praktisk for generell oversikt, men litt vanskeligere å effektivt benytte seg av når man ser på språkspesifikke forskjeller (se under om kategorier). Da er vokaler plassert etter formantverdier mer anvendbare. Kristoffersen (2000) har målt alle formantverdiene i standardisert østnorsk. Hvis vi plotter inn disse i en vokalfirkant, får vi et litt mer presist, dog rotete, bilde:

Fig. 3. Det norske vokalsystemet etter formantverdiene i Kristoffersen (2000), (Wikimedia v/Peter238)

Fremdeles er ikke bildet helt komplett, for en vokal er ikke ett punkt i det akustiske rommet. Vokaler eksisterer innenfor en kategori som spenner fra én Hertz-verdi til en annen. Den norske /ʉ:/-en er for eksempel plottet inn på F2-verdien 1500 Hz i figur 3, men det viser seg at nordmenn oppfatter alle lydsignalene mellom 1100 og 2100 Hz som en /ʉ/ (Knudsen 2013). Det vil si at vi har en lydkategori kalt ‘norsk /ʉ/’, som dekker området fra 1100 til 2100 Hz (F2) i det vi kaller et akustisk rom.

Så hva er et akustisk rom? Det kan beskrives som de lydsignalene vi er i stand til å høre. Et voksent menneske kan høre frekvenser mellom 20 og 16,000 Hertz. Alle mennesker deler altså et tilnærmet identisk akustisk rom, men vi har delt det inn i forskjellige kategorier etter hvilket morsmål vi har.

Vokaltilegnelse

En vokal er altså det lydsignalet som kommer ut av munnen din og inn i øret til mottakeren. Hvilken lyd mottakeren hører, kommer an på morsmålet hans. Når vi lærer oss å snakke, fyller vi hele det akustiske rommet med kategorier fra morsmålet. Alle lydsignaler blir oppfattet som noe, så hele det akustiske rommet blir kategorisert.

Likevel kan morsmålsbrukere være uenige i hva som er hvilken lyd i grensesonene mellom kategoriene. Dette ser vi i de grå områdene i figur 4 under. Se på den øverste linjen, L1 NO, som er morsmålsnorsk. Grensen mellom norsk /u/ og /ʉ/ er ikke definitiv, som vi ser av det grå området ved 1000 Hz. Denne frekvensen blir av og til oppfattet som /u/-kategorien, og av og til som /ʉ/-kategorien. Grensen mellom /ʉ/ og /y/ er derimot helt klar.

Fig. 4. Kategorisering i den delen av det akustiske rommet, 600 Hz — 2700 Hz, som er viktig for F2 (andre formant). Morsmålsbrukere av norsk (L1 NO), kinesiske innlærere av norsk (L2 NO) og morsmålsbrukere av mandarin (L1 CM)(Knudsen 2013).

Figuren over viser hvor forskjellig personene med de ulike morsmålene oppfattet vokalene /u/, /ʉ/ og /y/. Hvis vi ser nærmere på /ʉ/-kategorien, ser vi at den lyden spenner fra 1100 til 2100 Hz hos de med morsmålsnorsk (L1 NO). Hos kineserne (L1 CM) finnes det derimot ikke en /ʉ/-kategori. De Hertz-verdiene som kategoriseres som /ʉ/ på norsk, er her delt mellom det som på mandarin er /u/ og /y/. Dette skyldes selvsagt at /ʉ/ -lyden ikke eksisterer i mandarin, og dermed har den ikke en kategori i det kinesiske akustiske rommet.

I midten (L2 NO) ser vi det akustiske rommet til kinesere som er på vei til å lære seg norsk. Her er det store områder som er skraverte, altså at de ikke er helt sikre på hvilken lyd de hører. Dette er som forventet i en innlæringsfase. Det som er interessant å merke seg er at de bortimot har kopiert den kinesiske /u/-kategorien inn i det norske systemet. Den norske /u/-kategorien slutter allerede ved 900 Hz i morsmålsnorsk, men strekker seg helt til 1400 Hz i morsmålsmandarin. I mellomspråksnorsken har de faktisk utvidet den ytterligere 100 Hz.

Den /y/-kategorien som finnes i mandarin har disse innlærerne derimot utslettet til fordel for en begynnende norsk /ʉ/-kategori. Det er rimelig å anta at de i utgangspunktet, på bakgrunn av sitt kinesiske morsmål, ville oppfattet norsk /y/ og norsk /ʉ/ som representanter for den samme kategorien. Når de nå likevel oppfatter norsk /ʉ/, så skyldes det at de har blitt gjort oppmerksomme på at det eksisterer en kategori kalt /ʉ/ i norsk. De vet den skal være der, men de vet ikke helt hvor. En slik overdreven identifikasjon av en ny kategori kan vi kalle hyperkorreksjon. På dette stadiet er altså kategorien opprettet i det akustiske rommet, og fokuset kan nå ligge på å justere kategorigrensene slik at de samsvarer med morsmålsnorsk. Hvordan disse grensene endrer seg under innlæring, skal vi se på i et senere blogginnlegg.

Har du spørsmål? Send meg en epost, skriv en kommentar, eller legg igjen en kommentar på Facebook