Spis treści

Labeling of non-native pronunciation 2

Labeling procedure 2

Phoneme inventory 2

Anotacja segmentalna i suprasegmentalna 5

Anotacja błędów wymowy 7

Praca w programie Praat 9

Labeling of non-native pronunciation

Labeling procedure

The annotation contains a transcription of how the utterance was spoken by the speaker in relation to a reference transcription containing a canonical native pronunciation which has been produced automatically and then manually verified. The annotation procedure is similar to that proposed in (Bonaventura, Howarth & Menzel 2000) and involves the following steps: firstly, a trained phonetician – a native speaker of the target language (L2) verifies and corrects the canonical transcription and automatically generated phonetic segmentation. Then the annotator identifies the portions of the signal perceived as being incorrectly pronounced and marks deviations from the canonical pronunciation. If the annotator is not sure about a transcription or whether an error has occurred, the mispronunciation can be marked as uncertain (using the & symbol). In the next step, the resulting annotation is verified by a phonetician - a native speaker of the source language (L1) or an expert in German phonetics who confirm or reject the results of assessment of pronunciation errors provided by the first annotator. In case of rejection of pronunciation errors marked as certain a finer analysis (both perceptual and acoustical) are required before the final decision is taken.

The phonetic annotations were marked for three kinds of pronunciation errors at the phone level: substitutions, insertions and deletions. It is assumed that pronunciation errors result from (Bonaventura et al. 2000):

1.  Problems in the pronunciation of non-native sounds cause substitution of phonemes that do not exist in one’s mother tongue (L1) or are too difficult to pronounce with similar phones present in L1 e.g. the pronunciation of the grapheme ą (e.g. in mąż) by German students of Polish as /O~/ (as in Saison) instead of /ow~/, another example is the difficulty of realizing Polish palatalized consonants (e.g., /s’/, /z’/,/ t^s’/) or substitution of German vowels with the Polish ones.

2.  Carry-over of pronunciation regularities from L1 e.g., realization of /6/ (as in hart) instead of /r/ in Warszawa (/varSava/)

3.  Overgeneralizations of target language (L2) regularities which occur whenever the speaker chooses a possible pronunciation but in an inappropriate context e.g. /s’inus/ instead of /sinus/.

Each time a deviation from the canonical pronunciation is observed the annotator can choose from among the phoneme sets of L1 and L2. Realizations of phonemes not belonging to any of the phoneme sets but intermediate between the L1 phonemes and the target L2 phonemes should also be marked using special labels resulting in a creation of an inventory of intermediate phonemes.

Phoneme inventory

We use SAMPA for Polish and extended SAMPA for German (www.bas.uni-muenchen.de/forschung/Bas/BasSAMPA).

Polish SAMPA / German SAMPA
Phoneme / Orthography / Transcription / Phoneme / Orthography / Transcription
plosives
p (_p) / pik / pik / p (_p) / Pein / paIn
b (_b) / bit / bit / b (_b) / Bein / baIn
t (_t) / test / test / t (_t) / Teich / taIC
d (_d) / dym / dym / d (_d) / Deich / daIC
k (_k) / kat / kat / k (_k) / Kunst / kUnst
g (_g) / gen / gen / g (_g) / Gunst / gUnst
c / kiedy / cjedy
J / giełda / Jewda
Q / Arbeit / Qa:6baIt
fricatives
f / fan / fan / f / fast / fast
v / wilk / vilk / v / was / vas
s / syk / syk / s / Tasse / tas@
z / zbir / zbir / z / Hase / ha:z@
S / szyk / Syk / S / waschen / vaS=n
Z / żyto / Zyto / Z / Genie / Zeni:
s' / świt / s’fit
z' / źle / z’le
x / hymn / xymn / x / Buch / bu:x
C / sicher / zIC6
h / Hand / hant
j / Jahr / ja:6
affricates
pf / Pfahl / pfa:l
t^s / cyk / t^syk / ts / Zahl / tsa:l
d^z / dzwon / d^zvon
t^S / czyn / t^Syn / tS / Deutsch / dOYtS
d^Z / dżem / d^Zem / dZ / Dschungel / dZUN=l
t^s' / ćma / t^s’ma
d^z' / dźwig / d^z’vik
sonorants
m / mysz / myS / m / mein / maIn
n / nasz / naS / n / nein / naIn
n' / koń / kon’
N / pęk / peNk / N / Ding / dIN
liquids
l / luk / luk / l / Leim / laIm
r / ryk / ryk / r / Reim / raIm
w / łyk / wyk
j / jak / jak
w~ / ciąża / t^s'ow~Za
j~ / więź / vjej~s'
vowels
i / pik / pik / i / Politik
e / test / test / e / Meteor
a / pat / pat / a / Satz / zats
o / pot / pot / o / Politik
u / puk / puk / u / Kulisse
y / typ / typ / y / kyrillisch
i: / Lied / li:t
I / Sitz / zIts
Y / hübsch / hYpS
y: / süß / zy:s
o: / rot / ro:t
O / trotz / trOts
u: / Blut / blu:t
U / Schutz / sUts
e: / Beet / be:t
E / Gesetz / g@zEts
E: / spät / SpE:t
a: / Tat / ta:t
2: / Blöd / bl2:t
9 / plötzlich / pl9tslIC
diphtongs
aI / Eis / aIs
aU / Haus / haUs
OY / Kreuz / krOYts
unstressed vowels
@ / bitte / bIt@
6 / besser / bEs6
nasalized vowels
a~ / Restaurant
e~ / Teint
O~ / Saison
9~ / Parfum

Table 1: Polish and German SAMPA phoneme inventories.

Rys. 1: Przejście IPA-SAMPA, język niemiecki.

Table 2: Mapping of IPA to SAMPA (for German).

The Polish graphemes ą and ę are mapped to different phoneme sequences according to the context:

/em/ /om/ before /p/, /b/

/en/ /on/ before /t,/ /d/, /t^s/, /d^z/, /t^S/, /d^Z/

/en’/ /oń/ before t^s’, d^z’

/eN/ /oN/ before /k/, /g/

/ew~/ or /e/ for ę i /ow~/ for ą in the word-final position

/ew~/ for ę i /ow~/ for ą before /t^s/, /d^z/, /t^S/, /d^Z/, /S/, /Z/, /s/, /z/, /s’/, /z’/

/ej~/ before /s’/, /z’/ if preceded by palatal consonant e.g., mięśni (muscles), pięści (fists), więźniów (prisoners)

/oj~/ before /s’/ if preceded by palatal consonant e.g., usiąść (to sit)

/e/ /o/ before /l/ and /w/ e.g. zaczęli (they started) /za.t^Se.li/, wziął (he took) /vz’ow/

Jeśli chodzi o udźwięcznianie to przyjmujemy jako standard zarówno wymowę krakowsko-poznańską jak i warszawską. Czyli w pierwszym przypadku wstecznie udźwięczniane są spółgłoski zwarto-wybuchowe, zwarto-szczelinowe i szczelinowe występujące przed fonologicznie dźwięcznymi spółgłoskami (czyli tylko przed: b, d, g, z, v, z’, Z, d^z, d^Z, d^Z’). W drugim wariancie wymowy udźwięcznianie wsteczne dotyczy spółgłosek zwarto-wybuchowych, zwarto-szczelinowych i szczelinowych, ale występujących przed jakąkolwiek spółgłoską dźwięczną lub samogłoską. W przypadku gdy mówca wstawia pauzę po spółgłosce np. we frazie przyimkowej w domu (standardowo wymawiane jako /#v_#do.mu/ i realizuje ją jako spółgłoskę bezdźwięczną nie uznajemy tego za błąd i zapisujemy: /#f/#$p_#do.mu/.

W transkrypcji spółgłosek zwarto-wybuchowych wyróżniamy segment zwarcia i plozję. Jeżeli oba segmenty są zrealizowane to zapisujemy /t/, /d/ itd. Jeśli jednak zrealizowana jest tylko plozja (co ma miejsce między innymi wtedy gdy 2 te same spółgłoski zwarto-wybuchowe występują jedna po drugiej np. jest to) to wtedy zaznaczamy /_t/, /_d/ itd. czyli dla przykładu podanego w nawiasie transkrypcja będzie wyglądała następująco: #jes_t #to.

Anotacja segmentalna i suprasegmentalna

Oprócz transkrypcji i segmentacji (granice fonemów) panel anotacji (plik Textgrid w Praacie) zawiera różne diakrytyki i symbole:

a)  Granice wyrazów (zaznaczone #) i sylab (zaznaczone . przed sylabą). Rozróżniamy pomiędzy wyrazami prozodycznymi np. /#domu/ i ortograficznymi (przyimki „jednoliterowe” spółgłoskowe: v, z) np. /#v/ - w takich przypadkach zaznaczamy /#v_#domu/

b)  Akcent główny ” i poboczny ‘ (ten drugi tylko dla niemieckiego) zaznaczany po samogłosce akcentowanej. Niestandardową akcentuację zaznaczamy w ten sposób, że na sylabie, gdzie faktycznie akcent został zrealizowany umieszczamy znacznik ”, a w miejscu gdzie powinien się był znaleźć wstawiamy znacznik (”). W korpusie polsko-niemieckim przyjęto odwrotny zapis: akcent główny ' a poboczny ".

c)  Znak ‘ umieszczony po spółgłosce oznacza segment palatalny albo spalatalizowany (w przypadku niestandardowej wymowy polskich spółgłosek przez Niemców), np. wyraz ‘zielony’ zrealizowany jako /Z’e.lo.ny/ z miękkim /Z/ (w tym przypadku mówca dokonał substytucji oraz palatalizacji)

d)  Wyróżniamy 3 rodzaje pauz: standardowa (cisza) oznaczana jako #$p. Frazy, które mówca wstawił wewnątrz wyrazu oznaczamy jako /#$p. Pauzy wypełnione (delikatny szum - oddech itp.) zaznaczamy jako #$pf.

e)  Jeśli wyraz został przeczytany niepłynnie np. mówca zastanawiał się nad wypowiedzią i wydłużył którąś sylabę/dźwięk to taki wyraz oznaczamy umieszczając disf przed znakiem początku wyrazu np. /disf#s’e.d^z’et^s’/ (to jest ważne dla wyników analizy iloczasu)

f)  Inne informacje:

H aspiracja (po zwarto-wybuchowych), np. pH (zaznaczamy po spółgłosce). Przykład na rys. 5

usb rodzaj zakłócenia, nie dający się sklasyfikować dźwięk wyartykułowany przez mówcę, nie jest to błąd wymowy; usb traktujemy jako segment w wypowiedzi (co sprowadza się do tego, że zaznaczamy jego granice). Przykład na rys. 4

nib zakłócenie (chrząknięcia, westchnięcia, itp. ale nie szumy w mikrofonie spowodowane złymi ustawieniami); nib traktujemy jako segment w wypowiedzi (zaznaczamy jego granice)

hst na oznaczenie różnego typu jednostek nieleksykalnych takich jak hm, mhm, aha nie będących w scenariuszu; hst traktujemy jako jeden segment (zaznaczamy jego granice)

qphoneme na oznaczenie segmentów, które ze względu na jakość głosu nie nadają się do analizy akustycznej (np. creaky voice).Gdy cały wyraz nie nadaje się do analizy z powodu jakości głosu to można dać q za znakiem początku wyrazu.

&phoneme na oznaczenie tych realizacji fonemów, które uważamy za błędne, ale nie jesteśmy pewni co dokładnie zostało zrealizowane; można po znaku & napisać jaki dokładnie segment wchodzi w grę (np. nie jesteśmy pewni czy w wygłosie została zrealizowana schwa /@/ zamiast /e/ – zaznaczamy /e-&@/), ale nie jest to konieczne. W przypadku, gdy trudno określić jaki segment został zrealizowany zapisujemy samo &.

phoneme/L realizacja dźwięcznych spółgłosek zwarto-szczelinowych, zwarto-wybuchowych i szczelinowych jako spółgłosek lenes, np. d^z’/L oznacza częściowo ubezdźwięcznione dź (oceniając percepcyjnie realizację takich głosek słuchacz stwierdza, że mówca wypowiedział dź ale akustycznie jest ono bezdźwięczne – nie ma wykresu zmian częstotliwości podstawowej), np. /prav/L.do.po.do.bn'e/

w korpusie pl-pl i pl-de stosujemy dodatkowo:

phoneme/v – udźwięcznienie segmentu, który powinien być bezdźwięczny

phoneme/d – ubezdźwięcznienie segmentu, który powinien być dźwięczny

nie stosujemy /L (bo to jest traktowane jako standard w wymowie niemieckiej) ani /F

Na rysunku poniżej przedstawiono anotację fragmentu wypowiedzi, w której mówca zamiast częściowo ubezdźwięcznił spółgłoskę /z/ (brak wykresu przebiegu F0).


Rys. 2

phoneme/F realizacja dźwięcznych spółgłosek zwarto-szczelinowych, zwarto-wybuchowych i szczelinowych jako spółgłosek fortes (z większym napięciem narządów artykulacyjnych, przez co głoski charakteryzują się dużą intensywnością)

spell dla oznaczenia wtrąceń „wyrazopodobnych”; stosujemy gdy mówca zrealizował jakąś sylabę lub logatom, których nie było w scenariuszu i których nie można sklasyfikować jako błędów wymowy. Spell zaznaczamy jak segment (wstawiamy granice).

Anotacja błędów wymowy

Substytucje – jeżeli mówca zamiast głoski w języku docelowym zrealizował głoskę w języku źródłowym czyli np. zamiast długiego napiętego /e:/ powiedział /ej/ albo zamiast długiego napiętego /o:/ przeczytał /ow/ np. Polen /powl@n/. Domyślnie przyjmujemy, że mówca będzie dokonywał substytucji głosek w języku L2 poprzez głoski, które występują w L1. Ale może się zdarzyć, że będzie to segment fonetyczny „pomiędzy” albo pochodzący z innego języka znanego przez mówcę (np. z angielskiego). Jednym z celów anotacji jest zdefiniowanie inwentarza takich segmentów pośrednich.

Jeżeli fonemy w L1 i L2 mają taką samą transkrypcję w SAMPIE ale różne cechy artykulacyjne i akustyczne (np. /j/ klasyfikowane jako półsamogłoska w polskim i jako szczelinowa w niemieckim) i mówca dokonuje substytucji tego rodzaju to fonem z L2 oznaczamy asteriskiem np. /j-j*/

Na rysunku poniżej przedstawiono anotację fragmentu wypowiedzi, w której mówca zamiast /e/ w wygłosowej sylabie /mje/ zrealizował /@/, co jest zgodne z regułami fonetyki niemieckiej, ale nie polskiej.


Rys. 3

Wstawienia – jeżeli mówca wstawił jakąś dodatkową głoskę w wyrazie albo na granicy wyrazów np. jak poprzednio zamiast jednego długiego napiętego niemieckiego /e:/ przeczytał 2 głoski /ej/ albo wstawił segment zwany zwarciem krtaniowym na granicy sylab w wyrazach takich jak teatr np. /teQatr/ (czytane podobnie jak niemiecki Ozean). Jeżeli mówca dokonał wstawienia na początku wyrazu/sylaby, to umieszczamy za znakiem – znak początku wyrazu/sylaby (odpowiednio # i kropka), np. bardzo częste w wymowie Niemców realizowanie następu samogłoskowego ze zwarciem krtaniowym (zamiast następu miękkiego standardowego dla wymowy Polaków) zaznaczamy jako /-#Q#”aw.to/. Jeśli chodzi o granice segmentów wstawionych to muszą być one zaznaczone w takim miejscu, żeby granice sylab w przypadku wypowiedzi zrealizowanej standardowo i niestandardowo (tzn. ze wstawionym segmentem) były zgodne. Nie dotyczy to jednak wstawień usb, nib, spell i hst.

Na rysunku poniżej przedstawiono anotację fragmentu wypowiedzi, w której mówca dokonał insercji samogłoski /y/ po /r/ oraz zrealizował charakterystyczny dla języka niemieckiego następ samogłoskowy ze zwarciem krtaniowym zaznaczony jako -Q (w polskim występuje tylko w szczególnych przypadkach/kontekstach). Dodatkowo widzimy, że zamiast t^S mówca wypowiedział /t^s'/ co zaznaczone jest jako substytucja.


Rys. 4

Usunięcia (deletions) – występują gdy mówca nie zrealizował jakiejś głoski w wyrazie np. jeżeli Niemiec redukuje zupełnie głoskę /e/ w sylabie wygłosowej /er/ i zamiast /e/ i /r/ realizuje wokalizowane /r/ (w SAMPIE zapisywane jako /6/) np. besser /bEs6/ albo w szybkim tempie wymowy zamiast końcówki /en/ czyta /n/ np. waschen /vaSn/. Usunięcia zaznaczamy w taki sposób, żeby zgadzały się granice sylab np. mówca zamiast wieczorem (/#vje.t^So.rem/) powiedział wyraźnie wyczorem transkrybujemy jako /#v|j-y|e-|.t^S|o|.r|e|m/ i granice sylab (zaznaczone w przykładzie | podobnie jak granice fonemów) w obu przypadkach muszą być zgodne, więc granicę usuniętego segmentu /e/ zaznaczamy na długości (podstawionej) samogłoski /y/.