Zapisovanje govora

Darinka VERDONIK

Univerza v Mariboru, Fakulteta za elektrotehniko, računalništvo in informatiko
Avgust 2025

Podatke iz govora na posnetkih lahko podrobno in učinkovito analiziramo šele, če je govor tudi zapisan. To je časovno zamudna naloga, ki pa se na prvi pogled ne zdi preveč strokovno zahtevna. V praksi pa se že po prvih stavkih srečamo s primeri, ki odpirajo veliko vprašanj in zahtevajo dogovor o pravilih zapisovanja.

1      Z ločili ali brez njih?

V besedilih smo navajeni ločil in rabe velikih začetnic na začetku povedi. To nam olajša razumevanje. Enako nam ločila pomagajo, ko beremo zapis govora. Toda ko postavimo v zapis govora ločila, s tem izgovorjeno interpretiramo. Enote govora (glej članek Enote govora na portalu Govorjena slovenščina) so nekoliko drugačne kot enote v pisnem besedilu in s postavljeno vejico ali ločilom za konec povedi hitro zavedemo v interpretacijo, ki ni povsem skladna z nameravanim pomenom.

V konverzacijski analizi, disciplini jezikoslovja, ki se najbolj poglobljeno ukvarja prav z analizo pogovora, se je zato vzpostavila tradicija, da se ločila in velika začetnica povedi v zapisu govora ne uporabljajo. Namesto tega se zelo natančno označujejo premori, podaljšani zlogi, dviganje in spuščanje intonacije, poudarjanje, izrazito glasnejši ali izrazito tišji izgovor, sprememba tempa govora, vdihi in izdihi, različne oblike smeha in govorjenja ob smehu, hreščeč ali tresoč govor in podobno. Takšen zapis je zelo nazoren in natančen, zahteva pa še veliko več časa, kot je že tako ali tako potrebnega za zapis govora, in bralca, ki je vešč v razbiranju pomena dodanih oznak v zapisu. Primeren je za gradiva manjšega obsega, ne pa za obsežne korpusne zbirke z več 100 urami posnetkov govora.

V korpusnem jezikoslovju je zato število dodatnih oznak, ki bi nakazovale, kako je bilo besedilo izgovorjeno, minimalno. Vseeno pa so ostali zadržki do nadomeščanja teh oznak z ločili v zapisu. O najnovejši izdaji govorne enote korpusa British National Corpus njegovi avtorji navajajo, da zapisovalci niso smeli uporabljati ločil, ker bi bila njihova uporaba pri označevanju mej govora nedosledna in za analize zavajajoča. Na voljo so imeli samo dve posebni oznaki: »(.)« za krajše premore do 5 sekund in »(…)« za daljše premore nad 5 sekund. Tudi v prvi izdaji slovenskega govornega korpusa Gos je veljala praksa, da se ločila in velika začetnica povedi ne uporabljajo.

Ob vzponu jezikovnih tehnologij pa se vendarle dogaja prehod na uporabo ločil v zapisu govora. Glavni razlog je potreba tehnologij za razpoznavanje govora, da pridobijo gradivo, na katerem se lahko učijo algoritmi za avtomatsko postavljanje ločil v govorjeno besedilo. Če si predstavljamo razpoznavalnik govora, ki prikazuje podnapise k video vsebinam ali ki pretvori naš govor v besedilo na zaslonu, avtomatsko dodana ločila pomenijo boljšo uporabniško izkušnjo. Aktualne smernice za zapisovanje govora v slovenskem jeziku tako vključujejo zapis z vsemi ločili in velikimi začetnicami.

2      Dobesedno?

Govor je prepleten s premori, ponovitvami, popravki, oklevanji in drugimi netekočnostmi (glej članek Kako tekoč je govor v resnici na portalu Govorjena slovenščina). V podnapisih k video vsebinam ali prepisih javnih govorov, kot so recimo nastopi politikov v državnem zboru, ter drugih zapisih govora za namene dokumentiranja vsebine je povzet pomen, vsa popravljanja, obotavljanja in druge netekočnosti pa so izpuščeni iz zapisa. Tudi nekateri razpoznavalniki govora so naučeni tako, da predstavijo urejen zapis govora brez eee-jev in popravljanj.

Toda netekočnosti so pomemben element za mnoge analize, ne samo tiste, ki se namenoma osredotočajo na netekočnosti, ampak tudi druge, na primer tiste, ki analizirajo potek in strukturo pogovora, prilagajanje govorca okoliščinam, skladnjo govorjenega jezika ali strategije tvorjenja pomena. Predvsem pa z odstranitvijo netekočnosti predrugačimo to, kar je govorec dejansko povedal. V korpusnem jezikoslovju zato velja praksa, da zapišemo vedno vse dobesedno tako, kot je govorec izgovoril, vključno z vsemi besednimi fragmenti, zapolnjenimi premori (eee-ji, mhm-ji in podobno), onomatopoetičnimi ponazoritvami (frrfrr, blblbl) in drugimi polverbalnimi ali neverbalnimi izrazi, ki jih govorec izgovori. Tak zapis je sicer na zaslonu veliko težje berljiv, a edini odraža dejansko podobo našega govora.

3      Knjižno ali po slušnem vtisu?

Besede v pisavi zapisujemo vedno na isti, dogovorjen način. Dol je vedno zapisano kot dol. Izgovorjeno pa je lahko kot dov, duol, dole, doli, dovta, dul, dule … Če zapišemo vsakič tako, kot slišimo, izgubimo informacijo, da gre za fonetične variacije besede, ki ima isto slovnično funkcijo (je prislov), isti pomen (izraža gibanje ali smer proti nižjemu kraju) in je tudi etimološko izpeljana iz iste osnove. Če pa zapišemo vedno samo dol, izgubimo informacijo o raznolikosti izgovorjav, ki obstajajo v govorjenem jeziku.

Zlasti v slovenščini sorodnih jezikih, kot so slovaški, češki ali hrvaški, pa tudi v nemškem in drugod, se zato pri zapisovanju govora v korpusih uporabita kar oba načina, najprej po slušnem vtisu (za tak zapis se je uveljavilo poimenovanje pogovorni ali dobesedni), nato pa še knjižno ali standardno. Čeprav to pomeni dvojno delo, prinaša tudi pomembne prednosti: prvič, zapis natančno odraža dejansko podobo besed in besednih oblik; drugič, omogoča bolj podrobno luščenje za govor značilnih besed in besednih oblik iz korpusa; tretjič, omogoča bolj natančen avtomatsko pripravljen fonemski zapis podatkov.

4      Kaj pa polverbalni in neverbalni elementi govora?

Govor niso samo jasno artikulirane besede. Je niz glasovnega valovanja, v katerem se pojavijo tudi neverbalni ali polverbalni elementi. Za nekatere, kot so mhm, aha, mh, imamo vnose celo že v slovarjih in je oblika njihovega zapisa že ustaljena. Za mnoge pa smo se šele ob prvih zapisih govora začeli spraševati, kako jih zapisati, da ohranimo informacijo o njihovi prisotnosti v govoru, hkrati pa zapis kolikor mogoče poenotimo.

Pri tem je bil vedno prvi cilj, da je zapis unikaten, tako da se loči od že obstoječih besed. Zapolnjene premore, ki zvenijo a-jevsko, zato raje kot a zapišemo s tremi črkami, aaa. Podobno zapišemo, če je zapolnjeni premor bolj polglasniški (eee) ali zvočniški (mmm, nnn).

Polartikulirani glasovi niso samo zapolnjevalci premorov, izražajo lahko tudi čustva, na primer iii, ijoj, uuu, ali pa posnemajo glasove ali zvoke, npr. govor otrok (blblbl), zvok stroja (trrr) in podobno. Lahko imajo celo zelo jasen pomen, kot je glasovno zanikanje: nn ali aa.

Polverbalne in neverbalne glasove je včasih res težko zapisati, saj so lahko tako neartikulirani, da je težko reči, kateremu glasu bi bili najbolj podobni in kako jih ustrezno predstaviti s črkami. Pogost je recimo nekakšn ck, ki se sliši pred začetkom govorjenja, ampak ne posnema nobenega zvoka, je samo zvok, ki se sliši, ne da bi kakorkoli prispeval k vsebini govora.

Zapisovanje govora je preplet jezikoslovnih, tehničnih in metodoloških vprašanj, ki se odprejo že ob prvih nekaj stavkih zapisa. Od tega, kako uporabljamo ločila, kako zapisujemo pogovorne in narečne izogovorjave ter različne polverbalne ali neverbalne glasove, je odvisno, kako natančno bomo glasovno podobo govora ohranili za nadaljnje analize.

5      Literatura

BNC 2014 (2018). The British National Corpus 2014: User manual and reference guide (version 1.1). http://corpora.lancs.ac.uk/bnc2014/doc/BNC2014manual.pdf.

Verdonik, D., Gostenčnik, J. (2024). Smernice za zbiranje podatkov za govorne vire. Maribor: Univerza v Mariboru, Fakulteta za elektrotehniko, računalništvo in informatiko. https://dk.um.si/IzpisGradiva.php?id=87973.

Verdonik, D., Trojar, M., Bizjak, A. (2024). Prednosti in slabosti dvotirnega zapisovanja govora v slovenskih govornih virih. V Krajnc Ivič, M. (ur.). Stanje in perspektive uporabe govornih virov v raziskavah govora. Maribor: Univerza v Mariboru, Univerzitetna založba. 63-79. https://press.um.si/index.php/ump/catalog/book/898/chapter/48.

To delo je ponujeno pod licenco Creative Commons: Priznanje avtorstva-Deljenje pod enakimi pogoji 4.0 Mednarodna.

This work is licensed under the Creative Commons Attribution-ShareAlike 4.0 International.

https://creativecommons.org/licenses/by-sa/4.0