Zašto prikupljamo dječji govor?

Gordana HRŽICA

Sveučilište u Zagrebu, Edukacijsko-rehabilitacijski fakultet
Rujan 2025

Jedna od najvećih misterija ljudskog uma jest kako djeca tako brzo i uspješno usvoje jezik. U samo nekoliko godina, od prvih nesigurnih slogova do bogatog i složenog izražavanja, djeca svladavaju sustav koji odraslima djeluje nevjerojatno složen. Iako jezik svakodnevno upotrebljavamo bez razmišljanja, način na koji se on razvija u djetinjstvu i dalje je predmet intenzivnog znanstvenog proučavanja. Razumjeti kako djeca uče jezik znači razumjeti temeljne procese ljudskog mišljenja, komunikacije i socijalnog razvoja. Upravo zato snimke dječjeg govora imaju posebnu vrijednost: one bilježe trenutke u kojima se jezik gradi i mijenja, i omogućuju nam da pratimo put od prvih riječi do složenih rečenica.

1 Zašto su snimke važne?


Snimke dječjeg govora pružaju podatke koji su važni i za znanost i za društvo. One se upotrebljavaju u različite svrhe:

  • Istraživanje jezičnog razvoja. Snimke se upotrebljavaju za istraživanje jezičnog razvoja jer omogućuju otkrivanje faza u kojima se jezik oblikuje i razumijevanje razlika među djecom.
  • Usporedbe među jezicima. Snimke omogućuju usporedbu dječjeg govora na različitim jezicima te praćenje njihovih sličnosti i razlika.
  • Jezična dijagnostika. Snimke se koriste za razvoj materijala koji služe za procjenu jezičnih sposobnosti i za terapijski rad logopeda. Snimke spontano proizvedenog dječjeg govora pokazuju tipične obrasce, ali i varijacije koje se mogu usporediti s govorom djece koja imaju jezične teškoće. Na taj se način stvaraju pouzdani testni zadaci i primjeri na kojima logopedi mogu temeljiti procjenu i terapijske postupke.
  • Tehnologija. Snimke pridonose razvoju alata za automatsko prepoznavanje i analizu govora.
  • Obrazovanje. Snimke se upotrebljavaju za izradu nastavnih materijala i prilagodbu poučavanja jezika.
  • Kulturna baština. Snimke doprinose očuvanju govora današnje djece za buduće naraštaje.

Na taj način svaka snimka postaje dio šire priče o jeziku, to jest postaju resurs koji nadilazi pojedinačno dijete i doprinosi razumijevanju čovjeka kao bića koje govori.

2 Kako se snima dječji govor?

Da bi snimke bile što autentičnije, djecu se potiče na spontano izražavanje u situacijama koje su im bliske i prirodne. To može biti:

  • razgovor s roditeljem ili vršnjakom,
  • prepričavanje priče ili događaja,
  • opis slike ili predmeta,
  • slobodna igra u kojoj dijete samo stvara i oblikuje govor.

Upravo u takvim trenucima nastaju najvrjedniji uzorci: dijete bira vlastite riječi, gradi rečenice i pokazuje kako razumije jezik.

Snimanje se provodi pomoću kvalitetnih uređaja, u mirnom okruženju, a snimke se zatim pažljivo transkribiraju i dopunjuju metapodacima – primjerice o dobi djeteta i okolnostima snimanja. Takvi podaci omogućuju znanstvenicima da razumiju i okolinkse čimbenike koji mogu utjecati na razlike u dječjem jeziku.

3 Gdje se snimke čuvaju?

Kako bi bile dostupne istraživačima širom svijeta, snimke i transkripti dječjeg govora pohranjuju se u posebne baze podataka. Najpoznatija je CHILDES (Child Language Data Exchange System) – međunarodna baza u kojoj se čuva većina korpusa dječjeg jezika prikupljenih u različitim jezicima. CHILDES omogućuje istraživačima da uspoređuju podatke iz različitih jezika i kultura, a pritom nudi i alate za pretraživanje i analizu govora. CHILDES je dio sustava TalkBank, a time i dio CLARIN-a, što znači da su resursi javno dostupni.

Postoje različite vrste korpusa: neki sadrže longitudinalne podatke (praćenje govora iste djece kroz dulje vrijeme), dok su drugi krossekcijski (uzorci govora veće skupine djece različite dobi u jednom trenutku). Osim toga, postoje i specijalizirani korpusi koji se temelje na pripovijedanju priča ili opisivanju slika. Tako je, na primjer, za hrvatski jezik u bazi CHILDES dostupno nekoliko korpusa koji nude raznolik uvid u dječji govor:

  • Kovačević korpus (Kovačević korpus u CHILDES-u). Ovaj korpus sadrži longitudinalne snimke troje djece od početka govora do treće godine života te je bogato anotiran za morfosintaktički razvoj.
  • Hrvatski korpus predškolskog dječjeg jezika (CCPCL) (CCPCL u CHILDES-u). U ovom korpusu nalaze se krossekcijski uzorci govora više od 90 djece u dobi od 2;6 do 6;0, prikupljeni u standardiziranim razgovornim situacijama.
  • Croatian MAIN korpus (Croatian MAIN u CHILDES-u). U ovom korpusu nalaze se pripovijedanja i prepričavanja priča prema instrumentu Multilingual Assessment Instrument for Narratives (MAIN), što omogućuje usporedbe s drugim jezicima.
  • TKH Frog Story korpus (TKH Frog Story u CHILDES-u). U ovom korpusu nalaze se dječja prepričavanja slikovnice Frog, Where Are You?, koja daju uvid u razvoj narativnih sposobnosti u predškolskoj i ranoj školskoj dobi.

4 Etički okvir

Prikupljanje dječjeg govora zahtijeva strogo poštivanje etičkih načela. Roditelji ili skrbnici uvijek daju pristanak za sudjelovanje, a privatnost i anonimnost djece dosljedno se čuvaju. Time se osigurava da istraživanje ne donosi rizike, nego samo koristi – za sudionike, za znanost i za zajednicu.

5 Reference

MacWhinney, B. (2019). Understanding spoken language through TalkBank. Behavior Research Methods, 51, 1919–1927.

Kempe, V. (2024). Four decades of open language science: The CHILDES and TalkBank projects. Language Teaching Research Quarterly, 44, 45–59.

MacWhinney, B. (1985). The CHILDES Project: The Child Language Data Exchange System. Behavior Research Methods, Instruments, & Computers, 17(2), 99–129.

Roy, D. K., Frank, M. C., DeCamp, P., Miller, M., & Roy, B. (2009). Exploring word learning in a high-density longitudinal corpus. Cognitive Science, 33(8), 1548–1564.

Zakaj zbiramo otroški govor?

Gordana HRŽICA

Sveučilište u Zagrebu, Edukacijsko-rehabilitacijski fakultet
September 2025

Ena največjih skrivnosti človeškega uma je, kako otroci tako hitro in uspešno usvojijo jezik. V le nekaj letih – od prvih negotovih zlogov do bogatega in zapletenega izražanja – otroci obvladajo sistem, ki se odraslim zdi neverjetno zapleten. Čeprav jezik vsak dan uporabljamo brez razmišljanja, način, kako se razvija v otroštvu, ostaja predmet intenzivnega znanstvenega preučevanja. Razumeti, kako se otroci učijo jezik, pomeni razumeti temeljne procese človeškega mišljenja, komunikacije in socialnega razvoja. Prav zato imajo posnetki otroškega govora posebno vrednost: beležijo trenutke, ko se jezik gradi in spreminja, ter nam omogočajo, da spremljamo pot od prvih besed do zapletenih stavkov.

1 Zakaj so posnetki pomembni?

Posnetki otroškega govora zagotavljajo podatke, ki so pomembni tako za znanost kot za družbo. Uporabljajo se v različne namene:

  • Raziskovanje jezikovnega razvoja. Posnetki se uporabljajo za raziskovanje jezikovnega razvoja, saj omogočajo odkrivanje faz, v katerih se jezik oblikuje, in razumevanje razlik med otroki.
  • Primerjave med jeziki. Posnetki omogočajo primerjavo otroškega govora v različnih jezikih ter spremljanje njihovih podobnosti in razlik.
  • Jezikovna diagnostika. Posnetki se uporabljajo za razvoj gradiv, ki služijo za oceno jezikovnih sposobnosti in za terapevtsko delo logopedov. Posnetki spontanega otroškega govora pokažejo tipične vzorce, pa tudi variacije, ki jih je mogoče primerjati z govorom otrok z jezikovnimi težavami. Na ta način nastajajo zanesljive testne naloge in primeri, na katerih lahko logopedi utemeljijo ocenjevanje in terapevtske postopke.
  • Tehnologija. Posnetki prispevajo k razvoju orodij za samodejno razpoznavanje in analizo govora.
  • Izobraževanje. Posnetki se uporabljajo za izdelavo učnih gradiv in prilagoditev poučevanja jezika.
  • Kulturna dediščina. Posnetki prispevajo k ohranjanju govora današnjih otrok za prihodnje generacije.

Na ta način vsak posnetek postane del širše zgodbe o jeziku, torej vir, ki presega posameznega otroka in prispeva k razumevanju človeka kot govorečega bitja.

2 Kako se snema otroški govor?

Da bi bili posnetki čim bolj avtentični, se otroke spodbuja k spontanemu izražanju v situacijah, ki so jim blizu in naravne. To je lahko:

  • pogovor s staršem ali vrstnikom,
  • pripovedovanje zgodbe ali dogodka,
  • opis slike ali predmeta,
  • prosta igra, v kateri otrok sam ustvarja in oblikuje govor.

Prav v takšnih trenutkih nastanejo najdragocenejši vzorci: otrok izbira lastne besede, gradi stavke in pokaže, kako razume jezik. Snemanje poteka s kakovostnimi napravami, v mirnem okolju, posnetki pa se nato skrbno transkribirajo in dopolnijo z metapodatki – na primer o starosti otroka in okoliščinah snemanja. Takšni podatki omogočajo znanstvenikom, da razumejo tudi okoliščinske dejavnike, ki lahko vplivajo na razlike v otroškem jeziku.

3 Kje se posnetki hranijo?

Da bi bili dostopni raziskovalcem po vsem svetu, se posnetki in prepisi otroškega govora shranjujejo v posebne podatkovne baze. Najbolj znana je CHILDES (Child Language Data Exchange System) – mednarodna baza, v kateri je shranjena večina korpusov otroškega jezika, zbranih v različnih jezikih. CHILDES raziskovalcem omogoča primerjavo podatkov iz različnih jezikov in kultur, hkrati pa ponuja orodja za iskanje in analizo govora. CHILDES je del sistema TalkBank in s tem tudi del CLARIN-a, kar pomeni, da so viri javno dostopni.

Obstajajo različne vrste korpusov: nekateri vsebujejo longitudinalne podatke (spremljanje govora istih otrok skozi daljše obdobje), drugi pa so presečni (vzorci govora večje skupine otrok različnih starosti v nekem trenutku). Poleg tega obstajajo tudi specializirani korpusi, ki temeljijo na pripovedovanju zgodb ali opisovanju slik. Tako je na primer za hrvaški jezik v bazi CHILDES na voljo več korpusov, ki ponujajo raznolik vpogled v otroški govor:

  • Korpus Kovačević (korpus Kovačević v CHILDES-u). Ta korpus vsebuje longitudinalne posnetke treh otrok od začetka govora do tretjega leta starosti ter je bogato označen z morfosintaktičnimi podatki.
  • Hrvaški korpus predšolskega otroškega jezika (CCPCL) (CCPCL v CHILDES-u). V tem korpusu so presečni vzorci govora več kot 90 otrok, starih od 2;6 do 6;0, zbrani v standardiziranih pogovornih situacijah.
  • Croatian MAIN korpus (Croatian MAIN v CHILDES-u). Ta korpus vsebuje pripovedovanje zgodb po instrumentu Multilingual Assessment Instrument for Narratives (MAIN), kar omogoča primerjave z drugimi jeziki.
  • TKH Frog Story korpus (TKH Frog Story v CHILDES-u). Ta korpus vsebuje otroška pripovedovanja ob slikanici Frog, Where Are You?, ki ponujajo vpogled v razvoj narativnih sposobnosti v predšolskem in zgodnjem šolskem obdobju.

4 Etični okvir

Zbiranje otroškega govora zahteva strogo spoštovanje etičnih načel. Starši ali skrbniki vedno dajo soglasje za sodelovanje, zasebnost in anonimnost otrok pa se dosledno varujeta. Tako je zagotovljeno, da raziskovanje ne prinaša tveganj, temveč le koristi – za udeležence, znanost in skupnost.

5 Literatura

MacWhinney, B. (2019). Understanding spoken language through TalkBank. Behavior Research Methods, 51, 1919–1927.

Kempe, V. (2024). Four decades of open language science: The CHILDES and TalkBank projects. Language Teaching Research Quarterly, 44, 45–59.

MacWhinney, B. (1985). The CHILDES Project: The Child Language Data Exchange System. Behavior Research Methods, Instruments, & Computers, 17(2), 99–129.

Roy, D. K., Frank, M. C., DeCamp, P., Miller, M., & Roy, B. (2009). Exploring word learning in a high-density longitudinal corpus. Cognitive Science, 33(8), 1548–1564.