Uporabniki

Uporabniki posnetkov bodo večinoma raziskovalci, ki preučujejo slovenski govorjeni jezik v jezikoslovju ali sorodnih družboslovnih in tehničnih vedah.

Uporabniki bodo tudi razvijalci jezikovnih in govornih tehnologij, kot so razpoznavanje govora, strojno razumevanje pomena govora in strojno prevajanje govora.

Uporabniki bodo lahko tudi vsi ostali, ki bi želeli posnetke uporabiti za svoje raziskave ali razvoj tehnologij za slovenski jezik.

Anonimnost govorcev

Govorci bodo označeni z anonimno kodo, ki ne bo razkrivala njihove identitete. Podatek o imenu in priimku govorca in kontaktni podatki ne bodo javno objavljeni skupaj s posnetkom, ampak bodo dostopni samo urednikom zbirke za potrebe upravljanja baze oziroma pravic posameznikov in nagradnega tekmovanja. 

Posnetki in zapisi bodo povezani s podatki o okoliščinah snemanja in anonimnimi kodami govorcev.

Obdelava posnetkov

Posnetki bodo del govorne baze slovenščine. K posnetkom bodo lahko dodani zapisi govora, ki ga slišimo na posnetkih.

Zapisi govora bodo lahko dodatno označeni s podatki o izgovoru, oblikah besed, stavčnih strukturah, pomenu, čustvenem tonu in podobno.

Dostopnost posnetkov

Posnetki iz govorne baze slovenščine bodo dostopni prek nacionalnega repozitorija za jezikovne vire in tehnologije CLARIN.SI. Bazo bo mogoče prenesti pod eno od odprtih licenc, kot je Creative Commons.

Dostop do posameznih izjav v posnetkih bo mogoč tudi prek specializiranih iskalnikov za jezikovne vire, imenovanih konkordančniki. Primer takšnega dostopa je govorni korpus Gos, ki je dostopen prek konkordančnikov CJVT, Clarin noSketch Engine ali Clarin Kontext.

Upravljavec osebnih podatkov na portalu Govorjena slovenščina je Inštitut za elektroniko in telekomunikacije, Fakulteta za elektrotehniko, računalništvo in informatiko, Univerza v Mariboru (UM FERI), Koroška cesta 46, 2000 Maribor.

Kontakt pooblaščene osebe za varstvo podatkov je na voljo tukaj: https://www.um.si/o-univerzi/dokumentno-sredisce/varstvo-osebnih-podatkov/   

Portal Govorjena slovenščina je namenjen zbiranju posnetkov vsakdanje slovenščine in njihovi javni objavi z namenom uporabe za raziskave govora in razvoj digitalnih orodij za slovenski jezik ter kot arhiv jezikovne kulturne dediščine.

UM FERI obdeluje naslednje osebne podatke uporabnikov portala:

  • ime, priimek in email registriranega uporabnika, ki naloži posnetek na portal
  • kontaktni e-poštni naslov in druge kontaktne podatke
  • avtomatsko določen ID vsakega oddanega posnetka
  • število govorcev na posnetku
  • kraj in regija snemanja
  • prostor, kjer so bili govorci (npr. doma v dnevni sobi…)
  • žanr in tip govora (npr. družabni pogovor)
  • datum snemanja
  • kanal govora
  • podatki o napravi, s katero je bilo izvedeno snemanje
  • opis situacije, v kateri je nastal posnetek
  • ključne besede, ki so lahko v pomoč pri iskanju, opisu ali kategorizaciji
  • zapis govora.

Od navedenih podatkov podatek o imenu in priimku in kontaktni podatki ne bodo javno objavljeni skupaj s posnetkom, ampak bodo dostopni samo urednikom zbirke za potrebe upravljanja baze oziroma pravic posameznikov ter analitike in nagradnega tekmovanja.

UM FERI dodatno obdeluje naslednje podatke govorcev na posnetkih:

  • ime in priimek
  • spol
  • starost
  • izobrazba v 4 stopnjah (OŠ ali manj, SŠ, višja ali visoka šola, fakulteta ali več)
  • prvi jezik
  • dvojezičnost od rojstva
  • dodaten prvi jezik v primeru dvojezičnosti
  • sedanji kraj in občina bivanja
  • kraj in občina bivanja v otroštvu
  • dodaten kraj in občina daljšega bivanja
  • druge geografske in jezikovne podatke, ki izhajajo iz zgornjih podatkov.

Od navedenih podatkov podatek o imenu in priimku ne bo javno objavljen skupaj s posnetkom, ampak bo dostopen samo urednikom zbirke za namene upravljanja pravic govorcev.

Posnetki se na portalu zbirajo na podlagi privolitve govorcev. Privolitev kadar koli prekličete, ne da bi to vplivalo na zakonitost obdelave podatkov, ki se je na podlagi privolitve izvajala do njenega preklica.

Posnetki se nadalje lahko dodajo na portal na podlagi zakonitih interesov raziskovanja govora, razvoja digitalnih orodij za slovenski jezik in potrebe po arhiviranju jezikovne kulturne dediščine.

Skladno z zgoraj opredeljenim namenom se posnetki ter z njimi povezani podatki hranijo za nedoločen čas, do umika privolitve s strani govorcev na posnetku oziroma do prejema prepovedi osebe, ki je po zakonu, ki ureja dedovanje, zakoniti dedič prvega ali drugega dednega reda. V primeru umika privolitve oziroma izvrševanja pravice do pozabe bo UM FERI upravljavce, ki so s portala prenesli zbirko posnetkov, z razumnimi tehničnimi sredstvi obvestil, da posameznik, na katerega se nanašajo osebni podatki, od njih zahteva, naj izbrišejo morebitne povezave do teh osebnih podatkov ali njihove kopije.

Uporabniki posnetkov bodo predvsem raziskovalci slovenskega govorjenega jezika v jezikoslovju in sorodnih vedah ter razvijalci jezikovnih in govornih tehnologij, ki želijo ponuditi podporo za slovenski jezik.

Upravljavec ne namerava prenesti posnetkov in z njimi povezanih metapodatkov v tretjo državo zunaj EU, bodo pa posnetki na voljo za prenos prek spletnega portala od koderkoli na svetu.

Od upravljavca lahko zahtevate dostop do osebnih podatkov in drugih informacij o obdelavi, popravek ali izbris osebnih podatkov, v določenih okoliščinah pa tudi omejitev obdelave in prenosljivost podatkov ter ugovarjate nadaljnji obdelavi. V primeru, da niste zadovoljni z obdelavo osebnih podatkov, se lahko pritožite Informacijskemu pooblaščencu RS, https://www.ip-rs.si