Dosežki
Portal Govorjena slovenščina je del projekta LLM4DH, ki se osredotoča na raziskave razvoja velikih jezikovnih modelov za slovenščino in njihovo uporabo v digitalni humanistiki. Prek portala je mogoče oddajati posnetke tudi v okviru sodelovanja z drugimi raziskovalnimi projekti.
OBJAVLJENI KORPUSI
ROG dialog
Zbirka posnetkov zasebnega govora z zapisi in ročno dodanimi oznakami o dialoških dejanjih in sentimentu.
Namen: učenje strojnih modelov za označevanje govora, jezikoslovne analize.
Projekt: Veliki jezikovni modeli za digitalno humanistiko, LLM4DH (2024-2027). Zbirka je prosto dostopna v repozitoriju CLARIN.SI.
Krohot
Zbirka posnetkov zasebnega govora z zapisi in ročno dodanimi oznakami o humornih segmentih.
Namen: analize humorja v slovenščine, strojno učenje.
Projekt: Ime Krohot (2025). Zbirka je prosto dostopna v repozitoriju CLARIN.SI
SloBench ASR 2
6 posnetkov zasebnega govora za nadgradnjo evalvacijske zbirke SloBenchASR, namenjene testiranju uspešnosti strojnih modelov za razpoznavanje ali analizo slovenskega govora.
AKTUALNO
Zemljevid posnetkov po statističnih regijah

1:00 ▶
0:10 ▶
2:40 ▶
4:00 ▶
0:30 ▶
2:20 ▶
5:00 ▶
3:30 ▶
15:00 ▶
2:10 ▶
1:30 ▶
0:00