15. okt 2020.

Tekstove sa portala RTS-a automatski čita glas Dragana Vučelića

Portal RTS-a obnovio je opciju čitanja tekstova objavljenih na portalu koju najviše koriste slepi i slabovidi, ali i oni koji ne mogu da gledaju u ekran da bi sami čitali. Softver je postavila novosadska kompanija AlfaNum, specijalizovana za sintetizaciju glasa i pretvaranje glasa u tekst.

Od 08. oktobra 2020. na sajtu RTS-a mogu da se preslušaju vesti uz pomoć AlfaNum-ovog najnovijeg sintetizatora baziranog na dubokim neuronskim mrežama, za koji je glas dao spiker, radijski i televizijski voditelj Dragan Vučelić dobitnik nagrade Radio-televizije Srbije za lepotu govora.

Ovaj tim koji je potekao sa Fakulteta tehničkih nauka u Novom Sadu, razvio je sintetičke, muške i ženske glasove za srpski, hrvatski i crnogorski jezik.

Korišćenjem tehnologije za konverziju govora od malog uzorka nečijeg glasa AlfaNum za dve nedelje sintetizuje glas koji zvuči veoma slično glasu osobe čiji je snimak uzet kao osnova.
Primer za to je glas kojim govori digitalni asistent Rajfajzen banke REA.

Osvajanjem ove tehnologije korišćenjem veštačke inteligencije stvorena je mogućnosti za razvoj aplikacija koje mogu da pomognu licima sa raznim oblicima invaliditeta kao i za razvoj velikog broja drugih aplikacija.

Pomenućemo audio knjige, aplikacije za online nastavu koja je jako potrebna u sistemu obrazovanja, zvučna obaveštenja u kontakt centima u automobilskoj industriji u robotici i td.

Prošle godine portovana je sinteza na Android OS. Sva slepa i slabovida lica u Srbiji su dobila mogućnost da besplatno koriste ovu aplikaciju koja omogućava jednostavnu upotrebu svih funkcija uređaja koji koriste Android OS na maternjem jeziku.

AlfaNum tim je radio i na unapređenju automatskog prepoznavanja govora, takođe baziranog na dubokim neuronskim mrežama.

Zahvaljujući tome završen je Sistem za automatsko prepoznavanje govora za diktiranje medicinskih nalaza za potrebe PIO Fonda koji će ubuduće olakšati rad lekara koji neće više gubiti vreme na kucanje dijagnoza.

Ovako unapređene govorne tehnologije danas omogućavaju znatno širu primenu u poslovnom i privatnom okruženju kao i očuvanje srpskog i srodnih jezika u novom domenu govorne komunikacije – između čoveka i mašina.

Ostavite komentar

Vaša adresa e-pošte neće biti objavljena. Neophodna polja su označena *

*

Na našem sajtu biće objavljeni svi pristigli komentari, osim komentara koji sadrže govor mržnje, psovke i uvrede ili nisu u vezi sa temom članka koji se komentariše. Govor mržnje definisan je Zakonom o javnom informisanju, koji u članu 38. kaže: „Zabranjeno je objavljivanje ideja, informacija i mišljenja kojima se podstiče diskriminacija, mržnja ili nasilje protiv lica ili grupe lica zbog njihovog pripadanja ili nepripadanja nekoj rasi, veri, naciji, etničkoj grupi, polu ili zbog njihove seksualne opredeljenosti, bez obzira na to da li je objavljivanjem učinjeno krivično delo“. Pre nego što budu objavljeni, komentari moraju biti odobreni od strane naših moderatora, pa vas molimo za malo strpljenja.

Send this to a friend