Xiaomi, kompanija koja se bavi proizvodnjom pametnih telefona i IoT uređaja, predstavila je svoju najnoviju govornu tehnologiju, koja predstavlja primenu naprednih algoritama na polju alata za olakšanu upotrebu. Tehnologija Text-To-Speech koju je razvio Xiaomi AI Lab je sposobna da u stilu svakodnevnog govora generiše jedinstven i prilagođen glas za korisnike sa poremećajima govora.
Ovaj tip korisnika sada može da komunicira sa drugima koristeći “svoj glas”, umesto tipičnog monotonog elektronskog glasa. Kao deo predistraživačkog projekta „Own My Voice“ koji vodi Tehnološki komitet kompanije Xiaomi, ovaj uspešan projekat demonstrira Xiaomi-jevu posvećenost „Tech for Good“ (tehnologiji za dobro drugih) i ostvarivanju svoje misije „da inovativne tehnologije poboljšaju život svima na svetu“.
Zašto je Xiaomi pokrenuo ovaj projekat?
Xiaomi brine o ljudima i nastoji da ispuni njihove različite potrebe kroz tehnološke inovacije. Usled želje mnogih korisnika koji imaju oštećenja govora za posedovanjem sopstvenog glasa za svakodnevnu komunikaciju, osnovan je projektni tim „Own My Voice“ koji je omogućio korisnicima sa oštećenjem govora da koriste usluge Text-To-Speech. Zhu Xi, pokretač ove teme u Komitetu za tehnologiju za Tech for Good, Xiaomi Corporation, rekao je: „Uzbuđeni smo što istražujemo višestruke vrednosti koje nam donose tehnološke inovacije, kao što je odgovaranje na zahteve korisnika za sopstvenim identitetom i izgradnjom identiteta. ”
Kako je Xiaomi sproveo projekat?
Da bi generisao što prikladniji i personalizovaniji glas korisnicima, projektni tim je angažovao više od 200 volontera u Xiaomi-u kako bi „donirali“ svoje glasove. Koristili su algoritam za podudaranje otiska glasa kako bi uporedili karakteristike glasova volontera sa glasovima primaoca. Ovim pristupom pronašli su najpogodniji glas koji je korišćen kao osnovni zvuk. Uzimajući u obzir personalizaciju i zaštitu privatnosti, izabranim pravim glasom manipulisano je kompleksnom akustičnom modifikacijom da bi se formirao nov i originalan zvuk glasa.
Zatim su koristili tehnologiju Text-To-Speech u stilu svakodnevnog govora kako bi prilagodili AI model, čineći da ovaj novi glas postepeno dobija prirodan ritam i intonaciju koja može istinito da izrazi emociju i ton čoveka.
Projekat „Own My Voice“ kombinuje niz najnaprednijih algoritama sa Xiaomi-jevom samorazvijenom govornom tehnologijom kako bi se osigurala specifičnost, bezbednost i visoka autentičnost sintetizovanog glasa, stvarajući novu ideju o prilagođenoj sintezi govora za korisnike sa smetnjama.
U čemu je značaj ovog projekta?
Okosnicu ovog projekta čini grupa stručnjaka za govornu tehnologiju iz Xiaomi AI Lab. Oni su od 2017. godine objavili 37 radova o govoru u zbornicima vrhunskih međunarodnih konferencija, poput Međunarodne konferencije o akustici, govoru i obradi signala (ICASSP). Uspeh “Own My Voice” uglavnom zavisi od spontanog stila Text-To-Speech tehnologije koju su razvili.
Tehnologija Text-To-Speech u suštini predstavlja sintetizovani glas nalik na ljudski u svojoj intonaciji, pauzi, brzini i drugim karakteristikama. Ovo čini uobičajeno monoton i neprirodan osećaj elektronskog glasa prirodnijim. Trenutno se ova tehnologija primenjuje na mnoge pametne uređaje opremljene funkcijom XiaoAI, AI glasovnim asistentom kompanije Xiaomi. Projekat „Own My Voice“ pokazuje da spontani stil Text-To-Speech tehnologije takođe može biti široko prihvaćen i poboljšati korisničko iskustvo.
Zhu Xi je dodao: „Ako primetimo i odgovorimo na potrebe manjinskih grupa u ranoj fazi, proces širenja tehnologije mogao bi biti znatno skraćen. Ovo omogućava da prednosti novih tehnologija postanu dostupne korisnicima sa posebnim potrebama bez odlaganja.“
U budućnosti, Xiaomi će nastaviti da dobija povratne informacije od primaoca glasa i dalje proučava izvodljivost ovog projekta u širem opsegu. Xiaomi će nastaviti da osnažuje pristupačnost kroz najsavremeniju tehnologiju, nastojeći da ispuni različite potrebe ljudi kroz tehnološke inovacije.