Xiaomi, podjetje za potrošniško elektroniko in pametno strojno opremo, povezano s platformo IoT, je predstavilo svojo najnovejšo aplikacijo naprednih algoritmov in lastne govorne tehnologije. Tehnologija pretvorbe besedila v spontani govor, ki jo je razvil Xiaomi AI Lab, se uporablja za ustvarjanje prilagojenega glasu za uporabnika z motnjami govora.
Uporabnik tako lahko komunicira z drugimi z uporabo »svojega glasu«, namesto tipičnega monotonega elektronskega glasu. Kot del predraziskovalnega projekta »Own My Voice«, ki ga vodi Tehnični odbor Xiaomi, ta poskus dokazuje zavezanost Xiaomija k uporabi tehnologije za dober namen in k doseganju svojega poslanstva »naj vsi na svetu uživajo v boljšem življenju z inovativnimi tehnologijami«.
Zakaj je Xiaomi začel ta projekt?
Xiaomi skrbi za ljudi in si prizadeva izpolniti njihove raznolike potrebe s tehnološkimi inovacijami. Odkril je željo številnih uporabnikov z motnjami govora po lastnem edinstvenem glasu za vsakodnevno komunikacijo in je zato ustanovil projektno skupino »Own My Voice«. Zhu Xi, vodja tematskega odbora za tehnologijo pri pobudi Tech for Good v Xiaomiju, je dejal: »Navdušeni smo ob raziskovanju številnih vrednot, ki nam jih prinašajo tehnološke inovacije, kot sta odziv na zahteve uporabnikov po samoidentiteti in ustvarjanju identitete.«
Kako je Xiaomi izpeljal projekt?
Da bi ustvarili najbolj primeren in personaliziran glas za prejemnika le-tega, je projektna skupina zaposlila več kot 200 prostovoljcev znotraj Xiaomija, ki so »darovali« svoje glasove. Uporabili so algoritem za ujemanje glasovnega odtisa, da bi uskladili značilnosti glasov prostovoljcev s tistimi od prejemnika. S tem pristopom so našli najprimernejši glas kot osnovni zvok glasovne reference. Glede na personalizacijo in zaščito zasebnosti je bil izbrani pravi glas obdelan s kompleksno akustično modifikacijo za oblikovanje novega in izvirnega zvoka glasu. Nato so uporabili tehnologijo pretvorbe besedila v govor v spontanem slogu za usposabljanje modela umetne inteligence, s čimer je ta novi glas postopoma pridobil naravni ritem in intonacijo, ki lahko resnično izrazi čustva in ton človeka.
Projekt »Own My Voice« združuje vrsto najnaprednejših algoritmov s Xiaomijevo lastno razvito govorno tehnologijo, s čimer zagotovi specifičnost, varnost in visoko pristnost sintetiziranega glasu, kar ustvarja novo idejo o prilagojeni sintezi govora za uporabnike z govornimi motnjami.
V čem je pomembnost projekta?
Hrbtenica tega projekta je skupina strokovnjakov za govorno tehnologijo iz laboratorija Xiaomi AI. Od leta 2017 so objavili 37 prispevkov o govoru v zbornikih vrhunskih mednarodnih konferenc, kot je Mednarodna konferenca o akustiki, govoru in obdelavi signalov (ICASSP). Uspeh »Own My Voice« je v glavnem odvisen od spontanega sloga tehnologije pretvorbe besedila v govor, ki so jo razvili sami.
Tehnologija pretvorbe besedila v govor spontanega sloga v bistvu naredi sintetizirani glas v svoji intonaciji, premoru, hitrosti in drugih značilnostih podoben pravemu. S tem se monoton in nenaraven občutek elektronskega glasu nadomesti z bolj naravnim. Trenutno se ta tehnologija uporablja za številne pametne naprave, opremljene s Xiaoaijem, glasovnim pomočnikom AI podjetja Xiaomi.
Zhu Xi je dodal: »Če opazimo in obravnavamo potrebe manjšinskih skupin v zgodnji fazi, bi se lahko dolgotrajni proces uporabe specifične tehnologije močno skrajšal. To pa omogoča, da prednosti novih tehnologij postanejo hitro dostopne uporabnikom s posebnimi potrebami.«
V prihodnje bo Xiaomi še naprej, na podlagi povratnih informacij, preučeval izvedljivost tega projekta v širšem obsegu. Xiaomi bo še naprej krepil tudi dostopnost najsodobnejših tehnologij in si prizadeval izpolniti različne potrebe ljudi na podlagi tehnoloških inovacij.