Diktirajte tekst uz pomoć Google Docs-a
Pixabay

Kompjuteri su dosad bili vrlo neprecizni u prepoznavanju izgovorenih reči. Takvi programi su radili tek povremeno za mali broj korisnika. Međutim, danas je situacija znatno bolja zahvaljujući kompanijama Nuans (Nuance), Majkrosoft (Microsoft), Epl (Apple) i Gugl (Google), koje su uložile mnogo novca i truda u to da se prepoznavanje reči usavrši.


Među ovim kompanijama ističe se Gugl, koji se oprobao u prepoznavanju glasa još 2008. godine. Usluga GOOG-411 (odnosno Google Voice Local Search) omogućavala je glasovnu pretragu poslovnih telefonskih imenika, ali nije zaživela. Tehnologija za prepoznavanje glasa, takođe, ima istaknutu ulogu u operativnom sistemu Android, a napokon je postala dostupna i bez pristupa internetu, kada je na tržište izbačena verzija ovog operativnog sistema pod nazivom JellyBean.


Ove godine, Gugl je najzad dodao prepoznavanje glasa u Google Docs. Sada možete bukvalno da diktirate dokument bez potrebe da se instalira bilo kakav dodatni program ili plagin. Ali, kako će se pokazati u praksi?

Kako početi?

Ako imate Guglov nalog, prepoznavanje glasa vam je već dostupno. Dovoljno je da otvorite Google Docs i napravite novi dokument ili otvorite neki koji već postoji. Otvoriće se prozor sa pitanjem da li hoćete da isprobate diktiranje. Kliknite Probaj (Try It). Ukoliko se, pak, ova opcija ne pojavi, možete sami kliknuti na Alatke (Tools), a potom na Unos teksta glasom (Voice Typing).



Zatim, treba da dozvolite da Google Docs koristi vaš mikrofon. Samo klinite Dozvoli (Allow) u sledećem prozoru.


Posle toga, izaberite jezik za diktiranje. Google Voice Typing nudi veliki broj jezika, od engleskog i španskog, pa do afrikansa i arapskog. Podržava i srpski.


To je sve – kliknite ikonicu u obliku mikrofona i počnite da diktirate.

Koliko je precizno?

Jedna od najvećih prepreka zbog kojih prepoznavanje glasa još nije masovno rasprostranjeno sastoji se u tome što ova tehnologija često nije dovoljno precizna. Dosad se podrazumevalo da, ako diktirate nešto kompjuteru, to znači da vas potom očekuje nekoliko sati prepravljanja teksta. Dakle, kako se Gugl pokazao?


Odgovor glasi – na engleskom, vrlo uspešno. Razume čak i različite akcente.


Takođe je vrlo impresivno kako Guglov softver za prepoznavanje glasa izlazi na kraj sa šumovima u pozadini. Čak i kad se čuje pseći lavež ili gust saobraćaj, Gugl ume da prepozna šta tačno korisnik govori.


Najveći nedostatak je vezan za znakove interpunkcije. Ako kažete „zarez“ ili „tačka“, Gugl će shvatiti da želite da napišete tu reč. Nažalost, nema načina da se ovo spreči.


Ipak, ovo će najverovatnije biti ispravljeno vremenom, kad veći broj ljudi počne da koristi ovu tehnologiju i kad Gugl, shodno tome, uloži više sredstava i truda u to da unapredi prepoznavanje glasa.

Jezici i dijalekti

Google Voice Typing podržava veliki broj jezika i dijalekata. Samo u okviru engleskog, podržava novozelandski, australijski, indijski, južnoafrički, američki i britanski dijalekat. Teškoća je u tome što ne postoji jedinstven američki naglasak, a ni britanski. Obe zemlje imaju mnoštvo naglasaka i dijalekata, koji se razlikuju od mesta do mesta.


Sada, nećete morati da uvežbavate određeni naglasak: razume brojne varijetete engleskog. Ovakav rezultat obećava uspeh i za druge jezike.

Brzina diktiranja

Sve do sada, napredak ovakvih programa kočilo je to što nisu mogli da prate brzinu kojom korisnik diktira. Pošto je u pitanju servis kome se pristupa preko interneta, postojao je rizik da će i Guglovo rešenje proći slično. Ipak, Gugl je uspešno prevazišao i tu prepreku. U stanju je da prati brz tempo diktiranja i samim tim, ne usporava produktivnost korisnika, što je velika prednost u odnosu na druga pomagala za diktiranje.

Napomena o mikrofonu

Mikrofoni ugrađeni u elektronske uređaje često su nepredvidivi u pogledu kvaliteta. Neki su vrlo kvalitetni, ali drugi su izuzetno loši – nema sredine. Uopšteno govoreći, jeftiniji laptop računari obično imaju najgore mikrofone, jer proizvođači ovih uređaja tome ne daju prioritet.


Google Voice Typing ne pokazuje značajniju razliku, ako se koristi mikrofon ugrađen u laptop ili spoljni mikrofon. Tačnost i brzina diktiranja se ne menjaju. Ipak, spoljni mikrofon i slušalice pružaju izvesnu prednost, utoliko što korisnik može lakše da primeti buku u pozadini i da oceni da li diktira preglasno ili pretiho.

Zaključci

Guglov program za diktiranje nije savršen. To i nije iznenađenje, jer je uspešno prepoznavanje glasa vrlo teško. Međutim, mnogo toga bi još moglo da se poboljša.

Najočigledniji primer je interpunkcija i rečenična struktura. U idealnom slučaju, Gugl bi umeo automatski da ubaci znake interpunkcije na osnovu ritma izgovorene rečenice. Nažalost, tehnologija je i dalje veoma daleko od tog stadijuma.

Takođe, diktiranje još nije uključeno u druge servise koje Gugl nudi, kao što je Gmail. Jedna mogućnost da se olakša korišćenje ove tehnologije bila bi da se Google Voice Typing preuzima kao zasebna aplikacija, koja bi onda mogla da se kombinuje sa drugim programima.

Međutim, Google Voice Typing je, uprkos tome, najbolji primer softvera za diktiranje na današnjem tržištu, neuporedivo brži i tačniji od konkurentskih proizvoda.

Pogledajte kako se ovaj softver koristi.


IZVOR: Make Use Of