Precizan ‘speech to text’ od sada i na srpskom – uz novi servis Daktilograf

Sviđa vam se članak?

Preporučite ga vašim prijateljima i kolegama putem društvenih mreža!

Ne nastaje svaki startap odlukom da se u sred razvoja jednog proizvoda odustane i pivotira u potpuno drugu oblast. Još je interesantnije ako odustanete od razvoja solarne stanice za napajanje elektronike zato što ste se setili starog projekta i kažete sebi – to je to! Upravo tako, rođen je crnogorski startap Daktilograf.

Početkom godine, objašnjava naš sagovornik Mirsad Hadžalić, ekipa okupljena oko Daktilografa bila je u punom zamahu razvoja startapa u oblasti pametne poljoprivrede. „Plan nam je bio da godinu započnemo učešćem na PODIM konferenciji i tražimo podršku investitora“, kaže on:

Tokom pauze pregledali smo neke stare projekte, a onda sam gledajući prototip društvene mreže za decu sa posebnim potrebama ukapirao stvarnu vrednost dela tog koda i uzviknuo – obustavljaj!

Uzeo sam papir i nacrtao layout aplikacije koja služi za konverziju govora u tekst i u vrhu ispisao naše sadašnje ime. Gospodo, mi smo sada Daktilograf i sa ovim projektom idemo na PODIM – rekao sam ostalim članovima tima. Ostatak ekipe me je gledao u neverici, ali smo vrlo brzo zajednički zaključili da je to bolji izbor.

Uspeli su da kreiraju prototip do početka dela konferencije koji se održavao u Podgorici, a ubrzo nakon toga započeli su i pregovore o investiranju sa ICT Hub Venture i sa SC Ventures. Tako počinje njihova misija razvoja softvera koji bi medijima i državnim službama mogao napraviti pravu revoluciju u radu.

Da li je Daktilograf dovoljno ‘pametan’?

Dosadašnji softveri ovog tipa razvijali su se u dva pravca: prvi je zasnovan na upotrebi rečnika ili audio biblioteka, a drugi je baziran na veštačkoj inteligenciji. Kako Mirsad navodi, regionalni konkurenti Daktilografa rade po sistemu rečnika, dok globalna konkurencija koristi oba pristupa. On objašnjava:

Prednost našeg rešenja je u tome što smo mi prevazišli sistem rečnika, a za prepoznavanje reči ne koristimo AI sisteme, pa ne samo što naše rešenja zahteva znatno manju procesorsku snagu već mnogo bolje uči jer su rezultati treninga mnogo predvidljiviji od rezultata dobijenih treniranjem veštačke inteligencije.

Ovaj softver, takođe, nije isključivo oslonjen na audio biblioteke i za sada prototip ima dvostruku proveru sa rečnicima – prvo pokušava da odgonetne audio signal odnosno da „shvati“ koju je to reč „čuo“. On se za sada „konsultuje“ se rečnicima zbog bolje tačnosti, ali će vremenom potreba za „konsultovanjem“ biti sve manja i na kraju nestati.

Međutim, kako vrlo često svakodnevni govor nije isti kao onaj pisani, postavlja se pitanje: da li softver ispravlja gramatičke i logičke greške? Mirsad objašnjava:

U ovom prototipu ne postoje gramatički niti interpukcijski moduli predviđeni planom razvoja. U narednih šest meseci bi trebalo da imamo kreiran tržišni proizvod koji će imati kako lingvističku, tako i interpukcijsku i gramatičku korekciju, kao i mogućnost njenog isključivanja, zavisno od potreba klijenata.

Za sada softver zapisuje ono što je čuo ako je dovoljno siguran u to, ili ga ispraviti ako nije dovoljno siguran.

Podrška i za druge jezike?

Jedna od glavnih karakteristika softvera je da gotovo trenutno pretvara govor u tekst za sve južnoslovenske jezike. „Mi već razvijamo module za ruski, poljski, češki, slovački i ostale slovenske jezike, a početkom 2019. planiran je razvoj rešenja za engleski i španski“:

Dakle, kada kažem da ćemo kreirati rešenja za engleski i španski, to znači da ćemo ih kreirati na osnovu našeg algoritma, dakle srpsko-hrvatskog jezika i ta šifra će biti osnov za razumevanje drugih jezika. Za slovenske jezike je taj posao znatno lakši, dok je za „zapadne“ dosta komplikovaniji ali ne i nemoguć.

Kako navodi Mirsad, oni već sada mogu kreirati aplikaciju za prevođenje koristeći API kompanija kao što je Google za jezike koji su već odlično pokriveni rečnicima a, kako dodaje, i dalje postoji vrlo mali broj specijalizovanih aplikacija, čak i u zemljama čiji su jezici odlično pokriveni rečnicima, te je i to veliki potencijal za razvoj i širenje.

Nadogradnja po potrebama klijenata

Sam softver se, pored jezika, može dodatno nadograditi na zahtev klijenata – „na primer, nakon prezentacije u Podgorici, započeli smo razgovore sa IT službom Skupštine Crne Gore oko moguće saradnje, a prvi uslov je bio da serveri moraju biti instalirani na teritoriji Crne Gore zbog zakonske odredbe koja to predviđa“, kaže Mirsad.

Što više direktnih prezentacija, sastanaka, sistem preporuka, lobiranje, ponude ugovora sa velikim benefitima za klijente koji prvi podrže priču, velike olakšice, popusti i druge beneficije za državne organe, kako kažu članovi tima Daktilograf, ovaj tim trebalo bi da dovedu do softvera broj jedan najpre u medijskim kućama, a zatim i u administrativnim službama, državnim organima i drugim institucijama u kojima postoji potreba za pisanjem teksta.

Bez dodatnih zahteva klijenata, dodaje Hadžalić, postoje dva pricing modela: 50 evra mesečno za jedan korisnički profil aplikacije Snimač/Konvertor namenjene medijima za 24/7 konverziju i oko 150 evra za korisnički profil aplikacije Stenogram namenjene državnoj upravi – vladama, skupštinama, sudovima, službenom glasniku. A to je, dodaje, tek početak.