Precizan ‘speech to text’ od sada i na srpskom – uz novi servis Daktilograf

Ne nastaje svaki startap odlukom da se u sred razvoja jednog proizvoda odustane i pivotira u potpuno drugu oblast. Još je interesantnije ako odustanete od razvoja solarne stanice za napajanje elektronike zato što ste se setili starog projekta i kažete sebi - to je to! Upravo tako, rođen je crnogorski startap Daktilograf.

Početkom godine, objašnjava naš sagovornik Mirsad Hadžalić, ekipa okupljena oko Daktilografa bila je u punom zamahu razvoja startapa u oblasti pametne poljoprivrede. „Plan nam je bio da godinu započnemo učešćem na PODIM konferenciji i tražimo podršku investitora“, kaže on:

Tokom pauze pregledali smo neke stare projekte, a onda sam gledajući prototip društvene mreže za decu sa posebnim potrebama ukapirao stvarnu vrednost dela tog koda i uzviknuo – obustavljaj!

Uzeo sam papir i nacrtao layout aplikacije koja služi za konverziju govora u tekst i u vrhu ispisao naše sadašnje ime. Gospodo, mi smo sada Daktilograf i sa ovim projektom idemo na PODIM – rekao sam ostalim članovima tima. Ostatak ekipe me je gledao u neverici, ali smo vrlo brzo zajednički zaključili da je to bolji izbor.

Uspeli su da kreiraju prototip do početka dela konferencije koji se održavao u Podgorici, a ubrzo nakon toga započeli su i pregovore o investiranju sa ICT Hub Venture i sa SC Ventures. Tako počinje njihova misija razvoja softvera koji bi medijima i državnim službama mogao napraviti pravu revoluciju u radu.

Da li je Daktilograf dovoljno ‘pametan’?

Dosadašnji softveri ovog tipa razvijali su se u dva pravca: prvi je zasnovan na upotrebi rečnika ili audio biblioteka, a drugi je baziran na veštačkoj inteligenciji. Kako Mirsad navodi, regionalni konkurenti Daktilografa rade po sistemu rečnika, dok globalna konkurencija koristi oba pristupa. On objašnjava:

Prednost našeg rešenja je u tome što smo mi prevazišli sistem rečnika, a za prepoznavanje reči ne koristimo AI sisteme, pa ne samo što naše rešenja zahteva znatno manju procesorsku snagu već mnogo bolje uči jer su rezultati treninga mnogo predvidljiviji od rezultata dobijenih treniranjem veštačke inteligencije.

Ovaj softver, takođe, nije isključivo oslonjen na audio biblioteke i za sada prototip ima dvostruku proveru sa rečnicima – prvo pokušava da odgonetne audio signal odnosno da „shvati“ koju je to reč „čuo“. On se za sada „konsultuje“ se rečnicima zbog bolje tačnosti, ali će vremenom potreba za „konsultovanjem“ biti sve manja i na kraju nestati.

Međutim, kako vrlo često svakodnevni govor nije isti kao onaj pisani, postavlja se pitanje: da li softver ispravlja gramatičke i logičke greške? Mirsad objašnjava:

U ovom prototipu ne postoje gramatički niti interpukcijski moduli predviđeni planom razvoja. U narednih šest meseci bi trebalo da imamo kreiran tržišni proizvod koji će imati kako lingvističku, tako i interpukcijsku i gramatičku korekciju, kao i mogućnost njenog isključivanja, zavisno od potreba klijenata.

Za sada softver zapisuje ono što je čuo ako je dovoljno siguran u to, ili ga ispraviti ako nije dovoljno siguran.

Podrška i za druge jezike?

Jedna od glavnih karakteristika softvera je da gotovo trenutno pretvara govor u tekst za sve južnoslovenske jezike. „Mi već razvijamo module za ruski, poljski, češki, slovački i ostale slovenske jezike, a početkom 2019. planiran je razvoj rešenja za engleski i španski“:

Dakle, kada kažem da ćemo kreirati rešenja za engleski i španski, to znači da ćemo ih kreirati na osnovu našeg algoritma, dakle srpsko-hrvatskog jezika i ta šifra će biti osnov za razumevanje drugih jezika. Za slovenske jezike je taj posao znatno lakši, dok je za „zapadne“ dosta komplikovaniji ali ne i nemoguć.

Kako navodi Mirsad, oni već sada mogu kreirati aplikaciju za prevođenje koristeći API kompanija kao što je Google za jezike koji su već odlično pokriveni rečnicima a, kako dodaje, i dalje postoji vrlo mali broj specijalizovanih aplikacija, čak i u zemljama čiji su jezici odlično pokriveni rečnicima, te je i to veliki potencijal za razvoj i širenje.

Nadogradnja po potrebama klijenata

Sam softver se, pored jezika, može dodatno nadograditi na zahtev klijenata – „na primer, nakon prezentacije u Podgorici, započeli smo razgovore sa IT službom Skupštine Crne Gore oko moguće saradnje, a prvi uslov je bio da serveri moraju biti instalirani na teritoriji Crne Gore zbog zakonske odredbe koja to predviđa“, kaže Mirsad.

Što više direktnih prezentacija, sastanaka, sistem preporuka, lobiranje, ponude ugovora sa velikim benefitima za klijente koji prvi podrže priču, velike olakšice, popusti i druge beneficije za državne organe, kako kažu članovi tima Daktilograf, ovaj tim trebalo bi da dovedu do softvera broj jedan najpre u medijskim kućama, a zatim i u administrativnim službama, državnim organima i drugim institucijama u kojima postoji potreba za pisanjem teksta.

Bez dodatnih zahteva klijenata, dodaje Hadžalić, postoje dva pricing modela: 50 evra mesečno za jedan korisnički profil aplikacije Snimač/Konvertor namenjene medijima za 24/7 konverziju i oko 150 evra za korisnički profil aplikacije Stenogram namenjene državnoj upravi – vladama, skupštinama, sudovima, službenom glasniku. A to je, dodaje, tek početak.

Odgovori

Tvoja e-mail adresa neće biti objavljena.

Popularno

SEO i pretraga

Kako izvršiti migraciju jednog od najvećih oglasnika u Srbiji – iz SEO ugla

Sajt nekretnine.rs mesečno poseti i do 590.000 korisnika. Njegove posetioce nedavno je dočekao novi izled sajta, a evo kako je tekao proces migracije.

Internet marketing

Influenseri nekad i sad – priča o ljubavi, prohibiciji i prostituciji

Sve je krenulo tako nevino. Ljudi počnu da se bave nečim iz ljubavi, u slobodno vreme, ugledajući se na druge. Ljubavi prema tom nečemu ili ljubavi prema pažnji koju dobijaju zbog toga. Nevino i iskreno. Dobro, možda ne baš potpuno iskreno, ali...

Digitalni mediji

Zašto je YouTube Rewind 2018. najomraženiji video – ikada?

Pre nešto manje od mesec dana YouTube je objavio godišnji pregled najpopularnijih klipova, mimova i jutjubera za 2018. godinu - ali taj video postao je za kratko vreme jedan od najomraženijih sa čak 14 miliona dislajkova.

Propustili ste

Karijere

Kako smo spustili fluktuaciju tehničkog kadra ispod 10%

Dok čitava domaća IT industrija raste, manjak kvalifikovanog kadra i česta fluktuacija zaposlenih ostaju među glavnim problemima sa kojima se menadžment suočava. Kako edukovati novi kadar, a u isto vreme zadržati top talenat u svojim redovima?

Tehnologija

Srbija postaje deo ruskog tehnološkog projekta ‘Tačka ključanja’ – o čemu je zapravo reč?

Beograd bi mogao da bude prvi inostrani grad u kojem će biti sproveden ruski projekat 'Tačka ključanja' koji podrazumeva multidisciplinarno povezivanje, rad i razmenu ideja iz oblasti nauke, inžejnerstva, obrazovanja i digitalnih tehnologija.

Gaming

Mihajlo Jovanović-Džaril: Nema daljeg razvoja regionalnog esporta dok se timovi ne izgrade u prepoznatljive brendove

Četvrta sezona popularne regionalne esport lige EBL u organizaciji Fortune esports startuje 28. januara. U razgovoru sa direktorom ove organizacije otkrivamo više detalja o predstojećoj sezoni i koje su to promene na esport sceni Balkana.

Startapi i poslovanje

Zašto srpske kompanije ne izlažu na CES-u?

Consumer Electronics Show (CES), najveći sajam potrošačke elektronike u Las Vegasu, završen je prošle nedelje - opet bez nastupa srpskih kompanija. U razgovoru sa preduzetnicima analiziramo razloge ovog trenda.

Intervju

Četiri pitanja o digitalnoj transformaciji malih i srednjih preduzeća

Mogu li se male i srednje kompanije nositi sa promenama koje sa sobom nosi digitalizacija poslovanja?

SEO i pretraga

Kako izvršiti migraciju jednog od najvećih oglasnika u Srbiji – iz SEO ugla

Sajt nekretnine.rs mesečno poseti i do 590.000 korisnika. Njegove posetioce nedavno je dočekao novi izled sajta, a evo kako je tekao proces migracije.