Precizan ‘speech to text’ od sada i na srpskom - uz novi servis Daktilograf - Netokracija.rs

Precizan ‘speech to text’ od sada i na srpskom – uz novi servis Daktilograf

Ne nastaje svaki startap odlukom da se u sred razvoja jednog proizvoda odustane i pivotira u potpuno drugu oblast. Još je interesantnije ako odustanete od razvoja solarne stanice za napajanje elektronike zato što ste se setili starog projekta i kažete sebi - to je to! Upravo tako, rođen je crnogorski startap Daktilograf.

Početkom godine, objašnjava naš sagovornik Mirsad Hadžalić, ekipa okupljena oko Daktilografa bila je u punom zamahu razvoja startapa u oblasti pametne poljoprivrede. “Plan nam je bio da godinu započnemo učešćem na PODIM konferenciji i tražimo podršku investitora”, kaže on:

Tokom pauze pregledali smo neke stare projekte, a onda sam gledajući prototip društvene mreže za decu sa posebnim potrebama ukapirao stvarnu vrednost dela tog koda i uzviknuo – obustavljaj!

Uzeo sam papir i nacrtao layout aplikacije koja služi za konverziju govora u tekst i u vrhu ispisao naše sadašnje ime. Gospodo, mi smo sada Daktilograf i sa ovim projektom idemo na PODIM – rekao sam ostalim članovima tima. Ostatak ekipe me je gledao u neverici, ali smo vrlo brzo zajednički zaključili da je to bolji izbor.

Uspeli su da kreiraju prototip do početka dela konferencije koji se održavao u Podgorici, a ubrzo nakon toga započeli su i pregovore o investiranju sa ICT Hub Venture i sa SC Ventures. Tako počinje njihova misija razvoja softvera koji bi medijima i državnim službama mogao napraviti pravu revoluciju u radu.

Da li je Daktilograf dovoljno ‘pametan’?

Dosadašnji softveri ovog tipa razvijali su se u dva pravca: prvi je zasnovan na upotrebi rečnika ili audio biblioteka, a drugi je baziran na veštačkoj inteligenciji. Kako Mirsad navodi, regionalni konkurenti Daktilografa rade po sistemu rečnika, dok globalna konkurencija koristi oba pristupa. On objašnjava:

Prednost našeg rešenja je u tome što smo mi prevazišli sistem rečnika, a za prepoznavanje reči ne koristimo AI sisteme, pa ne samo što naše rešenja zahteva znatno manju procesorsku snagu već mnogo bolje uči jer su rezultati treninga mnogo predvidljiviji od rezultata dobijenih treniranjem veštačke inteligencije.

Ovaj softver, takođe, nije isključivo oslonjen na audio biblioteke i za sada prototip ima dvostruku proveru sa rečnicima – prvo pokušava da odgonetne audio signal odnosno da “shvati” koju je to reč “čuo”. On se za sada “konsultuje” se rečnicima zbog bolje tačnosti, ali će vremenom potreba za “konsultovanjem” biti sve manja i na kraju nestati.

Međutim, kako vrlo često svakodnevni govor nije isti kao onaj pisani, postavlja se pitanje: da li softver ispravlja gramatičke i logičke greške? Mirsad objašnjava:

U ovom prototipu ne postoje gramatički niti interpukcijski moduli predviđeni planom razvoja. U narednih šest meseci bi trebalo da imamo kreiran tržišni proizvod koji će imati kako lingvističku, tako i interpukcijsku i gramatičku korekciju, kao i mogućnost njenog isključivanja, zavisno od potreba klijenata.

Za sada softver zapisuje ono što je čuo ako je dovoljno siguran u to, ili ga ispraviti ako nije dovoljno siguran.

Podrška i za druge jezike?

Jedna od glavnih karakteristika softvera je da gotovo trenutno pretvara govor u tekst za sve južnoslovenske jezike. “Mi već razvijamo module za ruski, poljski, češki, slovački i ostale slovenske jezike, a početkom 2019. planiran je razvoj rešenja za engleski i španski”:

Dakle, kada kažem da ćemo kreirati rešenja za engleski i španski, to znači da ćemo ih kreirati na osnovu našeg algoritma, dakle srpsko-hrvatskog jezika i ta šifra će biti osnov za razumevanje drugih jezika. Za slovenske jezike je taj posao znatno lakši, dok je za “zapadne” dosta komplikovaniji ali ne i nemoguć.

Kako navodi Mirsad, oni već sada mogu kreirati aplikaciju za prevođenje koristeći API kompanija kao što je Google za jezike koji su već odlično pokriveni rečnicima a, kako dodaje, i dalje postoji vrlo mali broj specijalizovanih aplikacija, čak i u zemljama čiji su jezici odlično pokriveni rečnicima, te je i to veliki potencijal za razvoj i širenje.

Nadogradnja po potrebama klijenata

Sam softver se, pored jezika, može dodatno nadograditi na zahtev klijenata – “na primer, nakon prezentacije u Podgorici, započeli smo razgovore sa IT službom Skupštine Crne Gore oko moguće saradnje, a prvi uslov je bio da serveri moraju biti instalirani na teritoriji Crne Gore zbog zakonske odredbe koja to predviđa”, kaže Mirsad.

Što više direktnih prezentacija, sastanaka, sistem preporuka, lobiranje, ponude ugovora sa velikim benefitima za klijente koji prvi podrže priču, velike olakšice, popusti i druge beneficije za državne organe, kako kažu članovi tima Daktilograf, ovaj tim trebalo bi da dovedu do softvera broj jedan najpre u medijskim kućama, a zatim i u administrativnim službama, državnim organima i drugim institucijama u kojima postoji potreba za pisanjem teksta.

Bez dodatnih zahteva klijenata, dodaje Hadžalić, postoje dva pricing modela: 50 evra mesečno za jedan korisnički profil aplikacije Snimač/Konvertor namenjene medijima za 24/7 konverziju i oko 150 evra za korisnički profil aplikacije Stenogram namenjene državnoj upravi – vladama, skupštinama, sudovima, službenom glasniku. A to je, dodaje, tek početak.

Odgovori

Tvoja e-mail adresa neće biti objavljena.

Popularno

Digitalni mediji

Disney+ je konačno dostupan i kod nas, ali evo šta korisnici u Srbiji ne dobijaju

Od ovog meseca, korisnici iz Srbije i regiona konačno imaju priliku da se pretplate na Disney+ striming platformu, ali uz određena ograničenja.

Startapi i poslovanje

Domaći OTA Sync podigao €250.000 – prva investicija Telekomovog VC fonda

Domaći startap OTA Sync podigao je investiciju u vrednosti od skoro 250.000 evra od strane zajedničkih investitora TS Ventures Fonda, DSI grupe poslovnih anđela i Startup Wise Guys fonda iz Estonije.

Karijere

Nakon 15 godina u medijima Ivan Jelić karijeru nastavlja u kompaniji Sourcefabric

Posle 15 godina rada na domaćem medijskom tržištu kao deo web tima B92, Ivan Jelić nastaviće svoju karijeru u kompaniji Sourcefabric. U intervjuu sa njim otkrivamo kako se odlučio da svoje nove profesionalne korake gradi u firmi koja razvija softver za medije.

Propustili ste

Startapi i poslovanje

Florence Healthcare sa velikom kancelarijom u Beogradu obezbedio novih $27 miliona investicije

Cilj ove investicije je da podrži misiju kompanije da u narednoj deceniji udvostruči rezultate kliničkih istraživanja tako što će omogućiti remote pristup njihovoj dokumentaciji.

Internet marketing

Kreativna agencija Redvertex otvara kancelarije u Beogradu – zapošljavaju 3D artiste i arhitekte

Jedna od vodećih svetskih kreativnih agencija iz oblasti arhitektonske vizualizacije i marketinga posvećene svetskoj industriji nekretnina, otvara svoju kancelariju u prestonici Srbije.

Novost

Ximedes sa kancelarijama u Novom Sadu akvizirao holandski Ginger Payments – širenje tima prva stvar na spisku

Ximedes, evropska softverska firma aktivna u fintech oblasti sa kancelarijama u holandskom Harlemu, Hamburgu, Stokholmu i Novom Sadu, akvizirala je kompaniju Ginger Payments koja je vodeći provajder platforme za onlajn plaćanje sa sedištem u Amsterdamu.

Najava

Solana x Jump Hacker House konferencija o web3 tehnologiji dolazi u Beograd početkom jula

'Solana x Jump Hacker House Beograd', konferencija za softverske inženjere i tehnološke biznise zainteresovane za blockchain i web3 tehnologije biće održana u Beogradu od 02. do 06. jula.

Gaming

Highwater nova je igra srpskog Demagog studija koja ove godine dolazi na konzole i PC

Nakon uspeha video igre 'Golf Club: Wasteland' i najave igre 'The Cub', srpski game dev studio Demagog najavio je svoj novi naslov 'Highwater' koji bi uskoro trebalo da bude dostupan za gejmere širom sveta.

Karijere

Kako započeti karijeru u web3 – saveti programera

Web3 je najbrže rastući ekosistem u Srbiji. Zanimalo nas je kako izgleda karijerni put u ovoj industriji, a to smo otkrili kroz razgovor sa dvojicom web3 programera.