Mogu li neuralne mreže 'uloviti' botove na Internetu?

Mogu li neuralne mreže ‘uloviti’ botove na Internetu?

Sekcije za komentare na velikim portalima odavno su postale uporište stranačkih prepiranja i nametanja mišljenja, takozvanog 'botovanja'. Takvo ponašanje danas se gotovo stopilo sa mišljenjima običnih građana koji kritikuju ili hvale vlast, a prepoznavanje botovskog komentara - veština koju poseduje tek nekolicina. Novosađanin Mihailo Isakov misli da se botovski komentari mogu lakše prepoznati uz pomoć neuralnih mreža, evo i kako.

bot1

Ukoliko ste se već na počektu zapitali šta su to neuralne mreže – u pitanju je nova generacija sistema za informaciono procesiranje koja pokazuje osobinu učenja, memorisanja i generalizacije na osnovu podataka kojima se obučava. U prevodu, sistem se uči kako bi prepoznao određeno ponašanje. To je upravo ona tehnologija koju Google primenjuje kako bi automatski odredio vašu lokaciju na osnovu napredne analize fotografije.

No, mogu li se neuralne mreže iskoristiti za prepoznavanje botova? Mihailo Isakov kaže da mogu, a tim povodom kreirao je i web aplikaciju pod nazivom „Lovac na sendviče“ čiji je zadatak obeležavanje botovskih i ne-botovskih komentara, a sa ciljem učenja sistema da prepozna komentare sa političkom pozadinom:

Lovac na sendviče je Chrome app koji na komentare na portalima Blic i B92 ugradi dugmiće „BOT!“ i „nije bot“. Time korisnici koji instaliraju aplikaciju mogu da mi pošalju komentare za koje misle da su plaćeni. Bavim se mašinskim učenjem, konkretno dubokim neuronskim mrežama, i već duže vreme sam hteo da istreniram mrežu da prepoznaje bot komentare na Internetu.

bot2
Korisnici aplikacije ručno obeležavaju komentare za koje smatraju da su plaćeni (Izvor: Lovac na sendviče)

U razgovoru za Netokraciju, Isakov ističe kako je inicijalno želeo da ručno obeleži približno 10.000 komentara, ali da je posao jednostavno prevelik za jednu osobu. Plan je bio da se kreira upravo Chrome aplikacija šaljivog naziva koja bi privukla korisnike, a njenom kreatoru obezbedila veliki broj podataka koji će dalje biti iskorišćeni u svrhu istraživanja neuralnih mreža.

Šta nam neuralne mreže govore o ‘botovima’?

Lovac na sendviče objavljen je pre svega nekoliko dana, a aplikacija je do sada zabeležila 300 korisnika koji su ocenili više od 1.700 komentara sa 4.000+ ocena. Aplikacija trenutno radi na sajtovima kao što su Blic, B92 (uskoro i na N1), dok je u planu i izrada verzije za Firefox pretraživač, dodaje Mihailo, ističući kako je jedan od problema sa kojim se primena neuralnih mreža na prepoznavanje botovskih komentara suočava jeste i veliki dataset obeleženih komentara potrebnih za kvalitetnu analizu:

Hashtagovi su jako korisni za sentiment analizu tvitova jer ih korisnici sami pišu, a ti treba samo da ih pokupiš. Kod komentara to je teže jer ne postoji nikakva dodatna informacija, nikakav način da uporediš sadržaj komentara sa nekom labelom ili ocenom (upvotes/downvotes ne znače mnogo). 

Isakov ističe da je kod aplikacije u potpunosti opensource budući da je cilj proširiti reč o app-u, te prikupiti barem 10.000 obeleženih komentara potrebnih za ozbiljnije rezultate. On zaključuje kako će se nakon što prikupi dovoljan broj komentara krenuti sa analizom pomenutih informacija (pri čemu će kompletan dataset biti dostupan za preuzimanje), a sa ciljem predstavljanja rezultata o mašinskom učenju vezanom za prepoznavanje određenih paterna tj. ponašanja na Internetu.

Preuzmite „Lovac na sendviče“ i krenite u lov na botovske komentare već danas.

Ostavi komentar

  1. Aleksandar Vučićević

    Aleksandar Vučićević

    14. 3. 2016. u 10:30 Odgovori

    Svaka čast Mihajlu, on je za samo nekoliko nedelja uspeo da razvije aplikaciju koja će nam omogućiti da još brže izvršimo bolnu reformu interneta. Molim da mi neko prosledi njegov kontakt u inboks.

  2. Stjepan Zlodi

    Stjepan Zlodi

    14. 3. 2016. u 10:53 Odgovori

    Kad u članku napišete da je nešto opensource onda bi očekivao da će se u njemu naći i link na repozitorij tog koda.

    Drugo – čini mi se da bot nije ispravan termin za stranačke vojnike koji ostavljaju takve komentare. Bot je obično automatizirana skripta koja izvodi jednostavne operacije visokog volumena. Npr. kao kladioničarske skripte koje lijepe svoje komentare na sve članke iz rubrike sport na nekim portalima. U ovom slučaju bi prije rekao da se radi o drukerima koji rade za jednu opciju, ali bez obzira što to rade s pola mozga ne možemo ih izjednačiti s botovima. Jedino ako je u .rs termin za drukera bot onda povlačim primjedbu. 🙂

Odgovori

Tvoja e-mail adresa neće biti objavljena.

Popularno

Startapi i poslovanje

Uz ‘Fleksibilni petak’ Nordeus omogućio zaposlenima da sami organizuju poslednji radni dan u nedelji

Dok se zaposleni u Nordeusu nakon 'full remote' režima ne vrate u kancelariju, kompanija im omogućava da njihova radna nedelja traje 4 dana - ukoliko to žele. Fleksibilni petak startovao je 8. maja, a u nastavku otkrivamo kako to izgleda u praksi.

Tehnologija

Šta novi IPS QR kodovi donose malim trgovcima i njihovim kupcima – i kako ih implementirati?

Usluga instant plaćanja na prodajnim mestima uz pomoć IPS QR kodova zvanično je puštena u protokol u Srbiji krajem februara. U nastavku analiziramo na šta trgovci treba da obrate pažnju ako isti uvode u svoje procese naplate.

Kultura 2.0

Milica Čalija: Pokrenuli smo ‘Kupujmo iz Srbije’ jer želimo da mali proizvođači prežive pandemijsku krizu

Akcija 'Kupujmo iz Srbije' pokrenuta je sa ciljem da se kroz predstavljanje malih proizvođača putem društvenih mreža doprinese borbi da njihovi biznisi prežive aktuelnu pandemiju. U tekstu koji sledi, sa inicijatorkom projekta razgovaramo o samoj akciji i daljim koracima za pomoć malim preduzetnicima u Srbiji.

Propustili ste

Gaming

Preko 10 miliona ljudi preuzelo je igru srpsko-švedskog studija Sozap – a za domaći tim to je samo početak

Armed Heist je 'mobile' igra studija Sozap i verovatno je najviše preuzimana igra bilo kog domaćeg studija južno od Beograda. Sa predstavnicima niškog ogranka ove gejming kompanije razgovaramo o pomenutoj igri i planovima za budućnost.

Netokracija

Popunite anketu o stanju plata u srpskoj IT i digitalnoj industriji nakon COVID-19

Učestvovanje u anketi je anonimno, zahteva svega nekoliko minuta i biće moguće dok ne prikupimo relevantnu količinu materijala.

Karijere

Kada je pravo vreme da uvećate vaš tim – iz ugla kreativne agencije i IT kompanije

Skaliranje - naizgled strana reč koju ako prebacite u kontekst preduzetništva i poslovanja znači mnogo. Ovog puta govorimo o rastu timova u kreativnoj i IT industriji, o tome kako efikasno voditi ovaj proces i kako izbeći izazove na tom putu.

Kultura 2.0

Mojih 5: Nemanja Čedomirović

Nemanja Čedomirović vodi GrowIT i sa svojim timom pomaže kompanijama da usvoje agilni način rada, a ove nedelje u specijalu 'Mojih 5' deli svoje preporuke sadržaja koji mu je ovih dana okupirao pažnju.

E-commerce

Nikola i Sonja pokrenuli su Prodajadelova.rs jer žele da promene način na koji održavamo naše četvorotočkaše

Napustio je dobro plaćen posao i visoku poziciju u kompaniji Würth sa ciljem da započne svoj posao iz snova. Ovo je priča o Nikoli Đuroviću koji je sa suprugom Sonjom pokrenuo sajt Prodajadelova.rs sa namerom da promeni percepciju kupovine auto delova i servisiranja vašeg četvorotočkaša.

Ekskluzivno

U 2019. godini potrošili smo €47,05 miliona na digitalno oglašavanje

Rezultati o ukupnom utrošku na digitalno oglašavanje u prethodnoj godini konačno su tu. Gle čuda - i ovoga puta tržište digitalnog oglašavanja u Srbiji zadržalo je dvocifren rast, ostvarivši jedan od najboljih rezultata otkako se istraživanje vrši.