Mogu li neuralne mreže 'uloviti' botove na Internetu?

Mogu li neuralne mreže ‘uloviti’ botove na Internetu?

Sekcije za komentare na velikim portalima odavno su postale uporište stranačkih prepiranja i nametanja mišljenja, takozvanog 'botovanja'. Takvo ponašanje danas se gotovo stopilo sa mišljenjima običnih građana koji kritikuju ili hvale vlast, a prepoznavanje botovskog komentara - veština koju poseduje tek nekolicina. Novosađanin Mihailo Isakov misli da se botovski komentari mogu lakše prepoznati uz pomoć neuralnih mreža, evo i kako.

bot1

Ukoliko ste se već na počektu zapitali šta su to neuralne mreže – u pitanju je nova generacija sistema za informaciono procesiranje koja pokazuje osobinu učenja, memorisanja i generalizacije na osnovu podataka kojima se obučava. U prevodu, sistem se uči kako bi prepoznao određeno ponašanje. To je upravo ona tehnologija koju Google primenjuje kako bi automatski odredio vašu lokaciju na osnovu napredne analize fotografije.

No, mogu li se neuralne mreže iskoristiti za prepoznavanje botova? Mihailo Isakov kaže da mogu, a tim povodom kreirao je i web aplikaciju pod nazivom “Lovac na sendviče” čiji je zadatak obeležavanje botovskih i ne-botovskih komentara, a sa ciljem učenja sistema da prepozna komentare sa političkom pozadinom:

Lovac na sendviče je Chrome app koji na komentare na portalima Blic i B92 ugradi dugmiće “BOT!” i “nije bot”. Time korisnici koji instaliraju aplikaciju mogu da mi pošalju komentare za koje misle da su plaćeni. Bavim se mašinskim učenjem, konkretno dubokim neuronskim mrežama, i već duže vreme sam hteo da istreniram mrežu da prepoznaje bot komentare na Internetu.

bot2
Korisnici aplikacije ručno obeležavaju komentare za koje smatraju da su plaćeni (Izvor: Lovac na sendviče)

U razgovoru za Netokraciju, Isakov ističe kako je inicijalno želeo da ručno obeleži približno 10.000 komentara, ali da je posao jednostavno prevelik za jednu osobu. Plan je bio da se kreira upravo Chrome aplikacija šaljivog naziva koja bi privukla korisnike, a njenom kreatoru obezbedila veliki broj podataka koji će dalje biti iskorišćeni u svrhu istraživanja neuralnih mreža.

Šta nam neuralne mreže govore o ‘botovima’?

Lovac na sendviče objavljen je pre svega nekoliko dana, a aplikacija je do sada zabeležila 300 korisnika koji su ocenili više od 1.700 komentara sa 4.000+ ocena. Aplikacija trenutno radi na sajtovima kao što su Blic, B92 (uskoro i na N1), dok je u planu i izrada verzije za Firefox pretraživač, dodaje Mihailo, ističući kako je jedan od problema sa kojim se primena neuralnih mreža na prepoznavanje botovskih komentara suočava jeste i veliki dataset obeleženih komentara potrebnih za kvalitetnu analizu:

Hashtagovi su jako korisni za sentiment analizu tvitova jer ih korisnici sami pišu, a ti treba samo da ih pokupiš. Kod komentara to je teže jer ne postoji nikakva dodatna informacija, nikakav način da uporediš sadržaj komentara sa nekom labelom ili ocenom (upvotes/downvotes ne znače mnogo). 

Isakov ističe da je kod aplikacije u potpunosti opensource budući da je cilj proširiti reč o app-u, te prikupiti barem 10.000 obeleženih komentara potrebnih za ozbiljnije rezultate. On zaključuje kako će se nakon što prikupi dovoljan broj komentara krenuti sa analizom pomenutih informacija (pri čemu će kompletan dataset biti dostupan za preuzimanje), a sa ciljem predstavljanja rezultata o mašinskom učenju vezanom za prepoznavanje određenih paterna tj. ponašanja na Internetu.

Preuzmite “Lovac na sendviče” i krenite u lov na botovske komentare već danas.

Ostavi komentar

  1. Aleksandar Vučićević

    Aleksandar Vučićević

    14. 3. 2016. u 10:30 Odgovori

    Svaka čast Mihajlu, on je za samo nekoliko nedelja uspeo da razvije aplikaciju koja će nam omogućiti da još brže izvršimo bolnu reformu interneta. Molim da mi neko prosledi njegov kontakt u inboks.

  2. Stjepan Zlodi

    Stjepan Zlodi

    14. 3. 2016. u 10:53 Odgovori

    Kad u članku napišete da je nešto opensource onda bi očekivao da će se u njemu naći i link na repozitorij tog koda.

    Drugo – čini mi se da bot nije ispravan termin za stranačke vojnike koji ostavljaju takve komentare. Bot je obično automatizirana skripta koja izvodi jednostavne operacije visokog volumena. Npr. kao kladioničarske skripte koje lijepe svoje komentare na sve članke iz rubrike sport na nekim portalima. U ovom slučaju bi prije rekao da se radi o drukerima koji rade za jednu opciju, ali bez obzira što to rade s pola mozga ne možemo ih izjednačiti s botovima. Jedino ako je u .rs termin za drukera bot onda povlačim primjedbu. 🙂

Odgovori

Tvoja e-mail adresa neće biti objavljena.

Popularno

Startapi i poslovanje

Da li ženski pristup pravi uspešne biznise?

Filozof Soren Kierkegaard kaže da se život može razumeti samo iz retrospektive, ali da se mora živeti unapred. Kažu i da preduzetnici imaju odlične instinkte za snalaženje, ali da ih pitate da objasne kako su nešto znali, možete da očekujete odgovor koji je u suštini glasi - nemoj da me pitaš gluposti, ne znam.

Office Talks Podcast

Šta je ‘destination’ marketing i kako kreirati strategiju koja privlači turiste?

Turizam jedne države danas i te kako zavisi od digitalnog oglašavanja. O tome šta predstavlja termin 'destinacionog marketinga' i kako Srbija i Crna Gora mogu da sebe bolje brendiraju kao turističke destinacije, govorimo u 93. epizodi Office Talks Podcasta.

Startapi i poslovanje

Srpski Eat Me App rešava problem viška hrane koja se baca – čuvajući našu okolinu

Otpad od hrane je treći najveći emiter gasova staklene bašte na svetu. Globalno, 30% ili 1,8 milijardi tona sve proizvedene hrane na globalnom nivou se pokvari zbog loše planiranje resursa duž linije lanca snabdevanja. Srpski startap Eat Me App sa svojom aplikacijom nastoji da stane na put ovom problemu i globalnom društvu ponudi jedno od rešenja za ovaj veliki problem.

Propustili ste

Startapi i poslovanje

B-Fresh: Nakon pobede na Generator ZERO konkursu, krećemo sa aktivnom prodajom!

Domaći startap ekosistem možda ne obiluje sa previše uspešnih agrotech rešenja. Ipak, Generator Zero konkurs OTP banke predstavio nam je talentovane timove iz oblasti ekologije i poljoprivrede. Pobedu na ovom takmičenju odneo je tim B-Fresh sa proizvodom za produženje roka trajanja voća i povrća.

Gaming

Novo poglavlje Tetrisa piše se u Beogradu i Tel Avivu – razvijaće ga Playstudios

Kompanija Playstudios kupila je krajem prošle godine prava za razvoj Tetris franšize na mobilnim platformama. Dalji razvoj ovog legendarnog naslova poveren je timu Playstudios Europe iz Beograda na kome će zajedno raditi sa kolegama iz Playstudios Israel u Tel Avivu.

Office Talks Podcast

Zašto Elon Musk kupuje Twitter?

Twitter - hoće li ostati kakvog ga znamo ili sa akvizicijom Elona Muska dolazi neka nova era? O kupovini ove društvene mreže razgovaramo u 95. epizodi Office Talks podcasta.

Startapi i poslovanje

Londonski Qudo sa osnivačem iz Srbije uzeo investiciju od $3,5 miliona – razmišlja se o razvojnom centru u Beogradu

Questionardo, firma koja razvija platformu Qudo za agilno ispitivanje potrošača i preciznu digitalnu aktivaciju vođenu podacima, nedavno je dobila i investiciju od 3,5 miliona dolara. Jedan od osnivača ovog startapa dolazi iz Srbije i sa njim razgovaramo o daljem poslovanju i razvoju proizvoda.

Karijere

Relax Gaming otvorio studio u Novom Sadu uz aktivno širenje tima

Rast iGaming industrije primetan je i na domaćem tržištu. Nakon četiri godine poslovanja u Srbiji, kompanija Relax Gaming otvorila je novi studio i najavila aktivno širenje tima.

Intervju

Vladimir Lelićanin: Pokrenuli smo 3327 kao mesto gde će domaći developeri slobodno raditi na web 3.0 projektima

Direktor razvojnog centra pri kompaniji MVP Workshop otkriva u razgovoru za Netokraciju kako je nastao 3327, kako se razvijaju inovativni web 3.0 projekti u Srbiji, ali i šta je potrebno kako bi se izgradila još jača web 3.0 zajednica na ovim prostorima.