Jak vyzrát na (spam)boty?

Založil Roman Horník, 23. 02. 2012, 07:00:26

Předchozí téma - Další téma

Roman Horník

Nemá někdo z vás zkušenosti s bojem proti spambotům?
Chci je poznat co nejvíc a pak vytvořit dodatečnou ochranu tohohle fóra. Doteď jsem je střílel ručně, na pažbě mám skoro 40 zářezů, ale nejsem ani Don Quijot, ani Chuck Norris, do nekonečna to takhle nejde, takže si to chci zautomatizovat.
Fórum je sice dost zabezpečeno proti útokům strojů, ale ne tolik, abych cejtil, že je dostatečně v bezpečí, možná, i když je stabilní, má nějakou bezpečnostní díru.
Třeba koukám, že host s nějakou IP, která je zanesena v databázi spambotů provádí něco, co nemůžu ani já, ani Ota (co jako admin může všechno) vidět, což mi tak trochu nahání hrůzu. A nechci nikoho živýho ničím dalším omezovat, nechci omezovat ani boty vyhledávačů a crawlery.

Takže se ptám:

1) Dá se většina z nich spolehlivě strojově identifikovat? Jakej je třeba jejich nejčastější user-agent?
2) Reaguje alespoň nadpoloviční většina z nich na javascript nebo robots.txt?
Debian Sid/Experimental 64bit + Mate Desktop Environment
* CPU: Intel i5 3570
* GPU: NVIDIA GTX650 1GD5
* MB: Lenovo IH61M
* RAM: 16GiB Deutsche Demokratische Republik 3 @ 1600MHz

Petr Krčmář

Ani user-agent ani robots.txt nepomůžou. Boti se obvykle hlásí jako standardní prohlížeč, taky to často standardní prohlížeč je, protože dneska je běžné sypat spam ručně. Pár Indů udělá za deset dolarů opravdu kus práce. Na Rootu (taky SMF) se mi osvědčilo chtít při registraci odpověď na dvě české otázky. Podporu pro to fórum má, stačí ho nakrmit otázkami. Třeba: ,,Napiš slovy, kolik trpaslíků patří ke Sněhurce." nebo ,,Jak se jmenuje aktuální testovací verze Debianu?"

I přes tyhle otázky občas spammer projde, pak ho nezbývá než smazat a banovat mu IP adresu. Ale to se stane jen občas a pak je vždycky pokoj.

Taky můžeme natvrdo zaříznout přístup z počítačů z Číny a Ruska podle hostname. Neodstaví je to všechny, ale velkou část pokusů ano. Mimochodem za pár měsíců mám z Ruska 20 000 blokovaných pokusů o přístup. Asi to nebudou regulérní uživatelé.

Roman Horník

Petře, mockrát Ti děkuju za cenný informace!
Vůbec jsem nevěděl, že se ručně spamuje až v takový míře, ale má to zase svou logiku, když se dneska používaj bezpečnostní prvky, se kterýma si stroj neporadí.
Takže musíme s Otou vymyslet takovou otázku, která při strojovým překladu do jinýho jazyka vyhodí nesmysl, na níž by odpověď znali pokud možno jen Češi i Slováci, nepoužívající diakritiku, nemající ani základní linuxový znalosti nebo znalosti z výpočetní techniky vůbec (BFU konkurenčního OS, od nějž jsme s radostí utekli).
IP, až na pár výjimek, blokovat nebudu, budou-li k nám od jednoho ISP, hlavně ze vzdálenějších končin, tedy hlavně z asijských zemí a z Ruska, chodit spammeři/spamboti opakovaně, zablokuju celou síť onoho ISP, na tomhle fóru si na chleba nevydělaj.
Debian Sid/Experimental 64bit + Mate Desktop Environment
* CPU: Intel i5 3570
* GPU: NVIDIA GTX650 1GD5
* MB: Lenovo IH61M
* RAM: 16GiB Deutsche Demokratische Republik 3 @ 1600MHz

ulo

Jestli můžu navrhnout, tak ta otázka by se mohla týkat našeho největšího myslitele J.Cimrmana - to by Češi i Slováci znát mohli (i ty mladší) a nespadá to do hlubších znalostí IT :-)
PC-doma:  LinuxMint 17.2 KDE (64bit) - AMD Athlon II X2 270, MB ASUS M5A78L LE, RAM 4 GB, ATI Radeon HD4350
PC-práce: LinuxMint 17.2 KDE (32bit) - Intel Pentium 4, MB MSI 945G Neo, RAM 4 GB, GeForce 8400 GS
NB:  LinuxMint 17.1 KDE (32bit) - Acer TravelMate 3002
Servery:  Debian 6.0 Squeeze

Roman Horník

Jo, dobrej nápad! :D
Akorát- bude to vědět i mladá generace?
Debian Sid/Experimental 64bit + Mate Desktop Environment
* CPU: Intel i5 3570
* GPU: NVIDIA GTX650 1GD5
* MB: Lenovo IH61M
* RAM: 16GiB Deutsche Demokratische Republik 3 @ 1600MHz

ulo

čeče tak to předpokládám, že jo :-)  Já nejsem (asi) už nejmladší a tak neznám, který věci teď letí u mladých (mám ted na mysli *náctileté).
A co tady zkusit udělat malou anketku nebo nějaký průzkum anebo u té otázky nějakou možnost kontaktovat kvůli nápovědě třeba tebe jako admina nebo Otu.
PC-doma:  LinuxMint 17.2 KDE (64bit) - AMD Athlon II X2 270, MB ASUS M5A78L LE, RAM 4 GB, ATI Radeon HD4350
PC-práce: LinuxMint 17.2 KDE (32bit) - Intel Pentium 4, MB MSI 945G Neo, RAM 4 GB, GeForce 8400 GS
NB:  LinuxMint 17.1 KDE (32bit) - Acer TravelMate 3002
Servery:  Debian 6.0 Squeeze

Petr Krčmář

Těch otázek se tam dá nasypat dvacet a on vždycky nějakou vylosuje. Zkušenost je taková, že přes jednu otázku prochází poměrně dost spammerů. Oni si to umí přeložit a/nebo vygooglit. Dá se tam nastavit, aby losoval víc otázek, já jsem dal dvě a projde jich minimum.

Je taky docela problém vymyslet rozumné otázky. Mě se osvědčila přísloví, kde třeba chybí jedno slovo a uživatel ho musí doplnit. Nebo nějaké obecnější otázky na to, který měsíc je v roce čtvrtý a podobně. Cimrmana bych do toho netahal, já ho znám velmi dobře a umím citovat půlku her, ale ne každý bude vědět, co doplnit do věty ,,Ale té ... se nevzdáááám! Mňmňmň." :-)

Roman Horník

Zatím to vypadá, že se jim registrace nedaří, což je dobře, ale jakmile se to nějakýmu povede, já nikdy nespím, nemilosrdně ho zlikviduju :P
Mňmňmň :D
Debian Sid/Experimental 64bit + Mate Desktop Environment
* CPU: Intel i5 3570
* GPU: NVIDIA GTX650 1GD5
* MB: Lenovo IH61M
* RAM: 16GiB Deutsche Demokratische Republik 3 @ 1600MHz

Milan Kvak

Pridám trošku zo skúseností - asi to je už neaktuálne ale keby niekto hľadal. Prevádzkujem jedno fórko sice na phpBB ale spambotom je asi jedno kam postujú. So spamom som mal problémy, ale potom som skúsil google reCaptcha a odvtedy nemám ani jeden SPAM. (cca 4 mesiace)