Walka ze spamem

Wszystko Off Topic
Awatar użytkownika
LordRuthwen
Moderator
Posty: 2305
Rejestracja: 18 września 2009, 21:45
Lokalizacja: klikash?

Walka ze spamem

Post autor: LordRuthwen »

Temat na luźną dyskusję.
Tak się zastanawiam jak walczycie ze spamem?
Bo na pewno wielu z was ma serwery pocztowe.
Ja mam zaprzęgnięty do tego skrypt fail2ban automatycznie wysyłający powiadomienia do zarządcy adresu IP delikwenta (KLIK)
Poważnie się też zastanawiam, czy nie dorobić do tego wpisywania na sorbsa czy inne rble.
klavierkrk
Beginner
Posty: 257
Rejestracja: 14 maja 2013, 17:18

Post autor: klavierkrk »

z perspektywy programistycznej, to wygląda ciekawie:

1. najprościej:
wrzucasz string do input
słowa kluczowe = "tani kredyt", "jestem spamem"
jeżeli PRAWDA występowanie słów kluczowych to USUŃ.
output to USUŃ lub ZOSTAW string który wrzuciłeś

2. można byloby też to zrobić na zasadzie statystyki:
string z emaila idzie do input,
jeżeli słów kluczowych więcej niż np. 5% tekstu, to odrzuć
opcjonalne ustawienia: 5%, 10, 15% całego tekstu...

3. oczywiście filtrowanie adresów,
jeżeli e-mail=jestem@spamem.pl ,to USUŃ.

4. znaleźć 15 różnych filtrów e-mailowych (podobnych do tych wyżej).
jeżeli dana wiadomość przejdzie pozytywnie weryfikację więcej niż 10 razy, to nie jest spamem. a jak mniej niż 10, to jest. Kwestia ustawień.


paradoksalnie analiza stricte tekstowo/stringowa jest prosta, problem pojawić się może jeżeli wiadomość e-mail to jest obrazek (np. jpg w całości wpisany w html), bo wtedy trudniej to wykryć, że to spam


wiem, że jest przynajmniej kilkadziesiąt skryptów PERLa, które to robią (powiedzmy, że każdy skrypt to 1 filtr), tutaj można pogrzebać:
http://www.cpan.org/index.html
Awatar użytkownika
LordRuthwen
Moderator
Posty: 2305
Rejestracja: 18 września 2009, 21:45
Lokalizacja: klikash?

Post autor: LordRuthwen »

Przepraszam, zastosowałem skrót myślowy, spam swoją drogą, chociaż dość długo uczyłem bayesa i nie puszcza więcej niż 1-2 wiadomości miesięcznie, ale przychodzi mi tego masa na niefiltrowane postmaster.
Chodziło mi raczej o próby wysyłania, logowania i tak dalej, bo o tym mi f2b raportuje.
Do analizy obrazków też są odpowiednie narzędzia, jak choćby OcrPlugin: https://wiki.apache.org/spamassassin/OcrPlugin
ODPOWIEDZ