Spam szűrők elleni harc. Vagy háború?

**etalon** · 2009-11-06, 10:32

Tudom, hogy nem éppen SEO téma, de szerintem majdnem annyira fontos. Mert hiába van sok látogató a honlapon, azokat meg is kell tartani.
A kapcsolattartás egyik legjobb módja a hírlevelek, vagy körlevelek küldése. De itt mintha betonfalba ütköznénk: Akkor is nagyon nehéz átjutni az ingyenes email szolgáltatók spam szűrőjén, ha a címeket teljesen legálisan gyűjtöttük.
Ugyanúgy, ahogy a Google teljes titokban tartja azt az algoritmust, amivel a találati lista sorrendjét meghatározza, hétpecsétes titok a spam szűrők szűrési algoritmusa.
Márpedig, ha ismerjük, hogy mit kell tenni a google találati lista elejére kerüljünk, akkor össze lehet szedni azt is, hogy hogyan tudunk átjutni a spam szűrőkön.
Gyűjtsük össze itt az ezzel kapcsolatos tudásokat!

Hasonló témák:

**Geri** · 2009-11-06, 10:38

amiket én ismerek szempontok:
több címzett
spam listás szavak(******,free,etc)
rosszul beállított küldő header(nem a küldő severhez tartozó emailcím)
linkek az emailben
spam listás a küldő server ip-je

hm... most csak ezek jutottak eszembe, pedig sokkal hosszabb a lista. ezeknel a dolgoknak az alapján számolja a spam score-t a legtöbb spam filter és az már általában egyené beállítás hogy hány százalékos pontnál mit csináljon(pl 90+ nál már be sem rakja a postafiókba,70+ spam folder, etc)

update:
egy érdekes wiki cikk a témában: http://en.wikipedia.org/wiki/Bayesian_spam_filtering

**ChrIsDrY** · 2009-11-06, 12:48

Számomra az ilyen hírlevelek kiküldés módja már lejárt lemez vagy 5 éve minimum, részint a fent leírt okok miatt. Nagyon a magyar felhasználókba verték a nagy 'marketing guruk' ezeket a dolgokat s közben elfelejtették, hogy változnak az idők és a felhasználói szokások/elvárások, amiket nagyban mi is befolyásolhatunk. Nálunk pl. szépen immár 4 éve RSS-re vannak rászoktatva az olvasók, felhasználók, tagok... valamint Twitteren is nő az igény (magyar angol oldalunkon egyaránt), mindez azonnali, nem akad fel semmi spamszűrőn, lekövethető analitikai rendszerekkel, ki, mikor, mit nézett meg... Továbbá a közösségi oldalakon lévő csoportoknak küldött üzenetek is nagyon jól működnek (persze megfelelő szövegezéssel). Ha mindenáron még a hírlevéllel akarsz bíbelődni, akkor azért a mostani spam-törvényt (ill. a mindenkori spamtörvényt) is figyelni kell. Továbbá, én mint felhasználó ha megunom a hírlevelet: leiratkozást kell kérnem, ez nekem és az küldőnek is idő, ha ezt nem teszi meg akkor ott a spamszűrő (ami tanítható), továbbá megfelelően meg kell fogalmazni, szerkeszteni a html-t, ez is mind idő. -Persze, ez az én meglátásom, én az újabb automatizált és lekövethető rendszerekben jobban bízom. Pl. az RSS-nél Twitternél stb-nél minden könnyen kezelhető a felhasználó szempontjából (amit megintcsak nem árt szem előtt tartani). Nincs rossz karakterkódolás, spec levelezőprogramok rossz megjelenítési formái miatt is lehet elégedetlen ügyfél - még aki kérte is a hírlevelet. Nálam is van, aki kéri, ott a feedburner RSS-e, az mindenre jó, erre is: hírlevélben is értesít, ha úgy akarja a felhasználó, amúgy, meg a sharethis, meg a többi bookmark ami szintén megfelelő ennek is. De szerintem Mo-on még 10 év múlva is hírlevelet fognak küldözgetni... tisztelet a kivételnek.

Ui.: Mivel ez a Bayes-filter spamszűrő-rendszer nálam is működik, ha átjön valami átállítom az érzékenységét s betaníttatom, s utána nem jön több hírlevél, se spam...

**abc** · 2009-11-06, 20:04

Amit észrevettem, néhány ingyenes levelező spambe tesz ha csak nagybetűvel írod a levél tárgyát, illetve van amelyiknek már 2-3 is elég hozzá, hogy a spam mappába érkezzen a levél.

**szjaori** · 2010-12-10, 11:34

Muszály lenne háborúnak lennie mert a nélkül nem lesz eredményes spam beszüntetéssehol. komolyan kell venni.

**Warrior** · 2010-12-10, 11:45

Biztos vagyok benne hogy az is sokat számít ha a felhasználók spamként jelölik a levelet a fiókjukban és akkor következő alkalommal ott landol. Már csak az a kérdés a felhasználók hány százalékának kell ezt megtenni hogy teljesen spamnek minősüljön a levél? (Azaz hogy mindenki kapásból spamként kapja meg.)

**Kvarclovag** · 2010-12-10, 18:30

ChrIsDrY leírta az én véleményemet is. Egy apróság ami miatt a hírleveleket elfogadhatónak tartom, hogy van olyan célközönség aki rss-t és twittert nem tud/akar kezelni, levelet viszont valamelyest igen. De mindenképp célszerű ma már alternatívát kínálni, én hajlandó vagyok rss-t figyelni, esetleg twittert is, bár ott elsikkadhatnak érdekes infók, de hírlevélre biztos nem iratkozok fel soha. A levél az munka, azzal foglalkozni kell ... Ja ezt már írtam. Egyébként a hírlevél fiókra vonatkozó ötletemet fenntartom, egyszer csak ráharapnak a hírlevél küldő programot írók.

**etalon** · 2010-12-11, 12:00

Hellion eredeti hozzászólása

Biztos vagyok benne hogy az is sokat számít ha a felhasználók spamként jelölik a levelet a fiókjukban és akkor következő alkalommal ott landol. Már csak az a kérdés a felhasználók hány százalékának kell ezt megtenni hogy teljesen spamnek minősüljön a levél? (Azaz hogy mindenki kapásból spamként kapja meg.)

Ezzel kapcsolatban fenntartásaim vannak: Van egy Szegedi Attila nevű vagyonvédő, aki gmail-en keresztül küldi rendszeresen spam-jeit. (több címzettnek nem titkosított címlistára egyszerre 50 címzettnek.) A gmail fiókomba érkezik a levél. MInden alkalommal bejelölöm, hogy spam. Minden alkalommal ugyanarról a címről jön.
És mégis mindig megkapom.
A megoldás a következő: nem tesz bele linket, email címet csak telefonszámot.

**harzol** · 2010-12-11, 12:04

Idővel ez is spam mappába fog kerülni, de lehet tényleg többször kell spam-nek jelölni.
(Az is számít, hogy mások spam-nek jelölik-e...)

**rendszergazda** · 2010-12-11, 14:50

Nem szoktam hírleveleket küldeni, olvasni is elvétve, de mail szervert sokat üzemeltetek, ezért összeírnék pár dolgot, olyan hibákat amik miatt spam gyanússá válhat egy teljesen korrekt hírlevél is, amikre érdemes lehet figyelni küldéskor.

Először is mi a spam? A Wikipédia így definiálja: "A spam a fogadó által nem kért, elektronikusan, például e-mailen keresztül tömegesen küldött hirdetés, felhívás." És mi a hírlevél? Nagyjából ugyan ez, azzal a fontos különbséggel, hogy nem kéretlenül küldött ("A kéretlen hírleveleket spamnek nevezzük." - Wikipédia).

Innentől kezdve főhet a feje szegény Rendszergazdának, hogyan tudja a mail szerveren eldöntetni egy (hír)levélről, hogy az kért vagy kéretlen? A válasz egyszerű: sehogy. Marad a "találgatás"... Lehet a levelekkel egyszerűen egy "Tabu, a tiltott szavak játéká"-t játszani, vagy statisztikai/nyelvtani elemzésekbe belemenni.

Egyszer régebben, amikor épp a képes spam volt a menő, abból is az animált gif, hogy még nehezebb legyen felismerni, akkor már egyik szerveremen olyan spam szűrést állítottam be, hogy a levél képi mellékleteit átkonvertálta először egy layer-es tiff-be (összefűrze az animált gif layereit, plusz a "zavaró" szemetet tartalmazó layereket ki is dobta közben belőle), majd erre ráment egy optikai karakterfelismerő OCR program, majd az eredményt összevetettem egy tiltott szavak listájával, korrelációs algoritmussal. El lehet képzelni, mekkora erőforrást vitt el egyetlen levél elemzése, és átlagban másodpercenként érkezett 5 darab arra a szerverre, nem is bírta a dolgot, pedig nem volt gyenge szerver....

Tanultam a dologból, így ma már egyszerű módszerekkel döntök egy levél sorsáról, és a nagy "ingyenes" mail szolgáltatók sem tesznek másként, ebben is biztos vagyok, egy levél vizsgálatára nem éri meg egy X (X tart a 0-hoz) erőforrásnál többet pazarolni.

Tehát nyerők az egyszerű módszerek. Spam listák (blacklists), késleltetett küldés (graylists), pozitív listák (whitelists), pár alap szó szűrése (gyógyszerek, nyeremények, stb.) mint technikák eléggé közismertek. Az alábbiakban inkább olyan gyakori hibákra hívnám fel a figyelmet, amikkel sokszor találkozom, és ami miatt általában a spam mappában landolhat egy teljesen korrekt hírlevél is:

A fejléc kódolása:

A levél fejléce tart az első sortól az első üres sorig, ezt mindenki ismeri, technikai információk helye, a levél vélt útvonala (Received: sorok), dátum, küldő, címzett, tárgy, egyéb "meta" adatok gyűjteménye. A levél ezen része azonban még az "ősi örökség" nyomán 7bites kódolású kell(ene) legyen, tehát angol kis/nagybetűk, számok, írásjelek, de semmi ékezet, semmi unicode vagy egyéb karakterkészletnek helye nincs! A "Content-Type:" a levél szövegére, törzsére vonatkozik, a fejlécre nem!
Ez leginkább a Subject mezőnél szokott gondot okozni sok küldő programnak, hogy ékezetes karaktereket írnak a tárgyba, pl. így:

HTML kód:

Subject: Még nem késte le a legjobb karácsonyi ajánlatokat

Helyesen/szabványosan pl. így kellene kinéznie:

HTML kód:

Subject: =?utf-8?Q?M=C3=A9g=20nem=20k=C3=A9ste=20le=20a=20legjobb=20kar=C3=A1csonyi=20aj=C3=A1nlatokat?=

Ugyan ez igat a címzett (To: ) résznél is, ha a címzett neve tartalmaz ékezetes karaktert, szintén kódolni kell.

HTML levelek képi design elemei

A legtöbb hírlevél nem pusztán sima szöveg, kihasználva a html levelek adta szabadságot, komplett kis "weboldalak" születnek meg, sok grafikai elemmel. Ezek vagy az üzenethez csatolva érkeznek, vagy külső hivatkozásként, egy web szerverről töltődnek be, amennyiben ez engedélyezve van a levelező programban. Hogy melyik a jobb megoldás? Nehéz erre egyértelmű választ adni, hisz külső hivatkozásokat használva jelentősen kisebb lehet a levél mérete, de hátránya, hogy így internetről kell letölteni a levelezőnek a hiányzó elemeket, ami biztonsági kockázatot jelenthet, valamint gondolni kell arra is, hogy valaki esetleg másfél év múltán is rátalál az archívumában egy korábbi hírlevelünkre, és nagyon csúnya tud lenni, ha időközben már letöröltük a szerverről a hírlevél által hivatkozott képi vagy egyéb elemeket.

Én azt vallom, hogy a hírlevél tartalmazza a hozzá tartozó grafikai elemeket is, persze racionálisan, pl. nem kell nyomdai minőségben mellékelni a logót, a hírlevélhez legyen külön, nagyobb tömörítéssel, akár picit rosszabb minőségben mellékelve a grafika, és abban a méterben, ahogy az a levélben fel lesz használva; értem ezalatt hogy egy 100x100 pixel méretben megjelenő logót nem 600x600 pixeles változatban mellékeljenek, hogy majd a megjelenítésnél lecsökkenti a méretét az előírás szerint a levelező.

Így persze nagyobb lesz a hírlevél mérete, de értelmes módon megszerkesztve azt nem lesz azért több MB-os így sem, és ha nem spam üzenet, akkor nem kell több százezer címre sem postázni, így a szerver is bírni fogja. A spammerek azonban minél gyorsabban minél több levelet küldenek, ezért általában a levél pici, és minden grafikai elemet külső hivatkozásként alkalmaznak.

Ha mindenképp külső képhivatkozást szeretne valaki használni, akkor fontos, hogy honnan linkeli, mindenképp a saját szerver ajánlott. Képmegosztó oldalt, egyéb szervert igénybe véve egyfelől lehet hogy törlik idővel a feltöltött képeket, másfelől ha spam levélnél is használták, lehet hogy feketelistás lesz. Jobb elkerülni ennek a lehetőségét.

Linkek

Nem csak a spammer feladókról ill. spam küldő szerverekről van fekete lista. Sajnos sok vírussal/féreggel megfertőzött otthoni számítógép tagja un. botnet hálózatoknak, amin keresztül távirányítva ezen gépeket spam küldésre is fel lehet és előszeretettel fel is használják. Ezt már nehezebb így megfogni, hisz az "okosabb" férgek képesek a levelező program beállításait kiolvasni, és a szolgáltató mail szerverét (akár authentikálva is) használják a feladó valódi identitását felhasználva spam küldésre.

Ezért nem csak az számít, ki küldi a levelet, milyen címről, hanem az is, milyen hivatkozásokat tartalmaz, "hova linkel". Hírlevélben valószínűleg úgysem fog senki warez vagy keksz oldalt linkelni, adatlopó otpbank.hu.hoszucim.ugyiscsakazelejetnezed,co,tw oldalt sem valószínű hogy bárki linkelne. Ami viszont előfordul, az a link rövidítő szolgáltatások (pl. bit.ly), vagy osztott domaines tárhelyek pl. sites.google.com használata hivatkozásokban.

Mivel ezeket a spammerek is előszeretettel használják, így általában szerepelnek a feketelistán, vagy könnyen felkerülhetnek rá, jobb ezek használatát mellőzni hírlevélben.

Üzenet a jövőből

A dátum legyen helyesen megadva. Ha hiányzik a fejlécből a Date: mező, az gond. Ha ott van, de pl. nem jó a formátuma, az is gond. A másik, hogy a dátum legyen valós. Szakálas spammer trükk már az is, hogy a levelet a "jövőből" küldjük, mivel sokan dátum szerint rendezik a leveleiket, így könnyen az első helyre lehet(ett) kerülni, amolyan mail seo-ként, így lehetett beszerezni a mail lista első helyét, de mára már ismert "blackhat" dolog ez. A másik a múltból érkező levél, érdekes dolog 1900-ból elektronikus levelet kapni, különösen hogy a levelező mutatja, hogy van 1 olvasatlan levél, de idő szerint csökkenő listában mire megtalálom, hogy a legrégebbit kell keresni, elmegy vele egy kis idő. De mára már ez is idejétmúlt dolog, hírleveleknél inkább csak hibás beállításból adódhat, kerülendő.

Message-ID

A levél fejlécében lévő Message-ID mező legyen egyedi. Ez általában csak akkor gond, ha belepakoljuk kézzel, ha hagyjuk hogy a mail szerver pakolja oda, akkor ezzel nem szokott gond lenni. Kivéve ha "X-Mailer:" header-t is megadunk, de rosszul. Ebbe a levélküldő program neve/verziója kerülhet bele, opcionális, inkább ne használjuk, ha mégis, akkor legyen valós, különben "lebukhatunk" mert általában minden levelező program magára jellemző formátumú Message-ID-t generál, és ha látszólag egy levelet Outlook-ból küldtek, de a Message-ID nem olyan, mint amilyet az Outlook generál, akkor máris Spam mappa.

Másrészt mint írtam egyedi legyen. Nyilván ha egy levél több címzettnek szól, több TO: CC: vagy BCC: címzettje van, ott az ID egyforma lesz. De ha a hírlevél nem így kerül kézbesítésre, akkor ott már egyedi Message-ID kell legyen. Ha jön egy levél nekem, majd utánna jön egy másik másvalakinek, de ugyan az a Message-ID-ja mint amivel már Én is kaptam levelet, akkor az már szintén Spam, ill. pontosabban én azt már fogadáskor visszadobom hogy duplikált kézbesítés, de ez implementáció függvénye hogy ki hogy kezeli.

Még van csomó apróság, hírlevél ne jöjjön "sürgős" jelzéssel, ne kérjen olvasási nyugtát, Precedence: Bulk header és ezernyi más apró dolog, de a fentiek a leggyakoribbak amikkel találkoztam, meg olyan vagyok kicsit mint a Google, és titokban tartom az algoritmust, hogy pontosan mi alapján szűrök spam leveleket

A fentiek azonban gyakori hibák, és úgy hiszem, hogy többek között ezekre figyelhetnek a "nagy" mail szerverek is egy levél elemzése során.

Téma: Spam szűrők elleni harc. Vagy háború?

Téma eszközök

Display

Spam szűrők elleni harc. Vagy háború?

re: Spam szűrők elleni harc. Vagy háború?

re: Spam szűrők elleni harc. Vagy háború?

re: Spam szűrők elleni harc. Vagy háború?

re: Spam szűrők elleni harc. Vagy háború?

re: Spam szűrők elleni harc. Vagy háború?

re: Spam szűrők elleni harc. Vagy háború?

re: Spam szűrők elleni harc. Vagy háború?

re: Spam szűrők elleni harc. Vagy háború?

re: Spam szűrők elleni harc. Vagy háború?

A téma címkéi:

Könyvjelzők

Könyvjelzők

Hozzászólás szabályai