180 likes | 297 Views
Petr Čech. Antispamový filtr. Nevyžádaná pošta. Elektronická pošta: Nízké provozní náklady a možnost téměř okamžitého doručení: Elektronická pošta je ideální nástroj předávání nevyžádaných informací. Tak zvaná nevyžádaná pošta .
E N D
Petr Čech Antispamový filtr
Nevyžádaná pošta • Elektronická pošta: • Nízké provozní náklady a možnost téměř okamžitého doručení: • Elektronická pošta je ideální nástroj předávání nevyžádaných informací. • Tak zvaná nevyžádaná pošta. • Nevyžádaná pošta dnes tvoří více jak 60% všech přenášených zpráv. Petr Čech: Antispamový filtr
Nevyžádaná pošta • Problémy: • Snížení pracovních výkonů – nutnost třídit poštu • Zvýšení zatížení poštovních serverů • Zvýšení provozních nákladů • Zhoršení výhodných vlastností elektronické pošty jako služby • …to vše vyžaduje nalezení nějakého řešení Petr Čech: Antispamový filtr
Jak se bránit? • Legislativní opatření: • Na vládní úrovni definované právní normy (neefektivní) • Obchodní opatření: • zpoplatněním elektronické pošty nějakou minimální částkou (efektivní ale nepopulární) • Chování uživatelů: • správným chováním v prostředí internetu můžeme množství přijatých nevyžádaných správ výrazně snížit • Technická opatření Petr Čech: Antispamový filtr
Technická opatření • Naivní metody – Černé listiny • Na internetu existuje několik tzv. černých listin odesilatelů • Při příchodu každého dopisu je zaslán dotaz, zda stroj, od kterého je zpráva přijímána, nemá záznam v některé černé listině • V kladném případě je taková pošta odmítnuta • Např. projekt MAPS (Mail Abuse PreventionSystem) Petr Čech: Antispamový filtr
Technická opatření • Metody identifikace nevyžádané pošty bez analýzy obsahu zpráv • Rozpoznání podezřelé zprávy, aniž by bylo třeba analyzovat obsah • Např. metoda Greylisting: • Poštovní server při neúspěšném doručení zařadí zprávu do fronty a po určitém čase se ji pokusí doručit znovu (oproti tomu rozesílače nevyžádané pošty zprávy rozesílají jednorázově). • Přijímací server si z každého dopisu zjistí IP adresu odesílajícího stroje, adresu odesilatele a adresu příjemce. • V případě, že tuto trojici IP adres již nalezne ve své databázi, zprávu normálně do ručí. • V opačném případě dopis odmítne, informuje o tom odesílající server a novou trojici si zapíše do databáze s příznakem, že po předem určenou dobu nebude dopisy se shodnými parametry přijímat. Petr Čech: Antispamový filtr
Technická opatření • Identifikace nevyžádané zprávy na základě analýzy obsahu zpráv • Na základě výskytu určitých slov, nebo frází. • Dokonalejší metody využívají heuristické postupy a snaží se “učit“ na základě předkládaných příkladů. • Spolehlivost: • u nejlepších kolem 60 – 70% • Při určení spolehlivosti je důležitá nejen schopnost rozpoznat nevyžádanou poštu, ale také počet tzv. “falešných poplachů“, kdy program mezi spam zařadí legitimní zprávu. Petr Čech: Antispamový filtr
Analýza obsahu zprávy • elektronická adresa odesilatele • předmět emailové zprávy • tělo elektronické zprávy: • čistě textový obsah (plain text) • webový obsah (html kód) • Názvy souborů • Obrázky uvnitř webového obsahu • Přílohy Petr Čech: Antispamový filtr
Triky spamerů • nepoužívání klíčových slov • častá změna adresy odesilatele • nepoužívání nestandardních příznaků (již se neobjevují zprávy nevyžádané pošty např. s vysokou prioritou) • obsah zprávy již nemá čistě textový charakter • multimédia • maskování (text, který má spamerský charakter je maskován jiným textem) • textové triky Petr Čech: Antispamový filtr
Textovétriky – Oddělování znaků • jednotlivé znaky, ze kterých se klíčové slovo skládá, lze oddělovat nějakým jiným znakem: • v.i.a.g.r.a, • v_i_a_g_r_a, • v-i-a-g-r-a, • … Petr Čech: Antispamový filtr
Textové triky – Nahrazování znaků • nahrazování abecedních znaků znakem jiným, který je opticky velmi podobný, různá slova tak lze například zapsat: • v1agra (viagra) • \ / iagr@ (viagra) • w4tch (watch) • ord3r (order) • … Petr Čech: Antispamový filtr
Textovétriky – násobení znaků • Již klasickým trikem se také stalo znásobení některého znaku v klíčovém slově: • viiiagra (viagra) • ooorder(order) • … Petr Čech: Antispamový filtr
Textové triky – prohazování znaků • některé znaky v klíčovém slově lze snadno prohodit, pro počítačový program je pak text obtížné čitelný, pro člověka ale nikoliv: • vaigra • vigara • Viagar • … Petr Čech: Antispamový filtr
Textové triky – rozdělování slov • autor nevyžádané zprávy záměrně rozdělí klíčové slovo nahodilým vkládáním mezer, například slovo viagra lze pak zapsat jako: • v i a g r a, • viagra, • via gra, • …. Petr Čech: Antispamový filtr
Textové triky – Kombinace • všechny již uvedené triky lze vzájemně kombinovat, vždy však jen do určité míry • spameři se musí držet pravidla, že příjemce zprávy musí být schopen původní text zprávy přečíst Petr Čech: Antispamový filtr
Textové triky - ostatní • Velké množství vykřičníků – například vykřičník v textu předmětu není u běžných emailových zpráv příliš obvyklý • Apostrofy – více jak jeden apostrof v anglickém slově je podezřelé • Detekce kritických slov – vyhledávání řetězců, které se velmi často vyskytují ve zprávách nevyžádané pošty Petr Čech: Antispamový filtr
Textové triky – výsledek detekce • Výstupem aplikace je xml soubor, který popisuje analyzovaný email: • emails_id_0_details.xml Petr Čech: Antispamový filtr
Závěr • Sestavuji kolekci spamových zpráv pro další testování: • pitacz@seznam.cz • Nejlépesoubory typu *.eml a zabalené Petr Čech: Antispamový filtr