230 likes | 488 Views
Andmeturve ja krüptoloogia, XV Lühiülevaade steganograafiast. 6. detsember 2002 Valdo Praust vpraust@delfi.ee Loengukursus IT Kolled ž is 2002. aasta sügissemestril. Vajadus teabe semantika peitmiseks.
E N D
Andmeturve ja krüptoloogia, XVLühiülevaade steganograafiast 6. detsember 2002 Valdo Praust vpraust@delfi.ee Loengukursus IT Kolledžis 2002. aasta sügissemestril
Vajadus teabe semantika peitmiseks Nõue praktikast: vahel on vaja mingi (semantilise) sisuga teavet või selle olemasolu varjata, kuigi andmeid ei saa varjata Tüüpnäide: teabe sisu saab keegi (mingi süsteem) kontrollida, kusjuures keelatud on teatud sisuga või vormingus teave Sageli on lubatud vaid teatud kindla sisu ja vorminguga teave
Krüptograafia ei peida varjatult Krüpteerimine teabe sisu (varjatust) ei lahenda: tulemus on juhuslik bitijada, mis viitab hõlpsalt sellele, et tegemist on teabega, mida tahetakse varjata Täpsemalt ei peida krüptograafia fakti, et teabe sisu tahetakse varjata Lahendus: krüptograafiaga käsikäes (sellele lisaks tuleb kasutama mingeid muid meetodeid
Steganograafia põhimõtted Steganograafia on informatsiooni peitmise tehnika Kreeka keeles tähendab ta “varjatud sõna” Erinevalt krüptograafiast on tegemist distsipliiniga, kus ei vaadata teavet pelga bitijadana, vaid mingit semantilist sisu omavana Steganograafia täiendab krüptograafiat; paljudes kohtades kasutatakse neid meetodeid koos üksteist täiendades
Steganograafia pakutavad kaks põhivõtet Ühe teabekogumi peitmine teise teabekogumi sisse. On steganograafia ajalooline kasutusvaldkond, kus teabe olemasolu tuleb peita Andmekogumine eemaldamatu digitaalvesimärgi lisamine. On autoriõiguse tagamisest tingituna kaasajal väga oluline: ei võimalda teabekogumi kasutajal selle autorile viitavat eemaldada ilma, et andmete utilitaarne väärtus kaoks
Teabe semantika peitmine: põhimõisted Põhimõte: üks teabekogum peidetakse teise teabekogumi sisse mingi süstemaatilise ja pööratava meetodiga • Peidetavat teabekogumist nimetatakse sõnumiks (message) • Teabekogumit, millesse sõnum peidetakse, nimetatakse konteineriks e konteinerfailiks (container) Eesmärgiks ei ole mitte varjata sõnumi sisu, vaid eelkõige selle olemasolu
Nõuded konteinerfailile • Konteiner on kaasajal tavaliselt mingi kindla semantilise sisuga, eesmärgiga ning kindlas vormingus digitaalne teabekogum(fail) • Lisaks võib aga konteiner olla aga ka: • prinditud materjal, • ringhäälingusaade, • analoogsalvestil lindil või plaadil vm Lähtealus: enamike praktiliste teabekogumine semantiline sisu jääb pisimuudatuste tegemisel samaks ning pisimuudatused ei häiri teabekogumite kasutamist oma põhieesmärkidel
Nõuded sõnumile Konteiner on kaasajal reeglina digitaalne teabekogum, semantiline tähendus ja vorming ei ole siin olulised • Sageli on sõnum enne konteinerisse asetamist krüpteeritud, st juhusliku bitijada omadustega, et ei oleks hiljem võimalik tuvastada peitmise fakti • Sõnumi/konterineri pikkuste vahekord sõltub peamiselt konteinerfaili vormingust. Reeglina on see vahemikus mõni kuni mõnisada korda
Piltkonteiner Lähtekoht: inimene ei taju ülipeeni geomeetilisi detaile, mõõtmete või värvivarjundite erinevusi jm • Võimalikke praktilisi lahendusi: • pakkimata RGB vormingus pilt (TIFF): R, G ja B madalamate bittide muutmine • palettpõhine RGB vormingus pilt (GIF, BMP): eelmine võte + mängimine paletiga • kadudega pakitud pilt (JPEG): mustrite ja/või värvuserinevuste pruukimine, mis pakkimisel ei kao • kõikide eeltoodud meetodite keerukas kombinatsioon + spektritel, Fourier’ teisendustel ning stohhastilisel mustriplokkidel põhinevad meetodid (kaasajal enamlevinud)
Helikonteiner Lähtekoht: inimene ei taju helide kõrguse, tämbri või kestuse üliväikesi muutusi • Võimalikke praktilisi lahendusi: • pakkimata heli (CD, WAV, AU jm): madalamate bittide muutmine • täiendav lisaprobleem: eristamatuseks tuleb kasutada vaid tugevate signaalide kõrval olevaid nõrku signaale. Lahendus: madalamate bittide muutmise keerukad algoritmid • kadudega pakitud heli (nt MPEG Layer 3 e MP3, WMA jt): senisest palju keerukamad meetodid, mis läbiksid kõik filtrid muutusteta (sagedusanalüüsil põhinevad jm)
Videokonteiner Lähtekoht : inimene ei taju piltide vaheldumise “laialimäärimist” erinevate naaberkaardiute vahel pildi erinevate osade puhul • Võimalikke praktilisi lahendusi: • pakkimata video: kõik pakkimata piltide ja heli juures kehtiv + kahe järjestikuse kaadri omavaheline kombineerimine • kadudega pakitud video (MPEG, AVI, RM): kõik pakitud piltide ja heliga seonduvad võtted + järjestikuste kaadrite kombineerimine (ka siin on see keerukam) • Video korral toimivad ka kõik heli ja pildi juures kasutatavad võtted
Tekstikonteiner Lähtekoht: enamikel juhtudel kasutatakse küljendatud teksti, puhta teksti korral on võte ülimalt raskendatud • Võimalikke praktilisi lahendusi: • sõnavahede, tähevahede, reavahede jm esmapilgul märkamatute parameetritega manipuleerimine • semantilised võtted (nt “ja” ja “ning” üksteisega asendamine
Masinkoodkonteiner Lähtekoht: enamike protsessorite käsustikud võimaldavad sama tulemust saavutada mitmel erineval viisil • Peamine võte: koodi muutmine nii, et selle käitumisomadused jääksid samaks • Lihtsamaid praktilisi lahendusi: • NOP (tühja käsu) lisamine suvalistesse kohtadesse • ühe tsüklitüübi asendamine teisega • koodile sellise osa lisamine, kuhu üldse ei satutagi
Konteinerite võrdlus • Pildikonteineri puuduseks on keerukad võtted (enamik pilte on kas kadudega pakitud või paletipõhised), eeliseks on piltide suur levik tavameedia hulgas • Pakkimata heli (nt CD) on ideaalne konteiner ilma oluliste puudusteta • Pakitud heli korral on probleemid võtete keerukuses ja töökindluses
Konteinetrite võrdlus (järg) • Videokonteineril on samad puudused mis pakitud pildil ja heli; eeliseks on konteineri suur maht, mis võimaldab peita suuri sõnumeid • Tekst on üldiselt halb konteiner; konteinerfaili ja sõnumi pikkuse vahekord on ülimalt väga suur • Masinkoodkonteineri eelis on konteineri suurus; suur puudus selle kerge avastatavus (konkreetse programmi võrdlus standardtarkvaraga)
Peitmise tingimused Peamine tingimus: eelnevalt krüpteeritud sõnumi korral ei tohi peitmise fakt olla tulemuse põhjal tuvastatav Reaalsus: paljude konteinerite ja peitmisvõtete korral on selle tingimuse täitmine problemaatiline Siiski on olemas suur hulk algoritme ja sellel tuginevaid praktikas kasutatavaid programme, mis seda omadust suudavad edukalt rahuldada
Peitmise näide See on Naissaare miinitehase NATO luuresatelliidi foto (1984): see aga Naissaare sadama foto samast ajast (30 KB kumbki)
Peitmise näide (järg) Siin on mõlemad pildid pandud Niguliste kiriku foto (307 KB JPEG, algne vasakul) sisse, mille kvaliteet kahaneb veidi (kasutatud on JPEG vormingul säiluvaid Fourier’ teisendusi):
Digitaalvesimärk Digitaalvesimärk (digital watermark) on digitaalse teabekogumi sisse paigutatud turvaotstarbeline digitaalsignaal või –muster, mis võimaldab tõendada teabekogumi omanikku ja/või identifitseerida selle eksemplari või partiid • Digitaalvesimärgid võivad olla • nähtavad (visible), st teabekogumi kasutajale teada; • nähtamatud (invisible), st nad ei ole teabekogumi kasutajale teada Nähtav vesimärk võib viidata nähtamatu olemasolule
Vesimärgistatavatest dokumentidest • Digitaalvesimärke saab kanda • piltidele; • helile; • videole; • raadio- ja telesadetele ning analoogsalvestistele • Veidi raskem on neid kanda masinkoodile, küljendatud tekstile (PS, PDF, RTF) • Väga problemaatiline on nende kandmine küljendamata tekstile (HTML, ASCII jm) Digitaalvesimärgi peamine funktsioon on autoriõiguste kaitse
Nõuded vesimärgi algoritmile • Vesimärki peab olema võimatu kõrvaldada, ilma et see märgistatud andmekogumit oluliselt ei kahjustataks • Vesimärk peab säilima andmekogumi tüüpiliste töötlusoperatsioonide käigus (mastaabi muutmine, kärpimine, toonimine, heli miksimine, analoogmuundused jm) • Nähtamatut tüüpi vesimärk peab olema tajumatu • Volitatud isikud peavad saama(nt teatud võtme) abil vesimärgi olemasolu hõlpsalt tuvastada • Vesimärgi hind peab olema vastuvõetav
Vesimärgitarkvara: arengu alguses • Turul on olemas mitmeid tooteid, mis lisavad vesimärke nii piltide, heli, video kui ka analoogsignaalidele; pidevalt ilmub neid juurde • Enamik neid tooteid on lahti murtud, st on leitud algoritmid, mis eemaldavad vesimärgi ilma, et märgistatud teabekogum olulislt kahjustuks (kaasaja kurb reaalsus) • Kõik märgid näitavad, et praktikas kasutatavad ja eemaldamiskindlad algoritmid ning programmid ilmuvad mõne aasta jooksul, mil valdkond stabiliseerub
Prognoos: vesimärginduse tormiline areng Põhjus: on olemas põletav vajadus kaitsta (digitaal)toodet võrgumaailmas volitamata paljundamise eest Näide:kõik tarkvaratootja tooted on personifitseeritud – vesimärgi abil seostatud kindla kliendiga ja nende kontrollimatu leviku korral on teabe algallikas hõlpsalt tuvastatav