1 / 19

A teď si to zkuste sami

A teď si to zkuste sami. Text je v češtině v abecedě s 26 znaky (bez diakritiky) Nejčastější znaky v obecném českém textu: E 10,13 %; A 8,99%; O 8,39%; I 6,92%; N 6,64%; S 5,74%; R 5,33%.

inga
Download Presentation

A teď si to zkuste sami

An Image/Link below is provided (as is) to download presentation Download Policy: Content on the Website is provided to you AS IS for your information and personal use and may not be sold / licensed / shared on other websites without getting consent from its author. Content is provided to you AS IS for your information and personal use only. Download presentation by click this link. While downloading, if for some reason you are not able to download a presentation, the publisher may have deleted the file from their server. During download, if you can't get a presentation, the file might be deleted by the publisher.

E N D

Presentation Transcript


  1. A teď si to zkuste sami Text je v češtině v abecedě s 26 znaky (bez diakritiky) Nejčastější znaky v obecném českém textu: E 10,13%; A 8,99%; O 8,39%; I 6,92%; N 6,64%; S 5,74%; R 5,33% • rdaqwi bc dwefewq riwgdh, aegebjckbmn rkcobcoq bcocw sc bsc rkqhdsgc bqa q hcjw kdfswcmwc sgejkge bocwcge, tcf ai rkdrwdisqwd adfmca, qgef dn s gc fqgchuqwd bcdcacgbe banbwirwgdi bjdri. hcmqw gq jcwcFdgqj rkcfeocgjq tebjc sfoqwcgc fcac, gcjkrcwesc rkcaejqw, mon jcg fqjkqhcgn huwqr mdgchgc fqsdwq, q irdkgc bc bgqfew rdjwqhej gcrketcagc sfrdaegmn gq swcmwn, igqsgn q ddjefgn ocg. gq geh tegcud if ai s uwqsc rkqmjehmn gcfdnsqwd aebjd.

  2. Výskyt znaků v textu

  3. Nejčastější znaky • c frekvence 13,39% • g a q 9,29% • c se nikdy nevyskytuje samostatně ani na začátku slova ---- Hypotéza c odpovídá E • q tvoří samostatné slovo, nebo druhé písmeno ve dvoupísmených slovech – Hypotéza q odpovídá A • g se často vyskytuje na začátku slov (je to souhláska). Tvoří dvoupísmená slova s e a s a – Hypotéza g odpovídá N

  4. Teď to vypadá takto rdaAwi bE dwefewA riwNdh, aeNebjEkbmn rkEobEoA bEoEw sE bsE rkAhdsNE bAa A hEjw kdfswEmwE sNejkNe boEwENe, tEf ai rkdrwdisAwd adfmEa, ANef dn s NE fANEhuAwd bEdEaENbe banbwirwNdi bjdri. hEmAw NA jEwEFdNAj rkEfeoENjA tebjE sfoAwENE fEaE, NEjkrEwesE rkEaejAw, mon jEN fAjkAhENn huwAr mdNEhNE fAsdwA, A irdkNE bE bNAfew rdjwAhej NErketEaNE sfrdaeNmn NA swEmwn, iNAsNn A ddjefNn oEN. NA Neh teNEud if ai s uwAsE rkAmjehmn NEfdnsAwd aebjd. Další časté znaky jsou e a w. Vyskytují se často vedle sebe – právě jeden z nich je samohláska. E je často v okolí N – je to samohláska, praděpodobně I

  5. rdaAwi bE dwIfIwA riwNdh, aINIbjEkbmn rkEobEoA bEoEw sE bsE rkAhdsNE bAa A hEjw kdfswEmwE sNIjkNI boEwENI, tEf ai kdrwdisAwd adfmEa, ANIf dn s NE fANEhuAwd bEdEaENbI banbwirwNdi bjdri. hEmAw NA jEwEFdNAj rkEfIoENjA tIbjE sfoAwENE fEaE, NEjkrEwIsE rkEaIjAw, mon jEN fAjkAhENn uwAr mdNEhNE fAsdwA, A irdkNE bE bNAfIw rdjwAhIj NErkItEaNE sfrdaINmn NA swEmwn, iNAsNn A ddjIfNn oEN. NA NIh tINEud if ai s uwAsE rkAmjIhmn NEfdnsAwd aIbjd. Patrné je slovo ANIZ , tedy f odpovídá Z S tvoří samostatné slovo, dvoupísmené slovo s písmenem E – je to v

  6. rdaAwi bE dwIZIwA riwNdh, aINIbjEkbmn rkEobEoA bEoEw VE bVErkAhdVNE bAa A hEjw kdZVwEmwE VNIjkNI boEwENI, tEZ ai kdrwdiVAwd adZmEa, ANIZ dn V NE ZANEhuAwd bEdEaENbI banbwirwNdi bjdri. hEmAw NA jEwEFdNAj rkEZIoENjA tIbjE VZoAwENE ZEaE, NEjkrEwIVE rkEaIjAw, mon jEN ZAjkAhENn uwAr mdNEhNE ZAVdwA, A irdkNE bE bNAZIw rdjwAhIj NErkItEaNE VZrdaINmn NA VwEmwn, iNAVNn A ddjIZNn oEN. NA NIh tINEud iZ ai V uwAVE rkAmjIhmn NEZdnVAwd aIbjd. Na vyznačeném místě se rýsuje spojení VE SVE PRACOVNE, tedy b je S, r je P, k je r, h je C, d je O

  7. POaAwi SE OwIZIwA PiwNOC, aINISjERSmnrREoSEoA SEoEw VE SVE PRACOVNE SAa A CEjw ROZVwEmwE VNIjRNI SoEwENI, tEZ ai ROPwOiVAwO aOZmEa, ANIZ On V NE ZANECuAwO SEOEaENSI SanSwiPwNOi SjOPi. CEmAw NA jEwEFONAj PREZIoENjA tISjE VZoAwENE ZEaE, NEjRPEwIVE PREaIjAw, mon jEN ZAjRACENn uwAP mONECNE ZAVOwA, A iPORNE SE SNAZIw POjwACIj NEPRItEaNE VZPOaINmn NA VwEmwn, iNAVNn A OOjIZNn oEN. NA NIC tINEuO iZ ai V uwAVE PRAmjICmn NEZOnVAwO aISjO. Nyní již lze domyslet snadno i ostatní písmena, Slovo POMALU: a je M, w je L, I je U Slovo MINISTERSKY: m je K, n je Y Slovo PREDSEDA: r je P, o je D Slovo VNITRNI: j je T Slovo JINEHO: t je J, u je H

  8. POMALU SE OLIZILA PULNOC, MINISTERSKY PREDSEDA SEDEL VE SVE PRACOVNE SAM A CETL ROZVLEKLE VNITRNI SDELENI, JEZ MU ROPLOUVALO MOZKEM, ANIZ OY V NE ZANECHALO SEOEMENSI SMYSLUPLNOU STOPU. CEKAL NA TELEFONAT PREZIDENTA JISTE VZDALENE ZEME, NETRPELIVE PREMITAL, KDY TEN ZATRACENY HLAP KONECNE ZAVOLA, A UPORNE SE SNAZIL POTLACIT NEPRIJEMNE VZPOMINKY NA VLEKLY, UNAVNY A OOTIZNY DEN. NA NIC JINEHO UZ MU V HLAVE PRAKTICKY NEZOYVALO MISTO. Zbývá opravit chyby, omylem bylo písmeno B šifrováno jako písmeno O a v jednom místě textu chybí C.

  9. POMALU SE BLIZILA PULNOC, MINISTERSKY PREDSEDA SEDEL VE SVE PRACOVNE SAM A CETL ROZVLEKLE VNITRNI SDELENI, JEZ MU ROPLOUVALO MOZKEM, ANIZ BY V NE ZANECHALO SEBEMENSI SMYSLUPLNOU STOPU. CEKAL NA TELEFONAT PREZIDENTA JISTE VZDALENE ZEME, NETRPELIVE PREMITAL, KDY TEN ZATRACENY CHLAP KONECNE ZAVOLA, A UPORNE SE SNAZIL POTLACIT NEPRIJEMNE VZPOMINKY NA VLEKLY, UNAVNY A OBTIZNY DEN. NA NIC JINEHO UZ MU V HLAVE PRAKTICKY NEZBYVALO MISTO. Výsledkem je začátek českého překladu knihy Harry Potter a princ dvojí krve

  10. Metoda, která umožní zjistit bez dešifrování textu, zda byl text zašifrován monoalfabetickou šifrou, a popřípadě v jakém jazyce byl text napsán. Index koincidence

  11. Statistika výskytu znaků v češtině

  12. Po použití Cézarovské šifry

  13. Po použití monoalfabetické šifry

  14. Jen sloupce jsou přeházené Jak to vyjádřit číselně? Nabízí se rozptyl veličiny, tedy průměrná odchylka od střední hodnoty Graf vypadá pořád stejně

  15. Var (X) = E (X - E(X))2 Rozptyl

  16. n*Var (p) = ∑(p(i)-1/n)2 = = ∑p(i)2 - ∑2*p(i)/n + ∑1/n2 = = ∑p(i)2 - 2/n + 1/n= = ∑p(i)2 - 1/n Pro výskyt znaků v textu -=

  17. IC(T) = ∑p(i)2 = n*var(T)+1/n Vždy větší nebo roven 1/n = 1/26 = 0,03846. Blízký hodnotě 0,03846 je pro náhodně generovaný text se stejnou hustotou výskytu jednotlivých znaků. Čím větší, tím více nerovnoměrný je výskyt písmen. Je zachován při monoalfabetické šifře. Index koincidence

  18. Indexy koincidence vybraných jazyků • Čeština 0,0577 • Slovenština 0,0581 • Angličtina 0,0676 • Francouzština 0,0801 • Němčina 0,0824 • Italština 0,0754 • Španělština 0,0769 • Ruština 0,0470 • Náhodný text 0,0385

  19. Najděte texty v češtině (26 znaků), „odborné počítačové“ češtině angličtině a ještě alespoň jenom jazyce a spočítejte jejich indexy koincidence. Zašifrujte tyto texty monoalfabetickou šifrou a ověřte, že se jejich index koincidence nemění. Úkol

More Related