110 likes | 252 Views
Format ZIP. Zip – ogólne informacje. Format powstał w 1989r. Jest często używany przez użytkowników komputerów stacjonarnych. Jest bardzo popularny na platformach z Windowsom występuje tam pod postaciami różnych programów, które obsługują ten algorytm. Np. 7-Zip, WinRaR
E N D
Zip – ogólne informacje • Format powstał w 1989r. • Jest często używany przez użytkowników komputerów stacjonarnych. Jest bardzo popularny na platformach z Windowsom występuje tam pod postaciami różnych programów, które obsługują ten algorytm. • Np. 7-Zip, WinRaR • Format stosowany jest do archiwizacji plików. Cechuje się wysoką kompresją.
Struktura formatu • Każdy algorytm, format pliku ma swoją strukturę danych. Format .ZIP również taką posiada. Wygląda ona następująco:
Struktura formatu • Format ZIP definiuje „centralny katalog”, który znajduje się na końcu struktury – służy do dołączania nowych plików. Centralny katalog przechowuje listę nazw pozycji (plików i katalogów), przechowywanych w pliku ZIP – wraz z innymi informacjami (przesunięcia w pliku, metadane) • Każdy wpis jest wprowadzany przez miejscowy nagłówek – zawierający informacje o pliku – takie jak: komentarz, rozmiar pliku, a następnie nazwę pliku. • Zip wykorzystuje pola w swoim zapisie. Pola są wykorzystywane do wspierania formatu ZIP64.
Format ZIP • Format ZIP używa 4 – bajtowych „podpisów” na określanie struktur plików. Każdy wpis jest oznaczany przez określony podpis. Początek centralnego katalogu jest oznaczany innym podpisem. • W ZIP nie występują markery EOF, BOF. • Specyfikacja ZIP obsługuje przechowywanie archiwum na wielu nośnikach pamięci (np. dyskietka 3,5’’ – 1.44MB). • Od 2007r ZIP wspiera kodowanie nazw plików w systemie UTF-8.
Nagłówki plików • Wszystkie wielobajtowe wartości nagłówka są przechowywane w określonej kolejności bajtów. Długości wszystkich pól liczone są w bajtach (mają długość w bajtach). Lokalny nagłówek pliku
Nagłówki plików • Dodatkowe pola zawierają wiele danych opcjonalnych – takich jak atrybuty specyfikacji systemu (os-specyficit). Każde pole jest podzielona na mniejsze zawierające swoje ID (16bit) i mające długość 16 bitów. • Jeżeli bit 3 (0x08) z uniwersalną flagą jest włączony to CRC-32 i rozmiar pliku nie jest znany to nagłówek jest zapisywany. Pola w lokalnym nagłówku wypełniane są zerami a CRC-32 i rozmiar dołączane są w strukturze 12-bajtowej (poprzedzane 4 bajtowym podpisem). Data descriptor
Nagłówki plików Centralny katalog nagłówka
Nagłówki plików Koniec katalogu nagłówka (centralnego katalogu)
Kompresja • Format ZIP dopuszcza do korzystania z kilku metod kompresji: • Bzip2 • LZMA • Deflated • Imploted • Tokenizing