380 likes | 513 Views
Technologie taśmowe – wprowadzenie i zastosowania Jacek Herold , WCSS. Zagadnienia. Czym są urządzenia taśmowe Czym różnią się od dysków twardych Podstawowe parametry urządzeń Parametry streamerów Parametry taśm Najczęściej używane technologie i kompatybilność
E N D
Technologie taśmowe – wprowadzenie i zastosowaniaJacek Herold, WCSS
Zagadnienia • Czym są urządzenia taśmowe • Czym różnią się od dysków twardych • Podstawowe parametry urządzeń • Parametry streamerów • Parametry taśm • Najczęściej używane technologie i kompatybilność • Kiedy i dlaczego używamy technologii taśmowych • Trochę głębiej w technologię • Systemy kodowania • Sposób zapisu Line Serpentine vs. Helical Track • Urządzenia blokowe vs znakowe • sposób dostępu do danych - szeregowe układanie danych. • Zagadnienie kompresji - kompresja automatyczna vs. Konfigurowana • Systemy automatyczne: autloadery, biblioteki • RAIT
Zagadnienia c.d. • Oprogramowanie do archiwizacji • tar, dump/restore • IBM TSM • Amanda, Bacula • Veritas
Czym są urządzenia taśmowe - historia Urządzenia taśmowe to napędy pozwalające na zapisywanie informacji na taśmach magnetycznych (nośnikach taśmowych). Służą przede wszystkim do archiwizacji i tworzenia kopii zapasowych. Ich historia sięga roku 1951 kiedy to firma Remington Rand wyprodukowała pierwszy na świecie napęd taśmowy. Napęd obsługiwał taśmy o „zawrotnej” ilości ośmiu ścieżek (6 użytecznych) i gęstości 128bpi. Taśma przesuwała się z prędkością ok. 2,5m/s a szybkość odczytu wynosiła 7200 znaków na sekundę. W 1984 roku firma DEC wprowadziła na rynek pierwszy napęd korzystający z technologii zapisu Line Serpentine. Co znacznie przyspieszyło szybkość wymiany danych pomiędzy taśmą a urządzeniem. Kolejnym krokiem było wprowadzenie w roku 1987 przez konsorcjum SONY i Exabyte technologii zapisu Helical Track, co przy ówczesnych prędkościach przesuwu taśm stanowiło kolejną rewolucję w prędkości zapis / odczyt.
Czym są urządzenia taśmowe – c.d. Kasety do napędów dzielą się na dwa rodzaje – z dwoma szpulami i z jedną szpulą: Obecnie w zastosowaniach profesjonalnych stosuje się najczęściej taśmy z jedną szpulą: LTO, SDLT, natomiast w pozostałych taśmy z dwoma szpulami: DAT72, QIC.
Czym są urządzenia taśmowe – c.d. Różne rodzaje napędów taśmowych:
Czym są urządzenia taśmowe – c.d. Przykładowe system prowadzenia taśmy:
Czym różnią się od dysków twardych Twarde dyski Urządzenia taśmowe: • Blokowy dostęp do danych • Niewymienne nośniki – wyjątek MO • Nieznany maksymalny czas przechowywania • Słabsze algorytmy korekcji • Mała odporność na uszkodzenia mechaniczne • Transfer liniowy na poziomie 120MB/s • Stosunkowo krótki czas oczekiwania na określony fragment danych • Kodowanie RLL • Ściśle zdefinowane systemy plików • Szeregowy dostęp do danych • Wymienne nośniki • Długi czas przechowywania danych(30 lat) • Wydajne algorytmy korekcji błędówWH Error: 10-17 SW Error: 10-27 • Duża odporność na uszkodzenianośnika • Bardzo szybki transfer liniowy – ok. 280MB/s (LTO-5 Comp.) • Potencjalnie bardzo długi czas oczekiwania na określowny fragment danych • Kodowanie: RLL, MPRL, NPML • Brak systemu plików (wyjątek LTFS)
Podstawowe parametry urządzeń i nośników • Technologia: LTO, SDLT, AIT, DDS (DAT) • Pojemność nośnika: nominalna, z kompresją • Interface: SCSI, FC, SAS • Szybkość transferu: nominalna, z kompresją • Całkowity czas potrzebny na utworzenie odczytanie pełnego archiwum • Szyfrowanie sprzętowe • WORM • Gwarantowany czas przechowania danych • Maksymalna liczba przebiegów głowicy • Maksymalna liczba montowań nośnika • Cartidge Memory (CM) • Korekcja błędów HW Error, SW Error • Pamięć cache • Wsteczna kompatybilność
Podstawowe parametry urządzeń i nośników • LTO-5: (przykładowo Quantum LTO-5 FH) • Pojemność nominalna: 1500GB, 3000GB (2:1) 4500GB (3:1 IBM) • Interface FC-8 • Szybkość transferu: 140MB/s, 280MB/s (2:1) • Czas potrzebny na utworzenie pełnego archiwum: 90 minut (2:1) – dla pewności należy przyjąć 120minut • Dostepność WORM-a: TAK • Szyfrowanie sprzętowe: NIE • Pamięć cache: 256MB
Podstawowe parametry urządzeń i nośników Taśma LTO-5: • Gwarantowany czas przechowywania archiwum 15..30 lat • Pojemność 1500GB / 3000GB (2:1) • Maksymalna liczba montowań taśmy: 5000 • Maksymalna liczba przebiegów głowicy 1 000 000 co daje ok. 260 pełnych zapisów / odczytów nośnika. • CM: jeśli występuje pozwala odczytać ważne informacje o taśmie: • Liczbę montowań • Liczbę przebiegów głowicy • Ewentualne problemy • Bar Code
Najczęściej używane technologie i kompatybilność • Technologie profesjonalne: • LTO (obecnie LTO-5) • 1500GB • 120MB/s • SDLT • 300GB (1:1) • 36MB/s (1:1) • AIT (oczekiwane AIT-6) • 800GB • 248MB/s • SAIT (oczekiwane SAIT-4) • 4000GB (1:1) • 240MB/s (1:1) • T10000 (T10000B) • 1000GB (1:1) • 120MB/s (1:1) • DLT-S4 • 800GB (1:1) • 60MB/s
Najczęściej używane technologie i kompatybilność Technologie użytku domowego i małych firm • Digital Data Storage (DDS) (obecnie DAT-160) • 80GB • 6,9MB/s • VXA (obecnie VXA-320) • 160GB • 24MB/s • SLR (Scalable Linear Recording) • 70GB • 6MB/s Ponadto wiele innych formatów.
Najczęściej używane technologie i kompatybilność • Na co zwracać uwagę przy wyborze technologii: • Powszechność danej technologii • Lista kompatybilności • Dostępność serwisu • Współpraca z innymi urządzeniami • Możliwości rozwojowe technologii
Najczęściej używane technologie i kompatybilność Kompatybilność technologii LTO-5
Najczęściej używane technologie i kompatybilność Kompatybilność technologii DDS
Najczęściej używane technologie i kompatybilność Przyszłość technologii LTO:
Najczęściej używane technologie i kompatybilność Przyszłość technologii DDS:
Przyrost pojemności taśm • Rok 1974 – pierwsza „biblioteka” taśmowa (IBM) • Rok 1996 – zastosowanie algorytmu PRML (DDS-3)
Kiedy i dlaczego używamy technologii taśmowych • Stosujemy: • Archiwa długoterminowe • Bezpieczeństwo danych nie modyfikowanych (WORM) • Trwałość mechaniczna: dysk pracuje przez cały czas taśma tylko przez chwilę • Przechowywanie dużych pojemności • Archiwa multi-volume • Kopie bezpieczeństwa • Szybkość dostępu do danych jest drugorzędna • Wymagane mocne kody korekcyjne • Nie stosujemy: • Szybki lub losowy dostęp do danych • Dane często ulegają zmianie • Krótki czas, życia danych • Dane małoistotne
Kilka słów więcej o technologii • Systemy kodowania • Sposoby zapisu • Urządzenia blokowe i znakowe • Sposób dostępu do danych (partycje)
Systemy kodowania danych na taśmach • Czym jest kodowanie i dlaczego je stosujemy • Rodzina LTO: • LTO-1: RLL1,7 • LTO 2,3,4: PRML • LTO-5: NPML • Rodzina DDS: • Helical scan (R-DAT, PRML od DDS3)
Sposób zapisu danych – ułożenie ścieżek Helical scan Line serpentine
Urządzenia blokowe i znakowe • Sposób dostępu do danych • Szybkość liniowa vs czas dostępu • Odczyt danych z taśmy a ułożenie plików • Dane na „końcu” taśmy • Czas dostępu do danych na „końcu” taśmy • Partycje na taśmie vs partycje na dysku
Kompresja danych i pojemność taśmy • Pojemność nominalna • Problem kompresji danych • Porównanie przykładowych wyników kompresji • Szybkość transferu a kompresja • Kompresja automatyczna (LTO) a kompresja konfigurowana
Systemy automatyczne • Autoloadery • Biblioteki • Rodzaje elementów biblioteki: Data Transfer, Storage, Mail etc. • Zarządzanie biblioteką • Partycje biblioteki • VTL
Systemy automatyczne – rodzaje bibliotek • Z pojedynczym robotem • Z wieloma robotami • Współdzielony obszar roboczy • Autonomiczne obszary robocze • Pojedyncza technologia zapisu lub wiele technologii zapisu • Wiele bibliotek w systemie
Systemy automatyczne – zarządzanie biblioteką • Elementy biblioteki: napędy, roboty • Biblioteka podłączona bezpośrednio • Biblioteka w strukturze SAN • Partycje biblioteki
RAIT • Co to jest RAIT • Poziomy – konfiguracje: 0,1,5 • Dlaczego stosujemy RAIT • Gdzie zastosowanie RAIT jest uzasadnione • HW RAIT vs Software RAIT dopasowanie nośników
Oprogramowanie do archiwizacji • Istotne cechy oprogramowania • Wspierany sprzęt • Wspierane systemy operacyjne • Praca w sieci • Sposób zarządzania • Procedury awaryjne • Wsparcie od strony producenta • Wspierane technologie, Multi-Volume, VTL, RAIT, Disk Pool • Oprogramowanie • IBM TSM • Bacula • Amanda • CASTOR (CERN) • Veritas backup • tar, dump/restore, mt, mtx
Oprogramowanie do archiwizacji • HSM – ang. Hierarchical Storage Management Poziomy hierarchii HSM Parametry użytkowe i cechy systemu HSM Przykładowa realizacja HSM w PCSS
Przyrost pojemności technologii taśmowych • Współczynnik 2x • Przyrost na przestrzeni lat
Podsumowanie • ...
Technologie taśmowe Dziękujemy za uwagę Kontakt: jacek.herold@pwr.wroc.pl kmd.pcss.pl