290 likes | 423 Views
Vliv diskové infrastruktury na výkon MS SQL Serveru . Agenda. Návrh diskové infrastruktury pro MS SQL RAID penalty zvyšování výkonu EFD Anatomie IO Naměření hodnoty Ideální nasazení pro SQL Tiering na poli. Klíčové úkoly při vytváření infrastruktury pro MS SQL.
E N D
Agenda Návrh diskové infrastruktury pro MS SQL RAID penalty zvyšování výkonu EFD Anatomie IO Naměření hodnoty Ideální nasazení pro SQL Tiering na poli
Klíčové úkoly při vytváření infrastruktury pro MS SQL Jak mohu konsolidovat mnoho serverů a DB instancí? Jak získat co nejlepší poměr – výkon, funkce, cena? Konsolidace Náklady Jak mohu zjednodušit nasazení Microsoft SQL Serveru? Jak mohu naplnit RPO, RTO požadavky organizace? Snadnost nasazení Vysoká dostupnost Jak mohu optimalizovat proces zálohy a obnovy? Jak mohu vylepšit výkon DB a naplnit tak požadavky nejnáročnějších aplikací? Záloha Obnova Výkon
Porty FE Porty FE R/W cache R/W cache CPU CPU Porty BE Porty BE Návrh diskové infrastruktury-na co je třeba myslet I. • Analýza I/O profilu nasazované aplikace • Dotaz na dodavatele • Kalkulátory a modelační nástroje • Analýza stávajícího prostředí v případě migrace • Počet I/O • Velikost I/O • Poměr čtení zápis • Poměr náhodných a sekvenčních transakcí • Diskové schéma • Typ disků (EFD,FC,SATA) • Typ RAID zabezpečení • Počet disků, distribuce • Velikost stripe a element size logického disku • Posunutí počátku logického volumu, Window 2003 a starší • Velikost stripe souborového systému • Definice a oddělení jednotlivých částí DB (DB,logy, indexy, TEMPDB) • Ověřit koexistenci dalších aplikací na stejném poli RG nebo disku • Používání referenčních konfigurací Hosti/Servery Fyzické disky v RAIDu
Porty FE Porty FE R/W cache R/W cache CPU CPU Porty BE Porty BE Návrh diskové infrastruktury - na co je třeba myslet II. • Připojení systému do diskového pole • Volba technologie FC, iSCSI, FCoE, NAS, DAS • HBA karty pro dostupnost a výkon • Použití MultiPath ovladačů, MPIO • Maximální počet logických disků, LVM • Před nasazením do živého provozu • Ověřte design pomocí simulačních nástrojů • Microsoft – SQLIO, SQLIOSimulator • IOZONE • Ověřte chování HA komponent • Po nasazení do ostrého provozu • Pravidelně ověřujte výkon infrastruktury včetně diskového pole - Monitoring • Vyžadujte po svém storage administrátorovi výkonnostní statistiky diskového pole • Optimalizujte diskové schéma při zvýšení nároků na výkon Hosti/Servery Fyzické disky v RAIDu 5
Co je to výkon diskového pole Základní parametry které měříme na diskových polích: –Throughput (IOPS) Velmi důležitý pro přístup souborového systému a DB, RDBMS; velmi malé I/O požadavky (2-16KB) –Bandwidth (MB/s) Důležitý pro backup a obnovu - přesun velkých souborů přenášených pomocí velkých bloků –Response time (ms) Klíčové měřítko pro posuzování kvality poskytování dat; kritická je stabilita RT při různých režimech zatížení SnapShot Sessions, Mirrors 6
Vliv RAID protekce na výkon zápisových operací • Počet BE zápisových operací pro jednotlivé typy RAID
Porty FE Porty FE R/W cache R/W cache CPU CPU Porty BE Porty BE 0.25 ms. 6 ms. Techniky pro zvyšování výkonu Read Caching • Read Caching • Přečtená data jsou určitou dobu držena v cache pro další čtení • Prefetch • Jakmile je detekováno sekvenční čtení, data následných bloků jsou předpřipravena do čtecí cache • Výhody: výrazně kratší response time na vyřízení čtecích požadavků Hosti/Servery Fyzické disky v RAIDu Čtecí operace Read Cache PREFETCH Fyzické disky
Porty FE Porty FE R/W cache R/W cache CPU CPU Porty BE Porty BE Techniky pro zvyšování výkonu Write Caching – Write acknowledgement • Psaní dat do cache je vždy rychlejší než-li zápis do disků • Pro malé I/O, menší než-li 1 ms, versus 5 – 12 ms do disků • Dokáže eliminovat typ disků na zápisový výkon • Algoritmus vyprazdňování cache je klíčová vlastnost • Pomalé disky pomalu odebírají data z cache • Optimalizace velikosti bloků pro disky Hosti/Servery zápisová operace 2 KB I/O to LUN Fyzické disky v RAIDu Write Cache Single 8 KB I/O to disk LUN
Typy disků I. Fibre Channel disky Kapacity 73-450 GB Otáčky 10k – 15k ot. Propustnost cca 50-70MB/s I/O 120-180 Doba odezvy 6-9ms SATAII disky Kapacity 500-1000 GB Otáčky 5.4k – 7.2k ot. Propustnost cca 50-60MB/s I/O 80-100 Doba odezvy 12-16ms
Nárůst kapacity disků From 1GB to 1TB
Nárůst propustnosti sběrnic disků From 3 MB/Sec to 4 GB/Sec
Zvýšení počtu IO operací IOPS Improved 4x
Klíčové parametry ovlivňující výkon konvenčních disků Seek time čas potřebný pro nastavení čtecích a zápisových hlaviček Rotační latence specifikuje potřebný čas pro nastavení datové oblasti pod čtecí nebo zápisovou hlavičku Disková kapacita a propustnust komunikačních kanálů se zvyšuje ale Mechanické latence limitují výkon HDD již 30 let
Typy disků - Enterprise Flash Drive • EMC spolupracovalo na vývoji EFD disků se společností STEC Inc. • první EFD uvedeny před rokem na platformě EMC Symmetrix DMX4 • druhá generace EFD uvedena v březnu 09 Nové výkonnostní parametry: Náhodné čtení: 45,000 operací Náhodné zápisy: 16,000 operací Sekvenční čtení: 220 MB/s Sekvenční zápisy: 115 MB/s Interface: FC, SAS a SATA Provedení: 3.5 palců (standardní HDD rozměry) Váha: menší než 0,4 kg
Firmware • Interface Protocol • Media Management • Error Detection & Correction Anatomie Enterprise Flash Drive MultipleParallelI/O Channels Dual-Ported FC Interface Non-Volatile SLCNAND Flash Controller Logic DDR SDRAM w/SPS Výkon Dostupnost Spolehlivost První Enterprise Flash Drive na trhu
Spolehlivost na úrovni zařízení Duální FC rozhraní Integrovaná ochrana DRAM destage při ztrátě napájení Multi-bit ECC – oprava chyb Integrovaný termální senzor Rozšířený SMART mechanismus NAND – Spolehlivost na úrovni logiky SLC NAND technologie garantuje min 100,000 přepisů s 1-bit ECC Praxe potvrzuje 300,0002,000,000 přepisů Multi-bit ECC Dynamické pře-mapování vadných bloků Stejný přístup jako u konvečních HDD SDRAM cache buffer pro optimalizace zápisových operací Wear-Leveling-Regulace opotřebení Hrubá kapacita vs. hrubá NAND kapacita 73 GB použitelná = 128 GB hrubá 146 GB použitelná = 256 GB hrubá Statickáadynamickáregulace opotřebení Zápisy a přepisy jsou re-alokovány na méně opotřebený fyzický NAND blok Enterprise Flash Drive - spolehlivost Očekávaná životnost je vyšší než-li u konvenčních pevných disků
Rozdíl mezi SSD a Enterprise Flash Drives • EFD • Singl level cell (SLC)NAND • Ukládají jeden datový bit do paměťové buňky • Duální FC porty • Více kanálový paralelní IO přístup • Vyšší propustnost • Rozšířená správa opotřebení • SSD • Multi-level cell(MLC) NAND nebo NOR • Ukládají do paměťové buňky více než-li jeden Bit • Optimalizované pro provoz„jednou zapsat a mnohokrát přečíst“ • Optimalizováno pro výkon čtení, průměrný výkon pro zápis • Zřídka podporují optimalizaci opotřebení • Příklad: USB disky, MP3 přehrávače, PC disky
Anatomie čtecí operace ~0.2-0.5 milliseconds Locate & Transmit RequestedBlock Cache Read Hit Allocate CacheSlot Store&Transmit Block Read Block From Media Into Cache Cache Read Miss • 7200 rpm HDD: ~12 milliseconds • 10K rpm HDD: ~ 9 milliseconds • 15K rpm HDD: ~ 6 milliseconds • EFD: ~ 1 milliseconds
Výkon Enterprise Flash Disků Výrazně nižší Response Time i pro smíšený typ zátěže HDD 14 RAID Groups (112 disků) OLTP2 profile: 20% random read hit 8 Kb 45% random read miss 8 Kb 15% random write 8 Kb 10% seq read 64 Kb 10% seq write 64 Kb KB KB KB KB KB Flash drive 1 RAID Group (8 disků)
Zrychlení správné části aplikace Není nutné používat Flash disky pro 100 % dat • databáze obvykle obsahují několik tabulek, které jsou přistupovány častěji • Indexy a vyhledávací funkce – např.Account #, Phone #, SS #, email ID, ZIP Code, atd. • jedna aplikační transakce většinou generuje desítky diskových operací • např: transakce s debetní kartou vyžaduje 12 diskových I/Os • 8 lookup, 2 reads, 2 writes • 250+ diskových I/O’s per požadavek je běžné např. pro aplikace data warehousů • umístění vyhledávacích tabulek na EFD může mít obrovský dopad • Transaction time s 12 Read Miss I/O’s na 15K HDD: 720ms • Transaction time jestliže 8/12 je obslouženo EFD: 32ms 22x !
Flash V-LUN FibreChannel V-LUN SATA Tiering v rámci diskového pole • Clariion • manuální tiering na základě výkonnostních dat z analyzačních nástrojů – Navisphere Analyzer nebo OS related (Perfmon, IOSTAT) • Virtual LUN – non-disruptive přesouvání LUNů mezi různými typy disků • Symmetrix • Symmetrix optimizer – automatický přesun vytížených hyperů mezi různými typy disků bez přerušení přístupu k datům • Virtual LUN – non-disruptive přesouvání LUNů mezi různými typy disků Zrychlením malé, ale používané části databáze lze výrazně zvýšit výkon databáze!