370 likes | 498 Views
Garantir la protection des données et déployer un plan de reprise ou continuité d'activité avec la virtualisation. Jérôme Mombelli Architecte Infrastructure Microsoft France. Agenda. Introduction Les différentes approches Tour d’horizon des solutions pour la mise en œuvre d’un PCA/PRA
E N D
Garantir la protection des données et déployer un plan de reprise ou continuité d'activité avec la virtualisation Jérôme Mombelli Architecte Infrastructure Microsoft France
Agenda • Introduction • Les différentes approches • Tour d’horizon des solutions pour la mise en œuvre d’un PCA/PRA • Les technologies partenaires HP • Retour d’expérience CA-CIB
Interruptions de serviceRecovery Point/Time Objectives RPO: Point de reprise Jours Heures Minutes Transactions Sinistre Corruption des données Erreurs humaines Perte de serveurs Opérations de maintenance Pannes du stockage 99.9% 99.99% 99.999% 99.9999% 8.75h/an 52min/an 5.2min/an 32sec/an Causes des interruptions de service Coûts Jours Heures Minutes Secondes Instantané RTO: Temps de reprise
Solutions de continuité d’activité Haute Disponibilité L'utilisation du clustering local palie à une défaillance confinée. Le reste de l'environnement est actif Plan de continuité d’activité Reprise des opérations combinant des personnes, des processus et des plates-formes Reprise d’activité Solutions qui facilite la reprise des opérations pour les applications et l’accès aux données pour une zone de protection au niveau du site Sauvegarde Restauration Suppose en général que l’infrastructure est un tout, dans 97% des cas la mise en œuvre est liée aux services de fichiers Réplication Synchrone ou Asynchrone des données sur différents stockages Diminution du temps de reprise (RTO) et du point de prise (RPO)
Data Protection Manager 2010 & Hyper-V R2 DPM Agent • Hôte – Bare Metal Recovery • Protection et recouvrement de la VM • Pas de granularité • Permet de réduire le RTO • 1 Agent DPM au niveau du hôte, permet de protéger toutes les VMs • Protège aussi les VMs non Windows • VM – Granularité et Applicatif • Protection & Restauration granulaire et applicative • Identique à un serveur physique • Un agent par VM • RPO potentiel de 15 minutes DPM Agent
DPM & Hyper-V R2Scenarii de Restaurations VM6 VM5 VM4 VM1 VM2 VM3 CSV
DPM & PRA Site Primaire Site Secondaire
Solutions de continuité d’activité Haute Disponibilité L'utilisation du clustering local palie à une défaillance confinée. Le reste de l'environnement est actif Plan de continuité d’activité Reprise des opérations combinant des personnes, des processus et des plates-formes Reprise d’activité Solutions qui facilite la reprise des opérations pour les applications et l’accès aux données pour une zone de protection au niveau du site Sauvegarde Restauration Suppose en général que l’infrastructure est un tout, dans 97% des cas la mise en œuvre est liée aux services de fichiers Réplication Synchrone ou Asynchrone des données sur différents stockages Diminution du temps de reprise (RTO) et du point de prise (RPO)
PRA basée sur la réplication du stockage • Solution partenaire de type Site Recovery • Solution avec réplication et scripts • Hôtes Hyper-V (autonome ou cluster avec CSV) sur chaque site • Solution de réplication partenaire du stockage d’un site à l’autre • Script pour stopper la réplication et exporter/importer les machines virtuelles • Dépendant de la solution partenaire. • Exemples pour l’export/import: http://blogs.msdn.com/b/virtual_pc_guy/archive/2010/03/24/performing-a-configuration-only-export-import-on-hyper-v.aspx • Possible d’automatiser l’ensemble des opérations • Opération manuelle • Action de type « bouton rouge »
Principe de fonctionnement Replica • Réplication du stockage contenant les VMs • Lancement d’un script régulièrement pour l’exportation/importation uniquement de la configuration des VMs Bouton rouge: Exécution des scripts pour reprendre l’activité • Script pour l’arrêt de la réplication et passer le replica en accès Lecture/écriture • Script pour le redémarrage des VMs
Solutions de continuité d’activité Haute Disponibilité L'utilisation du clustering local palie à une défaillance confinée. Le reste de l'environnement est actif Plan de continuité d’activité Reprise des opérations combinant des personnes, des processus et des plates-formes Reprise d’activité Solutions qui facilite la reprise des opérations pour les applications et l’accès aux données pour une zone de protection au niveau du site Sauvegarde Restauration Suppose en général que l’infrastructure est un tout, dans 97% des cas la mise en œuvre est liée aux services de fichiers Réplication Synchrone ou Asynchrone des données sur différents stockages Diminution du temps de reprise (RTO) et du point de prise (RPO)
Cluster géographiquement étendu Un cluster géographiquement étendu est un cluster dont les nœuds sont localisés sur différents sites physiques Ce type de cluster utilise les mêmes concepts qu’un cluster mono-site Les baies de stockage ou un logiciel tiers fournissent le mécanisme de réplication SAN Le cluster étendu bascule automatiquement les VMs sur un site géographique diffèrent Les données du premier site sont répliquées sur le second site Baie de stockage Baie de stockage Site principal Site secondaire Les configurations multi-sites peuvent fournir un basculement automatique
Windows Server 2008 R2 Hyper-VLive Migration dans un cluster multi-sites VM pré-créée sur la machine cible Contenu de la mémoire copié via le réseau Vérification de l’état du lien de réplication et des LUNs • Phase de transfert final • Machine virtuelle en pause • Transfert de l’accès aux fichiers de la VM vers l’hôte de destination • Changement du sens de réplication du stockage Hôte 1 Hôte 2 Solution tierce de réplication stockage Solution tierce de réplication stockage Stockage 1 Stockage 2 Suppression de la définition de l’ancienne VM après validation que la migration s’est déroulée avec succès Site principal Site secondaire Bleu = Stockage Violet = Réseau Vert = Réseau pour l’accès client
Avantages du cluster multi-sites • Utilisation des même technologies en environnement virtuel & physique • Virtualisation, applications critiques, services d’infrastructure • Basculement automatique en cas de perte d’un site • Réduction du temps d’indisponibilité • Pas d’opérations manuelles • Failback (retour arrière sur le site principal) • Basculement planifié avec Live Migration • Aucune indisponibilité • Transparent pour les applications • Répartition des machines virtuelles en fonction de la charge • Réduction de la charge administrative associée • Synchronisation automatique des changements au niveau du cluster et des machines virtuelles • Mise en cohérence automatique des membres du cluster • Suppression des facteurs d’erreur humaine
Partenaire Pierre HofferResponsable Avant Ventes Enterprise Servers and StorageHewlett Packard
Continuity, Security and Efficiency Top the list of business priorities ZDNet survey 2009
Business Continuity Solutions HP Services Multi-site DR/DT Fault-Tolerant Disaster Tolerant Solutions Local and Remote Clustering Remote Mirroring Business Critical Deployment Cost Rapid Recovery Solutions Rapid Backup Solutions Operational Data Protection Solutions Infrastructure and Enterprise Backup Solutions Days Hours Minutes Recovery Time
HP StorageWorks Arrays Complete HP block-IO portfolio for all needs • Storage Arrays by HP P2000 Family P9500 X1000/X3000 with iSCSI 3PAR Family EVA Family P4000 Family Enterprise Midrange • Maximize performance, scalability and availability • Non-stop operation • High connectivity • High scalability • High efficiency • Universal connectivity and heterogeneity • Maximize performance, scalability and availability • Non-stop operation • High connectivity • High scalability • High efficiency • Universal connectivity and heterogeneity Entry level • Flexible and scalable iSCSI and Fibre Channel storage • Scalable modularity • High availability • Heterogeneous • Ease of administration • Price/scalability • Simple, affordable & fault tolerant Array technology • Clustering & shared storage • Minimal infrastructure • DtS conversion • Price/availability Scalability, Availability and Business Continuity • Backupsolution: HP LTO Tape libraries (MSL, EML, ESL), HP VTL with deduplication (D2D, VLS9200) • Backup Software: HP Data Protector
Writes XP/P9000 Thin Provisioning (ThP) Plan ahead - upgrade seamlessly as you grow Features • ThP V-Volumes are backed-up by a pool of physical storage with a selectable over-provisioning ratio. • ThP enables wide striping across hundreds of disks • ThP allows over-provisioning i.e. presenting more virtual capacity than physically available Benefits • Easy, fast and straight forward storage provisioning • No server reconfiguration required - configure future capacity requirements upfront • No hot-spots due to array internal data striping and distribution • Only actually needed & buffer capacity needs to be purchased resulting in massive power and cost savings • Fully supported with other array software like AutoLUN, Business Copy and Continuous Access 100GB 100GB Virtual Volume ThP VirtualVolumes Physical capacity pool
XP/P9500 Continuous Access Synchronous, asynchronous or journaled remote replication with guaranteed in-order delivery Site A What does it do? • Assures business continuance • Provides disaster recovery • Simplifies workload management • Allows point-in-time database backup • Provides restore without latency How does it work? • Creates a remote mirror for all specified logical units in the array over Fibre Channel • Unlimited distances with CA Asynchronous and CA Journal Site B S VOL P VOL P VOL S VOL
XP Cluster Extension for Windows End-to-end clustering solution to protect against server and storage failure Quorum Data Center 3 • What does it do? • Provides manual or automated site-failover for Server and Storage resources • Supported environments: • Windows Server 2003 (32-bit & 64-bit) • Microsoft Server 2003 (IA64) • Windows Server 2008 • HP ProLiant Storage Server • Requirements • XP Disk Arrays • XP Continuous Access (sync, async or journaled) • XP Cluster Extension MSCS on Windows B A A HP XP Cluster Extension HP XP ContinuousAccess Datacenter 1 Datacenter 2 Delivering automated metropolitan fail-over over hundreds of km Please visit: http://www.hp.com/support/clxxp
CLX WS2008-R2 Hyper-V Live Migration Non disruptive VM site swap and protection against server and storage failure File Share Witness Data Center 3 • What does it do? • Allows non disruptive migration of VMs from datacenter to datacenter for maintenance purpose and load balancing • Provides manual or automated site-failover in case of severe failures or disaster • Supported environments: • Windows Server 2008 R2 Hyper-V • Requirements: • XP Disk Arrays • XP Continuous Access • Microsoft Cluster • Cluster Extension XP Move VM A to DC 1 VMA VMA MicrosoftCluster VMB Cluster Extension XP HP XP ContinuousAccess Data Center 1 Data Center 2 Up to 500km VHD VHD VHD VHD See the Whitepaper on: http://h20195.www2.hp.com/V2/getdocument.aspx?docname=4AA2-6905ENW.pdf
3 Datacenter Replication Solution • with delta resynchronization Datacenter 1 Datacenter 2 Datacenter 3 ContinentalClusters • Consolidated Servers • Hyper-V • Integrity VM • etc. Metropolitan Clusters XP/P9500 Up to 247PB Core SAN Asynchronous Replication Asynchronous Replication • Consolidated Storage • XP/P9500 SynchronousReplication XP/P9500 Up to 247PB XP/P9500 Up to 247PB Enterprise Infrastructure Management
Retourd’expérience Franck HohneckerResponsable Pôle Expertise Stéphane Saint-CharlesArchitecte Technique CA-CIB
Crédit Agricole CIB • Une démarche d’innovation IT du groupe Crédit Agricole au service de ses métiers • Les métiers de Crédit Agricole CIB: • Coverage & InvestmentBanking • Structured Finance • FixedIncomeMarkets • EquityBrokerage & Derivatives • Transaction & Commercial Banking • Banque Privée Internationale • Le S.I. de Crédit Agricole CIB en quelques chiffres: • Environnement international : Datacenters, Hubs & Sites satellites. • 10.000+ serveurs, 1 Peta Octets de stockage utile, 1.200+ applications • Nos contraintes: • Satisfaire des besoins métiers croissants • Fournir une haute Qualité de Services (Haute-disponibilité, PSI, PRA) • Assurer l’Intégrité et la Sécurité des données • Garantir l’évolutivité et la pérennité de nos infrastructures • Optimiser notre base de coûts
Crédit Agricole CIB • Chiffres clés • Plus de 50 implantations • Plus de 13 000 collaborateurs • 62% de l'effectif global en Europe • 26% de l'effectif global en Asie
Contexte CA-CIB • Une Production répartie sur 2 Datacenters Principaux distants de 75Km (Principe Actif / Actif) • 120 Géo-clusters MSCS (Windows 2003 & 2008) • Exchange, SQL (2 à 4 nœuds) • Systèmes de Fichiers (2 à 6 nœuds) • Clusters Applicatifs (2 nœuds) • Clusters Hyper-V (8 nœuds)
Clusters CLX CA-CIB • 5 ans d’expérience sur clusters CLX en Production • Des Exercices PSI (Plan de Secours informatique) réguliers • Maturité des équipes opérationnelles • Déploiements • Administration • Industrialisation et automatisation massive
Architecture SCVMM Command View Serveur Applicatif A Serveur Applicatif B Serveur Applicatif C SAN Machines Virtuelles Machines Virtuelles HP Cluster Extension Hyper-V Cluster Live Migration Data Center B Réseau IP XP24000 DR Group 03 DR Group 02 DR Group 01 Replication des VHDs de toutes les VMs LAN SAN 75Km SCVMM XP24000 Command View Serveur Applicatif A OS Disk 30 GB Datas Disk100 GB Serveur Applicatif B OS Disk 30GB Data Center A Serveur Applicatif C OS Disk 30GB
Stockage implémenté • Stockage XP24000 et tiering EVA8100 & 8400 en external Storage • Utilisation des fonctions de virtualisaiton du stockage (Wide Stripping et Thinprovisioning) • Liens de réplication SAN dédiés 12 x 2Gb
Focus Réseau • Liens inter-sites 2 x10Gb/s • Technologie MPLS • Extension niveau 2 et 3 entre les deux Datacenters • Mise en œuvre du VLAN taging sur la plate-forme Hyper-V (en cous d’intégration)
Hyper-V • 80 Tests réalisés sur 3 axes • performances • Résilience • Gestion opérationnelle • Capacités d’automatisation • Choix de Windows 2008 R2 Datacenter Full Installation • Choix de SCOM et SCVMM pour piloter la solution
Hyper-V & Clusters CLX • Intégration native d’Hyper-V au sein d’un clusters MSCS • Exploitation simplifiée • Capitalisation sur l’automatisation déjà réalisée • Choix serveurs HP BL460 • 8 Cores / 96Go de RAM • Stockage • 1 LUN par VM • HP Continuous Access en mode Fence DATA • VHD dynamiques • Utilisation d’HP Cluster Extension v4 • Prise en charge du live-migrateinter-site • Simplification du Plan de reprise en cas de sinistre pour les applications non-clusterisables ou dont les procédures de reprise sont complexes
Evolutions du Cloud privé • Objectif capacitaire de 1000 VMs • Mise à disposition d’un portail self-service (développement interne) • Un Cloud d’infrastructure communautaire au service des entités du groupe Crédit Agricole