1 / 17

Structures de données avancées : SDDS (structures de données distribuées et scalables)

Structures de données avancées : SDDS (structures de données distribuées et scalables). D. E ZEGOUR Institut National d ’Informatique. Sdds : - Systèmes distribués -. Définition  Un ensemble de machines se partageant les données à stocker et la charge CPU.

Download Presentation

Structures de données avancées : SDDS (structures de données distribuées et scalables)

An Image/Link below is provided (as is) to download presentation Download Policy: Content on the Website is provided to you AS IS for your information and personal use and may not be sold / licensed / shared on other websites without getting consent from its author. Content is provided to you AS IS for your information and personal use only. Download presentation by click this link. While downloading, if for some reason you are not able to download a presentation, the publisher may have deleted the file from their server. During download, if you can't get a presentation, the file might be deleted by the publisher.

E N D

Presentation Transcript


  1. Structures de données avancées : SDDS (structures de données distribuées et scalables) D. E ZEGOUR Institut National d ’Informatique

  2. Sdds : - Systèmes distribués - Définition •  Un ensemble de machines se partageant les données à stocker et la charge CPU. • Les tâches de communication inter-machines sont transparentes à l’utilisateur, • L’ensemble du système apparaît comme une seule machine virtuelle.

  3. Sdds : - Architectures Matérielles - Architecture à Mémoire Partagée : Shared-Memory • Processeurs indépendant avec une mémoire commune • Limité à une dizaine de processeurs ( La mémoire devient un goulot d’étranglement) • L’ajout d’un nouveau processeur peut entraîner des modifications importantes au niveau du matériel

  4. Sdds : - Architectures Matérielles - Architecture à Disques Partagés : Shared-Disk • Chaque processeur a sa mémoire privée et peut accéder à n’importe quel disque à travers un réseau d’interconnexion • Chaque processeur peut ainsi copier des pages d’une base de données sur un disque partagé dans son propre cache disque. • Nécessite une gestion des conflits d’accès aux même pages et l’implantation d’un protocole de gestion de cohérence des caches. • La complexité de ces mécanismes limite les performances de cette architecture.

  5. Sdds : - Architectures Matérielles - Architecture sans partage : Shared-Nothing • Chaque processeur dispose de sa propre mémoire locale et de son propre espace disque ( Chaque nœud apparaît comme un serveur de données local avec sa propre base de données) • Cette architecture s’est développée grâce aux réseaux de PCs et de stations de travail qui permettent d’intégrer un grand nombre de processeurs (plusieurs centaines, voire des milliers de processeurs). • Extensibilité et disponibilité très séduisantes. • Minimiser la quantité de données transférées sur le réseau. • Ces systèmes sont cependant difficiles à administrer et à programmer.

  6. Serveurs Répertoired'accès Clients Sdds : - Structures de données classiques - • Stockage sur un seul site  Limite de taille • Mécanisme de calcul d'adresse unique et centralisé  un point d'accumulation • Limite sur les performances d'accès • Vulnérabilité aux pannes • Pas de Scalabilité

  7. Sdds : - Structures de données classiques - • Schémas de distribution classiques : • Partitionnement par intervalle, • Partitionnement par hachage • Round-Robin , …

  8. Sdds : - Scalable distributed data structures - • Une nouvelle classe de structures de données pour des bases de données modernes  SDDS • Conçues spécifiquement pour les multiordinateurs d’une grande taille • Avec des données multimedia, géographiques, texte,… • Assure la Scalabilité • Grandissant rapidement en gardant les mêmes performances • Assure une haute disponibilité

  9. Sdds : - Multiordinateurs – définitions - • Une collection faiblement couplés d'ordinateurs : • Station de travail, PC, CPU • Interconnectés par un réseau haut-débit (≥ 100 Mb/s)  : • LAN (Local Area Network), WAN(Wide Area Network), … • Architecture à partage de rien avec passage de messages : • Unicast, Multicast et Broadcast

  10. Sdds : - Multiordinateurs – définition - D B C Inter réseau A

  11. Sdds : - Multiordinateurs - avantages • Bon marchés et souvent ils existent déjà • Puissance théorique de ressources en calcul et mémoires • impossible pour un super-ordinateur traditionnel  : • HP laboratories (1500 WS) = 50GO de RAM et quelquesTO ( Téra octets) de disque. (1 TO = 1020 octets ) • UCBerkeleySodaHall (500 WS) = 64GO de RAM et plus d’un TO de disque • Possibilités de bases de données en RAM distribuée :

  12. RAM local RAM distant RAM distant Disque local réseau gigabitEthernet Temps d'accès 100 nsecs 1 µsecs 100 µsecs 10 msec En proportion 1 mn 10 mn 2 heures 8 jours Sdds : - Multiordinateurs - avantages

  13. Sdds : - Multiordinateurs – Axiomes généraux - • Les données sont identifiées par des clés (d1), OID pour les objets • Les données sont stockées sur des serveurs et sont accédées par des clients autonomes • Il n'y a pas de répertoire central d'accès • Image locale par client • Mécanisme de vérification et de redirection des requêtes • Mécanisme de mise à jour distribué des images des clients • Les mises à jour de la structure d'une SDDS ne sont pas envoyées aux clients de manière synchrone

  14. Sdds : - Multiordinateurs – Contraintes - • Les IAM font converger l’image d'un client vers l'image réelle du fichier • L'ensemble des renvois ne se fait qu'en quelques messages. • Contraintes de performance d'accès d'une SDDS • Nombre de messages sur le réseau par opération(indépendante des paramètres du réseau) • Convergence de vue d’un nouveau client et d'un client peu actif • Contraintes de scalabilité • Prendre en charge n’importe quelle quantité de données • Maintenir les performances quand le volume de données stockées varie

  15. Sdds : - Multiordinateurs – Contraines - • Contraintes de distribution • Une grande quantité de données • Traitement parallèle et distribué • Contraintes de disponibilité • Assurer la continuité du fonctionnement 24 heures / 7 jours

  16. Sdds : - Multiordinateurs – typologie - • Basées sur le hachage : • LH*, DDH et EH* • Ordonnées : • RP*, CTH*, DRT, et Distributed B+-tree • Multidimensionnelles : • k-RP* , k-DRT et IH* • Haute-disponibilité : • LH*m, LH*s, LH*g, LH*RS , LH*SA

  17. Classiques SDDS Arbre Hachage Sdds : Variantes Structure de Données DRT, RP* CTH* 1-dimensionnel LH*, LH*LH DDH, EH* d-dimensionnelIH**

More Related