370 likes | 496 Views
SYSTÈME D’EXPLOITATION I. SIF-1015. Contenu du cours 10. Gestion de la mémoire Concepts et opérations de base Concepts et opérations avancées Implémentation LECTURES Chapitre 8 et 9 (OSC) Chapitre 21 (Mitchell) Chapitre 8 (Card). Concepts et opérations de base.
E N D
SYSTÈME D’EXPLOITATION I SIF-1015
Contenu du cours 10 • Gestion de la mémoire • Concepts et opérations de base • Concepts et opérations avancées • Implémentation • LECTURES • Chapitre 8 et 9 (OSC) • Chapitre 21 (Mitchell) • Chapitre 8 (Card)
Concepts et opérations de base • Espace d’adressage d’un processus • Chaque processus est associé à un espace d’adressage qui représente les zones de mémoire allouées au processus. Cet espace d’adressage comporte: • Le code du processus • Les données du processus décomposées en deux segments: segment data qui contient les variables initialisées et le segment bss qui contient les variables non initialisées • Le code et les données des bibliothèques partagées utilisées par le processus • La pile utilisée par le processus
Concepts et opérations de base • Espace d’adressage d’un processus • LINUXalloue 3 Go de 4 Go à cet espace d’adressage. Le Go restant est réservé à la mémoire utilisée par le noyau (code de LINUX et les données qu’il manipule) • Les 3 Go disponibles sont décomposés en régions mémoire utilisables par le processus • Le programme AfficheAdresses.c affiche l’adresse de diverses variables et fonctions. Les régions mémoire utilisées par un processus peuvent être visualisées (fig. 8.1, Card)
Concepts et opérations de base • Espace d’adressage d’un processus (AfficheAdresses.c)
Concepts et opérations de base • Espace d’adressage d’un processus (AfficheAdresses.c)
Concepts et opérations avancées • Régions de mémoire • L’espace d’adressage d’un processus est composé de plusieurs régions de mémoire. Chaque région mémoire est caractérisée par plusieurs attributs: • Adresses de début et de fin • Droits d’accès de cette zone • L’objet qui lui est associé (ex: fichier exécutable) • Les régions de mémoire contenues dans l’espace d’adressage d’un processus peuvent être déterminées en affichant le contenu du fichier maps (dans le répertoire de chaque processus dans /proc) • L’affichage donne: • Les adresses du début et de fin de la région de mémoire • Les droits d’accès (p indique que la région peut être partagée entre processus) • Le déplacement du début de la région dans l’objet • Le numéro du périphérique (disque) contenant l’objet • Le numéro d’i-node de l’objet
Concepts et opérations avancées • Régions de mémoire • Dans cet exemple, les trois premières régions (trois premières lignes) correspondent au programme exécuté (segment de code, segment de données initialisées, et segment de données non-initialisées)
Implémentation • Gestion des tables de pages (pagination) • LINUX utilise les mécanismes de mémoire virtuelle fournis par le processeur sur lequel il s’exécute • Les adresses manipulées par le noyau et les processus sont des adresses virtuelles et une conversion est effectuée par le processeur pour transformer une adresse virtuelle en adresse physique en mémoire centrale • La conversion fonctionne de la façon suivante: • Une adresse mémoire est décomposée en deux parties: • Un numéro de page • Un déplacement dans la page • Le numéro de page est utilisé comme indice dans la table de page, ce qui fournit l’adresse physique d’une page en mémoire centrale • À cette adresse est ajouté le déplacement pour obtenir l’adresse physique du mot concerné
Implémentation • Motivations derrière la VM • La DRAM est utilisée comme une cache pour le disque • L’espace d’addresses (virtuelle) d’un processus peut dépasser la capacité de la mémoire physique • La somme des espaces d’adresses de plusieurs processus peut dépasser la capacité de la mémoire physique • Faciliter la gestion de mémoire • Plusieurs processus résident en DRAM • Chaque processus possède son espace d’adresses • Seulement le code et les données actives sont en DRAM • Le OS alloue plus de mémoire au processus au besoin • Facilite la gestion de la protection • Un processus ne peut interférer avec un autre • Chacun opère dans un espace d’adresse distinct • Les processus user ne peuvent accéder aux informations privilégiées • Les sections différentes d’un espace d’adresses ont différentes permissions
Implémentation • Gestion des tables de pages (pagination) • Conversion d’adresse virtuelle en adresse physique
Système avec VM (Motivation #1) 0: 1: CPU N-1: • Exemples: • Stations de travail, serveurs, PC modernes, etc. Memory Page Table Virtual Addresses Physical Addresses 0: 1: P-1: Disk Traduction d’Addresse: Le matériel convertit les adresses virtuelles en adresses physiques via une table de lookup (page table) gérée par le OS
Faute de page • Qu’arrive-t-il si un objet est sur disque au lieu de la RAM ? • PTE indique que la VA n’est pas en RAM • Le OS lance un exception handler qui transfert les données du disque vers la RAM • Le processus courant est interrompu, un autre est démarré • Le OS contrôle pleinement le transfert Before fault After fault Memory Memory Page Table Page Table Virtual Addresses Physical Addresses Virtual Addresses Physical Addresses CPU CPU Disk Disk
Gestion d’une faute de page disk Disk • CPU signale le I/O controller • Lecture d’un bloc de longueur P à partir de l’adresse X sur le disque et stocké à l’adresse Y de la RAM • Lecture • Mode DMA • Géré par le I/O controller • I / O Controller signale la fin du transfert • CPU est interompu • OS redémarre le processus suspendu (1) Initiate Block Read Processor Reg (3) Read Done Cache Memory-I/O bus (2) DMA Transfer I/O controller Memory disk Disk
Motivation #2: Gestion de mémoire • Plusieurs processus peuvent résider en RAM • Comment résoudre les conflits d’addressage ? • Si deux processus accèdent à la même adresse RAM ? memory invisible to user code kernel virtual memory stack %esp Memory mapped region forshared libraries Linux/x86 process memory image the “brk” ptr runtime heap (via malloc) uninitialized data (.bss) initialized data (.data) program text (.text) forbidden 0
Solution: Espaces d’adresses virtuelles séparées • Les espaces d’adresses virtuelles et physiques sont divisés en blocs de dimension égale • Chaque bloc correspond à une page ( virtuelle et physique) • Chaque processus possède son propre espace d’adresses • Le OS contrôle l’assignation de pages virtuelles en mémoire physique 0 Physical Address Space (DRAM) Address Translation Virtual Address Space for Process 1: 0 VP 1 PP 2 VP 2 ... N-1 (e.g., read/only library code) PP 7 Virtual Address Space for Process 2: 0 VP 1 PP 10 VP 2 ... M-1 N-1
Motivation #3: Protection 0: Read? Write? Physical Addr 1: VP 0: VP 0: Yes No PP 9 VP 1: VP 1: Yes Yes PP 4 VP 2: VP 2: No No XXXXXXX • • • • • • • • • Read? Write? Physical Addr Yes Yes PP 6 N-1: Yes No PP 9 No No XXXXXXX • • • • • • • • • • Les PTE contiennent des droits d’accès • Les violations d’accès sont trappées par le OS Page Tables Memory Process i: Process j:
Implémentation: Tables de Pages Memory resident page table (physical page or disk address) Virtual Page Number Physical Memory Valid 1 1 0 1 1 1 0 1 Disk Storage (swap file or regular file system file) 0 1
Implémentation • Gestion des tables de pages (pagination) • En raison de la taille de l’espace mémoire adressable par le processeur, la table des pages n’est pas implémentée sous forme d’une seule table contiguë en mémoire puisque cette approche nécessiterait trop de mémoire • Par exemple: • Les processeurs de l’architecture x86 peuvent adresser 4 Go • La taille des pages mémoire est de 4 Ko (1 M pages de 4 Ko) • Chaque entrée de la table occupe quatre octets (adresse de 32 bits) • Une table de pages complète utiliserait 1 M entrées, pour une occupation de mémoire de 4 Mo • La table de pages est alors décomposée en au moins 2 niveaux: • Un catalogue de table de pages contenant les adresses des pages qui contiennent des parties de la table des pages complète • Les parties utilisées de la table des pages sont chargées en mémoire
Tables de pages multi-niveaux • Étant donné: • Bloc de 4KB (212) • Adresses de 32-bits • PTE de 4-byte • Problème: • Table de pages de 4 MB ! • 220 *4 bytes • Solution • Table de pages multi-niveaux • e.g., Table 2-niveaux (P6) • Niveau 1 : 1024 entrées, chaque entrée pointe sur une table de pages de niveau 2 • Niveau 2: 1024 entrées, chacune pointe sur une page en DRAM Level 2 Tables Level 1 Table ...
Structure de la table de pages 2-niveaux (P6) • Page répertoire: • 1024 PDEs de 4-byte qui pointent chacune sur une table de pages • Une page répertoire est attribuée par processus • La page répertoire d’un processus doit être en mémoire quand ce processus s’exécute • Cette page est toujours pointée par le PDBR • Page tables: • 1024 PTEs de 4-byte qui pointent sur une page en RAM. • Les tables de pages peuvent aller et venir entre la RAM et le disque Up to 1024 page tables 1024 PTEs page directory ... 1024 PDEs 1024 PTEs ... 1024 PTEs
Mapping VA->PA (P6) 10 10 12 Virtual address VPN1 VPN2 VPO word offset into page directory word offset into page table word offset into physical and virtual page page directory page table physical address of page base (if P=1) PTE PDE PDBR physical address of page table base (if P=1) physical address of page directory 20 12 Physical address PPN PPO
Représentation d’un espace virtuel Page 15 PT 3 Page 14 Page 13 Page Directory Page 12 Page 11 P=0, M=1 P=1, M=1 P=1, M=1 P=1, M=1 • • • • PT 2 P=0, M=0 P=0, M=1 P=0, M=0 P=1, M=1 • • • • Page 10 P=0, M=0 P=0, M=0 P=1, M=1 P=1, M=1 • • • • Page 9 P=0, M=1 P=0, M=1 P=0, M=1 P=0, M=0 • • • • Page 8 PT 0 Page 7 Page 6 Mem Addr Page 5 Disk Addr Page 4 Page 3 In Mem Page 2 On Disk Page 1 Page 0 Unmapped • Example simple • Espace d’adresses virtuelles de 16 pages • Flags • P: La PDE ou PTE en mémoire ? • M: Cet espace de VA a-t-il été mappé ?
Implémentation • Gestion des tables de pages (pagination) • L’intérêt de cette table de pages à deux niveaux repose sur le fait que la table de pages n’a pas besoin d’être chargée entièrement en mémoire • Si par exemple, un processus utilise 6 Mo de mémoire sur un processeur x86, seulement trois pages sont utilisées pour la table des pages: • La page contenant le catalogue • La page contenant la partie de la table de pages correspondant aux premiers 4 Mo de mémoire (1 K entrées, chaque entrée pointe sur une page de 4 Ko) • La page contenant la partie de la table de pages correspondant aux prochains 4 Mo de mémoire (la moitié est utilisée)
Implémentation • Gestion des pages mémoire (descripteur de page) • LINUX tient à jour l’état de chaque page de la mémoire centrale. Il utilise un tableau de descripteurs, pointé par la variable mem_map pour décrire chaque page • La structure page définit le format de ce descripteur
Implémentation • Gestion des pages mémoire (descripteur de page) • La structure page définit le format de ce descripteur
Implémentation • Espace d’adressage des processus (descripteur de régions mémoire) • L’espace d’adressage des processus peut être formé de plusieurs régions mémoire • Le noyau maintient en mémoire une description des régions mémoire par un processus. La structure vm_area_struct (fichier définit le format du descripteur de chaque région
Implémentation • Espace d’adressage des processus (descripteur de régions mémoire) • L’espace d’adressage des processus peut être formé de plusieurs régions mémoire memory invisible to user code kernel virtual memory stack %esp Memory mapped region for shared libraries Linux/x86 process memory image the “brk” ptr runtime heap (via malloc) uninitialized data (.bss) initialized data (.data) program text (.text) forbidden 0
Linux organise la VM comme une collection d’espaces virtuels process virtual memory vm_area_struct task_struct mm_struct vm_end vm_start mm pgd vm_prot vm_flags mmap shared libraries vm_next 0x40000000 vm_end • pgd: • page directory address • vm_prot: • read/write permissions for this area • vm_flags • shared with other processes or private to this process vm_start data vm_prot vm_flags 0x0804a020 text vm_next vm_end vm_start 0x08048000 vm_prot vm_flags 0 vm_next
Traitement des fautes de pages sous LINUX vm_end vm_end vm_end vm_start vm_start vm_start r/o r/o r/w vm_next vm_next vm_next • La VA est-elle légale? • Est-elle définit dans une vm_area_struct? • Sinon signaler un segmentation violation (e.g. (1)) • L’opération est-elle légale? • Le processus peut-il faire un read/write ? • Sinon signaler un protection violation (e.g., (2)) • SI OK, traite la faute de page • e.g., (3) process virtual memory vm_area_struct shared libraries 1 read 3 data read 2 text write 0
Exec() explicité • Pour exécuter un nouveau programme p dans le contexte du processus courant par exec(): • Libérer les vm_area_struct et les tables de pages de l’ancien processus • Créer de nouvelles vm_area_struct et des tables de pages pour le nouveau processus • Zones stack, bss, data, text, shared libs. • Zones text et data correspondant au fichier .exe • Zone bss et stack initialisées à 0 • Intialiserle PC au début du programme à exécuter dans la zone .text • Linux swap ensuite les pages de codes et de données au besoin process-specific data structures (page tables, task and mm structs) physical memory same for each process kernel code/data/stack kernel VM 0xc0 demand-zero stack %esp process VM Memory mapped region for shared libraries .data .text libc.so brk runtime heap (via malloc) demand-zero uninitialized data (.bss) initialized data (.data) .data program text (.text) .text p forbidden 0
Fork() explicité • Création d’un nouveau processus avec fork(): • Copier les structures mm_struct, vm_area_struct, et les tables de pages du processus père. • Au début les deux processus partagent les mêmes pages en mémoire • Comment peut-on avoir deux espaces d’adresses distincts sans recopier toutes les pages virtuelles ? => Technique du “copy on write” • Technique du copy-on-write • Créer initialement les pages W en R/O • Le champ flag des vm_area_struct de ces zones est initialisé à private “copy-on-write” • Un accès en écriture à ces pages par un des processus cause une faute de page • Le gestionnaire de fautes reconnait le copy-on-write, fait une copie de la page et restaure la permission en écriture • Résultat: Copies de pages sont retardées tant qu’un accès en écriture n’est pas requis (i.e., quand un processus essaie de modifier une page partagée).
Fork() explicité • Création d’un nouveau processus avec fork(): • Technique du “copy on write” (avant un page fault)
Fork() explicité • Création d’un nouveau processus avec fork(): • Technique du “copy on write” (après un page fault)
Implémentation • Espace d’adressage des processus (descripteur de régions mémoire, structure vm_area_struct)
Implémentation • Espace d’adressage des processus (descripteur d’espace d’adressage) • LINUX maintient un descripteur de l’espace d’adressage. Ce descripteur est accessible par le champ mm de la structure task_struct associée à chaque processus. mm pointe sur une structure mm_struct
Implémentation • Espace d’adressage des processus (descripteur d’espace d’adressage) • Structure mm_struct