660 likes | 767 Views
ΛΕΙΤΟΥΡΓΙΚΑ ΣΥΣΤΗΜΑΤΑ Ι. Κεφάλαιο 3 ο : Διαχείριση Μνήμης. 4.1 Απλή Διαχείριση. O Διαχειριστής Μνήμης (ΔΜ) (memory manager) πρέπει να: ξέρει ποια διαμερίσματα της ΚΜ είναι κατειλλημένα μπορεί ν' αναθέτει μνήμη σε διεργασίες όταν την χρειάζονται
E N D
ΛΕΙΤΟΥΡΓΙΚΑ ΣΥΣΤΗΜΑΤΑ Ι Κεφάλαιο 3ο: Διαχείριση Μνήμης
4.1 Απλή Διαχείριση O Διαχειριστής Μνήμης (ΔΜ) (memory manager) πρέπει να: • ξέρει ποια διαμερίσματα της ΚΜ είναι κατειλλημένα • μπορεί ν' αναθέτει μνήμη σε διεργασίες όταν την χρειάζονται • παίρνει πίσω μνήμη που "ελευθερώνεται" από διεργασίες • διαχειρίζεται την εναλλαγή (swapping) – δηλ. τη μεταφορά (διαμερισμάτων) διεργασιών μεταξύ ΚΜ & δίσκου. Οι ΔΜ χωρίζονται σε κατηγορίες ανάλογα με το αν επιτρέπουν, σελιδοποίηση (paging), swapping (δηλ. μεταφορά τμημάτων ή ολόκληρων διεργασιών μεταξύ ΚΜ και δίσκου). Χωρίς swapping και paging ο ΔΜ είναι «απλός».
Μονοπρογραμματισμός (Monoprogramming) Η πιο απλή λύση: μόνο ένα process βρίσκεται στη ΚΜ κάθε φορά • Η ΚΜ χωρίζεται σε 2 μέρη: ένα για το Λ.Σ. και ένα για το user process που τρέχει στη Κ.Μ. • Μόλις ο χρήστης ζητήσει να τρέξει ένα πρόγραμμα, το Λ.Σ. το "φορτώνει" στη ΚΜ και το τρέχει Το monoprogramming δεν αρκεί στις πιο πολλές περιπτώσεις: • I/O-bound jobs: το CPU υποαπασχολείται κακή απόδοση. • Πολλές διαδραστικές διεργασίες: χρόνος απόκρισης πολύ μεγάλος. • Πολλές εφαρμογές θέλουν την δυνατότητα δημιουργίας πολλών διεργασιών που τρέχουν "ταυτόχρονα". • χρειαζόμαστε multiprogramming • η δουλειά του Δ.Μ. γίνεται πολύ πιο δύσκολη
Μοντέλο για Ωφέλη Πολυπρογραμματισμού • Έστω p η πιθανότητα ότι σε μια χρονική στιγμή μια διεργασία βρίσκεται στη κατάσταση αναμονής για Ε/Ε (I/O-wait) • Έστω επίσης ότι υπάρχουν Ν τέτοια διεργασίες • Το CPU utilization δίνεται από τη φόρμουλα: • CPU utilization = 1 - pN • με p = 80% το CPU utilization είναι: το multiprogramming έχει σοβαρές ευεργετικές συνέπειες. Σημείωση: Το παραπάνω μαθηματικό μοντέλο είναι υπεραπλουστευμένο; Γιατί;
ΔΜ με Σταθερά Διαμερίσματα (Partitions) • Ένα «partition» μνήμης είναι σταθερού μεγέθους. Διαφορετικά partitions μπορεί να έχουν διαφορετικό μέγεθος. • Το κάθε διαμέρισμα μπορεί να "φιλοξενεί" διεργασίες (το μέγεθος των οποίων πρέπει να είναι ≤ του μεγέθους του διαμερίσματος). • Ο Δ.Μ. διατηρεί μια ουρά από διεργασίες που περιμένουν να εισέλθουν σ' ένα διαμέρισμα. Μπορεί να υπάρχει μια ουρά για όλα τα διαμερίσματα ή μια ουρά για κάθε διαμέρισμα. • Στη τελευταία περίπτωση μπορεί να υπάρχει διαθέσιμη μνήμη και να μη χρησιμοποιείται. • Στη 1η περίπτωση ο Δ.Μ. πρέπει να προσέξει να μην σπαταλάει μνήμη.
ΔΜ με Σταθερά διαμερίσματα (Partitions) Παράδειγμα: Αν ένα μικρό process μπει στο διαμέρισμα 3, τότε αν και υπάρχει πολύ διαθέσιμος χώρος σε αυτό το διαμέρισμα δεν μπορεί να χρησιμοποιηθεί. Αυτό ονομάζεται εσωτερικός κατακερματισμός (internal fragmentation). • Η λύση σ' αυτό το πρόβλημα δεν είναι προφανής. Για παράδειγμα αν κάθε φορά ο Δ.Μ. ψάχνει για το process στην ουρά που ελαχιστοποιεί τον εσωτερικό κατακερματισμό, τότε μικρές διεργασίες θα αδικούνται (λιμοκτονούν) -- θυμηθείτε τα πλεονεκτήματα του SJF αλγόριθμου και ότι μικρές, διαδραστικές διεργασίες πρέπει να έχουν υψηλή προτεραιότητα. • Μια λύση (για λιμοκτονία) είναι το κάθε μικρό process να σχετίζεται με μια μεταβλητή, Κ, που αντιπροσωπεύει πόσες φορές ο διαχειριστής δεν έδωσε το διαμέρισμα στο process. Μετά από Κ φορές, το διαμέρισμα δίνεταιστο process (αυτή η τεχνική ονομάζεται γενικά «παλαίωση» ή γήρανσηaging).
Θεμελιώδη Προβλήματα των Partitions • Ακόμα και με μονοπρογραμματισμό υπάρχουν 2 διαμερίσματα. • Ο linker και ο loader συνεργάζονται και παράγουν τις διευθύνσεις των εντολών και των δεδομένων του προγράμματος. Ο linker παράγει "λογικές" διευθύνσεις και όχι "φυσικές", - δηλ. η πρώτη διεύθυνση είναι 0, κ.λπ. • Ομως, στη φυσική διεύθυνση 0 βρίσκονται εντολές ή δεδομένα του Λ.Σ. τίθεται θέμα προστασίας του Λ.Σ. • Η λύση εστιάζει στη μετάφραση των «λογικών» διευθύνσεων σε «φυσικές». Για παράδειγμα αν το process έχει μπει στο Part1 τότε σ' όλες τις διευθύνσεις που παράγονται κατά την εκτέλεση του process, το κατάλληλο υλικό προσθέτει 100 Κ.
Θεμελιώδη Προβλήματα των Partitions • Συνήθως η παραπάνω στρατηγική υλοποιείται με την χρησιμοποίηση ενός ειδικού καταχωρητήβάσης (base register). • Στο παραπάνω παράδειγμα, όταν το process φορτωθεί στο Part. 1 και αμέσως πριν του δοθεί η CPU ο καταχωρητής βάσης παίρνει την τιμή 100 Κ. • Αυτό γίνεται από τον kernel του Λ.Σ. (δηλ. οι διεργασίες δεν έχουν πρόσβαση σ' αυτόν τον register). Έτσι επιτυγχάνεται το επιθυμητό αποτέλεσμα.
Θεμελιώδη Προβλήματα των Partitions • Ο καταχωρητής βάσης όμως δεν αρκεί! • Στην περίπτωση πολυπρογραμματισμού, πρέπει το σύστημα να εγγυάται ότι καθένα πρόγραμμα θα προστατεύεται από τ' άλλα που είναι στη Κ.Μ. • απαιτείται έλεγχος σχετικά με τις διευθύνσεις που μπορεί να παράγει ένα process. • π.χ. το process στο Part1 δεν μπορεί να παράγει διευθύνσεις > 200Κ γιατί τότε θα κάνει ζημιά στο process που τρέχει στο Part2.
Θεμελιώδη Προβλήματα των Partitions • Αυτό το πρόβλημα λύνεται μ' ένα άλλο ειδικό καταχωρητή ορίου (limit register). • Ο limit register περιέχει την μέγιστη διεύθυνση του partition στο οποίο τρέχει το process. Κάθε διεύθυνση που παράγεται, λοιπόν, προστίθεται στο base register και το αποτέλεσμα συγκρίνεται με το limit register: αν είναι μεγαλύτερο, το process πεθαίνει. Σημείωση: Με base και limit registers τα προγράμματα μπορούν να μετακινηθούν στην Κ.Μ. (δηλαδή ν' ανατεθούν σε διαφορετικά partitions κατά την διάρκεια της εκτέλεσής τους). Αυτό ονομάζεται επανατοποθέτηση (relocation).
4.2 ΔΜ με Εναλλαγή (Swapping) • Τί γίνεται όταν υπάρχουν πιο πολλές διεργασίες απ' όσες μπορεί να υποστηρίξει η Κ.Μ.; • Ορίζεται ένας χώρος στο δίσκο (swap space) που φιλοξενεί τις διεργασίες που δεν «χωρούν» στη Κ.Μ. • Η μεταφορά διεργασιών μεταξύ ΚΜ και swap space στο δίσκο ονομάζεται εναλλαγή - swapping. Διαχείριση Μνήμης με Μεταβαλλόμενα διαμερίσματα • Η έννοια των σταθερών τμημάτων δεν βοηθά πολύ: Συχνά, σπαταλείται πολύς χώρος ΚΜ γιατί δεν γίνεται καλό "ταίριασμα" («εφαρμογή») μεταξύ μεγεθών διαμερισμάτων & διεργασιών. μεταβαλλόμενου μεγέθους διαμερίσματα -- variable partitions.
ΔΜ με Μεταβαλλόμενα διαμερίσματα Βασική ιδέα: • οι διευθύνσεις, ο αριθμός, και τα μεγέθη των partitions μεταβάλλονται ανάλογα με τις ανάγκες. • Κάθε διαμέρισμα αποτελείται από συνεχόμενες διευθύμσεις στην ΚΜ και μπορεί να είναι ίσου μεγέθους με τη διεργασία που «φιλοξενεί» (συνήθως λίγο μεγαλύτερο). • Το σημαντικό αποτέλεσμα είναι ότι τα μεταβαλλόμενα partitions ελαχιστοποιούν τηνσπατάλη χώρου στη ΚΜ. • Από την άλλη πλευρά, όμως, η ανάθεση ΚΜ σε διεργασίες και γενικά το έργο διαχείρισης ΚΜ δυσκολεύει.
ΔΜ με Μεταβαλλόμενα διαμερίσματα Παράδειγμα: • Βλέπουμε ότι υπάρχουν 2 "άδεια" διαμερίσματα της ΚΜ, έστω με μέγεθος 3ΜΒ και 1ΜΒ αντίστοιχα. Κ.Μ. Kernel P1 Μόλις ήρθε το process P1 >> Kernel P1 P2 Μόλις ήρθε και το process P2 >> Kernel P2 Έφυγε το process P1 >> Kernel P3 P2 Ήρθε το process P3 >> Kernel P3 P2 P4 Ήρθε το process P4
ΔΜ με Μεταβαλλόμενα διαμερίσματα • Αν τώρα έρθει ένα process P5 που χρειάζεται 4ΜΒ, δεν μπορεί να γίνει δεκτό, παρότι υπάρχει 4ΜΒ ελεύθερος χώρος στη ΚΜ. Αυτό το φαινόμενο ονομάζεται εξωτερικός κατακερματισμός (external fragmentation). • Μια λύση στο πρόβλημα του external fragmentation είναι η σύμπτυξη μνήμης(storage compaction) που συνδέει όλους τους άδειους χώρους της ΚΜ σ' ένα συνεχόμενο διαμέρισμα της ΚΜ. π.χ. Σπάνια όμως χρησιμοποιείται επειδή απαιτεί χρονοβόρο memory-to-memory copying (CPU time).
ΔΜ με Μεταβαλλόμενα διαμερίσματα Πόση μνήμη ανατίθεται σ' ένα process; • Η δυσκολία έγκειται στο ότι συνήθως το μέγεθος ενός process μεταβάλλεται κατά την εκτέλεσή του. Ένα process έχει τρία τμήματα: - text: το object code («εκτελέσιμο»)- δεν μεταβάλλεται - data: τα δεδομένα -μεταβάλλεται [βλ. malloc()] - stack: το stack επίσης μεταβάλλεται Το data τμήμα μεγαλώνει προς το stack και αντίστροφα. • Προσέξτε: αν δίναμε ακριβώς όσο χώρο χρειάζεται ένα process όταν εισέρχεται στη μνήμη, τότε θ' απαιτείται mem-to-mem αντιγραφή για να μεταφέρουμε ένα process που μεγαλώνει σε κάποιο άλλο διαμέρισμα.
Διαχείριση Μνήμης Θεμελιώδες θέματα είναι: • ποιά είναι τα άδεια διαμερίσματα της μνήμης; • ποιο process κατέχει ποιο διαμέρισμα της μνήμης; Οι απαντήσεις σ' αυτά τα ερωτήματα δίνονται χρησιμοποιώντας εναλλακτικούς τρόπους, π.χ.: • Bit Maps: χάρτες ψηφίων που περιέχουν ένα bit για κάθε διαμέρισμα. Π.χ., αν ΒΜ[Ι] = 1 το διαμέρισμα Ι είναι ελεύθερο. • Linked Lists: λίστες των οποίων οι κόμβοι αντιστοιχούν σε διαμερίσματα. • Buddy Systems: βασίζεται σε διαφορετικές λίστες, οι κόμβοι των οποίων αντιστοιχούν σε διαμερίσματα των οποίων το μέγεθος είναι διαφορετικές δυνάμεις του 2.
ΔΜ με Bit Maps • Η κύρια μνήμη χωρίζεται σε "μονάδες ανάθεσης" (allocation units) των οποίων το μέγεθος είναι λίγα bytes ή λίγα Kbytes. Το μέγεθος των μονάδων ανάθεσης είναι σταθερό. • Σε κάθε μονάδα ανάθεσης αντιστοιχεί ένα bit στο Bit Map. Αν η Ι θέση είναι 1, τότε η μονάδα ανάθεσης Ι δεν χρησιμοποιείται από κανένα process. • Όσο πιο μεγάλο είναι το μέγεθος των μονάδων ανάθεσης τόσο πιο μικρό είναι το Bit Map. • Μεγάλες μονάδες ανάθεσης έχουν σαν αποτέλεσμα σπατάλη χώρου, λόγω internal fragmentation (η τελευταία μονάδα ανάθεσης δεν θα χρησιμοποιείται όλη). • Πλεονέκτημα bit maps: η απλότητα τους (ευκολία υλοποίησης). • Μειονέκτημα bit maps: κόστος ανάθεσης -- πρέπει να βρεθούν στο Bit Map αρκετά συνεχόμενα 1 - μια χρονοβόρα διαδικασία.
ΔΜ με Linked Lists • Στην πιο απλή μορφή τους, κάθε κόμβος αντιστοιχεί σε διαμέρισμα που είτε χρησιμοποιείται από κάποιο process, είτε είναι "ελεύθερο" διαμέρισμα. • Τα πεδία ενός κόμβου είναι: 1 ψηφίο (διεργασία ή οπή ;), 1 αριθμός (αρχική διεύθυνση του διαμερίσματος), 1 αριθμός (μέγεθος του διαμερίσματος), 2 δείκτες (στον προηγούμενο και επόμενο κόμβο). • Οι κόμβοι της λίστας είναι ταξινομημένοι με βάση τη διεύθυνση του 1ου byte του διαμέρισματος που αντιπροσωπεύουν. Η ταξινόμηση βοηθά στη διαχείριση: • όταν ένα process τελειώσει ή γίνει swapped out η ενημέρωση της λίστας είναι γρήγορη: πρέπει να εξεταστούν ο επόμενος και ο προηγούμενος κόμβος της λίστας ούτως ώστε να επιτευχθεί η συγχώνευση των (πιθανών) άδειων τμημάτων (οπών --holes) - δηλ. ≥ 2 συνεχόμενα holes (άδεια διαμερίσματα) να συγχωνευθούν σ' ένα.
Αλγόριθμοι Ανάθεσης Μνήμης σε Διεργασίες • Εκτελούνται κατά τη διάρκεια δημιουργίας ενός process ή κατά το swap in ενός process. • Μέθοδος First-Fit: Βρίσκει την πρώτη οπή (hole) όπου χωράει το process. • Μέθοδος Next-Fit: Σαν το first-fit, μόνο που ξεκινά το ψάξιμο από την προηγούμενη οπή που βρήκε την προηγούμενη φορά που έτρεξε. • Μέθοδος Best-Fit: Βρίσκει την οπή με το μικρότερο εσωτερικό κατακερματισμό. • Μέθοδος Worst-Fit: Βρίσκει την οπή με το μεγαλύτερο εσωτερικό κατακερματισμό.
Αλγόριθμοι Ανάθεσης Μνήμης σε Διεργασίες: Σύγκριση • Η Best-Fit είναι πιο αργή μέθοδος, προφανώς, από τη first-fit γιατί απαιτεί περισσότερη αναζήτηση. • Το best fit έχει χαμηλότερο «memory utilization» (δηλ. υψηλότερη σπατάλη μνήμης) σε σχέση με το first fit. Αυτό εξηγείται διότι το best fit έχει την τάση ν' αφήνει πολύ μικρές «οπές» όπου δε μπορούν να χωρέσουν διεργασίες. • Η βασική ιδέα του Worst Fit είναι ν' αφήνει όσο το δυνατόν μεγαλύτερα διαμερίσματα προς μελλοντική χρησιμοποίηση. Πειραματικά, όμως, έχει αποδειχθεί ότι το worst fit δεν είναι αποδοτικό. • Ένας τρόπος να αυξηθεί η επίδοση των παραπάνω αλγορίθμων ανάθεσης είναι να χρησιμοποιούνται 2 διαφορετικές λίστες, μια με διεργασίες και μια με οπές (αυτό όμως αυξάνει το κόστος όταν ένα process τελειώνει ή γίνει swapped out). • Αν η λίστα των οπών είναι ταξινομημένη με βάση το μέγεθος, τότε best fit & first fit είναι περίπου εξίσου αποδοτικές μέθοδοι.
Αλγόριθμοι Ανάθεσης Μνήμης σε Διεργασίες Ο αλγόριθμος quick fit: • κρατά πολλές λίστες οπών, η κάθε μια αντιπροσωπεύει οπές με διαφορετικά μεγέθη. • έτσι η ανάθεση γίνεται γρήγορα (βρίσκεται πολύ γρήγορα μια οπή ενός συγκεκριμένου μεγέθους). • το μειονέκτημά του έγκειται στο ότι, όταν ένα process τελειώσει ή γίνει swapped out, τότε είναι πιο χρονοβόρο ν' εξετασθούν οι περιπτώσεις για συγχώνευση οπών.
4.3 Εικονική Μνήμη (Virtual Memory) • Τί γίνεται όταν • Διεργασίες είναι μεγαλύτερες της ΚΜ; Δηλαδή το σύνολο των μεγεθών των text, data και stack υπερβαίνει το μέγεθος της ΚΜ; ή • Το σύνολο των διεργασιών που τρέχουν (βλέπε πολυπρογραμματισμό) απαιτούν χώρο μεγαλύτερο της Κ.Μ.; • Η λύση είναι η τεχνική εικονικής μνήμης(virtual memory): Το Λ.Σ. κρατά μερικά διαμερίσματα ενός process στη ΚΜ ενώ άλλα διαμερίσματα βρίσκονται στο swap space. • Συνήθως λίγα κομμάτια του text, data & stack είναι στη Κ.Μ. Αυτά τα κομμάτια αφορούν τις εντολές, και δεδομένα που χρειάζονται άμεσα καθώς και αυτά που αναμένεται να χρησιμοποιηθούν στο εγγύς μέλλον. • Έτσι, αυτό που γίνεται swap in & out είναι κομμάτια των text, data, stack τμημάτων ενός process, και όχι ολόκληρες διεργασίες.
4.3.1 Σελιδοποίηση (PAGING) • Μια τεχνική υλοποίησης εικονικής μνήμης. • Η έννοια της σελίδας (Page) αναφέρεται στο κομμάτι εκείνο ενός process που γίνεται swapped in & out - δηλαδή είναι η μονάδα εναλλαγής. [Χρησιμοποιούνται οι έννοιες pagein & pageout] • Το σύνολο των διευθύνσεων μνήμης που παράγονται κατά την εκτέλεση ενός προγράμματος αποτελεί ένα χώρο διευθύνσεων (address space). Επειδή, στη γενική περίπτωση, αυτό είναι μεγαλύτερο της ΚΜ, δεν μπορεί να υπάρξει μονοσήμαντη αντιστοιχία μεταξύ μιας διεύθυνσης που παράγει ένα πρόγραμμα και μιας φυσικής διεύθυνσης (physical address). Ακόμα περισσότερο όταν η ΚΜ διαμοιράζεται σε πολλές διεργασίες! διευθύνσεις που παράγονται από ένα πρόγραμμα λέγονται εικονικές διευθύνσεις (virtual addresses) χώρο εικονικών διευθύνσεων (virtual address space).
4.3.1 Σελιδοποίηση • Χωρίς εικονική μνήμη, συνεπώς, ότι διεύθυνση παράγεται θα δίνεται στο memory bus το οποίο προσπελαύνει την διεύθυνση (μετά ίσως από χρήση των καταχωρητών ορίου/βάσης). • Με εικονική μνήμη, απαιτείται η παραγόμενη διεύθυνση να "μεταφραστεί" πριν δοθεί στο memory bus. Αυτή η μετάφραση γίνεται από ειδικό hardware (memory management unit -- MMU). • Το virtual address space διαιρείται σε μονάδες μνήμης που λέγονται σελίδες (pages). • Αντίστοιχα, η φυσική μνήμη διαιρείται σε πλαίσια σελίδων (page frames) • Σελίδες και πλαίσια σελίδων έχουν το ίδιο μέγεθος -- [συνήθως από 512 bytes μέχρι 8 K bytes). • Η κάθε σελίδα όταν χρειαστεί (pagein) αποθηκεύεται σε ένα πλαίσιο σελίδας.
4.3.1 Σελιδοποίηση • Παράδειγμα: Θεωρείστε έναν Η/Υ με 16-bit διευθύνσεις (δηλ. virtual address space = 64K), με 32 ΚΒ μνήμη και με μέγεθος σελίδας = 8K • Το MMU μεταφράζει τις παραγόμενες διευθύνσεις ως εξής: 0-8K 8K-16K 8K-16K ; 16Κ-24Κ 0K-8K 24K-32K ; κ.ο.κ Τα ερωτηματικά σημαίνουν ότι απαιτείται page in.
Σφάλμα Σελίδας • Όταν το MMU βρίσκει ότι η σελίδα που περιέχει τη ζητούμενη διεύθυνση δεν υπάρχει στην Κ.Μ., τότε κάνει ένα trap στο Λ.Σ. Αυτό το trap ονομάζεται σφάλμα σελίδας -- page fault. • Το Λ.Σ. εξυπηρετεί ένα page fault ως εξής: • από κάποιες δομές που διαχειρίζεται για το process που τρέχει, βρίσκει πού υπάρχει αυτή η σελίδα στο swap space. • Αν η ΚΜ είναι γεμάτη, βρίσκει μια σελίδα που βρίσκεται ήδη στη Κ.Μ. (συνήθως την λιγότερο χρησιμοποιημένη) – «θύμα». • Αν η σελίδα θύμα έχει ενημερωθεί, τότε την γράφει στη θέση της στο swap space. Γιατί; • Κατόπιν, φέρνει την ζητούμενη σελίδα στο πλαίσιο σελίδας (frame) που ελευθερώθηκε.
Σφάλμα Σελίδας • Κατόπιν ενημερώνει το χάρτη μνήμης (memory map). Δηλαδή: • την εγγραφή που δείχνει στο πλαίσιο που χρησιμοποιήθηκε - δηλ. την εγγραφή της σελίδας «θύμα»: να δείχνει πλέον ότι αυτή η σελίδα δεν είναι χαρτογραφημένη και • την εγγραφή της ζητούμενης σελίδας, ώστε να δείχνει το κατάλληλο πλαίσιο. • Τέλος, ξανακαλείται η εντολή που προκάλεσε το σφάλμα σελίδας (trap).
Η μετάφραση virtual physical • Στο παράδειγμα μας, κάθε εικονική διευθυνση έχει 16 ψηφία. • Αφού η σελίδα είναι 8Κ απαιτούνται 13 bits για τις διευθύνσεις των bytes μέσα στη σελίδα (offset). • Με 64Κ virtual address space και 8Κ σελίδες μπορούμε να έχουμε 8 σελίδες εικονικών διευθύνσεων 3 bits για να προσδιορίσουμε την εικονική σελίδα.
Η μετάφραση virtual physical • Τα 3 πρώτα bits ενός virtual address ορίζουν τηνεικονική σελίδα, και • τα υπόλοιπα 13 bits ορίζουν ένα byte μέσα στη σελίδα. Αν η 6η εικονική σελίδα τοποθετηθεί στο πλαίσιο 3, τότε η μεταφρασμένη διεύθυνση (physical) είναι: • η διεύθυνση στη θέση του πίνακα 110000000000000 + • 00οοοοοοοοοοοοο , • όπου το «οοο...ο» είναι το 13-αψήφιο offset. • Το αποτέλεσμα είναι 15 bits.
4.3.2 Πίνακες Σελίδων (Page Tables) • Στην ουσία, οι πίνακες σελίδων είναι αυτό που έχουμε ονομάσει έως τώρα χάρτες μνήμης (memory maps). Η λειτουργία τους δηλ. είναι η ίδια: • Μία εικονική διεύθυνση χωρίζεται σε εικονικό αριθμό σελίδας (virtual page number) (σημαντικά ψηφία) και offset (low-order bits). • Ο εικονικός αριθμός σελίδαςχρησιμοποιείται σαν δείκτης θέσης στο PT. • (ίσως μετά από page fault) ο αριθμός πλαισίου στην εγγραφή του PT αποτελεί τα σημαντικά ψηφία που αντικαθιστούν τα σημαντικά ψηφία του virtual page number. • Μόλις προσθέσουμε σε αυτά το offset, παράγεται η σωστή φυσική διεύθυνση -- physical address.
4.3.2 Πίνακες Σελίδων (PTs) Προκύπτουν όμως 2 σημαντικά προβλήματα: • Μέγεθος: Τα PTs μπορεί να είναι πολύ μεγάλα. Σημειώστε ότι κάθε process έχει δικό του PT! • Η λειτουργία πρέπει να είναι πολύ γρήγορη γιατί χρησιμοποιείται για κάθε διεύθυνση που παράγεται! • Αναλογιστείτε ότι σχεδόν όλα τα μοντέρνα συστήματα έχουν ≥32-bit διευθύνσεις > 4GB virtual addr. space. Αν page size = 4KΒ το κάθε PT έχει 1M εγγραφές • Επίσης, λόγω του μεγέθους των, οι πίνακες σελίδων αποθηκεύονται στην (καλύτερη περίπτωση στην) Κ.Μ. (όχι σε registers) διπλασιάζονται οι προσβάσεις στη ΚΜ που απαιτούνται για να εκτελεστεί μια εντολή ...! • Συνήθως λύσεις άλλοτε βασίζονται σε καταχωρητές υλικού για το mapping ή σε τεχνικές που "μικραίνουν" το μέγεθος των ΠΣ.
Πολυ-επίπεδοι Πίνακες Σελίδων • Μια τεχνική που αποσκοπεί στο να τμηματοποιήσει το PT (που είναι πολύ μεγάλο) έτσι ώστε να απαιτούνται λίγα (και μικρά) διαμέρισματά του στη ΚΜ σε κάθε στιγμή. Παράδειγμα: 32-bit διευθύνσεις και Πίνακες 2 επιπέδων Τα 10 bits του PT1 ορίζουν ένα PT με 1024 εγγραφές. Κάθε μια δείχνει σ' ένα άλλο PageTable (στο 2ο επίπεδο) στη Κ.Μ. Ετσι η τιμή του PT1 χρησιμοποιείται ως δείκτης θέσης στο PT1, η εγγραφή του οποίου οδηγεί σ' ένα PT στο 2ο επίπεδο.
Πολυ-επίπεδοι Πίνακες Σελίδων • Τα 10 ψηφία “PT2” χρησιμοποιούνται ως index στο PT που βρέθηκε στο προηγούμενο βήμα. • Η εγγραφή στο 2ο PT δείχνει στο πλαίσιο της ΚΜ για τη ζητούμενη σελίδα. • Το 12-bitoffset χρησιμοποιείται για να βρεθεί το κατάλληλο byte στο πλαίσιο σελίδας που δείχνει το PT2.
Πολυ-επίπεδοι Πίνακες Σελίδων Στο παράδειγμα: • Κάθε σελίδα είναι 4KB (αφού offset είναι 12 bits) • Κάθε PT στο 2ο επίπεδο αναπαριστά (χαρτογραφεί) 4MB • Το PT στο 1ο επίπεδο αναπαριστά 4GB (32 bits-> 4 GB). Έτσι αν τα text, data, και stack διαμερίσματα του process είναι το καθένα <=4ΜΒ τότε χρειαζόμαστε να έχουμε στη κύρια μνήμη μόνο 3 PTs του 2ου επιπέδου. Αφού το text διαμέρισμα δεν μεγαλώνει, τότε η ανάθεση εικονικών διευθύνσεων στο process μπορεί να γίνει ως εξής: • 0-4MB text • 4MB - 8MB data • τα τελευταία 4ΜΒ stack (μεγαλώνει "προς τα κάτω") θα χρειαστούν περισσότερα PTs στη KM μόνο αν το data ή το stack διαμέρισμα μεγαλώσει πάνω από 4ΜΒ το καθένα.
Κρυφή Μνήμη για τους Πίνακες (PAGETABLECACHES / TLB ) • Αφού τα PTs είναι πολύ μεγάλα για να χωρέσουν σε CPUregisters, πώς μπορούμε να μειώσουμε το κόστος πρόσβασης σ' αυτά (στη ΚΜ) ; • Η απάντηση βασίζεται στη χρήση συσχετιστικής μνήμης (associativememory) που λειτουργεί σαν «κρυφή μνήμη» ή «προσωρινή μνήμη» (cache). • Η θεμελιώδης παρατήρηση είναι ότι η συμπεριφορά των περισσότερων προγραμμάτων είναι τέτοια ώστε να παρατηρούνται μεγάλοι αριθμοί αναφορών σε λίγες σελίδες (που αλλάζουν αργά με το πέρασμα του χρόνου) π.χ. - όλες οι εντολές σε μια σελίδα εντολών (βλέπε loops). • Έτσι χρησιμοποιείται ειδικό υλικό που αποτελείται από καταχωρητές το σύνολο των οποίων καλούνται TLB -- translationlookasidebuffer. Ο αριθμός αυτών των registers είναι μικρός (π.χ. ≤ 64).
Κρυφή Μνήμη για τους Πίνακες (PAGETABLECACHES / TLB ) • Ο κάθε καταχωρητής έχει την ίδια πληροφορία που υπάρχει σε μια καταχώρηση του ΠΣ και επιπλέον έχει και τον εικονικό αριθμό σελίδας. • Η MMU εξετάζει πρώτα αν η ζητούμενη εικονική σελίδα βρίσκεται στην κρυφή μνήμη TLB (όλοι οι registers εξετάζονται παράλληλα). • Αν ναι, τότε αποφεύγεται η πρόσβαση του PT στη ΚΜ. • Αν όχι, τότε προσπελαύνεται το PT και η κατάλληλη PT εγγραφή αντικαθιστά κάποια άλλη στην TLB. • Σε μερικές σύγχρονες μηχανές, η διαχείριση σφαλμάτων στη TLB γίνονται από το ΛΣ. • Προσέξτε ότι • αν δρομολογηθεί άλλη διεργασία (process/contextswitch), τότε θα πρέπει να "μηδενισθεί" η PT cache ! • Η έννοια και χρήση κρυφής μνήμης είναι καθοριστικής σημασίας για Συστήματα Λογισμικού !
Η Δομή των Εγγραφών των ΠΣ • Συνήθως η ακριβής δομή εξαρτάται από τη μηχανή. Αλλά, οι πιο πολλές εγγραφές έχουν τις εξής πληροφορίες: • Προστασία -- Protectionbits: ορίζουν αν η σελίδα αυτή μπορεί να γίνει read/write/execute • Ενημέρωση; -- Modifybit: δηλώνει αν έχει ενημερωθεί η σελίδα από τότε που ήρθε στη ΚΜ. • Αναφορές; -- Referencebits: δηλώνουν πόσες φορές το τελευταίο χρονικό διάστημα έγινε αναφορά σ' αυτή τη σελίδα. • Παρούσα; -- Presentbit: δηλώνει αν η σελίδα βρίσκεται στη ΚΜ. • Δείκτης πλαισίου -- PageFramebits: ορίζουν σε ποιο frame της ΚΜ βρίσκεται αυτή η σελίδα.
Η Δομή των Εγγραφών των Πινάκων Σελίδων • Προσέξτε ότι η διεύθυνση της σελίδας στο swapspace (δίσκο) δεν βρίσκεται στην εγγραφή του PT... • Modifybit: χρησιμοποιείται όταν αποφασίζεται να εκδιωχθεί μια σελίδα απ' την ΚΜ για να ελευθερωθεί χώρος για μια άλλη σελίδα. • Αν το bit αυτό είναι 1, τότε η σελίδα γράφεται στο swapspace - αλλιώς δεν χρειάζεται αυτή η εγγραφή στο δίσκο – μια χρονοβόρα εντολή. • Referencebit: Χρησιμοποιείται για ν' αποφασιστεί ποια σελίδα ("θύμα") θ' αντικατασταθεί. • Το πρόσφατο παρελθόν, οδηγός του μέλλοντος ...
Ανεστραμμένοι ΠΣ (inverted PTs) • Αν ο χώρος εικονικών διευθύνσεων είναι πολύ μεγάλος, (πχ 264) οι ΠΣ πρέπει να είναι εξαιρετικά μεγάλοι (πχ 252 εγγραφές για πλαίσια μεγέθους 4ΚΒ). απαιτείται άλλη προσέγγιση! • Οι ανεστραμμένοι πίνακες είναι μια λύση: • Υπάρχει ένας μόνο ΠΣ, με μια εγγραφή για κάθε πλαίσιο, που δείχνει ποια σελίδα ποιας διεργασίας φιλοξενεί (πχ 218 εγγραφές). • Σε κάθε αναφορά μνήμης, δηλαδή σε εικονική σελίδα, χρησιμοποιείται μια συσκευή TLB, όπως πριν. • Αν δε βρεθεί στη TLB, για να βρούμε αν υπάρχει η σελίδα στη μνήμη γρήγορα, χρησιμοποιείται ένα πίνακας κατακερματισμού (hash table): • Κάθε φορά που εισέρχεται μια σελίδα στη μνήμη, με βάση τον αριθμό εικονικής σελίδας, εισέρχεται και στον πίνακα κατακερματισμού.Επίσης, πρέπει να ενημερώνεται και η TLB.
Ανεστραμμένοι ΠΣ (inverted PTs) Εικ. Χώρος Διευθ. Δ1 Πίνακας Κατακερματισμού Ανεστρ. Πίνακας Εικ. Διευθ. Δ1 Εικ. Χώρος Διευθ. Δ2
4.3.3 Αντικατάσταση Σελίδων (Page Replacement) • Όταν σημειώνεται ένα σφάλμα σελίδας τότε το Λ.Σ. πρέπει (μερικές φορές - αν δεν υπάρχει ελεύθερο πλαίσιο) να διαλέξει μια σελίδα (victim) "θύμα" που θα αντικατασταθεί από την ζητούμενη σελίδα. • Αν το "θύμα" είναι «βρώμικο» (dirty) (δηλ. έχει ενημερωθεί όσο ήταν στη Κ.Μ.) τότε το Λ.Σ. πρέπει να την ξαναγράψει πάλι στο swapspace. Μια σελίδα είναι dirty αν η εγγραφή στο ΠΣ που δείχνει σ' αυτήν έχει το ψηφίο M = 1. • Προφανώς η απόδοση του συστήματος είναι καλύτερη αν το "θύμα" δεν είναι μια πολυ-χρησιμοποιημένη σελίδα. • Το μεγάλο πρόβλημα κόστους πηγάζει από την ανάγκη πρόσβασης στο δίσκο για αντικατάσταση σελίδων – μια χρονοβόρα διαδικασία!
4.3.3 Αντικατάσταση Σελίδων Η βέλτιστη στρατηγική: • Αν ξέραμε μετά από πόσο χρόνο (π.χ. αριθμό εντολών) η κάθε σελίδα στη ΚΜ θα επαναπροσπελαστεί, τότε μπορούμε να διαλέξουμε σαν θύμα τη σελίδα που δε θα χρειαστεί για το μεγαλύτερο χρονικό διάστημα. • Όμως, γενικά σε πραγματικά συστήματα, τέτοιου είδους πληροφορία δεν υπάρχει, ούτε μπορεί να παραχθεί. • Σε μερικές περιπτώσεις είναι δυνατόν να υποβληθεί ένα πρόγραμμα σε κάποιο είδους «ανιχνευτή» («tracer») το οποίο καταχωρεί την συμπεριφορά του προγράμματος αναφορικά με τις προσπελάσεις σε σελίδες. • Αυτή η πληροφορία χρησιμοποιείται όταν το πρόγραμμα τρέχει πραγματικά και έτσι μπορούμε να υλοποιήσουμε τη βέλτιστη στρατηγική.
Ο Αλγόριθμος Not Recently Used • Συνοπτικά, αυτή η μέθοδος διαλέγει σαν θύμα μια σελίδα που δεν έχει χρησιμοποιηθεί πρόσφατα. • Πρέπει λοιπόν να υπάρχουν πληροφορίες σχετικά με το πόσο πρόσφατα χρησιμοποιήθηκε η κάθε σελίδα. Στον αλγόριθμο NRU χρησιμοποιούνται τα R και Μ ψηφία που συνήθως υπάρχουν στις εγγραφές των PageTables: • Το R γίνεται ένα όταν η αντίστοιχη σελίδα προσπελαύνεται. • Το Μ γίνεται 1 όταν η αντίστοιχη σελίδα ενημερώνεται. • Τις ενημερώσεις των R, Mbits τις κάνει συνήθως το hardware.
Ο Αλγόριθμος Not Recently Used Αλγόριθμος NRU • Όταν αρχίζει ένα process τότε όλα τα R, Mbits των εγγραφών του PT παίρνουν την τιμή 0. • Σε κάθε clockinterrupt το Rbit γίνεται πάλι 0. Έτσι αν εξετάσουμε μια PT εγγραφή και δούμε το R = 1 ότιυπήρξε αναφορά σ' αυτή τη σελίδα μετά το τελευταίο clocktick. • Όταν σημειώνεται ένα pagefault: Το Λ.Σ. χρησιμοποιεί 4 κατηγορίες σελίδων με βάση τις τιμές των R & Mbits. • Το Λ.Σ. διαλέγει σαν θύμα μια από τις σελίδες στην κατώτερη κατηγορία. • Γιατί προτιμάει θύματα από Κ1 και όχι από Κ2; • Ο NRU είναι απλός, και έχει καλή απόδοση.
Αλγόριθμοι βασισμένοι σε FIFO: Δεύτερη Ευκαιρία • Προφανώς η "καθαρόαιμη" FIFO στρατηγική έχει προβλήματα. Γιατί ; O Αλγόριθμος Δεύτερης Ευκαιρίας (Second - Chance) • Βασίζεται στη στρατηγική FIFO: εξετάζει σελίδες αρχίζοντας από την πιο παλιά. • Αλλά, αντί να αντικαθιστά την πιο παλιά σελίδα, εξετάζει το Rbit. • Αν R=0 τότε την αντικαθιστά. Αν R = 1 τότε • κάνει το bit R = 0 • η σελίδα τοποθετείται στο τέλος της λίστας (δηλ. "βαφτίζεται" σαν η πιο πρόσφατη σελίδα στη ΚΜ) • η αναζήτηση θύματος συνεχίζεται στην επόμενη πιο παλιά σελίδα. Αν R=1 για όλες τις σελίδες, τότε second-chance είναι στην ουσία FIFO (Γιατί ;)
Αλγόριθμοι βασισμένοι σε FIFO: Ρολόι O Αλγόριθμος «Ρολόι» (Clock) • Το σημαντικότερο μειονέκτημα του second-chance είναι ότι συνεχώς ενημερώνει την λίστα - χρονοβόρα διαδικασία. • Στον αλγόριθμο Ρολόι, οι σελίδες-πλαίσια οργανώνονται σ' ένα μια κυκλική λίστα που προσομοιώνει ένα ρολόι, δηλαδή υπάρχει ένας δείκτης που δείχνει στην πιο παλιά σελίδα. • Όταν σημειώνεται ένα pagefault: • εξετάζεται η σελίδα που δείχνει ο δείκτης: • Αν R=0, τότε αυτή είναι το θύμα & ο δείκτης προωθείται να δείχνει στην επόμενη σελίδα. • Αν R=1, τότε R 0 & ο δείκτης δείχνει στην επόμενη σελίδα και η αναζήτηση συνεχίζεται.
Ο Αλγόριθμος Least-RecentlyUsed (LRU) Βασική ιδέα: • σελίδες που προσπελάστηκαν στο πρόσφατο παρελθόν θα επανα-προσπελασθούν και στο εγγύς μέλλον (και αντιστρόφως). Έτσι, • το θύμα είναι η σελίδα που δεν έχει χρησιμοποιηθεί για το μεγαλύτερο χρονικό διάστημα. • Μια προσέγγιση υλοποίησης είναι με μια λίστα όλων των σελίδων στη ΚΜ με την πιο-πρόσφατα-χρησιμοποιημένη σελίδα στην κορυφή της λίστας και την LRU σελίδα στο τέλος. • Απλή μέθοδος, αλλά η λίστα χρειάζεται ενημέρωση σε κάθε αναφορά στη μνήμη (που γίνεται > 1 φορές για κάθε εντολή) το κόστος είναι απαγορευτικό!
Ο Αλγόριθμος Least-RecentlyUsed (LRU) • Μια προσέγγιση αποφυγής του παραπάνω κόστους είναι να χρησιμοποιηθεί ειδικό hardware. • Μια μέθοδος χρησιμοποιεί έναν 64-bitcounter η τιμή του οποίου αυξάνεται σε κάθε εντολή. • Επίσης, κάθε εγγραφή του PT έχει 64 bits παραπάνω, έτσι ώστε μετά από κάθε αναφορά σε μια σελίδα της ΚΜ η τιμή του counter να αποθηκεύεται στην αντίστοιχη εγγραφή του PT. η μέθοδος διαλέγει σαν θύμα την σελίδα της οποίας η εγγραφή στο PT έχει την μικρότερη τιμή του counter. • Το παραπάνω ειδικό h/w κοστίζει, φυσικά, και μπορεί να μην υπάρχει/προσφέρεται από κάποιο σύστημα. Ετσι πολλοί σχεδιαστές Λ.Σ. καταφεύγουν σε λύσεις softwareμε τις οποίες προσπαθούν να προσομοιώσουν την στρατηγική LRU.
Μια προσομοίωση του LRU είναι Not-Frequently-Used (NFU) • Με κάθε σελίδα συνδέεται και ένας μετρητής (softwarecounter) -- αρχικά έχει την τιμή 0. • Με κάθε clockinterrupt το Λ.Σ. προσπελαύνει όλες τις σελίδες στην Κ.Μ. Για κάθε σελίδα: • o counter «ολισθαίνει δεξιά»(shift right) • η τιμή του counter τότε προσαυξάνεται με την τιμή του R (0 ή 1) της ίδιας σελίδας. • Το R προστίθεται στο πιο σημαντικό ψηφίο του counter. • Όταν σημειώνεται ένα σφάλμα σελίδας, η σελίδα με τη μικρότερη τιμή του μετρητή επιλέγεται σαν θύμα.
Μια προσομοίωση του LRU: Not-Frequently-Used (NFU) • Ο παραπάνω αλγόριθμος είναι μια συγκεκριμένη μορφή NFU που ονομάζεται αλγόριθμος γήρανσης (aging). π.χ.