70 likes | 237 Views
File Organization. Indexed-Sequential File Introduction. Thanks to Tamar Barnes. (3) Index-Sequential (IS) file. r p. קובץ/שטח אינדקס. קובץ/שטח גלישה. קובץ/שטח ראשי. קבצי ראשי וגלישה יחדיו שומרים על הסדרתיות כאשר קובץ אינדקס אמור לאפשר גישה ישירה.
E N D
File Organization Indexed-Sequential File Introduction Thanks to Tamar Barnes A. Frank
(3) Index-Sequential (IS) file r p קובץ/שטח אינדקס ... קובץ/שטח גלישה קובץ/שטח ראשי • קבצי ראשי וגלישה יחדיו שומרים על הסדרתיות כאשר קובץ אינדקס אמור לאפשר גישה ישירה. • בשטח/קובץ ראשי (שטח A): שרשור ברמת הגוש. • בשטח/קובץ גלישה (שטח בלתי תלוי): שרשור ברמת הרשומה. A. Frank
IS file implementation אינדקס אב x פנימי גישות אינדקס - יורדים x רמות ואז יש גישה ישירה לשטח הראשי חיצוני 3 שדה מצביע שמאפשר הארכה מלאכותית של הגוש, מבחינת מספר הרשומות ששייכות אליו 2 1 p 18 19 20 24 27 29 שטח גלישה שטח ראשי, ממוין 30 39 A. Frank 31 40
Example of IS File Overflow area Social security more data overflow pointer block record no. 110.1 6317-17-075 ^ 11.1 013-47-1234 ^ 5301-14-129 110.2 ^ 028-18-2341 111.1 11.2 1701-43-676 ^ 110.3 11.3 3415-15-128 110.2 111.1 5340-76-063 110.1 12.1 ^ 134-01-5839 111.2 1901-73-151 ^ 12.2 143-09-0711 111.2 111.3 12.3 156-88-4321 ^ … b-1.1 3177-00-616 ^ block number 9343-89-633 110.3 11 013-47-1234 1. 0314-43-704 ^ 5839-01-134 12 Index … Sequential File (Primary area) key pointer … 1 013-47-1234 b-1.1 3177-00-616 2 2. 3177-00-616 Master Index A. Frank end end
What is the IS idea? • לא רצינו לשנות את השטח הראשי בעת הוספת רשומה חדשה כדי שלא נצטרך לבנות מחדש את שטח האינדקס - את הבעיה הזו פתר שטח הגלישה. • הרשומות שהתווספו בשיטת המפתח הראשון/האחרון תמיד תהיינה הרשומות שצריכות להיכנס אחרי/לפני המפתח של הגוש. • שרשרת גלישה = הרחבה של הרשומות שנמצאות בגוש מסוים, לא כולל שינוי של המפתח הראשון/האחרון, ולכן ההרחבה לא משנה בכניסת האינדקס את מפתח הכניסה(חריג – אם משתנה המפתח הראשון/האחרון בקובץ כולו). A. Frank
What about Reorganization? • סיבות לארגון מחדש: - שרשראות גלישה ארוכות (עלות החיפוש עליהן יקרה מדי). • - שטחי גלישה יחסית מלאים. • - הרבה רשומות מבוטלות. • ארגון מחדש: קוראים את כל הרשומות, כולל אלו שבשטח הגלישה, באופן סדרתי, ויוצרים שטח חדש לקובץ האב ולבסוף יוצרים קובץ אינדקס חדש לכל ההוספות. A. Frank
Informal look at IS • הערכה לא פורמלית של המדדים • מדדים מאופייני קריאה: יחסית יעילים, אבל תלוי • מדדים מאופייני כתיבה: • - עדכון רשומה: זול כי הרשומות הן באורך קבוע ויש עדכוןבמקום. • - הוספה: בעיקר לשטח הגלישה. • - ארגון מחדש: עלות יקרה יחסית. אם לא נעשה ארגון מחדש, זה יעלה לנו בפעולות ההבאה, כישרשראות הגלישה תהיינה יותר ויותר ארוכות. A. Frank