150 likes | 331 Views
Distributed Data Base. Maryam Razavian Zahra Eidoon. Distributed Database Overview. Transparency استقلال داده های توزیع شده Distributed Transaction Atomicity انواع پایگاه داده توزیع شده همگن غیر همگن (GateWay). ذخیره داده ها در یک سیستم توزیع شده. Fragmentation
E N D
Distributed Data Base Maryam Razavian Zahra Eidoon
Distributed Database Overview • Transparency • استقلال داده های توزیع شده • Distributed Transaction Atomicity • انواع پایگاه داده توزیع شده • همگن • غیر همگن(GateWay)
ذخیره داده ها در یک سیستم توزیع شده • Fragmentation • شکستن یک رابطه به رابطه های کوچکتر • انواع fragmentation • افقی • Select query • عمودی • Projection • Lossless
ذخیره داده ها در یک سیستم توزیع شده • Replication • ذخیرهکپی های متعددی از یک رابطه و یا یک Fragment از یک رابطه. • افزایش دسترس پذیری داده • کاهش تهدید از بین رفتن کانال ارتباطی • بالا رفتن سرعت اجرای query • وجود کپی محلی از داده ها • Increased parallelism
نامگذاری در پایگاه داده توزیع شده • نام گذاری اشیاء • Global Unique ID by name server • Global relation name + replica ID • استقلال داده توزیع شده • در هنگام اجرای query نام کامل رابطه را مشخص نکنیم
تراکنش های توزیع شده • تراکنش توسط مدیر تراکنشها به زیر تراکنشهایی تقسیم می شود • هر زیرتراکنش در یک سایت اجرا می شود • Distributed Recovery • Commit Protocols • 2phase protocol • 3phase protocol
Commit Protocol • 2PC • فاز یک :تصمیم گیری • فاز دو :ثبت تصمیم • Handling of Failures • Site failure • Coordinator failure • Network partition
Commit Protocol(Cont) • 3PC • فاز یک : تصمیم گیری • فازدو:Pre_commit decision • فاز سه : فرستادن پیغامهایCommit / Abort
The dangers of Replication and a solution • به روز رسانی داده های Replicate • دسترس پذیری بالاتر • کارایی بالا تر • انواع Replication • Lazy replication • Eager replication
The dangers of Replication and a solution • Eager Replication • تمامی replica ها در یک تراکنش به روز رسانیده می شوند • با هم سنکرون هستند • تبادل پیغام با هم زیاد => کارایی پایین • زمان پاسخ تراکنش بالا تر • قبل از Commit باید تقاضای lock بین تمامی سایتها پخش شود و بعد lock ها تخصیص داده شوند
The dangers of Replication and a solution • Lazy Replication • آسنکرون است • پس از commitتراکنش بین سایتها پخش می شود • استقلال داده توزیع شده تهدید می شود • کارایی بالاتر
مقدمه ای بر DataWarehouse • جمع آوری اطلاعات از پایگاههای داده غیر همگن • ذخیره سازی آنها به عنوان داده های چند بعدی • استفاده از آنها در سیستم های تصمیم گیری • حجم اطلاعاتی بالا(حدود ترا بایت) • پاسخ به query پیچیده در زمان کم • DBMS توزیع شده با دسترس پذیری و scalability بالا • طراحی شمایی با قابلیت بالا • پوشیده ساختن تفاوتها • استفاده از materialized view
Data Ware House • باید بتوانیم رد داده هایی که به تازگی ذخیره شده اند را بگیریم • Metadata Repository • مراحل طراحی • تحلیل نیاز ، طراحی مفهومی ، طراحی شمای Dimentional • مباحث کلی • MultiDimentional data models • Materialization of views • Index Selection • Design Issues
Reducing the blocking in two-phasecommit with backup sites • Commit protocol • Two-phase Commit • Quorum based three-phase commit • The backup commit protocol • The BC protocol • Termination Protocol • Recovery protocol for the coordinator • Backup site failure and network partitioning
منابع • Panos Vassiliadis, Christoph Quix, Yannis Vassiliou, Matthias Jarke "DATA WAREHOUSE PROCESS MANAGEMENT",2000 • Matteo Golfarelli , Stefano Rizzi " Designing the Data Warehouse: Key Steps and Crucial Issues",1999 • Jim Gray ,Pat Helland, Patrick O'Neil,Dennis Shasha "Dangers of replication and a solution",1996