590 likes | 701 Views
台灣百年地震損失與模擬. 講者:財金碩一 R98723067 江易燊 電信碩二 R97942121 林宜鴻 2010/01/06. 大綱. 一、研究動機 二、資料來源 三、模型建立 四、模擬預測 五、研究結果 六、未來展望. 研究動機. 台灣地震損失資料不十分齊全。 現存最完整的損害資料: 中央氣象局的地震災害房屋倒塌數 台灣某年的房價成交金額 希望能用數學模型來描述地震損失 可用於建立地震保險的相關資料 可計算地震保險保費. 資料來源. A. 地震資料. 以 1900~1999 百年來的地震資料為樣本。 來自中央氣象局,共 88 筆
E N D
台灣百年地震損失與模擬 講者:財金碩一 R98723067 江易燊 電信碩二 R97942121 林宜鴻 2010/01/06
大綱 一、研究動機 二、資料來源 三、模型建立 四、模擬預測 五、研究結果 六、未來展望
研究動機 • 台灣地震損失資料不十分齊全。 • 現存最完整的損害資料: • 中央氣象局的地震災害房屋倒塌數 • 台灣某年的房價成交金額 • 希望能用數學模型來描述地震損失 • 可用於建立地震保險的相關資料 • 可計算地震保險保費
資料來源 A. 地震資料 • 以1900~1999百年來的地震資料為樣本。 • 來自中央氣象局,共88筆 • 排除掉短時間內連續餘震(如相差數十秒不到) • 短時間內連續餘震採用損失相加的方式歸類 • 財產損失只計算「房屋」倒塌的損失 • 只計算「全倒+半倒」房屋的損失
資料來源 B. 人口資料 • 以1901~2006百餘年來的人口資料為樣本。 • 1905~1943年人口資料: 來自《臺灣省五十一年來統計提要》 • 1949~2006年人口資料: 來自《台灣社會變遷全記錄》 • 1901~1904年的人口使用外插法估計 • 1944~1948年的人口使用內插法估計
資料來源 C. 房價資料 • 使用2008年Q1~Q4台灣地區房價資料 • 來自內政部地政司全球資訊網 • 使用台灣21個縣市的房價資料 • 將台北市排除 • 每個縣市中,抽取約三分之一人口密度較高的 鄉/鎮/市/區 ex: 台北縣取新店市、中和市,但不取萬里鄉
總體模型 • 一次地震的損失:倒塌房價的總和 • 一段週期間的總損失,如一年:所有地震損失之和 • 為一個複合分配
地震頻率 • 地震發生頻率之模型建立 • 統計直觀而言,在連續的時間內發生的不連續事 件(地震),應該會呈現一Poisson分佈。 • Question:Poisson的時間區間該取多大? • Poisson:計算某段時間區間內發生特定事件的次 數,即為觀察到的λ!
地震頻率 • 思考: • 取時間區間為一年,似乎很符合直觀 • 但考慮地震發生的特性,可能兩三年才會發生一 次災難性地震,若取一年期為觀察區間,容易觀 察到太多0次的樣本,而影響到後續的參數分析 • 故取時間區間為兩年,會比一年來得好 • 即Poisson分佈中的λ≡每兩年期間內發生地震的 總次數。
地震頻率模型 • Chi-Square檢定 檢定離散分配中,已分組樣本與特定離散分配之間的契合度 • X2 = Chi-Square統計量 • Oi = 觀測到的頻率 • Ei = 理論上的頻率
一年期的Poisson地震頻率模型 • 需注意合併資料,直到每組期望值都超過5 • 結果依然不甚理想
兩年期的Poisson地震頻率模型 • 兩年期較為接近Poisson
倒塌房屋 • 全倒的房屋數,大部分為少量居多(如幾十棟),但偶爾會出現龐大的倒塌量(如921大地震倒塌十萬棟以上)。 • 故其累積分配會呈現極端的『Γ』形狀。 • 若先將房屋倒塌數取自然對數,則可得到較為正 常的機率分佈圖,如下頁:
對數倒塌房屋 • 房屋倒塌數的模型建立 • ln(經人口調整後的房屋倒塌數)? • 但若該次地震倒塌0棟房子,則取ln後會出問題… ∵ln(0)=-∞ • 解決方法: 使用ln(經人口調整後的房屋倒塌數+n),n為我們 選定的一個很小的常數(例如4) • n如何取? 選定3~8的常數,使得K-S值最小(其實差異不大)
對數倒塌房屋模型 • 接前頁之分析,我們以ln(經人口調整後的房 屋倒塌數+n)為主要分析的變數對象 • 令Y=ln(經人口調整後的房屋倒塌數+n) • 則Y會呈現什麼樣的分佈? • Y可能的分佈:Exponential Distribution Lognormal Distribution Weibull Distribution Other Distributions… • 哪一個會最接近資料分布? • 用MLE嘗試可能的模型,並利用畫圖和K-S檢定。
對數倒塌房屋模型 • Kolmogorov–Smirnov test(K-S檢定) • 鑑定樣本資料與某特定分配間的契合度 • K-S檢定統計量= 為樣本資料的累積分配函數 為目標欲鑑定的分配之累積函數
對數房屋倒塌模型分析 Weibull • Weibull分配機率密度函數 • 利用Maximum Likelihood Estimate • K-S檢定: • 對數房屋倒塌模型會滿足Weibull
修正倒塌房屋模型 • 以房屋倒塌數為損失估計的重點 • 1920年倒塌100棟房屋的意義與2008年倒塌100棟 房屋的意義相同嗎? • 假設房屋建築品質具有時間上的同質性 • 則房屋倒塌數明顯需要經過人口密度調整 • 假設台灣面積不變,人口密度的比例即可看成為 總人口數的比例 • 以2006年年底的人口密度為1(基準),其他年份 的人口密度再以比率換算
經人口調整後Weibull模型分析 • Weibull分配機率密度函數 • 利用Maximum Likelihood Estimate • K-S檢定: • 經人口調整後的房屋倒塌模型亦滿足Weibull分配!
房價分配 • 內政部網站上大約有30000筆房屋交易資料, 依前述抽樣方法抽出約10000筆資料 (為何選 取1/3?),檢視其是否合乎特定分配。 • 房價的平均數約為560萬 • 房價的中位數約為450萬 • Claim:房價會是接近一個lognormal的分配
房價分配Lognormal模型 • Lognormal分配機率密度函數: • 利用Maximum Likelihood Estimate:
分配參數回顧 • 分配參數 • 模擬一次代表兩年的損失 • 以 代表一年的損失,符合我們的直覺。
未調整損失模擬討論 • 在100年的模擬中,可以看出只有幾次會發生特別大的損失,前兩次損失佔了百年損失的59.2%,算是符合台灣地震的特性。 • 把模擬次數加到40萬次,則更容易看到一些更極端的損失值。 • 中位數遠小於平均數,極端右偏的損失。 • 如果只考慮VaR,而不考慮CVaR,會遠遠低估後尾所帶來的風險。
調整損失模擬討論 • 調整損失,和非調整損失有類似的特性,右偏分配和可能會有一兩次的極大損失。 • 在調整損失過後,不管是模擬100或40萬次,整體損失會上升數倍。 • 舉40萬次為例,平均損失上升6.95倍,中位數上升4.13倍,CVaR(0.05)和CVaR(0.01)上升7倍,可知越尾端的資料會往上調整的越多。
研究結果 (a) 未經人口密度調整的房屋倒塌模型 (b) 經過人口密度調整的房屋倒塌模型