1 / 21

Finger pattern のブロック化による 陰的 wavelet 近似逆行列前処理の 高速化

Finger pattern のブロック化による 陰的 wavelet 近似逆行列前処理の 高速化. 今倉 暁  曽我部 知広  張 紹良 名古屋大学 大学院工学研究科 計算理工学専攻. Outline. 近似逆行列前処理 Wavelet 近似逆行列前処理 Finger pattern のブロック化 [提案法] 数値実験 ・ 結果 まとめ ・ 今後の課題. 近似逆行列前処理. 最小二乗問題. : M の j 番目の列ベクトル. 完全独立・並列化が容易. : I の j 番目の列ベクトル. 近似逆行列前処理. 偏微分方程式を離散化した際の線形方程式

kamana
Download Presentation

Finger pattern のブロック化による 陰的 wavelet 近似逆行列前処理の 高速化

An Image/Link below is provided (as is) to download presentation Download Policy: Content on the Website is provided to you AS IS for your information and personal use and may not be sold / licensed / shared on other websites without getting consent from its author. Content is provided to you AS IS for your information and personal use only. Download presentation by click this link. While downloading, if for some reason you are not able to download a presentation, the publisher may have deleted the file from their server. During download, if you can't get a presentation, the file might be deleted by the publisher.

E N D

Presentation Transcript


  1. Finger patternのブロック化による陰的wavelet近似逆行列前処理の高速化 今倉 暁  曽我部 知広  張 紹良 名古屋大学 大学院工学研究科 計算理工学専攻

  2. Outline • 近似逆行列前処理 • Wavelet近似逆行列前処理 • Finger patternのブロック化 [提案法] • 数値実験 ・ 結果 • まとめ ・ 今後の課題

  3. 近似逆行列前処理

  4. 最小二乗問題 :Mの j番目の列ベクトル 完全独立・並列化が容易 : I の j番目の列ベクトル 近似逆行列前処理 • 偏微分方程式を離散化した際の線形方程式  を前処理付きKrylov部分空間法で解くことを考える. • 本研究では, 前処理として以下の近似逆行列前処理を扱う. • Mの計算.

  5. 近似逆行列前処理 0 0 0 0 • 実際に解く上で,M に要求される性質 疎行列である.        が小さい. ・・・計算コスト ・・・近似逆行列の精度 Mの非零構造を考える.→A-1の構造を参考にする. 疎性と精度を両立させたい フィルタリングを行う 閾値 : 小 閾値 : 大 値 値 大 小 大 小 疎性 : × 精度 : ○ 疎性 : ○ 精度 : ×

  6. Wavelet近似逆行列前処理

  7. Wavelet近似逆行列前処理 ~離散wavelet変換(DWT)~ L = 1 L = 2 4 L = 3 L : 任意パラメータ Wの非零構造

  8. Wavelet近似逆行列前処理 0 0 0 0 0 W 0 Finger pattern Finger pattern (S. C. Hawkins and K. Chen, 2006) (T. F. Chan et al., 1997) 疎性と精度の両立が可能 同値

  9. Wavelet近似逆行列前処理 Finger pattern Finger pattern 近似逆行列前処理 陰的wavelet近似逆行列前処理

  10. Wavelet近似逆行列前処理 ~wavelet依存性~ Watt 1 (n=1856) 前処理行列 の構築時間 反復法にかかる 時間 影響が少ない 本研究では WaveletをHaarに限定する 116 128 1.2 • DWTの精度に影響 Time[s] Sherman 4 (n=1104) • 近似逆行列の疎性に影響 0.4 • Daubechies 4 • 精度が高い • 疎性が低い • 計算コストが高い • Haar • 精度が低い • 疎性が高い • 計算コストが低い 反復回数 85 87 Daubechies4 Haar

  11. Finger patternのブロック化

  12. Finger patternのブロック化 ~従来法の問題点~ 最小二乗問題 近似逆行列の計算 問題点 近似逆行列の非零構造が   列ごとに異なる為, 異なる   部分行列に対して, QR分解   を合計n回行う必要がある. 陰的法を例に・・・ QR分解の結果を再利用する為に, Finger patternのブロック化を提案する. 本研究では, 陰的法に対してブロック化を行った. • QR分解 • 後退代入

  13. Finger patternのブロック化 従来法 提案法 A(:,Sj) mj(Sj) A(:,Sj) mj(Sj)

  14. Finger patternのブロック化 ~精度比較~ の非零構造 Theorem 1. Proof. 従来法  提案法

  15. 数値実験・結果

  16. 数値実験 Test行列 • Poisson3Da (electromagnetics problem) • dw8192 (computational fluid dynamics problem) n = 13514, Nnz = 352726 n = 8192, Nnz = 41746 T b = (1,…,1) 前処理 • 陰的wavelet近似逆行列前処理[従来法] • 提案法 • ILU(0) 解法 • GMRES • 初期近似解 • 停止条件 T x = (0,…,0) |r |/|r | < 10 0 -8 n 0 計算環境 • CPU : PowerPC G5 2.5GHz • メモリ : 4.0GB • コード : Fortran77 • コンパイラ: g77 –O5

  17. 結果 QR分解 後退代入 ILU(0)の分解 GMRES 2.2倍 3.0倍 3.5倍 1.5倍 1.8倍 1.7倍 poisson3Da 反復回数 12 158  158 159  159 160  160 57 Time[s] L= 5 3 4 従来法 提案法 従来法 提案法 従来法 提案法 ILU(0)

  18. 結果 dw8192 相 対 残 差 ―前処理なし ― 従来法 L=8 ― 提案法 L=6 ― 提案法 L=7 ―提案法 L=8 ― ILU(0) 0 反復回数 500

  19. 結果 QR分解 後退代入 ILU(0)の分解 GMRES 指数関数的に 計算時間が増大 指数関数的に 計算時間が増大 計算時間は減少 449 230 316 dw8192 25 Time[s] 449 316 230 484 反復回数 0 L= 6 7 8 提案法       ILU(0)

  20. まとめ・今後の課題

  21. まとめ ・ 今後の課題 • 陰的wavelet近似逆行列前処理に対して, finger pattern のブロック化を行った. • 最小二乗問題でのQR分解の結果を再利用すること により, 全体で約1.5倍高速化された. • また, 従来法では収束しない問題に対しても収束す る場合もみられた. • 提案法は従来法に代わる有効な解法になり得る. • 今後の課題 • 前処理行列の構築の更なる高速化 • アルゴリズムの並列化及び実装

More Related