130 likes | 301 Views
O. O. 対角マトリックスを用いた3次元剛塑性有限要素法の並列計算. 塑性加工研究室 大友勇司. 3次元大規模シミュレーション. ・計算時間 ・メモリ容量. 対角マトリックスを用いた剛塑性有限要素法 節点ごとの釣合い式を解く. 3次元大規模問題に適している. 従来法. 計算時間. 対角マトリックス法. 収束性,並列化効率の向上. 節点数. 対角マトリックスを用いた3次元剛塑性有限要素法. 釣合い式. 従来法. 非線形連立方程式. [ A ( v )] { v } = { F }. O. v. F. =. 1節点あたりの不釣合い節点力.
E N D
O O 対角マトリックスを用いた3次元剛塑性有限要素法の並列計算 塑性加工研究室 大友勇司 3次元大規模シミュレーション ・計算時間 ・メモリ容量 対角マトリックスを用いた剛塑性有限要素法 節点ごとの釣合い式を解く 3次元大規模問題に適している 従来法 計算時間 対角マトリックス法 収束性,並列化効率の向上 節点数
対角マトリックスを用いた3次元剛塑性有限要素法対角マトリックスを用いた3次元剛塑性有限要素法 釣合い式 従来法 非線形連立方程式 [A(v)] {v} = {F} O v F = 1節点あたりの不釣合い節点力 [A(v)]i{v} - {F}i= {DP}i O 速度場の修正ベクトル {v} = {v0}+{Dv}i 対角マトリックス法 O [A(v0)]ii{Dv}i = -{DP0}i Dv DP0 = - O 3×3 計算時間は節点数にほぼ比例
65.7% 並列 計算 並列 計算 34.1% 共有メモリ型ワークステーションによる並列計算 CPU 2 CPU 1 メモリ ・[B]の計算 サブルーチン 1 サブルーチン 1 ・{DP0}iの計算 ・釣合い式[A]ii{Dv}i={DP}i の計算 CPU 1 CPU 2 全節点? 全節点? サブルーチン 2 サブルーチン 2 ・加速係数aの計算 ・[D]の計算 ・不釣合い応力の計算 不釣合い応力? 全ステップ? Alpha Server CPU : 731MHz×16
並列計算におけるCPUの振分け CPU1 CPU2 (a) 領域 (b) 節点 容易 負荷バランス ; 困難 対角マトリックス
非線形連立方程式 [A(v)]ii {Dv}i = {DP}i [A]=∫[B] [D][B]dV 線形 T V 繰返し2 非線形 間欠数ni? 非線形性の間欠更新による収束性の向上 ・[B] の計算 サブルーチン1 ・{DP0}iの計算 ・釣合い式[A]ii{Dv}i={DP}iの計算 繰返し1 全節点? 解 サブルーチン2 ・加速係数 a の計算 ・[D]の計算 ・不釣合い節点応力の計算 初期値 v0 繰返し3 不釣合い応力? 繰返し4 全ステップ?
z 30 ° y y x 間欠数の影響 1CPU 傾斜工具によるすえ込み加工 15 3 10 2 繰返し数 計算時間 /ksec 繰返し数/k 5 1 計算時間 0 5 0 10 20 30 40 50 1/8 対称モデル 間欠数 ni
並列計算におけるスピードアップ率 4 ni=5 3 理想 スピードアップ率 1 2 t1 スピードアップ率 = tn 1 0 1 2 3 4 CPU数
総計算時間と要素数の関係 従来法は約2乗に比例 7 10 1CPU: a=0.045 6 10 2CPU: a=0.028 5 4CPU: a=0.019 10 総計算時間 T /sec 4 10 3 10 1.46 T=aN 2 10 1 10 1.25×105 0 10 2 3 4 5 6 10 10 10 10 10 要素数 N
メモリサイズと要素数の関係 従来法は約2乗に比例 400 300 1.00 M=0.0028N メモリサイズ M /Mbytes 200 100 125 0 50 100 150 要素数 N /k
クランクシャフト3次元鍛造加工の並列計算 4 理想 3 スピードアップ率 2 1 0 1 2 3 4 CPU数
分散メモリ型PCクラスタによる並列計算 CPU 2 CPU 1 メモリ 2 メモリ 1 ・[B]の計算 データ転送 サブルーチン 1 サブルーチン 1 ・{DP0}iの計算 ・釣合い式[A]ii{Dv}i={DP}i の計算 並列 計算 CPU 1 CPU 2 全節点? 全節点? サブルーチン 2 サブルーチン 2 並列 計算 ・加速係数aの計算 ・[D]の計算 ・不釣合い応力の計算 不釣合い応力? PCクラスタ CPU : 2.4GHz×4 ネットワーク:100Mbps 全ステップ?
4 1.5 理想 3 1.0 スピードアップ率 2 総繰返し数 /k 0.5 1 0 1 2 3 4 0 1 2 3 4 CPU数 CPU数 領域分割による並列計算 CPU2 CPU1
まとめ 対角マトリックスを用いた3次元剛塑性有限要素法に おいて並列計算を行い,計算時間の低減を図った 共有メモリ型ワークステーション 非線形性の間欠更新により解の収束性,並列化効率 を向上させた 並列計算により更に大規模な問題も計算可能となった 分散メモリ型PCクラスタ 領域分割による並列計算では収束性が低下した