1 / 21

High Performance Computing Service in NTUCC

High Performance Computing Service in NTUCC. 2006/12/22 高效能運算服務推廣說明會 計算機及資訊網路中心 作業管理組 助理程式設計師 張傑生 jsc@ntu.edu.tw. 簡報大綱. 歷史演進 現有設備 系統架構 使用狀況 申請規範 未來展望 心得交流. 歷史演進. 1990~ 年代 Cray XMP Cray J916 They were retired several years ago. 2000~ 年代

verena
Download Presentation

High Performance Computing Service in NTUCC

An Image/Link below is provided (as is) to download presentation Download Policy: Content on the Website is provided to you AS IS for your information and personal use and may not be sold / licensed / shared on other websites without getting consent from its author. Content is provided to you AS IS for your information and personal use only. Download presentation by click this link. While downloading, if for some reason you are not able to download a presentation, the publisher may have deleted the file from their server. During download, if you can't get a presentation, the file might be deleted by the publisher.

E N D

Presentation Transcript


  1. High Performance Computing Service in NTUCC 2006/12/22 高效能運算服務推廣說明會 計算機及資訊網路中心 作業管理組 助理程式設計師 張傑生 jsc@ntu.edu.tw

  2. 簡報大綱 • 歷史演進 • 現有設備 • 系統架構 • 使用狀況 • 申請規範 • 未來展望 • 心得交流

  3. 歷史演進 • 1990~年代 • Cray XMP • Cray J916 • They were retired several years ago. • 2000~年代 • 2003 first cluster with 50 nodes(100 cpus) • 2005 second cluster with 78 nodes(156 cpus) • 2006 • IBM P595 SMP server with 64 cpus • HP cluster with 106 nodes(424 cpu cores)

  4. 現有設備 • 建置日期:2003 • 運算節點:50 • Nexcom Blade Server • Dual Intel Xeon 2.0GHz • 1GB memory • 效能 • Rpeak: 400GFlops • Rmax: 200GFlops • 未來計畫移做教育訓練用途

  5. 現有設備 • 建置日期:2005 • 運算節點:78 • IBM Blade Server • Dual Intel Xeon 3.2GHz • 5GB memory • 效能: • Rpeak: 998GFlops • Rmax: 500GFlops • 適合對象: • 已透過 MPI 平行化之程式

  6. 卓越計算中心 • 經費來源:邁向頂尖大學(五年伍佰億) • 2006 重點建設 • 以硬體採購為主 • 改善機房基礎建設 • 高效能計算設備 • IBM SMP p595 • HP cluster • 2007 規劃建設 • 軟硬體採購並重 • 軟體採購政策 • 普遍性、一致性、滿足大多數使用者需求。 • 一次買斷,非租賃。 • 將部分負擔納入採購優先權考量。 • 歡迎踴躍提供軟體建議。

  7. 建置中 • 建置日期:2006 • 運算節點: • IBM p595 • 64*Power5 1.9GHz CPU • 256GB memory • AIX 5.3 • 效能: • Rpeak: 486GFlops • Rmax: 418GFlops • 適合對象: • 已透過 OpenMP 平行化之程式 • 單一程式需要大量記憶體

  8. 建置中 • 建置日期:2006 • 運算節點:106 • HP DL145G3 Server • Dual Intel Xeon 3.0GHz • 4GB memory • 效能: • Rpeak: 4900GFlops • Rmax: 2900GFlops • 適合對象: • 已透過 MPI 平行化之程式

  9. 系統架構

  10. 軟體列表

  11. Job Queue Policy • IBM Blade (2005) • Long queue • 3 concurrent execution jobs maximum • For each job • 1152 hours(48days) maximum if using 1 cpu • 36 hours maximum if using 32 cpus • Short queue • 4 concurrent execution jobs maximum • For each job • 144 hours maximum if using 1 cpu • 9 hours maximum if using 16 cpus

  12. 研究團隊 • 服務對象 • 遍及校內物理系、化學系、凝態中心、土木系、機械系、工科系、農藝系、光電所、電子所、資工系與藥學系等單位之研究團隊約二十組 • 研究團隊介紹

  13. 使用狀況 • 綠線為 78,也就是「平均」每一組運算節點 load 都為1。 • 盡量讓每一顆 CPU load 維持在 0.5,也就是讓所有 CPU 都有工作計算,盡量降低閒置CPU。以提升整體利用率。 • 2006/05額外擴充40組計算節點。

  14. 使用狀況 • 紅線代表總記憶體量,也就是 5*78 = 390GB。 • 目前記憶體使用量大約為 50%。 • 2006/05 額外擴充40組計算節點。 • 2006/07 將每組計算節點之記憶體由 2GB 擴充為 5GB。

  15. 使用統計(2006/01~2006/10)

  16. 申請規範 • 由於資源有限,目前僅開放學術研究用途。 • 請先與計中方面聯絡,討論需求與程式內容。 • 以研究團隊為單位申請。 • 後續將依學校要求,訂定收費辦法,落實使用者付費觀念。 • 未來發表論文時,請 Acknowledge 計資中心。

  17. 時程規劃 • 2007/01 IBM SMP 主機教育訓練。 • 2007/02 開放 IBM SMP 主機帳號申請。 • 2007/03 HP cluster 主機教育訓練。 • 2007/03 開放 HP cluster 主機帳號申請。

  18. 教育訓練 • IBM SMP 與 HP cluster 廠商提供 • 2007/01~03 於計中電腦教室 • 高效能環境介紹與平行化程式寫作 • 進階平行化程式寫作與偵錯技巧 • 系統管理維護之教育訓練 • 程式開發環境之教育訓練 • 未來將放置課程錄影於網站上,提供線上學習。 • IMSL 廠商提供 • 2007/02 於計中電腦教室舉辦教育訓練 • 每月定期於該公司(忠孝東路五段)舉辦教育推廣活動,全程免費且附午餐便當。

  19. 教育訓練 • 後續規劃 • 計資中心教學研究組開課 • 邀約校內教授專家不定期開課

  20. 未來展望 • 定期舉辦服務推廣活動,發掘潛在使用者。 • 透過教育訓練,提升使用者技術能力。 • 平行化程式設計、MPI/OpenMP 使用說明 • 監控系統狀態,調整 queuing policy,以兼顧整體使用率與滿足使用者需求。 • 持續爭取經費,擴充計算設備。 • 廣徵各方意見,滿足軟硬體需求。

  21. 心得交流 • 謝謝大家 • 請踴躍發言

More Related