1 / 89

网格计算及其在高能物理中的应用概况

网格计算及其在高能物理中的应用概况. 高能物理所计算中心. 本报告参考了: CERN 钱思进教授 2002 年 7 月的报告 Grid Computing and its Application IHEP 孙功星副研究员准备 2000 年 11 月 8 日在韩国召开的“国际高能物理数据网格研讨会 上所作的报告 Grid Activity in china IHEP 杨大鉴研究员的博士生蒋文保的报告 Grid Computing 美国加州理工大学 Harvey B Newman 在 2002 年 10 月 9 日 ICFA 讨论会上作的报告

kris
Download Presentation

网格计算及其在高能物理中的应用概况

An Image/Link below is provided (as is) to download presentation Download Policy: Content on the Website is provided to you AS IS for your information and personal use and may not be sold / licensed / shared on other websites without getting consent from its author. Content is provided to you AS IS for your information and personal use only. Download presentation by click this link. While downloading, if for some reason you are not able to download a presentation, the publisher may have deleted the file from their server. During download, if you can't get a presentation, the file might be deleted by the publisher.

E N D

Presentation Transcript


  1. 网格计算及其在高能物理中的应用概况 高能物理所计算中心

  2. 本报告参考了: • CERN钱思进教授2002年7月的报告 Grid Computing and its Application • IHEP孙功星副研究员准备2000年11月8日在韩国召开的“国际高能物理数据网格研讨会上所作的报告 Grid Activity in china • IHEP杨大鉴研究员的博士生蒋文保的报告 Grid Computing • 美国加州理工大学Harvey B Newman 在2002年10月9日ICFA讨论会上作的报告 Report from ICFA Standing Committee on Interregional Connectivity • 许榕生研究员为本次大会准备的报告 高能物理网格发展动态

  3. 网络技术的三次浪潮 • 什么是网格计算 • 为什么现在会发展网格计算 • 哪些行业需要网格计算 • 高能物理对计算的需求 • 网格计算的基本技术 • 国际网格计算技术的发展现状 • 国内网格计算现状及发展前景

  4. 网络技术发展的三次浪潮 • 第一次浪潮:Internet的产生(80年代) • 计算机相互连接的发展产生了局域网 • FTP、Telnet、Email • newsgroup、BBS • 第二次浪潮:WWW(80年代末- 90年代中期) • 超文本文件由http协议连接 • WWW的产生(1989年由CERN科学家发明) • 第三次浪潮:Grid(90年代后半期-...) • 各种资源统一通过网格技术连接 • 根据用途不同分为数据网格、计算网格...

  5. 什么是网格 Argonne实验室的I. Foster认为网格是一种规模大小可变的虚拟组织:由动态合作的个体、研究单位和资源所有者之间的灵活的、安全的、协调的资源共享 • 虚拟组织的成员——分布在世界各地的,为了完成同一件事情的研究机构、大学、科学家个体… • 资源——计算机、存储设备、网络、大型科学仪器、数据库、软件、信息… 用户的观点:希望使用网上资源像使用电力、自来水那样方便,不必关心是从哪里来的资源,也不必考虑用多用少,总能满足需求。

  6. 电力网格 计算网格 共享资源 发电站、高压线、变电站 … 计算机、数据存储设备、数据库、大型仪器设备、网络、软件… 共享范围 地理分布 地理分布、研究或工业领域、研究机构… 共享地域 国家或地区(基于政治或经济因素等) 全世界 中心控制 是,在很多国家和地区由政府单一控制 无须中心控制 最终用户规则 被动的 主动的,可以是提供共享资源的节点 与电力网比较

  7. 为什么现在会发展网格计算 • 需求 • 计算密集型、I/O密集型、数据密集型计算的需求 • 需要使用位于远处的大型、位置固定的仪器设备 • 在不同地区使用具有不同政策的已有技术的复杂需求 • 大型国际合作项目的需求 • 可能性 • 计算机工业技术符合摩尔定律的发展 • 网络基础设施飞速发展,发达国家、地区高速网络及跨大洋的洲际光缆已经具备相当的规模 • 软件技术的新发展

  8. 哪些行业需要网格计算 • 生物、生化研究 • 人类基因研究 • 爱滋病药物研究 • 地震仿真研究 • 大气物理与气象预报 • 高能物理理论与实验

  9. 家庭中的计算机用来评价爱滋病药物 • 社团组成: • 数千家庭计算机用户 • 慈善机构提供的计算能力 (Entropia) • 研究组 (Scripps) • 共同的目的= 促进爱滋病研究 ___________ image courtesy from

  10. 地震工程和仿真 NEESgrid(地震工程和仿真网格): • 将地震工程师与实验设施、数据库、计算机结合的体系结构 • 按需地使用实验、数据流、计算设施、档案、合作 NEESgrid: Argonne, Michigan, NCSA, UIUC, USC

  11. 高能物理对计算的需求 以LHC实验为例

  12. Large Hadron Collider (大型强子对撞机) 能量.: 14 TeV (质子-质子) 1250 TeV (铅核-铅核) 亮度: 1034 cm-2s-1 (质子-质子) 1027 cm-2s-1 (铅核-铅核) 周长: 26.6 km 主要实验: 4个

  13. 4 主要的 LHC 实验 ATLASCMS ALICE LHCb

  14. LHC 计算需求 数据存储 – 原始数据率 0.1 – 1 GByte/sec 相当于 5-8 PetaBytes/year 需要磁盘容量 10 PetaBytes 处理能力 – 200,000 个目前 (2001) 最快的 PC机

  15. Tier2 Center Tier2 Center Tier2 Center Tier2 Center 层 2中心 HPSS HPSS HPSS HPSS LHC高能物理实验数据处理示意图 CERN内部/外部比例 ~1:2层0/( 层1)/( 层2) ~1:1:1 ~PByte/sec ~100-400 MBytes/sec 在线取数 对撞实验 CERN 700k SI95 ~1 PB Disk; Tape Robot 层0 +1 HPSS 层1 ~2.5 Gbits/sec FNAL: 200k SI95; 600 TB IN2P3 Center INFN Center RAL Center 2.5 Gbps 层 2 ~2.5 Gbps 层 3 Institute ~0.25TIPS Institute Institute Institute 100 - 1000 Mbits/sec 离线物理数据 2007-8年达几十 Pbyte/sec.5年左右达到1000PByte/sec 层 4 PC或工作站

  16. 世界上参加高能物理实验合作的单位 欧洲: 267 个研究单位, 4603 个用户 其他地区: 208 个研究单位, 1632 用户 ICFA ——国际未来加速器委员会 SCIC ——地区间连接标准委员会

  17. 高能物理对网络的需求 ICFA 于1996年启动各国之间的高速网络互联计划 ICFA 要求参与国际高能物理合作的国家和机构 必须: • 检查他们的运行方法以便保证与远方合作者的完全连接 • 争取提供必要的通信设施和足够的国际带宽

  18. ICFA 1998联网带宽计划(Mbps) 每个物理学家使用的带宽 (所用峰值带宽) 大学组使用的带宽 本地实验室或地区中心 中心实验室,包括一个或几个主要实验使用的带宽 跨大洋连接带宽 估计1998-2005年期间将增加100–1000 倍的带宽需求

  19. 跨越大西洋的带宽要求[*] [*]按最大占用50%算 http://gate.hep.anl.gov/lprice/TAN

  20. 网格技术产生的技术基础 • 高性能计算技术的发展 • CPU技术飞速发展 • 超级计算机与计算机集群 • 大规模共享资源 • 网络基础设施的高度发达 • 发达国家的高速光纤网已四通八达 • 跨大洋的海底光缆连接已经具有相当规模 • 软件技术的新发展 • 异构平台体系和语言 • 广域网的资源共享软件 • 中间件 • 网络安全技术

  21. CPU的计算速度每18个月翻一番 • 你家里的PC机的CPU计算能力已经相当服务器的CPU了 • 你办公室和你家里的计算机的CPU经常无事可做,或负荷很低 • 它们在网格里可以提供给需要的人使用,而对你毫无影响

  22. 中国计算机TOP50排行榜 • 第一: “深腾1800”,联想研制,安装于科学院数学院,具有512个Intel Xeon 2.0G CPU,峰值计算能力2048 Gflops • 第三:HP SuperDome,用于北京社会保险,具有256个CPU,峰值计算能力384 Gflops • 第42:北京大学数学学院在国内最早自行组装的大型PC-Farm,具有60个PIII-700 CPU,峰值计算能力42 Gflops

  23. 网络基础设施的高度发达 • 网络速度每9个月翻一番(技术) • 网络带宽每5年提高一个数量级(实际) • 发达国家的高速光纤网已四通八达 • 跨大洋的海底光缆连接已经具有相当规模

  24. 主干网与各国连接的进展 • 欧洲 GEANT 主干网 • 联结31个国家,速率 2.5 and 10 Gbps • 英国: JANET 网,速率10 Gbps • 2.5 Gbps NY-London, with 622 Mbps to ESnet and Abilene • 法国 (IN2P3): 2.5 Gbps RENATER • 里昂-日内瓦(CERN)的连接千兆以太网1.0G • 计划2003年改用光纤 • SuperSINET (日本):10 Gbps IP and 10 Gbps Wavelength Core • 东京-纽约的连接: 2 x 2.5 Gbps; 需要到Starlight • CA*net4 (加拿大):国内光纤,速率10 Gbps • “Lambda-Grids” 计划2004年5月实现 • GWIN (德国):2.5 Gbps 骨干; 到美国 2 x 2.5 Gbps; • 俄罗斯: 155 Mbps连到莫斯科 • 到GEANT 155 Mbps

  25. (续) • 美国Abilene (Internet2) 从2.5G 正升级到10 Gbps • Encourage high throughput use for targeted applications • 美国能源部ESNET: 升级到10 Gbps • 美国与西欧中心(CERN) • 622 Mbps; 到STARLIGHT • 2.5G 三地STARLIGHT-CERN-NL连接2003年到10G • 美国SLAC到法国IN2P3 (BaBar) • ~100 Mbps通过US-CERN到Renater • 600 Mbps 今年BaBar的目标 • 美国费米实验室 (FNAL) • 与Esnet 连接升级到622 Mbps • 用光纤连到STARLIGHT • 纽约到阿母斯特丹由Tyco公司捐助(IEEAF)计划, 2002年由IEEAF安排 622 Gbps+10 Gbps Research Wavelength

  26. One of the most homogeneous bandwidth distribution

  27. UK SuperJANET4 NL SURFnet GEANT It GARR-B Fr Renater DataTAG Project NewYork ABILENE STARLIGHT ESNET GENEVA Wave Triangle CALREN STAR-TAP • EU-Solicited Project. CERN, PPARC (UK), Amsterdam (NL), and INFN (IT);and US (DOE/NSF: UIC, NWU and Caltech) partners • Main Aims: • Ensure maximum interoperability between US and EU Grid Projects • Transatlantic Testbed for advanced network research • 2.5 Gbps Wavelength Triangle 7/02 (10 Gbps Triangle in 2003)

  28. 加州-东京 ~1/03 纽约-欧洲 9/02 (研究)

  29. 软件技术的新发展 • 异构平台体系与程序语言 • Java语言、Java虚拟机 • 中间件 • 代理、可移动代理、CORBA • 广域网的资源共享软件 • 文件共享,如AFS • 数据库,如Objectivity • 网络安全技术 • SSH、SSL • 认证/授权技术 • 加密技术 • 数字签名、防抵赖技术

  30. 网格计算的基本技术(服务功能) • 通信服务 • 信息服务 • 安全认证 • 名字服务 • 监视系统 • 资源管理和调度 • 资源交易机制 • 编程工具 • 用户图形界面

  31. 应用层 应用层 汇聚层 资源层 TCP层 连接层 IP层 基础层 链路层 Grid协议体系结构 Internet协议体系结构 GRID的协议分层体系结构

  32. Application “Coordinating multiple resources(汇聚多个资源)”: 普及体系结构服务、应用特定的分布式服务 Collective “Sharing single resources(共享单一资源)”:协商访问、控制使用 Resource “Talking to things(与东东的对话)”: 通信 (Internet 协议) 与 安全 Connectivity “Controlling things locally(本地控制的东东)”: 访问与控制、资源 Fabric 计算网格是如何实现的 Grid 结构 Globus Toolkit™ For more info: www.globus.org/research/papers/anatomy.pdf

  33. GRID技术要点—组成结构 • 网格结点 • 中间件 • 开发环境和工具层 • 应用层

  34. 国际网格计算技术的发展现状 科学界 • 美国Argonne实验室 : Globus • 欧盟数据网格 : EU DataGrid • 物理学网格 : GriPhyN • 地震工程与仿真网格 : NEESgrid 政府 • 美国能源部 (DOE) : DOE Science Grid • 美国国家航天局 (NASA) : Information Power Grid • 美国国家科学基金会 (NSF)国家计算科学联盟 (NCSA) : National Technology Grid • 德意志联邦教育科研部 (BMBF):  UNICORE 厂商 • IBM • SUN • Platform

  35. HEP领域中的GRID技术 高能物理领域对计算技术的需求历来走在时代的前列,关于GRID技术的研究也不例外 举例: • 美国的粒子物理数据网格 PPDG • 欧盟数据网格 (EU DataGrid) • 西欧核子研究中心CERN的LCG计划

  36. PPDG ---参与者 • 加州理工大学 • 阿槓国家实验室 • 劳伦斯伯克利实验室 • 布鲁克海文国家实验室 • 费米国家实验室 • 圣地亚哥超级计算机中心 • 斯坦福直线加速器中心 • 威斯康星大学

  37. PPDG ---主要目标 • 为成千个物理学家提供广域分布的PB量级(1015Byte)数据的粒子物理数据分析的体系结构 • 加速广泛针对数据密集型科学合作的网络和中间件体系结构的发展

  38. PPDG ---体系框图

  39. PPDG ---技术方案 第一步(1999年): • 提供两个不同地点间的高速文件复制服务 • 提供多地点高速缓存的文件存取服务

  40. PPDG ---技术方案 第二步(2000-2001年): • 开发一个一般化的文件迁移框架(支持 QoS) • 作为透明写访问和代理技术所需要的基础,作到目录、资源代理和匹配服务的实现/通用化 • 实现文件的透明的写访问 • 实现对代理的有限支持 • 实现数据网格的分布资源管理 • 在组件级和结构级主要努力作到健壮性和快速问题诊断

  41. PPDG ---技术方案 长远目标 : • 系统必须使用静态的和移动的独立代理去执行定义好的任务 • 系统必须是有弹性的、预测性的/自适应的 • 任务的优先级必须是基于策略和边界效用两者 • 必须使用辅助调度算法(匹配)在一定的时间限额内将请求配给资源,匹配的结果将影响用于度量边界效用的索引 • 事务管理必须使用上述价格估算法,比如抽查/重算机制

  42. PPDG ---已有的技术基础 • ANL: Globus 网格中间件服务 • SLAC: 对象开放文件系统 (OOFS) • Caltech: 全球互连对象数据库 (GIOD) 项目 • FNAL: 数据访问架构 (SAM) • LBNL: 存储访问协作系统 (STACS) • ANL: 规模可伸缩的目标存储和访问 Scalable Object Storage and Access • 威斯康星大学的: Condor 分布资源管理系统 • SDSC: 存储资源代理 (SRB)

  43. 欧盟数据网格计划 • 为进行数据密集型科学研究给大型分布科学组织提供世界级的网格 • 从计划的构思和机构的人员编制看主要涉及CERN和粒子物理界 (由LHC计划推动) • 由地球观测和生物学共享

  44. EU DataGrid 计划的目的 • 特定的计划目标: • 构架的中间件和网格管理软件(大部分由欧盟资助) • 大规模实验床(大部分由参加单位资助) • 具有产品质量级别的演示(部分由欧盟资助) • 与欧洲和美国的项目合作并提供补充 • 为开放标准和国际实体作出贡献:

  45. EU DataGrid 主要参加者 • CERN – International (Switzerland/France) • CNRS – France • ESA/ESRIN – International (Italy) • INFN – Italy • NIKHEF – The Netherlands • PPARC - UK

  46. 项目计划 • 计划从2001年1月1日开始 • 测试床 0 (2001年前期) • 部署国际实验床0体系结构(仅用Globus 1 - 未用欧洲数据网格中间件) • 测试床 1 (2002年前期) • 第一版EU DataGrid 软件在项目内部定义了用户: 高能物理实验(工作组8)、地球观测(工作组9)、生物医学(工作10) • 2002年3月1日成功通过欧盟的项目评审 • 测试床 2 (2002年10月) • 在实验床 1上建立,扩充数据网格的功能 • 测试床 3 (2003年3月)和 测试床 4(2003年9月) • 计划到2003年12月31日停止

  47. EU DataGrid计划的各工作组分工 中间件 • WP1 网格工作负载管理 • WP2 网格数据管理 • WP3 网格监控服务 • WP4 构架管理 • WP5 海量存储管理 测试床 • WP6 测试床集成 • WP7 网络服务 科学应用 • WP8 高能物理 • WP9 地球观测 • WP10 生物学 宣传 WP11 项目管理 WP12

  48. Apps Local Computing Local Application Local Database Grid Data Management Metadata Management Object to File Mapping Job Management Mware Information & Monitoring Replica Manager Grid Scheduler Computing Element Services Storage Element Services Replica Catalog Authorization Authentication and Accounting Service Index SQL Database Services Grid Globus Fabric services Fabric Monitoring and Fault Tolerance Node Installation & Management Fabric Storage Management Resource Management Configuration Management EU DataGrid 软件结构 Grid Application Layer Collective Services Underlying Grid Services

  49. Web 用户界面 (1)

  50. Web 用户界面 (2) 4th DataGridConference, 04-08.03.2002 Roberto Barbera

More Related