260 likes | 418 Views
China-VO 的发展. 赵永恒 2003 年 8 月. China-VO. 为中国天文学家提供使用国际数据的先进平台和门户 从国际上获取数据和相关技术 将我们的数据提供给天文学界 未来: LAMOST 、 SST 、 FAST 目前: BATC 、太阳磁场、 216… 过去:天文底片(?) 培养新一代面向“虚拟天文台”的科技队伍 公众教育. 海量数据存储与管理技术. Linux + IDE 硬盘 + 软 RAID 技术 2001 年: 550GB 服务器 ADS 镜像站点 2002 年: 4.5TB 数据服务器 建立了 1TB 多波段巡天数据库
E N D
China-VO的发展 赵永恒 2003年8月
China-VO 为中国天文学家提供使用国际数据的先进平台和门户 从国际上获取数据和相关技术 将我们的数据提供给天文学界 • 未来:LAMOST、SST、FAST • 目前:BATC、太阳磁场、216… • 过去:天文底片(?) 培养新一代面向“虚拟天文台”的科技队伍 公众教育
海量数据存储与管理技术 Linux + IDE硬盘 + 软RAID技术 2001年:550GB服务器 • ADS镜像站点 2002年:4.5TB数据服务器 • 建立了1TB多波段巡天数据库 (WDC for Astronomy)
高性能计算技术 COMA机群:Linux + MPICH • 65个处理器、32.8GB内存、2.56TB IDE硬盘 • 峰值性能为950亿次/秒 • 浮点运算的Linpack性能为57.8Gflops • 在国内超级计算机Top50中(包括商用机器)排名第22。 已开展的工作包括: • 宇宙大尺度结构及星系形成的数值模拟研究 • 高阶CDM+流体动力学模拟程序的并行化研究
China-VO的原型 • 巡天数据的在线服务 • 本地查询和交叉证认 • 定义天文对象和方法 • 基于 OGSA/Globus • 与Web Service兼容:UDDI, WSDL, SOAP. • 每个数据库都是一个Grid Service • 基于Grid Service的交叉证认 • 与望远镜实时数据的互联 • 可视化工具
Grid Service流程 Publish Visit(jdbc) Community Registry mining Factory Database Service 2 4 2MASS 1 Miner 5 Compute Service Provider User Application . . . 3 6 . . . Database Service Database Factory 7 NVSS 4 Database Storage Service Provider
服务层(数据、存储、计算) • 已解决 • 数据服务:数据的封装 • Data VOTable • 未解决 • 元数据服务:DNS-like? UCD • 多表联合查询: • 存储空间服务:File, MyVO • 计算服务:网络中心?
传输层 (OGSA) • 已解决 • Stream方式 • 未解决 • File方式:GridFTP? URL?
应用层 • 已解决 • 表 => 图 • 未解决 • 可视化工具:各种各样(基于科学) • 基本工具: • 交叉证认工具: • 数据挖掘工具:
资源注册与发现 • 未解决 • 数据: • 存储: • 计算: • 工具:
一般范例 • Cone Search • 多表查询 • 可视化 • 银河系化学演化 • 多表查询 • 计算程序(工具) • 可视化 • 科研范例? • 科学教育
LAMOST的范例 • 多波段天体物理(输入星表) • 多表联合查询 <= (工作星表) • 交叉证认 • 多参数空间的分类 => (输入星表III) • QSO, AGN, CV, XRB, … • 可视化 • 光谱数据服务(输出) • 获取光谱(2dF, SDSS, …) => (光谱自动分析) • 与自动分析系统的接口? • 光谱参数?
LAMOST & China-VO LAMOST Working Catalogues Input Catalogue IVO China-VO Scientific Research Spectrum Analysis Image Precessing
Three Layer GRID Abstraction E-Science 本体论 ontology Knowledge Grid Control Information Grid Data to Knowledge Computation/Data Grid Automation
接入方式 • OGSA接入 • 远程程序调用 • 使用门户
基本的服务激活机制 服务状态表达与监控 服务间元数据传递 机器可识别的服务描述 统一的数据访问接口 文件传输能力 数据库格式动态转换能力 数据缓存 服务注册和发现机制 元数据互操作能力(Ontology)/语义网 数据、资源的访问控制,用户授权与认证 工作流支持 动态的服务上下线管理 VO 对Grid的功能需求
特有的技术问题 • 资源发现和注册 VO Registry • 天文数据查询 VO Query Language (VOQL) • VO数据格式 VOTable / XML • 天文数据集的元数据 UCD / VO Ontology • 天文数据处理与分析服务 VO Services
China-VO的信息技术 • 基础技术 • 海量数据的存储与管理技术 • 高性能计算技术 • 信息标准化 • 数据格式(XML):VOTable、AML等 • 接口与协议:SOAP、Web Service等 • 网格技术 • OGSA/Globus等 • 应用技术 • 数据自动分析技术 • 新型统计分析技术 • 数据挖掘与知识发现技术 • 可视化技术
几个原则 • 遵循IVOA的标准 • 要参与进去,要有声音 • 紧跟OGSA的发展 • 需要追踪和了解 • freeware软件 + 廉价的硬件 • 天文学:“穷人的科学” • 集群方式 • “在战争中学习战争”
Call to Action • If you do data visualization: we need you(and we know it). • If you do databases:here is some data you can practice on. • If you do distributed systems:here is a federation you can practice on. • If you do data mininghere are datasets to test your algorithms. • If you do astronomy educational outreachhere is a tool for you. • The astronomers are very good, and very smart, and a pleasure to work with, and the questions are cosmic, so …
谢谢! http://www.china-vo.org/