200 likes | 349 Views
Methods Exploring and Practic on Data Mining of Astronomy 天文数据挖掘方法探索与实践. Xiaoqing Jian, GDUFS China- VO and Astroinformatics 2012·2012.11.28-12.02· 宜昌. Outline/ 概要. 1 天文数据挖掘的 必要性 VS 可行性 2 天文数据挖掘的 特殊性 VS 共性(一般挖掘方法) 3 天文数据的历史性(积累) VS 现实性(含未来) 4 天文数据挖掘的方法探索(规律性) VS 灵感发现.
E N D
Methods Exploring and Practic on Data Mining of Astronomy天文数据挖掘方法探索与实践 Xiaoqing Jian, GDUFS China-VOand Astroinformatics 2012·2012.11.28-12.02·宜昌
Outline/概要 • 1天文数据挖掘的必要性VS可行性 • 2天文数据挖掘的特殊性VS共性(一般挖掘方法) • 3天文数据的历史性(积累)VS现实性(含未来) • 4天文数据挖掘的方法探索(规律性)VS灵感发现
1天文数据挖掘的必要性VS可行性 • 皮级(1000万亿Byte,PB)的天文数据随着计算机技术的提高和人类探索宇宙深空的愿望增长而涌现;---物+人 • 世界范围天文数据的共享性与合作性为“巧妇”——天文数据挖掘人员,提供了很好的“食粮”和“环境”;客观+主观(数据的保密性和保密的时间持久性相对很短)
2天文数据挖掘的特殊性VS共性(一般挖掘方法)2天文数据挖掘的特殊性VS共性(一般挖掘方法) • 有最新的数据(例如太阳系),但有的数据虽然新,反映的却是很久很久以前的现状(例如宇宙137亿光年以前的背景辐射) • 数据变化的连续性,例如太阳每天都发生的changes Hydrogen(氢气)to Helium(氦气) by nuclear fusion(核聚变)。
天文数据背后连接的天文现象,是人类社会的能力难以企及的,研究这些数据和现象,对了解自然与人类能力的局限性——发现造物主的伟大有很大的帮助,对自然的敬畏之心油然而生。天文数据背后连接的天文现象,是人类社会的能力难以企及的,研究这些数据和现象,对了解自然与人类能力的局限性——发现造物主的伟大有很大的帮助,对自然的敬畏之心油然而生。 • 获得其它的数据挖掘对象(例如医院病人的资料,网络敏感信息的挖掘等)难以得到的满足感。( 人类社会的问题挖掘往往容易涉及个人的隐私,引发法律纠纷)。探索的欲望+满足的欲望
3天文数据的历史性(积累)VS现实性(含未来)3天文数据的历史性(积累)VS现实性(含未来) • 例1:席泽宗院士(Jun. 9,1927~Dec. 27,2008)早年(1955年)发表的《古新星新表》,考订了从殷代到公元1700年间的90次新星和超新星爆发记录,尤其对宋代的皇家天文资料的挖掘,终于找到了在公元1054年,“客星”的出现,间接证明了蟹状星云这一超新星的早年爆发的历史。其后的(1965年)《中朝日三国古代的新星记录及其在射电天文学的意义》(与薄树人合作发表,《科学》(Science)第154卷,3749期全文刊出)论文,再一次被世界各地的科学家在研究超新星、射电源、脉冲星等高能天体时大量引用。
[唐],瞿昙悉达撰 。卜筮 之书, • 例2,席泽宗还对中国古代战国时期(公元前364年)夏天,天文学家甘德用肉眼发现了木星最亮的卫星——木卫三,(席泽宗, 《伽利略前二千年甘德对木卫的发现》 《天体物理学报》第1卷第2期,1981年4月第85-88页) ,考据为古籍《开元占经》(上册),卷二十三岁星占一,第165-166页——“甘氏曰:单閼之岁,摄提格在卯,岁星在子,与虚、危晨出夕入,其状甚大有光,若有小赤星附于其侧,是谓同盟两国,或昌或王,死者不在其乡。”)
4天文数据挖掘的方法探索(规律性)VS灵感发现4天文数据挖掘的方法探索(规律性)VS灵感发现 • 天文数据挖掘的方法探索规律性-------大科学家的行为;但并不应该仅仅是专家的专利。 • 爱好和兴趣是最好的老师; • 灵感发现——有时可以是业余天文爱好者的所为。 伽利略没有出名前,也就是意大利当时一个“二 流”大学----比萨大学(没获得学位毕业)的学 生。探索和兴趣、坚持使得他走向成功!
本人带领指导的广东外语外贸大学信息学院计算机类专业应届毕业生论文(从2008届开始,主要转向涉及地理空间及天文领域)主要的数据来源本人带领指导的广东外语外贸大学信息学院计算机类专业应届毕业生论文(从2008届开始,主要转向涉及地理空间及天文领域)主要的数据来源 • 中国科学数据库- 空间科学主题数据库暨空间科学数据网格http://www.csdb.cn/#
CSDB说明 • CSDB——China Science Data Base,以中科院自主获取的空间科学数据为重点依托,以国外空间科学数据为重要补充,按日地空间物理和行星科学两个主要的学科方向进行分布式数据资源的整合,内容涵盖行星际、中高层大气、宇宙线、电离层、太阳活动、近地空间等典型天、地基空间环境要素观测数据。
例:太阳射电天文学 • 诞生于20世纪40年代,是射电天文学和太阳物理学之间的一个新兴的交叉学科。利用太阳射电望远镜来观测研究太阳的射电辐射,结合太阳的其它电磁波辐射与粒子发射的资料,进一步揭示太阳的物理本质。
例:History and Tradition • Monday March 19th marks the Spring Equinox and to celebrate people are encouraged to meet at the top of Munson Mountain. • Penticton‘s Pen Henge stones delineate the sunset points at both the spring and fall equinoxes(春分与秋分点), while the other two stones mark the winter and summer solstice(冬至与夏至).
诞生历史/首次发现 • 1942年,英国防空部队发现波长为4-6m的炮瞄雷达有时突然受到强烈的电波干扰,经过J.S.Hey的调查研究,终于发现了是太阳射电辐射!而且,比6000K的黑体辐射还要强,并与日面上的太阳活动(太阳黑子和日冕)有关。
Penticton(彭蒂克顿) ——在加拿大; • 西经 119º38' 北纬 49º29‘ • 别名Nickname(s): The Peach City,箴言Motto: A Place to Stay Forever
The Royal Astronomical Society of Canada • 2012 是 leap year闰年
补充结论: • 由此可见,不论中国还是外国,挖掘古代的天文资料,并与现代科学文明相结合,既可以保持和发扬传统的优势,又可以激励现代青年人,对于人类的优秀文明遗产薪火相传、永不熄灭!
近1年指导学生的毕业论文题目 • 天文信息学之研究——基于时间序列分析的太阳黑子规律研究(2012, 沈伟立) • 天文信息学之研究——数据挖掘在恒星光谱研究中的应用(2012,熊斐影) • 运用决策树算法对太阳射电辐射流分类的研究(2012,叶锐林)
致谢 • 1. • 2.
参考文献 • 崔辰州、赵永恒、赵刚、张彦霞:“虚拟天文台的技术进展”,天文学进展,Vol.20.,No. 4,2002年12月; • [美]Ryszard S.Michalski Ivan Branko Miroslav Kubai等著,朱明等译,“机器学习与数据挖掘:方法和应用”。 • 著名科学史家席泽宗先生逝世,《自然科学史研究》第28卷,第2期(2009年):133-134 • http://www1.ihns.ac.cn/members/xizez/xizez.htm • 瓦维洛夫著,伽利略,苏联大百科全书选译,1954年6月:8
Thank You for Your Attention! Q&A e-mail: xqingj@gdufs.edu.cn