260 likes | 374 Views
网络 科学的发展新动力 : 大数据和众包. 刘肖凡, 副教授 东南 大学计算机科学与工程学院. 内容提要. 网络科学是一门什么科学 大数据给网络科学带来的机遇 大 数据给网络科学带来的冲击 众 包模式:分享数据的快乐. 网络科学是什么?. 网络科学从哪来. 研究对象 : 复杂 系统的组成和运作原理 早期的方法:还原论. Descartes held that non-human animals could be reductively explained as automata — De homine , 1662. 网络科学从哪来.
E N D
网络科学的发展新动力:大数据和众包 刘肖凡,副教授 东南大学计算机科学与工程学院 南京四校-微软亚洲研究院学术论坛
内容提要 • 网络科学是一门什么科学 • 大数据给网络科学带来的机遇 • 大数据给网络科学带来的冲击 • 众包模式:分享数据的快乐 南京四校-微软亚洲研究院学术论坛
网络科学是什么? 南京四校-微软亚洲研究院学术论坛
网络科学从哪来 研究对象:复杂系统的组成和运作原理 早期的方法:还原论 Descartes held that non-human animals could be reductively explained as automata — De homine, 1662. 南京四校-微软亚洲研究院学术论坛
网络科学从哪来 研究目标:复杂系统的组成和运作原理 近期的方法:复杂性理论 • 协同学 Synergetic • 混沌理论 Chaos Theory • 自组织临界理论 Self-Organized Criticality • 分形论 Fractals …… 南京四校-微软亚洲研究院学术论坛
网络科学从哪来 微观尺度上的一些发现,如:六度分隔 南京四校-微软亚洲研究院学术论坛
网络科学的视角 点 边 将系统中的个体抽象为 点 点与点之间由 边 相连 从简单的结构中得出复杂的性质 图论的再发展 南京四校-微软亚洲研究院学术论坛
大数据给网络科学带来的机遇 南京四校-微软亚洲研究院学术论坛
数据支撑网络科学发展 • 微阵列(Microarray) • 蛋白质组学 • 移动电话位置、通话记录 • 社交网站上的好友关系、兴趣爱好 …… 南京四校-微软亚洲研究院学术论坛
互联网:最复杂的计算机网络 南京四校-微软亚洲研究院学术论坛
社交网络:关于我们自己 南京四校-微软亚洲研究院学术论坛
万维网:最大的知识网络 南京四校-微软亚洲研究院学术论坛
代谢网络:生命的运转 南京四校-微软亚洲研究院学术论坛
大数据给网络科学带来的冲击 南京四校-微软亚洲研究院学术论坛
数据制约网络科学发展 • 大数据、少主人 • 敏感数据 • 定制工具 • 无法重复 • 无法验证 南京四校-微软亚洲研究院学术论坛
谁掌握了大数据 • 1999年Barabasi小组获取互联网AS层结构数据 • 2008年Barabasi小组获取移动电话位置数据 • 2013年华东理工周炜星小组获取中国移动通信公司的590万用户手机通话记录 南京四校-微软亚洲研究院学术论坛
没有数据的人在干什么 南京四校-微软亚洲研究院学术论坛
众包模式:分享数据的快乐 南京四校-微软亚洲研究院学术论坛
众包项目模式 • “众包” 是一种分布式的问题解决模式,指的是一个公司或机构把过去由特定人员执行的工作任务,以自由自愿的形式外包给(通常是网络上的)非特定大众的做法。 • 有什么好处?同一套数据、多种视角 南京四校-微软亚洲研究院学术论坛
著名众包模式案例 南京四校-微软亚洲研究院学术论坛
著名众包模式案例 • 在线社交网络 • 恐怖分子社交网络 • 婚恋网站推荐算法 南京四校-微软亚洲研究院学术论坛
阿里数据平台创新大赛 • 电子商务交易记录 • 用户间商务通讯记录 • 云计算平台 • 统一的工具软件 • 允许自带工具 南京四校-微软亚洲研究院学术论坛
众包模式的双赢局面和局限性 • 科学家获取了数据 • 公司获得了想法 • 数据经过加工 • 数据颗粒较粗 南京四校-微软亚洲研究院学术论坛
结语 南京四校-微软亚洲研究院学术论坛
结语 • 科学的发展依赖数据量的积累 • 大数据需要采集,更需要分享 • 众包项目模式是未来的发展趋势 南京四校-微软亚洲研究院学术论坛
网络科学的发展新动力:大数据和众包 刘肖凡,副教授 东南大学计算机科学与工程学院 南京四校-微软亚洲研究院学术论坛