1 / 20

真假大数据

真假大数据. 谢文 2012.10. 历史的经验值得注意. 1999-2001 :真假互联网 2003-2005 :真假 ISP 2007-2009 :真假 WEB2.0 2010-2011 :真假电子商务 2012-2014 :真假大数据?. 讨论大数据的时态. 过去时 — “大数据古已有之,在物理学,生物学,医药业等领域已经搞了几十年了。” 完成时 -- “我们能够提供从硬件到软件再到方法的完整大数据解决方案。” 进行时 -- “我们正在加大投入,在数据获取,存储,整合,挖掘等方面发奋努力。”

hedda-mccoy
Download Presentation

真假大数据

An Image/Link below is provided (as is) to download presentation Download Policy: Content on the Website is provided to you AS IS for your information and personal use and may not be sold / licensed / shared on other websites without getting consent from its author. Content is provided to you AS IS for your information and personal use only. Download presentation by click this link. While downloading, if for some reason you are not able to download a presentation, the publisher may have deleted the file from their server. During download, if you can't get a presentation, the file might be deleted by the publisher.

E N D

Presentation Transcript


  1. 真假大数据 谢文 2012.10

  2. 历史的经验值得注意 • 1999-2001:真假互联网 • 2003-2005:真假ISP • 2007-2009:真假WEB2.0 • 2010-2011:真假电子商务 • 2012-2014:真假大数据?

  3. 讨论大数据的时态 • 过去时—“大数据古已有之,在物理学,生物学,医药业等领域已经搞了几十年了。” • 完成时--“我们能够提供从硬件到软件再到方法的完整大数据解决方案。” • 进行时--“我们正在加大投入,在数据获取,存储,整合,挖掘等方面发奋努力。” • 将来时—“大数据不仅是网络业的未来,而且是整个社会和经济发展的未来,现在应该开始讨论,研究,尝试这个方向的问题了。”

  4. 讨论大数据的时点 大数据热反映出人们在猜测追寻下一个大创新

  5. 什么不是大数据 • 数据大不等于大数据 • 现有设备,技术,方法所能处理的不是大数据 • 数据挖掘,精细化运营,精准广告和个性化服务推广不是未来大数据服务商业模式的主要部分

  6. 大数据的描述性定义 • 三V定义 • 多样性(Variety) • 体量(Volume) • 速度(Velocity) • 第四个V • 价值(Value)

  7. 大数据的操作定义 • 多样性 • 数据来源多样性—-超出一种服务,一个公司,一个地区 • 数据种类多样性—-文字,语音,图表,图片,视频 • 数据对象多样性---个人,商业,社会,自然界 大数据的多样性越高,潜在价值就越大

  8. 大数据的操作定义 • 体量 • 以TB为基本计量单位 • 数据间关系众多,结构复杂,变化多端 大数据的体量越大,潜在价值就越大

  9. 大数据的操作定义 • 速度 • 数据种类每年翻番 • 数据体量每年翻番 • 单位数据获取的成本每年减半 • 单位数据存储的成本每年减半 • 单位数据利用的成本每年减半 大数据的增长速度越高,潜在价值就越大

  10. 大数据认识误区 • 只从多样性,体量和增长速度上把握,无法说清普通数据与大数据的本质区别 • 脱离产业发展和社会进步的大背景,孤立讨论大数据无法说明其重要性 • 只能看到现有产品和服务的改进和完善前景,看不到产业创新和价值链重组的巨大空间 • 需要不断重新定义大数据

  11. 虚假大数据—一维数据 个人数据 Email 博客 照片 行为记录 物质世界数据 商品 地理 时间 自然 社会数据 法律,财经信息,新闻,公共服务

  12. 半真半假大数据—二维数据 个人数据 物质世界数据 电子商务 定位服务 信息终端 天气预报 物联网 地图服务 社会数据 微博 电子政务 网络游戏

  13. 真正大数据—三维数据 个人数据 物质世界数据 FACEBOOK 移动终端 谷歌街景 DATA.GOV 社会数据

  14. 大数据概念定义 • 大数据是以TB为基本计量单位且以年增长量至少翻番的互联网动态三维数据,这三维是个人,社会和物质世界,即 • BD=f(I,S,M, N2)/TB • I=个人数据 • S=社会数据 • M=物质世界数据 • N=年数 • TB=数据计量单位

  15. 大数据的创新难点 • 如何低成本高效率地实现数据标准化,开放化和通用化 • 如何冲破个人隐私,商业利益,行政垄断的限制,实现数据的低成本,高效率,大规模的聚集和整合 • 如何从现有商业模式的改良和运营精细化专为商业模式的创新 • 凡是在以上三方面具备创新想法和实施能力的公司都有投资价值,如历史上的谷歌,苹果,亚马逊和FACEBOOK

  16. 大数据雏形例证之一 • “美国宾夕法尼亚大学宣布用改进的3D打印技术打印出了鲜肉,这种利用糖、蛋白质、脂肪、肌肉细胞等原材料打印出的肉具有和真正的肉类相似的口感和纹理。” ----英国每日邮报(2/7/12) • 既然食品可以数据化生产,还有什么不能? • 大数据的边界被扩大了,主角未必是网络公司 • 在制造成本降低后,大规模推广仍然需要依托互联网进行 • 传统零售业会消失吗?

  17. 大数据雏形例证之二 • “一家名为气候公司的创业企业每天都会对美国境内超过一百万个地点,未来两年的天气情况进行超过1万次模拟。随后,该公司将根系结构和土壤孔隙度的相关数据,与模拟结果相结合,为成千上万的农民提供农作物保险。” ----美国纽约时报(30/8/12) • 全新商业模式,大幅降低成本,提高利润 • 需要利用自然的,商业的,个人的,公共的数据 • 租用亚马逊公共云服务

  18. 大数据雏形例证之三 • 美国南加大教授成功地在26小时内使用龙门吊式专业3D打印机打出一所可以居住的独立住宅,包括水电管线和内外部基本装修。房屋强度是传统方式的8倍,建造成本是传统方式的60%。 ----美国建筑学年会报告 • 既然房屋可以数据建造,还有什么不能? • 远距离个性化设计,无数参考模型,所见即所得 • 降低建筑业专业门槛和专业人才需求

  19. 斗胆预测 • 2013年是大数据时代元年 • 2015年左右大数据必有大创新出现 • 2020年前后必有大成功公司上市

  20. 谢谢

More Related