250 likes | 456 Views
EMC 的大数据解决方案. 2014/9/1. 什么是 大数据 ? EMC Greenplum 简介 DB 软件架构介绍 行业解决方案 实际案例分享. 2. 2014/9/1. 什么是 大数据 ?. 什么是大数据?. 数据大( Volume ) 时效性高( Velocity ) 种类和来源多样化( Variety ). EMC & Greenplum ?. 2014/9/1. 是一家 数据库软件 公司。 在全球 数据处理和 BI/DW 领域,提供容量最大、 速度最快、 性价比最好的 数据仓库引擎产品和咨询服务.
E N D
EMC的大数据解决方案 2014/9/1
什么是大数据? • EMC Greenplum简介 • DB软件架构介绍 • 行业解决方案 • 实际案例分享 2 2014/9/1
什么是 大数据?
什么是大数据? 数据大(Volume) 时效性高(Velocity) 种类和来源多样化(Variety)
EMC &Greenplum? 2014/9/1
是一家数据库软件公司。 在全球数据处理和 BI/DW领域,提供容量最大、 速度最快、性价比最好的 数据仓库引擎产品和咨询服务
2010年 EMC公司收购Greenplum EMC公司是全球信息基础架构技术与解决方案的领先开发商与提供商,是全球最大的企业存储设备和软件提供商。 2014/9/1
EMC Greenplum大数据三部曲 2014/9/1
Greenplum Product Line 2014/9/1
报表和分析 • MicroStrategy • Arcplan • Business Objects • Cognos • Hyperion • SAS • Insight 典型的数据分析体系架构 业务系统 数据移动、抽取、转换、加载 (ETL) 运营系统 Oracle ERP DB2 Informatica DataStage AbInitio Pervasive Segent SCM SQLServer CRM MySQL Postgres OA,HR… 集成数据库、存储和硬件于一体 2014/9/1
全球各地的代表性客户 12
DB软件架构介绍 2014/9/1
完全不共享 例如: Greenplum 共享磁盘 例如: Oracle RAC 完全共享 例如: SMP服务器 网络 Master DB 网络 DB DB DB DB DB DB DB DB SAN/FC 磁盘 SAN/共享磁盘 磁盘 磁盘 磁盘 磁盘 Share-Nothing的完全并行架构 注:所有的共享资源都用蓝灰色表示
Greenplum 基础架构MPP 每一个存储节点都是独立的数据库(无共享) 在存储节点和Master主机之间交换数据 应用程序通过Master主机访问数据 MPP=Massive Parallel Processing海量并行处理结构 Query Plan 2014/9/1
MPP/无共享架构的优势 • 最易于扩展的架构 – 云数据库和数据分析的最佳选择 • 自动化的并行处理机制 – 内部处理自动化并行,无需人工分区或优化 – 加载与访问方式与一般数据库相同 • 数据分布在所有的并行节点上 – 每个节点只处理其中一部分数据 • 最优化的I/O处理 – 所有的节点同时进行并行处理 – 节点之间完全无共享,无I/O冲突 • 增加节点实现线性扩展 – 增加节点可线性增加存储、查询和加载性能
行业解决方案 2014/9/1
行业商务智能解决方案 电信 零售 政府 金融服务 • 信息传播 公民服务 国家安全 电子政务 • 人力资本管理 法规实施和监管 合规性报告 • 欺诈检测 客户报表 电汇通知 分部记分卡 • 资产组合分析 客户关系管理、 收购和盈利率 欺诈分析 客户流失分析 响应时间 流量分析 产品关联/捆绑 预防亏损 优化供应链 存储运营分析 客户忠诚度计划 协作规划和预估
实际案例分享 2014/9/1
谢谢观看 24 2014/9/1