370 likes | 536 Views
面向下一代互联网的网络管理研发实践. 2011.11. 项目背景介绍. 提纲. 总体建设方案. 系统设计及实现. 功能及相关说明. 总结与展望. 项目背景. 针对 CNGI 下一代互联网络在网络管理方面存在的迫切需求,支持 IPv4/IPv6 协议栈, 提供 网络拓扑、设备性能 、 资源配置、实时告警 等监控和管理 手段 , 以充分保障下一代互联网网络运行的可靠性、稳定性、高效性。. 3. 需求分析. CNGI/CSTNet 科研网络 连接院内外 100 家科研单位 ,范围涵盖总中心、分中心、研究所三个层次,分别对应不同的管理区域。.
E N D
面向下一代互联网的网络管理研发实践 2011.11
项目背景介绍 提纲 总体建设方案 系统设计及实现 功能及相关说明 总结与展望
项目背景 针对CNGI下一代互联网络在网络管理方面存在的迫切需求,支持IPv4/IPv6协议栈,提供网络拓扑、设备性能、资源配置、实时告警等监控和管理手段,以充分保障下一代互联网网络运行的可靠性、稳定性、高效性。 3
需求分析 CNGI/CSTNet科研网络连接院内外100家科研单位,范围涵盖总中心、分中心、研究所三个层次,分别对应不同的管理区域。 功能需求包括拓扑、流量、故障、配置等方面,需求一致性高,与业务的关联性弱,便于统一建设。 采用给每个单位安装一套网络管理系统的方式,不仅部署费用昂贵,后期的升级维护成本很高。 各研究所又有各自的个性化需求,要求建设过程充分考虑可扩展性及开放性。
单机式网管 VS 统一式网管 ID 比较点 单机式网管 统一式网管 第 5 页
技术路线 SaaS的增长 • 成熟的应用 • 没有复杂的IT • 按需付费 • 协作平台 • 无隐形成本 • 立即上手 安装应用 带来麻烦 成熟的技术 • 网络的高带宽 • 面向服务的架构和Web技术的发展 • 可扩展的技术架构 • 富客户端应用 • 高总拥有成本 • 安装复杂 • 集成复杂 • 响应缓慢 本项目基于SaaS(软件即服务)的设计思想,将网管软件部署为服务并通过互联网提供访问入口,从而为研究所用户提供在线的网络管理平台。研究所可以通过互联网使用这个平台。 SaaS是Software-as-a-service(软件即服务)的简称,它是一种通过Internet提供软件的模式,对于许多小型单位来说,SaaS是采用先进技术的最好途径,它消除了单位购买、构建和维护基础设施和应用程序的成本和需要。
项目背景介绍 提纲 总体建设方案 系统设计及实现 功能及相关说明 总结与展望
基于云服务的网络管理系统——设计目标 在线使用,每个研究所均认为拥有一套独立的网管系统 支持100个以上研究所的监控管理能力,支持IPv4/IPv6双栈网络的管理 软件提供模式 监控能力 研究所数量及监控单元的需求提升时,可以线性扩展提高处理能力 • 能够实现网络监控分钟级的实时性要求,正常运行时间达到99.99%以上 高可靠/高性能 支持动态扩容 第 8 页
总体建设方案 • 采用云+端的方式建设云网管平台 • 云:采集、接收、处理、存储并提供展示服务,称为网管中心; • 端:采集、预处理、临时存储、临时访问入口,称为采集探针;
网管中心部署方案简介 • 包括云资源管理区(M区) + 云计算区(A区) + 采集数据接收器区(双机热备C区) + 存储区(S区) • M区职责:管理A区、C区、S区之间的资源使用关系,用户信息等,实现了集群的状态监测、自动部署、任务分配、在线扩容等功能。 • A区职责:运行相关进程,这些进程完成实际的接收、采集等任务,并统一进行保存,这些进程构成了统一的服务层完成基于IPv4/IPv6的网管服务。 • C区职责:采集数据动态定向到A区。 • S区职责:存储区(存储数据库数据文件、M区资源关系数据镜像、用户信息、A区计算关系数据及规则数据、采集的所有数据)
项目背景介绍 提纲 总体建设方案 系统设计及实现 功能及相关说明 总结与展望
系统整体方案 • 云平台自监控及自恢复 • 服务能力注册 • 任务分配与调控 • 采集器的远程管理 控制单元 集群管理、服务管理 网络连接 服务单元 采集、接收、处理、web服务 ... ... 外部数据源 探针发送、主动采集
IPv4/IPv6网络运行管理系统模块关系 短信 Web应用 模型管理 WEB展示 邮件 告警处理 告警发布 告警关联 告警过滤 告警压缩 存储中心 服务管理 数据接收处理 数据接收 模型匹配 告警规则匹配 数据持久化 Socket网络接口、统一数据格式 数据采集 SNMP Ping Telnet 服务模拟 WMI Syslog 研究所采集探针 设备层
IPv4/IPv6网络运行管理系统模块关系 机器一 数据呈现 模型管理 告警发布 告警处理 数据接收处理 数据采集 自管理 • 数据采集服务 • 从数据中心通过SNMP、Ping等协议发起的数据采集任务; • 数据接收处理服务 • 接收采集数据,并进行数据模型匹配、以及告警规则匹配处理,将告警事件发送到告警处理模块,并对数据持久化; • 告警处理服务 • 对接收处理模块产生的告警信息关联、过滤、压缩等处理; • 告警发布服务 • 根据告警发布规则将相关告警通知给使用人员; • 模型管理服务 • 整个访问运算所依赖的关系模型,供其他几个服务进行调用; • 数据呈现服务 • WEB应用服务,对网管数据进行可视化呈现。
采集探针整体架构 采集探针 网络中心云平台 控制数据 数据采集 拓扑发现 internet 数据展现 网管数据 Syslog接收 探针控制 自动升级 网管数据 网管协议 本地数据库 研究所内网
采集探针服务说明 机器一 数据呈现 数据发送 数据采集 自管理 • 拓扑发现 • 完成定时对拓扑进行扫描并完成使用者提出的拓扑发现请求; • 数据采集 • 通过SNMP、Ping、Telnet、服务模拟等对被管对象进行数据采集; • 数据展现 • 内置webServer,在广域网发生故障时可以查看本地信息; • 数据发送 • 对采集到的数据进行格式化,发送到云管理中心; • 自管理 • 自身运行状态的监控;与云管理中心的通信;软件版本自动升级; • 本地数据库 • 实现数据的本地缓存,提供本地服务能力;
项目背景介绍 提纲 总体建设方案 系统设计及实现 功能及相关说明 总结与展望
系统主要功能 告警 视图 门户 资源 设备管理 配置管理 IP-MAC IP管理 性能监测 当前告警 告警查询 系统总览 编辑仪表盘 网络拓扑 机房视图 第 19 页
网管展示模块介绍 • 系统总览 • 提供TOP N性能视图、网络拓扑缩略图等;用户可自定义该首页。 • 视图管理 • 包括IPv4/IPv6拓扑视图、机房机架图等,支持丰富的网管信息关联。 • 资源管理 • 包括网络设备管理、服务器管理、IP及MAC的管理等。 • 性能管理 • 管理网络设备端口流量信息(bps、pps、丢包、错包等) ;以及Ping监控。 • 配置管理 • 对网络设备的config进行采集并保存,提供版本比较等功能。 • 告警中心 • 实现对告警的过滤、压缩、关联、级别配置等相关操作,实现统一的告警中心。 • 系统管理 • 通过账户管理等相关模块实现对系统配置信息的管理。
对网络设备的要求 • 网络设备: • 需要开启SNMP协议,如果需要端口启停功能需要snmp写权限。 • 如果需要远程ping或者配置文件备份需要开启telnet协议。 • 服务器: • Linux,Solaris,AIX,HPUnix 。 • Telnet协议: 对常见命令 sar,ps等有执行权限。 • 脚本的部署需要使用root权限。 • snmp协议:开启snmp协议(接口流量使用snmp获取)。 • windows:开启snmp协议。
对网络设备的要求 • 数据库: • Oracle,Sybase,Sqlserver,Mysql 开启jdbc协议 • 对系统表有选择权限; • DB2:开启所属服务器telnet协议监控账户需为 实例的拥有者。 • 中间件: • 开启JMX协议 • 如需要监控温湿度,需要温湿度传感器提供数据采集接口。(目前已经支持科技网在用的长英科技温湿度传感器)
网管采集探针基本需求 • 配置 • 最低需要双核CPU 2.0GHz,4G内存 • 操作系统:CentOS5.x操作系统。 • 网络:网络带宽至少128kb/s(按照500个监控对象估算)。 • IP地址:需要一个外网IP地址。 • 权限:启动探针服务时需要root权限。
项目背景介绍 提纲 总体建设方案 系统设计及实现 功能及相关说明 总结与展望
总结 云+端 云网管 IPv4/IPv6 可视化 实时性
展望 未来:融合IPv4/IPv6、有线/无线、网管/流量的综合一体化解决方案 • 2011 CNGI网络管理系统 • 云+端 • 支持IPv4/IPv6双协议栈 • 2010 全网网络监测分析系统 • DPI+Netflow
云网管系统试用 • 前提 • 部署网管探针的服务器已经准备就绪 • 提交试用申请表 • 联系方式 • 邮件:yanfazu@cstnet.cn • 电话:010-58812925