390 likes | 871 Views
Jennifer APM Java 应用程序性能监控解决 方案. 目录. Jennifer 是什么 ? Jennifer 产品理念 Jennifer Application 性能管理解决方案的适用范围 Jennifer 的主要机能 实时综合性能监控 AP 服务器障碍诊断 / 性能低下原因分析 / 障碍原因分析 服务激增时的自动负荷控制 ( PLC ) 应用程序 / SQL 查询监控 报告 / 能力规划 / 负载趋势分析 Jennifer 的系统构成. Jennifer 是什么 ? Application 性能管理解决方案.
E N D
目录 • Jennifer是什么? • Jennifer产品理念 • Jennifer Application性能管理解决方案的适用范围 • Jennifer的主要机能 • 实时综合性能监控 • AP服务器障碍诊断/ 性能低下原因分析 /障碍原因分析 • 服务激增时的自动负荷控制(PLC) • 应用程序/ SQL查询监控 • 报告/能力规划/负载趋势分析 • Jennifer的系统构成
Jennifer是什么?Application性能管理解决方案 • Jennifer是专为J2EE Web应用系统开发的,充分利用「实时综合性能监控机制」来实现性能管理的解决方案。
产品对系统运行状况进行实时综合监控的工具 对象Web应用服务器上运行的J2EE系统 工具为保证系统的安定运行及问题发生时能得到迅速有效的解 决,而提供各种信息的工具 特征提供可直观判断的监控机能 适用范围开发、测试到运用阶段,皆可适用 Jennifer产品理念
J2EE Application的课题与Jennifer的必要性 效率化 可视化 稳定化 • 商务环境与系统状况 • IT人才不足 • 外包项目的增多 • 短期项目的增加 • 低预算 • 寻求高品质 • 系统的大规模化及复杂化 • 大型机向Web应用的转变 • 开源代码、架构化的使用,使外部依存性逐步变大 • 由于开发方式、方法的变化,使工作更加复杂 • 依据主动式管理模式,商务应用性能低下及系统当机的风险必须降低
Jennifer Application性能管理解决方案的适用范围 应用 Jennifer Eclipse JUnit JMeter 应用 AP服务器 JP1 中间件 OS/网络 系统 开发 测试 运用 编码/开发 单体/机能 测试 结合测试 性能测试 负载测试 系统发布 监控 维护 开发人员 QA/检测人员 系统管理员
为解决问题所投入的成本,到了后期会逐步增加!为解决问题所投入的成本,到了后期会逐步增加! Require- ments Functional Test Coding Design 50 % 40 % Fault Origin 10 % Fault Detection 50 % 7 % 25 % 5 % 3 % 10 % 20 KDM Cost per Fault 12 KDM 1 KDM 1 KDM 1 KDM 6 KDM System Test Field Use 源于:Carnegie Mellon University Software Engineering Institute 1 KDM = 1,000 Deutsch Marks
Downtime原因 Cost of Downtime • 由于应用程序的BUG、错误,所频繁引起的系统停滞 • 由于应用程序停滞直接导致大量成本的发生 源于:Infonetics Research, 2004
更为具体的性能课题 数据库 Apps服务器 构成? EJB调用多? JDBC? HTTP Server 事务 服务器 Web 哪里的原因? 超出预想以外的 流量? 事务处理延迟? CPU的负载? 应用的增加? 安全服务器是 瓶颈吗? 安全认证 服务器 AP服务器
Jennifer主要机能 • 实时的综合性能监控 • AP服务器障碍诊断/ 性能低下原因分析/ 迅速的障碍原因分析 • 服务急增时自动负载控制(PLC) • 应用程序/ SQL查询监控 • 报告/能力规划/负载趋势分析
Jennifer系统构成 JenniferAgent • 在监视对象系统服务器上安装,向JenniferServer传输各种性能数据信息。 Jennifer Server • 收集并记录从Jennifer Agent获取的实时数据,根据该数据对各系统进行监控 JenniferClient Console • 在Web浏览器上表示从JenniferServer获得的信息 NOTE:Jennifer的License是以监控对象系统(被安装有Jennifer Agent的AP服务器)为单位。 JenniferServer推荐规格(根据Agent数量、数据保存时间) Windows 2003/2008 Server、Linux 内存 : 1024MB以上(推荐2048MB以上) CPU : 1.3GHz以上(推荐2.0GHz以上)
仅在一个画面内,即可监控系统的整体状况 实时综合性能监控 Demo
聚焦Active Service画面(例:通过放大Active Service画面来进行更详细的确认) 特定的Active Service数及服务所用的时间,被用不同颜色(4种)表示为可直观判断的实时图形鼠标双击后,即刻显示出对象的详细信息列表进而表示出更加详细的信息 • 鼠标双击! 再次双击! • IP、处理时间、SQL查询时间、CPU使用量、程序名等 • 可确认执行中的Class/ Method堆栈等信息
用户自定义架构的定义形综合画面dashboard 依据各个作业人员的具体分工、可自定义每个成员的监控界面 ①以用户或组的形式自定义操作界面(例:DB担当者的定制) ②柔和的界面构成及编辑 • 已制作完成的DB担当者Tab中,可组成或编辑与DB担当者工作相关的功能模块 • 担当者担当者のTab页的制作(例:DB担当者) デモ
可以浏览全部请求事务(Transaction)的X-VIEW画面工具 可以浏览全部请求事务(Transaction)的X-VIEW画面工具 • 可以对鼠标所选择的区域进行更为详细的诊断 • 可直观地判断出瓶颈所在(位于X-VIEW上方的事务处理) AP服务器障碍诊断、性能低下原因分析及障碍原因分析 表示出被选择的请求事 务详细情报列表 • Client IP • SQL查询执行时间 • CPU响应时间 • 程序名等 X-VIEW 10件被表示 选择10个请求事务! 表示所选1件程序的详细信息 详细信息 • Class/Method的Profile • 详细的SQL查询执行信息 • 响应时间 • CPU使用时间 • 错误信息等
AP服务器障碍诊断、性能低下原因分析和障碍原因分析AP服务器障碍诊断、性能低下原因分析和障碍原因分析 例:可直观判断瓶颈位置(位于X-VIEW上方的事务处理) 不是针对Transaction进行数据统计,而是利用Transaction数据分布图形来直观有效地进行的分析和确认 X-VIEW X-VIEW 例:DB数据库被Lock 的情况下 X-VIEW X-VIEW X-VIEW 例:由于资源不足而处理超时的情况下
AP服务器障碍诊断、性能低下原因分析和障碍原因分析AP服务器障碍诊断、性能低下原因分析和障碍原因分析 通过X-VIEW可以查看历史时点的Transaction的状况 设定日期 设定时间 应答时间 Demo 时间
服务急增时自动负载控制(Peak Load Control) 服务急增时,由于设定了自动负载控制(PLC)的峰值,在系统不停滞的状态下实现服务安定化。 PLC工作 优先度高 拒绝 优先度中 峰值 AP 服务器 Web服务器 仅允许设定范围内的数值 拒绝 活动的服务 优先度低 拒绝的服务 Demo
按照业务分类使优先度Group化,按照优先顺序管理业务处理按照业务分类使优先度Group化,按照优先顺序管理业务处理 服务急增时自动负载控制(Peak Load Control) 优先度高 优先度中 峰值 優先度高 优先度低
对每个Application及SQL的使用状况,可按日期或时间进行监控对每个Application及SQL的使用状况,可按日期或时间进行监控 Application&SQL的监控 选择日期 选择时间 监控结果表示 • 服务请求数 • 失败数 • 应答时间总计 • 平均应答时间 • 标准偏差 • 最小/最大应答时间 • 平均CPU使用量 • CPU总计 • 平均tpmC使用量
内存泄漏原因分析机能1/2 • 内存泄漏首要解决方法是分析HEAP DUMP。例如旧版本的JDK不能进行HEAP DUMP的分析,Jennifer提供了Collection的监控机能 ・Collection监控机能是指,使用Collection Class的Elements数超过设定值时、 在JVM中用Stack Trace与Application相结合的方式,追踪内存泄漏的功能 • Collection的对象内容,全部可用CSV等工具进行下载
通过有效的方式( → → )把握Heap内存增加的原因 内存泄漏原因分析机能2/2 Heap内存 对导致内存增加的应用程序 进行Stack Trace 一致 • 对内存增加原因追踪 • Vector, Hashtable • HashMap, TreeMap • LinkedList, ArrayList • TreeSet • Live Object LiveObject
通过简单地确定Application中的多种性能故障类型,可更简便地修正程序 通过简单地确定Application中的多种性能故障类型,可更简便地修正程序 Application错误的监控 哪日的错误? 多种障碍类别 何时发生的错误? • 未释放 • Connection / • Statement / ResultSet • 错误/例外事项 • (Exception)Log • 特定SQL错误(Exception) 错误类型的详细信息? 详细错误内容? Demo ④的详细信息以件为单位表示 ④中被选定错误的发生日期? ④中被选定错误的发生日期内的时间分布?
利用可定制的报告机能,用包含可视化图表内容在内的Word文件 (RTF文件格式)作成报告模版。 Heading Text Heading Text Select ... from ... Select ... from ... Tail Text Tail Text 报告模版 通过报告模版分析性能1/2 . . .
依据性能分析,进行负载趋势分析及能力规划2/2依据性能分析,进行负载趋势分析及能力规划2/2 • 在DB数据库中保存性能数据,并对数据加工后进行负载趋势分析和能力规划 Jennifer 性能数据 其他监控数据 综合性能分析 业务数据
用Jennifer去解决遇到的问题 • 直接观察使用情况 • 实现运用状况的定量化 • 容易理解、容易使用的工具 • 运用管理者也可以直接锁定瓶颈 • 直接联络应用开发人员 • 应用开发与运用之间的经验共有 • 问题发生时、不再现地解决问题 =>综合监控界面 =>通过简单点击、可直观地看到图形画面 =>响应时间的分布图 =>从开发到运用阶段皆适用 =>应答时间的图形化分布
Jennifer导入后的效果 • 实现系统性能优化、验证服务器性能状况 [开发及测试] • 通过APM工具进行品质管理 • 削减开发及测试的成本(进行有效的测试) • 监控性能的变化、维持并管理品质[运用阶段] • 全体人员都将成为专家 • 实现主动的专业化管理、防止性能故障的发生 • 缩短故障的解决时间 • 开发及测试、以及运用中,通过同一工具实现连续的性能管理 • 开发及测试中的经验及成果,同时在运用过程中继续灵活使用(削减运用成本)
A银行 对A银行22个业务的120WAS进行综合监控。其中6个业务的TUXEDO监控由Remon适配器构成。 Jennifer System CRM 实时/周期性的 数据传输 CRMJennifer Server Jennifer Agent(WebSphere) REMON 负责人员 Call center 实时/周期性的 数据传输 CallCenter Jennifer Server Jennifer Agent(WebSphere) 综合管理 Jennifer Server REMON ITSM 受信 实时/周期性的 数据传输 受信Jennifer Server Jennifer Agent(WebSphere) REMON 事件传送 ... 实时/周期性的 数据传输 TuxedoJennifer Server MS,关联,Obank TUXEDO REMON Tuxedo负责人
B银行 可适用于B银行的7个业务的35WAS监控。以企业型银行业的Jennifer・综合管理为目标调整画面构成。 Jennifer System 实时/周期性的 数据传输 个人银行Jennifer Server DB 个人银行 Jennifer Agent(WebSphere) REMON 实时/周期性的 数据传输 按照部署分类的负责人 企业银行 (综合管理)Jennifer Server DB 企业银行 Jennifer Agent(WebLogic) REMON 实时/周期性的 数据传输 Home PageJennifer Server DB Home Page Jennifer Agent(WebLogic) REMON 系统部 信用卡Jennifer Server 实时/周期性的 数据传输 DB 信用卡 Jennifer Agent(WebLogic) REMON
C银行 对C银行的个人业务、企业业务、BRS系统等9个业务的45WAS上使用JENNIFER进行综合业务监控。 1个Jennifer服务器即可综合监控所有的WAS。 Jennifer System 实时/周期性的 数据传输 个人银行 Jennifer Agent(WebSphere) REMON 企业银行(综合管理)Jennifer Server 企业银行 实时/周期性的 数据传输 DB Jennifer Agent(WebSphere) 负责人 REMON 实时/周期性的 数据传输 BRS Jennifer Agent(WebSphere) REMON 数据中心
结论 使用Jennifer监控管理应用,引领行业! • Application监控效率化 • Application可用性的确保 • 障碍发生时故障解决更简便 监控台的综合View 使用PLC控制Application的负载 监控台与应答时间分布图相结合
THANK YOU THANK YOU ! Contact Information 北京德勤正源科技有限公司 技术总监:王超 Tel : 010-62909225 Mobil:13501256782 Email: chaowang.cn@139.com