610 likes | 782 Views
VANTAGE ANALYZER FOR J2EE. Presentation Overview. J2EE 운영환경 VANTAGE ALALYZER 소개 Vantage Analyzer Architecture VA Native Agent VA Nucleus Server VA Performance Console UI VA Features VA & ASM VA 활용방안 Summary. Java 현황. Java 현황.
E N D
VANTAGE ANALYZER FOR J2EE
Presentation Overview • J2EE 운영환경 • VANTAGE ALALYZER 소개 • Vantage Analyzer Architecture • VA Native Agent • VA Nucleus Server • VA Performance Console UI • VA Features • VA & ASM • VA 활용방안 • Summary
Java 현황 Java 현황 “ 모든 Enterprise 환경의 80% 가 JAVA Language 를 사용하고 있습니다. “ - GARTNER “전세계 7백만 개발자중 150만 개발자가 JAVA 를 사용합니다. “ - GARTNER “연간 20억$ 의 시장 “ - GIGA Information Group –
Database Servers Application Servers End Users Mainframe J2EE 운영환경의 문제점 • 점점 더 복잡하게 변화하는 J2EE 환경 • 성능을 관리하고 문제를 진단하는데 어려움 • 새로운 환경에 대한 경험부족이 문제를 가중시킴 • 잦은 애플리케이션의 업그레이드로 인한 시스템 불안정 JSP Servlet EJB SQL
J2EE 성능 문제 • J2EE 애플리케이션 서버는 Black Box? • 시스템 또는 종속된 하위 시스템이 예상치 못한 문제를 일으킬때 어떻게 근본 원인을 찾아낼 수 있는가? ActionServlet AccountEJB SQL SQL Transaction Time
Developer Tester • Concerns: • Ensure code meets performance goals • Implement Best Practice performance solutions when not meeting goals • Examples: • What code is causing my transaction to take 2x longer when I have concurrent requests? • Concerns: • Baseline System – Obtain Performance Metrics • Load Test System – Pinpoint bottlenecks • Ensure system meets performance Goals • Examples: • Where is the system bottleneck when I increase the # of virtual users? Administrator Management Team • Concerns: • Ensure SLA’s and user expectations are being met • Examples: • Which system is not responding correctly? • Which SQL statements need tuning? • Concerns: • Customer Satisfaction • Examples: • Are we meeting our SLA’s? • Which systems need to be targeted for performance optimization? Key J2EE Stakeholders Baseline System Isolate Problem Areas Performance Tuning Cycle Measure Change Adjust
J2EE Management Challenges • 애플리케이션의 내부를 보아야 함. • 모니터링 서버에 부하를 주어서는 안됨. • 애플리케이션이 다른 애플리케이션과 어떻게 연결되는지를 파악할 수 있어야 함. • JVM 의 restart 가 잦아서는 안됨. • 해당 트랜잭션에 대한 응답시간 지연부분이 J2EE 어느 부분에서 발생하는가를 찾기 위해 Class/Method/SQL 부분별 세부적으로 Hotspot부분을 찾아야 함. • 문제 분석을 위해서는 해당 포인트를 실시간 또는 저장 데이터를 통해 운영 서버에 영향을 최소화하는 상황에서 제공되어야 함.
J2EE 운영환경을 위한 Vantage • 비즈니스 트랜잭션을 위한 응답속도 모니터링. • 네트웍 애플리케이션의 모니터링 및 분석. • 웹서버, AP서버, DB서버의 주요 컴포넌트들에 대한 성능 모니터링. • J2EE 시스템의 성능 분석과 컴포넌트, CPU, 메모리, SQL 성능 측정.
Vantage Analyzer란? • Vantage Analyzer는 J2EE Production 성능 관리 솔루션. • CPU, Memory, SQL 정보 제공. • 3-Tier 분석과 성능 문제 식별. • SLA 설정 및 Alert
Vantage Analyzer for J2EE 세부 분석 기능 통합 분석 해결방법제시 운영 레벨 분석 실행상황과 운영상황 리포팅 특성파악 Real time 모니터링과 알람 Mainframe 모니터링과 이벤트 분석 상황파악 Users Web Servers App Servers Data Bases 기능
기능 • 운영시스템 모니터링 시 적은 Overhead. • 간편한 설치 및 등록 • Object 간 상호 연계 Graph 제공 (JSP-Servlet-Session/Entity 등) • Method 분석 ( 많은 리소스를 사용하는 Method 및 Sub Method) • SQL의 Hotspot 지점의 응답시간분석 및 트랜잭션 수 • 리소스 분석(CPU, JVM Heap Size등) • 실시간 트랜잭션 모니터링 기능 • 실 시간 레포트 제공 • 저장 레포트 제공 (XML, PDF 형식의 레포트 제공) • SLA설정에 따른 Alert 기능
Native Agents Overview BCI(Byte Code Instrumentation)을 이용하여 어플리케이션 서버의 JVM 성능 자료를 수집 Highlights- Native Agent 는 C/C++로 만들어져 있으며 어플리케이션 서버의 JVM 내부에서 동작함. - JVMPI를 이용하여 성능 자료 수집 - BCI를 사용하기 때문(Java가 아님)에 CPU/Memory 정보를 수집할 수 있음 - Production Mode에서 약 5%의 부하만으로 어플리케이션 서버의 성능 자료를 수집함.
Native Agents What types of data does it collect?- Method - JSPs, Servlets, EJBs (Entity/Session/Message) - SQL Queries- CPU- Memory (JVM Heap Size) Benefits- 설치가 용이함- BCI (Byte Code Instrumentation)을 사용하기 때문에 서버 부하가 적음- Agent를 재 시작하지 않고 간편하게 설정(Configuration)을 바꿀 수 있음 (유사 모니터링 tool은 설정(Configuration)을 바꾸면 어플리케이션 서버를 재시작해야 함)
Nucleus Server OverviewVANucleus Server는 Native Agent이 수집한 성능자료를 전송 받아 DB에 저장하는 중앙 관리 역할을 수행 Highlights- Proactive SLA Monitoring (Transaction Time & CPU Time)- 경고 발생시 처리 방법 설정(Operational Alert Server)SNMP Traps, e-mails, pages, etc.- 실시간 자료 수집 외에 추세 분석을 위한 Historical 자료 저장 및 관리- MReports (HTML, GIF/JPG, PDF Formats)
Performance Console OverviewVAPerformance Console은 Nucleus Server에 수집된 실시간 자료 및 historical 자료를 조회할 수 있는 Viewer 기능 제공(UI) Highlights- J2EE 성능에 대한 실시간 landscape view 제공 (JavaScape)- 항상 메모리에 90번 수행한 자료를 보관 - Performance Point Mode 1 Second Intervals - Production Mode 5 Second Intervals- 20byte 이하의 작은 크기의 Data를 Sampling할 때 사용하므로 Network 부하가 없음- 과거 시점의 문제를 분석하기 위하여 Pconsole을 이용하여 당시의 historical session 자료를 조회할 수 있음- Historical Mreports 생성
J2EE JavaScape View J2EE JavaScape View • 실시간으로 현재 트랜잭션의 Jsp – Servlet- Session/EJB/DB 호출 관계를 보여줌 • 수행이 끝난 Transaction은 화면에서 자동으로 사라짐 • 해당 트랜잭션에 대한 CLASS, Method, CPU 및 Throughput 상세 정보 제공 Click
JScape Detail JScape Method Detail - Class/Method별로 상세 정보 조회 JScape SQL Detail - SQL 문장 별로 상세 정보 조회
JavaScape by Thread View JavaScape by Thread View • 실시간으로 현재 수행중인 트랜잭션의 진행상황/Thread/CPU/JVM Memory 상황을 보여줌 • 장애 발생 시 수행이 끝나지 않고 메모리에 남아 있는 Runaway Thread 파악 가능
Transaction Explorer View Transaction Explorer View • Tree format으로 트랜잭션들에 대한 Method 및 SQL 소요 시간 통계 정보 제공 • Transaction 자체에서 수행된 시간과 하위 문장에서 수행된 시간을 구분하여 주므로 지연 발생 지점을 쉽게 분석
Transaction Explorer View Transaction Explorer View • 조회 자료 기간 - PConsole에 실행한 후부터 현재까지 • Total Wall Clock Time Percent : 전체 100%중에서 transaction이 차지하는 비중 • Total Wall Clock Not in Child Methods Percent : 전체 100% 중에서 하위 Method가 아닌 component 자체에서 차지하는 비중 • Total Invocations : 총 수행 회수 • Average Response Time : 평균 응답시간 • Total Wall Clock Time : Transaction의 총 실행 시간 = Total Invocation X Average Response Time • Total CPU Process Time : Transaction의 총 CPU 사용 시간 • Java Component Name
Transaction Scope View Transaction Scope View • 각 트랜잭션이 수행된 상황의 시간, 사용자명, IP addresses, 호출 URL 등 상세 정보 제공 • Transaction Scope 사용시 오버헤드가 거의 없으며, 설정 변경 시 AP server restart 불필요
Transaction Scope View Transaction Scope View bcde fghij1)1! 1@ 1# 조회 자료 기간 – PConsole서 TxScope 옵션을 선택한 후부터 현재까지 b TScope ID : TxScope 옵션이 선택된 후부터 수집된 자료 Seq. c Agent Name d Agent IP e Thread Name f Main Class Name GTransaction Start : Transaction 시작시간 h Transaction Start Synched : Transaction 시작이 Nuclues Server에 감지된 시간 i Duration : 응답시간 j Type : JSP or Servlet 1) Request URL 1! User IP 1@ User Name 1# VA TX Tag – Client Web Browser에 cookie를 설정한 경우 나타남.
Method HotSpots View Method Hot Spot View • 전체 Transaction 응답시간 중 가장 Resource를 많이 사용한 Method를 순서대로 나타냄 • Transaction Time %, CPU Time %, Last 90 Seconds Throughput/Second, Last 90 Seconds Average Response Time, Longest Response Time, Total Invocations 제공
Method HotSpots View Method Hot Spot View bcdefghij1)1! 조회 기간 – 옵션에서 설정 b Class Name c Method Name d Total Tx Time % : 전체 Tx. Time 100%중에서 선택된 method가 차지하는 비중 e Tx % Not In Child Calls : 전체 Tx. Time 100%중에서 하위 모듈이 아닌 자체 method가 차지하는 비중 f Total CPU Time % : 전체 CPU time 100%중에서 선택된 method가 차지하는 비중 GCPU % Not in Child Calls : 전체 CPU Time 100%중에서 하위 모듈이 아닌 자체 method가 차지하는 비중 h Last 450 sec Tx/sec : 최근 450초 동안 수행된 회수를 초당 수행 회수로 표시 i Last 450 sec Avg. Resp. Time : 최근 450초 동안의 평균 응답 시간 j Overall Avg Resp. Time : 조회 기간 동안의 평균 응답 시간 1) Longest Resp. Time : 가장 오래 걸린 응답 시간 1! Total Invoc. : 조회 기간 동안의 총 수행 회수
SQLyzer HotSpots View SQLyzer HotSpots View • 전체 Transaction 응답시간 중 가장 Resource를 많이 사용한 SQL문장을 순서대로 나타냄 • Transaction Time %, Last 90 Seconds Average Response Time, Longest Response Time, Total Invocations 제공
SQLyzer HotSpots View SQLyzer HotSpots View bcdefghi 조회 기간 – Pconsole을 시작한 후부터 현재까지 b SQL String c Using Prepared Statements : Prepared 문장 사용 여부 d Total Tx Time % : 전체 Tx. Time 100%중에서 선택된 SQL 문장이 차지하는 비중 e Last 450 sec Tx/sec : 최근 450초 동안 수행된 회수를 초당 수행 회수로 표시 f Last 450 sec Avg. Resp. Time : 최근 450초 동안의 평균 응답 시간 GOverall Avg Resp. Time : 조회 기간 동안의 평균 응답 시간 H Longest Resp. Time : 가장 오래 걸린 응답 시간 I Total Invoc. : 조회 기간 동안의 총 수행 회수
SLA Monitoring View SLA Monitoring View • Method별 SLA 설정 • SLA 위반 시 SNMP Trap, Email, Pager로 경고 전송 및 User Command 실행
SLA Monitoring View SLA Monitoring View bcdefghij1)1! 조회 기간 – Pconsole을 시작한 후부터 현재까지 b # : Seq. 번호 c SLA Name d SLA Monitoring Field : 선택된 Method Based Rule Type e SLA Limit Value : SLA 임계치 f Current Value : 현재 시점의 응답시간 GLast(NS) SLA Violation Time : 마지막 SLA 위반 시간(가장 최근) h Last(NS) SLA Violation Value : 마지막 SLA 위반 응답시간(가장 최근) i Log File Enabled : SLA 위반 시 파일로 로그 저장 여부 j Alert Enabled : Operational Awareness Alert 사용 여부 1) DB Log Enabled : SLA 위반 시 DB로 로그 저장 여부 1! External Cmd Enabled : SLA 위반 시 외부 실행 파일 실행 여부
Memory Scope View Memory Scope View • 현재 메모리에 존재하는 크기 순서대로 top 10 class/method 자료 제공 및 Allocation memory 크리 순서대로 Top 10 class/method 자료 제공 • 주기적으로 메모리 분석 정보가 갱신되며, 또한 사용자가 원할 때 수동으로 분석 가능
Memory Scope View Memory Scope View • 기본 설정은 Production Mode에서는 약 10분 주기로, Performance Point Mode에서는 약 2분 주기로 자동 분석 사용자가 수동으로 현재 시점의 메모리를 분석 bcdefghi 조회 기간 – PConsole에서 Memory Scope 옵션을 선택한 후부터 현재까지 b # : Seq. 번호 c Agent Name d Allocation Class Type : 메모리를 할당 받은 class type e Allocation Spot : 메모리를 할당 받은 class/method f Memory Utilization (Memory Leak) : 현재 사용중인 메모리 양 GCurrent Object Count : h Total Allocation Size i Last Analysis Time
MReports • MReports 예제 • 측정된 상세 자료를 PDF/HTML로 쉽게 export 가능 • CPU, Heap Memory, Methods, Servlets, SQL 정보등 상세 자료 제공
Users Web Servers App Servers Data Bases Mainframe Servlet Servlet Servlet JDBC JMS EJB EJB EJB JSP JSP JSP JSP Vantage ASM Vantage Java Diagnostics Transaction Flow
VA 의 효율적인 사용 방안 • VA의 효율적인 사용 방안 Step 1. Production Mode를 이용하여 상시 모니터링 (24x7x365) • Collection Mode는 Production Mode 선택 • Collection Option은 CPU Time만 선택 • 약 2~3%의 overhead로 trend와 analysis 정보 수집 • Agent Configuration에서선택된 JSP, EJB, SQL call과 같은 High-level component의 대한 자료 수집 • 관리자가 “Configure Production Monitoring”을 이용하여 자료 수집을 위한 method를 추가/삭제 할 수 있음
VA 의 효율적인 사용 방안 • VA의 효율적인 사용 방안 Step 2. Trouble shooting을 위하여 Performance Point Mode, TxScope, Memory Analysis 이용 • Performance Point Mode • 모든 method에 대하여 자료를 수집 (기본적으로 응답시간이 499 s 이상) • 최고 20%의 overhead가 발생할 수 있음 • SLA 위반 시 자동으로 선택되게 할 수 있음 • TxScope • Transaction Explorer는 transaction별 통계자료를 나타내지만 TxScope는 각각의 Transaction 수행 시점 별 자료를 수집함 • 시작 시간, User ID, IP Address 혹은 VA Tag Cookie별로 각 transaction을 선택하여 분석할 수 있음 • VA Tag 설정 사용자 transaction 혹은 SLA 위반 시 자동으로 선택되게 할 수 있음
VA 의 효율적인 사용 방안 • VA의 효율적인 사용 방안 Step 2. Trouble shooting을 위하여 Performance Point Mode, TxScope, Memory Analysis 이용 • Memory Scope • 잠재적 memory leak 혹은 memory 과다 사용에 대한 분석 • 부하가 많은 system에서 사용하면 많은 overhead가 발생 • SLA 위반 시 자동으로 선택되게 할 수 없으며, 수동으로 문제 발생시에만 사용
VA 의 효율적인 사용 방안 • VA의 효율적인 사용 방안 Step 3. SLA 사용 • SLA Violation Threshold : SLA 임계치 • SLA Violation Threshold : SLA 임계치와 비교되는 값 • SLA Method is Based on : SLA 대상 method
VA 의 효율적인 사용 방안 • VA의 효율적인 사용 방안 Step 3. SLA 사용 • Operational Awareness Alerts : SLA 위반 시 E-mail 발송 설정 E-mail이 한번 발송되면 앞으로 60분 동안은 발송되지 않음 • SLA Violation Persistence : SLA 위반 시 DB 혹은 File로 log 저장 • SNMP Trap : SLA 위반 시 SNMP Trap 발생
VA 의 효율적인 사용 방안 • VA의 효율적인 사용 방안 Step 3. SLA 사용 • SLA Violation External Actions : SLA 위반 시 외부 command 실행 • Trouble Shooting Actions : SLA 위반 시 Trouble shooting을 위한 옵션 선택 자동으로 Perf. Point Mode 실행 자동으로 TxScope 실행 • SLA 설정 완료
VA 의 효율적인 사용 방안 • VA의 효율적인 사용 방안 Step 4. VA Tag Cookie 사용 • VantageAnalyzer\nucleus\txtag\VATag.jsp를 Web Server로 copy • 사용자가 VATag.jsp에 접근하여 Tag 설정한 후 • 다른 transaction 수행 시 일정 시간 동안 자동으로 Performance Point Mode로 전환 가능 • 자동으로 TxScope 옵션 활성화 됨
응답시간 저하부분 분석 오랫동안 수행중인 트랜잭션 확인 실시간 Alert 이용 High CPU Utilization Bottleneck 분석 어플리케이션 확장성 점검 Memory Leak 분석 Functional (data) Issue 분석 Transaction Tagging VA 활용예제 VA 활용 예제 Vantage Analyzer
응답시간 저하 부분 분석 VA 활용방안 • 특정 transaction의 응답시간이 기대치보다 느릴 때 • 응답시간이 느릴 때 서버에 부하가 많았다면 어플리케이션 확장성(Scalability) 문제 참조 bTransaction Explorer 화면 사용 • Transaction Explorer서 transaction type별 통계 분석을 통하여 어느 부분에서 오래 걸렸는지 쉽게 분석 가능
응답시간 저하 부분 분석 VA 활용방안 cTransaction Scope 화면 사용 • Transaction Scope서 특정 시점/Agent/IP/사용자 별로 transaction 분석 가능 • 각 transaction의 응답시간을 100% 기준으로, 어느 부분에서 응답시간이 지연되었는지 나타낸다. • 통계 분석이 아닌 특정 시점의 transaction을 분석 용이 • 특정 환경/조건에서 응답시간이 느린 상황에 대한 분석에 유용
응답시간 저하 부분 분석 VA 활용방안 dHotSpot 화면 사용 • Method Hotspots와 SQLyzer Hotspots를 이용하여 어플리케이션의 문제 지점(hotspot) 쉽게 접근 • 응답시간 순서대로 정렬하여 가장 느린 응답시간을 가진 method/SQL 검색 e예제 • 특정 JSP의 응답시간이 느려졌다면, 먼저 Transaction Explorer를 열어서 대상 JSP를 검색 • 만약 대상 JSP가 전체 Tx. Time의 80%를 차지하고, 하위 문장들이 10%를 차지했다면, 대상 JSP 자체에서 응답시간이 지연됨을 의미하며, “Time not in Child”부분이 80%로 나타날 것임 • 그렇지 않다면 하위 method 혹은 SQL call에서 응답시간 지연이 일어났음을 의미 • 어느 부분이건 성능 저하의 원인을 쉽게 찾아낼 수 있다
오랫동안 실행중인 Transaction 확인 VA 활용방안 • 현재 실행중인 Transaction로 인하여 전체 어플리케이션의 성능이 저하된다면, 기존 분석 툴로는 관련 분석자료를 수집하기 힘든 상황 • 실행이 끝나지 않은 Transaction은 응답시간 등 관련 자료가 나타나지 않기 때문에 분석이 어려움 bJ2EE JavaScape 화면 사용 • J2EE JavaScape는 J2EE component(JSP, Servlet, WebService, Session, Entity, Message-Driven Beans, Database)들 간의 상호 작용을 Graph로 나타내며, 실행이 끝난 Transaction은 화면에서 서서히 지워진다. 화면이 지워지지 않음 화면이 지워짐
오랫동안 실행중인 Transaction 확인 VA 활용방안 cJavaScape by Thread 화면 사용 • 아직 끝나지 않은 transaction에 대한 thread stack 정보와 현재까지 실행중인 시간을 표시 • 기본설정에서는 Production Mode에서는 5초 이내에 실행이 끝나면 화면에 나타나지 않으며, Performance Point Mode에서는 1초 이내에 실행이 끝나면 화면에 나타나지 않음 화면이 지워지지 않음 화면이 지워짐
어플리케이션 확장성(Scalability) 확인 VA 활용방안 • 어플리케이션의 부하가 특정 수준을 넘어가면, bottleneck이 발생하여 성능 저하 발생 • 특정 method에 대한 동기화에 문제가 발생하여 Lock이 걸려 있거나 혹은 외부 자원 사용을 위한 대기 상태에 빠져 있어서 bottleneck을 유발하는 경우 • 또한 특정 SQL 문장이 느리거나, CPU 혹은 Memory등 resource 부족이 bottleneck을 유발하는 경우 b HotSpot 화면 사용 • Method Hotspots는 기본적으로 “Time not spent in child”순서대로 정렬되어 있으며,어느 method에서 응답시간 지연이 일어나는지, CPU를 많이 사용하는지 쉽게 찾을 수 있음 • SQLyzer Hotspots는 가장 오래 걸린 SQL 문장 순서대로 정렬되어 있으며, 응답시간이 오래 걸려 tuning 대상이 되는 SQL 문장들을 쉽게 찾을 수 있음
어플리케이션 확장성(Scalability) 확인 VA 활용방안 c Transaction Scope 화면과 Response Time Graph 사용 • 응답시간이 항상 느리게 나타나는지, 불규칙적으로 느려졌다 빨라졌다 반복하는지 검사 • 응답시간이 불규칙적으로 느려진다면 Transaction Scope를 이용하여 특정 트랜잭션의 성능 저하 원인을 분석한다. 응답시간이 항상 느린지 불규칙적으로 느려지는 지 확인
어플리케이션 확장성(Scalability) 확인 VA 활용방안 d예제 • 어플리케이션이 부하로 인하여 성능이 저하되고 있다고 판단되면, • 부하가 적을 때 Method Hotspots과 부하가 많을 때의 Method Hotspots를 Export • 두 시점의 응답시간 저하 부분을 비교하여, 부하가 많을 때 문제 발생 지점을 조사 • 만약 상위 method가 SQL driver class/method를 포함하고 있다면, SQLyzer Hotspots를 이용하여 오래 걸린 SQL 문장을 찾아 낼 수 있다.
High CPU utlilization bottleneck 추적 VA 활용방안 • 어플리케이션의 부하가 많아질수록 CPU에서 bottleneck이 발생할 확률도 높아짐. • Hardware upgrade를 통해서 이 문제를 해결할 수도 있지만 • 문제 발생 method를 찾아서 간단한 code 수정을 통하여 CPU/Memory 사용률을 대폭 감소시킬 수도 있음 • 간단한 예로, string concatenating 대신에 StringBuffer를 사용하여 memory 낭비를 줄일 수 있으며 과도한 XML 변환 사용을 자제하면 CPU 낭비를 줄일 수 있음 • VA는 CPU를 많이 사용하는 method를 찾기 위하여 method별 CPU 사용률을 분석 • 관리자는 Java에 대한 전문지식이 없이도 성능 bottleneck을 발생시킨 부분을 빠르게 찾아 낼 수 있으며 관련 transaction에 대한 정보를 조회할 수 있음 b Method HotSpot 화면 사용 • “CPU % Not in Child Calls” column을 click하여 상위 CPU 사용 method 순서대로 정렬