130 likes | 519 Views
Retour d’expérience Bouygues Telecom avec appdynamics. par CYRIL VANLATHEM EXPLOITANT OSS FAI. Ordre du Jour. 1 - Bouygues Telecom 2 - Pourquoi un APM sur l’OSS? 3 - Choix de l’APM d’ AppDynamics 4 - AppDynamics chez Bouygues Telecom 5 - Cas concret d’utilisation. 2.
E N D
Retour d’expérience Bouygues Telecom avec appdynamics par CYRIL VANLATHEMEXPLOITANT OSS FAI C. VANLATHEM - PAUG JUIN 2013
Ordre du Jour 1 -Bouygues Telecom 2 - Pourquoi un APM sur l’OSS? 3 - Choix de l’APM d’AppDynamics 4 - AppDynamics chez Bouygues Telecom 5 - Cas concret d’utilisation C. VANLATHEM - PAUG JUIN 2013 2
Les chiffres clefs C. VANLATHEM - PAUG JUIN 2013 3
Les chiffres clefs C. VANLATHEM - PAUG JUIN 2013
Pourquoi un APM sur l’OSS Fixe Supervision basée sur les seuils IHM Ventes/ IHM PNF / IHM Cdc / Diag / … Disponibilité des frontaux OSS Vente: Eligibilité / Guichet OSS / NRM NAGIOS Demandes Référentiels clients BSS MAJ Remontées d’informations OSS Front OSS Front OSS Back OSS Back Référentiels techniques OSS Référentiels techniques OSS PFS Réseau (SMV / DSLAM / ACS / IMS / Radius HS) MAJ MAJ Provisioning Provisioning Flux de commandes Disponibilité des chaines de provisioning NAGIOS Relation operateurs partenaires QoD: Cohérence des flux et des ref OSS C. VANLATHEM - PAUG JUIN 2013 5
Outils de la famille des APM (Application Performance Management)Les critères de choix suite au POC. • Critères de choix: • Installation et paramétrage simple • Recouvrir la Diversité des technos (Java, .Net, Php, …) • Interface conviviale pour les analyses • Prix • Prise en compte des besoins du support • AppDynamicsrépondait à l’ensemble de ces points. • Mécanismeautodécouverte • Dashboard clair • Modèleéconomiquebasésur le nombre de JVM. C. VANLATHEM - PAUG JUIN 2013 6
AppDynamics chez Bouygues Telecom Périmètre d’utilisation • Provisionning FAI • 40 JVMs Principales fonctionnalités • Monitoring/Métrologie => Avoir/Donner de la visibilité • Supervision => Détecter les incidents au plus tôt • Aide au diagnostic => Réduire le délai de résolution des incidents • Aide au KP / Mesure de la performance => Anticiper les points de rupture Reste à faire pour arriver à la cible • Finaliser les métriques JMX • Créer les alertes • Interface avec NAGIOS • Personnaliser nos tableaux de bord • Prévoir le monitoring du nouveau système d’orchestration : FullfillmentOrder Management Suite de TIBCO C. VANLATHEM - PAUG JUIN 2013 7
AppDynamics chez Bouygues Telecom Gain immédiat sur le monitoring 8
AppDynamics chez Bouygues Telecom Et sur l’analyse des erreurs … 9
Cas concret sur la cause d’un figeage d’un st. • Symptôme : figeage du domaine ODYL • Impact fonctionnel : process de provisioning d’optimisation des lignes à l’arrêt. • Impact technique : beaucoup d’alarmes remontent au cockpit (support niveau 1) nécessitant des arrêts/relance fréquents • Démarche : • Analyse des erreurs via le dashboard « Errors » => pas de pbsignificatif C. VANLATHEM - PAUG JUIN 2013 10
Cas concret sur la cause d’un figeage d’un st. • Rien de significatif au niveau consommation mémoire au moment des incidents (dashboard « Memory ») • Rien de significatif au niveau temps de réponse au moment des incidents (dashboard « Slow Response Times »)
Cas concret sur la cause d’un figeage d’un st. • Observation des différents indicateurs/métriques présents sous AppDynamics : • détection d’une saturation régulière d’un pool de connexion • Ouverture d’une anomalie • Correction de l’anomalie • Rétablissement du service confirmé par les mesures Utilisation du pool de connexion sur le ST C. VANLATHEM - PAUG JUIN 2013