120 likes | 191 Views
Stato della farm di COMPASS-TS. CSNI Castel Gandolfo, 11 settembre 2001 Benigno Gobbo INFN Trieste Benigno.gobbo@cern.ch. Stato dell’ Hardware. Farm 2000 11 PC Client (2PIII @800 MHz, 2x20 GB EIDE disks, 256 MB RAM) PC Server EIDE (2PIII @700, 2x15 GB sys, 14x75 GB data, 512 MB)
E N D
Stato della farm di COMPASS-TS CSNI Castel Gandolfo, 11 settembre 2001 Benigno Gobbo INFN Trieste Benigno.gobbo@cern.ch CSNI
Stato dell’ Hardware • Farm 2000 • 11 PC Client (2PIII @800 MHz, 2x20 GB EIDE disks, 256 MB RAM) • PC Server EIDE (2PIII @700, 2x15 GB sys, 14x75 GB data, 512 MB) • 2 PC User & Test (2PIII @800, 2x30 GB disks, 512 MB RAM) • 1 Sun (SparcIII &750, 18 GB SCSI disk, 512 MB RAM) • RAID 5 controller + 8x73 GB SCSI disks • Infrastrutture di rete e di gestione • Componenti ordinati nel 2001 • PC Server EIDE ( 2PIII @800, 2x20 GB sys, 20x80 GB data, 512 MB) • 20.217 CHF ( + 2.500 CHF 3 anni di garanzia “on-site” ) (+ spese doganali) • Upgrade PC Server EIDE (6x80 GB EIDE disks+trays) • 3858 CHF (+ spese doganali) • 19 PC Client (2PIII @1000 MHz, 2x40 GB EIDE disks, 512 MB RAM) • 2.432.500 + IVA l’uno • Ampliamento infrastrutture di rete e gestione • 4.380.000 + IVA CSNI
Stato dell’ Hardware (cont.) • Da Ordinare • Tape Library Ultrium (LTO) con 2 drive • LTO tapes • Switch gigabit ad almeno 6 porte • Upgrade Sun (+SparcIII @750, + 18 GB SCSI disk) • Upgrade di memoria a 512 MB per client vecchi CSNI
Hardware CSNI
Stato del Software • OS ed applicativi installati • RedHat 6.2 con kernel 2.2.19-6.2.7 ( RedHat 7.2 da ottobre, se release OK e CERN certification) • OpenAFS 1.0.4 • OpenSSH 2.3.0 (da Caspur) • Printing software: CUPS 1.1.9-0 • Monitoring Software: Big Brother 1.8 • Load management: Sun Grid Engine 5.3 (alpha release) • Gcc 2.95.2 • In test su un nodo: kernel 2.4.5, gcc 3.0 • CERN Software • ANAPHE 3.6.1 • Utilizziamo: Objectivity/DB 6.1, ConditionsDS 2.2.0, CLHEP 1.6.0.0 • CERNLib 2001 • CASTOR 1.3.3.0 • In test su un nodo: installazione del sw ASIS (CERNLib+CASTOR) locale mediante rpm • ROOT 3.01.02 • COMPASS Software • CORAL (programma di ricostruzione) • COMGeant (sumulazione) • DATE (software DAQ da ALICE) CSNI
Stato del Software (cont.) Farm Monitoring: Larrd su BB CSNI
Attività sulla Farm • Test di performance di accesso simultaneo ad un federated database Objectivity/DB • Ottimizzazione dello schema di riscostruzione con CORAL • Fino ad 11 client su server EIDE. Accesso via AMS • Sviluppati: • Script Perl di configurazione dei test e sottomissione dei processi via ssh • Programmi in C++ per popolazione/accesso dei DB • Script Perl per creazione, spostamento, cancellazione delle federazioni • Accesso remoto al DB delle condizioni • Implementazione della possibilità di run di CORAL locale • Utilizza Remote Method Invocation di Java • DB nella CCF (CERN), accesso da ACID (Trieste) • Idea: Programma di ricostruzione (CORAL, scritto in C++) gira su ACID ed accede al DB delle condizioni su CCF. • Prima realizzazione: client, server in Java • Poi: accesso con programma C++ via Java Native Interface CSNI
Attività sulla Farm (cont.) • Alcuni risultati • Simulazione del processo di ricostruzione di CORAL dal punto di vista del traffico su LAN da e verso DB • Ottimizzazione del numero di processi client (CORAL) per server sia in scrittura verso DB che in lettura da DB. • Ottimizzazione del Page Size • “Strano” andamento delle performances in funzione del Page Size. Confermato anche da altri test. Da investigare… • Fattibilità del run di CORAN su ACID prelevando le condizioni da CCF • Allo startup: • Determinazione della finestra temporale di validità dei dati da analizzare • Richiesta da ACID di tutte le condizioni necessarie relative all’intervallo • Raccolta in CCF delle calibrazioni necessarie • Trasferimento verso ACID delle calibrazioni • Run locale di CORAL CSNI
Attività sulla Farm (cont.) Test di lettura, Page Size 8192 Ogni cliente legge da un diverso DB (da 1.9 GB) CSNI
Attività sulla Farm (cont.) Test di performance in lettura da più container Page Size 16384 Page Size 8192 Confronto tra FDB con Page Size 8k e 16k. Ogni client legge un diverso container nello stesso DB (da 1.9 GB) CSNI
Attività sulla Farm (cont.) • Attività iniziate • Produzione MC e loro analisi con CORAL per la misura di h1 • 15 g presa dati ~ 40 M eventi “buoni” • Per produzione, storage ed analisi di circa 106 eventi • Produzione: 3.9 s/evento 1080 h CPU time ~50 h su farm attuale (~20 h su 30 nodi) • Storage: 90 kB/evento 90 GB disco • Analisi con CORAL: 2 s/evento 560 h CPU time ~25 h su farm attuale • Proseguimento sviluppo software di ricostruzione (CORAL) • Test di creazione, lettura ed update di DST da raw data • Proseguimento sviluppo software di ricostruzione del RICH1 • Test su MC e su Dati • Anche qui serve produzione di MC “ad-hoc” • Test software su piattaforme eterogenee (non possibile sulla CCF) • Ricerca eventuali bugs del compilatore • Test endianess • … • Sviluppo ed installazione tools per ripartizione della processatura sulle varie macchine CSNI
Attività sulla farm (cont.) • prossimo futuro • Processing dati RAW per test specifici (RICH1 in particolare) • Allo stato attuale, visti i tempi di event processing, la CCF del CERN risulta sottodimensionata • Analisi (m)DST prodotti (qui ed al CERN) • Produzione massiccia di MC e loro analisi per h1 • Proseguimento test colloquio ACID CCF • Nel 2002 • Studio risposta del RICH1 CSNI