Metodi per la condivisione tra batch e interattivo

Transcript

Metodi per la condivisione tra batch e interattivo
Metodi per la condivisione
tra batch e interattivo
Mirko Corosu (INFN-GENOVA)
Riunione CCR 07 Luglio 2010
Sommario
 Breve
descrizione della problematica
 Soluzioni di integrazione delle CPU
– Soluzione statica
– Soluzione mista
– Soluzione interactive-jobs
– Soluzione load-average based
– Soluzione UI on demand
Breve descrizione della
problematica
Attivita’ di calcolo su T3



Simulazioni di piccoli campioni di eventi di segnale e
di fondo per il processo di interesse
Analisi finale degli eventi reali selezionati da
preprocessing su T0,T1 e T2
Coesistenza di diversi modelli di calcolo:
– Interattivo:
 Sviluppo e test rapido di codice in maniera interattiva
– Batch:
 Test intensivo del codice via batch system locale
– Grid (come opzione)
 Test preliminare sul nodo GRID locale
 Invio di produzioni private o di gruppo sulla GRID
Obiettivi

Funzionalita’
– L’interattivo deve avere risorse disponibili in tempi
molto brevi

Flessibilita’ di utilizzo delle risorse
– Il rapporto tra le risorse utilizzate dal batch e quelle
utilizzate dall’interattivo cambia a seconda delle
necessita' contingenti degli utenti
– Il corretto dimensionamento preventivo di una facility
per l’interattivo e’ complicato

Ottimizzazione dell’efficienza:
– Massimizzazione dell’utilizzo delle CPU

Ottimizzazione del lavoro di gestione
– Omogeneizzione dei sistemi
Integrazione delle CPU
Soluzione statica




Le macchine per l’interattivo e quelle per il batch
sono distinte
Nessun meccanismo di trasferimento delle
risorse interattivo <-> batch
Soluzione percorribile quando il carico massimo
del lavoro interattivo e’ pianificabile
Pro:
– Semplicita’ di implementazione
– Funzionalita’ dell’interattivo garantita (dimensionando
le risorse sul massimo utilizzo teorico)

Contro:
– Probabilita’ di sottoutilizzo delle risorse
– Due cluster distinti da gestire (di norma le macchine
per l’interattivo hanno una configurazione differente)
Soluzione Statica – esempio di
implementazione
 Facility
di calcolo INFN-TRIESTE:
– Non e’ Tier3 “ufficiale” ma di fatto offre
risorse di calcolo batch e interattive
– 60 nodi di calcolo dei quali:
 51 nodi batch
 2 CE Grid
 1 LSF Master
 4 Nodi per l’interattivo dedicati a singoli esperimenti
 2 Nodi per l’interattivo generici
Soluzione Mista



I nodi per l’interattivo e quelli per il batch sono
distinti
Viene implementato un meccanismo che, sulla base
di necessita’ contingenti (pianificate con un certo
anticipo), sposta risorse verso l’una o l’altra
modalita’ di accesso
Pro:
–
–
–

Flessibilita’ maggiore rispetto al caso totalmente statico
Funzionalita’ dell’interattivo garantita
Si adatta meglio di altre soluzioni a Tier 3 stand-alone
(non integrati in facility piu’ grandi)
Contro:
– Intervento manuale necessario per traferire le risorse
– Necessaria l’implementazione del meccanismo che
modifica le configurazioni dei sistemi
Soluzione Mista – possibile
implementazione


Tutte le macchine di calcolo vengono installate e
configurate allo stesso modo, tutte entrano a far parte del
cluster batch
Alcune di esse vengono escluse dalla sottomissione di job
via batch system:
– Ad esempio: 1 UI public login PROOF/ROOT + Worker PROOF



Viene implementata una interfaccia Web che permette
(previa autenticazione) di cambiare le configurazioni di
PROOF e del batch system, assegnando macchine all’uno
o all’altro cluster
Lo spostamento di risorse avviene in un tempo tale da
permettere ai rispettivi task di terminare naturalmente
L’idea e’ quella di permettere l’utilizzo dell’interfaccia ad
un “responsabile” di gruppo che, previa pianificazione del
lavoro di analisi, decide l’assegnazione delle risorse
Soluzione Interactive-jobs


Si tratta di sfruttare la possibilita’ che viene
offerta da alcuni batch system (Torque/Maui ed
LSF sicuramente) di sottomettere sui WN un job
in modalita’ interattiva.
Pro
– Garantisce l’allocazione di una CPU riservata utente per
tutta la durata della sessione
– Permette una estrema flessibilita’ nell’allocazione delle
risorse
– Ottimizza il lavoro di gestione delle installazioni e
configurazioni (necessita’ di un solo cluster)

Contro
– Non e’ ovvio configurare il sistema in modo che il job
interattivo venga messo in esecuzione in un tempo
ragionevolmente breve
– Non si adatta alla perfezione ad un cluster di piccole
dimensioni, dove la percentuale di slot liberate
nell’unita’ di tempo e’ piu’ bassa
Soluzione Interactive-jobs – un
esempio (INFN-BARI)

La configurazione di Torque-Maui viene
modificata per permettere al job interattivo di
avere una alta priorita’
– Viene utilizzato un demone (scritto dagli
amministratori) per assicurare che il tempo di attesa in
coda di un job interattivo non raggiunga il minuto



I job interattivi possono essere sospesi con il
comando “screen”
Possono essere lanciati job interattivi “multi
CPU” (ad esempio PROOF)
Non e’ configurato un limite fisso per le sessioni
interattive
Soluzione Interactive-jobs – un
esempo (INFN-BARI)
UI on demand
 Sottomissione
automatica di una o piu’ UI
virtuali per la gestione dell’interattivo.
 Stessi pro e contro dell’interactive-job piu’:
 Pro:
– L’interattivo viene limitato sia in termini di
CPU che in termini di memoria
 Contro:
– Puo’ essere complicato gestire job interattivi
multicore
Conclusioni e spunti



Il lavoro da fare sull’integrazine tra batch e
interattivo e’ in molti casi appena all’inizio
La panoramica presentata non e’ esaustiva ed e’
largamente integrabile da esperienze o idee di
chi attualmente lavora su questo tema
Puo’ essere utile un confronto tecnico tra gli
addetti ai lavori (magari lasciando il tempo di
concretizzare almeno parzialmente i progetti di
chi ancora non ha implementato una soluzione)
Ringraziamenti
 Giacinto
Donvito (INFN-BARI)
 Lucio Strizzolo (INFN-TRIESTE)
Grazie dell’attenzione