Il Tier2 dei Laboratori di Frascati è uno dei centri di calcolo che compongono WLCG (Worldwide LHC Computing Grid), la più grande griglia computazionale esistente.
WLCG è un’infrastruttura globale realizzata allo scopo di fornire risorse di calcolo per immagazzinare, distribuire ed analizzare i circa 30 Petabytes (30 milioni di Gigabytes) di dati generati ogni anno dal Large Hadron Collider (LHC) del CERN, rendendoli disponibili a tutti i partner della collaborazione, indipendentemente dalla loro collocazione geografica.
WLCG è frutto di una collaborazione di infrastrutture di calcolo nazionali ed internazionali, è coordinato dal CERN ed è gestito da una collaborazione internazionale dei quattro esperimenti LHC (ALICE, ATLAS, CMS e LHCb) e dei centri di calcolo partecipanti.
42 paesi, 170 centri di calcolo, 2 milioni di job eseguiti ogni giorno.
Il calcolo WLCG ha permesso ai fisici di annunciare la scoperta del Bosone di Higgs il 4 luglio 2012!
L’infrastruttura WLCG si compone di più livelli o tiers: 0, 1, 2, 3 con diversi livelli di servizio.
Il Tier0 è il data centre del CERN, collocato a Ginevra, è responsabile della custodia dei dati raw ed esegue una prima ricostruzione dei dati. I Tier1, 13 grandi centri di calcolo con ampie capacità di storage, sono responsabili di una percentuale dei dati ed eseguono computazioni su larga scala.
Infine i Tier2, che immagazzinano una parte dei dati, forniscono soprattutto potenza di calcolo per analisi e simulazione Monte Carlo.
Uno dei Tier2, dedicato all’attività di calcolo dell’esperimento ATLAS, è ospitato nei Laboratori Nazionali di Frascati dell’INFN.
Questo centro, oltre all’esperimento ATLAS, supporta anche le attività di altri esperimenti, quali: PADME, esperimento ospitato ai LNF, KM3NeT, BelleII, gli altri esperimenti LHC e, nell’ambito di una collaborazione tra INFN e INAF, CTA (Cherenkov Telescope Array).
Il progetto CTA è considerato strategico, nei prossimi anni, da entrambe le istituzioni al fine di sviluppare in sinergia gli aspetti legati al calcolo, integrando le diverse competenze ed esperienze nella gestione di grandi infrastrutture di calcolo (INFN) e implementazione di software per l’analisi dei dati e la gestione di archivi e banche dati di astronomia (INAF), per cui il Tier2 è stato configurato per ospitare anche il calcolo di questo esperimento.
Grazie a questa collaborazione, oltre a quelle con altri enti ed al ruolo centrale che hanno i Laboratori in ambito tecnologico-scientifico, i Laboratori Nazionali di Frascati sono attualmente una delle Unità Operative del progetto PON della ricerca I.Bi.S.Co.: Infrastruttura per BIg Data e Scientific Computing, presentato nell’ambito dell’Avviso 424/2018 del PON Ricerca e Innovazione 2014-2020 (PIR01_00011). L’obiettivo del progetto è quello di potenziare l’esistente infrastruttura di calcolo scientifico del Sud Italia, finanziata nel passato dal PON 2007-2013 (es. progetti SCOPE e RECAS), costituita dai centri di calcolo delle Sezioni INFN di Bari, Catania e Napoli, con lo scopo di renderla un’infrastruttura multi-disciplinare e multi-funzionale estendendone l’utilizzo anche alle realtà scientifiche degli altri Enti di Ricerca italiani; oltre a costituire il primo vero e concreto passo verso l’Italian Computing and Data Infrastructure (ICDI), ponendo le basi per la sua parte meridionale (ICDI-sud) che si inquadrerà nel progetto nazionale e che sarà connessa al centro Italia grazie all’inclusione dei Laboratori di Frascati nel progetto.
Il partner proponente il progetto, della durata di 32 mesi, è l’INFN e i partner co-proponenti sono: Università degli Studi di Bari Aldo Moro, Università degli Studi di Napoli Federico II, CNR, INGV e l’INAF nell’ambito della collaborazione con i Laboratori di Frascati per l’esperimento CTA.
Successivamente, gli stessi soggetti sono risultati vincitori anche di un finanziamento da parte del MIUR per il rafforzamento del capitale umano per l’infrastruttura I.Bi.S.Co. (avviso n. 2595 del 24 dicembre 2019).
L’esperimento PADME svolge nel Tier2 di Frascati parte dell’off-line computing. Lo storage del Tier2 ospita i dati raw, provenienti dal buffer disco dell’on-line, che vengono anche trasferiti nella tape library del CNAF e in quella dell’esperimento KLOE. Nella farm di Frascati vengono eseguite le simulazioni MC, la ricostruzione dei dati raw e l’analisi dati, salvando gli output nello storage in Grid.
Nel Tier2, infine, oltre, alla gestione delle risorse di calcolo locali per le diverse esigenze degli utenti di ATLAS dei Laboratori, vengono portate avanti anche una serie di iniziative di utilità per il calcolo dei gruppi locali e della collaborazione ATLAS più in generale, ad esempio:
- la compartecipazione alla gestione della Virtual Organization ATLAS (definita come l’insieme delle risorse, delle persone e delle policy dell’intera comunità dell’esperimento);
- la partecipazione allo sviluppo e test del software del DPM (Disk Pool Manager): un software per la gestione dei sistemi di storage nella Grid;
- la partecipazione al progetto IDDLS che ha lo scopo di investigare e testare, con use case reali, tecnologie di reti programmabili per l’interconnessione a banda larga di centri di calcolo; realizzando, su tali reti, un prototipo di infrastruttura di storage federato, o DataLake, a servizio degli esperimenti di fisica delle alte energie, nella direzione di una ottimizzazione dell’utilizzo delle risorse e di un ampliamento delle stesse accedendo anche a cloud commerciali. L’obiettivo finale è avere un pilot di DataLake italiano connettendo il Tier1, alcuni Tier2 e alcuni data producer.