Servizio Calcolo Alessandro Brunengo
Personale (2017) Alessandro Brunengo (tecnologo, responsabile) 10% Mailing, 90% Calcolo Mirko Corosu (tecnologo) 30% Atlas, 70% Calcolo Francesco Saffioti (CTER) Enrico Salvo (CTER t.d. fino a gennaio 2018) Paolo Lantero (CTER, in congedo) Perdiamo un tecnologo al 20% (previsto) 2
Attivita del Servizio Calcolo Manutenzione infrastrutture sala CED Rete geografica: connettivita, sicurezza, e locale: wired, wireless Servizi centrali infrastrutturali (dns, dhcp, ntp, cluster virtualizzazione) per l utenza (account, web, wiki, mail, printer, backup, aree dati personali, videoconferenza, vpn, ) Calcolo scientifico Farm centrale, farm di gruppo, Tier3 Atlas, farm HPC e calcolo parallelo (94 nodi, 1375 slot, 15.5 khepspec) Storage per volumi centrali e di gruppo (300 TB) User support (incluso supporto per conferenze) Attivita in ambito CCR (storage, mail, network) 3
Attivita 2016 Sala CED: connessione impianto anti incendio con impianto di dipartimento la manutenzione dell impianto e ora a carico dei servizi tecnici di ateneo Rete locale: potenziamento ed ampliamento copertura WiFi (PF4 e PF5) Infrastruttura virtualizzazione: consolidamento e upgrade 3 server, 768 GB di RAM, 50 vm, 4 TB, integrazione con kerberos/ LDAP 90% dei servizi su ovirt supporto per server di gruppo e servizi di dipartimento Account: migrazione a tecnologia di AA basata su Kerberos/ LDAP, compatibile con AAI Upgrade dominio Windows a WS2012, regolarizzazione licenze e revisione backup 4
Attivita 2016 (cont.) Nuovi servizi: wiki, joomla Nuovo sito del calcolo, sistema di ticket Supporto conferenze: IFAE, Pixel2016 Calcolo scientifico Upgrade del middleware del Tier3 (EMI-3/SL6) Parziale upgrade di GPFS sui cluster satelliti (Tier3/Magic) e potenziamento export via CNFS (ora 2*10Gbps) Potenziamento e parziale implementazione di fair sharing sulla farm di calcolo HPC (utenze di sezione: solo uso per test) Supporto a progetti di calcolo parallelo e vettoriale (Ocapie, BioMNP): progetto, dimensionamento, capitolato per le gare 5
Attivita 2016 (cont.) Attivita in ambito CCR Installazione e configurazione mail relay secondario di backup per tutte le sedi INFN Realizzazione sito di servizi per la PEC dell Ente Utility di backup Centralizzazione della gestione delle caselle Abbiamo vinto gestione e supporto del servizio, incluso nell elenco dei SSNN della CCR Attivita di sviluppo su soluzioni di storage per cloud Attivita di formazione (storage per cloud, GPFS) Commissioni di gara e referaggio interno a CCR 6
Attivita previste per il 2017 7
2017: infrastrutture CED: installazione nuovo impianto di condizionamento cofinanziato da CCR Rete parziale sostituzione del vecchio impianto tecnologia ad acqua (piu efficiente, risolve problemi di rumorosita ) richiede anche isolamento zona calda in sala macchine Connettivita GE nei laboratori Completamento copertura wireless in tutto il dipartimento 8
2017: servizi centrali Gestione dinamica volumi Windows in configurazione cluster Implementazione di un sistema di alta affidabilita per imap service Implementazione di una soluzione owncloud per lo storage utente (integrata con servizi nazionali di CCR) 9
2017: calcolo scientifico Upgrade batch system: migliore supporto a calcolo parallelo e coprocessori (GPU, PHI) Acquisto e installazione nuovi cluster (Ocapie, BioMNP) Ocapie: cluster da 320 thread CPU, 1952 thread PHI, 6.1+9.6 Tflops teorici, 4 khepspec, connessione InfiniBand con multiple topologie BioMNP: cluster da 384 core (fisici), 14 Tflops teorici, ~8 khepspec, connessione InfiniBand Upgrade GPFS Svecchiamento hardware Riscrittura dei sistemi di statistica e monitoring 10
2017: CCR Novita Brunengo non e piu coordinatore del gruppo storage Brunengo e nuovo coordinatore del gruppo mailing Rilevanti attivita di R&D in campo storage: GPFS come backend per sistemi cloud (OpenStack, owncloud) Rilevanti attivita in campo mailing: implementazione di un sistema di mail relay per il supporto di indirizzamento @infn.it Attivita di supporto e manutenzione di servizi nazionali? (vedi slide successiva) 11
2017: CCR (cont.) Importante tendenza la CCR tenta di organizzare sviluppo e supporto di Servizi Nazionali (un servizio di IT) spinta da esigenze di ottimizzazione e risparmio servono nuovi servizi inesistenti (per ora manifestata forte esigenza di strumenti collaborativi) sollecitata soprattutto dalla nuova Direzione Generale serve man power, si chiedera collaborazione alle sedi serve struttura organizzativa: ora non c e il futuro e un ampliamento dei servizi informatici nazionali, ed una migrazione di servizi duplicati da locale a nazionale 12
Vorrei, ma Upgrade link geografico a 10 Gbps capacita di banda commisurata alla capacita locale verso la farm e lo storage importante non solo per utilizzo medio, ma per capacita di punta fondamentale per poter partecipare a attivita di R&D su soluzioni di storage distribuito e servizi in business continuity Ma gli esperimenti hanno bisogno di banda? 13
Criticita Acquisti le nuove normative intrducono compicazioni e dilatano i tempi la fase di transizione rallenta la capacita di emettere ordini ma non rallenta l esigenza di emetterli due ordini fermi da due mesi (stampante, nuovo impianto di condizionamento): si deve avere pazienza. Man power il carico aumenta, il personale non puo aumentare non deve diminuire! il supporto puntuale alla utenza non puo piu essere esteso a qualunque problema (configurazione applicativi, smartphone, sistemi di casa!) 14