High Performance Computing and Networks (HPCN)



Documenti analoghi
Il CRS4 e le connessioni ad alta velocità per la ricerca. Lidia Leoni Direttore Infrastrutture e Servizi di Calcolo e Reti CRS4

Laboratorio Virtuale NEPTUNIUS (Numerical. codes for computational fluid dynamics and. fluid structure interactions)

VIRTUAL VIRTUAL DATACENTER DATACENTER

In estrema sintesi, NEMO VirtualFarm vuol dire:

Cloud Computing: alcuni punti fermi per non smarrirsi fra le nuvole

VMUG UNIPI 2015 FEDERICO BENNEWITZ MAURIZIO TERRAGNOLO VIRTUALIZZAZIONE NELLA NAUTICA VM-NAUTICA

Introduzione al Cloud Computing

Cloud Service Broker

Presentazione aziendale. soluzioni, servizi, consulenza

Stefano Mainetti Fondazione Politecnico di Milano

Titolo progetto: ConsoliData. Ambito di intervento: ICT e dispositivi sensoriali. Struttura di riferimento : Coordinatore di progetto: INFN

Infrastruttura ReCaS. Roberto Bellotti Università degli Studi di Bari A. Moro & INFN

Navigare verso il cambiamento. La St r a d a. p i ù semplice verso il ca m b i a m e n t o

Una rassegna dei sistemi operativi per il Cloud Computing

WNoD: Virtualizzazione, Grid e Cloud nel Calcolo Scientifico per l INFN

Una delle cose che si apprezza maggiormente del prodotto è proprio la facilità di gestione e la pulizia dell interfaccia.

Zerouno IBM IT Maintenance

Povo2. Nuovo Datacenter d Ateneo. Trasloco sala macchine domenica 14 dicembre 2014

Prestazioni computazionali di OpenFOAM sul. sistema HPC CRESCO di ENEA GRID

L obiettivo che si pone è di operare nei molteplici campi dell informatica aziendale, ponendosi come partner di riferimento per l utenza aziendale.

Service e Switch Recovery

Mercoledì 28 Maggio 2014, Firenze. Lucio Gamba Direttore marketing Clouditalia

Griglie computazionali LEZIONE N. 10. Università degli Studi di Napoli Federico II Corso di Laurea Magistrale in Informatica I Anno

La Videosorveglianza Criteri per il dimensionamento dello storage

UNA SOLUZIONE COMPLETA

Progetto Atipico. Partners

REALIZZAZIONE SALA CED

Allegato. Servizio Hosting Virtual DataCenter di Regione Lombardia. per l ENTE UCL Asta del Serio

COME SVILUPPARE UN EFFICACE PIANO DI INTERNET MARKETING

SERVER E VIRTUALIZZAZIONE. Windows Server Guida alle edizioni

Aspetti critici rete LAN e WAN per i Tier-2. R.Gomezel

LA MIGRAZIONE IN SEMPLICI STEP. Il moving di una macchina Linux sul Cloud Server Seeweb

Addition X DataNet S.r.l.

LE POSSIBILITA' DI ACCESSO DA REMOTO ALLE RETI DI CALCOLATORI

Creare una Rete Locale Lezione n. 1

Sistemi avanzati di gestione dei Sistemi Informativi

PARTNER DI PROGETTO. Università degli Studi di Palermo Dipartimento di Ingegneria Industriale

tel soft servizi Vi accompagniamo nell'evoluzione dei Vostri sistemi informativi, creando valore e competitività.

ALYFA.NET (Company profile)

Infrastruttura di produzione INFN-GRID

Progetto Cluster. Sottoprogetto Bioinformatica

CHIARIMENTI al 27/1/2011

DEPLIANT INFORMATIVO DI PRESENTAZIONE AZIENDALE

Il proge)o ReCaS infrastru)ura distribuita di calcolo per SuperB ed altre applicazioni

PROGETTAZIONE MECCANICA DESIGN INDUSTRIALE OUTSOURCING RICERCA E SVILUPPO GRAFICA DOCUMENTAZIONE TECNICA STUDIO TECNICO

I servizi di supporto all'utenza

Innovatori per tradizione

UNIDATA S.P.A. Per la Pubblica Amministrazione. Compatibile con. giovedì 23 febbraio 12

Dalla Pianificazione Energetica all attuazione degli interventi: il punto di vista delle PA e delle Imprese

Sommario. Oracle Database 10g (laboratorio) Grid computing. Oracle Database 10g. Concetti. Installazione Oracle Database 10g

May Informatica S.r.l.

Servizi ASP. ASP su Centro Servizi TeamSystem Contratto e SLA

Innovation Technology

Diventa Partner Software Wolters Kluwer

Lo scenario: la definizione di Internet

Come Funziona. Virtualizzare con VMware

Virtualization. Strutturare per semplificare la gestione. ICT Information & Communication Technology

Progetto Vserver- HighAvailability

Sistemi avanzati di gestione dei Sistemi Informativi

WorkFLow (Gestione del flusso pratiche)

la rete come risorsa disponibile Sergio Bonora LABORATORI GUGLIELMO MARCONI 2009 La rete come risorsa disponibile 1

Comunichiamo ovunque.

Identificazione documento. Approvazioni. Variazioni DEGLI STUDI DI NAPOLI FEDERICO II. Centro di Ateneo per i Servizi Informativi

Cloud Service Area. Ci hanno scelto: elogic s.r.l. - Via Paolo Nanni Costa, Bologna - Tel info@elogic.

Architetture Informatiche. Dal Mainframe al Personal Computer

DOKITECH / MISSION COMPANY

I nostri servizi Dynamic Data Centre Infrastructure-as-a-Service.

Architetture Informatiche. Dal Mainframe al Personal Computer

Cloud Computing....una scelta migliore. ICT Information & Communication Technology

KEN PARKER SISTEMI s.r.l.

POLYEDRO. La migliore piattaforma tecnologica di sempre per EMBYON, l evoluzione dell ERP Metodo

Network Monitoring. Introduzione all attività di Network Monitoring introduzione a Nagios come motore ideale

IBM Power in cloud, l'ambiente As400 va sulla nuvola

Il presente documento è conforme all'originale contenuto negli archivi della Banca d'italia

Il servizio di registrazione contabile. che consente di azzerare i tempi di registrazione delle fatture e dei relativi movimenti contabili

Affidamento della progettazione e messa in opera di una infrastruttura tecnologia per la realizzazione di un sistema di continuità operativa ICT

Docebo: la tua piattaforma E-Learning Google Ready.

EasyCloud400. Il tuo AS/400. Come vuoi, quanto vuoi. Telecomunicazioni per l Emilia Romagna. Società del Gruppo Hera

Gartner Group definisce il Cloud

Thinking Fast: il sistema di backup più veloce al mondo ora esegue anche l'archiviazione

Il Cloud Computing Privato per il settore bancario e assicurativo

La piattaforma di lettura targhe intelligente ed innovativa in grado di offrire servizi completi e personalizzati

I sistemi virtuali nella PA. Il caso della Biblioteca del Consiglio Regionale della Puglia

Linux Day /10/09. Cloud Computing. Diego Feruglio

Azienda: cooperativa di consumatori nata nel 1989 e presente nelle Province di Modena e di Ferrara e nella Regione Puglia e Basilicata.

Dal software al CloudWare

C Cloud computing Cloud storage. Prof. Maurizio Naldi

LAit & Red Hat Dante Chiroli Direzione Tecnologie: Architetture

I servizi ICT a supporto della Continuità Operativa. Marco Filippi Programma di Continuità Operativa - CSI Piemonte

CAPITOLATO TECNICO. 2. Un apparato di lettura/scrittura DVD IBM U3 completa di DVD ram.

Che cos'è il cloud computing? e cosa può fare per la mia azienda

VMware. Gestione dello shutdown con UPS MetaSystem

SACE BT realizza su tecnologia Microsoft la piattaforma di gestione delle polizze

Progetto ReCaS status update. Giuseppe Andronico WS CCR, Catania 28 Maggio 2014

VIRTUAL INFRASTRUCTURE DATABASE

LOGICAL Con i dati tra le nuvole Presentazione della piattaforma informatica di servizi logistici Business Workshop

Cablaggio UNI CNR GRID. Cavedi0 1. Accelerat ore. Centro stella. Cavedi0 R FW. Villetta Rossa. Router GARR

IL CSI PIEMONTE PER LA CONTINUITÀ DEI VOSTRI SERVIZI

ShareGrid Una piattaforma di calcolo condivisa per Grid Computing

Transcript:

High Performance Computing and Networks (HPCN) Lidia Leoni, direttore Piattaforma High Performance Computing and Networks (HPCN), Centro Ricerche, Sviluppo e Studi Superiori in Sardegna lidia.leoni@crs4.it CRS4 Polaris Technological Park, 09010 Pula CA, Italy http://www.crs4.it

Il CRS4 Il CRS4 è un centro di ricerca multidisciplinare che promuove lo studio, lo sviluppo e l'applicazione di soluzioni innovative a problemi provenienti da ambienti naturali, sociali e industriali. Tali sviluppi e soluzioni si basano sulla Scienza e Tecnologia dell'informazione e sul Calcolo Digitale ad alte prestazioni. L'obiettivo principale è l'innovazione. Il CRS4, fondato dal Prof. Rubbia e dal Prof. Zanella nel 1990, è parte del Parco Scientifico e Tecnologico di Pula (POLARIS)

Informazioni generali Fondato il 30 novembre 1990. Entrato nel suo ventiquattresimo anno di attività divenendo un punto di riferimento importante per la Regione 160 ricercatori/tecnologi budget ~ 15M di cui ~50% da fondi esterni EU/National research project Industrial contracts

Informazioni generali Ricerca e sviluppo nei settori abilitanti L'esperienza diretta nel contesto applicativo con focus primario su: Energia & Scienze ambientali; Società dell'informazione; scienze biomediche Forte Rete di collaborazioni PON, EU FP7, Wellcome Trust, NIH, APL,... Trasferimento tecnologico alle industrie ENI, INPECO, IBM, NICE, GEXCEL,... Trasferimento tecnologico alle istituzioni pubbliche Sanità, Ambiente, Beni Culturali,...

Partner Industriali Giuditta Lecca, July 27 th 2012

Alta Formazione e training on the job Corso di Analisi Dati Next Generation Sequencing con Galaxy (8-11 ottobre 2013) Corso di amministrazione di cluster di calcolo alle pubbliche amministrazioni SWAT International Workshop in Sardinia (September 30 - October 4 2013) Summer School 2011-2012-2013 NGS and GWAS for Complex and Monogenic Disorders September (Sept. 9-13 2013) Master on Bioinformatics (2 editions) w University of Cagliari (2005-2006, 2012-2013) Sardinian Summer School - Genomic Analysis of Complex and Monogenic Disorders Master on Renewable Energy w industrial partners and University of Cagliari up to 10 stagers per year from Universities

Settori di ricerca Fedele alla sua missione fondativa, il Centro ha promosso programmi di ricerca e sviluppo tecnologico a carattere multidisciplinare; Le Aree di Ricerca si sono evolute e specializzate, mantenendo come orizzonte di riferimento quello internazionale, sola dimensione realmente capace di contribuire allo sviluppo del territorio. All interno dei programmi strategici, non soltanto le competenze scientifiche e tecnologiche ma anche la capacità di parlare a mondi diversi, vitale per un centro di ricerca, si sono sviluppate e si svilupperanno, per posizionare il Centro su filoni di frontiera, cogliendo e anticipando le opportunità che si presenteranno. Energia e Ambiente Biomedicina Società dell informazione Data Fusion

Piattaforme Tecnologiche Il CRS4 possiede un centro di calcolo, la prima piattaforma in Italia dedicata alla genotipizzazione e al sequenziamento massivo del DNA e di un laboratorio di Visual Computing allo stato dell'arte. Le nostre Piattaforme Tecnologiche sono: High Performance Computing and Network Genotyping and Massive DNA Sequencing Visual computing

La piattaforma HPCN La piattaforma HPCN mette a disposizione degli utenti un'infrastruttura per il calcolo ad alte prestazioni ed i relativi servizi di supporto alla ricerca. In collaborazione con la sua comunità, valuta, implementa e supporta le nuove tecnologie emergenti. Il calcolo ad alte prestazioni è uno dei principali servizi forniti dal settore ai propri utenti. HPC Networking & security System management

Data Center Overview 170+ TeraFlop di potenza di calcolo su 600+ compute node Cluster Standard e ibridi (GPU, IBM Cell, FPGA ) 5 Petabyte di storage 250 macchine virtuali per servizi, sviluppo e progetti specifici 1 Gbps link GARR, link a 100 Mbps con un provider 350 porte IB (DDR, QDR, FDR) 300+ porte 10GE e circa 1200 porte 1GE Rete Ottica DWDM (ROADM) sino a 80 Gbps PtP nella rete CyberSar Rete Ottica CWDM

Rete e Sicurezza L'infrastruttura di rete è un componente essenziale e trasversale a tutti i progetti e le attività di ricerca del CRS4. Per rispondere adeguatamente alle esigenze dei ricercatori, negli anni, l'infrastruttura di rete è stata modificata sia dal punto di vista architetturale che tecnologico, utilizzando sempre soluzioni di ultima generazione. L'architettura corrente è stata disegnata per offrire elevate caratteristiche di Non-Brocade robustezza, prestazioni e resilienza. Switch INTERNET CAMPUS INTERNET GARR L2 VSRP AREA Genoma pipeline Cluster FW VSRP Layer 3 Area HPC Area OSPF Area 0 - Backbone VRRP LACP Cluster Enclosure 10GE L2 Link 10GE L3 Link 2x10GE L2 Backup Link 2x10GE L2 Primary Link

Infrastruttura della rete CyberSar su RTR-R 12 INFN INAF SRT San Basilio AOB RTR INAF Remote supervisor INAF Capoterra Remote Supervision CRS4 Pula 8xGbE 2x10GbE 5x10GbE punto-punto 8xGbE 2x10GbE 5x10GbE punto-punto 8xGbE 2x10GbE 5x10GbE punto-punto Ttiscali Sa Illetta 10x10GbE 8xGbE 2x10GbE 5x10GbE punto-punto 8xGbE 2x10GbE 5x10GbE punto-punto 40x1GbE UNICA Ingegneria UNICA INFN Monserrato UNICA Remote supervisior Janna dark fibe

Rete Cybersar 13 Dark fiber core Rete Regionale Ricerca RTR DWDM network 10Gb/s lambdas

RTR-R Rete Telematica Regionale - Ricerca DWDM network 10 Gb/s lambdas G A R R - X Janna dark fibers

HPC (High Performance computing) Il CRS4 offre supporto alle attività di ricerca della comunità scientifica tramite il Calcolo ad alte prestazioni e le sue applicazioni, grazie a un centro di calcolo allo stato dell'arte. Il suo personale specializzato è altamente qualificato e affianca i ricercatori nell'utilizzo dell'infrastruttura tecnologica. La potenza di calcolo del CRS4 è di circa 170 TFlops, così suddivisi: GPU Nvidia Kepler K40 34 Tflops GPU NVidia Kepler K10 90 Tflops HP Cluster 34,6 Tflop (bassa e media latenza) Sun Cluster 3 TFlops Tesla cluster GPU NVidia cluster FPGA Maxeler IBM Cluster and other resources 3 Tflops Formazione di personale da adibire ad attività sistemistiche e di ricerca

Settori di ricerca sul cluster CRS4 Fisica dei Materiali: CNR-IOM/Unica - interazioni tra molecole organiche e materiali (zinc oxide), proprietà elettriche e conduttive di materiali e particelle, problemi legati all'ambiente e all'ossidazione dei materiali come il piombo. Meteorologia: previsioni multiple al fine di stimare la probabilità che un dato evento si verifichi Bioinformatica e genomica: molecole di interesse farmaceutico e geni o proteine Geofisica: studio e sviluppo di metodi numerici, basati sulle onde acustiche, per ricostruzione del sottosuolo Chimica: celle a combustibile Fluidodinamica: LunaRossaChallenge - Simulazioni su 1024 cores per ricerca CFD, Karalit, fluidodinamica dei materiali Chimica-bioinformatica: dinamica molecolare Termodiffusione: generazione di gradienti di concentrazione causati da gradienti di temperatura Bioinformatica: simulazione in silicio dell'attività elettrica del cuore Dinamica molecolare: Atomi e molecole nello studio di patologie

CNR 52% CRS4 36% UNICA 12% Company 0% Other 0% Utilizzo Risorse di calcolo CRS4 2011-2014 2012 2011 2014 2013 CNR 50% CRS4 27% UNICA 20% Company 3% Other 0% CNR CRS4 UNICA Company Other CNR 50% CRS4 24% UNICA 20% Company 5% Other 1% CNR 29% CRS4 16% UNICA 13% Company 35% Other 7%

Utilizzo delle risorse HPC e software DRMS Il principale software di DRMS (Distributed Resources Manager System) e' OpenGridScheduler. Abbiamo anche LSF di Platform (Load Share Facility) I software DRMS controllano e sovrintendono l'utilizzo delle risorse di calcolo come: CPU Memoria spazio disco licenze rete. Gli utenti richiedono le risorse sottomettendo, tramite il DRMS, i loro i lavori che possono essere sequenziali o paralleli. Abbiamo piu' di 100 utente che attivamente utilizzano il cluster. Altri utenti sono raggruppati in progetti o utilizzano le risorse, anche dall'esterno del CRS4, tramite portali e servizi vari.

Software e supporto Compilatori: Intel, PGI (Portland Group), Compilatori Gnu, CUDA MPI: MVAPICH, MPI, Openmpi Software: StarCD/StarCcm+, Ansys Fluent, Paraview, NAMD, Gromacs, ACEMD, AMBER, DL_POLY, Grace, MayaVi, VMD, Quantum-Espresso, Annovar, OpenFoam, Schrodinger Tools: Perl, Python, QT, R, Java, tcl/tk, Valgrind Librerie: ATLAS, Lapack e Parpack, Blas, FFTW, ACML, MKL, Metis, Aztec,. Il supporto agli utenti è fornito anche fornendo supporto personalizzato sulle risorse o sul software. Questa politica si è rivelata molto utile in diversi settori della ricerca scientifica.

Software di management MUCCA

Impatto del modulo GREEN di MUCCA nel consumo del cluster HP Tutto il cluster acceso, senza jobs utente, assorbe circa 85KW/h!!!! Risparmio sino a 30KW/h per brevi periodi Forte integrazione tra l'hardware e lo scheduler Policy e granularita' adattabili per gruppi di macchine

Cluster MEDUSA per CFD Cluster con 640 core composto da - 32 nodi dual CPU Intel X86_64-2 CPU con 10 core, 2.8GHz - 128 GB RAM (circa 5GB per core) - dischi SSD - IB FDR (56 Gbps) - 1 GE

Infrastruttura di Storage Spazio disco 5 PB disponibili Cluster storage DDN 3,8 PB Sun StorageTek 500 TB Cluster space 200 TB DAS e NFS File server 500 TB Spazio di Backup approx 800TB

Infrastruttura DDN 2 Controller SFA 10K 1800 dischi da 3TB - 5,4 PB RAW 12 Server con connessioni IB QDR and 10 GbE 1 Storage IBM Storwize V7000 con 24 dischi SAS da 600 GB 10000 RPM per la gestione dei metadata catalog, 2 Server con connessioni 10 GbE collegati allo Storwize Filesystem utilizzato: GPFS 3.4 L installazione supporta il collegamento istantaneo di oltre 1000 client Lo spazio disco utilizzabile ammonta a 3.8 PByte ed è accessibile da un unico mountpoint Il metadata catalog è ospitato su infrastruttura separata con dischi SAS da 10K rpm, configurati in raid 5 L accesso al filesystem è garantito da 10 server IBM collegati allo storage con tecnologia IB Architettura priva di single point of failure

Gestione criticità sulle infrastrutture IT Classificazione delle applicazioni e servizi in classi di criticità Livello Alto Livello Medio Livello Basso Trattamento differenziato in corrispondenza di criticità alle varie classi di servizi con tempi di ripristino differenziati (dipende dal budget associato a servizi e progetti) Pubblicazione dellla procedura di spegnimento (protezione) e ripristino delle infrastrutture

Accesso utenti CRS4 4 differenti tipologie di utenti: Personale CRS4 - Tutte le risorse Utenti esterni - Solo le risorse di progetto Studenti - Dipende dal loro tutor e dal tipo di stage Guest - Solo accesso alla rete pubblica Tipi di accesso alle risorse VPN SSH FTP (project area) http/s (wiki, SVN, webmail, cloud.)

Infrastruttura tecnologica Il Centro di calcolo del CRS4 è classificato Tier 2: Ridondanza su alcuni componenti (G.E., UPS, Chiller) che supportano il Data Center Nessuna ridondanza a livello dell alimentazione (power center) o della distribuzione o per effettuare alcune manutenzioni strutturali senza fermate Collegamento su più fibre ma su unico cavedio Fermata del sistema per manutenzione annuale

Attivita' HPCN in ambito ambiente di Calcolo Potenziamento degli strumenti di management creati al CRS4 MUCCA 2.1) moduli di gestione cluster e monitoring: hardware, software, e jobs utente Modulo GREEN: risparmio energetico gestione intelligente dei nodi non utilizzati) Cloud Computing Progetto interno basato su Openstack Opensource, modulare e ben supportato (ampia community) Orientata all'infrastruttura (IaaS, ottimizzazione risorse di calcolo e risparmio energetico) Flessibile (raggruppamento ed isolamento) Nuovo modello di fruizione dell'infrastruttura Collaborazioni esterne Bando PIA Studio e sviluppo di metodologie per l'analisi e la gestione di grandi quantità di dati Analisi Python Copia parallela dei dati (5TB con 10 client paralleli in poche ore)

Esperienza sul Cloud Computing Open Source 2009-2011 Eucalyptus 2011 - oggi OpenStack E stata sviluppato un Middleware che consente di interagire con cloud pubblici e privati usando un unico set di chiamate REST attraverso le API messe a disposizione. REST API Public Cloud Private Cloud In questo modo si centralizza il controllo e si semplifica l accesso ai servizi. Le API consentono di creare dei servizi aggiuntivi scollegati dal dialetto del cloud scelto e dalla localizzazione.

scheduler scheduler Grid Engine scheduler scheduler scheduler Grid Engine Scheduler e un componente che abbiamo sviluppato che ci consente di far convivere le risorse tra OpenStack e Grid Engine. In questo modo e possibile gestire un pool di macchine condivise tra OpenStack e Grid Engine tanto facilmente quanto uno interamente dedicato. Dal punto di vista dell utente questo aspetto e trasparente, dal lato gestione questo consente di dirottare la destinazione d uso delle macchine fisiche verso le esigenze del centro di calcolo. OpenStack farm Grid Engine farm

Portale Cloud CRS4

Sardinia Radio Telescope archive system Il Sardinia Radio Telescope è capace di produrre flussi di dati di varie dimensioni, che vanno dai 5 KB/s (quasi 20 MB all ora) del total power sino ai 512 MB/s (quasi 2 GB all ora) delle ROACH. Facendo una stima approssimativa dei tempi di utilizzo annui dei vari backend, possiamo dedurre che SRT attualmente è capace di produrre centinaia di TB di dati ogni anno, che dovranno essere archiviati da qualche parte. Nei prossimi anni saranno disponibili nuovi backend, come ad esempio la ROACH 2, capace di produrre un flusso di dati di 40 GB/s (quasi 150 TB all ora). Il trend è quindi abbastanza chiaro, e indica che la quantità di dati che annualmente dovremo archiviare crescerà con il passare del tempo. Il progetto si propone di realizzare un sistema di archiviazione scalabile costi complessivi che decrescano con l aumentare dei dati risorse computazionali.

CRS4 SRT Sardinia Radio Telescope archive system: schema proposal site DB auth & metadata sistema stoccaggio replica proj_id : passwd replica auth & sched site buffer ADC finalizzatore sistema ridotto di stoccaggio

Progetto Storage SRT: sistema di stoccaggio API REST replica load query routine di stoccaggio metadata & info (RDBMS) replica filesyste m

CRS4 Progetto Storage SRT: evoluzioni del flusso proposal site analysis site middleware DB auth & metadata sistema stoccaggio

Acquisizioni future Il CRS4 ha previsto un piano di upgrade delle infrastrutture di calcolo che consentiranno l acquisizione di: - Cluster - Storage - Rete - UPS, GE, impianto elettrico.

Future project vision