Architettura del middleware INFNGRID e piano di deployment sull'infrastruttura SCoPE Gennaro Tortone INFN Napoli 21 febbraio 2007
Indice Il middleware INFNGRID Certification Authority Virtual Organization Servizi core Servizi collective Servizi di supporto al deployment e per la gestione dell'infrastruttura Piano di deployment dell'infrastruttura Grid per il PON SCoPE
Il middleware INFNGRID Attività grid dell INFN: - progetto speciale INFNGRID [dal 2000] - partecipazione ai progetti: - DataGrid (EDG), finanziato da UE [2001-2004] - DataTAG, finanziato da UE [2002-2003] - LHC Computing Grid (LCG), progetto CERN [dal 2002] - EGEE, finanziato da UE [2004-2006] - EGEE-II, finanziato da UE [2006-2008] - progetto Grid-IT, finanziato dal MIUR/FIRB [2003-2005] Nell ambito di questi progetti sono state realizzate varie infrastrutture Grid che inizialmente erano dei testbed e poi sono diventate una infrastruttura Grid di produzione (Grid.IT)
Il middleware INFNGRID Servizi core (presenti in ciascun sito Grid) repository pacchetti del middleware servizi di computing servizi di storage user interface Servizi collective servizi di autenticazione/autorizzazione servizi di allocazione dei job servizi informativi cataloghi di file / repliche user interface
Il middleware INFNGRID I seguenti servizi non fanno parte dell'infrastruttura, ma sono necessari/utili per il deployment e per la gestione Certification Authority servizi di monitoring servizi di accounting ticketing system service availability monitoring
Il middleware INFNGRID Il middleware INFNGRID garantisce piena compatibilità con il middleware EGEE (glite/lcg) release e aggiornamenti/bugfix frequenti semplicità di integrazione con l'infrastruttura Grid italiana (Grid.it) ed europea (EGEE) disponibilità di tool consolidati nati in ambito INFN ed utilizzati in diversi progetti ed infrastrutture Grid esistenti (GridICE, VOMS, DGAS) supporto tecnico sulla release e sui tool con possibilità di escalation direttamente verso gli sviluppatori del middleware
Certification Authority La Certification Authority utilizzata per l'infrastruttura INFNGRID e' la CA INFN La CA INFN firma certificati personali certificati server Ciascun certificato e' identificato da un subject /C=IT/O=INFN/OU=Personal Certificate/L=Napoli/ CN=Gennaro Tortone/Email=gennaro.tortone@na.infn.it La validità dei certificati e' di un anno
Certification Authority Un utente in possesso di un certificato personale puo' firmare le proprie mail in uscita crittografare file accedere ai servizi Grid Ogni richiesta di certificato all'infn CA deve essere autorizzata preventivamente dalla Registration Authority (RA) di competenza che accerta l'identità dell'utente Ciascuna struttura INFN e ciascun ente/struttura che afferisce alla CA INFN ha istituito una RA
Certification Authority Per attivare una Registration Authority, il Direttore della Struttura deve inviare una lettera di richiesta alla CA INFN protocollata e su carta intestata La CA INFN e' riconosciuta come trusted da tutte le risorse di calcolo Grid.it e EGEE (vale anche l'inverso) https://security.fi.infn.it/ca
Virtual Organization Virtual Organization (o virtual team) un gruppo di persone e risorse distribuiti geograficamente, i cui membri sono tenuti assieme da interessi ed obiettivi comuni che comunicano e coordinano il proprio lavoro attraverso l'utilizzo di Information Technology
Servizi core
Servizi core Caratteristiche presenti sulle risorse di calcolo di ciascun sito periferico consentono l'inserimento delle risorse locali nell'infrastruttura Grid policy di utilizzo richiedono management locale start-up aggiornamenti troubleshooting
Servizi core Repository pacchetti del middleware YAIM tool automatico per l'installazione e l'aggiornamento dei nodi Grid consente l'installazione automatica del sistema operativo tramite PXE contiene una replica dei pacchetti INFNGRID e degli aggiornamenti del sistema operativo - Distribuzione utilizzata: Scientific Linux CERN 3.0.4 (=RHEL3) - Architettura supportata: IA32 - Release attuale: INFNGRID 3.0.0 - Framework del middleware: Globus 2.x
Servizi core Computing Element CE interfaccia Grid verso una farm costituita da nodi di calcolo (Worker Node WN) gestisce i job di calcolo tramite un batch-queue system tramite il batch system e' possibile partizionare l'insieme di risorse di calcolo (CPU) e definire delle policy di utilizzo da parte delle varie VO (CPU time, numero di job concorrenti) mediante la creazione di code batch ciascun Computing Element e' fornito di certificato digitale (rilasciato dalla CA INFN) che attesta l'attendibilità delle transazioni servizi Globus: globus-gatekeeper, globus-gridftp, GRIS batch system supportati: PBS, Torque, LSF
Servizi core Worker Node WN host disponibile per l'esecuzione di job viene gestito/allocato da un Computing Element pochi pacchetti del middleware installati contiene l'execution environment del processo di calcolo (librerie di esperimento, toolkit, ecc.) Internet Grid CE WN
Servizi core Storage Element interfaccia Grid ad uno spazio di storage utilizzo del protocollo GridFTP per il trasferimento di file consente di gestire lo spazio di storage in modo da permetterne l'utilizzo da parte di varie VO ciascuno Storage Element e' fornito di certificato digitale (rilasciato dalla CA INFN) che attesta l'attendibilità delle transazioni servizi Globus: globus-gridftp, GRIS SE
Servizi core User Interface componente che permette agli utenti di accedere alle risorse Grid funzionalità di base sottomissione di job visualizzazione stato di un job cancellazione di un job recupero dell'output di un job l'utente accede alla UI tramite collegamento remoto ad una UI di infrastruttura o di gruppo (SSH,...) tramite un PC desktop o notebook personale configurato con i componenti della UI tramite web (GENIUS) UI
Servizi core User Interface UI l'utente accede ad una UI tramite delle credenziali locali (es. username/password), tuttavia per poter accedere ai servizi Grid deve utilizzare il proprio certificato personale UI GRID
Servizi core Tipico deployment di un sito Grid UI UI GRID SE CE YAIM WN
Servizi collective
Servizi collective Caratteristiche insieme ai servizi di supporto sono presenti nel centro di gestione dell'infrastruttura Grid consentono l'utilizzo trasparente delle risorse di computing e storage dei siti periferici del centro di calcolo dell'infrastruttura richiedono un team di management locale start-up / aggiornamenti / troubleshooting supporto agli utenti finali supporto ai site-manager dei siti periferici continuità del servizio coordinamento del deployment
Servizi collective VOMS (Autenticazione / Autorizzazione) VOMS Il servizio VOMS (Virtual Organization Membership Service) estende le informazioni presenti nel certificato proxy di un utente con: VO membership gruppo ruolo privilegi gestione degli utenti tramite interfaccia web con un solo VOMS server e' possibile gestire piu' VO
Servizi collective Resource Broker (allocazione dei job) Il Resource Broker consente di abbinare un job (seriale o parallelo) ad una risorsa di computing e/o storage RB tale abbinamento prende il nome di matchmaking e avviene tramite l'elaborazione di requirement del job stato della Grid ciascun Resource Broker e' fornito di certificato digitale (rilasciato dalla CA INFN) che attesta l'attendibilità delle transazioni
Servizi collective Information Index (servizio informativo) Ogni risorsa di calcolo e di storage presente nell'infrastruttura Grid espone il proprio stato e le proprie caratteristiche tramite il servizio GRIS (Grid Resource Information Service) ciascun GRIS si registra presso un Information Index che effettua il caching delle informazioni fornite dai vari GRIS e fornisce una visione aggregata delle risorse di una infrastruttura Grid II
Servizi collective LCG File Catalog (cataloghi file / repliche) Un sistema di data management per la GRID deve offrire le seguenti funzionalita' di base: localizzazione dei dati copia dei dati gestione e replica dei dati gestione dei meta-dati backend MySQL funzionamento dipendente dalle informazioni presenti nel servizio informativo livello di trasporto basato su GSIFTP LFC
LCG File Catalog II LFC SE SE SE
Servizi di supporto al deployment e per la gestione dell'infrastruttura
Servizi di supporto GridICE (servizio di monitoring) Il servizio di Grid Monitoring si occupa della misurazione di parametri significativi relativi alle risorse presenti in una infrastruttura Grid attività strategica per il calcolo distribuito analisi delle prestazioni controllo delle risorse statistiche sull'utilizzo delle risorse basato sul contenuto del servizio informativo consultabile tramite interfaccia web MS
Servizi di supporto SAM (Service Availability Monitoring) Il Service Availability Monitoring si occupa di testare il corretto funzionamento dei vari componenti del middleware tramite l'invio di job di certificazione vengono validate le funzionalità di ciascun servizio a seguito di un errore viene segnalato il problema al Site Manager tramite il Ticketing System le informazioni raccolte sono disponibili tramite una interfaccia web SAM
Servizi di supporto Ticketing System Il Ticketing System rappresenta l'interfaccia di supporto sia per gli utenti che per i Site Manager dell'infrastruttura Grid TS per ciascun sito viene definito un gruppo di Site Manager che viene utilizzato per inviare degli allarmi a seguito di malfunzionamenti riportati dal Service Availability Monitoring la gestione dei Trouble Ticket viene effettuata tramite interfaccia web attualmente in ambito INFNGRID viene utilizzata una soluzione OpenSource: Xoops/xHelp
Servizi di supporto DGAS (servizi di accounting) DGAS (Distributed Grid Accounting System) e' utilizzato sulle infrastrutture Grid per l'accounting delle risorse DGAS le informazioni sono raccolte in un database (Home Location Register) e possono essere aggregate in diversi modi: la granularità arriva fino al singolo job eseguito sulla Grid l'architettura e' completamente distribuita per assicurare flessibilità e scalabilità
Distributed Grid Accounting System
Deployment di un Grid Service Center LFC VOMS RB II SAM DGAS MS TS
Piano di deployment dell'infrastruttura Grid per il PON SCoPE
Attività - WP2 Work Package 2 Implementazione del middleware di base della piattaforma Grid Installazione e test del middleware di base INFNGRID sul prototipo SCoPE (CE, WN, SE, UI) Progettazione, realizzazione e test dei servizi Grid di start-up sul prototipo ScoPE (VOMS, RB, II, LFC) Progettazione, realizzazione e test dei servizi di Grid Monitoring (GridICE) e di Service Availability (SAM) Progettazione, realizzazione e test dei tool di monitoring ambientale e di management dell'infrastruttura Installazione e test del middleware di base INFNGRID nelle strutture periferiche coinvolte (CE, WN, SE, UI)
Attività - WP3 Work Package 3 Realizzazione e gestione della VO e delle risorse Supporto agli utenti Management dei servizi core del centro di calcolo ScoPE Management dei servizi core nei siti periferici Management dei servizi collective del centro di calcolo ScoPE Progettazione ed implementazione di un sistema di trouble ticketing (TS) Installazione di un portale di accesso (Web User Interface) alle risorse Grid (GENIUS) Gestione della VO SCoPE
Attività - WP5 Work Package 5 Integrazione della Grid ScoPE nell'infrastruttura Grid nazionale ed internazionale Coordinamento con gli altri PON per la progettazione e realizzazione dell'infrastruttura Grid comune Integrazione della Grid ScoPE nelle Grid nazionali Grid.it e nella Grid europea EGEE
Attività - WP6 Work Package 6 Diffusione dei risultati e training agli utenti Realizzazione di un Laboratorio Virtuale per la diffusione dei risultati ed il training dei nuovi utenti Inclusione di un sottoinsieme di risorse della Grid SCoPE nel testbed GILDA (Grid INFN Laboratory for Dissemination Activities) per l'integrazione di realtà territoriali (industria, ecc.)
Alcuni passi per l inserimento in una Grid 1. Acquisizione da parte degli utenti di certificati da una Registration Authority 2. Iscrizione del proprio nominativo in uno o più elenchi di un VOMS 3. Acquisto di apparati: vanno catalogati nell Information Index; il Monitoring provvederà a verificarne lo stato e la disponibilità in corso d opera 4. Iscrizione nei rispettivi CE degli utenti autorizzati all utilizzo delle risorse relative L insieme costituito da un elenco di nomi (punto 2) e dalle risorse associate agli utenti (punto 4) costituisce una Virtual Organization Sottomissione JOB 1) Da una UI (User Interface) l utente Carlo richiede alla VO Atlas l attivazione di un certificato (es.: ttl = 12 ore) per sottomettere dei job 2) Ottenuta l attivazione parte la richiesta di sottomissione al Resourse Broker 3) Il Resourse Broker consulta l Information Index 4) I job vengono sottomessi sulla farm FARM1 INFN-CA Certification Authority (FI) RA Registration Authority (NA) Carlo Gennaro Maria RA Registration Authority (CT) Luigi Franco Vincenzo VOMS Elenco Atlas: Carlo, Gennaro, Franco, Vito RA Registration Authority (CA) Antonio Giuseppe Vito Elenco CMS: Carlo, Maria, Luigi, Vincenzo, Antonio, Giuseppe CE-1 Atlas Computing Element Carlo Gennaro Vito SE-1 Maria Luigi Carlo CE-2 CMS Computing Element SE-2 CE-3 Atlas Computing Element Franco Vito FARM1 FARM2 FARM3 Resource Broker Information Index Monitoring Atlas-Farm1 Atlas-SE1 Atlas-Farm3 CMS-Farm2 CMS-SE2