Strategie di Super-Scheduling e Replicazione dei dati in Griglie per Applicazioni Data-intensive : Risultati per il progetto EU-DataGrid.

Dimensione: px
Iniziare la visualizzazioe della pagina:

Download "Strategie di Super-Scheduling e Replicazione dei dati in Griglie per Applicazioni Data-intensive : Risultati per il progetto EU-DataGrid."

Transcript

1 POLITECNICO DI BARI Facoltà di Ingegneria Corso di Laurea in Ingegneria Elettronica Tesi di Laurea in Sistemi Operativi Strategie di Super-Scheduling e Replicazione dei dati in Griglie per Applicazioni Data-intensive : Risultati per il progetto EU-DataGrid. Relatori: Chiar.mo Prof. Giacomo Piscitelli Chiar.mo Prof. Marcello Castellano Laureando: Francesco Carlucci A.A. 2001/2002

2 Ringrazio i Membri della INFN-Sezione di Bari e del Progetto Europeo DataGrid per la preziosa collaborazione offerta.

3 INDICE INDICE GENERALE Indice generale... 3 Introduzione... 6 Capitolo 1 Caratteristiche generali delle Griglie Definizione di Griglia Architettura di Griglia Livello Fabric: Risorse delle Griglie Computazionali Livello Connectivity: Comunicazione fra le Risorse Livello Resource: Accesso alle Risorse Livello Collective: Coordinazione delle Risorse Livello Application: Applicazioni delle Griglie Computazionali Tassonomia di una Griglia Definizione e requisiti del Workload Management System Tassonomia di un Resource Management System Organizzazione delle macchine Modello delle Risorse Organizzazione del Namespace delle risorse Qualità del Servizio (QoS) Resource Discovery Resource Dissemination Organizzazione degli schedulatori Stima dello stato del sistema La rischedulazione Le politiche di schedulazione Capitolo 2 Il Progetto EU-DataGrid Caratteristiche del progetto EU-DataGrid Motivazioni e finalità del progetto EU-DataGrid Architettura di DataGrid WP2 Grid Data Management La griglia e il modello di storage Un caso d uso: l analisi HEP Architettura

4 INDICE Data Management Replica Catalog Service Data Mover Service e Storage Manager Service Replica Manager WP3: Grid Information and Monitoring services Globus MDS R-GMA WP4: Fabric Management Gridification Resource Management WP5: Mass Storage Management Storage Element Service Interazioni con il Replica Manager (WP2) Interazioni con l Information Service (WP3) WP7: Network Monitoring QoS e incremento delle attuali prestazioni Monitoring della rete Il Network Optimization Service WP1: Workload Management System ClassAd e il Job Description Language Architettura del WMS Logging & Bookkeeping Service Caratteristiche avanzate del WMS Schedulazione dei job nella attuale release del WMS Capitolo 3 Il simulatore DataGridSim La simulazione La simulazione multi-threaded tempo-discreta ad eventi Il linguaggio di programmazione e i tools utilizzati Meccanismo di simulazione Progetto del simulatore Concetti generali Il modello della rete Il modello dei Computing Element Il modello degli Storage Element

5 INDICE Il modello della gestione dei file Confronto con altri simulatori di griglie computazionali Introduzione Bricks MicroGrid MONARC Simulator GridSim Simgrid OptorSim ChicSim GriSim L interfaccia grafica Capitolo 4 Super-scheduling e replicazione dei dati in DataGrid Il livello della schedulazione nel simulatore Organizzazione delle risorse Il concetto di Virtual Organization e l organizzazione multi-tier dei siti I servizi di DataGrid e la loro implementazione in simulazione La schedulazione su DataGrid Caratteristiche e obiettivi della schedulazione su griglie di dati Il Resource Broker e le politiche di scheduling Lo Storage Broker e le politiche di replicazione Simulazione e risultati Topologia e parametri di configurazione della DataGrid simulata Misure e risultati delle simulazioni Effetti di variazioni parametriche Conclusioni Bibliografia Appendice A Codice Sorgente del Simulatore Indice delle figure Indice delle tabelle

6 INTRODUZIONE INTRODUZIONE Il termine Griglia è stato coniato attorno alla metà degli anni Novanta, a denotare una infrastruttura di calcolo distribuito su scala geografica, essenzialmente orientata alle sperimentazioni scientifiche e ingegneristiche. Da allora questa definizione è stata estesa ad altri campi quali l intelligenza artificiale e il networking avanzato, sebbene con un certo abuso. In realtà, il vero e specifico problema alla base del concetto di Griglia è la condivisione coordinata di risorse all interno di una dinamica e multi-istituzionale organizzazione virtuale (Virtual Organization, brevemente indicata con VO) [1]. La condivisione non è limitata solo allo scambio dei file, ma si estende all accesso diretto a computer, al software, in generale a tutto l hardware necessario alla risoluzione di un problema scientifico, ingegneristico o industriale. Gli individui e le istituzioni che mettono a disposizione della griglia le loro risorse per la medesima finalità fanno parte della stessa VO. Un esempio molto esplicativo della necessità di raggruppare individui e risorse da loro offerte in organizzazioni virtuali è dato dal progetto EU-DataGrid [2], finanziato dalla Comunità Europea e finalizzato all allestimento di una infrastruttura di griglia di dati geograficamente estesa su tutta l Europa Unita. Vari esperimenti scientifici sono stati programmati [3] negli anni a venire su DataGrid, tra cui: 1. Fisica delle alte energie (HEP) come CMS, ATLAS, ALICE, e LHCb: rilevatori associati a vari esperimenti di collisioni tra particelle inizieranno a produrre a partire dal 2006 una enorme mole di dati (dell ordine di PetaBytes) per così dire grezzi che necessitano di essere analizzati e selezionati. 2. Osservazioni terrestri e spaziali: ogni giorno satelliti orbitanti inviano sulla Terra una quantità di dati attorno a 100 GB sotto forma di immagini, e questo numero è destinato sicuramente a salire in futuro, nasce dunque la necessità di immagazzinare e di conseguenza rendere accessibile ai fisici tutta l informazione raccolta. 3. Bio-Informatica, che comprende vari ambiti di ricerca, tra i quali il più interessante è l analisi del genoma umano. Ciascun progetto comunque presenta caratteristiche e necessità che lo differenziano dagli altri, ecco dunque che nasce la necessità di assegnare ciascun attività ad una VO distinta. Questo non preclude il fatto che se un istituzione o un individuo è coinvolto in più di una attività, esso possa appartenere a più VO. 6

7 INTRODUZIONE Caratteristica comune di questi progetti è la necessità di disporre un ambiente di calcolo data-intensive, nel quale le applicazioni hanno il bisogno di accedere a grandi quantità di dati geograficamente distribuiti in maniera veloce e affidabile, ed proprio è compito della DataGrid far operare queste applicazioni al meglio possibile. E facile osservare che nessun computer attuale sarebbe in grado da solo di elaborare simili moli di dati in tempi ragionevoli, tuttavia la condivisione di risorse quali CPU e dischi opportunamente coordinati può dare l impressione all utente di accedere ad un supercomputer virtuale, con una incredibile potenza computazionale e capacità di memorizzazione, in grado di sopportare grandi carichi di lavoro [4]. Non solo: attraverso la DataGrid, l utente può accedere a software non installato sulla sua workstation, e analizzare dati dall altro capo del mondo in modo molto più rapido. Basti pensare all efficienza e velocità derivanti dall eseguire la propria applicazione su una macchina sufficientemente potente (sicuramente più potente del proprio PC) scelta opportunamente vicina ai dati da utilizzare (vicinanza in termini di banda di trasmissione sufficiente a garantire buone prestazioni) in contrasto con l attuale procedura che consiste nello scaricare i dati da un sito remoto sulla propria macchina (lentamente, data la distanza notevole) e lanciare l applicazione sulla propria workstation, con l inconveniente aggiuntivo di doverla tenere sotto carico. Inoltre, spesso le applicazioni scientifiche abbisognano di particolari architetture di calcolo (multiprocessori paralleli, calcolatori vettoriali, ecc.) o strumenti di cui l utente non dispone fisicamente, ma ne può disporre virtualmente perché sono risorse condivise all interno della VO a cui appartiene. Dall idea di far apparire tutta l architettura di una DataGrid come un unico supercomputer virtuale, nascondendo all utilizzatore tutta la complessità interna ma mostrandogli solo i benefici, nasce l esigenza di progettare e realizzare uno schedulatore di risorse (Resource Broker, RB d ora in poi) [5][6]. Esso è uno dei componenti critici del sistema di gestione delle risorse, ha il compito di assegnare le risorse ai job in modo da soddisfare le esigenze delle applicazioni e del sistema. Le risorse di cui esso deve tenere traccia e gestire includono sistemi di calcolo, sistemi di immagazzinamento di dati (mediante lo Storage Broker [7]), la rete che li interconnette (mediante il Network Monitor). Lo scheduling è un campo tradizionale dell informatica ma, nonostante siano state studiate molte tecniche per numerosi tipi di sistemi, da uniprocessore a multiprocessore ai sistemi distribuiti, le caratteristiche tipiche delle griglie di dati 7

8 INTRODUZIONE rendono molti di questi approcci inadeguati. Infatti, mentre nei sistemi tradizionali le risorse e i job sono sotto il diretto controllo dello schedulatore, le risorse delle griglie sono geograficamente distribuite, sono di natura eterogenea e appartengono a diversi individui o organizzazioni, ciascuna con le proprie politiche di scheduling, modelli di costo di accesso differenti, carichi di lavoro e disponibilità di risorse che varia dinamicamente nel tempo. La mancanza di un controllo centralizzato, assieme alla presenza di utenti che generano job molto diversi l uno dall altro, rendono la schedulazione più complicata rispetto a quella dei sistemi di calcolo tradizionali. Queste considerazioni valgono per le griglie in generale, ma se consideriamo invece le griglie di dati, bisogna aggiungere che, pur essendo presenti in letteratura numerose politiche di scheduling per sistemi di macchine eterogenee, nessuna di queste può essere applicata al workload management system di una DataGrid: infatti, come su detto, è fondamentale in questo tipo di griglia garantire alle applicazioni un accesso veloce e affidabile ai dati, mentre nessuna di queste politiche tiene conto della disponibilità di rete, focalizzando la loro attenzione sulla risorsa CPU. L obiettivo di questa tesi è quello di studiare il comportamento e l efficienza (secondo metriche prestabilite, quali il makespan, il flowtime e il response time) di politiche di scheduling già esistenti in letteratura, tuttavia inadatte nella loro forma attuale all ambiente DataGrid: è necessario modificarle e integrarle con tecniche che tengano conto delle caratteristiche proprie di una griglia di dati, quali il network monitoring e il data replication. Infatti, da una parte, il monitoraggio della rete aiuta nel processo di scheduling del job sulle risorse computazionali, ottimizzando l accesso dell applicazione di griglia ai dati di input di cui ha bisogno. Una volta individuate le repliche migliori a cui il job schedulato su quella risorsa può accedere, la scelta della risorsa su cui schedulare il job avviene in base a tre politiche: i) assegnazione il job alla risorsa che meglio soddisfa i requisiti espressi dal job, mediante il Job Description Language; ii) assegnazione del job alla risorsa da cui esso può meglio accedere ai dati di input; iii) assegnazione del job alla risorsa in base ad una combinazione delle due precedenti politiche, che tenga conto sia dei requisiti del job sia della vicinanza dei dati. Questo tipo di ottimizzazione può essere ragionevolmente denominata di breve termine, dal momento che è essenzialmente orientata alle applicazioni anziché all intero sistema di griglia. Dall altra parte, l utilizzo di politiche di replicazione dinamica dei dati porta all ottimizzazione del sistema globale, quindi ad una ottimizzazione denominabile, a ragion veduta, di lungo termine. Una qualsiasi strategia di replicazione dei dati è, in 8

9 INTRODUZIONE generale, orientata all aumento delle prestazioni globali del sistema anziché delle singole applicazioni: come si vedrà nel corso della tesi, la schedulazione di un job prescinde dalla politica di replicazione utilizzata. La tendenza nelle griglie di dati, e quindi anche in DataGrid, è quella di tenere separati (disaccoppiati) il sistema di schedulazione dei job da quello di gestione dei dati: questa scelta, in DataGrid, è marcata dalla divisione dei due compiti tra due Work Package differenti (rispettivamente WP1 e WP2). Lo studio dell azione singola o combinata delle politiche di schedulazione e di replicazione è stato condotto mediante l uso di un simulatore di griglia realizzato ad hoc battezzato DataGridSim. Lo scopo di tale simulatore non è quello di riprodurre fedelmente il comportamento dei servizi e dei componenti di griglia: in passato si sono fatti tentativi di questo genere [58][60], però i risultati non sono stati mai soddisfacenti, in primo luogo perché il sistema simulato soffre di problemi di scalabilità (i simulatori realizzati, non riuscendo a riprodurre una vasta griglia, perdono di vista l obiettivo della simulazione, cioè riprodurre una griglia molto più vasta dei testbed disponibili), poi perché tali simulatori, sebbene riproducano fedelmente il funzionamento della griglia, si rivelano ardui da usare per lo studio di politiche di scheduling e replicazione di dati, dato l alto numero di parametri e la scarsa duttilità. Queste e altre motivazioni hanno portato alla decisione di realizzare un simulatore ex-novo anziché utilizzarne uno già esistente. DataGridSim ha come scopo principale la simulazione della condivisione delle risorse in un ambiente DataGrid. Questa caratteristica lo rende adatto allo studio di politiche di scheduling e di replicazione dei dati, giacché sono facilmente effettuabili misure di tempi di esecuzione e di carico sui nodi della griglia. La tesi è organizzata in questo modo: nei capitoli 1 e 2 è fornita una analisi approfondita delle problematiche, e delle soluzioni ad esse, rispettivamente nei sistemi a griglia in generale e nel progetto EU-DataGrid, verso cui la tesi stessa è orientata; il capitolo 3 è interamente dedicato al simulatore DataGridSim, di cui se ne illustrano le caratteristiche, l uso e anche un confronto con altri analoghi simulatori; nel capitolo conclusivo, il quarto, è illustrata, nella prima parte, l architettura proposta dell architettura di schedulazione e dei servizi di DataGrid, nella seconda invece sono discusse le politiche sia di schedulazione che di replicazione dei dati, fornendo anche i risultati delle simulazioni effettuate. 9

10 CAP. 1: CARATTERISTICHE GENERALI DELLE GRIGLIE CAPITOLO 1 CARATTERISTICHE GENERALI DELLE GRIGLIE In questo capitolo si cerca di fornire una panoramica abbastanza completa del lavoro di standardizzazione e uniformazione del concetto di griglia che si svolge in questi anni da parte di vari gruppi di ricercatori, coordinati dal Global Grid Forum (GGF) [29]. Infatti, l idea della griglia è un concetto sufficientemente nuovo, dunque è mancato materialmente il tempo per una razionalizzazione che invece è stata fornita ad altri argomenti del ramo del computing. A giustificazione di questa mancanza c è il fatto che finora nessun progetto di griglia è passato alla fase di produzione, al più si è arrivati alla realizzazione di piccoli e medi testbed, ben lontani però dalle dimensioni finali che si ipotizzano per un sistema Grid, quindi tutti i risultati ad oggi ottenuti sono sperimentali o addirittura solamente simulati. All interno di questa panoramica, particolare attenzione viene data al cuore della Griglia, il Resource Management System, componente o servizio che si occupa della gestione delle risorse partecipanti alla Griglia Definizione di Griglia Una Griglia è un sistema distribuito di network computing su larghissima scala [8], che può essere scalato alle dimensioni dell ambiente Internet con macchine distribuite tra molte organizzazioni e domini amministrativi [6]. Il concetto di Griglia nacque come progetto di collegamento di siti con supercomputer, ma ora è di gran lunga cresciuto oltre l intento originale. Infatti, sono tante le applicazioni che possono trarre beneficio da una infrastruttura a griglia, tra queste ricordiamo collaborative engineering, data exploration, high throughput computing, e naturalmente distributed supercomputing. Costruire una Griglia richiede lo sviluppo e l installazione di un certo numero di servizi, quali il resource discovery (servizio di individuazione e selezione delle risorse partecipanti all allestimento della Griglia), il resource management (servizio di gestione dei job, cioè le applicazioni utente, e delle risorse) e la sicurezza (questo servizio deve garantire un accesso autorizzato ed autenticato dell utente alle risorse). Dunque la Griglia non è solo un modello di architettura per fornire risorse computazionali per applicazioni con grandi esigenze di calcolo, ma è una infrastruttura che può collegare e unificare tra loro risorse estremamente eterogenee distribuite su 10

11 CAP. 1: CARATTERISTICHE GENERALI DELLE GRIGLIE tutto il globo terrestre. Ci sono cinque obiettivi che una Griglia deve perseguire per poter meritarsi questo nome [4][11]: L eterogeneità: una griglia coinvolge risorse eterogenee per natura sparse su vari domini amministrativi distribuiti su distanze geografiche. La scalabilità: una griglia può includere da poche a milioni di risorse, e ciò comporta il problema della potenziale degradazione delle prestazioni; per questo le applicazioni grid-enabled devono essere progettate per essere tolleranti alla latenza dovuta ai collegamenti su distanza geografica. La dinamicità o adattabilità: in una griglia il guasto di una risorsa è una regola, non un eccezione! Infatti, il gran numero di risorse rende la probabilità di guasto conseguentemente alta. Dunque sia i servizi offerti dalla griglia, sia le applicazioni orientate alla griglia devono avere un comportamento dinamico per ottenere la massima prestazione dalle risorse attualmente disponibili, senza far riferimento a risorse statiche potenzialmente soggette a guasti. La politica di riparazione di un guasto va dalla notifica al resto della griglia che la risorsa non è più disponibile al trasferimento del checkpoint di una attività in un altro nodo della griglia. L estensibilità: questa proprietà viene garantita nel momento in cui si adotta una progettazione modulare; le varie parti o moduli sono progettati in maniera indipendente l uno dall altro e comunicano mediante precisi e ben documentati protocolli o API. Questo modus operandi crea due vantaggi: 1) diventa facile sostituire un modulo con uno completamente nuovo, oppure semplicemente aggiornarlo, senza dover reinstallare l intera architettura (l aggiornamento o sostituzione va fatto solo sui nodi interessati e con estrema rapidità); 2) si rende la griglia altamente adattabile alle esigenze degli utenti e al loro carico di lavoro, per esempio, è sufficiente commutare su un altro modulo all interno dell RB per cambiare politica di schedulazione. L autonomia del sito: tenendo a mente eterogeneità delle risorse, la condivisione di proprie risorse all interno di una VO non deve andare a intaccare la loro normale amministrazione e quindi autonomia; in altre parole la partecipazione di un sito alla Griglia non deve intaccare gli esistenti sistemi di sicurezza, autenticazione, gestione delle risorse e degli utenti; ancora, la griglia non impone nessuno stravolgimento alla configurazione del sito, ma solamente propone norme da seguire anche in maniera lasca per utilizzare la griglia e condividere le proprie risorse al meglio [1]. 11

12 CAP. 1: CARATTERISTICHE GENERALI DELLE GRIGLIE Le cinque caratteristiche di una griglia su elencate possono essere implementate seguendo i seguenti passi: 1. L integrazione dei componenti individuali hardware e software in una risorsa di rete: questo comporta in primo luogo la definizione di un linguaggio di descrizione della risorsa, che possa astrarla dal livello fisico con un certo livello di dettaglio e renderla catalogabile e pubblicabile all interno dell information service (esempi sono il Condor ClassAd [14] e il LDAP [24], spiegati più avanti); in secondo luogo l implementazione di gestori della risorsa, che fanno da tramite tra i protocolli standard di griglia e l architettura della risorsa. Ad esempio, nel caso di sistemi di calcolo, il gestore della risorsa da un lato si interfaccia al protocollo di griglia, dall altro traduce i messaggi in comandi per i gestori locali (LRMS, acronimo di Local Resource Management Systems) quali LSF, PBS e Condor per cluster di workstation oppure la semplice chiamata fork() di Unix nel caso di singola workstation o PC; nel caso di altri tipi di risorse, possono essere interfacce verso il software di gestione di sensori o radiotelescopi, o interfacce verso database o file server quali NFS, AFS per i dischi e HPSS per i nastri. 2. L implementazione di un middleware (software basato su infrastrutture già esistenti) che provvede ad una visione trasparente delle risorse disponibili, assieme allo sviluppo di strumenti che permettono la gestione e il controllo delle applicazioni e delle infrastrutture di griglia e lo sviluppo e l ottimizzazione delle applicazioni distribuite, al fine di ottenere vantaggi dalle risorse. APPLICAZIONI Scientifiche Web Applications Ingegneristiche... AMBIENTI DI SVILUPPO E STRUMENTI Linguaggi Web Tools Librerie Monitoring Scheduler... SERVIZI DI ACCOPPIAMENTO DELLE RISORSE DISTRIBUITE Comunicazioni Sicurezza Informazioni Accesso ai dati QoS Applications Tools Middleware LOCAL RESOURCE MANAGERS Operating System Queuing Librerie e Kernel delle System applicazioni RISORSE DISTRIBUITE INTERNE ALLE ORGANIZZAZIONI Computer Cluster Storage Data Sources Systems TCP/IP & UDP Strumenti Scientifici Figura 1.1: Componenti di una Griglia Fabric 12

13 CAP. 1: CARATTERISTICHE GENERALI DELLE GRIGLIE Nella figura 1.1 si possono osservare i componenti principali della griglia, secondo una architettura a strati, di cui si dà ora la descrizione: Livello Fabric: esso raggruppa tutte le risorse hardware e software messe a disposizione della infrastruttura di griglia. Si osservi che non tutte le risorse fisiche di un sito possono apparire in questo livello: l amministratore può scegliere di non mettere a disposizione della VO di appartenenza alcune risorse per motivi di costo, sicurezza, ecc., e tali risorse risultano essere inesistenti e inaccessibili per la griglia. Livello Middleware: è il cuore della griglia, raggruppa l insieme dei protocolli, dei servizi di base (quali il controllo remoto dei processi, accesso alle risorse di memorizzazione, la sicurezza, l autenticazione, la fornitura di QoS mediante prenotazione delle risorse, la co-allocazione, la gestione delle informazioni ) e delle interfacce tra griglia e risorse del livello fabric (di cui si è parlato prima). Come suggerisce il nome, il livello Middleware mostra come l intera infrastruttura di griglia si poggia su architetture già esistenti: non tenta di sostituirsi ai gestori locali delle risorse, come sistemi operativi, scheduler di cluster, driver e protocolli di dischi, nastri e apparecchiature scientifiche, ma si integra con essi, creando così un utente virtuale che si affianca agli utenti fisici sul campo. D altra parte, il tentativo di creare un sistema di calcolo e condivisione di file su larghissima scala come Internet, non può che portare a questa scelta, piuttosto che a quella di progettare un sistema operativo distribuito tradizionale, che abbisogna di proprie risorse quali computer e linee di trasmissione dedicati. Questa direzione non è indolore: infatti lo sviluppatore di software per griglia si trova a dover interagire con hardware e software spesso mancante di documentazione accettabile, oppure non conforme a standard, oppure, ancora, non pienamente soddisfacente le proprie esigenze. Livello Tools: a questo strato la Griglia offre servizi di alto livello, quali il servizio di informazione (tiene traccia di tutti gli utenti e le risorse attualmente presenti e operanti sulla griglia, fornendo dati anche sul loro stato e carico di lavoro); il servizio di logging, indispensabile sia a livello utente (per mantenere traccia della propria attività sulla griglia), che a livello amministrativo (per effettuare analisi statistiche di workload e utilizzo delle risorse, ma soprattutto per rendere il sistema di griglia fault tolerant: infatti, un robusto servizio di logging garantisce la ripresa delle attività in modo trasparente all utente in caso di guasto di una risorsa; tale ripresa può essere effettuata sulla stessa risorsa, se è in grado di ripartire, oppure su un altra risorsa, dopo aver richiamato in automatico il servizio di brokering); il 13

14 CAP. 1: CARATTERISTICHE GENERALI DELLE GRIGLIE servizio di catalogo e management delle repliche di file e oggetti, che assume un ruolo fondamentale nelle DataGrid; i vari servizi di brokering delle risorse, che vanno dallo schedulatore dei job, agli storage broker (che si occupa delle risorse di immagazzinamento dati) e bandwidth broker (che si occupa della gestione della rete, principalmente di soddisfare richieste di QoS). Oltre a ciò, a questo livello si collocano tutte le librerie grid-enabled, cioè librerie di programmazione che aiutano l utente a interfacciare la propria applicazione con la griglia: l esempio più calzante è quello della sostituzione della chiamata a sistema operativo open() per l apertura di un file locale, con una ipotetica grid_open() che permette di accedere ad un file remoto presente su una risorsa di griglia, nascondendo così tutti i dettagli di basso livello, come i protocolli di comunicazione, all utente della griglia, che spesso è un ricercatore scientifico ed è poco interessato al funzionamento del sistema di griglia. Tutto quello che deve fare è ricompilare il proprio programma utilizzando le librerie grid-enabled al posto delle tradizionali librerie: questo rientra nella finalità di far apparire la griglia come un supercomputer virtuale. Tuttavia, una applicazione non orientata alla griglia (ossia che non è stata linkata con librerie grid-enabled) è comunque utilizzabile: infatti, meccanismi di data caching permettono l uso delle applicazioni tradizionali anche in remoto. Livello Applications: a questo livello si pongono tutte le applicazioni ingegneristiche e scientifiche che hanno bisogno della griglia per ottenere risultati, come le applicazioni high-throughput (simulazioni su vasta scala e studi parametrici); tali applicazioni possono avere un forte grado di parallelismo, oppure agiscono su un incredibile mole di dati (data-intensive), superiori a quelle di qualsiasi singola unità di memorizzazione, oppure interagiscono in modo remoto con strumenti scientifici costosi o non facilmente trasportabili (come radiotelescopi). Un notevole contributo allo sviluppo dei livelli middleware e tools è venuto dal progetto Globus [9][10]: il Globus Toolkit è un insieme di servizi di alto e basso livello, con la notevole caratteristica di essere costruiti in modo modulare con i moduli indipendenti e che espongono una interfaccia API ben documentata. Ciascun modulo offre un servizio differente e autonomo: si va dai servizi di basso livello come la sicurezza, l autenticazione e il trasporto di dati sulla rete, a servizi di più alto livello, come servizi di directory, di gestione delle repliche fino allo scheduling dei jobs. Il successo di questo toolkit è dovuto proprio a questa proprietà: i progettisti grid possono 14

15 CAP. 1: CARATTERISTICHE GENERALI DELLE GRIGLIE scegliere quali moduli utilizzare e quali scartare perché non a loro congeniali senza troppe complicazioni (solitamente la scelta ricade sui moduli di basso livello, in modo da risparmiare tempo e soldi nella progettazione di qualcosa di già esistente e già funzionante, impegnando le loro risorse sui servizi di griglia di livello tools, che sono ancora un problema aperto). Analizzeremo più avanti la struttura di Globus, nella trattazione dell EU-DataGrid, di cui il Globus Toolkit è un importante componente. Nella progettazione di una griglia è necessario seguire una serie di principi di base, al fine di facilitare la coesione di risorse eterogenee ed autonome [4]: L ambiente griglia non deve interferire con l amministrazione e l autonomia del sito; Non deve compromettere la sicurezza degli utenti e dei siti; Non deve sostituirsi ai sistemi operativi e ai protocolli di rete già presenti; Deve permettere sempre ad un sito di connettersi o sconnettersi dalla rete quando vuole; Deve provvedere ad una infrastruttura affidabile e fault tolerant con nessun punto debole; Deve utilizzare gli standard già presenti; Deve fornire agli sviluppatori di software librerie grid-enabled. 1.2 Architettura di Griglia Nella definizione di un architettura di griglia occorre porre attenzione al problema centrale dell interoperabilità intesa come capacità di stabilire relazioni condivise tra tutti i potenziali partecipanti alla Griglia, anche se questa definizione può essere ristretta senza perdere significato ai partecipanti ad una stessa VO (l interoperabilità tra VO non è strettamente necessaria). In un ambiente di rete, l interoperabilità vuol dire adozione di protocolli comuni. Dunque, l architettura di Griglia è prima e principalmente un architettura di protocolli, dove per protocolli si intendono i meccanismi di base con cui gli utenti e le risorse di una VO negoziano, gestiscono e sfruttano le condivisioni. Il messaggio contenuto in [1] e recepito dal Global Grid Forum [29] è l invito a spostare l attenzione del progettista Grid dal livello interno (software, caratteristiche delle risorse) al livello esterno (interazioni): il motivo sta nel fatto che le VO sono estremamente mutevoli, donde la necessità che la condivisione sia supportata da protocolli leggeri e flessibili, che facciano forti astrazioni sulle caratteristica della risorsa piuttosto che dettagliarla pesantemente. Protocolli con 15

16 CAP. 1: CARATTERISTICHE GENERALI DELLE GRIGLIE queste proprietà si prestano ad un efficiente resource discovery. Inoltre, dal momento che i protocolli gestiscono le interazioni tra componenti e non la loro implementazione, l autonomia (proprietà richiesta ad una griglia, come suddetto) è garantita: ciascun sito può scegliere una diversa implementazione del protocollo. L architettura proposta in [1] e riportata graficamente della figura 2.1 può essere definita a strati: ciascuno strato raggruppa protocolli specifici di quel livello, i quali possono interagire con protocolli di livello inferiore, il viceversa non può accadere. Gli strati hanno dimensioni differenti per sottolineare un preciso obiettivo da conseguire: man mano che si sale dal livello inferiore a quello superiore è auspicabile che il numero di protocolli vada diminuendo. Infatti, lo scopo ultimo è quello di arrivare a pochi protocolli che possano astrarre in maniera soddisfacente tutte le risorse attive sulla Griglia. Applications Collective Resource Connectivity Fabric Figura 2.1: Architettura di Protocolli per una Griglia Computazionale 2.1 Livello Fabric: Risorse delle Griglie Computazionali Il livello Fabric è composto dalle risorse della Griglia, caratterizzate da tre aspetti: i) estrema eterogeneità anche nella tipologia; ii) appartenenza ad amministrazioni differenti; iii) distribuzione su larga scala. Accanto a computer, supercomputer e database quindi, possiamo trovare altri strumenti scientifici come microscopi, radiotelescopi e sensori. L appartenenza delle risorse a domini amministrativi differenti è una 16

17 CAP. 1: CARATTERISTICHE GENERALI DELLE GRIGLIE caratteristica derivante dalla collaboratività dell ambiente: infatti ogni Virtual Organization mette a disposizione degli altri le proprie risorse ma ne mantiene sia la proprietà che l amministrazione, ognuna di esse quindi, ha piena libertà nella gestione. 2.2 Livello Connectivity: Comunicazione fra le Risorse Nel livello Connectivity si trovano i protocolli di comunicazione che permettono alle diverse componenti del livello Fabric di scambiarsi dati ed informazioni. Questi protocolli devono permettere il trasporto, l instradamento e l assegnazione di nomi ai diversi nodi. Naturalmente, dal momento che le griglie si basano su infrastrutture già esistenti e diffuse (è il concetto di middleware) sono adoperati gli standard de facto affermatisi con Internet, cioè i protocolli IP, TCP, UDP e DNS. 2.3 Livello Resource: Accesso alle Risorse Il livello Resource si preoccupa di rendere uniforme l accesso a risorse eterogenee, ossia crea risorse logiche uniformi adoperando quelle del livello Fabric. I componenti di questo livello possono essere suddivisi in due categorie: Sistemi informativi: forniscono informazioni sulla struttura e lo stato di una risorsa, come ad esempio la sua configurazione, il carico e le politiche d utilizzo. Sistemi di gestione: permettono l accesso e l utilizzo condiviso delle risorse, nel rispetto delle politiche d accesso stabilite dall amministrazione locale. 2.4 Livello Collective: Coordinazione delle Risorse Se il livello Resource permette l accesso ad una risorsa, il livello Collective contiene i servizi che permettono l utilizzo e la coordinazione di più risorse. I servizi di questo livello si distinguono in: Servizi di indicizzazione: permettono di scoprire l esistenza di risorse, dando la possibilità di effettuare ricerche per nome, per attributi come la tipologia, la disponibilità, il carico. Servizi di co-allocazione, scheduling e brokering: permettono l allocazione di una o più risorse pianificando l esecuzione di job. Servizi di replicazione dati: permettono la gestione dei dati realizzando meccanismi come la replicazione, che incrementano le prestazioni nell accesso ai dati, in base a metriche come il tempo di risposta, il costo e l affidabilità. 17

18 CAP. 1: CARATTERISTICHE GENERALI DELLE GRIGLIE Servizi di individuazione del software: permettono la scelta della miglior implementazione software e della miglior piattaforma d esecuzione. 2.5 Livello Application: Applicazioni delle Griglie Computazionali Il livello Application è costituito dagli strumenti (linguaggi, librerie, compilatori) che permettono la realizzazione di applicazioni Grid e dalle stesse applicazioni. Le applicazioni che più si avvantaggiano dell ambiente di griglia sono quelle che sfruttano: Supercalcolo distribuito: è necessario tutte le volte che la complessità dell applicazione rende improponibile la sua esecuzione su un unico elaboratore. Elaborazione high-throughput: con l elaborazione high-throghput si cerca di pianificare l esecuzione di un gran numero di job debolmente correlati, in modo da adoperare la potenza computazionale degli elaboratori temporaneamente inutilizzati. Elaborazione on-demand: l elaborazione on-demand viene adoperata ogniqualvolta c è la necessità di una gran potenza computazionale per un breve periodo di tempo, senza dover acquistare gli elaboratori necessari. Elaborazione data-intensive: le applicazioni data-intensive sintetizzano nuove informazioni partendo dai dati conservati in database distribuiti geograficamente. Ad esempio, durante un esperimento di fisica delle alte energie vengono raccolti un terabyte (1 TB byte) di dati al giorno, che corrispondono a circa mezzo petabyte (1 PB byte) l anno e le applicazioni d analisi accedono ad una considerevole frazione di questi dati, alla ricerca di eventi interessanti. Nella figura 3.1 si osserva un riassunto grafico dell architettura appena esaminata. 18

19 CAP. 1: CARATTERISTICHE GENERALI DELLE GRIGLIE APPLICATION COLLECTIVE RESOURCE CONNECTIVITY FABRIC Supercalcolo Distribuito, Highthroughput, On-demand, Data-intensive Linguaggi, Librerie, Compilatori Resource Discovery, Co-allocazione, Scheduling, Brokering, Replicazione dei Dati, Individuazione del Software Monitoraggio e Gestione delle Risorse Protocolli di Comunicazione, Meccanismi di Autenticazione Sistemi Operativi, Sistemi Operativi di Rete, Protocolli di Comunicazione, Database, Supercomputer, Workstation, PC, Reti, Microscopi, Radiotelescopi, Satelliti, Sensori Figura 3.1: Architettura di Griglia 1.3 Tassonomia di una Griglia Nella Figura 4.1 possiamo osservare la tassonomia di un sistema a griglia secondo [6]. L architettura di una griglia è motivata dagli obiettivi di progetto e dalle applicazioni di riferimento che devono utilizzare il sistema. Si possono trovare tre principali obiettivi di progetto: i) aumentare le prestazioni delle applicazioni, ii) favorire l accesso ai dati, iii) potenziare servizi nuovi o già esistenti. Alla luce di questi scopi, la tassonomia proposta divide le griglie rispettivamente in tre grandi categorie: le griglie computazionali, le griglie di dati e le griglie di servizi. 19

20 CAP. 1: CARATTERISTICHE GENERALI DELLE GRIGLIE Sistemi a Griglia Griglie Computazionali Griglie di Dati Griglie di Servizi Supercomputing High Throughput On-demand Multimediale Collaborativa Figura 4.1: Tassonomia dei sistemi a Griglia La categoria delle Griglie Computazionali (Computational Grids) individua sistemi che hanno una potenza di calcolo disponibile per una singola applicazione maggiore della potenza di ogni singola macchina che costituisce la griglia. In funzione di come questa potenza è utilizzata, questi sistemi si possono distinguere in sistemi distribuiti di supercomputing e high throughput. Un sistema distribuito di supercomputing esegue l applicazione in parallelo (previa opportuna parallelizzazione del codice) per ridurre il tempo di completamento di un job: esempi di questo tipo di necessità sono il modellamento dei fenomeni meteorologici e le simulazioni nucleari. Un ambiente high throughput, invece, tende a massimizzare un altra metrica di prestazioni, il tasso di completamento di un flusso di jobs (makespan e flowtime). Esempi tipici sono le applicazioni parameter-sweep, in cui è necessario eseguire sempre gli stessi calcoli sullo stesso set di dati, cambiando volta per volta alcuni parametri: in genere le simulazioni hanno questa prerogativa (come le simulazioni montecarlo). Le Griglie di Dati (Data Grids) sono sistemi che forniscono un infrastruttura per sintetizzare nuove informazioni dai data repositories, librerie digitali o banche dati largamente distribuite. Anche le griglie computazionali forniscono dei servizi per la gestione dei dati, ma la differenza maggiore tra le griglie di dati e quelle computazionali sta nella infrastruttura specializzata, fornita alle applicazioni per gestire l archiviazione e l accesso ai dati. In una Griglia Computazionale ogni applicazione implementa il proprio data management system piuttosto che usare dei servizi forniti dalla griglia. Infine, le Griglie di servizi (Service Grids) sono sistemi che forniscono servizi che non vengono forniti da singole macchine. Questa categoria si può suddividere 20

21 CAP. 1: CARATTERISTICHE GENERALI DELLE GRIGLIE ancora in: on-demand, collaborative e multimediali. Una griglia collaborativa connette utenti e applicazioni in gruppi di lavoro collaborativi, permettendo l interazione realtime fra gli utenti e le applicazioni tramite uno spazio di lavoro virtuale. Una griglia ondemand aggrega dinamicamente risorse differenti per fornire nuovi servizi. Infine una griglia multimediale fornisce una infrastruttura per applicazioni multimediali real-time: è quindi indispensabile che tale tipo di griglia supporti servizi di QoS tra le molteplici macchine geograficamente distribuite. Le tre categorie di griglia appena descritte rappresentano al meglio gli obiettivi dei progetti attualmente in lavorazione da parte di gruppi di ricerca in tutto il mondo. Ovviamente il sogno è quello di sviluppare un sistema a griglia veramente generalpurpose, ma tanti sono i problemi, a partire da quello dell ottimizzazione delle applicazioni a seconda delle richieste dell utente: è stato dimostrato [12] che è impossibile ottimizzare contemporaneamente il tempo di risposta di ciascuna applicazione e il throughput di tutte le applicazioni, anzi le due metriche sono antitetiche, l ottimizzazione di una va a scapito dell altra. Bisogna allora rinunciare all attuazione di una griglia general o multi-purpose? La risposta è negativa. Infatti, la necessità di mantenere l architettura di griglia modulare [11] si sposa bene con il concetto di Virtual Organization [1]: è possibile quindi che ciascuna VO adotti un proprio sistema di resource management o, meglio, che lo stesso servizio di gestione delle risorse si adatti alle esigenze degli utenti appartenenti alla stessa VO senza reinventare la ruota, semplicemente cambiando un modulo dell architettura. In questa soluzione al problema rientra l idea del community scheduler proposto in [5], quindi alla base del WMS (workload management system) di EU-DataGrid. 1.4 Definizione e requisiti del Workload Management System È chiaramente fondamentale la gestione di risorse quali i processori, la memoria, la rete, i dispositivi di memorizzazione, e le altre risorse in una griglia computazionale. Il Workload Management System (WMS) [13] è la parte del middleware di Griglia che ha il compito di amministrare le risorse al fine di eseguire le applicazioni in maniera conveniente, efficiente ed effettiva. Per svolgere questo compito, il WMS (spesso definito anche Resource Management System, RMS in breve) interagisce con gli altri componenti del Grid-middleware, come il security module che esegue l autenticazione degli utenti e gestisce le loro autorizzazioni, e il resource access 21

22 CAP. 1: CARATTERISTICHE GENERALI DELLE GRIGLIE module che fornisce l interfaccia al gestore locale delle risorse (come sistemi a coda di job e sistemi operativi [31]). Dal punto di vista dell utente, la gestione delle risorse è completamente trasparente, nel senso che la sua interazione con il WMS è limitata alla sola descrizione, attraverso un linguaggio di alto livello (come ClassAd di Condor [14]), dei requisiti sulle risorse sui cui devono essere eseguiti i propri job. È compito del WMS tradurre questi requisiti astratti sulle risorse in un insieme di risorse conformi, estratte dall intero set di risorse di griglie, alle quali l utente ha il permesso di accesso. Tipicamente un WMS è composto da tre moduli principali: lo user access module, il resource information module, e il resource handling module. Quest ultimo assolve al compito di allocare, reclamare e identificare la risorsa. L allocazione è la funzione di identificare una o più risorse che meglio rispondono ai requisiti del job, senza violare possibili limiti della risorsa, e di monitorare l esecuzione del job su queste risorse. La reclamazione è la funzione di richiamare la risorsa quando il job che la stava usando termina la sua esecuzione. Infine, identificare la risorsa vuol dire ad assegnare nomi simbolici alle risorse in modo tale che jobs e schedulatori possono identificare le risorse necessarie a eseguire il calcolo. A tal fine il resource handling module accede individualmente alle risorse di griglia interagendo con i gestori locali tramite interfacce predefinite. Esso interagisce strettamente col resource information module, il cui scopo è quello di collezionare e pubblicare informazioni riguardo l identità, le caratteristiche e lo stato delle risorse, cosicché possono essere prese efficaci decisioni di schedulazione. Il resource information module fornisce agevolazioni sia in fase di resource dissemination sia in fase di resource discovery. Il servizio di resource dissemination fornisce informazioni sulla disponibilità delle risorse, ed è usato dalla risorsa stessa per notificare la sua presenza sulla griglia, in modo che possa essere utilizzata dalle applicazioni. Il resource discovery è, invece, il meccanismo per cui le informazioni sulle risorse di griglia disponibili vengono esaminate dallo scheduler alla ricerca di un insieme di risorse conforme ai requisiti dell applicazione utente. Infine, lo user access module fornisce agli utenti il servizio di accesso al cuore del WMS, cioè il resource handling module. I requisiti dell applicazione sono formulati attraverso un job description language che viene sottoposto da questo modulo ad un procedimento di parsing, che traduce questo linguaggio in uno di più basso livello, interno al WMS. Solitamente questo modulo fornisce un interfaccia utente, che include comandi per iniziare, terminare e monitorare l esecuzione di un job. 22

23 CAP. 1: CARATTERISTICHE GENERALI DELLE GRIGLIE 1.5 Tassonomia di un Resource Management System Possiamo caratterizzare un sistema di gestione delle risorse focalizzando la nostra attenzione su: organizzazione delle macchine, modello delle risorse, protocollo di disseminazione, organizzazione del namespace, organizzazione dei data storage, resource discovery, supporto QoS, organizzazione dello scheduler, politiche di scheduling, stima dello stato e rescheduling [6] Organizzazione delle macchine Piatta Organizzazione A celle Gerarchica A celle piatte A celle gerarchiche Figura 5.1: Organizzazione delle macchine L organizzazione delle macchine nelle griglie influenza il modello delle comunicazioni del RMS e quindi la scalabilità della architettura che ne deriva. La tassonomia presentata in figura 5.1 è peculiare dei sistemi a griglia. In una organizzazione flat tutte le macchine possono comunicare l una con l altra senza intermediari. In una organizzazione gerarchica le macchine dello stesso livello possono comunicare direttamente con le macchine dello stesso livello, un livello sopra o un livello sotto nella scala gerarchica. In una struttura a celle le macchine appartenenti alla stessa cella comunicano fra loro in modo flat. Alcune macchine nella cella si occupano della comunicazione verso l esterno. La struttura interna di una cella non è visibile dall esterno. Una griglia che ha le una struttura a celle flat ha un solo livello, mentre quelle con struttura a celle gerarchica possono avere celle che contengono altre celle. La maggiore differenza fra una struttura a celle e una struttura gerarchica è che una struttura a celle ha dei confini limitati, con una struttura interna non visibile, mentre in una struttura gerarchica la struttura della gerarchia è pienamente visibile a tutti i 23

24 CAP. 1: CARATTERISTICHE GENERALI DELLE GRIGLIE componenti della griglia Modello delle Risorse Estensibile Oggetti Modello delle Risorse Fisso Estensibile Schema Fisso Figura 6.1: Modello delle Risorse Il modello delle risorse indica come le applicazioni e il RMS descrivono le risorse della griglia (Figura 6.1). La tassonomia presentata focalizza l attenzione su come vengono descritte le risorse e le operazioni su di esse. In un approccio a schema, la risorsa viene descritta con un linguaggio opportuno. In alcuni sistemi, viene aggiunto un linguaggio di query nel linguaggio dello schema. In uno schema estensibile nuovi tipi possono essere aggiunti per descrivere la risorsa. In un modello ad oggetti le operazioni sulla risorsa sono parte del modello delle risorse stesse. Anche questo modello può essere estensibile o fisso. Nel caso l approccio sia ad oggetti ed estensibile, viene fornito anche un meccanismo per estendere la definizione dell oggetto gestito dal RMS Organizzazione del Namespace delle risorse Il RMS di una Griglia lavora su un pool di risorse che hanno dei nomi globali. L organizzazione del namespace (Figura 7.1), che può essere creato e gestito da un entità esterna al RMS, influenza notevolmente il progetto dei protocolli di gestione delle risorse e condiziona i metodi di scoperta delle risorse. 24

25 CAP. 1: CARATTERISTICHE GENERALI DELLE GRIGLIE Relazionale Namespace delle Risorse Gerarchico Ibrido A grafo Figura 7.1: Organizzazione del Namespace delle Risorse Un namespace relazionale divide le risorse in relazioni e usa le metodologie dei database relazionali. Un namespace gerarchico divide le risorse della griglia in gerarchie. Le gerarchie sono tipicamente organizzate sulla base della struttura fisica o logica delle reti. Il namespace ibrido consiste in relazioni ma il contenuto delle relazioni sono spezzate in un ordine gerarchico al fine di distribuirle sulle macchine della griglia. Un namespace basato sui grafi usa nodi e puntatori dove i nodi possono o meno essere entità complesse Qualità del Servizio (QoS) Nei sistemi a griglia il QoS non è limitato alla larghezza di banda della rete ma si estende alla capacità di calcolo e di archiviazione dei nodi. Se le applicazioni hanno esigenze particolari in termini di tempo è necessario calcolare il QoS totale piuttosto che fornire solo quello relativo alla rete, inoltre la scelta delle risorse da utilizzate risulterà fortemente vincolata da questo. Nessuno Supporto QoS Hard Soft Figura 8.1: Supporto QoS Il QoS è di tipo soft se il RMS fornisce i dati circa il QoS di una risorsa ma non garantisce che sia rispettato, di tipo Hard se garantisce che il QoS dichiarato venga 25

26 CAP. 1: CARATTERISTICHE GENERALI DELLE GRIGLIE rispettato Resource Discovery La scelta delle risorse da utilizzare parte dalla ricerca delle risorse disponibili e adatte allo scopo, tale ricerca va sotto il nome di resource discovery (figura 9.1). I sistemi basati su query si differenziano per il fatto che le richieste possono essere inviate ad un unico database centralizzato o ad uno distribuito. Query Centralizzata Resource Discovery Agenti Distribuita Figura 9.1: Resource Discovery La maggior differenza tra un approccio basato su query e uno basato su agenti sta nel fatto che quello basato su agenti può utilizzare una sua logica, piuttosto che usare una funzione fissa del meccanismo di query, al limite un agente può comportarsi anche come una query Resource Dissemination Per dissemination ci riferiamo all operazione che compiono le risorse comunicando la loro disponibilità ad essere utilizzate (figura 10.1). L aggiornamento dei database, gli stessi usati per il resource discovery, può avvenire su base periodica o su richiesta. Quelli su base periodica si differenziano in push e pull a seconda che le informazioni vengano inviate dalla risorsa al sistema o vengano richieste dal sistema. Nei sistemi on-line/on-demand le informazioni vengono inviate (push) immediatamente dalla macchina che le origina al sistema. 26

Griglie computazionali

Griglie computazionali Griglie computazionali Università degli Studi di Napoli Federico II Corso di Laurea Magistrale in Informatica I Anno IL MIDDLEWARE Richiami sulla caratterizzazione dei sistemi GRID Il Concetto di Virtual

Dettagli

Reti di Calcolatori GRIGLIE COMPUTAZIONALI

Reti di Calcolatori GRIGLIE COMPUTAZIONALI D. Talia RETI DI CALCOLATORI - UNICAL 10-1 Reti di Calcolatori GRIGLIE COMPUTAZIONALI D. Talia RETI DI CALCOLATORI - UNICAL 10-2 Griglie Computazionali Cosa è il Grid Computing? Architettura Ambienti Globus

Dettagli

GRIGLIE COMPUTAZIONALI

GRIGLIE COMPUTAZIONALI Reti di Calcolatori GRIGLIE COMPUTAZIONALI D. Talia RETI DI CALCOLATORI - UNICAL 10-1 Griglie Computazionali Cosa è il Grid Computing? Architettura Ambienti Globus D. Talia RETI DI CALCOLATORI - UNICAL

Dettagli

Organizzazioni nel Grid Computing

Organizzazioni nel Grid Computing Il ruolo delle Organizzazioni nel Grid Computing Un primo sguardo a Globus - Parte 5 Organizzazioni di Grid Computing Panoramica sui prodotti software Primo sguardo a Globus Dott. Marcello CASTELLANO La

Dettagli

Presentazione NIS Network Integration & Solutions s.r.l. Autore: nome Cognome Data: Evento

Presentazione NIS Network Integration & Solutions s.r.l. Autore: nome Cognome Data: Evento Presentazione NIS Network Integration & Solutions s.r.l. Autore: nome Cognome Data: Evento Chi siamo NIS nasce nel 1993 come spin-off dalla Università di Genova (DIST) Nel 1996 viene aperta una unità operativa

Dettagli

Sistemi Distribuiti. Introduzione Definizione Vantaggi e svantaggi Architetture hardware e software Problemi di progetto. Sistemi Operativi mod.

Sistemi Distribuiti. Introduzione Definizione Vantaggi e svantaggi Architetture hardware e software Problemi di progetto. Sistemi Operativi mod. Sistemi Distribuiti Introduzione Definizione Vantaggi e svantaggi Architetture hardware e software Problemi di progetto 19.1 Introduzione A metà degli anni quaranta inizia l era dei calcolatori elettronici

Dettagli

Introduzione. Sistemi Distribuiti. Introduzione. Introduzione. Definizione di sistema distribuito. Introduzione

Introduzione. Sistemi Distribuiti. Introduzione. Introduzione. Definizione di sistema distribuito. Introduzione Sistemi Distribuiti Definizione Vantaggi e svantaggi Architetture hardware e software Problemi di progetto A metà degli anni quaranta inizia l era dei calcolatori elettronici moderni: grandi, costosi e

Dettagli

Studio e implementazione di metodi di previsione dei guasti per politiche di scheduling in ambito Desktop Grid

Studio e implementazione di metodi di previsione dei guasti per politiche di scheduling in ambito Desktop Grid Studio e implementazione di metodi di previsione dei guasti per politiche di scheduling in ambito Desktop Grid Relatore Dott. Massimo Canonico Candidato Guido Vicino Laurea in Informatica dei Sistemi Avanzati

Dettagli

Ambienti di calcolo a griglia - Parte 3

Ambienti di calcolo a griglia - Parte 3 TOC Ambienti di calcolo a griglia - Parte 3 Obiettivo Formativo Un software di griglia può essere installato con una certa facilità da programmatori. Al crescere dell uso e della dipendenza dell utenza,

Dettagli

Grid Scheduling e WS-Agreement

Grid Scheduling e WS-Agreement Grid Scheduling e WS-Agreement D. Talia - UNICAL Griglie e Sistemi di Elaborazione Ubiqui Sommario Il Problema del esource Management Applicazioni in più domini Obiettivi del proprietario vs. obiettivi

Dettagli

Table of Contents. Insegnamento: Sistemi Distribuiti - 6 cfu LM Ing. Informatica Docente: Prof. Marcello Castellano

Table of Contents. Insegnamento: Sistemi Distribuiti - 6 cfu LM Ing. Informatica Docente: Prof. Marcello Castellano Insegnamento: Sistemi Distribuiti - 6 cfu LM Ing. Informatica Docente: Prof. Marcello Castellano Table of Contents Definizione di Sistema Distribuito - 4 Obiettivi Principali di un S.D. - 7 Tipi di Sistemi

Dettagli

Table of Contents. Definizione di Sistema Distribuito 15/03/2013

Table of Contents. Definizione di Sistema Distribuito 15/03/2013 Insegnamento: Sistemi Distribuiti - 6 cfu LM Ing. Informatica Docente: Prof. Marcello Castellano Table of Contents Definizione di Sistema Distribuito - 4-7 - 13 Definizioni e Principali Caratteristiche

Dettagli

Ambienti di calcolo a griglia Parte 2. Risorse (e loro gestione) Job di griglia e applicazioni di griglia Riservare le risorse ai job

Ambienti di calcolo a griglia Parte 2. Risorse (e loro gestione) Job di griglia e applicazioni di griglia Riservare le risorse ai job Ambienti di calcolo a griglia Parte 2 Risorse (e loro gestione) Job di griglia e applicazioni di griglia Riservare le risorse ai job Docente: Marcello CASTELLANO La vera rivoluzione non è più la capacità

Dettagli

WS-Agreement. Sommario. Il Problema del Resource Management. Obiettivi del proprietario vs. obiettivi delle applicazioni

WS-Agreement. Sommario. Il Problema del Resource Management. Obiettivi del proprietario vs. obiettivi delle applicazioni Gid Grid Scheduling Shdli e WS-Agreement D. Talia - UNICAL Griglie e Sistemi di Elaborazione Ubiqui Sommario Il Problema del esource Management Applicazioni i i in più domini i Obiettivi del proprietario

Dettagli

Università degli Studi di Napoli Federico II Corso di Laurea Magistrale in Informatica I Anno

Università degli Studi di Napoli Federico II Corso di Laurea Magistrale in Informatica I Anno Griglie computazionali Università degli Studi di Napoli Federico II Corso di Laurea Magistrale in Informatica I Anno LEZIONE N. 16 Resource Management Systems: PBS, MAUI Il Computing Element Griglie computazionali

Dettagli

Progetto di Applicazioni Software

Progetto di Applicazioni Software Progetto di Applicazioni Software Antonella Poggi Dipartimento di Informatica e Sistemistica Antonio Ruberti SAPIENZA Università di Roma Anno Accademico 2008/2009 Questi lucidi sono stati prodotti sulla

Dettagli

Problemi di schedulazione distribuita su Grid

Problemi di schedulazione distribuita su Grid Problemi di schedulazione distribuita su Grid Ivan Porro Università degli Studi di Genova, DIST, Laboratorio BioLab pivan@unige.it 010-3532789 Si ringrazia per il materiale il Dr. Andrea Clematis dell

Dettagli

Work Package Grid Workload Management

Work Package Grid Workload Management Work Package Grid Workload Management Last modified: 22.05.01 Nell ambito del progetto DataGrid, le attivita` del work package 1 (Grid Workload Management), di cui l INFN e` responsabile, si stanno concentrando

Dettagli

Progetto di Applicazioni Software

Progetto di Applicazioni Software Progetto di Applicazioni Software Antonella Poggi Dipartimento di Informatica e Sistemistica Antonio Ruberti SAPIENZA Università di Roma Anno Accademico 2010/2011 Questi lucidi sono stati prodotti sulla

Dettagli

Infrastruttura di produzione INFN-GRID

Infrastruttura di produzione INFN-GRID Infrastruttura di produzione INFN-GRID Introduzione Infrastruttura condivisa Multi-VO Modello Organizzativo Conclusioni 1 Introduzione Dopo circa tre anni dall inizio dei progetti GRID, lo stato del middleware

Dettagli

Sistema Operativo e Applicativi

Sistema Operativo e Applicativi Sistema Operativo e Applicativi Modulo di Informatica Dott.sa Sara Zuppiroli A.A. 2012-2013 Modulo di Informatica () Software A.A. 2012-2013 1 / 36 Software Conosciamo due classi di software: Programmi

Dettagli

Come funziona un sistema di elaborazione

Come funziona un sistema di elaborazione Introduzione Cosa è un Sistema Sste aoperativo? Come funziona un sistema di elaborazione Proprietà dei Sistemi Operativi Storia dei Sistemi di Elaborazione Sistemi Mainframe Sistemi Desktop Sistemi i Multiprocessori

Dettagli

RETI PEER-TO-PEER. Reti di Calcolatori. Applicazioni di Rete avanzate: Reti di Calcolatori. Sistemi Peer to Peer Griglie Computazionali

RETI PEER-TO-PEER. Reti di Calcolatori. Applicazioni di Rete avanzate: Reti di Calcolatori. Sistemi Peer to Peer Griglie Computazionali Reti di Calcolatori Applicazioni di Rete avanzate: Sistemi Peer to Peer Griglie Computazionali Corso di Reti di Calcolatori Carlo Mastroianni Reti di Calcolatori RETI PEER-TO-PEER Sistemi P2P In una rete

Dettagli

Strutture dei Sistemi Operativi

Strutture dei Sistemi Operativi Strutture dei Sistemi Operativi Componenti di sistema Servizi del sistema operativo Chiamate di sistema Programmi di sistema Struttura del sistema Macchine virtuali Progetto e implementazione di sistemi

Dettagli

Grid Data Management Services

Grid Data Management Services Grid Management Services D. Talia - UNICAL Griglie e Sistemi di Elaborazione Ubiqui Sommario Grid Management in Globus Toolkit GridFTP (Trasferimento Dati) RFT (Trasferimento Dati Affidabile) RLS (Gestione

Dettagli

File System Distribuiti

File System Distribuiti File System Distribuiti Introduzione Nominazione e Trasparenza Accesso ai File Remoti Servizio Con/Senza Informazione di Stato Replica dei File Un esempio di sistema 20.1 Introduzione File System Distribuito

Dettagli

Introduzione. File System Distribuiti. Nominazione e Trasparenza. Struttura dei DFS. Strutture di Nominazione

Introduzione. File System Distribuiti. Nominazione e Trasparenza. Struttura dei DFS. Strutture di Nominazione File System Distribuiti Introduzione Nominazione e Trasparenza Accesso ai File Remoti Servizio Con/Senza Informazione di Stato Replica dei File Un esempio di sistema Introduzione File System Distribuito

Dettagli

Griglie computazionali LEZIONE N. 14. Università degli Studi di Napoli Federico II Corso di Laurea Magistrale in Informatica I Anno

Griglie computazionali LEZIONE N. 14. Università degli Studi di Napoli Federico II Corso di Laurea Magistrale in Informatica I Anno Griglie computazionali Università degli Studi di Napoli Federico II Corso di Laurea Magistrale in Informatica I Anno LEZIONE N. 14 OGSA, OGSI e WSRF Gli Standard OGF Griglie computazionali - a.a. 2009-10

Dettagli

Capitolo 1: Introduzione

Capitolo 1: Introduzione Capitolo 1: ntroduzione Che cos è un sistema operativo? Sistemi mainframe. Sistemi desktop. Sistemi multiprocessore. Sistemi distribuiti. Sistemi cluster. Sistemi in tempo reale. Sistemi palmari. Migrazione

Dettagli

CAPITOLO 5 - Sistemi Operativi Moderni

CAPITOLO 5 - Sistemi Operativi Moderni CAPITOLO 5 - Sistemi Operativi Moderni PRESENTAZIONE DI INSIEME Vedremo ora come si è evoluta nel tempo la struttura di un sistema operativo, per passare dalle vecchie strutture di tipo normalmente modulari,

Dettagli

Sistemi Distribuiti. Libri di Testo

Sistemi Distribuiti. Libri di Testo Sistemi Distribuiti Rocco Aversa Tel. 0815010268 rocco.aversa@unina2.it it Ricevimento: Martedì 14:16 Giovedì 14:16 1 Libri di Testo Testo Principale A.S. Tanenbaum, M. van Steen, Distributed Systems (2

Dettagli

Grid on Cloud : Implementazione e Monitoraggio

Grid on Cloud : Implementazione e Monitoraggio Tesi di Laurea Magistrale Anno Accademico 2013-2014 Relatore Ch.mo Prof. Marcello Cinque Correlatori Ch.mo Ing. Flavio Frattini Ch.mo Ing. Davide Bottalico Candidato Antonio Nappi Matr. M63000141 Supercalcolatori

Dettagli

Sistemi Operativi UNICAL. Facoltà di Ingegneria. Domenico Talia A.A. 2002-2003 1.1. Sistemi Operativi. D. Talia - UNICAL

Sistemi Operativi UNICAL. Facoltà di Ingegneria. Domenico Talia A.A. 2002-2003 1.1. Sistemi Operativi. D. Talia - UNICAL Domenico Talia Facoltà di Ingegneria UNICAL A.A. 2002-2003 1.1 Introduzione Presentazione del corso Cosa è un Sistema Operativo? Sistemi Mainframe Sistemi Desktop Sistemi Multiprocessori Sistemi Distribuiti

Dettagli

Virtualizzazione e Cloud Computing

Virtualizzazione e Cloud Computing Virtualizzazione e Cloud Computing 12 marzo 2015 Claudio Bizzarri claudio@bizzarri.net Ordine degli Ingegneri di Pistoia La virtualizzazione Macchine reali e macchine virtuali Vantaggi della virtualizzazione

Dettagli

Componenti di Sistemi Operativi. System Call Programmi di sistema Componenti di un SO Servizi di SO

Componenti di Sistemi Operativi. System Call Programmi di sistema Componenti di un SO Servizi di SO Componenti di so 1 Componenti di Sistemi Operativi System Call Programmi di sistema Componenti di un SO Servizi di SO 2 System Call Le system call forniscono l'interfaccia tra running program e SO Generalmente

Dettagli

Sistemi Operativi. Introduzione UNICAL. Facoltà di Ingegneria. Domenico Talia A.A. 2002-2003

Sistemi Operativi. Introduzione UNICAL. Facoltà di Ingegneria. Domenico Talia A.A. 2002-2003 Domenico Talia Facoltà di Ingegneria UNICAL A.A. 2002-2003 1.1 Introduzione Presentazione del corso Cosa è un Sistema Operativo? Sistemi Mainframe Sistemi Desktop Sistemi Multiprocessori Sistemi Distribuiti

Dettagli

Introduzione alle tecnologie informatiche. Strumenti mentali per il futuro

Introduzione alle tecnologie informatiche. Strumenti mentali per il futuro Introduzione alle tecnologie informatiche Strumenti mentali per il futuro Panoramica Affronteremo i seguenti argomenti. I vari tipi di computer e il loro uso Il funzionamento dei computer Il futuro delle

Dettagli

Servizi Avanzati in Ambiente Distribuito NESSI - Grid

Servizi Avanzati in Ambiente Distribuito NESSI - Grid Università degli Studi di Messina Facoltà di Ingegneria Servizi Avanzati in Ambiente Distribuito NESSI - Grid Autore: ing. Giulio De Meo Indice degli argomenti Piattaforme Tecnologiche Europee NESSI Grid

Dettagli

Condor-G: Un Agente per la Gestione dell Elaborazione in Multi-Institutional Grids

Condor-G: Un Agente per la Gestione dell Elaborazione in Multi-Institutional Grids Condor-G: Un Agente per la Gestione dell Elaborazione in Multi-Institutional Grids James Frey, Todd Tannenbaum, Miron Livny, Ian Foster, Steven Tuecke Condor-G Sfrutta: Security, comunicazioni, resource

Dettagli

Sistemi Distribuiti. Informatica B. Informatica B

Sistemi Distribuiti. Informatica B. Informatica B Sistemi Distribuiti Introduzione Che cos è un sistema distribuito? Un sistema distribuito è una collezione di computer indipendenti che appare all utente come un solo sistema coerente Da notare: le macchine

Dettagli

Introduzione al sistema operativo. Laboratorio Software 2008-2009 C. Brandolese

Introduzione al sistema operativo. Laboratorio Software 2008-2009 C. Brandolese Introduzione al sistema operativo Laboratorio Software 2008-2009 C. Brandolese Che cos è un sistema operativo Alcuni anni fa un sistema operativo era definito come: Il software necessario a controllare

Dettagli

CRESCO. Centro computazionale di RicErca sui Sistemi COmplessi. Dipartimento di Ingegneria dell Informazione e Matematica Applicata

CRESCO. Centro computazionale di RicErca sui Sistemi COmplessi. Dipartimento di Ingegneria dell Informazione e Matematica Applicata CRESCO Centro computazionale di RicErca sui Sistemi COmplessi Dipartimento di Ingegneria dell Informazione e Matematica Applicata Università di Salerno Responsabile Unità Operativa Prof. Ciro D Apice Attività

Dettagli

Architettura SW Definizione e Notazioni

Architettura SW Definizione e Notazioni Corso di Laurea Specialistica in Ingegneria Informatica Corso di Ingegneria del Software A. A. 2008 - Stili Architetturali E. TINELLI Architettura SW Definizione e Notazioni Definizione ANSI/IEEE Std Std1471-2000

Dettagli

ARCHITETTURE DEI SISTEMI DI ELABORAZIONE

ARCHITETTURE DEI SISTEMI DI ELABORAZIONE ARCHITETTURE DEI SISTEMI DI ELABORAZIONE 1 SISTEMI ACCENTRATI CARATTERISTICHE Sistemi proprietari Monocultura Scarsa diffusione informatica Backlog 2 Soluzione centralizzata TERMINALE TERMINALE ELABORATORE

Dettagli

Il clustering. Sistemi Distribuiti 2002/2003

Il clustering. Sistemi Distribuiti 2002/2003 Il clustering Sistemi Distribuiti 2002/2003 Introduzione In termini generali, un cluster è un gruppo di sistemi indipendenti che funzionano come un sistema unico Un client interagisce con un cluster come

Dettagli

Basi di Dati. Introduzione ai sistemi di basi di dati. K.Donno - Introduzione ai sistemi di basi di dati

Basi di Dati. Introduzione ai sistemi di basi di dati. K.Donno - Introduzione ai sistemi di basi di dati Basi di Dati Introduzione ai sistemi di basi di dati Introduzione ai sistemi di basi di dati Gestione dei Dati Una prospettiva storica File system verso DBSM Vantaggi di un DBMS Modelli dei dati Utenti

Dettagli

CAPITOLO 3 Previsione

CAPITOLO 3 Previsione CAPITOLO 3 Previsione 3.1 La previsione I sistemi evoluti, che apprendono le regole di funzionamento attraverso l interazione con l ambiente, si rivelano una risorsa essenziale nella rappresentazione di

Dettagli

Introduzione ai sistemi di basi di dati

Introduzione ai sistemi di basi di dati Basi di Dati Introduzione ai sistemi di basi di dati Alessandro.bardine@gmail.com alessandro.bardine@iet.unipi.it Introduzione ai sistemi di basi di dati Gestione dei Dati Una prospettiva storica File

Dettagli

DGAS Accounting economico e bilanciamento del carico di lavoro per la European DataGrid

DGAS Accounting economico e bilanciamento del carico di lavoro per la European DataGrid DGAS Accounting economico e bilanciamento del carico di lavoro per la European DataGrid Rosario M. Piro Istituto Nazionale di Fisica Nucleare (INFN) Sezione di Torino 10 dicembre 2003 Il sistema di gestione

Dettagli

IL SOFTWARE TIPI DI SOFTWARE. MACCHINE VIRTUALI Vengono definite così perché sono SIMULATE DAL SOFTWARE, UNIFORMANO L ACCESSO SISTEMA OPERATIVO

IL SOFTWARE TIPI DI SOFTWARE. MACCHINE VIRTUALI Vengono definite così perché sono SIMULATE DAL SOFTWARE, UNIFORMANO L ACCESSO SISTEMA OPERATIVO IL SOFTWARE L HARDWARE da solo non è sufficiente a far funzionare un computer Servono dei PROGRAMMI (SOFTWARE) per: o Far interagire, mettere in comunicazione, le varie componenti hardware tra loro o Sfruttare

Dettagli

Informatica Documentale

Informatica Documentale Informatica Documentale Ivan Scagnetto (scagnett@dimi.uniud.it) Stanza 3, Nodo Sud Dipartimento di Matematica e Informatica Via delle Scienze, n. 206 33100 Udine Tel. 0432 558451 Ricevimento: giovedì,

Dettagli

CdL MAGISTRALE in INFORMATICA

CdL MAGISTRALE in INFORMATICA 05/11/14 CdL MAGISTRALE in INFORMATICA A.A. 2014-2015 corso di SISTEMI DISTRIBUITI 7. I processi : il naming Prof. S.Pizzutilo Il naming dei processi Nome = stringa di bit o di caratteri utilizzata per

Dettagli

Evoluzione dei sistemi operativi (5) Evoluzione dei sistemi operativi (4) Classificazione dei sistemi operativi

Evoluzione dei sistemi operativi (5) Evoluzione dei sistemi operativi (4) Classificazione dei sistemi operativi Evoluzione dei sistemi operativi (4) Sistemi multiprogrammati! più programmi sono caricati in contemporaneamente, e l elaborazione passa periodicamente dall uno all altro Evoluzione dei sistemi operativi

Dettagli

Grid Tutorial Day Palermo, 13 Aprile 2011 Job Description Language Gestione job utente

Grid Tutorial Day Palermo, 13 Aprile 2011 Job Description Language Gestione job utente Grid Tutorial Day Palermo, 13 Aprile 2011 Marco Cipolla Job Description Language Gestione job utente Jobs e Applicazioni Utente I job permettono l esecuzione di programmi utente sulla GRID Per sottomettere

Dettagli

CORSO I.F.T.S TECNICHE PER LA PROGETTAZIONE E LA GESTIONE DI DATABASE

CORSO I.F.T.S TECNICHE PER LA PROGETTAZIONE E LA GESTIONE DI DATABASE CORSO I.F.T.S TECNICHE PER LA PROGETTAZIONE E LA GESTIONE DI DATABASE Ing. Mariano Di Claudio Lezione del 24/09/2014 Indice 1. Aspetti di Data Management CouchBase 2. Aspetti Architetturali Infrastruttura

Dettagli

Introduzione ai Sistemi Distribuiti

Introduzione ai Sistemi Distribuiti Università degli Studi di Roma Tor Vergata Facoltà di Ingegneria Introduzione ai Sistemi Distribuiti Corso di Sistemi Distribuiti Valeria Cardellini Anno accademico 2008/09 Definizioni di SD Molteplici

Dettagli

Lezione 11. Sistemi operativi. Marco Cesati System Programming Research Group Università degli Studi di Roma Tor Vergata.

Lezione 11. Sistemi operativi. Marco Cesati System Programming Research Group Università degli Studi di Roma Tor Vergata. Lezione 11 system Sistemi operativi 12 maggio 2015 System Programming Research Group Università degli Studi di Roma Tor Vergata SO 15 11.1 Di cosa parliamo in questa lezione? L interfaccia : system 1 Il

Dettagli

Sistemi Operativi STRUTTURA DEI SISTEMI OPERATIVI 3.1. Sistemi Operativi. D. Talia - UNICAL

Sistemi Operativi STRUTTURA DEI SISTEMI OPERATIVI 3.1. Sistemi Operativi. D. Talia - UNICAL STRUTTURA DEI SISTEMI OPERATIVI 3.1 Struttura dei Componenti Servizi di un sistema operativo System Call Programmi di sistema Struttura del sistema operativo Macchine virtuali Progettazione e Realizzazione

Dettagli

Il Progetto di Centro di Reprocessing di BaBar: Monitoring e Simulazione

Il Progetto di Centro di Reprocessing di BaBar: Monitoring e Simulazione Il Progetto di Centro di Reprocessing di BaBar: Monitoring e Simulazione Moreno Marzolla Email marzolla@pd.infn.it WWW: http://www.pd.infn.it/~marzolla INFN Padova BaBar Collaboration & Dip. Informatica,

Dettagli

CLOUD COMPUTING REFERENCE ARCHITECTURE: LE INDICAZIONI DEL NATIONAL INSTITUTE OF STANDARDS AND TECHNOLOGY. Prima parte: Panoramica sugli attori

CLOUD COMPUTING REFERENCE ARCHITECTURE: LE INDICAZIONI DEL NATIONAL INSTITUTE OF STANDARDS AND TECHNOLOGY. Prima parte: Panoramica sugli attori ANALISI 11 marzo 2012 CLOUD COMPUTING REFERENCE ARCHITECTURE: LE INDICAZIONI DEL NATIONAL INSTITUTE OF STANDARDS AND TECHNOLOGY Nella newsletter N 4 abbiamo già parlato di Cloud Computing, introducendone

Dettagli

EGRID MIDDLEWARE OVERVIEW. Angelo Leto Abdus Salam I.C.T.P. aleto@ictp.trieste.it 08/10/2004

EGRID MIDDLEWARE OVERVIEW. Angelo Leto Abdus Salam I.C.T.P. aleto@ictp.trieste.it 08/10/2004 EGRID MIDDLEWARE OVERVIEW Angelo Leto Abdus Salam I.C.T.P. aleto@ictp.trieste.it 08/10/2004 Introduzione al concetto di GRID Sulla base dell implementazione GLOBUS-EDG-EGRID What is the GRID? What is the

Dettagli

Classificazione del software

Classificazione del software Classificazione del software Classificazione dei software Sulla base del loro utilizzo, i programmi si distinguono in: SOFTWARE Sistema operativo Software applicativo Sistema operativo: una definizione

Dettagli

Griglie computazionali LEZIONE N. 10. Università degli Studi di Napoli Federico II Corso di Laurea Magistrale in Informatica I Anno

Griglie computazionali LEZIONE N. 10. Università degli Studi di Napoli Federico II Corso di Laurea Magistrale in Informatica I Anno Griglie computazionali Università degli Studi di Napoli Federico II Corso di Laurea Magistrale in Informatica I Anno LEZIONE N. 10 Tecnologie di Storage; DAS, NAS, SAN Esempio di SRM: StoRM 1 Introduzione

Dettagli

Le imprese intelligenti passano a IBM Scale Out Network Attached Storage (SONAS)

Le imprese intelligenti passano a IBM Scale Out Network Attached Storage (SONAS) IBM Systems and Technology Group (STG) System Le imprese intelligenti passano a IBM Scale Out Network Attached (SONAS) 2 Le imprese intelligenti passano a IBM Scale Out Network Attached (SONAS) Benvenuti

Dettagli

Supercalcolo e Grid: le infrastrutture per la ricerca del nuovo millennio. P. Govoni Universita ed INFN Milano-Bicocca

Supercalcolo e Grid: le infrastrutture per la ricerca del nuovo millennio. P. Govoni Universita ed INFN Milano-Bicocca Supercalcolo e Grid: le infrastrutture per la ricerca del nuovo millennio P. Govoni Universita ed INFN Milano-Bicocca gli ingredienti fondamentali i computer: gli strumenti che svolgono le operazioni di

Dettagli

Grid Data Management Services

Grid Data Management Services Grid Management Services D. Talia - UNICAL Griglie e Sistemi di Elaborazione Ubiqui Sommario Grid Management GridFTP RFT RLS OGSA-DAI 1 GT4 Services GridFTP High-performance transfer protocol The Reliable

Dettagli

Introduzione ai sistemi operativi

Introduzione ai sistemi operativi Introduzione ai sistemi operativi Che cos è un S.O.? Shell Utente Utente 1 2 Utente N Window Compilatori Assembler Editor.. DB SOFTWARE APPLICATIVO System calls SISTEMA OPERATIVO HARDWARE Funzioni di un

Dettagli

Il Sistema Operativo. C. Marrocco. Università degli Studi di Cassino

Il Sistema Operativo. C. Marrocco. Università degli Studi di Cassino Il Sistema Operativo Il Sistema Operativo è uno strato software che: opera direttamente sull hardware; isola dai dettagli dell architettura hardware; fornisce un insieme di funzionalità di alto livello.

Dettagli

BrightSync: progetto di un middleware di sincronizzazione per ambienti eterogenei

BrightSync: progetto di un middleware di sincronizzazione per ambienti eterogenei Corso di Laurea Specialistica in Ingegneria Informatica Reti di Calcolatori LS prof. Antonio Corradi BrightSync: progetto di un middleware di sincronizzazione per ambienti eterogenei di Emanuele Crescentini

Dettagli

Informatica di Base - 6 c.f.u.

Informatica di Base - 6 c.f.u. Università degli Studi di Palermo Dipartimento di Ingegneria Informatica Informatica di Base - 6 c.f.u. Anno Accademico 2007/2008 Docente: ing. Salvatore Sorce Il Sistema Operativo Gerarchia del software

Dettagli

comuni ai moderni SO sui quali il corso è incentrato Definizione di sistema operativo

comuni ai moderni SO sui quali il corso è incentrato Definizione di sistema operativo Il Sistema Operativo (SO) è una parte essenziale di un sistema di calcolo In generale un SO è un insieme di programmi che agisce come intermediario tra utenti e hardware di un computer. Esiste un insieme

Dettagli

Il middleware INFNGRID Certification Authority Virtual Organization Servizi core Servizi collective Servizi di supporto al deployment e per la

Il middleware INFNGRID Certification Authority Virtual Organization Servizi core Servizi collective Servizi di supporto al deployment e per la Architettura del middleware INFNGRID e piano di deployment sull'infrastruttura SCoPE Gennaro Tortone INFN Napoli 21 febbraio 2007 Indice Il middleware INFNGRID Certification Authority Virtual Organization

Dettagli

Il Cloud Computing: uno strumento per migliorare il business

Il Cloud Computing: uno strumento per migliorare il business Il Cloud Computing: uno strumento per migliorare il business Luca Zanetta Uniontrasporti I venti dell'innovazione - Imprese a banda larga Varese, 9 luglio 2014 1 / 22 Sommario Cos è il cloud computing

Dettagli

17/05/2013. Indice dei Contenuti. Ruolo del Naming nei SD. Corso Sistemi Distribuiti 6 cfu Docente: Prof. Marcello Castellano

17/05/2013. Indice dei Contenuti. Ruolo del Naming nei SD. Corso Sistemi Distribuiti 6 cfu Docente: Prof. Marcello Castellano Corso Sistemi Distribuiti 6 cfu Docente: Prof. Marcello Castellano /35 Ruolo del Naming nei SD - 3 Denominazione di entità - 4 Sistemi di Naming - 8 Tipologie di Naming - 10 Naming Semplice e Differenti

Dettagli

Corso di Alfabetizzazione Informatica

Corso di Alfabetizzazione Informatica Corso di Alfabetizzazione Informatica Lezione 6 a.a. 2010/2011 Francesco Fontanella La Complessità del Hardware Il modello di Von Neumann è uno schema di principio. Attualmente in commercio esistono: diversi

Dettagli

D3.1 Documento di analisi della visualizzazione 3D in ambiente Cloud e relative problematiche

D3.1 Documento di analisi della visualizzazione 3D in ambiente Cloud e relative problematiche D3.1 Documento di analisi della visualizzazione 3D in ambiente Cloud e relative problematiche Il Cloud Computing La visualizzazione nella Cloud Problematiche Virtualizzazione della GPU Front end Virtualization

Dettagli

Programmazione. Dipartimento di Matematica. Ing. Cristiano Gregnanin. 25 febbraio 2015. Corso di laurea in Matematica

Programmazione. Dipartimento di Matematica. Ing. Cristiano Gregnanin. 25 febbraio 2015. Corso di laurea in Matematica Programmazione Dipartimento di Matematica Ing. Cristiano Gregnanin Corso di laurea in Matematica 25 febbraio 2015 1 / 42 INFORMATICA Varie definizioni: Scienza degli elaboratori elettronici (Computer Science)

Dettagli

Sistemi Operativi. Struttura astratta della memoria. Gerarchia dei dispositivi di. Memoria centrale. Memoria secondaria (di massa)

Sistemi Operativi. Struttura astratta della memoria. Gerarchia dei dispositivi di. Memoria centrale. Memoria secondaria (di massa) Struttura astratta della memoria Memoria centrale il solo dispositivo di memoria al quale la CPU puo accedere direttamente Memoria secondaria (di massa) Estensione della memoria centrale che fornisce grande

Dettagli

Cos'é una (Computing) GRID?

Cos'é una (Computing) GRID? Incontro Borsisti Progetto Lauree Scientifiche Perugia, 26 agosto 1 settembre 2007 Cos'é una (Computing) GRID? Istituto Nazionale Fisica Nucleare Sezione di Perugia Università Studi di Perugia Perché il

Dettagli

Processi di Business e Sistemi di Gestione di Workflow: concetti di base. Prof. Giancarlo Fortino g.fortino@unical.it

Processi di Business e Sistemi di Gestione di Workflow: concetti di base. Prof. Giancarlo Fortino g.fortino@unical.it Processi di Business e Sistemi di Gestione di Workflow: concetti di base Prof. Giancarlo Fortino g.fortino@unical.it Introduzione Le aziende devono modificare la loro organizzazione per cogliere le nuove

Dettagli

Architetture dei WIS. Definizione di WIS. Benefici dei WIS. Prof.ssa E. Gentile a.a. 2011-2012

Architetture dei WIS. Definizione di WIS. Benefici dei WIS. Prof.ssa E. Gentile a.a. 2011-2012 Architetture dei WIS Prof.ssa E. Gentile a.a. 2011-2012 Definizione di WIS Un WIS può essere definito come un insieme di applicazioni in grado di reperire, cooperare e fornire informazioni utilizzando

Dettagli

MAGO CRESCO - SPI.2. Relazione finale sul Progetto MAGO. Consorzio Campano di Ricerca per l Informatica e l Automazione Industriale S.c.a.r.l.

MAGO CRESCO - SPI.2. Relazione finale sul Progetto MAGO. Consorzio Campano di Ricerca per l Informatica e l Automazione Industriale S.c.a.r.l. CRESCO - SPI.2 MAGO Relazione finale sul Progetto MAGO Relativo al contratto tra ENEA e CRIAI avente per oggetto: Analisi e Realizzazione di tool innovativi a supporto delle funzionalità GRID stipulato

Dettagli

Architetture di Cloud Computing

Architetture di Cloud Computing Corso di Laurea Magistrale in Ingegneria Informatica Corso di Ingegneria del A. A. 2013-2014 Architetture di Cloud Computing 1 Cloud computing Sommario Principali requisiti richiesti dal cloud clomputing

Dettagli

I SISTEMI OPERATIVI CONCETTI INTRODUTTIVI

I SISTEMI OPERATIVI CONCETTI INTRODUTTIVI I SISTEMI OPERATIVI CONCETTI INTRODUTTIVI Il Software Software di Base Sistema Operativo (Software di base essenziale) Software di base non essenziale Utility Driver Software applicativi (Applicazioni)

Dettagli

SISTEMI OPERATIVI. Realizzazione del file system. Prof. Luca Gherardi Prof.ssa Patrizia Scandurra (anni precedenti) (MODULO DI INFORMATICA II)

SISTEMI OPERATIVI. Realizzazione del file system. Prof. Luca Gherardi Prof.ssa Patrizia Scandurra (anni precedenti) (MODULO DI INFORMATICA II) SISTEMI OPERATIVI (MODULO DI INFORMATICA II) Realizzazione del file system Prof. Luca Gherardi Prof.ssa Patrizia Scandurra (anni precedenti) Università degli Studi di Bergamo a.a. 2012-13 Sommario Realizzazione

Dettagli

Fondamenti di Informatica Laurea in Ingegneria Civile e Ingegneria per l ambiente e il territorio

Fondamenti di Informatica Laurea in Ingegneria Civile e Ingegneria per l ambiente e il territorio Dipartimento di Ingegneria dell Informazione Università degli Studi di Parma Fondamenti di Informatica Laurea in Ingegneria Civile e Ingegneria per l ambiente e il territorio Il software di base Software

Dettagli

Valutazione delle prestazioni e Sistemi Distribuiti Dipartimento di Informatica Universita del Piemonte Orientale

Valutazione delle prestazioni e Sistemi Distribuiti Dipartimento di Informatica Universita del Piemonte Orientale Valutazione delle prestazioni e Sistemi Distribuiti Dipartimento di Informatica Universita del Piemonte Orientale Cosimo Anglano cosimo.anglano@mfn.unipmn.it Roma, 9-10 Giugno 2004 Composizione del gruppo

Dettagli

L iniziativa Cloud DT

L iniziativa Cloud DT L iniziativa Cloud DT Francesco Castanò Dipartimento del Tesoro Ufficio per il Coordinamento Informatico Dipartimentale (UCID) Roma, Luglio 2011 Il Cloud Computing Alcune definizioni Il Cloud Computing

Dettagli

Sistemi Informativi e WWW

Sistemi Informativi e WWW Premesse Sistemi Informativi e WWW WWW: introduce un nuovo paradigma di diffusione (per i fornitori) e acquisizione (per gli utilizzatori) delle informazioni, con facilità d uso, flessibilità ed economicità

Dettagli

ALLEGATO C STANDARD TECNICI DELLA BORSA CONTINUA NAZIONALE DEL LAVORO

ALLEGATO C STANDARD TECNICI DELLA BORSA CONTINUA NAZIONALE DEL LAVORO ALLEGATO C STANDARD TECNICI DELLA BORSA CONTINUA NAZIONALE DEL LAVORO Standard tecnici Gli standard tecnici di riferimento adottati sono conformi alle specifiche e alle raccomandazioni emanate dai principali

Dettagli

corrispondente server Web (l applicazione server) viene inviata una richiesta, alla quale il server normalmente risponde inviando la pagina HTML che

corrispondente server Web (l applicazione server) viene inviata una richiesta, alla quale il server normalmente risponde inviando la pagina HTML che Prefazione In questo volume completiamo l esplorazione del linguaggio Java che abbiamo iniziato in Java Fondamenti di programmazione. I due testi fanno parte di un percorso didattico unitario, come testimoniano

Dettagli

Estratto dell'agenda dell'innovazione e del Trade Bologna 2011. Speciale: I casi. Introduzione dell'area tematica IL CASO DI SUCCESSO

Estratto dell'agenda dell'innovazione e del Trade Bologna 2011. Speciale: I casi. Introduzione dell'area tematica IL CASO DI SUCCESSO Estratto dell'agenda dell'innovazione e del Trade Bologna 2011 Speciale: I casi Introduzione dell'area tematica IL CASO DI SUCCESSO Innovare e competere con le ICT: casi di successo - PARTE I Cap.7 Cloud

Dettagli

Database distribuiti al servizio di sistemi ambientali avanzati: l esperienza Datacrossing

Database distribuiti al servizio di sistemi ambientali avanzati: l esperienza Datacrossing Database distribuiti al servizio di sistemi ambientali avanzati: l esperienza Datacrossing Pierluigi Cau e Simone Manca Le necessita in campo ambientale - strumenti di gestione e archiviazione dei dati,

Dettagli

Grid Middleware: L interazione con IPv6. Valentino R. Carcione valentino.carcione@garr.it GARR. [GARR WS7-Roma-16-11-2006]

Grid Middleware: L interazione con IPv6. Valentino R. Carcione valentino.carcione@garr.it GARR. [GARR WS7-Roma-16-11-2006] Grid Middleware: L interazione con IPv6 Valentino R. Carcione valentino.carcione@garr.it GARR [GARR WS7-Roma-16-11-2006] Grid e IPv6, quali vantaggi? IPv6 offre uno spazio di indirizzamento molto ampio

Dettagli

Definizione e storia dei sistemi operativi

Definizione e storia dei sistemi operativi Definizione e storia dei sistemi operativi Dipartimento di Informatica Università di Verona, Italy Che cos è un Sistema Operativo? E un insieme di programmi agisce come intermediario tra HW e uomo per

Dettagli

Lezione 1. Introduzione e Modellazione Concettuale

Lezione 1. Introduzione e Modellazione Concettuale Lezione 1 Introduzione e Modellazione Concettuale 1 Tipi di Database ed Applicazioni Database Numerici e Testuali Database Multimediali Geographic Information Systems (GIS) Data Warehouses Real-time and

Dettagli

Sistemi Informativi Distribuiti

Sistemi Informativi Distribuiti Corso di Laurea Magistrale in Ingegneria Gestionale Corso di Sistemi Informativi Modulo II A. A. 2013-2014 SISTEMI INFORMATIVI MODULO II Sistemi Informativi Distribuiti 1 Sistemi informativi distribuiti

Dettagli

1. Spiegare le differenze fra le seguenti modalità di binding degli indirizzi:

1. Spiegare le differenze fra le seguenti modalità di binding degli indirizzi: 1. Spiegare le differenze fra le seguenti modalità di binding degli indirizzi: compile time, load time, execution time. Quale delle modalità precedenti necessita di un supporto hardware per poter essere

Dettagli

Sistemi operativi e reti A.A. 2015-16. Lezione 2

Sistemi operativi e reti A.A. 2015-16. Lezione 2 Università di Roma Tor Vergata Corso di Laurea triennale in Informatica Sistemi operativi e reti A.A. 2015-16 Pietro Frasca Lezione 2 Giovedì 8-10-2015 Sistemi batch multiprogrammati La causa principale

Dettagli

Di seguito ci accingiamo ad analizzare le possibili configurazioni di architettura: Server singolo

Di seguito ci accingiamo ad analizzare le possibili configurazioni di architettura: Server singolo La progettazione dell architettura si concentra sulla scelta dell hardware, dell infrastruttura di rete, e dei componenti software che andranno a costituire il sistema. Gli obbiettivi tecnologici che il

Dettagli