Supercalcolo e Grid: le infrastrutture per la ricerca del nuovo millennio. P. Govoni Universita ed INFN Milano-Bicocca



Documenti analoghi
Infrastruttura di produzione INFN-GRID

Il Sistema Operativo (1)

Architetture Informatiche. Dal Mainframe al Personal Computer

Architetture Informatiche. Dal Mainframe al Personal Computer

Reti e Internet: introduzione

Creare una Rete Locale Lezione n. 1

Reti di Telecomunicazione Lezione 6

Reti di Calcolatori. Vantaggi dell uso delle reti. Cosa è una rete? Punto di vista logico: sistema di dati ed utenti distribuito

Sistemi Operativi. Modulo 2. C. Marrocco. Università degli Studi di Cassino

Sistemi Operativi. Conclusioni e nuove frontiere

RETI INFORMATICHE Client-Server e reti paritetiche

Approccio stratificato

Lo scenario: la definizione di Internet

VMware. Gestione dello shutdown con UPS MetaSystem

WNoD: Virtualizzazione, Grid e Cloud nel Calcolo Scientifico per l INFN

Progetto di Applicazioni Software

INTRODUZIONE ALL' INFORMATICA

RETI DI COMPUTER Reti Geografiche. (Sez. 9.8)

Corso di Alfabetizzazione Informatica

Finalità delle Reti di calcolatori. Le Reti Informatiche. Una definizione di Rete di calcolatori. Hardware e Software nelle Reti

ICT (Information and Communication Technology): ELEMENTI DI TECNOLOGIA

Reti di Calcolatori GRIGLIE COMPUTAZIONALI

GRIGLIE COMPUTAZIONALI

Progetto di Applicazioni Software

Informatica. Teoria. L architettura dei PC Storia dell informatica Periferiche Reti - Software. Marco Brama

Corso di laurea in Biotecnologie. Introduzione. Marta Capiluppi Dipartimento di Informatica Università di Verona

Ambienti di calcolo a griglia Parte 2. Risorse (e loro gestione) Job di griglia e applicazioni di griglia Riservare le risorse ai job

Introduzione alle tecnologie informatiche. Strumenti mentali per il futuro

Comunicazione tra Processi

Comunicazione tra Processi

CALCOLATORI ELETTRONICI A cura di Luca Orrù

L informatica INTRODUZIONE. L informatica. Tassonomia: criteri. È la disciplina scientifica che studia

CitySoftware PROTOCOLLO. Info-Mark srl

RETI DIGITALI E TECNOLOGIE ABILITANTI

MODELLO CLIENT/SERVER. Gianluca Daino Dipartimento di Ingegneria dell Informazione Università degli Studi di Siena

Identificazione documento. Approvazioni. Variazioni DEGLI STUDI DI NAPOLI FEDERICO II. Centro di Ateneo per i Servizi Informativi

Hardware delle reti LAN

Introduzione al sistema operativo. Laboratorio Software C. Brandolese

Informatica - A.A. 2010/11

Reti di Calcolatori. Corso di Informatica. Reti di Calcolatori. Reti di Calcolatori. Corso di Laurea in Conservazione e Restauro dei Beni Culturali

I sistemi distribuiti

Office e Applicativi sw

Specifiche tecniche e funzionali del Sistema Orchestra

Reti di Calcolatori. Il Livello delle Applicazioni

Introduzione alle applicazioni di rete

Introduzione a Internet e al World Wide Web

Reti di calcolatori. Reti di calcolatori

Laboratorio di Informatica I

MODULO 02. Iniziamo a usare il computer

Comunicazione tra Computer. Protocolli. Astrazione di Sottosistema di Comunicazione. Modello di un Sottosistema di Comunicazione

SDD System design document

Reti di Calcolatori. una rete di calcolatori è costituita da due o più calcolatori autonomi che possono interagire tra di loro una rete permette:

Organizzazioni nel Grid Computing

Il software impiegato su un computer si distingue in: Sistema Operativo Compilatori per produrre programmi

ECDL MODULO 1 Concetti di base della tecnologia dell informazione. Prof. Michele Barcellona

Introduzione alle griglie computazionali

Internet Internet è universalmente nota come la Rete delle reti: un insieme smisurato di computer collegati tra loro per scambiarsi dati e servizi.

INFORMATICA. Corso di Laurea in Scienze dell'educazione

Lezione 1. Introduzione e Modellazione Concettuale

Dalla connessione ai social network. Federico Cappellini

Le Aziende del Distretto Green & High Tech presentano i loro progetti. Valorizzare le sinergie della rete per creare valore aggiunto

Cloud Service Broker

Modulo 1. Concetti di base della Tecnologia dell Informazione ( Parte 1.1)

Tecnologia dell Informazione

Il sistema operativo TinyOS

Laboratorio di Informatica

Pubblico e privato nelle strategie di e-government

Informatica. Scopo della lezione

Dispensa di Informatica I.1

SISTEMA SPUNI per la gestione delle pratiche di Sportello Unico per le Attività Produttive, in formato elettronico

Programma del corso. Introduzione Rappresentazione delle Informazioni Calcolo proposizionale Architettura del calcolatore Reti di calcolatori

Una rassegna dei sistemi operativi per il Cloud Computing

Internet e il World Wide Web. Informatica di Base A -- Rossano Gaeta 1

Introduzione. Sommario: Obiettivo:

Università degli Studi di Napoli Federico II Facoltà di Ingegneria Corso di Laurea Specialistica in Ingegneria Informatica.

Prova di informatica & Laboratorio di Informatica di Base

Breve storia del calcolo automatico

Sistemi Operativi II Corso di Laurea in Ingegneria Informatica

3 Capitolo primo Informatica e calcolatori

SISTEMA SUEDIL per la gestione delle pratiche di Sportello Unico per l EDILIZIA, in formato elettronico

Reti di elaboratori. Reti di elaboratori. Reti di elaboratori INFORMATICA PER LE DISCIPLINE UMANISTICHE 2 (13042)

Iniziare con Internet Explorer. dott. Andrea Mazzini

Scienze della comunicazione L 20 LABORATORIO INFORMATICA APPLICATA. Le reti di calcolatori

Corso di Informatica

Concetti di base delle tecnologie ICT

Definizione Parte del software che gestisce I programmi applicativi L interfaccia tra il calcolatore e i programmi applicativi Le funzionalità di base

Accesso Remoto: Che cos'è Q uali programmi si utilizzano Come si effettua (teoria) Q uando è utile

INTRODUZIONE ALL INFORMATICA

TERM TALK. software per la raccolta dati

Sistemi Operativi MECCANISMI E POLITICHE DI PROTEZIONE. D. Talia - UNICAL. Sistemi Operativi 13.1

MECCANISMI E POLITICHE DI PROTEZIONE 13.1

Cloud Computing Stato dell arte, Opportunità e rischi

Reti commutate. Reti commutate. Reti commutate. Reti commutate. Reti e Web

Informatica DR KLOE Calcolo

Sistema di Gestione Documentale V.2.5.x. ARCHIVIAZIONE OTTICA, FASCICOLAZIONE E PROTOCOLLO V.2.5.x

Software di sistema e software applicativo. I programmi che fanno funzionare il computer e quelli che gli permettono di svolgere attività specifiche

Storia di Internet e del World Wide Web

CdL in Medicina Veterinaria - STPA AA

Corso di Informatica

Linux nel calcolo distribuito

Transcript:

Supercalcolo e Grid: le infrastrutture per la ricerca del nuovo millennio P. Govoni Universita ed INFN Milano-Bicocca

gli ingredienti fondamentali i computer: gli strumenti che svolgono le operazioni di calcolo il software: le istruzioni impartite ai computer lo spazio disco: la capacita di immagazzinare dati da elaborare la connessione: il mezzo attraverso il quale i computer possono comunicare fra loro 2

i computer 1939 nasce HP 1941 viene costruito Bombe 1945 von Neumann introduce il concetto di software (utilizzato praticamente nel 1949-50) 1950 primo computer distribuito commercialmente 1956 primo computer a transistor 1958 prima connessione su vasta scala di stazioni radar in USA e Canada 3

i computer 1964 IBM passa dai transistor ai circuiti integrati 1965 primo mini-computer 1974 primo computer basato su un processore Intel (8008) 1976 primo computer parallelo, composto da un vettore di processori (Cray I) 1981 primo personal computer IBM 1994 cluster di personal computer costruito alla NASA (Beowulf) 4

la potenza di calcolo cresce nel corso del tempo aumenta la potenza di calcolo dei computer e diminuisce il costo a parita di potenza: computer sempre piu economici e potenti 5

capacita di calcolo al CERN LEP1 LEP2 LHC 6

il software 1945 primo linguaggio di programmazione (Konrad Zuse) 1948 teoria della comunicazione fra computer (Claude Shannon) 1952 primo compilatore (Grace Hopper) 1957 nascita del linguaggio FORTRAN 1960 invenzione dell algoritmo di ordinamento Quicksort (C. A. R. Hoare) 1962 primo videogioco: SpaceWar! 7

il software 1969 sviluppo di UNIX (Kenneth Thompson e Dennis Richie) 1977 standard di criptografia IBM adottati dal governo USA 1989 sviluppo di Parallel Virtual Machine, per utilizzare un insieme di computer come un unico calcolatore 1990 invenzione di HTML al CERN (Tim Berners- Lee) 1991 nascita di Linux (Linus Torvalds) 8

l HTML il WWW nasce come strumento di un gruppo specifico di utenti (Fisica delle Alte Energie) il suo design universale ed essere stato concepito in un laboratorio no-profit sono fra le ragioni del suo successo 9

lo spazio disco 1956 primo disco magnetico (IBM) 1962 realizzazione della prima memoria virtuale (Tom Kilburn) 1971 primo disco floppy (David Noble, IBM) 1980 primo hard disk per microcomputer (Seagate Tech) 1981 primo sistema di salvataggio ottico (Sony) 10

evoluzione della capacita 11

la connessione 1960 primo modem (AT&T) 1970 nasce ARPANET, la prima rete di condivisione di risorse informatiche fra diverse universita americane 1971 viene mandata la prima email (Ray Tomlinson) 1975 primo protocollo di collegamento remoto: Telnet (Larry Roberts) 1979 primo dominio multi-utente per giochi multiplayer 1985 protocollo NSF per il trasferimento dati 1988 il primo worm informatico infesta ARPANET 1990 nasce il World Wide Web al CERN (T. Berners-Lee) 1993 nasce il primo browser WEB (Mosaic) 12

evoluzione della connessione la diffusione della banda larga nel mondo cresce in numero di utenti e larghezza di banda sempre piu compagnie scelgono un sistema di connessione a banda larga 13

uno sviluppo combinato hardware, software, spazio disco e connettivita sono in continua crescita il miglioramento delle prestazioni e legato sia allo sviluppo dei singoli elementi, sia alla loro sinergia nel creare sistemi di calcolo sempre piu articolati transistor microprocessore multiprocessore cluster di PC grazie alle elevate prestazioni delle connessioni di rete ed alla compatibilita fra hardware e software, la GRID rappresenta il passo successivo 14

La GRID un computer virtuale costruito sulle risorse di calcolo disponibili in tutto il mondo offre agli utenti accesso trasparente a risorse di calcolo, spazio disco e servizi specializzati fornisce a ai centri locali gli strumenti necessari per gestire le risorse e spostare i dati 15

I cinque punti fondamentali le aree di sviluppo della Grid riguardano: condivisione delle risorse su scala globale accesso sicuro: alto livello di fiducia fra utenti e fornitori di servizi, per garantire la privacy degli uni e la sicurezza degli altri utilizzo delle risorse bilanciato per ottimizzare l efficienza annullamento delle distanze: l accesso alle risorse deve essere indipendente dalla loro distanza fisica uso di standard comuni per garantire il dialogo fra diverse Grid e porre le basi per il suo sviluppo commerciale 16

l architettura di Grid la applicazioni a diretto contatto con l utente, legate al suo ambito di lavoro applications gli strumenti che permettono alle varie risorse di entrare il Grid middleware le risorse effettive: computer, dischi, cataloghi elettronici, strumentazioni,... le risorse il livello piu basso, interconnette fisicamente le risorse disponibili la rete 17

il middleware automatizza le relazioni M2M, cioe fra macchine, per dare alla Grid la forma di un unica entita gestisce lo stato della Grid attraverso meta-dati, cioe informazioni riguardanti le risorse stesse il suo funzionamento si basa sull interazione di software agenti, che per conto dell utente interagiscono con software broker per negoziare l uso delle risorse raggiunto un accordo, altri agenti si occupano di distribuire il lavoro ottimizzando le risorse disponibili (spostare i programmi da eseguire o i dati da analizzare) all utente viene offerto un centro di calcolo virtuale 18

la struttura interna tiene traccia delle risorse di calcolo e dello spazio disco lato utente lato risorse distribuisce il carico di lavoro fra i vari siti che compongono la grid fornisce un interfaccia comune a diversi sistemi di salvataggio dati gestisce l autenticazione, la sicurezza, il monitoring di risorse e calcoli,... collective services information protocols management protocols resource & connectivity communication protocols authentication protocols permette agli elementi della Grid di interagire fra loro riconoscere i messaggi legati alla Grid scambiare dati in modo sicuro 19

Grid Testbed per sviluppare Grid, i progetti di ricerca coinvolgono in una struttura di prova diversi siti i computer presenti giocano il ruolo dei vari elementi necessari al funzionamento della grid i diversi siti offrono uno o piu servizi che compongono la struttura di una Grid 20

struttura di un Testbed il punto di accesso degli utenti alla grid user interface riceve le richieste degli utenti e trova il modo migliore di eseguirle resource broker riceve richieste di lavori e le inoltra ai worker node computing element esegue i lavori inviati dal computing element, processando i dati da analizzare worker node 21

servizi associati certification authority information index storage element l ente che convalida l identita degli utenti e delle risorse attraverso un certificato digitale cataloga le risorse disponibili nella Grid fornisce spazio di salvataggio con un interfaccia comune per diverse soluzioni tecniche replica manager & catalog gestisce e cataloga la duplicazione dei dati, per facilitarne l accesso da molti siti 22

una Grid per ogni necessita Grid nazionali Grid legate a progetti specifici alta parallelizzazione, grandi volumi di dati da analizzare - fisica delle alte energie volume di dati ridotto, grande potenza di calcolo - analisi spettrali (SETI@home) Grid di volontariato (SETI@home, LHC@home) Grid peer-to-peer (Napster) Grid a pagamento Grid private per ogni dominio e definito un gruppo di utenti, la Virtual Organisation (VO) 23

la nascita di egee CERN 1999 progetto MONARC al CERN 2000 progetto DataGRID per la Fisica delle Alte Energie 2001-2004 progetto EU DataGRID: middleware & testbed per un prototipo funzionante 2002-2005 LHC Computing GRID - LCG utilizzare i risultati di EU DataGRID per gli esperimenti LHC 2004-2006 primo progetto egee, per espandere i risultati di LCG ad una comunita piu ampia 24

applicazioni di egee More than 20 applications from 7 domains High Energy Physics (Pilot domain) 4 LHC experiments Other HEP (DESY, Fermilab, etc.) Biomedicine (Pilot domain) Bioinformatics Medical imaging Earth Sciences Earth Observation Solid Earth Physics Hydrology Climate Computational Chemistry Fusion Astronomy Cosmic microwave background Gamma ray astronomy Geophysics Industrial applications 25

ERROR: ioerror OFFENDING COMMAND: image STACK: -mark- -savelevel-