L Affidabilità dei Sistemi di Input-Output ad Elevate Prestazioni

Documenti analoghi
Sistemi RAID. Motivazioni Concetti di base Livelli RAID. Sommario

Sviluppo di un'interfaccia grafica per l'automatizzazione di campagne di software fault injection. relatore Ch.mo prof.

STRATEGIES FOR ACHIEVING DEPENDABILITY IN PARALLEL FILE SYSTEMS

Valutazione sperimentale di algoritmi per la rilevazione di fallimenti temporali nel sistema operativo Minix3

Rilevazione dei fallimenti nel sistema operativo open source Linux per applicazioni critiche Anno Accademico 2006/2007

Ambienti di calcolo a griglia Parte 2. Docente: Marcello CASTELLANO

Gui testing automatico di applicazioni Android tramite emulazione di input ed eventi provenienti da sensori

Studio del linguaggio TROPOS per la modellazione dei requisiti orientata agli agenti

Modulo 2 Architetture dei SD Lezione 1

Programma del corso. Introduzione Rappresentazione delle Informazioni Calcolo proposizionale Architettura del calcolatore Reti di calcolatori

Tu sai di averne uno quando il guasto di un computer di cui non hai mai sentito parlare non ti permette di fare il tuo lavoro.

Un architettura orientata ai servizi per la localizzazione di dispositivi mobili

RETI DI CALCOLATORI II

Strumento e tecnica a supporto del crash testing automatico di applicazioni mobili basato sul sistema operativo Android Anno Accademico 2010/2011

Informatica 3. Informatica 3. Lezione 1- Modulo 1. LEZIONE 1: Introduzione. Concetti di linguaggi di programmazione. Introduzione

Sintesi e sperimentazione di un modello di propagazione sonora per l analisi di reti di sensori sottomarine

Informatica 3. LEZIONE 1: Introduzione. Modulo 1: Introduzione al corso Modulo 2: Introduzione ai linguaggi di programmazione

Memorizzazione affidabile di dati in un ambiente di Griglia

Stato dell arte sulle tecniche di testing di Sistemi Embedded

Università degli Studi di Napoli Federico II

SISTEMI OPERATIVI DISTRIBUITI

P2p la teoria dei sistemi complessi per modellare reti p2p

Anno Accademico 2007/2008

Tecniche di progettazione per la tolleranza ai guasti. Codici non lineari

Informatica. Progettazione ed implementazione di un tool per il supporto al debug nella pratica di sviluppo Test Driven

Macchine Astratte. Nicola Fanizzi Dipartimento di Informatica Università degli Studi di Bari. Linguaggi di Programmazione feb, 2016

Mission IGA. associazione senza scopo di lucro fondata il 13 aprile 2006 riconoscimento giuridico FVG 4 agosto 2008

Un'applicazione per lo scambio di contenuti multimediali in ambiente Android

Le reti rete La telematica telematica tele matica Aspetti evolutivi delle reti Modello con mainframe terminali Definizione di rete di computer rete

Il sistema operativo TinyOS

L affidabilità dei sistemi di Input-Output ad elevate prestazioni

Strumenti per l automazione del testing di applicazioni web Javascript-based

Lezione 3 Sistemi Operativi e misure di performance. Parleremo di

Progetto di Applicazioni Software

Anni 80: reti locali di PC terminali dotati di intelligenza propria, che condividono risorse pregiate, come stampanti, dischi, etc.

FILE E INDICI Architettura DBMS

I SISTEMI OPERATIVI. Insieme di programmi che implementano funzioni essenziali per l uso di un sistema elaboratore.

Sviluppo di un applicazione di front-end per il monitoraggio di un Isola Ecologica

Le reti. Le reti del computer

Comunicazione tra Computer. Protocolli. Astrazione di Sottosistema di Comunicazione. Modello di un Sottosistema di Comunicazione

Test e risultati sull uso di un file system GPFS condiviso su rete WAN

Sistemi a processori multipli

R. Cusani, F. Cuomo: Telecomunicazioni - DataLinkLayer: Gestione degli errori, Aprile 2010

Modellazione di sistemi ingegneristici (parte 2 di 2)

Studio di tecniche di accesso ai dati dell esperimento CMS a LHC: il caso dell axigluone

AscotWeb - mediatore Versione dicembre 2015

Tesi di Laurea Triennale in Ingegneria Informatica REALIZZAZIONE DI UN APPLICATIVO PER LA GESTIONE DI FOGLI DI LAVORO INTEGRATO IN OUTLOOK 2010

Analisi e comparazione dei Framework OpenSwing e Google Web Toolkit per lo sviluppo di interfacce utente con paradigma MVC.

Soluzioni per l archiviazione di rete (NAS) con RAID hardware. Sicurezza dei dati e affidabilità elevate senza diminuzione delle performance.

POLITECNICO DI BARI FACOLTÀ DI INGEGNERIA CORSO DI LAUREA IN INGEGNERIA ELETTRONICA TESI IN CONTROLLO DIGITALE

Mobilità Intelligente Ecosostenibile

Università degli Studi di Roma Tor Vergata Dipartimento di Ingegneria Civile e Ingegneria Informatica

Introduzione alle gerarchie di memoria

Remote file access sulla grid e metodi di interconnesione di rete

Basi di dati. Base di dati

Analisi della dependability di un middleware per la

Gestione dello sviluppo software Modelli Base

Capitolo 6 Le infrastrutture SoftWare

Lezione n.7 Distributed Hash Tables

Unità Trattamento Aria

LABORATORIO di Reti di Calcolatori

Simulazione. D.E.I.S. Università di Bologna DEISNet

Tesi di Laurea. Progetto ed implementazione di un server proxy per il transcoding delle immagini Web. Candidato: Massimo Magazzù.

Scuola Politecnica e delle Scienze di Base Dipartimento di Ingegneria Civile, Edile e Ambientale

Memoria primaria o secondaria? DFS MapReduce Scheduling & Data flow. Map Reduce. Giambattista Amati. Università di Tor Vergata.

Produzione di idrogeno mediante un processo fotocatalitico basato sull impiego di rame

Valutazione Comparativa Sperimentale di Tecniche di Testing di Applicazioni Android

I DSS e la gestione dei dati e della conoscenza. Prof. Luca Gnan

UNIVERSITÀ DEGLI STUDI DI NAPOLI FEDERICO II FACOLTÀ DI INGEGNERIA CORSO DI LAUREA IN INGEGNERIA INFORMATICA

Studio di reti di sensori con comportamento ciclico con il simulatore Castalia. Corso di Laurea in Informatica

A cura di Valeria Valecchi

Cos'e un linguaggio di programmazione?

COME MINIMIZZARE IL TOTAL COST OF OWNERSHIP (TCO) NEI SISTEMI DI AUTOMAZIONE INDUSTRIALE

Introduzione. Sommario. Il software. Definizione di Ingegneria del software

Introduzione al Calcolo Parallelo Algoritmi e Calcolo Parallelo. Daniele Loiacono

Esperienze di Advanced Analytics nella statistica ufficiale: strumenti e progetti

Uno strumento per il deployment automatico di performance test su piattaforme per la distribuzione di dati

Partizioni e File system. Fondamenti di informatica

DB e DBMS. Corso di Fondamenti di Informatica (PEU-Z) Dott.ssa Rossella Aiello

Architetture della memoria

Confartigianato Vicenza. Navigazione Web ed sicura per l associazione di categoria di PMI più grande d Italia

Instradamento per servizi di tipo circuito virtuale. Dr. S. Greco Polito,

Progetto di un sistema di videosorveglianza basato su tecnologie multi-agente Corso di Laurea Magistrale in Ingegneria Informatica

Quando adottare un sistema di virtualizzazione in azienda

Scuola di Calcolo Scientifico con MATLAB (SCSM) 2017 Palermo 31 Luglio - 4 Agosto 2017

Università degli studi di Napoli Federico II

Capacity Availability Continuity Infrastructure Management

Basi di dati Basi di dati per bioinformatica

Implementazione di tecniche di tolleranza ai guasti in un middleware per la Data Distribution Service

UNIVERSITA' CA' FOSCARI DI VENEZIA. Facoltà di Scienze MM.FF.NN. - Dipartimento di Informatica Tesi di Laurea Triennale

STUDIO DI MASSIMA DI UN SISTEMA DI INIEZIONE DIRETTA PER UN MOTORE AERONAUTICO

7. Architetture Software

Parte II - Reti di Calcolatori ed Internet IL LIVELLO RETE

Proposte di tesi in Telecom Italia Lab, Aprile (sede in Torino, Via Reiss Romoli)

Rilevazione di malfunzionamenti nei device driver del kernel Linux

Valutazione delle prestazioni

Valutazione delle prestazioni. Valutazione delle prestazioni. Tempo di risposta e throughput. Prestazioni e tempo di esecuzione

Normalizzazione puntuale dei dati di accounting

Sistemi Operativi: Concetti Introduttivi

Cenni sulla virtualizzazione

Transcript:

1 tesi di laurea Anno Accademico 2005/2006 relatore Ch.mo prof. Domenico Cotroneo correlatore Ing. Generoso Paolillo candidato Emanuele Di Pascale Matr. 534/789

2 Il Contesto Le moderne applicazioni scientifiche richiedono imponenti risorse rse elaborative e di I/O Evoluzione da sistemi monolitici (Mainframe( Mainframe) ) a soluzioni distribuite (Cluster) Necessità di sviluppare uno strato software in grado di nascondere l ambiente l distribuito e che permetta di sfruttare al massimo le potenzialità del cluster Nascono i Parallel File System: : i dati vengono scritti e letti in parallelo da più client su più Storage Server (striping).

3 Elevato Throughput di I/O (Prestazioni) Scalabilità Affidabilità e Tolleranza ai Guasti Semplicità di Utilizzo e di Manutenzione Requisiti spesso in contrasto fra loro! Parallel File Systems Caratteristiche Ideali L evoluzione dei PFS da semplici scratch spaces a veri e propri File System persistenti ha esteso il campo di ricerca dalle sole prestazioni alla sicurezza dei dati (Data Avaliability e Data Reliability)

4 Soluzioni Presenti in Letteratura 1/2 Tecniche di Rilevazione dei Guasti HeartBeat: Ciascun componente invia periodicamente delle pulsazioni ad un server centrale; la mancata ricezione di una o più pulsazioni indica che il nodo in questione ha qualche problema. (Esempi: GPFS) Timeout: Le operazioni di I/O seguono specifici protocolli che prevedono l utilizzo l di timer. Se ad un messaggio di richiesta non corrisponde una conferma entro un dato intervallo di tempo si assume che si sia verificato un guasto. (Esempi: CSAR-2, Lustre)

5 Soluzioni Presenti in Letteratura 2/2 Tecniche RAID Distribuite RAID 1: 1 I dati vengono replicati su più Server di I/O Dispendioso in termini di Spazio Utilizzato Facile da implementare e da gestire Non incide significativamente sulle prestazioni del sistema Esempi: Lustre, CEFT-PVFS RAID 5: 5 Le informazioni di parità vengono distribuite su più Server di I/O Più efficiente in termini di spazio Presenta problemi per la gestione di operazioni concorrenti di I/O Comporta un overhead per la computazione della parità Esempi: Zebra, Panasas

6 Problematica Le tecniche RAID non sono ottimali per sistemi distribuiti e paralleli: Sono in grado di tollerare al più il fallimento di un singolo nodo per ciascun gruppo di parità Garantiscono una scarsa flessibilità in quanto non permettono di essere facilmente configurate dall utente per ottenere il grado di affidabilità desiderato Il recupero dei dati in seguito ad un guasto richiede l identificazione l del nodo malfunzionante

7 Vantaggi Soluzione Proposta: Gli Erasure Code È in generale possibile tollerare il fallimento di un numero di nodi superiore rispetto alle soluzioni RAID È posibile definire il livello di robustezza del sistema (ed il relativo costo in termini di spazio di memorizzazione aggiuntivo) in base alle esigenze dell utente In caso di fallimenti non è necessario identificare i nodi guasti; fintanto che rimangono in funzione un certo numero di server è possibile ricostruire i dati corretti da un qualunque loro sottoinsieme Svantaggi Si introducono operazioni di codifica e decodifica dei dati, spesso costose dal punto di vista computazionale I codici LDPC (più efficienti rispetto a quelli di Reed-Solomon Solomon) richiedono la lettura di un numero maggiore di blocchi per la ricostruzione dei dati originari

8 Possibili Strategie di Impiego Lazy Redundancy: Si applicano i codici LDPC solo alla memorizzazione dei checkpoint; Fa leva su primitive dell interfaccia MPI; È efficiente ma poco flessibile; Non garantisce l affidabilitl affidabilità dei dati modificati in seguito all ultimo checkpoint. Soluzione Ibrida: Si utilizza il RAID1 per la scrittura di piccoli dati, i codici LDPC per operazioni aggregate di notevoli dimensioni; Garantisce una maggiore affidabilità dell approccio Lazy; Comporta una perdita in termini di prestazioni e di spazio utilizzato.

9 Conclusioni e Sviluppi Futuri Non esistono in letteratura studi completi sulle soluzioni qui proposte: Analisi del comportamento dei codici LDPC in situazioni reali con un numero finito di nodi Impatto di tali codici sulle operazioni di I/O in ambienti ad elevate prestazioni Per una valutazione più significativa di queste strategie sarà necessario procedere alla loro implementazione su un sistema reale e all esecuzione di benchmark specifici. E già disponibile un testbed su cui fare sperimentazione (cluster( con PVFS2 nei Laboratori del CINI)