Sperimentazione del file-system distribuito HDFS in ambiente GRID. III Borsista Day, Roma, 06.12.2012



Documenti analoghi
CONFIGURAZIONI E TESTING DI HADOOP-FS PER L'ALTA AFFIDABILITÀ DEI DATI DI UN SITO MEDIO-PICCOLO

Sperimentazione del file system distribuito HDFS in ambiente grid

Flash talk: Wide Area Swift

Tecnologie e metodologie di Big Data Analytics - Apache Spark

Remote file access sulla grid e metodi di interconnesione di rete

Sommario HOL SDC

Test e risultati sull uso di un file system GPFS condiviso su rete WAN

Il Progetto di Centro di Reprocessing di BaBar: Requisiti per il Monitoring e il Management

Memoria primaria o secondaria? DFS MapReduce Scheduling & Data flow. Map Reduce. Giambattista Amati. Università di Tor Vergata.

SISTEMI OPERATIVI DISTRIBUITI

Le reti rete La telematica telematica tele matica Aspetti evolutivi delle reti Modello con mainframe terminali Definizione di rete di computer rete

Big Data: tecnologie, metodologie e applicazioni per l analisi dei dati massivi

Setup di una cloud privata a Torino Un prototipo in produzione. S.Bagnasco, D.Berzano, R.Brunetti, S.Lusso

BASI DI DATI DISTRIBUITE

Architettura e caratteristiche dello storage in INFN-CC. Workshop CCR La Biodola 3-7/06/2019 Marica Antonacci, Stefano Stalio per INFN-CC

Problematiche di rete nella sperimentazione di file-system distribuiti su WAN per applicazioni di GRID- Computing

Reti, Web e comunicazione Parte seconda

enimonitor proactive IT monitoring

Allegato Tecnico Backup As A Service

Isaac DE è una piattaforma Big Data completa di strumenti e servizi per l installazione, la configurazione, l uso, la gestione e il monitoraggio di

owncloud ( e AjaXplorer (

Introduzione ai. Sistemi Distribuiti

Grid Data Management Services. Griglie e Sistemi di Elaborazione Ubiqui

Studio di tecniche di accesso ai dati dell esperimento CMS a LHC: il caso dell axigluone

Elenco sezioni libro di testo Ed. 5 Tra parentesi le corrispondenze per l'ed. 7.

REFRESH HARDWARE SAP HANA ON IBM POWER SYSTEMS YOCTOIT CASE STUDY

Un esempio di servizio cloud per la comunità GARR

Indice. Introduzione. Capitolo 1 Introduzione a Windows Server Edizioni di Windows Server

ISILON HYBRID SCALE-OUT NAS STORAGE

Implementazione di un sistema open source per il Network Access Control. C. Catalano, S. Forestieri, F. Marrone, M. Pericò

Symantec IT Management Suite 8.0 powered by Altiris technology

2. Cenni di sistemi operativi

RELIABILITY MADE EASY

6 Borsisti Day 24/03/2015 Roma Consortium GARR

Sistema di monitoraggio per datacenter distribuiti geograficamente basati su OpenStack

DataBase NoSQL. Prof. Marco Pedroni Unversità degli Studi di Ferrara

Realizzazione di un infrastruttura Cloud pilota basata su OpenStack

Big data ed eventi: quasi un tutorial. Prof. Riccardo Melen

Piattaforme software distribuite I

Un po di numeri. 1 solo azienda. Una squadra di 15 professionisti. Più di 3700 requisiti Centinaia di migliaia di linee di Software codice scritte

ALLEGATO E AL CONTRATTO QUADRO - LOTTO 1 DI CLOUD COMPUTING

Il cloud server, affidabile senza rinunciare a flessibilità e velocità

File: definizione. Il file è la più piccola unità logica manipolabie Un file è caratterizzato principalmente da:

OpenStack & GPFS: overview dell infrastruttura di prova

Report sull attività di monitoraggio del Testbed di INFN Grid

Indice generale. Introduzione...xv. Ringraziamenti...xix. Capitolo 1 Condivisione delle risorse con Samba... 1

Introduzione all uso dei laboratori aka Linux basics.

VDI4U. La virtualizzazione dei desktop applicata all Università. Marco Grilli III Borsisti Day, Roma,

Soluzioni distribuite per la BioInformatica nel Virtual Data 5 Aprile Center / 33

Servizio di backup e ripristino dati su sistema disco/tape al CNAF

RMLab: Gestione Agile di un data center distribuito

Oracle 12cR2 DataGuard

Un'Interfaccia per il Monitoraggio dei Guasti in un'applicazione per il Controllo del Traffico Aereo

Introduzione ai. Sistemi Distribuiti

MySQL Server e Workbench.

CORSO MOC10991: Troubleshooting Windows Server 2016 Core Technologies. CEGEKA Education corsi di formazione professionale

Modello di Progetto di massima Centro Tier 2

Dipartimento di Giurisprudenza Prof. Michele Perilli Conoscenze Informatiche

Introduzione D B M G

Server LDAP. File Server. Domain Controller. Installazione di una piattaforma Linux Alessandro Brusò 24/05/2012

Tier-2 Legnaro-Padova. Massimo Biasotto

ELASTIC CLOUD STORAGE (ECS) APPLIANCE

Elena Baralis 2007 Politecnico di Torino 1

Configuring Advanced Windows Server 2012 Services (MOC 20412)

Sistemi informativi D B M G. Introduzione. Introduzione alle basi di dati D B M G 2. Elena Baralis 2007 Politecnico di Torino 1

Gestione delle informazioni Base di dati Modello dei dati Indipendenza dei dati Accesso ai dati Vantaggi e svantaggi dei DBMS

Elena Baralis 2007 Politecnico di Torino 1

Elena Baralis 2007 Politecnico di Torino 1

6MOTIVI PER SOSTITUIRE IL NAS STORAGE LEGACY PASSA ALLO SCALE-OUT STORAGE MODERNO

Argomenti. Architettura fisica di U-Lite Architettura software di U-Lite Comandi gestione job: NFS contro AFS Licenze software

PROGRAMMA. Corso Installare e configurare i servizi di dominio Active Directory

Corso integrato di Sistemi di Elaborazione. Modulo I. Prof. Crescenzio Gallo.

Una visione del Cloud per l Università e la Pubblica Amministrazione. Leonardo Valcamonici /CASPUR

CHIARIMENTI IN SEDE DI OFFERTA

Esperienze di Advanced Analytics nella statistica ufficiale: strumenti e progetti

File Leggimi di Veritas System Recovery 16 Monitor

Servizio Calcolo e Reti. Sandra Parlati LNGS 9 giugno 2016

Ottimizziamo il flusso di lavoro aziendale ed abbattiamo i costi di gestione mediante l uso di tecnologie adeguate.

HALLEY Informatica S.r.l. Via Circonvallazione, 131 (62024 Matelica : realizzato da:

Casi d uso e proposte tecniche per un repository nazionale di immagini VM in Glance

Laboratorio di Reti Locali e Geografiche

Integrazione di ENEA GRID in EGEE

Sistemi Operativi. Gianluca Della Vedova. Sistemi Operativi. Gianluca Della Vedova. Sistemi Operativi. Gianluca Della Vedova.

PREVENTIVO LOCALE DI SPESA PER L'ANNO 2004

BLS Network Attached Storage

Luca Della Mora. Scalabilità della generazione e dell'analisi di dati su infrastrutture multicore all'interno del framework ROOT

Advanced Features: subnet, snapshot, cloning. Alessandro Brunengo INFN-Genova

Compilazione rapporto di Audit in remoto

Allegato Tecnico Storage As A Service

Griglie e Sistemi di Elaborazione Ubiqui

NOTA: I prezzi disponibili non sono comprensivi di IVA né di costi di Setup* SERVIZI CLOUD. IntactMail - Posta Sicura. IntactMail Casella 20 GB

EMC Isilon Scale-out Data Lake Foundation Funzionalità essenziali per la realizzazione di un'infrastruttura Big Data

File System FAT. Il file system FAT è il file system usato da MS-DOS, Windows 3.1 e Windows 95

Introduzione all uso dei laboratori aka Linux basics. October 23, 2013

Sicurezza del File System

Transcript:

Sperimentazione del file-system distribuito HDFS in ambiente GRID Tutor: Domenico Diacono

Outline Use cases Hadoop Distributed File System Test di funzionalità Sviluppo di politiche di replica dei dati Monitoring di sistema Test di performance Sviluppi futuri e conclusioni 2

Use cases Analisi dei dati scientifici su cluster di host con CPU e storage condivisi HA del servizio di accesso ai dati anche con hardware modesto ed economico HA del servizio di accesso ai dati per resistere alle failure di interi centri di calcolo 3

Hadoop Distributed File System 4

Cosa è Hadoop Hadoop è un software framework per il calcolo distribuito che privilegia l affidabilità e la scalabità Il progetto Hadoop include: Hadoop Distributed File System (HDFS) YARN MapReduce Altri progetti correlati: Avro, Cassandra, Hive, Chukwa, HBase, ecc.. 5

HDFS: Features Hadoop Distributed File System Open source Large dataset Fault tolerance Scalabilile Commodity hardware Rack awareness 6

HDFS: Architettura 7

Fault tolerance The primary objective of HDFS is to store data reliably even in the presence of failures. File dati divisi in blocchi Ridondanza dei blocchi dati Politiche di replica High Availability namenode 8

Politiche di replica Predefinita in HDFS: Una replica su un nodo del rack locale, due repliche su nodi differenti di un rack remoto Politiche sviluppate: One Replica per Rack Hierarchical 9

Politica di replica predefinita 10

High Availability namenode Sincronizzazione dei metadati attraverso una directory condivisa Failover: Active Standby Standby Active 11

Test di funzionalità 12

Test di installazione Cluster formato da 7 macchine del sito INFN- Bari Differenti SO, hardware different, reti separate con firewall 7 datanode 1 primaray namenode 1 secondary namenode Da Hadoop 0.20 a 2.0 (CDH4.1) 13

Test dei namenode Metadati danneggiati o persi Ripristino dal secondary namenode: hadoop-daemon start namenode importcheckpoint Fallimento del namenode I client e di datanode restano in attesa Failover: hdfs haadmin failover nn1 nn2 14

Test dei datanode Blocchi dati danneggiati o persi Ripristino automatico 15

Test dei datanode Blocchi under-replicated Dopo il fallimento di un datanode Blocchi over-replicated Dopo il ripristino e riavvio di un datanode Blocchi mis-replicated Violazione della politica di replica Fallimento di un datanode durante processi di scrittura e lettura Switch su altri nodi attivi Workload 16

Client HDFS Client predefinito Hadoop bin/hadoop fs put testfile.dat /marzulli/ bin/hadoop fs get /marzulli/testfile.dat./ Client Fuse-Dfs Monta HDFS in userspace cp testfile.dat /mnt/hadoop/marzulli/ cp /mnt/hadoop/marzulli/testfile.dat./ 17

Autenticazione Kerberos Di default, ogni meccanismo di sicurezza è disabilitato Autenticazione dei nodi e degli utenti tramite il servizio Kerberos Keytab Ticket Livelli di autorizzazione gestiti dai permessi sui file 18

Sviluppo delle politiche di replica 19

One replica policy 1 replica per rack Maggiore affidabilità Tolleranza al fault di 2 racks (se fattore di replica 3) Su scala geografica Maggiore distribuzione dei dati Riduzione del costo in lettura Lettura dalla copia più vicina Incremento del costo in scrittura Maggiore quantità di dati trasmessi 20

One replica policy 21

Hierarchical policy Consapevolezza dell organizzazione gerarchica della topologia di rete 2 repliche in rack differenti della farm locale 1 replica su un rack di una farm remota Tolleranza al fallimento di un intera farm 22

Hierarchical policy 23

Implementazione delle politiche Classe astratta Java BlockPlacementPolicy Implementazione predefinita: BlockPlacementPolicyDefault Implementazioni realizzate: BlockPlacementPolicyOneReplica BlockPlacementPolicyHierarchical Politica configurabile attraverso l apposito parametro 24

Cluster HDFS geografico INFN Bari and INFN Napoli Ripetizione dei test di funzionalità Test delle politiche realizzate 25

Cluster HDFS in (pre)produzione a Bari 26

Monitoring di sistema 27

Monitoring con Ganglia In produzione sul cluster in (pre)produzione a Bari 28

Custom monitoring È stato sviluppato un ulteriore sistema di monitoring al fine di tracciare: Locazioni dei blocchi dati Recente cronologia Blocchi danneggiati o persi Operazioni sui blocchi Memorizzati in un database MySQL 29

Installazione e configurazione automatica dei nodi È stata sviluppata una procedura parametrizzata da eseguire su ogni nodo che provvede a: Installazione del software Packages repository Configurazione in base al tipo di nodo formattazione, mount e assegnazione ad HDFS di dischi/partizioni inutilizzati Riavvio del processo quando fallisce Riusabile in altri centri di calcolo 30

Test di performance 31

Test di performance È stata misurata la velocità media di scrittura e lettura su 3000 operazioni sui file Eseguiti da un solo client Datanode Parametri Valori Active, passive Block size (MB) 64, 128, 256 Client Replication factor 1,2 Fuse-dfs File dimension (MB) 4096 Complete dataset Test settings 3K File operations 32

Test di performance: risultati Block size (MB) Velocità media di scrittura (MB/s) Fatt. Replica 1 Fatt. Replica 2 Datan. inattivo Datan. attivo Datan. inattivo Datan. attivo 64 45,66 83,75 40,24 59,96 128 46,13 79,41 42,45 59,85 256 47,95 76,48 42,71 49,77 Velocità media di lettura (MB/s) Block size (MB) Fatt. Replica 2 64 59,96 128 59,85 256 49,77 33

Test di performance: caso reale 600 job concorrenti di Pamela che leggono file di ROOT da HDFS via Fuse-dfs buon risultato: picchi di oltre 3GB/s 34

Sviluppi futuri e conclusioni 35

Sviluppi futuri Testing del modulo HDFS-RAID Ripristino di blocchi dati danneggiati Riduzione del fattore di replica Conseguente risparmio di spazio disco Ampliamento e testing del cluster geografico con un ulteriore sito Collegamento ad elevate prestazioni (10Gbit/s) Test delle politiche di replica Test di performance 36

Sviluppi futuri Dopo l espansione dell infrastruttura di calcolo Testing di long-run di una farm basata su HDFS misurando performance e scalabilità Con 300 nodi di calcolo 500TB di spazio disco Possibilità di eseguire fino a 4000 processi di analisi dati contemporaneamente Testing delle configurazioni necessarie a livello di mount point fuse e dimensione blocco per ottimizzare le performance 37

Sviluppi futuri Implementazione di ulteriori sistemi di monitoring avanzati Per la gestione di un cluster complesso Per la gestione delle failures e di dati di accounting Nagios Database non relazionali Testing di sistemi di autenticazione/autorizzazione avanzati Federazioni di sistemi di autenticazione per supportare utenti provenienti da diverse istituzioni 38

Conclusioni L attività svolta ha dimostrato Efficacia della feature di affidabilità dei dati Efficacia del comportamento di ripristino automatico L importanza della possibilità di ottimizzare le politiche di replica dei dati a favore dell affidabilità e delle prestazioni Feedback positivi ricevuti dai primi utenti utilizzatori 39

Grazie per l attenzione 40