ENEA GRID. Corso di introduzione all'uso ed all'amministrazione. Autore: Alessandro Secco alessandro.secco@nice-italy.com

Documenti analoghi
Terza lezione: Directory e File system di Linux

Mac Application Manager 1.3 (SOLO PER TIGER)

CLUSTER COKA. Macchine e Risorse

Online Help StruxureWare Data Center Expert

MANUALE PARCELLA FACILE PLUS INDICE

ENEA GRID. Corso di introduzione all'uso ed all'amministrazione. Autore: Alessandro Secco

Configurazione avanzata di IBM SPSS Modeler Entity Analytics

Registratori di Cassa

PIATTAFORMA DOCUMENTALE CRG

01/05/2013 Istruzioni per l installazione

MANUALE EDICOLA 04.05

ENEA-GRID attività in corso

Capitolo 4 Pianificazione e Sviluppo di Web Part

Installazione LINUX 10.0

11/02/2015 MANUALE DI INSTALLAZIONE DELL APPLICAZIONE DESKTOP TELEMATICO VERSIONE 1.0

Definizione Parte del software che gestisce I programmi applicativi L interfaccia tra il calcolatore e i programmi applicativi Le funzionalità di base

Il Software. Il software del PC. Il BIOS

Il memory manager. Gestione della memoria centrale

HBase Data Model. in più : le colonne sono raccolte in gruppi di colonne detti Column Family; Cosa cambia dunque?

BACKUP APPLIANCE. User guide Rev 1.0

Active Directory. Installatore LAN. Progetto per le classi V del corso di Informatica

ENEA GRID. CRESCO: Corso di introduzione. Autore: Alessandro Secco

Guida Software GestioneSpiaggia.it

System Center Virtual Machine Manager Library Management

VMware. Gestione dello shutdown con UPS MetaSystem

Corso di PHP. Prerequisiti. 1 - Introduzione

XTOTEM offline sul proprio PC

Manuale Amministratore Legalmail Enterprise. Manuale ad uso degli Amministratori del Servizio Legalmail Enterprise

CREAZIONE DI UN SOTTOSITO

File, Modifica, Visualizza, Strumenti, Messaggio

Guida Joomla. di: Alessandro Rossi, Flavio Copes

SOSEBI PAPERMAP2 MODULO WEB MANUALE DELL UTENTE

Guida alla registrazione on-line di un DataLogger

Con il termine Sistema operativo si fa riferimento all insieme dei moduli software di un sistema di elaborazione dati dedicati alla sua gestione.

Guida all installazione di Easy

Acronis License Server. Manuale utente

MANUALE MOODLE STUDENTI. Accesso al Materiale Didattico

e/fiscali - Rel e/fiscali Installazione

Corso di recupero di sistemi Lezione 8

Regione Toscana. ARPA Fonte Dati. Manuale Amministratore. L. Folchi (TAI) Redatto da

CONTENT MANAGEMENT SY STEM

Gestione Risorse Umane Web

Considerazioni sui server

ATTIVAZIONE SCHEDE ETHERNET PER STAMPANTI SATO SERIE ENHANCED

Installazione LAMP. Installare un server lamp su Linux Ubuntu. Per installare un server LAMP in Ubuntu come prima cosa apriamo il terminale:

GRUPPO CAMBIELLI. Posta elettronica (Webmail) Consigli di utilizzo

Costruzione del layout in gino cms

LaCie Ethernet Disk mini Domande frequenti (FAQ)

MODULO 5 ACCESS Basi di dati. Lezione 4

Portale tirocini. Manuale utente Per la gestione del Progetto Formativo

Settaggio impostazioni tema. Cliccando nuovamente su aspetto e poi su personalizza si avrà modo di configurare la struttura dinamica della template.

INSTALLAZIONE DI JOOMLA! Guida alla installazione di Joomla!

Tabelle di riferimento Pulsanti Inserire documento Predisposizione doc Approvazione Doc Numerazione Doc Pubblicazione Albo Webservice

Procedura per creare un archivio storico remoto nelle 24 ore giornaliere

Cosa succede quando si naviga

Come modificare la propria Home Page e gli elementi correlati

Software di sistema e software applicativo. I programmi che fanno funzionare il computer e quelli che gli permettono di svolgere attività specifiche

7 Amministrazione programma

Gestione delle informazioni necessarie all attività di validazione degli studi di settore. Trasmissione degli esempi da valutare.

Impara a usare Microsoft DCCN in quattro semplici passaggi. Iscriversi al servizio è un operazione veramente semplice e richiede pochi minuti:

progecad NLM Guida all uso Rel. 10.2

SCOoffice Address Book. Guida all installazione

Riferimento rapido per l'installazione SUSE Linux Enterprise Server 11

Gestione della memoria centrale

1.1 Installare un nuovo Client di Concept ed eseguire il primo avvio

Sistemi Operativi. Interfaccia del File System FILE SYSTEM : INTERFACCIA. Concetto di File. Metodi di Accesso. Struttura delle Directory

Installazione e utilizzo di Document Distributor 1

BMSO1001. Virtual Configurator. Istruzioni d uso 02/10-01 PC

Manuale Operativo per l utilizzo della piattaforma E-Learning@AQ. Versione 1.1

1.1.1 ATLAS Postazione Studente : CONFIGURAZIONE DI ATLAS CON CLIENT LINUX

Modulo 4 Il pannello amministrativo dell'hosting e il database per Wordpress

1 Strumenti per il corso

Progetto: ARPA Fonte Dati. ARPA Fonte Dati. Regione Toscana. Manuale Amministratore

I Thread. I Thread. I due processi dovrebbero lavorare sullo stesso testo

Costruzione di Sit Web con PHP e MySQL. Lezione 7 - Esercitazione - Introduzione a MySQL: le tabelle, i tpi di dato, le query

SOFTWARE. Aprendo il SW la prima schermata che appare è la seguente:

INDICE. IL CENTRO ATTIVITÀ... 3 I MODULI... 6 IL MY CLOUD ANASTASIS... 8 Il menu IMPORTA... 8 I COMANDI DEL DOCUMENTO...

Riferimento rapido per l'installazione SUSE Linux Enterprise Server 11 SP1

Ambienti di calcolo a griglia Parte 2. Risorse (e loro gestione) Job di griglia e applicazioni di griglia Riservare le risorse ai job

La Gestione delle risorse Renato Agati

IBM SPSS Statistics per Linux - Istruzioni di installazione (Licenza per sito)

MANUALE UTENTE Fiscali Free

Configurazione di Outlook Express

Introduzione alle tecnologie informatiche. Strumenti mentali per il futuro

Introduzione a Emptypage FTP. I problemi che il software Emptypage FTP si propone di risolvere sono: Usare il tutorial

19. LA PROGRAMMAZIONE LATO SERVER

INSTALLAZIONE NUOVO CLIENT TUTTOTEL (04 Novembre 2014)

Gestione rifiuti VeLieRO

Sistemi Operativi MECCANISMI E POLITICHE DI PROTEZIONE. D. Talia - UNICAL. Sistemi Operativi 13.1

MECCANISMI E POLITICHE DI PROTEZIONE 13.1

Collegamento remoto vending machines by do-dots

1) GESTIONE DELLE POSTAZIONI REMOTE

STRUMENTI DI PRESENTAZIONE MODULO 6

Console di Amministrazione Centralizzata Guida Rapida

Apache 2, PHP5, MySQL 5

PULSANTI E PAGINE Sommario PULSANTI E PAGINE...1

Configuration Managment. Tutorial. Configuration Managment Creare un progetto SVN su Ubuntu. Creare un progetto SVN su Ubuntu.

Configuration Managment Configurare EC2 su AWS. Tutorial. Configuration Managment. Configurare il servizio EC2 su AWS. Pagina 1

LA GESTIONE DELLE VISITE CLIENTI VIA WEB

Transcript:

ENEA GRID Corso di introduzione all'uso ed all'amministrazione Autore: Alessandro Secco alessandro.secco@nice-italy.com 1

Lezione 3 Riepilogo lezione 2 AFS: terminologia e repliche LSF Admin: concetti di base Aggiunta di un host Aggiunta di una risorsa boolean Configurazione di una coda 2

Riepilogo lezione 2 Nella lezione precedente si è parlato di argomenti inerenti LSF dal lato utente. Come trasferire dati Client AFS LSF utente: concetti di base Comandi di interrogazione del cluster Richiesta di risorse LSF: lancio di un job Compilazione di un job in AFS Lancio e monitoraggio di un job 3

AFS: terminologia e repliche 4

AFS: terminologia Come visto nella prima lezione, AFS è un file system distribuito nato per girare in ambiente multi-centro, come può essere l'enea. CELLA: insieme di client e server in cui gira il software AFS, con amministratori ed utenti propri. VOLUME: contenitore di file in relazione tra loro, contenuto in una partizione di un file server. MOUNT POINT: directory del file system in cui viene reso disponibile un volume. REPLICA READ-ONLY: volume Read-Only, copia di un volume Read-Write CACHE: copia parziale dei file di AFS in locale sul client UTENTE AFS/Kerberos 5: 5 un account definito in AFS/Kerberos 5. Potrebbe anche non esistere nel sistema operativo. TOKEN: rappresenta le credenziali, salvate nella memoria del kernel, che serviranno per accedere ai servizi forniti da AFS. AMMINISTRATORE: un utente AFS in grado di creare volumi, mount point, repliche, ecc. 5

AFS: attori principali FILE SERVER: monta le partizioni fisiche contenenti i volumi read-write e read-only DB SERVER: in origine era una serie di demoni che gestivano il database di tutti gli utenti, permettevano l'autenticazione dei client,... Da quando AFS lavora con Kerberos 5, il DB server garantisce l'integrazione tra i due ambienti. CLIENT: una macchina che si autentica sul DB server e mostra i volumi forniti dal file server all'utente finale o all'amministratore. 6

AFS: miniguida alle repliche Le celle AFS disponibili, vengono montate dentro /afs. Per esempio, la cella enea si trova in /afs/enea.it A partire da /afs/enea.it, si trovano tutti i mount point dei volumi Enea. fs ls /afs/enea.it/software mostra il nome del volume presente in quella directory Ogni mount point può essere: Read-only: i file del volume non possono essere scritti direttamente Read-write: i file possono essere scritti, se si possiedono i permessi. 7

AFS: miniguida alle repliche Per capire se si sta lavorando su un volume read-only, bisogna interrogare AFS. Si supponga di lavorare in /afs/enea.it/software/lsf/conf Si lanci un comando di ispezione del volume: fs examine /afs/enea.it/software/lsf/conf Se il nome termina con.readonly, allora si tratta di un volume read-only. Il non poter scrivere in una directory, non è garanzia di trovarsi su un volume read-only! 8

AFS: miniguida alle repliche Come modificare un volume readonly? Si applica la procedura vista precedentemente per capire il nome del volume Ci si sposta in una directory speciale di AFS contenente i volumi read-write, caratterizzata da avere un punto davanti al nome della cella: cd /afs/.enea.it/software/lsf/conf Dopo aver modificato i file nel volume read-write, si prende il token di amministratore di AFS e si aggiornano le repliche read-only. klog <amministratore> (chiede una password) vos rel <nomevolume> Per chi non fosse amministratore, esiste l'utility WARC, documentata dal seguente link: http://www.afs.enea.it/project/eneagrid/afs/#utility 9

LSF Admin: concetti di base 10

LSF Admin Esistono diversi tipi di amministratore LSF: Amministratore di LSF: è l'utente che può far ripartire il sistema a caldo, modificare i file di configurazione, intervenire sui job di tutti gli utenti. In Enea è l'utente lsf. Amministratore secondario: tecnicamente ha tutti i poteri dell'amministratore di LSF, ma potrebbe avere restrizioni di file-system sulla modifica dei file di configurazione. Amministratore di coda Amministratore di coda: non può configurare LSF, ma all'interno di una coda può intervenire sui job di tutti gli altri utenti 11

Percorso dei file In Enea LSF è installato in: /afs/enea.it/software/lsf conf: file di configurazione del cluster e risorse conf/lsbatch/<nomecluster>/configdir: configurazione delle code, dei limiti su host e utente e politiche riguardanti il lancio dei job. docs: documentazione di LSF in PDF e HTML 7.0/<piattaforma>: contiene le directory dei file binari. Per ogni piattaforma è stato fatto un link a fs sysname. bin: comandi utente e admin etc: demoni di LSF lib: librerie (API) di LSF Queste 3 directory sono linkate in /afs/enea.it/software/lsf sostituendo @sys in luogo della piattaforma, per fornire un ambiente uniforme di accesso ai file binari. work: contiene le informazioni di accounting e i log degli eventi usati per la fault tolerance log_<nomecluster>: contiene i log di sistema del cluster 12

Terminologia aggiuntiva PROCESSO: indica un programma in esecuzione. Per semplificare, si considera: Job seriale = 1 processo Job multithreading = n thread su 1 host. Il thread è visto come un processo. Job parallelo = n processi su m host. Per i job batch un processo è considerato tale solo se usa intensivamente la CPU. SLOT: è uno spazio in grado di contenere un singolo processo MASTER: il server che si occupa di gestire il cluster LSF. MASTER di backup: se il master si ferma, uno o più host possono prenderne il posto. SLAVE: i server controllati dal master 13

Conoscere master e cluster lsid è un comando che informa sul nome del master e sul cluster dell'host da cui si è lanciato il comando. Il master è indicato nella variabile d'ambiente LSF_MASTER_LIST come prima chiave. La variabile è letta da lsf alla partenza dei demoni. Se il master non è attivo, la seconda chiave di LSF_MASTER_LIST diventa il nuovo master, e così via. 14

Demoni di LSF LSF usa dei processi che girano in background (demoni). I demoni, che si vedranno in dettaglio in altre lezioni, hanno alcune caratteristiche di cui bisogna tener conto: La loro comunicazione è volutamente blanda, per aumentare la scalabilità di LSF. Questo può causare lentezza nella risposta del sistema (bsub impiega circa 10-15 secondi a schedulare un job). L'amministratore può regolare le tempistiche di tutti i demoni, con molta, molta cautela. Alcuni demoni: lim, res, sbatchd, pim, mbatchd, mbschd,... I demoni vanno fatti partire da root con lo script lsf_daemons che si trova in 7.0/<piattaforma>/etc 15

Aggiunta di un host 16

Aggiunta di un host Per motivi di sicurezza e stabilità, la politica usata da Enea per l'aggiunta di host, è quella di usare una configurazione statica basata su file. File in /afs/enea.it/software/lsf/conf: lsf.cluster.<nomecluster> hosts NOTA: bisogna modificare il volume read-write!! File locali (accesso da root): /etc/lsf.sudoers lsf_daemons /bin/afsws/bin/pagsh 17

lsf.cluster.<nomecluster> Questo file contiene l'elenco degli amministratori, l'elenco dei client e server di LSF, le licenze in uso dai demoni, la disposizione delle risorse nel cluster. Per aggiungere un server si modifica la sezione Begin Host / End Host Nome host Modello e sistema operativo come da lsinfo 1=server 0=client Soglie (opzionali) Risorse boolean da lsinfo Begin Host HOSTNAME model type server ut pg RESOURCES sp5-13.frascati.enea.it POWER51900 IBMAIX532 1 0.9 - (mpich fluent poe) 18

hosts Il file hosts è simile al file /etc/hosts, e viene usato da LSF per sovrascrivere le informazioni da /etc/hosts e DNS in caso di macchine con più schede di rete o configurazioni particolari. Se, per esempio, una macchina comunica su 2 IP, potrebbe essere necessario aggiungere una configurazione come segue: xxx.yyy.zzz.www nomehost nomealias aaa.bbb.ccc.ddd nomehost 19

File locali Infine si aggiungono i file locali per la partenza dei demoni e l'integrazione con AFS: Integrazione con AFS: ln -s /afs/enea.it/software/lsf/conf/lsf.sudoers /etc Deve esistere /usr/afsws/bin/pagsh (cercare in distribuzione di AFS e copiare o creare link) Partenza dei demoni di LSF (solo server): /afs/enea.it/software/etc/lsf_daemons start Mettere lsf_daemons tra le ultime operazioni al boot del sistema. 20

Riconfigurazione di LSF Una volta modificati i file di configurazione che si trovano in /afs/.enea.it/software/lsf/conf si deve: Aggiornare le copie read-only di AFS Riconfigurare lsf in 2 passi: lsadmin reconfig: avvisa il master lim di rileggersi i file di configurazione e di ripartire. badmin reconfig: comunica al master batch daemon di riconfigurarsi. Vedere che l'host sia stato aggiunto: lsload <nomehost> 21

Aggiunta di una risorsa boolean 22

Il file lsf.shared lsf.shared è il file contenente tutte le risorse di LSF e si trova nella directory conf. Sezione Begin Cluster Contiene i cluster di lsf connessi tra loro Sezione Begin HostType Contiene tutte le keyword inerenti ai systemi operativi Sezione Begin HostModel Contiene i nomi dei modelli, il loro cpufactor, e la keyword dell'architettura Sezione Begin Resource Contiene la definizione di tutte le risorse stringhe, numeriche, boolean 23

Risorsa boolean Basta aggiungere una riga alla sezione Begin Resource Nome della risorsa Tipo della risorsa: Boolean, Numeric, String Intervallo di tempo in secondi di aggiornamento per Numeric & String Increasing: direzione risorse numeriche (Y/N) Descrizione come appare in lsinfo Begin Resource RESOURCENAME TYPE INTERVAL INCREASING DESCRIPTION mpich Boolean () () (Supporto mpich) 24

Risorsa boolean Successivamente va modificato lsf.cluster.<nomecluster>, aggiungendo la risorsa sull'host desiderato alla colonna RESOURCES, come visto in precedenza. Infine: Aggiornare i volumi readonly lsadmin reconfig badmin reconfig 25

Risorse numeriche (cenni) Non è cosi' semplice aggiungere risorse dinamiche numeriche (Come calcolo il loro valore? Come le distinguo da quelle statiche?) LSF fornisce uno strato di software, che si vedrà in lezioni successive) per lanciare script adatti a questo scopo. Per gli impazienti: man lim (cercare ELIM) man lsf.cluster (cercare ResourceMap) man lsf.shared 26

Configurazione di una coda 27

Il file lsb.queues lsb.queues si trova in conf/lsbatch/<nomecluster>/configdir È un file formato da tante sezioni Begin Queue ognuna delle quali definisce una coda di LSF. Esistono decine di parametri di configurazione delle code che si possono trovare in man lsb.queues. 28

Aggiunta di una coda Si supponga di voler aggiungere una coda per job brevi: bisogna aggiungere a lsb.queues una sezione vuota delimitata da Begin Queue/End Queue ed inserire alcuni parametri. Nome coda univoco Descrizione per bqueues -l Begin Queue QUEUE_NAME = small_test DESCRIPTION = Small 10 min. jobs PRIORITY = 80 RUNLIMIT = 10 RES_REQ = select[type == any] PJOB_LIMIT = 1 End Queue Limite di job per processori Priorità tra code Limite di tempo massimo per un job in minuti Uso automatico di risorse (si noti la keyword select[]) 29

Aggiunta di una coda Dopo la modifica di lsb.queues (nel volume read-write), vanno replicate le copie readonly del volume software.lsf.conf. Quando modifico un file della directory conf/lsbatch/<nomecluster>/configdir devo lanciare solamente badmin reconfig Infine, per verificare che tutto sia corretto: bqueues -l small_test bsub -q small_test sleep 10 30

lsb.queues: altri parametri utili CPULIMIT: limite imposto sul tempo di CPU (solo per job seriali) STACKLIMIT: limite stack (su alcune architetture è obbligatorio) HOSTS: limita la coda ad alcuni hosts USERS: limita la coda ad alcuni utenti PRE_EXEC/POST_EXEC POST_EXEC: esegue script prima e dopo il job sull'host di esecuzione JOB_STARTER: usa uno script per lanciare il job 31

Esercizio Da lin4p.frascati.enea.it, collegarsi a 172.1.50.11 user: lavadmin password: qemuxx Si troverà l'installazione di una versione free di lsf utile per fare dei test. COMPITO: aggiungere una risorsa ed una coda e documentare il funzionamento delle modifiche. NOTA BENE: si tratta di un cluster virtuale in emulazione: è meglio non collegarsi in tanti. 32