Bologna Batch System (BBS) Franco Semeria Seminario di Sezione

Documenti analoghi
Condor e la Griglia. Jaskaran Singh CS-599 Introduction to Grid Computing. Cosa Fa Condor CONDOR

Condor, Condor-G e la Griglia

Condor, Condor-G e la Griglia. Griglie e Sistemi di Elaborazione Ubiqui

Indice degli argomenti

ReCaS Datacenter cluster HPC, guida al suo utilizzo Febbraio, 2016 Alessandro Italiano

Argomenti. Architettura fisica di U-Lite Architettura software di U-Lite Comandi gestione job: NFS contro AFS Licenze software

Integrazione di ENEA GRID in EGEE

Piano di calcolo dell esperimento HERA-B

I Processi. Il Concetto di Processo

Un introduzione a. Condor Project Computer Sciences Department University of Wisconsin-Madison

Ambienti di calcolo a griglia Parte 2. Docente: Marcello CASTELLANO

Workshop Congiunto INFN CCR e GRID. Acireale, Maggio INFN - Sezione di Trieste - C. Strizzolo - L. Strizzolo

Contributo ENEA all'attività WP13, progetto FIRB GRID.IT (Chimica computazionale)

Tier-2 Legnaro-Padova. Massimo Biasotto

Lezione 2 Principi Fondamentali di SO Interrupt e Caching. Sommario

Virtualizzazione e macchine virtuali. Presentata da Bernardo Lombardi

Remote file access sulla grid e metodi di interconnesione di rete

Dipartimento di Scienze Chimiche Laboratorio Interdipartimentale di Chimica Computazionale

Università degli Studi di Napoli Federico II Corso di Laurea in Informatica III Anno

Strumenti per l analisi dati di plasmi di fusione in ambiente Linux AFS enea.it

Sistemi Operativi. Sistemi I/O SISTEMI DI INPUT/OUTPUT. Hardware di I/O. Interfaccia di I/O per le applicazioni. Sottosistema per l I/O del kernel

Sistemi Operativi SISTEMI DI INPUT/OUTPUT. D. Talia - UNICAL. Sistemi Operativi 10.1

Sistemi Operativi (modulo di Informatica II) L interfaccia del file system

2. Cenni di sistemi operativi

Scuola di Calcolo Scientifico con MATLAB (SCSM) 2017 Palermo 31 Luglio - 4 Agosto 2017

Condor-G: Un Agente per la Gestione dell Elaborazione in Multi-Institutional Grids

Sistemi Operativi. A.M. Fanelli Architettura dei Sistemi a. a Livello di Sistema Operativo. Livello di Linguaggi Applicativi

Sistemi Operativi GESTIONE DEI PROCESSI. D. Talia - UNICAL. Sistemi Operativi 4.1

Sistemi Di Elaborazione Dell informazione

Sistema operativo & file system 1

Il Sistema Operativo

Un introduzione a. II Parte

Bootstrap. Bootstrap. Shutdown. Struttura di un SO. Elementi principali di un SO:

Struttura dei Sistemi Operativi

Principi operativi dei computer. Capitolo 7 Fluency Conoscere e usare l informatica

Il nuovo cluster INFN per la fisica teorica

Esercizi su permessi

Grid Scheduling e WS-Agreement. Griglie e Sistemi di Elaborazione Ubiqui

Sistemi Operativi. Gianluca Della Vedova. Sistemi Operativi. Gianluca Della Vedova. Sistemi Operativi. Gianluca Della Vedova.

Piano di calcolo dell esperimento HERA-B

Il software. la parte contro cui si può solo imprecare

Il software. la parte contro cui si può solo imprecare. Il software

MPI. MPI e' il risultato di un notevole sforzo di numerosi individui e gruppi in un periodo di 2 anni, tra il 1992 ed il 1994

L hardware da solo non è sufficiente per il funzionamento dell elaboratore È necessario introdurre il software:

Capitolo 6 Le infrastrutture SoftWare

Gestione dei Processi

Concetto di Processo Scheduling dei Processi Operazioni sui Processi Processi cooperanti Comunicazione tra processi

Linguaggi di Programmazione

Quale Calcolo e Storage Per le applicazioni scientifiche ORA? Maggio 2015

Filtri e pipeline. qualsiasi comando unix ha a disposizione 3 file con cui comunicare con il resto del sistema: standard input in ingresso

Laboratorio Centro Calcolo

MODULO 1: INTRODUZIONE

Il software di sistema

Laboratorio virtuale

Isaac DE è una piattaforma Big Data completa di strumenti e servizi per l installazione, la configurazione, l uso, la gestione e il monitoraggio di

Parte II. Introduzione ai sistemi operativi e WindowsX. Parte II 1

Come funzionano i computer

HPC e Cloud 4 giugno 2018 Alberto Sabaini Anna Perina Piattaforma Computazionale

Il Progetto di Centro di Reprocessing di BaBar: Requisiti per il Monitoring e il Management

Condor e DAGMan. Napoli 2007

Il Globus Toolkit 4: Architettura e WS_GRAM. Sommario. Page 1. Architettura di GT4. Componenti e servizi principali

Programma del corso. Introduzione Rappresentazione delle Informazioni Calcolo proposizionale Architettura del calcolatore Reti di calcolatori

Come funziona un sistema di elaborazione

Istruzioni per l installazione del Local Scheduler

Programma e Modalità d Esame

Operazioni di I/O. Schema di collegamento fra dispositivi periferici e CPU

IL SOFTWARE DI SISTEMA

Il Globus Toolkit 4: Sommario. Page 1. Architettura di GT4. Componenti e servizi principali. GRAM e Servizi di Gestione di processi e job

Il Software programmabili programma algoritmo

Sommario. Introduzione al problema Infrastruttura realizzata Procedure di ottimizzazione Validazione Conclusioni

ARCHITECTING AND DESIGNING J2EE APPLICATIONS

Problematiche di rete nella sperimentazione di file-system distribuiti su WAN per applicazioni di GRID- Computing

5 Thread. 5 Thread. 5 Thread. Ad un generico processo, sono associati, in maniera univoca, i seguenti dati e le seguenti informazioni:

Comandi di Globus. Daniele D Agostino

Griglie Computazionali: GRID

Strumenti per l analisi dati di plasmi di fusione in ambiente Linux AFS enea.it

Organizzazione di un SO monolitico

L esecuzione di operazioni programmate ricopre un ruolo importante all interno dei processi elaborativi di un organizzazione.

Programmazione I - corso B a.a prof. Viviana Bono

La farm di LNL-Padova: stato e piani per il futuro

TECN.PROG.SIST.INF. - Politiche di schedulazione del processore. Roberta Gerboni

Architettura di un sistema operativo

Sistemi Operativi. L interfaccia del file system

Introduzione a Java A. FERRARI

Manuale HTCondor. Indice

IL SISTEMA OPERATIVO

Prestazioni e affidabilità dei dischi

Sicurezza del File System

Elementi di Base. Introduzione a Python.

Prof. Rossella Cancelliere

Elementi di Informatica A. A. 2016/2017

I THREAD O PROCESSI LEGGERI

Componenti principali. Programma cablato. Architettura di Von Neumann. Programma cablato. Cos e un programma? Componenti e connessioni

Workload Management System

Hardware e Software. I.I.S.S. E. Majorana Gela. Tecnologie Informatiche. Prof. Gaetano Impoco

Criteri da tenere a mente

Sistemi Operativi (modulo di Informatica II) L interfaccia del file system

GRID Data Center INFN Pisa

Istruzioni per l installazione del Local Scheduler

Transcript:

Bologna Batch System (BBS) Franco Semeria Seminario di Sezione 28-06-2004

Cosa e BBS BBS e un sistema batch basato su Condor. L utente sottomette i job da una macchina e il sistema li distribuisce sulle altre macchine secondo una definita policy di accesso.

Cosa e Condor Condor e un sistema per il calcolo distribuito su larga scala. Lo scopo principale di Condor e quello di usare macchine non dedicate (pc personali) in un modo non invasivo Non richiede la modifica del codice

Il Matchmaking con ClassAds Metodo di allocazione delle risorse analogo ai Classified Advertising Due soggetti: i job che chiedono risorse (es: RAM disponibile, velocita di CPU) e le macchine che offrono risorse. Central Manager Submitting machine Executing machine

Richieste e preferenze Si possono specificare richieste e preferenze: Un job puo richiedere le macchina con > 512MB di RAM, o preferire quelle di un particolare esperimento Una macchina puo runnare job solo durante la notte, o dare priorita ad una serie di utenti

Ottimizzazione delle risorse Si possono per esempio unire le farm di due gruppi ogni gruppo può sempre accedere alle proprie macchine Tutti possono usare anche le altre macchine se libere

I classads vengono specificati: Per I job nel job description file Per le mcchine nel file di configurazione di Condor

Condor Universe Puo essere utilizzato in diversi ambienti chiamati Universe scelti dall utente: Standard, Vanilla, PVM, MPI, Globus, Java, Scheduler I principali sono Standard e Vanilla

Condor Standard L Universe Standard bisogna rilinkare I job con alcune librerie di Condor. Cosi si ottiengono: remote system calls: Si accede ai file remotamente e in modo trasparente all utente checkpointing: il job avanza migrando da macchina a macchina

Condor Standard: l INFN Pool Il Condor Pool dell INFN e basato sullo Standard Universe Circa 200 macchine per 80 anni di CPU equivalente all anno

Condor Vanilla Non bisogna rilinkare I job. Non esiste checkpoint (se il job si ferma su una macchina deve ripartire dall inizio) L accesso remoto ai file avviene: Tramite condivisione dei dischi (NFS), oppure I file vengono copiati sulla executing machine tramite il Condor Transfer Mechanism

Condor Vanilla (cont.) In questo ambiente Condor assomiglia a un normale job scheduler (tipo pbs) Il vantaggio di Condor e la grande flessibilita dei ClassAds e la disponibilita di tool accessori (vedi DagMan) E possibile definire un complessa policy di accesso alle risorse con cui costruire un Batch System adattato alle proprie esigenze

DAGman Si possono eseguire job secondo un certo ordine con DAGman: A Job A A.condor Job B B.condor Job C C.condor Job D D.condor PARENT A CHILD B C PARENT B C CHILD D Script PRE A top_pre.csh B D C

Bologna Batch System Le macchine con BBS sono un sottoinsieme del Pool Nazionale I job BBS hanno la priorita sugli altri. Partono indipendentemente dal carico della CPU Due tipi di job (due code): short e long I short hanno una migliore priorita Unix (girano piu velocemente) Il numero di short su una macchina e minore dei long I short runnano per 1 ora, i long all infinito Tutti questi parametri possono essere modificati

Trasferimento dei file di I/O Un altro vantaggio di Condor: tramite il Condor Transfer Mechanism non e necessario che i dischi delle macchine siano condivisi Condor trasferisce automaticamente i file di input dalla submitting machine alla exec. machine, e viceversa per i file di output.

CPU e job In Condor una CPU può di norma eseguire un solo job. MA per BBS: Le risorse devono essere garantite Almeno un job short e uno long devono poter essere eseguiti su ogni macchina Le risorse non devono essere sprecate Non ci devono essere CPU libere e job in coda Contraddizione?

Virtual Machines E necessario associare più di una Virtual Machine (VM) per ogni CPU, che quindi può eseguire più di un job. Ogni VM ha una diversa priorità: i job short hanno una priorità migliore dei long

Job e macchine Come specificare un job come job bbs (short o long) Come specificare una macchina come macchina bbs (deve trattare i job bbs in modo particolare)

Per i job BolognaBatchJob = True requirements = (BolognaBatchServer == True) Per le macchine: BolognaBatchServer = True IsBBJob = (BolognaBatchJob == True)

Per i job long LongRunningJob = True Per le macchine IsLongBBJob = ( $(IsBBJob) && (LongRunningJob == True) )

Per dare priorita' diverse ai job: JOB_RENICE_INCREMENT = (5+(10* ( LongRunningJob == True BolognaBatchJob =!= True))) se LongRunningJob == True JOB_RENICE_INCREMENT = 5+10*1 = 15 altrimenti JOB_RENICE_INCREMENT = 5+10*0 = 5

La farm di Sezione Attualmente la farm di Sezione su cui e utilizzabile BBS e composta da 19 macchine biprocessori: 7 macchine centrali. 7 macchine di Alice. 5 macchine di Grid. BBS e utilizzato da Alice Prossimamente anche dai Teorici

BBS: utilizzo Creare un job description file: Executable = prova Input = prova.in Output = prova.out Log = prova.log Queue Sottomettere il job: bbs_submit_long prova.jdf bbs_submit_short prova.jdf

BBS: utilizzo (cont.) Cancellare un job: condor_rm Controllare lo stato dei job: bbs_q Interfaccia grafica: bbs_gui