Memoria primaria o secondaria? DFS MapReduce Scheduling & Data flow. Map Reduce. Giambattista Amati. Università di Tor Vergata.

Dimensione: px
Iniziare la visualizzazioe della pagina:

Download "Memoria primaria o secondaria? DFS MapReduce Scheduling & Data flow. Map Reduce. Giambattista Amati. Università di Tor Vergata."

Transcript

1 Map Reduce, Roma

2 Sommario 1 Memoria primaria o secondaria? 2 DFS 3 MapReduce 4 Scheduling & Data flow

3 Alcuni numeri Jeffrey Dean, Stanford talk, November 10, 2010

4 Dati in-memoria o su disco? Tempi di lettura Su disco Blocco (Windows): 65, 536 KB in 10 ms Cilindro: 16*65,536 in 10 ms 0.104GB/s Tempo di trasferimento dal disco rigido a un buffer è circa 3 Gbit/s 0.3GB/s In memoria 65, 536 KB in 0.1µs Lettura in memoria 65GB/s

5 Come gestire i Big Data I Concetti Chiave Distributed File System (DFS) Il modello computazionale Map Reduce Scheduling & Data flow.

6 Distributed File System Google GFS, Hadoop HDFS

7 Distributed File System (DFS) I dati vengono spezzettati, distribuiti e replicati in più file e più macchine Si hanno cluster di rack Ciascun rack ha 8-64 macchine collegate con uno switch a 1 Gbps I cluster sono collegati tra loro da un backbone principale a 2-8 Gbps I dati si spezzettano in chunk ( 64 MB), ogni chunk ospitato in memoria da una macchina (chunk server). Pochi GB di indice in memoria su ciascuna macchina poco costosa (commodity con CPU poco pregiata). Si hanno almeno 2-3 repliche di un chunk, un solo chunk al più in un rack.

8 Distributed File System Google GFS, Hadoop HDFS Google GFS o Hadoop HDFS forniscono una mappatura dello spazio dei nomi (namespace < informazione, chunk>), gestiscono la ridondanza e la disponibilità. Sollevano il programmatore da gestire tutta la complessità del calcolo distribuito. Le operazioni tipiche che vengono effettuate sono due: lettura e concatenazione (read e append) Gli update sulle singole macchine sono rari.

9 Distributed File System Chunk servers Piccolo file chiamato Nodo Master (Name Node in Hadoop HDFS) Archivia i metadati che contengono i puntatori ai chunk di un file e le sue copie Si può replicare

10 Distributed File System Quante macchine? Nel 2007 Google affermava di avere 403 PB. Tasso di compressione degli indici 3,5%: 14PB di dati prodotti Se tutto l indice va in memoria centrale... con servers, 2-3 repliche... nel 2007 occorrevano più di un milione di macchine con almeno 64 GB di RAM.

11 La programmazione distribuita è molto pesante Soluzione: Map-Reduce Map-Reduce viene incontro alle sfide della programmazione distribuita. Le 3 regole Archivia i dati con ridondanza su nodi multipli per garantire la persistenza e la loro disponibilità Effettua il calcolo in prossimittà dei dati per minimizzare il costo per trasferire i dati Usa un modello semplicissimo di programmazione per nascondere la complessità dell architettura

12 Primo esempio: contare le parole Si ha un documento molto grande Si deve contare il numero di volte che ciascun termine occorre nel file Applicazioni Analizzare i log del web server per determinare le URL più popolari Statistiche sui termini per la ricerca

13 Conteggio Parole Primo caso Il documento è troppo grande per risiedere in memoria, ma tutte le coppie <parola, frequenza> entrano in memoria

14 Conteggio Parole Secondo Caso Anche le coppie <parola, frequenza> non entrano in memoria. words(doc.txt) sort uniq -c dove le parole del file vengono collocate nello stesso file, ma una parola per ogni linea Il secondo caso cattura l essenza del MapReduce È facilmente parallelizabile

15 Conteggio Parole Secondo Caso words(doc.txt) sort uniq -c Map Scandire un termine alla volta Estrarre da ogni record un valore dalla chiave Raggruppare per chiavi Ordinare e Mescolare Ridurre Aggregare, sommare, filtrare o trasformare Scrivere il risultato su file Il principio è sempre lo stesso, Map e Reduce cambiano a seconda del problema

16 Map Reduce Dichiarare il numero dei Map e di Reduce, una chiave per un solo reduce

17 MAP

18 Reduce

19 Map Reduce Input: un insieme di coppie chiave-valore Il programmatore specifica due metodi: Map(k, v) < k, v > Prende una coppia chiave-valore e calcola un insieme di coppie chiave-valore Si ha una sola chiamata di Map per ogni coppia (k,v) Reduce(k, < v > ) < k, v > Tutti i valori v con la stessa chiave k vengono trattati insieme Esiste una sola chiamata Reduce per ogni chiave unica k

20 Map Reduce map(key, value): //key: document id; value: il testo del documento for each word w in value: emit(w, 1) reduce(key, values): // key:una parola w; value: un intero come contatore result = 0 for each count v in values: result += v emit(w, result)

21 Combiners Quando è possibile includere funzioni di tipo Reduce nella funzione di Map Riduce i tempi di calcolo nei Reduce (meno dati intermedi prodotti) Minore costo di comunicazione Minore scrittura di dati intermedi su FS locali. Riduzione del numero dei Reduce da gestire con il Master Node Quali proprietà deve avere la funzione di Reduce per potere essere svolta anche localmente?

22 Esercizio Supponiamo che i nostri dati di input per l operazione di map-reduce consistono di valori interi (le chiavi non sono importanti). La funzione map prende un intero n e produce la lista di coppie (p, n) tale che p è un divisore primo di n. Per esempio, map(12) = [(2, 12), (3, 12)]. La funzione reduce è l addizione, cioè reduce(p, [i 1, i 2,..., i k ]) = (p, i 1 + i i k ). Calcolare l output, se l input è l insieme di interi 15, 21, 24, 30, 49.

23 Map Reduce In breve

24 Map Reduce Esecuzione in parallelo

25 Scheduling & Data flow Cosa non deve fare il programmatore, ma che fa il sistema Partizione dei dati Scheduling dei task per l esecuzione del programma tra le varie macchine Ordinare per chiave i dati Assegnare i dati (intermedi) ai nodi. Gestire i guasti dei nodi. Gestire la comunicazione delle macchine

26 Data Flow Input e output finali sono memorizzati nel file system distribuito (DFS): Lo Scheduler tenta di pianificare i compiti di Map vicino alla posizione di archiviazione fisica dei dati di ingresso. I risultati intermedi sono memorizzati su FS locali dei server di Map e Reduce. L uscita è spesso input per un altro compito MapReduce

27 Coordinamento del Nodo Master Il Nodo Master si occupa del coordinamento: Status del Compito: (inattivo, in corso, completato) Gli stati inattivi vengono mandati in esecuzione non appena i server diventano disponibili Una volta completata un attività di Map, il master invia la posizione e le dimensioni dei suoi R file intermedi, una per ciascuna attività di Reduce il Master invia queste informazioni ai Reducers Il nodo master controlla (ping) i servers periodicamente per rilevare i guasti

28 Gestione dei guasti Fallimento di un compito Map Le attività completate o in corso sui server slave vengono resettati allo stato di Idle I compiti Idle vengono eventualmente riprogrammati su altri servers Guasto di un server Reduce Solo i compiti in-progress vengono resettati allo stato di Idle. I compiti Reduce di tipo Idle vengono assegnati e riavviati su altri server Fallimento del nodo Master Il compito MapReduce viene interrotto e viene notificato il fallimento al programma

29 Quanti Map e quanti Reduce? M compiti Map compiti, R Reducers Regola generale: Rendere M molto più grande del N numero di nodi del cluster È sensato assegnare un Map a ogni chunk di DFS. Migliora il bilanciamento del carico dinamico e accelera il recupero da eventuali guasti dei servers. Solitamente R è minore di M Dato che l output è distribuito su R file.

30 Documentazione J. Leskovec, A. Rajaraman, J. D. Ullman, Mining of Massive Datasets, Capitolo 2, sezioni

Subsection 1. MapReduce

Subsection 1. MapReduce MapReduce Subsection 1 MapReduce MapReduce La programmazione distribuita è molto pesante Soluzione: MapReduce MapReduce viene incontro alle sfide della programmazione distribuita. Le 3 regole Archivia

Dettagli

Big Data Tecnologie, metodologie per l analisi di dati massivi Seminario ISCOM

Big Data Tecnologie, metodologie per l analisi di dati massivi Seminario ISCOM Big Data Tecnologie, metodologie per l analisi di dati massivi Seminario ISCOM, Simone Angelini, Marco Bianchi, Giuseppe Marcone, Roma 26 febbraio 2016 Sommario 1 Il progetto SNOOPI 2 Piattaforme di Big

Dettagli

Elaborazione dati parallela con map/reduce. Roberto Congiu rcongiu@yahoo.com

Elaborazione dati parallela con map/reduce. Roberto Congiu rcongiu@yahoo.com Elaborazione dati parallela con map/reduce Roberto Congiu rcongiu@yahoo.com Indice delle slide Introduzione a Map/Reduce Descrizione del modello Implementazione Ottimizzazioni Introduzione Map/Reduce e

Dettagli

Tecnologie e metodologie di Big Data Analytics - Apache Spark

Tecnologie e metodologie di Big Data Analytics - Apache Spark Tecnologie e metodologie di Big Data Analytics - Apache Spark Simone Angelini Fondazione Ugo Bordoni sangelini@fub.it 2 Luglio 2019 Simone Angelini (Fondazione Ugo Bordoni) Tecnologie e metodologie di

Dettagli

Big Data: tecnologie, metodologie e applicazioni per l analisi dei dati massivi

Big Data: tecnologie, metodologie e applicazioni per l analisi dei dati massivi Big Data: tecnologie, metodologie e applicazioni per l analisi dei dati massivi Ministero Dello Sviluppo Economico Istituto Superiore delle Comunicazioni e delle Tecnologie dell Informazione Seminario

Dettagli

INDEXING: DISTRIBUITO O MAPREDUCE? Davide Tuccilli Algoritmi Avanzati A.A. 2011/2012

INDEXING: DISTRIBUITO O MAPREDUCE? Davide Tuccilli Algoritmi Avanzati A.A. 2011/2012 INDEXING: DISTRIBUITO O MAPREDUCE? Davide Tuccilli Algoritmi Avanzati A.A. 2011/2012 Introduzione Grandi moli di dati su cui effettuiamo ricerche quotidianamente Google indicizza per il motore di ricerca

Dettagli

Esercizio 1. Si consideri il seguente frammento di FAT: Blocco Fisico - valore nella FAT. e di directory D1 : nome file - primo blocco A 32 B 36

Esercizio 1. Si consideri il seguente frammento di FAT: Blocco Fisico - valore nella FAT. e di directory D1 : nome file - primo blocco A 32 B 36 Esercizio 1. Si consideri il seguente frammento di FAT: Blocco Fisico - valore nella FAT 30 16 31 34 32 33 33 35 34 41 35 40 36 37 37 31 38 29 39 30 40 39 e di directory D1 : nome file - primo blocco A

Dettagli

MapReduce: teoria e implementazione

MapReduce: teoria e implementazione MapReduce: teoria e implementazione 1 Genesi nasce nel 2004 [ MapReduce: simplified Data Processing on Large Clusters, Dean, Ghemawat. Google Inc.] nasce dall esigenza di eseguire problemi semplici su

Dettagli

DataBase NoSQL. Prof. Marco Pedroni Unversità degli Studi di Ferrara

DataBase NoSQL. Prof. Marco Pedroni Unversità degli Studi di Ferrara DataBase NoSQL Prof. Marco Pedroni Unversità degli Studi di Ferrara Definizione DB NoSQL = sistemi software di archiviazione, in cui la persistenza dei dati è caratterizzata dal fatto di non utilizzare

Dettagli

Sperimentazione del file-system distribuito HDFS in ambiente GRID. III Borsista Day, Roma, 06.12.2012

Sperimentazione del file-system distribuito HDFS in ambiente GRID. III Borsista Day, Roma, 06.12.2012 Sperimentazione del file-system distribuito HDFS in ambiente GRID Tutor: Domenico Diacono Outline Use cases Hadoop Distributed File System Test di funzionalità Sviluppo di politiche di replica dei dati

Dettagli

BASI DI DATI DISTRIBUITE

BASI DI DATI DISTRIBUITE BASI DI DATI DISTRIBUITE Definizione 2 Un sistema distribuito è costituito da un insieme di nodi (o di siti) di elaborazione una rete dati che connette fra loro i nodi Obiettivo: far cooperare i nodi per

Dettagli

Sistemi Operativi (modulo di Informatica II) L interfaccia del file system

Sistemi Operativi (modulo di Informatica II) L interfaccia del file system Sistemi Operativi (modulo di Informatica II) L interfaccia del file system Patrizia Scandurra Università degli Studi di Bergamo a.a. 2009-10 Sommario Il concetto di file Metodi di accesso Struttura delle

Dettagli

Informatica 3. LEZIONE 20: Ordinamento esterno. Modulo 1: Organizzazione della memoria Modulo 2: Ordinamento esterno

Informatica 3. LEZIONE 20: Ordinamento esterno. Modulo 1: Organizzazione della memoria Modulo 2: Ordinamento esterno Informatica 3 LEZIONE 20: Ordinamento esterno Modulo 1: Organizzazione della memoria Modulo 2: Ordinamento esterno Informatica 3 Lezione 20 - Modulo 1 Organizzazione della memoria Introduzione Dati in

Dettagli

Elementi di Informatica A. A. 2016/2017

Elementi di Informatica A. A. 2016/2017 Elementi di Informatica A. A. 2016/2017 Ing. Nicola Amatucci Università degli studi di Napoli Federico II Scuola Politecnica e Delle Scienze di Base nicola.amatucci@unina.it Cos'è un Sistema Operativo?

Dettagli

MapReduce. Progettazione del Software a.a. 2012/13. Università degli Studi di Milano Dept. of Computer Science. Matteo Camilli

MapReduce. Progettazione del Software a.a. 2012/13. Università degli Studi di Milano Dept. of Computer Science. Matteo Camilli Università degli Studi di Milano Dept. of Computer Science MapReduce Matteo Camilli matteo.camilli@unimi.it http://camilli.di.unimi.it Progettazione del Software a.a. 2012/13 1 Motivazioni Vogliamo processare

Dettagli

Sistemi Operativi. Il file system Casi di studio. Sistemi Operativi. Corso di laurea in Informatica. AA 2002/03 Bruschi, Rosti

Sistemi Operativi. Il file system Casi di studio. Sistemi Operativi. Corso di laurea in Informatica. AA 2002/03 Bruschi, Rosti Il file system Casi di studio 1 CP/M Control Program for Microcomputer Predecessore del MS-DOS Dimensione media 16K File system predisposto per Floppy Allocazione dei file come lista-linkata di blocchi

Dettagli

Soluzioni distribuite per la BioInformatica nel Virtual Data 5 Aprile Center / 33

Soluzioni distribuite per la BioInformatica nel Virtual Data 5 Aprile Center / 33 Soluzioni distribuite per la BioInformatica nel Virtual Data Center Workshop GARR 2017 - Netvolution Giuseppe Cattaneo Dipartimento di Informatica Università di Salerno, I-84084, Fisciano (SA), Italy cattaneo@unisa.it

Dettagli

File: definizione. Il file è la più piccola unità logica manipolabie Un file è caratterizzato principalmente da:

File: definizione. Il file è la più piccola unità logica manipolabie Un file è caratterizzato principalmente da: File System File: definizione Il file è la più piccola unità logica manipolabie Un file è caratterizzato principalmente da: Dimensione Posizione Accessibilità (solo lettura, lettura e scrittura) Tipo (estensione)

Dettagli

La memoria secondaria

La memoria secondaria La memoria secondaria E di solito un disco rigido che contiene dati e programmi in modo permanente (può essere anche un cd-rom, floppy disk, etc). Tempi di accesso: Floppy: O(100) ms Hard disk: O(10) ms

Dettagli

CONFIGURAZIONI E TESTING DI HADOOP-FS PER L'ALTA AFFIDABILITÀ DEI DATI DI UN SITO MEDIO-PICCOLO

CONFIGURAZIONI E TESTING DI HADOOP-FS PER L'ALTA AFFIDABILITÀ DEI DATI DI UN SITO MEDIO-PICCOLO CONFIGURAZIONI E TESTING DI HADOOP-FS PER L'ALTA AFFIDABILITÀ DEI DATI DI UN SITO MEDIO-PICCOLO Giovanni Marzulli GARR-INFN Domenico Diacono INFN Giacinto Donvito IGI-INFN 1 Outline Use cases Hadoop Distributed

Dettagli

Introduzione Definizioni

Introduzione Definizioni Informatica 3 Informatica 3 LEZIONE 20: Ordinamento esterno Lezione 20 - Modulo 1 Modulo 1: Organizzazione della memoria Modulo 2: Ordinamento esterno Organizzazione della memoria Politecnico di Milano

Dettagli

Input/Output (Cap. 7, Stallings)

Input/Output (Cap. 7, Stallings) Input/Output (Cap. 7, Stallings) Grande varietà di periferiche gestiscono quantità di dati differenti a velocità diverse in formati diversi Tutti più lenti della CPU e della RAM Necessità di avere moduli

Dettagli

Sistemi Operativi (modulo di Informatica II) L interfaccia del file system

Sistemi Operativi (modulo di Informatica II) L interfaccia del file system Sistemi Operativi (modulo di Informatica II) L interfaccia del file system Patrizia Scandurra Università degli Studi di Bergamo a.a. 2011-12 Sommario Il concetto di file Metodi di accesso Struttura delle

Dettagli

Esercitazione. programmazione MapReduce con Hadoop v1.2.1

Esercitazione. programmazione MapReduce con Hadoop v1.2.1 Esercitazione programmazione MapReduce con Hadoop v1.2.1 1 Prologo Cluster di VM accessibili tramite un gateway con reverse ssh passwordless ssh (Secure SHell) protocollo di rete per stabilire una connessione

Dettagli

Sistemi Operativi. L interfaccia del file system

Sistemi Operativi. L interfaccia del file system Sistemi Operativi (modulo di Informatica II) L interfaccia del file system Patrizia Scandurra Università degli Studi di Bergamo a.a. 2008-09 Sommario Il concetto di file Metodi di accesso Struttura delle

Dettagli

Esercizio FAT 1. Soluzione: 1. Capacità del disco: 2 24 blocchi (3 byte=24 bit) 2

Esercizio FAT 1. Soluzione: 1. Capacità del disco: 2 24 blocchi (3 byte=24 bit) 2 Esercizio FAT 1 In un disco con blocchi di 1 Kbyte (= 2 10 byte), è definito un file system FAT. Gli elementi della FAT sono in corrispondenza biunivoca con i blocchi fisici del disco. Ogni elemento ha

Dettagli

Informatica II Sistemi Operativi DIGIP - a.a. 2015/16

Informatica II Sistemi Operativi DIGIP - a.a. 2015/16 DIPARTIMENTO DI INFORMATICA Alberto Ceselli (alberto.ceselli@unimi.it) Informatica II Sistemi Operativi DIGIP - a.a. 2015/16 Sistemi Operativi (modulo di Informatica II) L interfaccia del file system Patrizia

Dettagli

Esercizio FAT 1. Soluzione:

Esercizio FAT 1. Soluzione: Esercizio FAT 1 In un disco con blocchi di 1 Kbyte (= 2 10 byte), è definito un file system FAT. Gli elementi della FAT sono in corrispondenza biunivoca con i blocchi fisici del disco. Ogni elemento ha

Dettagli

Modelli e problematiche di file system

Modelli e problematiche di file system Realizzazione del file system I file system (FS) sono memorizzati su disco I dischi possono essere partizionati Ogni partizione può contenere un FS distinto Il settore 0 del disco contiene le informazioni

Dettagli

Sistema di monitoraggio per datacenter distribuiti geograficamente basati su OpenStack

Sistema di monitoraggio per datacenter distribuiti geograficamente basati su OpenStack Sistema di monitoraggio per datacenter distribuiti geograficamente basati su OpenStack Tutor: Dott. Domenico Elia Tutor: Dott. Giacinto Donvito Indice Descrizione del progetto Confronto con l attività

Dettagli

Architettura di NTFS 1

Architettura di NTFS 1 Architettura di NTFS 1 NT 5.x supporta l intera gamma dei FS Windows e anche ext2fs di GNU/Linux FAT-16 Limite logico all ampiezza di partizione 2 16 blocchi di ampiezza massima 32 KB 2 GB FAT-32 Limite

Dettagli

Logico e fisico. Fisico: legato agli aspetti costruttivi e tecnologici HARDWARE Logico: legato al significato e all organizzazione SOFTWARE FISICO

Logico e fisico. Fisico: legato agli aspetti costruttivi e tecnologici HARDWARE Logico: legato al significato e all organizzazione SOFTWARE FISICO File System FISICO LOGICO Indice Caratteristiche generali I file e directory Metodi di accesso Directory e descrittori dei file Operazioni sui file Organizzazione della memoria fisica Allocazione della

Dettagli

Sistemi Operativi FILE SYSTEM : INTERFACCIA. D. Talia - UNICAL. Sistemi Operativi 8.1

Sistemi Operativi FILE SYSTEM : INTERFACCIA. D. Talia - UNICAL. Sistemi Operativi 8.1 FILE SYSTEM : INTERFACCIA 8.1 Interfaccia del File System Concetto di File Metodi di Accesso Struttura delle Directory Montaggio del File System Condivisione di File Protezione 8.2 Concetto di File File

Dettagli

Introduzione ai thread

Introduzione ai thread Introduzione ai thread Processi leggeri. Immagine di un processo (codice, variabili locali e globali, stack, descrittore). Risorse possedute: : (file aperti, processi figli, dispositivi di I/O..),. L immagine

Dettagli

File System FAT. Il file system FAT è il file system usato da MS-DOS, Windows 3.1 e Windows 95

File System FAT. Il file system FAT è il file system usato da MS-DOS, Windows 3.1 e Windows 95 File System Il File System rappresenta la modalità di scrittura/lettura di Windows dei dati sui dischi rigidi Windows 2000 supporta i seguenti file system: FAT ( File Allocation Table) FAT 32 (File Allocation

Dettagli

Sistema Operativo (Software di base)

Sistema Operativo (Software di base) Il Software Il software del PC Il computer ha grandi potenzialità ma non può funzionare senza il software. Il software essenziale per fare funzionare il PC può essere diviso nelle seguenti componenti:

Dettagli

Sistemi Operativi 1. Mattia Monga. a.a. 2008/09. Dip. di Informatica e Comunicazione Università degli Studi di Milano, Italia

Sistemi Operativi 1. Mattia Monga. a.a. 2008/09. Dip. di Informatica e Comunicazione Università degli Studi di Milano, Italia 1 Mattia Dip. di Informatica e Comunicazione Università degli Studi di Milano, Italia mattia.monga@unimi.it a.a. 2008/09 1 c 2009 M.. Creative Commons Attribuzione-Condividi allo stesso modo 2.5 Italia

Dettagli

Sistemi Operativi. Bruschi Martignoni Monga

Sistemi Operativi. Bruschi Martignoni Monga 1 Mattia Dip. di Informatica e Comunicazione Università degli Studi di Milano, Italia mattia.monga@unimi.it Lezione XXXII: a.a. 2008/09 1 c 2009 M.. Creative Commons Attribuzione-Condividi allo stesso

Dettagli

Laboratorio di Informatica (Chimica)

Laboratorio di Informatica (Chimica) Laboratorio di Informatica (Chimica) Lezione 02: Il Sistema Operativo. Walter Cazzola Dipartimento di Informatica e Comunicazione Università à degli Studi di Milano. e-mail: cazzola@dico.unimi.it Walter

Dettagli

Sistemi RAID. Motivazioni Concetti di base Livelli RAID. Sommario

Sistemi RAID. Motivazioni Concetti di base Livelli RAID. Sommario Sistemi RAID 1 Motivazioni Concetti di base Livelli RAID Sommario 2 1 Motivazione L evoluzione tecnologica ha permesso di avere dischi sempre più piccoli e meno costosi E facile equipaggiare un sistema

Dettagli

Criteri da tenere a mente

Criteri da tenere a mente 2 Alcune considerazioni sul progetto di soluzioni software Criteri da tenere a mente Lo stile di programmazione è importante leggibilità (commenti / nomi significativi di variabili / indentazioni /...)

Dettagli

Modelli e problematiche di file system. Modelli e problematiche di file system. Modelli e problematiche di file system

Modelli e problematiche di file system. Modelli e problematiche di file system. Modelli e problematiche di file system Parte 2 - Indice. Implementazione del file system 2. Implementazione dei file 3. Implementazione delle directory. Esempi di file system 5. Integrità e prestazioni del file system Architettura degli elaboratori

Dettagli

Bootstrap. Bootstrap. Shutdown. Struttura di un SO. Elementi principali di un SO:

Bootstrap. Bootstrap. Shutdown. Struttura di un SO. Elementi principali di un SO: Bootstrap Bootstrap All accensione di un calcolatore vengono attivati programmi di diagnostica scritti nella ROM (Read Only Memory) che verificano l assenza di guasti Poi viene attivato il programma di

Dettagli

VERIFICA DI SISTEMI. 5 Domanda [1 punto] Calcolare la velocità di trasferimento dei seguenti hard disk:

VERIFICA DI SISTEMI. 5 Domanda [1 punto] Calcolare la velocità di trasferimento dei seguenti hard disk: VERIFICA DI SISTEMI 1 Domanda [2 punti] Illustra la funzione della CPU e degli eventuali elementi che la costituiscono, specificando quali sono i parametri che ne caratterizzano il funzionamento. Spiega

Dettagli

Conseguenze Algoritmiche del fenomeno small world

Conseguenze Algoritmiche del fenomeno small world Conseguenze Algoritmiche del fenomeno small world 0 Peer-to-Peer (P2P) Il termine Peer-to-Peer (P2P) si riferisce ad un architettura logica di rete in cui i nodi non sono gerarchizzati sotto forma di client

Dettagli

Docenti: Fabrizio Benazzi Valter Lelli Azienda USL 11 di Empoli

Docenti: Fabrizio Benazzi Valter Lelli Azienda USL 11 di Empoli Informatica di base Docenti: Fabrizio Benazzi Valter Lelli Azienda USL 11 di Empoli v.lelli@usl11.tos.it f.benazzi@usl11.tos.it Moduli 1) Presentazione ed Introduzione 2) L'Hardware 3) Il Software di base

Dettagli

I THREAD O PROCESSI LEGGERI

I THREAD O PROCESSI LEGGERI I THREAD O PROCESSI Processi (pesanti): LEGGERI entità autonome con poche risorse condivise (si prestano poco alla scrittura di applicazioni fortemente cooperanti) Ogni processo può essere visto come Immagine

Dettagli

Università di Roma Tor Vergata Corso di Laurea triennale in Informatica Sistemi operativi e reti A.A Pietro Frasca.

Università di Roma Tor Vergata Corso di Laurea triennale in Informatica Sistemi operativi e reti A.A Pietro Frasca. Università di Roma Tor Vergata Corso di Laurea triennale in Informatica Sistemi operativi e reti A.A. 2017-18 Pietro Frasca Lezione 21 Giovedì 14-12-2017 Esempio Per mostrare l importanza del modo di memorizzare

Dettagli

Informatica 3. Informatica 3. LEZIONE 23: Indicizzazione. Lezione 23 - Modulo 1. Indicizzazione. Introduzione. Indicizzazione:

Informatica 3. Informatica 3. LEZIONE 23: Indicizzazione. Lezione 23 - Modulo 1. Indicizzazione. Introduzione. Indicizzazione: Informatica 3 Informatica 3 LEZIONE 23: Indicizzazione Lezione 23 - Modulo 1 Modulo 1: Indicizzazione lineare, ISAM e ad albero Modulo 2: 2-3 trees, B-trees e B + -trees Indicizzazione lineare, ISAM e

Dettagli

Introduzione ai. Sistemi Distribuiti

Introduzione ai. Sistemi Distribuiti Introduzione ai Sistemi Distribuiti Definizione di Sistema Distribuito (1) Un sistema distribuito è: Una collezione di computer indipendenti che appaiono agli utenti come un sistema singolo coerente. Definizione

Dettagli

Capitolo 14: Struttura delle memorie di massa

Capitolo 14: Struttura delle memorie di massa Capitolo 14: Struttura delle memorie di massa Struttura dei dischi. Schedulazione degli accessi al disco. Amministrazione del disco. Gestione dello spazio di swap. 14.1 Struttura dei dischi I dischi rigidi

Dettagli

Si può simulare una struttura di directory a multilivelli con una struttura di directory a singolo livello?"

Si può simulare una struttura di directory a multilivelli con una struttura di directory a singolo livello? Si può simulare una struttura di directory a multilivelli con una struttura di directory a singolo livello?" SOL Se è permesso che i nomi dei file abbiano lunghezza arbitraria, basta associare al nome

Dettagli

Grid Data Management Services. Griglie e Sistemi di Elaborazione Ubiqui

Grid Data Management Services. Griglie e Sistemi di Elaborazione Ubiqui Grid Data Management Services D. Talia - UNICAL Griglie e Sistemi di Elaborazione Ubiqui Sommario Grid Data Management GridFTP RFT RLS OGSA-DAI GridFTP GT4 Data Services High-performance Data transfer

Dettagli

File system: aspetti implementativi

File system: aspetti implementativi File system: aspetti implementativi Sistemi Operativi Lez. 24 Layout disco Tutte le informazioni necessarie al file system per poter operare sono memorizzate sul disco di boot MBR: settore 0 del disco,

Dettagli

Esercizio 2. la dimensione del file risultante la velocità di trasferimento minima dell'hard disk

Esercizio 2. la dimensione del file risultante la velocità di trasferimento minima dell'hard disk Esercizio Esercizio 1 Un sistema di elaborazione è dotato di una memoria centrale di 256 MB con un tempo d'accesso di 40 ns, e di una memoria cache di 128 kb con tempo d'accesso di 10 ns. Si determini

Dettagli

Realizzazione del file system. Fabio Buttussi HCI Lab Dipart. Di Matematica ed Informatica Università degli studi di Udine

Realizzazione del file system. Fabio Buttussi HCI Lab Dipart. Di Matematica ed Informatica Università degli studi di Udine Realizzazione del file system Fabio Buttussi HCI Lab Dipart. Di Matematica ed Informatica Università degli studi di Udine www.dimi.uniud.it/buttussi Struttura del file system Il file system risiede in

Dettagli

Architettura dei calcolatori e sistemi operativi. Input Output. IO 3 Device driver

Architettura dei calcolatori e sistemi operativi. Input Output. IO 3 Device driver Architettura dei calcolatori e sistemi operativi Input Output IO 3 Device driver Device driver - gestori delle periferiche Sono moduli software che realizzano l interfacciamento e la gestione dei dispositivi

Dettagli

POLITECNICO DI TORINO

POLITECNICO DI TORINO POLITECNICO DI TORINO Corso di Laurea in Ingegneria Informatica Tesi Magistrale Progettazione e sviluppo di applicazioni per la gestione di flussi di dati IoT tramite un architettura Big Data nel Cloud

Dettagli

Organizzazione Fisica dei Dati (Parte II)

Organizzazione Fisica dei Dati (Parte II) Modello Fisico dei Dati Basi di Dati / Complementi di Basi di Dati 1 Organizzazione Fisica dei Dati (Parte II) Angelo Montanari Dipartimento di Matematica e Informatica Università di Udine Modello Fisico

Dettagli

Esercizi di introduzione alla programmazione

Esercizi di introduzione alla programmazione Esercizi di introduzione alla programmazione Federico Reghenzani Informatica ed Elementi di Informatica Medica 2017-18 1 Esercizi di codifica 1.1 Conversione da base 10 a un altra base Trovare x: 203 10

Dettagli

Informatica Generale --- Scritto del XX Settembre 2002

Informatica Generale --- Scritto del XX Settembre 2002 Informatica Generale --- Scritto del XX Settembre 2002 Nome: Cognome: Testo e Risposte Esercizio 1 (punti 2 in prima approssimazione) Consideriamo numeri naturali rappresentati in base 10 e in base 12

Dettagli

Data-intensive computing systems

Data-intensive computing systems Data-intensive computing systems Esempi di progetti University of Verona Computer Science Department Damiano Carra Generalità! Lista con indicazione sommaria del progetto Serve per capire il tema! Il progetto

Dettagli

Introduzione all Informatica. Alfredo Cuzzocrea. Sistema Operativo

Introduzione all Informatica. Alfredo Cuzzocrea. Sistema Operativo Alfredo Cuzzocrea FIRMWARE: IL BIOS BIOS = Basic Input-Output System gestisce direttamente le risorse hardware e offre delle funzionalità standard di accesso risiede su un chip di memoria permenente ROM,

Dettagli

Parallel Frequent Set Counting

Parallel Frequent Set Counting Parallel Frequent Set Counting Progetto del corso di Calcolo Parallelo AA 2001-02 Salvatore Orlando 1 Cosa significa association mining? Siano dati un insieme di item un insieme di transazioni, ciascuna

Dettagli

INDICI PER FILE. Accesso secondario. Strutture ausiliarie di accesso

INDICI PER FILE. Accesso secondario. Strutture ausiliarie di accesso INDICI PER FILE Strutture ausiliarie di accesso 2 Accesso secondario Diamo per scontato che esista già un file con una certa organizzazione primaria con dati non ordinati, ordinati o organizzati secondo

Dettagli

! 11.2! Silberschatz, Galvin and Gagne 2005! Operating System Concepts 7 th Edition, Jan 1, 2005!

! 11.2! Silberschatz, Galvin and Gagne 2005! Operating System Concepts 7 th Edition, Jan 1, 2005! Struttura dei File! Unitaʼ logica di memorizzazione! Collezione di informazioni correlate! File control block (inode) struttura dati per le informazioni principali riguardanti un file! Fle system! risiede

Dettagli

Basi di Dati Architetture Client/Server

Basi di Dati Architetture Client/Server Basi di Dati Architetture Client/Server Architettura centralizzata Un architettura è centralizzata quando i dati e le applicazioni (programmi) risiedono in un unico nodo elaborativo Tutta l intelligenza

Dettagli

FILE E INDICI Architettura DBMS

FILE E INDICI Architettura DBMS FILE E INDICI Architettura DBMS Giorgio Giacinto 2010 Database 2 Dati su dispositivi di memorizzazione esterni! Dischi! si può leggere qualunque pagina a costo medio fisso! Nastri! si possono leggere le

Dettagli

Sistemi operativi e distribuiti

Sistemi operativi e distribuiti Sistemi operativi e distribuiti File System Il concetto di file Unospaziologicocontinuo per la memorizzazione dei dati Tipi di dati memorizzabili in un file Codice eseguibile Dati generici numeri caratteri

Dettagli

Ambienti di calcolo a griglia Parte 2. Docente: Marcello CASTELLANO

Ambienti di calcolo a griglia Parte 2. Docente: Marcello CASTELLANO Ambienti di calcolo a griglia Parte 2 Docente: Marcello CASTELLANO GRID: risorse (e loro gestione) Classificazione delle risorse Calcolo, Storage, Comunicazione Software e licenze Altre risorse Strategie

Dettagli

Architettura di Von Neumann

Architettura di Von Neumann Architettura di Von Neumann L architettura è ancora quella classica sviluppata da Von Neumann nel 1947. L architettura di Von Neumann riflette le funzionalità richieste da un elaboratore: memorizzare i

Dettagli

Strutture dei sistemi di calcolo

Strutture dei sistemi di calcolo Strutture dei sistemi di calcolo Funzionamento di un sistema di calcolo Struttura di I/O Struttura della memoria Gerarchia delle memorie Architetture di protezione Architettura di un sistema di calcolo

Dettagli

SOFTWARE. Programmi e dati che indicano al computer come svolgere un determinato compito

SOFTWARE. Programmi e dati che indicano al computer come svolgere un determinato compito SOFTWARE MODULO 3 SOFTWARE Programmi e dati che indicano al computer come svolgere un determinato compito Programma: sequenza di istruzioni, scritte in un determinato linguaggio, con le quali si fa eseguire

Dettagli

Sommario FONDAMENTI DI INFORMATICA. Schema dell'architettura a livelli del SO. Il Sistema Operativo (SO) SISTEMI OPERATIVI

Sommario FONDAMENTI DI INFORMATICA. Schema dell'architettura a livelli del SO. Il Sistema Operativo (SO) SISTEMI OPERATIVI Università degli Studi di Cagliari Corsi di Laurea in Ingegneria Chimica e Ingegneria Meccanica FONDAMENTI DI INFORMATICA http://www.diee.unica.it/~marcialis/fi A.A. 217/218 Docente: Gian Luca Marcialis

Dettagli

Test e risultati sull uso di un file system GPFS condiviso su rete WAN

Test e risultati sull uso di un file system GPFS condiviso su rete WAN Test e risultati sull uso di un file system GPFS condiviso su rete WAN Antonio Budano (INFN Sezione di Roma 3) In collaborazione con: Vladimir Sapunenko (INFN - CNAF) Elisabetta Vilucchi (INFN LNF) Sommario

Dettagli

ANALISI E SPERIMENTAZIONE DELLA PIATTAFORMA CLOUD DATAFLOW

ANALISI E SPERIMENTAZIONE DELLA PIATTAFORMA CLOUD DATAFLOW ALMA MATER STUDIORUM UNIVERSITÀ DI BOLOGNA SCUOLA DI INGEGNERIA E ARCHITETTURA DIPARTIMENTO DI INFORMATICA SCIENZA E INGEGNERIA CORSO DI LAUREA IN INGEGNERIA INFORMATICA TESI DI LAUREA IN SISTEMI OPERATIVI

Dettagli

Memorie a semiconduttore

Memorie a semiconduttore Memoria centrale a semiconduttore (Cap. 5 Stallings) Architettura degli elaboratori -1 Pagina 209 Memorie a semiconduttore RAM Accesso casuale Read/Write Volatile Memorizzazione temporanea Statica o dinamica

Dettagli

Architetture Client/Server. Un architettura è centralizzata quando i dati e le applicazioni (programmi) risiedono in un unico nodo elaborativo

Architetture Client/Server. Un architettura è centralizzata quando i dati e le applicazioni (programmi) risiedono in un unico nodo elaborativo Basi di dati Basi di Dati Architetture Client/Server Architettura centralizzata Un architettura è centralizzata quando i dati e le applicazioni (programmi) risiedono in un unico nodo elaborativo Tutta

Dettagli

Esercitazione E7 Prova di autovalutazione

Esercitazione E7 Prova di autovalutazione Esercitazione E7 Prova di autovalutazione Sistemi Operativi - prof. Silvio Salza - a.a. 2008-2009 E7-1 Esercizio 1 Un file di 8800 record di 180 Byte (con chiave da 47 Byte), è allocato su di un disco,

Dettagli

Università degli Studi di Padova - Corso di Laurea in Informatica

Università degli Studi di Padova - Corso di Laurea in Informatica Università degli Studi di Padova - Corso di Laurea in Informatica Regole dell'esame Il presente esame scritto deve essere svolto in forma individuale in un tempo massimo di 90 minuti dalla sua presentazione.

Dettagli

Il Sistema Operativo fa parte del software di base; e` costituito da un insieme di programmi che interagiscono e cooperano per:

Il Sistema Operativo fa parte del software di base; e` costituito da un insieme di programmi che interagiscono e cooperano per: Il Sistema Operativo Il Sistema Operativo fa parte del software di base; e` costituito da un insieme di programmi che interagiscono e cooperano per: gestire efficientemente l'elaboratore e le sue periferiche,

Dettagli

Introduzione ai. Sistemi Distribuiti

Introduzione ai. Sistemi Distribuiti Introduzione ai Sistemi Distribuiti Definizione di Sistema Distribuito (1) Un sistema distribuito è: Una collezione di computer indipendenti che appaiono agli utente come un sistema singolo coerente. 1

Dettagli

Il Sistema Operativo

Il Sistema Operativo Corso di Alfabetizzazione Informatica 2003/2004 Il Sistema Operativo Modello di von Neumann Bus di sistema CPU Memoria Centrale Memoria di Massa Interfaccia Periferica 1 Interfaccia Periferica 2 Il computer

Dettagli

Sistemi Operativi. Lez. 14 File System: aspetti implementativi

Sistemi Operativi. Lez. 14 File System: aspetti implementativi Sistemi Operativi Lez. 14 File System: aspetti implementativi Layout disco Tutte le informazioni necessarie al file system per poter operare, sono memorizzate sul disco di boot MBR: settore 0 del disco,

Dettagli

FONDAMENTI DI INFORMATICA

FONDAMENTI DI INFORMATICA Università degli Studi di Cagliari Corsi di Laurea in Ingegneria Chimica e Ingegneria Meccanica FONDAMENTI DI INFORMATICA http://people.unica.it/gianlucamarcialis A.A. 2018/2019 Docente: Gian Luca Marcialis

Dettagli

Sistemi Operativi. Gianluca Della Vedova. Sistemi Operativi. Gianluca Della Vedova. Sistemi Operativi. Gianluca Della Vedova.

Sistemi Operativi. Gianluca Della Vedova. Sistemi Operativi. Gianluca Della Vedova. Sistemi Operativi. Gianluca Della Vedova. Programmi applicativi Un programma applicativo (o applicativo) è un eseguibile che può essere utilizzato dall utente e che ha funzionalità di alto livello (word processor, spreadsheet, DBMS) Univ. Milano-Bicocca

Dettagli

Università degli Studi di Padova Dipartimento di Matematica. - Corso di Laurea in Informatica

Università degli Studi di Padova Dipartimento di Matematica. - Corso di Laurea in Informatica Università degli Studi di Padova Dipartimento di Matematica. - Corso di Laurea in Informatica Regole dell'esame Il presente esame scritto deve essere svolto in forma individuale in un tempo massimo di

Dettagli

Fondamenti di Informatica

Fondamenti di Informatica Università Degli Studi di Ferrara Corso di Laurea in Scienze della Comunicazione - A.A. 2017-2018 Fondamenti di Informatica Lez. 01 - Concetti Hardware e Software Fondamenti di Informatica - Docente: Giacomo

Dettagli

Partizioni e File system. Fondamenti di informatica

Partizioni e File system. Fondamenti di informatica Partizioni e File system Fondamenti di informatica Master Boot Record Master Boot Record Codice di avvio del sistema operativo Descrizione del Disco (partition table) Partizioni Partizioni: trasformano

Dettagli

La memoria cache. Informatica generale

La memoria cache. Informatica generale La memoria cache Nello schema di funzionamento di un calcolatore il processore continuamente preleva informazioni ed istruzioni dalla memoria centrale e scrive in essa informazioni La memoria centrale,

Dettagli

Basi di Dati Parallele

Basi di Dati Parallele Basi di Dati Parallele Capitolo 3 Basi di dati Architetture e linee di evoluzione P. Atzeni, S. Ceri, P. Fraternali, S. Paraboschi, R. Torlone 1 Scalabilità delle applicazioni Carico insieme di tutte le

Dettagli

Architetture Client/Server. Un architettura è centralizzata quando i dati e le applicazioni (programmi) risiedono in un unico nodo elaborativo

Architetture Client/Server. Un architettura è centralizzata quando i dati e le applicazioni (programmi) risiedono in un unico nodo elaborativo Basi di Dati Architetture Client/Server D B M G Architettura centralizzata Un architettura è centralizzata quando i dati e le applicazioni (programmi) risiedono in un unico nodo elaborativo Tutta l intelligenza

Dettagli

Capitolo 2: Strutture dei sistemi di calcolo

Capitolo 2: Strutture dei sistemi di calcolo Capitolo 2: Strutture dei sistemi di calcolo Funzionamento di un sistema di calcolo Struttura di I/O Struttura della memoria Gerarchia delle memorie Architetture di protezione Struttura delle reti di calcolatori

Dettagli

Sistemi Operativi 1. Mattia Monga. a.a. 2012/13. Dip. di Informatica Università degli Studi di Milano, Italia

Sistemi Operativi 1. Mattia Monga. a.a. 2012/13. Dip. di Informatica Università degli Studi di Milano, Italia 1 Mattia Dip. di Informatica Università degli Studi di Milano, Italia mattia.monga@unimi.it a.a. 2012/13 1 cba 2011 13 M.. Creative Commons Attribuzione-Condividi allo stesso modo 3.0 Italia License. http://creativecommons.org/licenses/by-sa/3.0/it/.

Dettagli

memoria virtuale protezione

memoria virtuale protezione Memoria Virtuale Le memorie cache forniscono un accesso veloce ai blocchi di memoria usati più di recente La memoria virtuale fornisce un accesso veloce ai dati sulle memorie di massa usati più di recente.

Dettagli

Il sistema operativo

Il sistema operativo Il sistema operativo Vito Perrone Corso di Informatica A per Gestionali Indice Architettura Gestione dei processi Gestione della memoria centrale Driver Gestione dei file 2 1 Il sistema operativo E uno

Dettagli

Databases. Architettura di un DBMS: Struttura ad indice per i files, B + -Trees

Databases. Architettura di un DBMS: Struttura ad indice per i files, B + -Trees Databases Architettura di un DBMS: Struttura ad indice per i files, B + -Trees Indici Un indice consiste di coppie e supporta l efficiente recupero di tutte le etichette con chiave

Dettagli

12 Memoria secondaria Struttura del disco Struttura del disco

12 Memoria secondaria Struttura del disco Struttura del disco 1 12 Memoria secondaria Struttura del disco Scheduling del disco Gestione del disco Gestione dell area di swap Memorie a stato solido 12.1 Struttura del disco 2 Un HD è composto da una serie di dischi

Dettagli

Architetture Client/Server e World Wide Web

Architetture Client/Server e World Wide Web Basi di Dati Architetture Client/Server e World Wide Web Il World Wide Web Il web è una ragnatela (grafo) di contenuti (nodi) collegati tra loro attraverso collegamenti (link) I nodi sono documenti e/o

Dettagli

Com è fatto un computer (seconda puntata) Appunti per le classi 1 A cura del prof. Ing. Mario Catalano

Com è fatto un computer (seconda puntata) Appunti per le classi 1 A cura del prof. Ing. Mario Catalano Com è fatto un computer (seconda puntata) Appunti per le classi 1 A cura del prof. Ing. Mario Catalano A che serve una memoria? Ovviamente, nel computer, come nel cervello umano, serve a conservare le

Dettagli