Calcolatori Elettronici
|
|
- Adelaide Belli
- 5 anni fa
- Visualizzazioni
Transcript
1 Calcolatori Elettronici Memoria cache: Esercizi individuali proposti Massimiliano Giacomin
2 Esercizio 1: collocazione dei blocchi nella cache Sia data la seguente sequenza di indirizzi di byte a cui si intende fare accesso: 4, 16, 32, 20, 132, 264, 128, 224, 36, 44, 16, 172, 352, 24, 128 Sia data una cache con blocchi di 4 parole e una dimensione totale di 32 parole (ogni parola si compone di 4 byte) Determinare se ciascuno degli accessi è un hit o un miss assumendo che la cache sia inizialmente vuota, ipotizzando una cache set-associativa a 2 vie in cui viene adottata una politica LRU di sostituzione dei blocchi Assumendo indirizzi a 16 bit, determinare inoltre il numero di bit riservati all etichetta (tag), all insieme e all offset 2
3 Cache set-associativa a due vie Dimensione totale: 32 parole Blocchi di 4 parole 32/4 = 8 blocchi 2 vie: insiemi = #blocchi/2 = 4 insiemi Insieme 0 Insieme 1 Insieme 2 Insieme 3 Cache Blocco di 16 byte Indirizzo Etichetta Insieme 16-6= Offset 3
4 Cache set-associativa a due vie Indirizzi di byte 4, 16, 32, 20, 132, 264, 128, 224, 36, 44, 16, 172, 352, 24, 128 Indirizzi di blocco 0, 1, 2, 1, 8, 16, 8, 14, 2, 2, 1, 10, 22, 1, 8 Un blocco della memoria può andare in un blocco qualsiasi all interno dell insieme determinato a partire dal numero del blocco in memoria Insieme 0 Insieme 1 Insieme 2 Insieme 3 Indirizzo Cache Etichetta Insieme Offset Memoria 4
5 Cache set-associativa a due vie Indirizzi di blocco 0, 1, 2, 1, 8, 16, 8, 14, 2, 2, 1, 10, 22, 1, 8 Indice insieme = (indirizzo di blocco) modulo (numero insiemi in cache) 0, 1, 2, 1, 0, 0, 0, 2, 2, 2, 1, 2, 2, 1, 0 Insieme mem[0] mem[0] mem[0] mem[0] mem[0] mem[16] mem[16] mem[16] mem[8] mem[8] mem[8] mem[8] 1 mem[1] mem[1] mem[1] mem[1] mem[1] mem[1] mem[1] 2 mem[2] mem[2] mem[2] mem[2] mem[2] mem[2] mem[14] 3 miss miss miss hit miss miss hit miss 5
6 Cache set-associativa a due vie Indirizzi di blocco 0, 1, 2, 1, 8, 16, 8, 14, 2, 2, 1, 10, 22, 1, 8 Indice insieme = (indirizzo di blocco) modulo (numero insiemi in cache) 0, 1, 2, 1, 0, 0, 0, 2, 2, 2, 1, 2, 2, 1, 0 Insieme mem[16] mem[16] mem[16] mem[16] mem[16] mem[16] mem[16] mem[8] mem[8] mem[8] mem[8] mem[8] mem[8] mem[8] 1 mem[1] mem[1] mem[1] mem[1] mem[1] mem[1] mem[1] 2 mem[2] mem[2] mem[2] mem[2] mem[22] mem[22] mem[2] mem[14] mem[14] mem[14] mem[10] mem[10] mem[10] mem[10] 3 hit hit hit miss miss hit hit Risultato totale degli accessi alla cache = 8 miss e 7 hit 6
7 Esercizio 2: collocazione dei blocchi nella cache Risolvere l esercizio 1 nelle due ipotesi seguenti: 1) cache a corrispondenza diretta 2) cache totalmente associativa, ipotizzando una sostituzione LRU
8 Caso 1: cache a corrispondenza diretta Indirizzi di blocco 0, 1, 2, 1, 8, 16, 8, 14, 2, 2, 1, 10, 22, 1, 8 Blocco della cache 0, 1, 2, 1, 0, 0, 0, 6, 2, 2, 1, 2, 6, 1, 0 Cache Un blocco della memoria può andare in un solo blocco della cache Indirizzo blocco di 4 parole Etichetta Blocco Parola blocco di 4 parole Memoria
9 Caso 1: cache a corrispondenza diretta Indirizzi di blocco 0, 1, 2, 1, 8, 16, 8, 14, 2, 2, 1, 10, 22, 1, 8 blocco della cache = (numero blocco memoria) modulo (numero blocchi in cache) Blocco mem[0] mem[0] mem[0] mem[0] mem[8] mem[16] mem[8] mem[8] 1 mem[1] mem[1] mem[1] mem[1] mem[1] mem[1] mem[1] 2 mem[2] mem[2] mem[2] mem[2] mem[2] mem[2] mem[14] 7 miss miss miss hit miss miss miss miss
10 Caso 1: cache a corrispondenza diretta Indirizzi di blocco 0, 1, 2, 1, 8, 16, 8, 14, 2, 2, 1, 10, 22, 1, 8 blocco della cache = (numero blocco memoria) modulo (numero blocchi in cache) Blocco mem[8] mem[8] mem[8] mem[8] mem[8] mem[8] mem[8] 1 mem[1] mem[1] mem[1] mem[1] mem[1] mem[1] mem[1] 2 mem[2] mem[2] mem[2] mem[10] mem[10] mem[10] mem[2] mem[14] mem[14] mem[14] mem[14] mem[22] mem[22] mem[22] 7 hit hit hit miss miss hit hit Risultato totale degli accessi alla cache = 9 miss e 6 hit
11 Caso 2: cache completamente associativa Indirizzi di blocco 0, 1, 2, 1, 8, 16, 8, 14, 2, 2, 1, 10, 22, 1, 8 Cache 0 12 Memoria Un blocco della memoria può andare in qualsiasi blocco della cache Indirizzo blocco di 4 parole Etichetta Parola
12 Caso 2: cache completamente associativa Indirizzi di blocco 0, 1, 2, 1, 8, 16, 8, 14, 2, 2, 1, 10, 22, 1, 8 Blocco mem[0] mem[0] mem[0] mem[0] mem[0] mem[0] mem[0] mem[0] 1 mem[1] mem[1] mem[1] mem[1] mem[1] mem[1] mem[1] 2 mem[2] mem[2] mem[2] mem[2] mem[2] mem[2] 3 mem[8] mem[8] mem[8] mem[8] 4 mem[16] mem[16] mem[16] 5 mem[14] 6 7 miss miss miss hit miss miss hit miss
13 Caso 2: cache completamente associativa Indirizzi di blocco 0, 1, 2, 1, 8, 16, 8, 14, 2, 2, 1, 10, 22, 1, 8 Blocco mem[0] mem[0] mem[0] mem[0] mem[0] mem[0] mem[0] 1 mem[1] mem[1] mem[1] mem[1] mem[1] mem[1] mem[1] 2 mem[2] mem[2] mem[2] mem[2] mem[2] mem[2] mem[2] 3 mem[8] mem[8] mem[8] mem[8] mem[8] mem[8] mem[8] 4 mem[16] mem[16] mem[16] mem[16] mem[16] mem[16] mem[16] 5 mem[14] mem[14] mem[14] mem[14] mem[14] mem[14] mem[14] 6 mem[10] mem[10] mem[10] mem[10] 7 mem[22] mem[22] mem[22] hit hit hit miss miss hit hit Risultato totale degli accessi alla cache = 8 miss e 7 hit
14 Esercizio 3 Sia data una cache con: - 4K blocchi - ogni blocco ha 4 parole (da 4 byte ciascuna) - indirizzi di 32 bit Trovare il numero totale di bit per i tag nel caso di: - cache a corrispondenza diretta - cache set associativa a 4 vie - cache completamente associativa 14
15 Corrispondenza diretta: 4K = 2 12 blocchi TAG 12 bit 4 bit = bit 16 bit * 2 12 = 16*4 Kbit = 64 Kbit 15
16 Set associativa a 4 vie: 4K = 2 12 blocchi Þ 2 12 /4 = 2 10 insiemi TAG 10 bit 4 bit = bit 18 bit * 2 12 = 18*4 Kbit = 72 Kbit 16
17 Completamente associativa: 4K = 2 12 blocchi TAG 4 bit 32-4 = bit * 2 12 = 28*4 Kbit = 112 Kbit 17
18 Esercizio 4 Esercizio 8 del Tema d esame Calcolatori A del 25/3/2009 (soluzione disponibile sul sito)
19 Esercizio 5: miss di cache e prestazioni Si consideri un sistema dotato solamente di cache primaria (senza cache secondaria) distinta per i dati e le istruzioni. Per la cache si suppone: - una penalità di fallimento di 10 cicli di clock - una percentuale di successo del 95% per le istruzioni e del 90% per i dati Si suppone inoltre che il 40% delle istruzioni faccia accesso a dati in memoria. Si supponga che il carico sia tale che il CPI medio nel caso multiciclo risulti in assenza di miss di cache 4,04 Si calcolino il CPI effettivo ed il throughput per un processore multiciclo e per un processore con pipeline (in tal caso trascurando altre cause di stallo). Si confrontino le prestazioni delle due soluzioni progettuali.
20 Consideriamo il processore con pipeline Se avviene un fallimento di accesso alla cache (per i dati o le istruzioni) si ha un ritardo dell istruzione in cui si è verificato il fallimento: si ha un incremento dei cicli di clock pari alla penalità di fallimento di accesso alla cache (10 cicli) Dobbiamo considerare l incremento medio di CPI dovuto ai fallimenti di accesso alla cache, chiamiamo d miss questo incremento Per le istruzioni (tutte fanno il fetch): 95% percentuale di successo Per i dati: il 40% delle istruzioni faccia accesso a dati in memoria 90% percentuale di successo d miss = 0, ,4 0,1 10 = 0,9 cicli Cicli di stallo per le istruzioni Cicli di stallo per i dati Þ CPI effettivo (in assenza di altre cause di stallo): CPI = 1 + d miss = 1 + 0,9 = 1,9 Þ Throughput pipeline = 1/CPI = 1/1,9 = 0,53 istruzioni/ciclo
21 Consideriamo il processore multiciclo: In assenza di miss di cache avrei CPI = 4,04 Ma per le istruzioni che danno miss (a causa del fetch o dell accesso ai dati) si ha una penalità pari a quella del caso con pipeline: d miss = 0, ,4 0,1 10 = 0,9 cicli Þ CPI multiciclo = 4,04 + 0,9 = 4,94 Þ Throughput multiciclo = 1/CPI = 1/4,94 = 0,20 istruzioni/ciclo Quindi l incremento delle prestazioni nel caso con pipeline è 0,53/0,20 = 2,65 [Posso confrontare i throughput o, ugualmente, CPI o, ugualmente, i tempi di esecuzione: il risultato non cambia!]
22 Esercizio 6 Esercizio 2 del Tema d esame di Calcolatori B del 14 apr 2010 (NB: esercizio parzialmente già risolto nei lucidi precedenti sugli esercizi relativi alla criticità sui dati della pipeline) Soluzione δ MISS-CACHE = 0.2 * (0.9* *10) * 0.3 * (0.8* *10) = 1,268 f lw + f sw CPI = 1 + δ MISS-CACHE + δ DIP (vedi risoluzione parziale nei lucidi precedenti per il calcolo di δ DIP nei due casi richiesti) Risulta: CPI E = 2.37 CPI E+M = 2.35
23 Esercizio 7 Si consideri la CPU multiciclo usuale (istruzioni MIPS). Si assuma il seguente carico di lavoro: - Tipo-R 50 % - lw 20 % - sw 16 % - beq + j 14 % Si dispone di una cache con le seguenti caratteristiche: - f miss per le istruzioni: 2% - f miss per accesso ai dati: 4% - P miss = 100 cicli di clock Confrontare le prestazioni tra il caso reale ed il caso di cache ideale senza miss 23
24 Caso ideale CPI id = 0.2 * * * * 3 = 4.06 Caso reale CPI reale = CPI id + δ miss = * *0.04*100 = = 7.5 Dato che nei due casi T clock non cambia, nel caso ideale il processore sarebbe 7.5/4.06 = 1.85 volte più veloce 24
25 Esercizio 7 (continua) Si consideri la CPU multiciclo usuale (istruzioni MIPS). Si assuma il seguente carico di lavoro: - Tipo-R 50 % - lw 20 % - sw 16 % - salti 14 % Si dispone di una cache con le seguenti caratteristiche: - f miss per le istruzioni: 2% - f miss per accesso ai dati: 4% - P miss = 100 cicli di clock Si supponga raddoppiare la frequenza del processore: quale miglioramento in termini di prestazione si ottiene? COME PRIMA 25
26 Nel caso precedente: T es = I * 7.5 * T clock Raddoppiando la frequenza: P miss uguale in termini di tempo Þ raddoppia in termini di cicli CPI = * *0.04*200 = = T es = I * * T clock 7.5* = 1.37 volte più veloce 26
27 Commento Quanto più il processore è veloce (T clock o CPI bassi) tanto maggiore è l importanza della cache 27
28 Esercizio 8 [cfr. Es. 3, Tema d esame CALC-B del 6 aprile 06] Supponiamo di disporre sia della cache primaria sia della cache secondaria Per la cache primaria: - 95% percentuale di successo per istruzioni, 90% per i dati - Si supponga inoltre che per trasferire blocchi dalla cache secondaria alla cache primaria occorrano 4 cicli. - Penalità di fallimento (in assenza di cache secondaria): 10 cicli. Per la cache secondaria: - 94% la percentuale di successo per le istruzioni, 92% per i dati. Il carico di lavoro è tale che il 40% delle istruzioni fanno accesso ai dati in memoria (lw + sw) Calcolare CPI e Throughput per un processore con pipeline (trascurando altri stalli) 28
29 Soluzione Cicli di stallo per le istruzioni Cicli di stallo per i dati d miss = 0,05 (0, ,06 10) + 0,4 0,1 (0, ,08 10) = = 0,4 cicli Da cui, CPI = 1 + 0,4 = 1,4 Throughput = 1/1,4 = 0,71 istruzioni/ciclo 29
30 Nota all esercizio precedente: Si noti che l esercizio non specifica il tempo di trasferimento di un blocco da memoria DRAM alla cache secondaria. Bisogna quindi assumere la soluzione 2: quando si verifica un fallimento nella cache secondaria (necessariamente seguente a un fallimento nella cache primaria), la penalità di fallimento è pari a 10 cicli, ovvero quella della cache primaria: la cache primaria viene caricata parallelamente alla secondaria direttamente dalla DRAM, con la corrispondente penalità di 10 cicli (è il tempo necessario per portare il blocco mancante da DRAM a cache primaria) 30
Calcolatori Elettronici A a.a. 2008/2009
Calcolatori Elettronici A a.a. 2008/2009 Memoria cache: Esercizi Massimiliano Giacomin 1 Esercizio: miss della cache e collocazione dei blocchi nella cache Sia data la seguente sequenza di indirizzi a
DettagliArchitetture degli elaboratori
Architetture degli elaboratori Memoria cache: Esercizi tratti da Massimiliano Giacomin 1 Esercizio: miss della cache e collocazione dei blocchi nella cache Sia data la seguente sequenza di indirizzi a
DettagliCache associativa. Possibili alternative per il trasferimento di un blocco dalla memoria inferiore alla memoria superiore:
Cache associativa Possibili alternative per il trasferimento di un blocco dalla memoria inferiore alla memoria superiore: 1. Indirizzamento diretto (già visto). Ogni blocco della memoria inferiore può
DettagliCalcolatori Elettronici
Calcolatori Elettronici Gerarchia di memorie: memorie cache Massimiliano Giacomin 1 Semplice classificazione delle memorie Memorie a sola lettura (ROM, PROM, EPROM, EEPROM-Flash) Memorie volatili (RAM)
DettagliBlocchi di più parole
Blocchi di più parole Per trarre vantaggio dalla località spaziale non conviene avere blocchi di una sola parola ma blocchi di più parole che occupano nella memoria principale posizioni vicine. Esempio:
DettagliCalcolatori Elettronici B a.a. 2006/2007
Calcolatori Elettronici B a.a. 2006/2007 Pipeline, criticità e prestazioni: Esercizi Massimiliano Giacomin 1 Influenza delle criticità sulle prestazioni Tipi di criticità: criticità strutturale: ad esempio,
DettagliCALCOLATORI ELETTRONICI 25 giugno 2018
CALCOLATORI ELETTRONICI 25 giugno 2018 NOME: COGNOME: MATR: Scrivere chiaramente in caratteri maiuscoli a stampa 1. Si implementi per mezzo di porte logiche OR, AND, NOT la funzione combinatoria (a 3 ingressi
DettagliPRESTAZIONI. senza e con memoria cache
PRESTAZIONI del processore MIPS pipeline senza e con memoria cache Prestazioni del processore GENERICO (P&H pp 29 31) Definizioni dei parametri di prestazione fondamentali del processore: sia P una prova,
DettagliCALCOLATORI ELETTRONICI 30 agosto 2010
CALCOLATORI ELETTRONICI 30 agosto 2010 NOME: COGNOME: MATR: Scrivere chiaramente in caratteri maiuscoli a stampa 1. Si implementi per mezzo di porte logiche di AND, OR e NOT la funzione combinatoria (a
Dettagli8 bit per la parola nel blocco 10 bit per l insieme (gruppo) nella cache 12 bit di etichetta. Esercizio 3 Memoria Cache
Esercizio 3 Memoria Cache Prima parte - memoria di 1 Giga parole da 16 bit (indirizzata a livello di parola) - cache di 1 Mega parole da 16 bit (indirizzata a livello di parola) - ogni della cache contiene
DettagliEsercizio. Si consideri una cache con 64 blocchi di 16 byte ciascuno. A quale numero di blocco corrisponde l indirizzo 1200 espresso in byte?
Esempio MIPS 32 bit Indirizzo su 32 byte Cache ad accessi diretto Dimensioni della cache 2 n blocchi, di cui n bit usati per l indice dimensione del blocco di cache 2 m parole ossia 2 m+2 byte In questo
DettagliLezione di Tutorato Di Architettura degli Elaboratori B 29/04/2005. SOLUZIONI: Cache
SOLUZIONI: Cache INTRODUZIONE Gerarchie di memoria: CPU Gli elaboratori con architettura alla Von Neumann soffrono del problema del Von Neumann Bottleneck nell accesso alla memoria. Per ovviare a questo
DettagliEsercizi sulle prestazioni delle memorie cache
Esercizi sulle prestazioni delle memorie cache Prof. Alberto Borghese Dott. Massimo Marchi Dipartimento discienzedell Informazione dell alberto.borghese@unimi.it Università degli Studi di Milano A.A. 2012
DettagliCALCOLATORI ELETTRONICI 15 luglio 2014
CALCOLATORI ELETTRONICI 15 luglio 2014 NOME: COGNOME: MATR: Scrivere chiaramente in caratteri maiuscoli a stampa 1. Si disegni lo schema di un flip-flop master-slave sensibile ai fronti di salita e se
DettagliIntroduzione alle memorie cache. Sommario
Introduzione alle memorie cache Corso ACSO prof. Cristina SILVANO Politecnico di Milano Cristina Silvano, 0/0/200 Sommario Obiettivo Livelli della gerarchia di memoria Memoria cache: concetti base Architettura
DettagliCALCOLATORI ELETTRONICI 27 giugno 2017
CALCOLATORI ELETTRONICI 27 giugno 2017 NOME: COGNOME: MATR: Scrivere nome, cognome e matricola chiaramente in caratteri maiuscoli a stampa 1 Di seguito è riportato lo schema di una ALU a 32 bit in grado
Dettagli1) Un calcolatore con processore R3000 avente frequenza di clock pari a 2GHz esegue il seguente programma:
(versione riveduta da errori di stampa) MATRICOLA COGNOME NOME 1) Un calcolatore con processore R3000 avente frequenza di clock pari a 2GHz esegue il seguente programma:.text addi $12,$0,2 addi $10,$0,288
DettagliLe memorie Cache a mappatura diretta
Le memorie Cache a mappatura diretta Prof. Alberto Borghese Dipartimento di Scienze dell Informazione alberto.borghese@unimi.it Università degli Studi di Milano Riferimento Patterson: 5.2, 5.3 1/18 Sommario
DettagliCALCOLATORI ELETTRONICI 14 giugno 2010
CALCOLATORI ELETTRONICI 14 giugno 2010 NOME: COGNOME: MATR: Scrivere chiaramente in caratteri maiuscoli a stampa 1. Si implementi per mezzo di porte logiche di AND, OR e NOT la funzione combinatoria (a
DettagliGerarchia di Memorie
Gerarchia di Memorie Corso di Calcolatori Elettronici A 2007/2008 Sito Web:http://prometeo.ing.unibs.it/quarella Prof. G. Quarella prof@quarella.net Gerarchia di Memorie Obiettivo: creare l illusione di
DettagliCaching Andrea Gasparetto
Tutorato di architettura degli elaboratori Caching Andrea Gasparetto andrea.gasparetto@unive.it Esercizio 1 Dati una cache con 4096 blocchi, e con dimensione dell INDEX di 10 b, determinare il grado di
DettagliLe memorie Cache. Sommario
Le memorie Cache Prof. Alberto Borghese Dipartimento di Scienze dell Informazione borghese@dsi.unimi.it Università degli Studi di Milano Riferimento Patterson: 5.2, 5.3 1/30 Sommario Circuito di lettura
DettagliEsercitazione su Instruction Level Parallelism
Esercitazione su Instruction Level Parallelism Salvatore Orlando Arch. Elab. - S. Orlando 1 Pipeline con e senza forwarding Si considerino due processori MIPS (processore A e B) entrambi con pipeline a
DettagliEsercitazione su Gerarchie di Memoria
Esercitazione su Gerarchie di Memoria Introduzione Memoria o gerarchie di memoria: cache, memoria principale, memoria di massa etc. (con possibilità di fallimenti nell accesso) o organizzazione, dimensionamento,
DettagliArchitettura degli Elaboratori. Classe 3 Prof.ssa Anselmo. Appello del 18 Febbraio Attenzione:
Cognome.. Nome.... Architettura degli Elaboratori Classe 3 Prof.ssa Anselmo Appello del 18 Febbraio 2015 Attenzione: Inserire i propri dati nell apposito spazio sottostante e in testa a questa pagina.
DettagliPROVA SCRITTA DEL MODULO DI. 3 luglio 2018 NOME: COGNOME: MATRICOLA:
PROVA SCRITTA DEL MODULO DI 3 luglio 208 NOME: COGNOME: MATRICOLA: ESERCIZIO (8 punti) Si progetti una rete sequenziale in grado di riconoscere le sequenze 00 e 0. La rete è dotata di un unico ingresso
DettagliESERCIZIO 1 Si consideri la seguente funzione f (A, B, C, D) non completamente specificata definita attraverso il suo ON-SET e DC-SET:
Università degli Studi di Milano Corso Architettura degli elaboratori e delle reti Prof. Cristina Silvano A.A. 2004/2005 Esame scritto del 15 luglio 2005 Cognome: Matricola: Nome: Istruzioni Scrivere solo
DettagliCALCOLATORI ELETTRONICI 29 giugno 2015
CALCOLATORI ELETTRONICI 29 giugno 2015 NOME: COGNOME: MATR: Scrivere nome, cognome e matricola chiaramente in caratteri maiuscoli a stampa 1. Relativamente al confronto tra le implementazioni del processore
DettagliArchitettura dei sistemi di elaborazione: La memoria (parte 2)
Architettura dei sistemi di elaborazione: La memoria (parte 2) La cache è una memoria veloce e di piccole dimensioni posta fra la CPU e la memoria principale. Memoria Cache La cache e la memoria principale
DettagliCalcolatori Elettronici
Calcolatori Elettronici Tecniche Pipeline: Elementi di base Massimiliano Giacomin 1 Esecuzione delle istruzioni MIPS con multiciclo: rivisitazione - esame dell istruzione lw (la più complessa) - in rosso
DettagliPROVA SCRITTA DEL MODULO DI. CORSO DI LAUREA IN INGEGNERIA ELETTRICA ED ELETTRONICA, INGEGNERIA BIOMEDICA 14 febbraio 2017
PROVA SCRITTA DEL MODULO DI CORSO DI LAUREA IN INGEGNERIA ELETTRICA ED ELETTRONICA, INGEGNERIA BIOMEDICA 14 febbraio 2017 NOME: COGNOME: MATRICOLA: CFU: ESERCIZIO 1 (8 punti) Sulla base della rete logica
DettagliLa gerarchia di Memoria
La gerarchia di Memoria Calcolatori Elettronici 1 Gap delle prestazioni DRAM - CPU 1000 CPU 100 10 DRAM 1 1980 1981 1982 1983 1984 1985 1986 1987 1988 1989 1990 1991 1992 1993 1994 1995 1996 1997 1998
DettagliLe memorie Cache. Sommario
Le memorie Cache Prof. Alberto Borghese Dipartimento di Scienze dell Informazione alberto.borghese@unimi.it Università degli Studi di Milano Riferimento Patterson: 5.2, 5.3 1/36 Sommario Circuito di lettura
DettagliInstruction Level Parallelism Andrea Gasparetto
Tutorato di architettura degli elaboratori Instruction Level Parallelism Andrea Gasparetto andrea.gasparetto@unive.it IF: Instruction Fetch (memoria istruzioni) ID: Instruction decode e lettura registri
DettagliEsercizi svolti sulle cache - Soluzioni
Esercizi svolti sulle cache - Soluzioni 1. Si progetti una cache di 16K a 8 vie per un sistema con indirizzamento al byte di 32bit, bus dati a 32 bit, bus indirizzi a 30bit, e word di 4 byte. In quale
DettagliCALCOLATORI ELETTRONICI 9 settembre 2011
CALCOLATORI ELETTRONICI 9 settembre 2011 NOME: COGNOME: MATR: Scrivere chiaramente in caratteri maiuscoli a stampa 1. Si implementi per mezzo di porte logiche AND, OR e NOT la funzione combinatoria (a
DettagliGli attori principali di un architettura
Memoria Architettura degli Elaboratori e delle Reti, Turno I Alberto Borghese Università degli Studi di Milano Dipartimento di Scienze dell Informazione email: borghese@dsi.unimi.it Gli attori principali
DettagliLa gerarchia di Memoria
La gerarchia di Memoria Gap delle prestazioni DRAM - CPU 1000 CPU 100 10 DRAM 1 1980 1981 1982 1983 1984 1985 1986 1987 1988 1989 1990 1991 1992 1993 1994 1995 1996 1997 1998 1999 2000 1 Località ed Organizzazione
DettagliESERCITAZIONE SULLA VALUTAZIONE DELLE PRESTAZIONI (5 giugno 2006) Esercizio 1 (Tratto dai lucidi sulla Valutazione delle prestazioni)
ESERCITAZIONE SULLA VALUTAZIONE DELLE PRESTAZIONI (5 giugno 2006) Esercizio 1 (Tratto dai lucidi sulla Valutazione delle prestazioni) Un programma resta in esecuzione per 1 sec, su un processore dotato
DettagliEsame di Architetture Canale AL Prof. Sterbini 8/7/13 Compito A
Esame di Architetture Canale AL Prof. Sterbini 8/7/13 Compito A Cognome e Nome: Matricola: Parte 1 (per chi non ha superato l'esonero 1 ora) Esercizio 1A. Si ha il dubbio che in una partita di CPU a ciclo
DettagliArchitettura degli Elaboratori. Classe 3 Prof.ssa Anselmo. Pre-appello del 14 Gennaio Attenzione:
Cognome.. Nome.... Architettura degli Elaboratori Classe 3 Prof.ssa Anselmo Pre-appello del 14 Gennaio 2015 Attenzione: Inserire i propri dati nell apposito spazio sottostante e in testa a questa pagina.
DettagliLa gerarchia di Memoria. Calcolatori Elettronici
La gerarchia di Memoria 1 Gap delle prestazioni DRAM - CPU 1000 CPU 100 10 D R A M 1 1980 1981 1982 1983 1984 1985 1986 1987 1988 1989 1990 1991 1992 1993 1994 1995 1996 1997 1998 1999 2000 2 Località
DettagliEsercitazione su Gerarchie di Memoria
Esercitazione su Gerarchie di Memoria Introduzione Memoria o gerarchie di memoria: cache, memoria principale, memoria di massa etc. (con possibilità di fallimenti nell accesso) o organizzazione, dimensionamento,
DettagliPROVA SCRITTA DEL CORSO DI. Corso di Laurea in Ingegneria Biomedica, Ingegneria Elettrica ed Elettronica 17 Luglio 2014
PROVA SCRITTA DEL CORSO DI Corso di Laurea in Ingegneria Biomedica, Ingegneria Elettrica ed Elettronica 7 Luglio 204 NOME: COGNOME: MATRICOLA: ESERCIZIO (8 punti) ) ( punti) Progettare un MUX 4-, utilizzando
DettagliCalcolatori Elettronici
Calcolatori Elettronici La memoria gerarchica La cache: come migliorare le prestazioni Ricapitolando (1) La memoria principale e la cache sono scomposte in blocchi di uguale dimensione L indirizzo del
DettagliMiglioramento delle prestazioni
Miglioramento delle prestazioni Migliorare sia larghezza di banda sia latenza: uso di cache multiple Introdurre una cache separata per istruzioni e dati (split cache) Beneficio: Le operazioni di lettura/scrittura
DettagliLa gerarchia di Memoria
La gerarchia di Memoria Gap delle prestazioni DRAM - CPU 1000 CPU 100 10 DRAM 1 1980 1981 1982 1983 1984 1985 1986 1987 1988 1989 1990 1991 1992 1993 1994 1995 1996 1997 1998 1999 2000 Località ed Organizzazione
DettagliArchitettura degli Elaboratori. Classe 3 Prof.ssa Anselmo. Appello dell 11 Settembre Attenzione:
Cognome.. Nome.... Architettura degli Elaboratori Classe 3 Prof.ssa Anselmo Appello dell 11 Settembre 2015 Attenzione: Inserire i propri dati nell apposito spazio sottostante e in testa a questa pagina.
DettagliCALCOLATORI ELETTRONICI 9 gennaio 2013
CALCOLATORI ELETTRONICI 9 gennaio 2013 NOME: COGNOME: MATR: Scrivere chiaramente in caratteri maiuscoli a stampa 1. Si implementi per mezzo di porte logiche di AND, OR e NOT la funzione combinatoria (a
DettagliArchitettura degli Elaboratori. Classe 3 Prof.ssa Anselmo. Appello del 20 Giugno Attenzione:
Cognome.. Nome.... Architettura degli Elaboratori Classe 3 Prof.ssa Anselmo Appello del 20 Giugno 2016 Attenzione: Inserire i propri dati nell apposito spazio sottostante e in testa a questa pagina. Preparare
DettagliCALCOLATORI ELETTRONICI 27 marzo 2018
CALCOLATORI ELETTRONICI 27 marzo 2018 NOME: COGNOME: MATR: Scrivere chiaramente in caratteri maiuscoli a stampa 1. Si implementi per mezzo di porte logiche di AND, OR e NOT la funzione combinatoria (a
DettagliIntroduzione alle memorie cache. Cristina Silvano, 06/01/2013 versione 2 1
Introduzione alle memorie cache Corso ACSO prof. Cristina SILVANO Politecnico di Milano Cristina Silvano, 06/01/2013 versione 2 1 Obiettivo Sommario Livelli della gerarchia di memoria Memoria cache: concetti
DettagliPROVA SCRITTA DEL CORSO DI CALCOLATORI ELETTRONICI 19 Febbraio 2013
PROVA SCRITTA DEL CORSO DI CALCOLATORI ELETTRONICI 19 Febbraio 2013 NOME: COGNOME: MATRICOLA: ESERCIZIO 1 (10 punti) Si consideri un calcolatore che dispone di una memoria principale di 256 Mbyte e di
DettagliLezione di Tutorato Di Architettura degli Elaboratori B 18/05/2005 SOLUZIONI: PIPELINE
SOLUZIONI: PIPELINE Consegna per le domande del compito: (da 3 a 5 domande) Rispondere alle seguenti domande in maniera sintetica, usando il presente foglio per scrivere le risposte. Non è possibile consultare
DettagliSOLUZIONI DELLA PROVA SCRITTA DEL CORSO DI. NUOVO E VECCHIO ORDINAMENTO DIDATTICO 13 Luglio 2004
SOLUZIONI DELLA PROVA SCRITTA DEL CORSO DI NUOVO E VECCHIO ORDINAMENTO DIDATTICO 13 Luglio 2004 MOTIVARE IN MANIERA CHIARA LE SOLUZIONI PROPOSTE A CIASCUNO DEGLI ESERCIZI SVOLTI ESERCIZIO 1 (9 punti) Si
DettagliAXO Architettura dei Calcolatori e Sistemi Operativi
Politecnico di Milano Dipartimento di Elettronica e Informazione prof.ssa Anna Antola prof. Luca Breveglieri prof. Roberto Negrini prof. Giuseppe Pelagatti prof.ssa Donatella Sciuto prof.ssa Cristina Silvano
DettagliSOLUZIONI DELLA PROVA SCRITTA DEL CORSO DI. NUOVO E VECCHIO ORDINAMENTO DIDATTICO 14 Febbraio 2007
SOLUZIONI DELLA PROVA SCRITTA DEL CORSO DI NUOVO E VECCHIO ORDINAMENTO DIDATTICO 4 Febbraio 2007 MOTIVARE IN MANIERA CHIARA LE SOLUZIONI PROPOSTE A CIASCUNO DEGLI ESERCIZI SVOLTI ESERCIZIO (8 punti) (a)
DettagliEsercizi sulla memoria cache - Informatica 2 - L. Breveglieri 1
Esercizio 1 Sia data una memoria cache di tipo a indirizzamento diretto (direct-mapped), con blocchi di dimensioni pari a una sola parola per blocco, e contenente. La parola è lunga 16 bit, e la memoria
DettagliESERCIZIO 1. Sia dato il seguente ciclo di un programma in linguaggio ad alto livello:
ESERIZIO 1 Sia dato il seguente ciclo di un programma in linguaggio ad alto livello: do { BASE[i] = BASEA[i] + BASEB[i] + IN1 + IN2; i++; } while (i!= N) Il programma sia stato compilato nel seguente codice
DettagliEsercizi vari Salvatore Orlando
Esercizi vari Salvatore Orlando Arch. Elab. - S. Orlando 1 Domande Per quali istruzioni MIPS viene impiegata la modalità di indirizzamento PCrelative, e quali sono le motivazioni che hanno portato i progettisti
DettagliCorso di laurea in Ingegneria Biomedica, Elettrica, Elettronica ed Informatica
Tutorato di Prima Prova Scritta 23 aprile 2013 Ing. Roberto Casula Ing. Rita Delussu casula.roberto103@hotmail.it rita.delussu2016@gmail.com Corso di laurea in Ingegneria Biomedica, Elettrica, Elettronica
DettagliProblemi del ciclo singolo
Problemi del ciclo singolo Ciclo di clock lungo Istruzioni potenzialmente veloci sono rallentate Impiegano sempre lo stesso tempo dell istruzione più lenta Unità funzionale e collegamenti della parte operativa
DettagliPROVA SCRITTA DEL MODULO DI NOME: COGNOME: MATRICOLA:
PROVA SCRITTA DEL MODULO DI CORSO DI LAUREA IN INGEGNERIA ELETTRICA ED ELETTRONICA, INGEGNERIA BIOMEDICA - 6 CFU Settembre 204 NOME: COGNOME: MATRICOLA: ESERCIZIO RETI LOGICHE (0 punti) Si vuole implementare
DettagliLa struttura gerarchica delle memorie
Architettura degli Elaboratori e delle Reti Lezione 27 La struttura gerarchica delle memorie Proff. A. Borghese, F. Pedersini Dipartimento di Scienze dell Informazione Università degli Studi di Milano
DettagliStruttura delle memorie cache
Architettura degli Elaboratori e delle Reti Lezione 28 Struttura delle memorie cache Proff. A. Borghese, F. Pedersini Dipartimento di Scienze dell Informazione Università degli Studi di Milano L 28 1/30
DettagliPrestazioni & Co: CPU, Memoria, I/O
Prestazioni & Co: CPU, Memoria, I/O CPU - progettazione - prestazioni ideali Panoramica Memoria - gerarchie di memoria: cache, memoria principale, etc. - organizzazione, dimensionamento, indirizzamento,
DettagliMemorie Caratteristiche principali
Memorie Caratteristiche principali Locazione: processore, interna (principale), esterna (secondaria) Capacità: dimensione parola, numero di parole Unità di trasferimento: parola, blocco Metodo di accesso:
DettagliPROVA SCRITTA DEL MODULO DI. 13 giugno 2017 NOME: COGNOME: MATRICOLA:
PROVA SCRITTA DEL MODULO DI 13 giugno 2017 NOME: COGNOME: MATRICOLA: ESERCIZIO 1 (7 punti) Progettare una rete logica ad un ingresso X e ad un uscita Z che sia posta ad 1 al riconoscimento della sequenza
DettagliEsercitazione del 19/05/ Soluzioni
Esercitazione del 9/5/5 - Soluzioni Una CPU moderna ha una velocità di esecuzione delle istruzioni generalmente molto più alta della capacità di fornire dati delle memorie DRAM. In generale possiamo dire
DettagliEsame di Architetture Canale MZ Prof. Sterbini 21/7/14
Esame di Architetture Canale MZ Prof. Sterbini 21/7/14 Cognome e Nome: Matricola: Parte 1 (per chi non ha superato l'esonero 1 ora) Esercizio 1 (14 punti). In una partita di CPU a ciclo di clock singolo
DettagliIntroduzione alle gerarchie di memoria
Introduzione alle gerarchie di memoria 1 Un ripasso Circuito sequenziale Segnale di clock Circuito sincrono Temporizzazione sensibile ai fronti Latch tipo S-R Latch tipo D Flip-flop tipo D Register file
DettagliPROVA SCRITTA DEL MODULO DI. 17 giugno 2015 NOME: COGNOME: MATRICOLA: CFU:
PROVA SCRITTA DEL MODULO DI 7 giugno 205 NOME: COGNOME: MATRICOLA: CFU: ESERCIZIO (7 punti) (4 punti) Prima parte. Progettare una rete logica combinatoria che effettui la somma di tutti i valori di numeri
Dettaglistatic dynamic random access memory
LA MEMORIA SRAM e D R A M static dynamic random access memory SRAM: unità che memorizza un gran numero di parole in un insieme di flip-flop, opportunamente connessi, mediante un sistema di indirizzamento
DettagliPROVA SCRITTA DEL MODULO INTEGRATO E DEL CORSO DI NOME: COGNOME: MATRICOLA: CFU:
PROVA SCRITTA DEL MODULO INTEGRATO E DEL CORSO DI CORSO DI LAUREA IN INGEGNERIA ELETTRONICA 5/7 CFU CORSO DI LAUREA IN INGEGNERIA ELETTRICA ED ELETTRONICA, INGEGNERIA BIOMEDICA - 6 CFU 12 Giugno 2013 NOME:
DettagliEsame di Architetture Canale AL Prof. Sterbini 10/6/16 Compito A Cognome e Nome: Matricola:
Esame di Architetture Canale AL Prof. Sterbini 10/6/16 Compito A Cognome e Nome: Matricola: Parte 1 (per chi non ha superato l'esonero) Esercizio 1A. Si ha il dubbio che in una partita di CPU a ciclo di
DettagliLa memoria cache. Lab di Calcolatori
La memoria cache 1 Gap delle prestazioni DRAM - CPU 1000 CPU- DRAM Gap CPU Proc 60%/yr. (2X/1.5yr) 100 10 ProcessorMemory Performance Gap: (grows 50% / year) D R A M DRAM9%/yr.(2X/10 yrs) 1 1980 1981 1982
DettagliValutazione delle Prestazioni Barbara Masucci
Architettura degli Elaboratori Valutazione delle Prestazioni Barbara Masucci Punto della situazione Ø Abbiamo studiato Ø Una prima implementazione hardware (a ciclo singolo) di un sottoinsieme dell IS
DettagliNome Cognome, Numero Matricola: Durata Esame: 30 min
Nome Cognome, Numero Matricola: Grader per Esame: Architetture 2 - Canale A-L - 13.07.2011 Enrico Tronci Dip. di Informatica, Università di Roma La Sapienza, Via Salaria 113, Roma, Italy tronci@di.uniroma1.it,
DettagliEsercitazione su Instruction Level Parallelism Salvatore Orlando
Esercitazione su Instruction Level Parallelism Salvatore Orlando Arch. Elab. - S. Orlando 1 Pipeline con e senza forwarding Si considerino due processori MIPS (processore A e B) entrambi con pipeline a
DettagliLezioni 5 e 6i. Esercizi Cache
Esercizi Cache Es1: Si consideri una cache di 4KB con associazione a gruppi a 8 vie ( 8-way set associative) in congiunzione con una memoria centrale di 1MB. Supponendo che un blocco sia di dimensione
DettagliCorso di laurea in ingegneria informatica Esame di sistemi operativi 21 gennaio 2009 SOLUZIONI
Corso di laurea in ingegneria informatica Esame di sistemi operativi 21 gennaio 2009 SOLUZIONI 1. Si consideri il programma C seguente (gli #include necessari sono omessi): / programma principale / 1.
DettagliEsame di Architetture Canale AL Prof. Sterbini 17/6/13 Compito A
Esame di Architetture Canale AL Prof. Sterbini 17/6/13 Compito A Parte 1 (per chi non ha superato l'esonero) Esercizio 1A. Si ha il dubbio che in una partita di CPU a ciclo di clock singolo (vedi sul retro)
DettagliPROVA SCRITTA DEL CORSO DI. NUOVO E VECCHIO ORDINAMENTO DIDATTICO (5-6-7 CFU) 16 Gennaio 2014
PROVA SCRITTA DEL CORSO DI NUOVO E VECCHIO ORDINAMENTO DIDATTICO (5-6-7 CFU) 16 Gennaio 2014 NOME: COGNOME: MATRICOLA: ESERCIZIO 1 (5-6 CFU: 9 punti 7 CFU: 8 punti) Analizzare la seguente rete logica sequenziale
DettagliArchitettura degli elaboratori - 2 -
Università degli Studi dell Insubria Dipartimento di Scienze Teoriche e Applicate Architettura degli elaboratori e gerarchie di memoria Marco Tarini Dipartimento di Scienze Teoriche e Applicate marco.tarini@uninsubria.it
DettagliPrestazioni delle cache
Prestazioni delle cache Tempo di CPU: somma di (Cicli di esecuzione CPU) x (periodo di clock) (Cicli di stallo causati dalla memoria) x (periodo di clock) Costo di hit trascurabile Cicli di stallo in memoria
DettagliLe memorie Cache a mappatura diretta e associative
Le memorie Cache a mappatura diretta e associative Prof. Alberto Borghese Dipartimento di Scienze dell Informazione alberto.borghese@unimi.it Università degli Studi di Milano Riferimento Patterson: 5.2,
DettagliPROVA SCRITTA DEL MODULO DI. 16 gennaio 2017
PROVA SCRITTA DEL MODULO DI 16 gennaio 2017 NOME: COGNOME: MATRICOLA: ESERCIZIO 1 (4 punti) Descrivere la tabella di verità e le caratteristiche di un flip flop JK, disegnando il circuito completo visto
Dettagli31!30!29!28!27!26!25!24!23!22!21!20!19!18!17!16!15!14!13!12!11!10! 9! 8! 7! 6! 5! 4! 3! 2! 1! 0! !
ESERCIZIO 1A Si consideri il seguente programma (accanto ad ogni istruzione è riportata la rappresentazione in binario): sw $s0, 40($s1) 101011 10001 10000 0000000000101000 lw $t0, 40($s1) 100011 10001
DettagliArchitettura degli Elaboratori. Classe 3 Prof.ssa Anselmo. Pre-appello del 17 Gennaio Attenzione:
Cognome... Nome.. Architettura degli Elaboratori Classe 3 Prof.ssa Anselmo Pre-appello del 17 Gennaio 2014 Attenzione: Inserire i propri dati nell apposito spazio sottostante e in testa a questa pagina.
DettagliCALCOLATORI ELETTRONICI A 25 gennaio 2011
CALCOLATORI ELETTRONICI A 25 gennaio 2011 NOME: COGNOME: MATR: Scrivere chiaramente in caratteri maiuscoli a stampa 1. Supponendo di avere a disposizione dei sommatori full adder (3 ingressi e due uscite)
DettagliArchitettura degli Elaboratori. Classe 3 Prof.ssa Anselmo. Appello del 19 Febbraio Attenzione:
Cognome.. Nome.... Architettura degli Elaboratori Classe 3 Prof.ssa Anselmo Appello del 19 Febbraio 2016 Attenzione: Inserire i propri dati nell apposito spazio sottostante e in testa a questa pagina.
DettagliMOTIVARE IN MANIERA CHIARA LE SOLUZIONI PROPOSTE A CIASCUNO DEGLI ESERCIZI SVOLTI
SOLUZIONI DELLA PROVA SCRITTA DEL CORSO DI NUOVO E VECCHIO ORDINAMENTO DIDATTICO 12 Luglio 2002 MOTIVARE IN MANIERA CHIARA LE SOLUZIONI PROPOSTE A CIASCUNO DEGLI ESERCIZI SVOLTI ESERCIZIO 1 (NO: 10 punti
DettagliUniversità degli Studi di Cassino
Corso di Cache Anno Accademico Francesco Tortorella La cache nella gerarchia di memoria D. Patterson, 2011 4 decisioni da prendere CPU CACHE MEM 1. Dove posizionare un blocco? 2. Come reperire un blocco?
DettagliEsame di Architetture Canale AL Prof. Sterbini 1/7/16 Compito A Cognome e Nome: Matricola:
Esame di Architetture Canale AL Prof. Sterbini 1/7/16 Compito A Cognome e Nome: Matricola: Parte 1 (per chi non ha superato l'esonero) Esercizio 1A. Si ha il dubbio che in una partita di CPU a ciclo di
DettagliVon Neumann Bottleneck
Von Neumann Bottleneck Gerarchia di memoria Struttura della Gerarchia Al livello 1 poniamo la memoria più veloce (piccola e costosa) Al livello n poniamo la memoria più lenta (grande ed economica) Scopo
DettagliPROVA SCRITTA DEL MODULO/CORSO DI. 24 novembre 2016
PROVA SCRITTA DEL MODULO/CORSO DI 24 novembre 206 MOTIVARE IN MANIERA CHIARA LE SOLUZIONI PROPOSTE A CIASCUNO DEGLI ESERCIZI SVOLTI NOME: COGNOME: MATRICOLA: ESERCIZIO (6 punti) Progettare un riconoscitore
Dettagli