Valutazione delle prestazioni

Documenti analoghi
La Valutazione delle Prestazioni

Valutazione delle prestazioni

Valutazione delle prestazioni

Valutazione delle prestazioni

Cicli di clock e istruzioni

L'architettura del processore MIPS

Soluzione Esercizio 1

Il modello di von Neumann

Il Processore. Informatica di Base -- R.Gaeta 27

Fondamenti di informatica: un po di storia

Architettura hardware

Architettura dei calcolatori

Sintesi Calcolatori Elettronici

Mari, Buonanno, Sciuto Informatica e cultura dell informazione McGraw-Hill

PRESTAZIONI. senza e con memoria cache

G L O S S A R I O. Fondamenti di Informatica I - Università degli Studi di Trento Dott. Roberti Pierluigi

Fondamenti di informatica: un po di storia

Valutazione delle Prestazioni. Valutazione delle Prestazioni. Architetture dei Calcolatori (Lettere. Tempo di risposta e throughput

Processore. Memoria I/O. Control (Parte di controllo) Datapath (Parte operativa)

Capitolo 7: Input/Output. Es.1 - Bus sincrono. Es.1 - Risposta (a)

La memoria principale

Architettura degli Elaboratori

Il processore. Istituzionii di Informatica -- Rossano Gaeta

Richiami sull architettura del processore MIPS a 32 bit

Implementazione semplificata

Criteri di caratterizzazione di una memoria

Linguaggi, compilatori e interpreti

ARCHITETTURA elementi di base

L insieme delle istruzioni (6)

Prestazioni & Co: CPU, Memoria, I/O

Lezione4: MIPS e Istruzioni (1 Parte)

Il Processore: l unità di controllo

Richiami sull architettura del processore MIPS a 32 bit

FALSO FALSO VERO FALSO VERO VERO VERO VERO

Unità Aritmetico-Logica

Porte Input/Output (I/O Connectors)

Dischi: Esercizio 1. Ora t.elab = n.cicli impiegati / Frequenza = / ( ) = 20ms

NOZIONI BASE DEL PROCESSORE (CPU)

Il modello di Von Neumann

Caratteristiche di un PC

DEFINIZIONE. particolare l'unità di elaborazione centrale è una tipologia di

Informatica Applicata - Architetture degli elaboratori. Parte 4 CPU. Facoltà di Scienze MM FF NN Università di Urbino A.A.

Componenti di un processore

Architettura di un calcolatore e linguaggio macchina. Primo modulo Tecniche della programmazione

INGEGNERIA E TECNOLOGIE DEI SISTEMI DI CONTROLLO Processori per sistemi di controllo

LEZIONE 2 Il processore e la memoria centrale

Architettura dei calcolatori

Transcript:

Valutazione delle prestazioni Trend tecnologico: Capacità della Memoria Capacità chip DRAM DRAM Year Size 1980 64 Kb 1983 256 Kb 1986 1 Mb 1989 4 Mb 1992 16 Mb 1996 64 Mb 1999 256 Mb 2002 1 Gb Incremento 1,4 per anno 4000X dal 1980 1

Transistors Trend tecnologico: Densità Microprocessori 100000000 10000000 1000000 up-name R10000 Pentium R4400 i80486 100000 10000 i8086 i80386 i80286 R3010 SU MIPS i80x86 M68K MIPS Alpha 2X transistor/chip ogni 1,5 anni i4004 1000 1965 1970 1975 1980 1985 1990 1995 2000 2005 Trend tecnologici Processore Densità Logica: circa 30% per anno Frequenza Clock : circa 20% per anno Memoria Capacità DRAM capacity: circa 60% per anno Velocità Memoria: circa10% per anno Costo per bit: riduzione di circa il 25% per anno Dischi Capacità: circa 60% per anno Larghezza di banda della rete: Aumenta di più del 100% per anno! 2

SPECint rating Trend delle prestazioni 400 350 300 250 200 150 100 50 0 1984 1986 1988 1990 1992 1994 Year Approccio quantitativo L incremento delle prestazioni è superiore a quello tecnologico. Ciò è stato possibile per l affermazione di un nuovo approccio nella progettazione: approccio quantitativo ovvero basato su misure. Principio da seguire nella progettazione: Rendere veloce il caso più frequente 3

Approccio quantitativo Una diretta conseguenza di questo nuovo approccio è il passaggio da calcolatori con un numero elevato di istruzioni anche molto complesse (approccio CISC), a calcolatori con un ridotto insieme di istruzioni (approccio RISC) Da misure sul comportamento dei programmi si è visto che: l'80% delle istruzioni eseguite corrispondeva al solo 20% del repertorio. conviene investire nella riduzione dei tempi di esecuzione di quel 20%, anziché aggiungere raffinate istruzioni, quasi mai usate, ma responsabili dell'allungamento del tempo di ciclo di macchina conviene costruire processori molto veloci, necessariamente con repertori semplici, e contare sull ottimizzazione del compilatore Indici prestazionali Tempo di risposta (o tempo di esecuzione o latenza) Tempo tra l'inizio e il completamento di un lavoro o compito elaborativo Durata dell esecuzione del mio programma Attesa per l accesso ad un sito web Throughput Ammontare complessivo di lavoro svolto in un dato tempo Numero di programmi eseguiti nell unità di tempo Numero di lavori (job, transazioni, interrogazioni a basi di dati) svolti nell unità di tempo Numero di programmi eseguibili da una macchina contemporaneamente 4

Il tempo di CPU Il tempo è la misura delle prestazioni di un computer Il computer che svolge la stessa quantità di lavoro nel minore tempo è il più veloce Tempo di risposta rappresenta la latenza per il completamento di un lavoro Includendo accessi a disco, accessi a memoria, attività di I/O Tempo di CPU rappresenta il tempo speso dalla CPU per eseguire il programma dato Non include il tempo di attesa per I/O o per l'esecuzione di altri programmi Comprende il tempo utente di CPU (tempo speso dalla CPU per eseguire le linee di codice che stanno nel nostro programma) + tempo di CPU di sistema (speso dal sistema operativo per eseguire i compiti richiesti dal programma) Tempo di CPU Tempo di CPU cicli di clock della CPU durata periodo di clock Tempo di CPU cicli di clock della CPU frequenza diclock 5

Cicli di clock per Istruzione (CPI) In genere, istruzioni di tipo diverso richiedono quantità diverse di tempo La moltiplicazione richiede più tempo dell addizione L accesso alla memoria richiede più tempo dell accesso ai registri Fissata la durata del ciclo di clock, varia il numero di cicli di clock richiesti dalle diverse istruzioni Si può calcolare il numero medio di cicli di clock per istruzione di un dato programma ciclidiclock della CPUper eseguireilprogramma CPI numero di istruzionieseguite Tempo di CPU Indicati con: N ist, il numero di istruzioni eseguite; CPI, il numero medio di cicli di clock per istruzione; T, il periodo del clock; F, la frequenza T CPU = N ist * CPI/f = N ist * CPI * T 6

Tempo di CPU: N ist T CPU = N ist * CPI/f = N ist * CPI * T N ist dipende dal repertorio di istruzioni e dal grado di ottimizzazione del compilatore. Compilatori diversi possono dare luogo a N ist diversi Uno stesso compilatore che genera codice per due macchine diverse, darà N ist diversi Un repertorio CISC favorisce la riduzione del numero di istruzioni Tempo di CPU: la frequenza f T CPU = N ist * CPI/f = N ist * CPI * T f (T) è legata alla tecnologia e all'organizzazione architetturale della CPU Oggi 1500 3000 MHz sono la norma Istruzioni complesse richiedono di norma frequenze di più basse Istruzioni semplici (RISC) permettono di diminuire i ritardi di propagazione nella logica di controllo e, quindi, di diminuire l'ampiezza del periodo di clock. 7

Tempo di CPU: il CPI T CPU = N ist * CPI/f = N ist * CPI * T CPI dipende dall'architettura e dal repertorio delle istruzioni Istruzioni semplici richiedono un minor numero di cicli. Attraverso tecniche come la pipeline è possibile portare CPI ad un valore molto vicino ad 1. L'aggiunta di più unità di esecuzione in parallello (macchine superscalari) permette di rendere CPI minore di 1. Tempo di CPU Se indichiamo con: N i, il numero di volte in cui l istruzione I i viene eseguita in un programma, CPI i, il numero di cicli di clock richiesto della I i n, numero di istruzioni diverse eseguite avremo: n ciclidiclock della CPU CPI i N i i 1 Questa formula può essere usata per esprimere il tempo di CPU come n n N i TCPU CPIi Ni T Nist * CPIi i 1 i 1 N ist T 8

Tempo di CPU Indicato con - f i = N i / N ist otterremo: T CPU CPI N n CPIi fi i 1 ist * n i 1 CPI f i i T Esempio Si consideri un calcolatore in grado di eseguire le istruzioni riportate in tabella. Calcolare CPI e il tempo di CPU per eseguire un programma composto da 100 istruzioni supponendo di usare una frequenza di clock pari a 500 MHz. Soluzione Tipo Frequenza CPI i ALU 43% 1 Load 21% 4 Store 12% 4 Branch 12% 2 Jump 12% 2 CPI = 1*0.43 + 4*0.21 + 4*0.12 + 2*0.12 + 2*0.12 = 2.23 T CPU = IC * CPI / f CK = 100 * 2.23 * 1/(500*10 6 ) = 446 ns 9

Misura delle prestazioni T CPU =N IST *CPI*T Processore1: N IST1 = N; CPI 1 =3; T 1 =T Processore2: N IST2 = 2,5N; CPI 2 =2; T 2 =T/2 T CPU1 =N IST1 *CPI 1 *T 1 =N*3*T T CPU2 =N IST2 *CPI 2 *T 2 =2,5N*2*T/2=2,5*N*T T CPU1 >T CPU2 Misura delle prestazioni T CPU =N IST *CPI*T Processore1: N IST1 =N; CPI 1 =10; T 1 =T/4 Processore2: N IST1 =2N; CPI 2 =1; T 2 =T T CPU1 =N IST1 *CPI 1 *T 1 =N*10*T/4=2,5*N*T T CPU2 =N IST2 *CPI 2 *T 2 =2N*1*T=2*N*T T CPU1 >T CPU2 10