Riassunti Sistemi Multimediali 2011/12

Dimensione: px
Iniziare la visualizzazioe della pagina:

Download "Riassunti Sistemi Multimediali 2011/12"

Transcript

1 Riassunti Sistemi Multimediali 2011/12 Mirko Napolano 1 Introduzione e semiotica La multimedialità è l insieme delle tecnologie che permettono di gestire ed integrare media differenti (testi, audio, video, immagini, ecc..). Un sistema multimediale è un framework che permette d integrare e far interagire fra loro e con l utente i vari media. Esso attinge conoscenze e tecnologie da branche dell informatica differenti (computer graphics, computer vision, computer networks, image processing, human interaction, ecc..). Tecnologie utilizzate in questi sistemi sono: rappresentazione, compressione ed elaborazione dei dati multimediali, trasmissione dei dati, gestione e recupero dei dati all interno di appositi database. Lo scopo di un sistema multimediale è quindi quello di permettere un processo di comunicazione fra gli utenti. Per inciso, la comunicazione è un processo in cui uno o più persone aumentano la loro conoscenza tramite un messaggio. Un processo di comunicazione coinvolge un mittente, un destinatario, un messaggio, una codifica, una decodifica, un canale di comunicazione e il relativo rumore e una risposta. Essa assume significato solo all interno di un determinato contesto ed entro un certo intervallo di tempo; inoltre, affinchè la comunicazione abbia successo è necessario che mittente e destinatario condividano lo stesso punto di vista, lo stesso codice interpretativo e la stessa lingua. Un messaggio non è altro che un insieme di segni, costituiti a loro volta da simboli o segnali. Esso serve a trasportare un significato; la scienza che studia i segni e il modo con cui esprimono un significato è la semiotica. Un segno è quindi costituito da due entità, il significante, cioè l insieme dei simboli, e il significato, cioè il concetto. Col termine mezzo ci si riferisce ad un mezzo fisico di comunicazione del messaggio (canale fisico) oppure ad un mezzo di rappresentazione (linguaggio). Un ipertesto è un tipo di testo non lineare, in cui la corretta comprensione del messaggio viene realizzata leggendo i simboli in modo non sequenziale. La lettura di un ipertesto viene facilitata dall utilizzo di link, che rimandano ad altre parti del testo. Un applicazione che include media differenti con cui si può interagire allo stesso modo degli ipertesti prende il nome di hypermedia; un classico esempio è il World Wide Web. 2 Il Web Il Web ha subito un evoluzione dal momento in cui è nato, ovvero dal 1991 quando Tim Berners Lee creò il protocollo HTTP e il linguaggio di markup HTML, fino ai giorni nostri. Tale evoluzione è evidenziata da versioni del web; tuttavia, tali acronimi non fanno riferimento a versioni successive effettivamente 1

2 rilasciate del web, come accade per i software, ma è utilizzato da esperti informatici della comunità per evidenziare la differenza di utilizzo delle informazioni in rete. La prima fase è quella del Web 1.0, e si riferisce ai primi anni 90: in questa fase i siti vengono gestiti da persone esperte del campo, ed in particolare di HTML che rappresenta il linguaggio dominante per la gestione e formattazione dei contenuti web. Gli utenti possono navigare i siti web e ricavare informazioni anche multimediali, ma non possono modificarle; per cui si parla di siti web statici. Esistono inoltre le prime forme di e-commerce, limitate tuttavia alle aziende (business to business). La seconda fase è detta Web 2.0 : non essendo, come detto, una versione successiva e standardizzata del Web, il passaggio dalla prima alla seconda fase è stata graduale. Nel Web 2.0 ciò che cambia notevolmente è l interazione tra sito e utente: quest ultimo può infatti modificare direttamente il contenuto delle pagine web, sfruttando servizi come i blog, i forum, le wiki e soprattutto i social network; l e-commerce inoltre si estende anche fra gli utenti comuni. La condivisione dei contenuti riguarda anche i dati multimediali, favorita dall avvento di servizi come YouTube, MySpace, Dropbox ed altri. Inoltre, le applicazioni più diffuse mettono a disposizione delle API, che possono essere utilizzate per includere i propri contenuti all interno di altre pagine web (mashup): ad esempio, è possibile condividere un video di YouTube su Facebook, oppure è possibile includere su un sito di un albergo la mappa del luogo in cui si trova. I siti web diventano cosi dinamici, e possono essere gestiti e creati da persone con conoscenze informatiche limitate. Ciò è stato possibile anche grazie a nuovi linguaggi web come PHP e CSS. Uno dei servizi più utilizzati del web, sin dagli albori, è il motore di ricerca: esso si basa sull utilizzo di parole-chiave (keywords) indicate dall utente e, sfruttando sofisticati algoritmi di Text Processing basati sulla ricerca sintattica, restituiscono i risultati basandosi sulle occorrenze della parola-chiave. Tuttavia tale approccio ha dei limiti: le parole-chiave infatti sono ambigue, e hanno significati differenti a seconda del contesto in cui sono collocate. Per cui, la successiva evoluzione del web si basa su un approccio semantico della gestione dei dati. Per fare ciò è necessario che ai dati vengano associate delle informazioni aggiuntive, i metadati, che le descrivano e ne permettano l indicizzazione da parte di motori di ricerca semantici. Tale fase, tuttora in corso, è quella del Web Semantico. Il Web Semantico si basa su un approccio diverso della gestione dei dati: questi non devono essere più isolati, ma devono poter essere fusi con altri dati correlati in modo da permettere una ricerca più completa. Per fare questo è necessario che tutti quelli che condividano informazioni sul web utilizzino dei linguaggi e degli strumenti standardizzati: in particolare, per identificare delle risorse in rete, anche non sul web, esistono le stringhe URI (Uniform Resource Identifier); per poter riutilizzare le risorse, a cui sono associate dei metadati, vengono utilizzate i documenti RDF (Resource Description Framework); per interrogare le informazioni presenti negli RDF è stato introdotto il linguaggio SPARQL (Simple Protocol And RDF Query Language); per caratterizzare la semantica dei termini e fornire una descrizione di una conoscenza condivisibile vengono utilizzati gli RDF Schema e il linguaggio OWL (Ontology Web Language). 2

3 Il linguaggio di markup che ha permesso lo sviluppo degli strumenti per il web semantico è XML (extensible Markup Language): esso è un linguaggio che permette di definire la sintassi e le regole da utilizzare nella stesura di un documento. Il linguaggio XML permette di introdurre dei tags all interno del documento; ad esso vanno associate delle regole sulla sintassi e sull ordine di tali etichette, che vengono racchiuse in documenti DTD (Document Type Definition) o in XML Schema (più potente). Facendo uso di XML, quindi, possono essere catalogati i metadati, ed essere associati poi alle informazioni. Un ulteriore raffinamento è costituito da RDF, che, basato su XML, definisce dei tags, accettati nell RDF Schema, che scompongono logicamente una frase in soggetto-predicato-oggetto. Infine, per dare un significato alle parole e metterle in relazione tra di loro, è necessario creare un ontologia, ossia una specifica formale ed esplicita di una conoscenza condivisibile. Il linguaggio che permette di esprimere le relazioni logiche che sussistono tra le parole di uno stesso concetto è OWL, anch esso basato su XML. 3 Immagini Un immagine raster, o immagine bitmap, è una matrice di n x m elementi in cui ciascuno di essi è una funzione f(x, y) di due variabili x e y che rappresentano le coordinate spaziali, mentre la f è il valore d intensità associata ad ogni coppia di punti, detti pixel. Nel caso in cui l immagine fosse in scala di grigi, il valore della funzione rappresenta il livello di grigio. La funzione f(x, y) è una combinazione delle proprietà elettromagnetiche delle onde, in particolare dell illuminazione e della riflettanza; l immagine reale viene acquisita da sensori elettronici sottoforma di impulsi elettromagnetici, dopodichè subisce un processo di conversione A/D, che consiste in un campionamento delle coordinate ed in una quantizzazione dell intensità. In particolare, se si definiscono L livelli di grigio, esso dovrà essere una potenza di 2, quindi L = 2 k con k numero dei bit necessari. Le immagini si classificano in base alla: risoluzione spaziale, che fa riferimento ai pixels presenti nell unità di misura (ad esempio, dots per inch, dpi) e quindi più campioni ci sono nell unità maggiore è la risoluzione; alla risoluzione dell intensità, che fa riferimento al più piccolo cambio d intensità percepibile, e quindi maggiori sono i bit su cui vengono codificate le immagini più alta è la risoluzione. Nelle immagini binarie o monocromatiche i pixel sono codificati su un singolo bit (0 o 1, nero o bianco, assenza o presenza di luce). Nelle immagini ad 8 bit ogni pixel ha un valore di livello di grigio che varia tra 0 e 255, quindi ogni pixel è codificato su un byte: i valori più scuri tendono allo 0, quelli più chiari tendono al 255. I formati più diffusi per le immagini a colori sono quelli a 24-bit e a 8-bit. Nelle immagini a 24-bit ogni pixel è rappresentato da 3 byte, solitamente per uno spazio dei colori RGB, ciascuno dei quali indica un livello di grigio dei 3 colori. Quindi, i colori che possono essere ottenuti combinando i 3 livelli sono circa 16 milioni, quindi per un immagine di risoluzione media si occupa circa 1MB. Nelle immagini ad 8-bit ogni pixel assume uno dei 2 8 = 256 colori possibili; tali immagini utilizzano il meccanismo della Look-Up Table o LUT: invece di memorizzare informazioni sul colore, viene memorizzato un indice della LUT (a 8-bit) che fa riferimento ad una particolare mappa di colori, risparmiando un 3

4 gran numero di operazioni computazionali. Per costruire la LUT possono essere seguiti due approcci: nel primo gli 8 bit su cui sono codificati il rosso R e il verde G vengono mappati su 3 bit, mentre il blu B viene mappato su 2 bit, ottenendo così 2 8 = 256 indici per la LUT; la scelta di riservare un bit in meno per il blu dipende dal fatto che l occhio umano è meno sensibile alle variazioni di questo colore. Una volta fatto ciò, ogni pixel nell immagine viene sostituito con il corrispondende indice della LUT a 8-bit, che servirà per generare un colore a 24 bit; nel secondo può essere utilizzato l algoritmo della mediana (Median Cut Algorithm): per ogni bit di ciascun colore viene individuata la mediana, i valori che sono minori della mediana vengono etichettati con 0, quelli maggiori con 1; questo procedimento viene fatto quindi per i tre colori R,G e B sugli 8 bit, determinando 256 indici della LUT. 3.1 Formati delle immagini Il formato di un file fa riferimento al modo in cui le informazioni vengono organizzate in esso. Uno dei formati immagine più comuni ed il primo ad essere utilizzato nel Web è GIF (Graphics Interchange Format): esso permette di rappresentare le immagini a colori su 8 bit, è un formato senza compressione dei dati e può essere utilizzato per creare piccole animazioni, in quanto supporta l interlacing, cioè la sovrapposizione ripetuta di più immagini bitmap. In generale, il formato GIF87 porta con sè diverse informazioni nell header: GIF signature, che identifica il tipo di file immagine GIF87 screen descriptor, che porta informazioni sull ampiezza, altezza, numero di pixel e background dell intera GIF global color map per ogni immagine della GIF: image descriptor, che dà informazioni sulla posizione dell immagine, il numero dei pixel e sulla mappa dei colori da utilizzare local color map, indicizzata per i tre colori R,G e B raster data, che rappresenta i pixel GIF terminator, che indica la fine del file. Un formato successivo a GIF, utilizzato sempre prevalentemente nel mondo web, è PNG (Portable Network Graphics): supporta immagini fino a 48 bit e contiene informazioni sulla correzione del gamma per una corretta visualizzazione dell immagine sui display. Altro formato grafico è TIFF (Tagged Image File Format), in cui le informazioni di supporto sono collegate tramite tags: il vantaggio principale di TIFF è che la stessa immagine può essere visualizzata in modi differenti, per questo è usato spesso dagli scanner e dalle stampanti. Un formato immagine molto diffuso è JPEG, ottenuto con l omonima compressione (Vedi più avanti). 4

5 PostScript è un linguaggio di descrizione di pagina interpretato particolarmente adatto alla descrizione di pagine ed immagini, inizialmente usato come linguaggio per il controllo delle stampanti. Lo scopo principale per cui venne ideato era lo sviluppo di uno strumento per descrivere pagine di testo e grafica in modo indipendente dalla risoluzione e dal dispositivo di visualizzazione. Grazie a questo linguaggio quindi è possibile trasferire da un computer ad un altro informazioni senza perdita di qualità. Il formato file più moderno che ha sostituito PostScript è PDF (Portable Document Format): la differenza col predecessore è che PDF non è un linguaggio ma un formato, quindi non ha bisogno di un interprete per essere letto; in più, PDF memorizza tutte le informazioni in un singolo file, a differenza di PostScript. 4 I colori La luce è un onda elettromagnetica, caratterizzata da una certa lunghezza d onda. A seconda di questo valore, l occhio umano può percepire determinati colori: in particolare, la luce si trova nello spettro elettromagnetico compreso tra 400 e 700nm di lunghezza d onda, che costituisce lo spettro del visibile, prima e dopo del quale l occhio umano non riesce più a captare informazioni. I valori di lunghezza d onda più bassi (quindi con una frequenza più elevata) producono tonalità di blu, mentre i valori di lunghezza d onda più alti (cioè con frequenza più bassa) producono tonalità di rosso. La luce viene percepita dall occhio umano tramite due tipi di cellule: i coni sono sensibili alle variazioni dei colori, in particolari di R,G e B (soprattutto R e G) mentre i bastoncelli sono sensibili alle variazioni di luminosità. Inoltre, gli oggetti riflettono la luce in modo differente: in particolare, i colori chiari riflettono di più mentre quelli scuri assorbono maggiormente; tale proprietà è detta riflettanza. Quindi, se indichiamo con E(λ) la PSD (Densità spettrale di potenza) di un raggio luminoso, con S(λ) la riflettanza di un oggetto e, ad esempio, con q R (λ) la sensibilità dell occhio di captare il colore rosso, l integrale del prodotto delle funzioni determina il valore di rosso percepito: R = E(λ)S(λ)q R (λ) dλ (1) Ovviamente, questo vale anche per il verde e per il blu. La percezione del colore, tuttavia, dipende anche da altri fattori, quali gli altri colori presenti sullo sfondo e l elaborazione del cervello. Lo spazio RGB, ad esempio, non è percettivo, non è il modo con cui il cervello umano rappresenta i colori, che è invece sottrattivo. In generale gli attributi percettivi del colore sono: la tinta (hue): il colore puro senza l aggiunta di tonalità di grigio, identifica un colore specifico facente capo ad una lunghezza d onda predominante; la saturazione (saturation): indica la purezza del colore, e dipende quindi dalla quantità di bianco mescolata al colore. Minore sono le lunghezze d onda facenti parte dello spettro del colore, più quest ultimo è saturo; la luminosità (lightness o chiarezza): la quantità di luce che il colore sembra emettere rispetto allo sfondo bianco. 5

6 Altri parametri descrittivi sono la brillanza (brightness), che è una misura assoẹlla quantità di luce emessa da un colore, a differenza della luminosità che è una misura relativa, e la croma (chroma), che rappresenta la quantità relativa del colore rispetto al bianco. Nella visualizzazione dei colori, i display adottano delle specifiche differenti: ciò comporta che una stessa immagine appaia con colori sbiaditi rispetto ad un altro display. Ciò è dovuto alla relazione che sussiste tra la tensione del monitor e l intensità luminosa, il valore di gamma; per risolvere tale fenomeno viene adottata la correzione gamma, una trasformazione non lineare che aggiusta automaticamente i valori dei colori. 4.1 Spazio dei colori La rappresentazione dei colori si basa su modelli differenti tra loro, a seconda degli usi che se ne deve fare. In generale, esistono due tipi di categorie, lo spazio dei colori additivo e lo spazio dei colori sottrattivo. Il primo, come lo spazio RGB, descrive la situazione in cui il colore è creato combinando luci provenienti da sorgenti differenti; il valore che si ottiene sommando tutti i colori è il bianco (su 8 bit, è il valore 255), eliminando tutti i colori si ottiene il nero (valore 0). Il secondo, come lo spazio CMY, genera i colori a partire da altri eliminando la luce che ciascuno di loro emette; con tale tecnica è possibile infatti creare i colori tramite tempere o inchiostri. Il valore ottenuto combinandoli tutti è il nero (valore 255) mentre se non c è colore ovviamente si ottiene il bianco (valore 0). Lo spazio dei colori CIE XYZ 1931 fu uno dei primi modelli ad essere proposto. Esso descrive i colori come una combinazione lineare dei 3 colori primari, ma effettuando delle trasformazioni riguardo la percezione di essi; in particolare, poichè l occhio umano è sensibile al colore tramite tre valori tristimolo, tali valori sono X = Y = Z = E(λ)x(λ)dλ (2) E(λ)y(λ)dλ (3) E(λ)z(λ)dλ (4) con X componenti del rosso a valori positivi, Y luminosità e Z valore del blu. Il diagramma cromatico dello spazio CIE 1931 può essere rappresentato in 2D, rappresentando lungo due assi il rosso e il verde e per sottrazione il blu. Il gamut di un dispositivo è l insieme dei colori che il dispositivo è in grado di produrre, riprodurre o catturare ed è un sottoinsieme dei colori visibili. Poiché per descrivere i colori esistono diversi modelli, con il gamut di un modello di colore s intende l insieme di tutti i colori descrivibili da quel particolare modello di colore. Quando un colore non può essere descritto da un certo modello, si dice che, rispetto a quel modello di colore, è fuori gamut. La maggior parte dei modelli di colore è un sottoinsieme dello spazio dei colori CIE Lo spazio dei colori RGB è un modello additivo, basato sui 3 colori rosso, verde e blu. Questo modello è molto utilizzato nella visualizzazione delle immagini, in quanto la percezione umana elabora i colori in un modo molto simile 6

7 a quello dell RGB. La scelta su questi 3 colori, invece che quelli primari rosso, giallo e blu, dipende dal fatto che tramite R,G e B è possibile coprire in modo maggiore la regione definita dallo spazio dei colori CIE Un immagine rappresentata nello spazio RGB è ottenuta come sovrapposizione di 3 immagini, ciascuna con i livelli d intensità per ciascun colore base. Da un punto di vista concettuale, RGB può essere rappresentato come un cubo, i cui vertici sono R,G,B,C,Y,M, bianco e nero, i cui spigoli rappresentano sfumature di questi colori e la cui diagonale dal vertice nero a quello bianco rappresenta i livelli di grigio. Lo spazio dei colori HSI è uno spazio additivo, basato sui valori di tinta (Hue), saturazione (Saturation) e intensità (Intensity). E uno spazio poco intuitivo per la percezione umana ma molto utile per l elaborazione hardware, in quanto permette di descrivere i colori tramite parametri oggettivi. I tre valori possono essere ricavati a partire dal cubo rappresentativo RGB: sviluppando il cubo come un esagono, i sei vertici rappresentano i sei colori primari e secondari mentre il centro rappresenta il bianco e dall altro lato il nero; la tinta è l angolo che si forma partendo dal rosso, la saturazione è la distanza dall origine al valore, l intensità si ricava dal cubo 3D come il valore di profondità del cubo stesso. Lo spazio dei colori CIELAB permette di rappresentare i colori in modo preciso: ognuno di essi è individuato da un valore di luminosità L, che indicano in percentuale i livelli di grigio, e da due parametri a e b che rappresentano due gamme di colori. In questo modo include tutti i colori percepibili e copre il gamut degli spazi RGB e CMY, utilizzati da monitor e stampanti; quindi è indipendente da piattaforme e periferiche. Per questo motivo è utilizzato da software di Image Processing, come Photoshop, come spazio intermedio nel passaggio da RGB a CMY e viceversa. Lo spazio dei colori CMY è uno spazio sottrattivo: i colori vengono ottenuti sottraendo la luce emessa da altri colori, il bianco vale 0 e il nero vale 255. Spesso, poichè questo spazio è utilizzato per effettuare delle stampe, per evitare che i colori vengano consumati per produrre il nero viene aggiunto il colore Black, determinando lo spazio CMYK. E possibile effettuare il passaggio da uno spazio dei colori ad un altro sfruttando delle matrici di trasformazione T, che associano, ad esempio nel caso RGB->HSI, al vettore [R,G,B] i valori trasformati tramite T di [H,S,I]. Per ottenere una trasformazione da RGB a CMY e viceversa basta sottrarre un vettore colonna unitario ai valori dello spazio di partenza. 5 Image Processing L Image processing si occupa di effettuare elaborazioni su un immagine, quali ridimensionamento, rotazione, cambiamento di contrasto e cosi via. In particolare, lo scopo del miglioramento dell immagine (Image enhancement) è di rendere l immagine sorgente più adatta per una particolare applicazione; ciò vuol dire che non esiste un miglioramento oggettivo dell immagine, l elaborazione dipende dall uso che se ne deve fare dell immagine, cioè l Image enhancement è orientato al problema. Le elaborazioni lavorano in due diversi domini: il dominio spaziale, che manipola direttamente i pixels di un immagine, e il dominio della frequenza, che modifica le immagini mediante la trasformata di Fourier. Le tecniche che 7

8 lavorano nel dominio dello spazio sono solitamente trasformazioni lineari T dei valori f(x, y) assunti dai vicini (neighborhoods) di un determinato pixel; tale regione è solitamente un area quadrata o rettangolare. Nel caso più semplice, la regione riguarda il singolo pixel, e l elaborazione è una trasformazione del livello di grigio del pixel tramite T. Solitamente, le trasformazioni si basano su note funzioni matematiche, come la retta, il logaritmo, l esponenziale, la radice e la potenza. In particolare, la funzione che calcola il negativo di un immagine è una retta con coefficiente angolare negativo, che associa ogni valore di colore al suo opposto (ad esempio, il valore 0 diventa L 1, con L massimo valore rappresentabile). La trasformazione logaritmica permette di espandere i valori dei pixel scuri di un immagine e convertirli in pixel più chiari, in modo da mettere in risalto i dettagli. La funzione potenza è utilizzata per effettuare la correzione di gamma, ovvero quel parametro tipico di un display che caratterizza la visualizzazione dei colori di un immagine: a seconda che γ sia minore o maggiore di 1 si parla di compressione o espansione gamma. L aumento della brillanza dell immagine viene realizzata da una retta, non passante per l origine con coefficiente angolare unitario, che aumenta l intensità dei pixel di un certo valore; in questo modo i pixel con un intensità più elevata vengono portati in saturazione e diventano bianchi. In modo esattamente opposto viene realizzata la diminuzione della brillanza. Nel caso di un immagine a colori, quest operazione deve essere effettuata per ogni colore dello spazio. L aumento del contrasto, cioè del rapporto tra oggetto e sfondo, viene effettuato tramite una retta, passante per il centro dei valori su cui è rappresentata l immagine, e con un coefficiente angolare maggiore di 1, il cui risultato è che i pixel con valori d intensità intermedi vengono portati a valori più chiari o più scuri, a seconda del valore più vicino; quindi, in questo modo, i pixel molto scuri diventano praticamente neri e quelli molto chiari praticamente bianchi. Se il coefficiente angolare fosse avremmo un immagine di soli pixel bianchi e neri. In modo esattamente opposto si può diminuire il contrasto di un immagine; in questo caso, avendo una retta con coefficiente angolare minore di 1, se questo valesse 0 l immagine sarebbe completamente grigia. Il contrasto può essere modificato anche utilizzando una funzione potenza, la contrast streching, che rende più precisa l elaborazione, in quanto non porta subito in saturazione i valori scuri e chiari. Ovviamente, tutte queste elaborazioni non sono reversibili, in quanto un certo numero di valori viene portato in saturazione, e quindi non possono essere riportati allo stato originario. Una rappresentazione molto utile per l uomo ma soprattutto per le applicazioni di grafica è l istogramma di un immagine: data un immagine rappresentata su k livelli di grigi, esso è una funzione di k elementi, in cui ciascuno di essi riporta l occorrenza dei pixel per quel dato livello di grigio: h[r k ] = n k (5) Se ogni elemento dell istogramma viene normalizzato per il numero di pixel n, si ottiene la probabilità che un pixel assuma un determinato livello di grigio: p[r k ] = n k /n (6) Nel caso di un immagine a colori, per ciascuno dei colori dello spazio viene definito un istogramma, che avrà tanti elementi quanti sono i livelli d intensità 8

9 per quel dato colore (che dipende sempre dal numero di bit su cui vengono codificati). La luminosità di un pixel è data invece dalla media degli istogrammi di ciascun colore. 5.1 Filtraggio nello spazio Tale approccio agisce direttamente sui singoli pixel. Se consideriamo un filtro lineare, che è caratterizzato da una certa maschera di valori, esso viene applicato su una zona d interesse: il risultato in uscita non è altro che la somma dei prodotti dei valori dei pixel con i corrispondenti coefficienti del filtro. Solitamente quindi la maschera agisce a partire dal centro della zona d interesse per una regione rettangolare m x n. I filtri smoothing sono utilizzati per lo sfocamento delle immagini e per la riduzione del rumore, operazioni preliminari che vengono effettuate su un immagine per eliminare piccoli dettagli prima di effettuare l estrazione di feature. Esistono due tipi di filtri spaziali per lo smoothing: il filtro lineare (Smoothing Linear Filter) e il filtro mediano (Order-Statistics Filter). Il filtro lineare effettua semplicemente la media dei pixel contenuti all interno della regione su cui è applicato il filtro; tale media può essere standard oppure pesata per un certo valore (average weighted), in modo che vengano sfocati maggiormente gli elementi sui bordi della regione filtrata. Il filtro mediano è un filtro spaziale non lineare, la cui maschera è basata sui valori dei pixel filtrati: per ciascuna regione ordina i valori dei pixel, individua il valore mediano e lo sostituisce al pixel che si trova al centro della regione. In ogni caso, quindi, per effettuare lo sfocamento dell immagine (blurring) viene calcolata una media, che equivale per valori analogici ad un integrale. Poichè un filtro lavora su regioni solitamente quadrate, i bordi dell immagine devono essere trattati in modo opportuno; esistono diversi approcci, che prevedono, ad esempio, di tralasciare i pixel al di fuori dell immagine, di imbottire l immagine con pixel bianchi o neri (creando un contorno), di replicare i pixel sui bordi o di troncare l immagine. L operazione inversa allo smoothing è lo sharpening, cioè la tecnica che accentua, per quanto possibile, i dettagli di un immagine, la sua nitidezza, e mette in risalto i contorni (Edge Detection). Così come lo smoothing opera in sostanza un integrazione, così lo sharpening effettua una differenziazione nello spazio; viene quindi realizzata dai filtri derivativi. Tale operazione è importante nei punti di discontinuità dell immagine, nelle zone a livello di grigi costanti e nelle rampe a livelli di grigio, in quanto caratterizzano zone, punti e linee di rumore nell immagine. La derivata prima di una funzione ad una variabile f(x) viene approssimata come differenza di due valori consecutivi f = f(x + 1) f(x) (7) x essa deve valere 0 nelle zone costanti e un valore diverso da 0 all inizio delle discontinuità e lungo le rampe. La derivata seconda di una funzione ad una variabile f(x) viene approssimata come 2 f = f(x + 1) + f(x 1) 2f(x) (8) x2 9

10 essa deve valere 0 nelle zone costanti e lungo le rampe e un valore diverso da 0 all inizio e alla fine delle discontinuità. Quindi, la derivata prima rende i contorni spessi mentre la seconda li rende sottili. Calcolando la derivata seconda lungo le x e lungo le y, si ottiene l operatore isotropo di derivata seconda di una funzione a due variabili f(x, y), l operatore Laplaciano 2 f = 2 f x f y 2 che viene approssimato per l implementazione digitale come 2 f = f(x + 1, y) + f(x 1, y) + f(x, y + 1) + f(x, y 1) 4f(x, y) L immagine g(x, y) su cui viene applicato il filtro derivativo è una somma algebrica dell immagine originale e del filtro laplaciano: g(x, y) = f(x, y) ± 2 f Se il valore centrale del filtro è negativo ottengo un filtro derivativo, che mette in evidenza i dettagli; se è positivo diventa un filtro lineare medio, che effettua lo smoothing. Un altro modo per aumentare la nitidezza di un immagine consiste nel sottrarre ad essa una sua versione sfocata (Unsharp masking): f s (x, y) = f(x, y) f b (x, y) con f s immagine nitida ed f b immagine sfocata. Per quanto riguarda la derivata prima, nell Image Processing essa è realizzata tramite l ampiezza del gradiente: mag( f) = G 2 x + G 2 y tale filtraggio, a differenza del laplaciano, non è isotropo perchè agisce solo lungo la direzione verticale e orizzontale. 10

11 Il metodo di Roberts rappresenta un approssimazione del filtro derivativo del primo ordine: esso utilizza due filtri del tipo [ ] e [ 0 ] Dopo aver calcolato la convoluzione dell immagine con i due filtri, per ciascuna coppia di punti (x, y) vengono calcolate ampiezza e fase di un gradiente approssimato. In modo simile al metodo di Roberts, il metodo di Sobel approssima il gradiente mediante due filtri, uno per la direzione orizzontale e uno verticale, in cui rispettivamente la riga e la colonna centrale sono nulle e Anche in questo caso, l immagine viene convoluta con questi due filtri e vengono calcolati modulo e fase del gradiente approssimato di ciascun punto. 6 Features Per definire una similarità tra oggetti multimediali è necessario che questi vengano descritti da particolari caratteristiche univoche, le feature, e che queste vengano confrontate in modo opportuno. Per fare ciò è necessario definire una metrica, ossia una distanza caratterizzata da un insieme di proprietà. Una qualunque funzione d che descriva una metrica deve soddisfare quattro assiomi: positività d(x, y) 0 identità d(x, y) = 0 x = y simmetria d(x, y) = d(y, x) disuguaglianza triangolare d(x, y) d(x, z) + d(z, y) Le metriche più diffuse sono quelle che si applicano negli spazi euclidei: dati due punti A e B la distanza L 1 (o Manhattan Distance) è la somma delle proiezioni dx e dy sugli assi (la somma della differenza delle componenti) d = dx + dy la distanza L 2 (o distanza Euclidea) è la radice quadrata della somma del quadrato delle proiezioni dx e dy sugli assi d = dx 2 + dy 2 11

12 in generale, la distanza L p (o distanza di Minkowski) è la radice p- esima della somma della potenza p-esima delle proiezioni dx e dy sugli assi d = p dx p + dy p all infinito, la distanza L è il massimo tra dx e dy d = max(dx, dy) Mediante la metrica, quindi, è possibile effettuare delle comparazioni di oggetti multimediali, in quanto permettono di indicizzare informazioni su di essi come vettori di proprietà, le feature appunto. Esistono numerose possibili features per le immagini: l istogramma dei colori, la trama (texture), i contorni, le forme ecc.. Poichè l operazione di estrazione delle features e il loro confronto può essere computazionalmente molto elevato, lo scopo è quello di minimizzare il numero di operazioni da calcolare. I singoli pixel, ad esempio, non possono essere utilizzati come features in quanto si associerebbe per ogni immagine un vettore di dimensioni n x m. Il primo passo per ricavare informazioni dalle immagini, quindi, è quello di scegliere le features appropriate; la scelta dipende da più fattori come l ambito applicativo, la percezione umana e la potenza descrittiva degli oggetti. Una buona feature è quella che permette all uomo di differenziare oggetti diversi all interno di una scena ed è significante, cioè porta un numero d informazioni più elevato di altre; deve quindi rispecchiare la percezione umana quanto più è possibile, e devono essere tralasciate feature associate ad informazioni che occorrono più spesso di altre. E necessario dunque utilizzare tecniche che permettano di scegliere tra le feature quelle che separano meglio gli oggetti multimediali considerati. Una delle tecniche prese in prestito dalla statistica che permette di semplificare i dati è la Principal Component Analysis, PCA, nota anche come trasformata di Karhunen-Loeve. Lo scopo primario di questa tecnica è la riduzione di un numero più o meno elevato di variabili (rappresentanti altrettante caratteristiche del fenomeno analizzato) in alcune variabili latenti (feature reduction) caratterizzate da una distanza metrica quanto più elevata è possibile. Ciò avviene tramite una trasformazione lineare delle variabili che proietta quelle originarie in un nuovo sistema cartesiano nel quale la nuova variabile con la varianza più grande viene proiettata sul primo asse, quella con la seconda varianza più grande sul secondo asse e così via. Un metodo più semplice per calcolare queste variabili si basa sulla matrice di covarianza: innanzitutto viene creata una matrice X con una riga per ogni dato, viene sottratta la media di ogni dato dalla corrispondente riga, si calcola la matrice di covarianza di X, si trovano gli autovalori e gli autovettori di questa matrice; le PC sono gli autovettori corrispondenti ai più grandi autovalori. Collegata alla PCA vi è la Single Value Decomposition, SVD, una tecnica algebrica che permette di ridurre il rango della matrice di covarianza, utilizzando i suoi autovalori e autovettori. La Principal Component PC, quindi, al di là della sua natura algebrica definisce la distanza migliore tra gli oggetti, ed è quindi una combinazione lineare delle feature stesse. Se consideriamo, dunque, un database multimediale, la sua compattezza è la somma delle similarità tra gli oggetti; più gli oggetti sono simili maggiore è la compattezza del database. Se esso è troppo compatto non è utile, in quanto non permette di distinguere in modo adeguato gli oggetti; per cui una 12

13 feature è buona se, nel momento in cui viene rimossa, aumenta la compattezza del database (lo scopo è sempre quello di distanziare gli oggetti). 7 Visual Information Retrieval Lo scopo dei sistemi di Visual Information Retrieval (o Content-Based Information Retrieval CBIR) è di recuperare da un database multimediale immagini o sequenze d immagini rilevanti per una query. E un estensione delle attività di recupero effettuate sui database relazionali, la cui differenza principale è che il risultato della query non è univoco ma si basa su similarità tra le feature che descrivono gli oggetti multimediali. Elementi come il colore, la tessitura, le forme, le relazioni spaziali sono usate come indizi per recupare immagini con un contenuto simile. In un database di questo tipo è necessario gestire, insieme ai dati, metadati indipendenti dal contenuto (autore, titolo, formato, ecc..), dati dipendenti dal contenuto (colore, forma, tessitura) e metadati descrittivi, che fanno riferimento alla semantica dell immagine. La prima generazione della Visual Information Retrieval prevedeva l utilizzo di attributi testuali associati a video e immagini: i dati dipendenti dal contenuto erano individuati da keywords, i metadati descrittivi da scripts scritti da esperti, e quindi le query erano basate sui classici motori di ricerca testuali, che effettuano una ricerca sintattica. I problemi con questro approccio sono molteplici: innanzitutto, è necessario descrivere manualmente e a parole ogni elemento del database, la lingua utilizzata non è univoca, la descrizione delle immagini non è oggettiva ma dipende dal punto di vista di chi la compone e infine potrebbero perdersi dei dettagli nella descrizione. La fase successiva, con i CBIR, ha permesso di descrivere in modo oggettivo le immagini (eliminando la percezione della persona che deve descrivere a parole l oggetto) in modo automatizzato e molto più velocemente. Per ciascuna immagine vengono calcolate un insieme di features descrittive: le query si basano su esempi visivi (Query by Example), cioè il sistema valuta la similarità tra l immagine inserita dall utente e quelle presenti nel database, restituendo come risultato le immagini ordinate per valori di similarità percentuali decrescenti. Inoltre, in questo modo i risultati della query vengono mostrati all utente che può effettuare un raffinamento della query successiva, in quanto può giudicare il risultato tramite un voto (relevance feedback). Le Query by Content, invece, danno informazioni in modo testuale sul contenuto di un immagine; queste parole, affinchè il match abbia successo, devono essere presenti nei metadati. Altri tipi di query by Example sono: le Iconic queries, basate sul linguaggio iconico in modo da dare un significato grafico e spaziale agli oggetti; le query by painting, basate su un particolare colore, le query by sketch, che recuperano immagini in base alle forme, le query by image, che fornisce in input un prototipo d immagine con un certo colore e tessitura. 7.1 Feature Detection Le possibili features globali di un immagine sono il colore, la tessitura (texture), la forma, la struttura, le relazioni spaziali e (nel caso dei video) il movimento. Esse sono dette features di basso livello, perchè riguardano caratteristiche dirette dell immagine a differenza delle features di alto livello, che rappresentano 13

14 il contenuto semantico di un immagine. Le features di basso livello dovrebbero essere invarianti per scala, traslazione, rotazione, cambi d illuminazione e punti di vista. Per rilevare i contorni di un immagine (Edge Detection) possono essere utilizzati i filtri derivativi, che approssimano operatori come il gradiente e il laplaciano, oppure l algoritmo molto diffuso per questo scopo del Canny Edge Detector. Per effettuare invece la blob detection, che serve a trovare punti d importanza di un immagine che non si trovino lungo i bordi, vengono utilizzati due operatori, il Laplacian of Gaussian (LoG) e la Difference of Gaussian (DoG), che rappresenta un ottima approssimazione del primo operatore e più semplice da realizzare: esso consiste nel convolvere l immagine originaria in scala di grigi con due gaussiane, di valori di σ per lo sfocamento differenti, e di effettuarne la differenza pixel per pixel; poichè la DoG realizza un filtro passa-basso, l effetto è quello di mettere in evidenza i dettagli dell immagine. Per applicare la DoG, o altre tecniche di blob detection, spesso è utile creare per un immagine una piramide gaussiana: essa viene costruita a partire dall immagine originaria con valori di dimensione e sfocatura via via decrescenti; in questo modo si ottiene che le immagini in cima alla piramide contengono i dettagli predominanti dell immagine, e quindi su di esse può essere applicata la DoG. Un altra tecnica per l edge detection è la wavelet ortonormale e la sua trasformata. Essa, letteralmente ondina, rappresenta un segnale mediante l uso di una forma d onda oscillante a decadimento rapido, la wavelet madre. I tipi di wavelet più famosi sono quella di Haar, di Daubechi e il Mexican Hat. Nell ambito dell Image processing viene utilizzata la trasformata wavelet discreta (DWT), che rappresenta il segnale d ingresso in una forma scalata e traslata. A differenza della trasformata di Fourier, che rappresenta un segnale solo nel dominio della frequenza, la trasformata wavelet rappresenta il segnale sia nel tempo che nella frequenza, ed è inoltre computazionalmente meno complessa. Per applicarla ad un immagine e rilevare i contorni, è necessario utilizzare una wavelet discreta a due dimensioni, che agisca sulle righe e sulle colonne: ciò che viene effettuato è una combinazione di due filtraggi passa-basso e passaalto e di sottocampionamenti prima lungo le righe e poi lungo le colonne, che permettono di recuperare informazioni alle alte frequenze. La wavelet inoltre è utilizzata nella compressione dei dati per il formato immagine JPEG Un algoritmo molto efficace per estrarre e descrivere dalle immagini feature locali invarianti per scala, rotazione e traslazione è SIFT (Vedi documentazione). Una delle feature globali più comuni associate alle immagini è il colore. Il recupero di immagini basate sulla somiglianza del colore si ottiene calcolando l istogramma del colore per ciascuna immagine in modo da poter identificare l occorenza dei pixel per ogni livello d intensità di ogni colore. Per effettuare il confronto si possono scegliere spazi di colore differenti, come RGB o HSI, a seconda degli usi. Questo metodo cerca di segmentare la porzione di colore nella regione e la relazione spaziale tra le diverse regioni di colore. Questa è una delle tecniche più usate dal momento che non dipende dalle dimensioni dell immagine nè dal suo orientamento. Per calcolare la similarità tra le immagini in base al colore, il metodo più semplice è di utilizzare una metrica euclidea sugli istogrammi delle immagini (distanza di Manhattan o distanza euclidea); un altro metodo è la metrica di Swain e Ballard, che si basa sulla ricerca del valore degli istogrammi nelle posizioni omologhe. Una funzione applicata ad immagini reali per generare una metrica da utilizzare nel confronto si basa sull autocorrelogramma 14

15 dei colori: per ciascun pixel dell immagine a distanza k viene calcolata la probabilità che essi abbiano lo stesso colore; in questo modo la metrica restituisce informazioni sul colore e sulla distanza spaziale, e dato che le immagini reali sono caratterizzate da colori abbastanza contigui, tale probabilità è spesso elevata. Dopodichè si costruisce un correlogramma tra due immagini, basate sui rispettivi autocorrelogrammi dei colori. Un altra feature comune è la tessitura (texture), che cerca di descrivere caratteristiche visive ripetitive nelle immagini, difficili da rappresentare testualmente. La tessitura si rappresenta mediante texels (texture elements) che si collocano in serie a seconda di quante texture sono state reperite nell immagine. Le caratteristiche della tessitura più comuni sono quelle di Tamura: sono la granularità, la direzionalità, il contrasto e la ripetitività. Due immagini con tessitura differente hanno delle componenti spettrali in alta frequenza diverse. 8 Video e Audio 8.1 Video La trasmissione video analogica può avvenire in due modi differenti: nel Component Video (video a componenti) le informazioni che fanno riferimento ai 3 colori vengono trasportate su tre cavi separati, mentre nel Composite Video (video composito) le informazioni vengono fuse in un unico flusso trasportato da un singolo cavo. Il primo tipo era utilizzato largamente in passato, ma è ancora usato oggi nelle applicazioni video che devono salvaguardare la qualità. Il secondo tipo è quello utilizzato nella maggior parte dei dispositivi domestici; esso trasporta due informazioni, crominanza (colore) e luminanza (intensità) in un unico segnale, con una rappresentazione dei colori YUV o YIQ e con modalità di codifiche che dipendono dai vari Stati (PAL, NTSC, SECAM). Un compromesso tra le due trasmissioni è l S-Video: esso utilizza due cavi, uno per la luminanza e uno per la crominanza, separando i flussi d informazione ma evitando che ci siano interferenze tra i colori e i livelli di grigio. La trasmissione video digitale è quella attualmente più utilizzata perchè comporta molti vantaggi: innanzitutto i video possono essere memorizzati facilmente su dispositivi di memoria ed elaborati per successive modifiche, si può accedere direttamente ad un punto del video (evitando lo scorrimento del nastro ), registrazioni successive non degradano la qualità originaria, c è maggiore tolleranza al rumore (criterio MAP di trasmissione numerica). Il video può essere creato direttamente in digitale oppure può essere ottenuto da quello analogico tramite una conversione A/D. Gli standard più comuni per il video digitale vengono prodotti dal CCIR, una commissione internazionale che gestisce le risorse e gli standard delle telecomunicazioni mondiali. Uno di essi è l HDTV: il suo punto di forza non è tanto l aumento di risoluzione delle immagine quanto l aumento del campo visivo, specialmente in ampiezza, con il passaggio dall aspect ratio 4:3 a quello 16:9; è caratterizzato inoltre da una risoluzione di 720p o superiore (con p numero di linee verticali). 15

16 8.2 Audio Il suono è un onda generata dalla pressione delle molecole nell aria. Essendo per natura un segnale analogico, per digitalizzarlo è necessario effettuare una conversione A/D di un segnale monodimensionale, ovvero campionamento del tempo e quantizzazione dell ampiezza; tipico range di valori di frequenza di campionamento per l audio sono da 8kHz a 48kHz. Prima di effettuare la conversione A/D, il segnale audio viene filtrato con dei filtri passa-banda per rimuovere frequenze non volute; la scelta delle frequenze dipende dalla natura del suono, ad esempio per il parlato il range di frequenze utili va da 50Hz a 10kHz. MIDI (Musical Instrument Digital Interface) è un protocollo per l interazione degli strumenti musicali elettronici con il computer. Esso è un linguaggio di scripting: descrive il modo e il tempo con cui i suoni dei vari strumenti devono essere riprodotti. Lo standard è supportato dalla maggior parte dei sintetizzatori, in modo che i suoni creati con uno di questi possano essere manipolati e riprodotti anche da altri. Il protocollo utilizza 16 canali, ciascuno associato ad uno strumento, che possono essere riprodotti singolarmente o in parallelo; in ogni caso, la comunicazione dati è di tipo seriale. Solitamente i dispositivi con un interfaccia MIDI sono o di input (computer) o di output (sintetizzatore, cioè strumenti che creano suoni); esistono quindi 3 tipi di connettori: IN, OUT e THRU (se devono ritrasmettere i dati) e, come detto, un singolo dispositivo non avrà tutti questi connettori. Il messaggio MIDI è costituito da una serie di messaggi per il canale (tipo di connessione, canali attivi, ecc..) e di messaggi di sistema. 8.3 Compressione delle informazioni La compressione è il processo di codifica delle informazioni che permette di ridurre il numero totale dei bit su cui le informazioni vengono rappresentate. Se la compressione e la decompressione non comportano perdita d informazione, il processo di compressione è detto lossless, altrimenti è detto lossy. Il compression ratio è definito quindi come B 0 B 1 con B 0 numero di bit prima della compressione e B 1 numero di bit dopo la compressione (quindi il rapporto sarà maggiore di 1). In teoria dei segnali, l entropia definisce la quantità d incertezza presente in un segnale aleatorio; nella compressione dati definisce il limite inferiore della compressione senza perdita: n η = H(S) = p i log 2 p i dove S è l alfabeto con cui sono codificate le informazioni, p i è la probabilità che occorra il simbolo s i e log 2 p i indica la quantità d informazioni contenute in s i. i=1 16

17 Quindi l entropia rappresenta la quantità media delle informazioni contenute in ogni simbolo, e definisce il limite inferiore per il numero di bit da utilizzare per codificare ogni simbolo di S η l con l lunghezza media della parola codice Compressione lossless Il primo algoritmo di compressione dati lossless è stato Run-lenght coding, utilizzato nei fax. Esso inserisce una dipendenza tra un codice e quelli successivi recuperando informazioni dalla memoria. Questa codifica è applicabile quando le informazioni sono contigue, come ad esempio immagini con colori a tinta unita, in modo da utilizzare un codice molto ridotto per rappresentare un gruppo d informazioni; in particolare viene memorizzato il valore dell elemento che occorre, un carattere speciale e il numero di occorrenze. La codifica Variable-length coding permette di effettuare una compressione dei dati lossless utilizzando simboli a lunghezza variabile. Un algoritmo che adotta un approccio top-down è l algoritmo di Shannon-Fano: si ordinano i simboli secondo un ordine decrescente per il numero di occorrenze; ricorsivamente si dividono i simboli in due parti, ciascuna approssimativamente con lo stesso numero di occorrenzei, fino a quando ciascuna non contiene solo un simbolo. In questo modo si ha che le parole con un occorrenza maggiore sono codificate su un numero di bit inferiore. Un algoritmo che adotta, invece, un approccio bottom-up è l algoritmo di Huffman. Questa tecnica funziona creando un albero binario di simboli: 1. ordina i simboli in una lista in base alle loro occorrenze 2. ripete i seguenti passi finché la lista non contiene un unico simbolo: prende dalla lista i due simboli con la frequenza di conteggio minore. Crea un albero di Huffman che ha come figli questi due elementi, e crea un nodo di genitori assegna la somma del conteggio delle frequenze dei figli ai genitori e li pone nella lista in modo da mantenere l ordine cancella il figlio dalla lista 3. assegna una parola codice ad ogni elemento basandosi sul percorso da radice a foglia. Il vantaggio principale è che permette di codificare sul minor numero di bit possibile i simboli con le occorrenze maggiori. Inoltre, è un codice a ridondanza minima, in modo da evitare ambiguità in fase di decodifica. La compressione lossless nelle immagini adotta un approccio differenziale: utilizzando un operatore di differenza tra i pixel d(x, y) = I(x, y) I(x 1, y) oppure utilizzando l operatore laplaciano discreto d(x, y) = 4I(x, y) I(x, y 1) I(x, y + 1) I(x + 1, y) I(x 1, y) si ottiene un istogramma dell immagine più ristretto, che diminuisce l entropia totale dell immagine. 17

18 8.3.2 Compressione lossy Grazie all aumento della potenza di calcolo dei computer, è stato possibile utilizzare algoritmi di compressione lossy sui dati, conservando al contempo un gran numero d informazioni. La compressione lossy di un informazione è un approssimazione abbastanza fedele dell informazione di partenza; a seconda delle applicazioni, la fedeltà dovrà essere più o meno elevata. Questa compressione fornisce un rapporto di compressione molto più elevato del caso lossless. Le due misure di distorsioni più utilizzate per valutare la fedeltà della compressione dati sono l errore quadratico medio (Mean Square Error MSE) σ 2 d = 1 N N (x n y n ) 2 n=1 con x n, y n e N la sequenza dati d ingresso, d uscita e la lunghezza della sequenza, e il rapporto segnale-rumore (SNR) SNR = 10 log 10 σ 2 x σ 2 d con σ 2 x valor quadratico medio della sequenza d ingresso. La compressione lossy applicata alle immagini tiene conto della frequenza spaziale, cioè del numero di volte che il valore di un pixel cambia in una data area (ad esempio, gli edge sono caratterizzati da un elevata frequenza spaziale). Per formalizzare questo valore viene utilizzata la DCT (Discrete Cosine Transform): essa misura quante volte cambia il contenuto dell immagine in relazione al numero di periodi del coseno. Il suo ruolo è quindi di decomporre il segnale originario in componenti ad alta e bassa frequenza; il ruolo della IDCT (Inverse Discrete Cosine Transform) è di ricostruire il segnale originario. Nel caso delle immagini, viene applicato ad un sottoblocco di pixel dell immagine la 2D-DCT, che agisce lungo le due direzioni dell immagine; essendo una funzione lineare invertibile, può essere ottenuta come combinazione lineare in due passi consecutivi di due DCT ad una variabile: in questo modo le operazioni aritmetiche effettuate si riducono da nxn a n+n. JPEG è uno dei più diffusi metodi di compressione lossy delle immagini. Esso utilizza la 2D-DCT per ricavare informazioni sulla frequenza spaziale, in modo da individuare le basse frequenze (cioè il grosso dell immagine) e le alte frequenze (cioè i dettagli). L utilizzo della DCT ha tre motivazioni: la prima è che il contenuto utile delle immagini reali cambia relativamente poco all interno di una regione, per cui è difficile trovare una grande differenza d intensità tra i pixel di una regione analizzata ( spatial redundancy ); la seconda è che l occhio umano non percepisce molto la perdita d informazioni alle alte frequenze, per cui la spatial redundancy può essere ridotta riducendo le componenti alle alte frequenze; la terza è che l occhio umano percepisce maggiormente variazioni di grigi piuttosto che dei colori. La compressione JPEG si articola in 5 fasi: 1. trasformazione da spazio RGB a spazio YIQ o YUV (dove Y è la luminanza e I e Q o U e V rappresentano la crominanza) e sottocampionamento dei colori 2. DCT su un singolo blocco dell immagine 18

19 3. quantizzazione 4. ordinamento a zig-zag e codifica Run-length 5. codifica entropica (Entropy coding) Ogni immagine è divisa in blocchi 8x8, il cui insieme forma lo Scan. La 2D DCT è applicata a ciascun blocco producendo in uscita dei valori F (u, v) per ogni blocco; l effetto è quello di produrre un immagine a quadrettini. La quantizzazione viene effettuata tramite una funzione di approssimazione F (u, v) round( Q(u, v) ) con Q(u, v) coefficienti di una matrice di quantizzazione, che sono più alti (e quindi introducono maggiore perdita) verso l angolo in basso a destra, cioè alle alte frequenze. Questa è la fase che determina la perdita delle informazioni in JPEG. Un file JPEG può essere generato in 4 modi: sequential mode, quello di default, con una scansione da sinistra a destra e dall alto verso il basso; progressive mode; hierarchical mode; lossless mode (meno utilizzato). Un tipico file JPEG JPEG 2000 è un algoritmo di compressione delle immagini successivo a JPEG, che è stato introdotto principalmente per avere un miglior compromesso tra compressione e qualità visiva. Il processo di compressione segue quello di JPEG, con la differenza tecnica sostanziale che al posto della DCT utilizza la trasformata wavelet, per produrre un analisi multiscala e multirisoluzione: invece di effettuare la codifica sui singoli blocchi 8x8, la wavelet codifica le singole bande e le singole scale. L algoritmo può essere sia lossless che lossy, a seconda che venga utilizzata una wavelet reversibile o irreversibile. L insieme delle bande individuate costituiscono delle regioni, che vengono quantizzate e codificate in code blocks tramite l algoritmo di EBCOT. Il vantaggio, quindi, è quello di avere meno distorsioni, un miglior rapporto di compressione e quindi immagini compresse migliori in qualità. 8.4 Compressione Video Un video è una successione d immagini (frames) ordinate nel tempo in modo da riprodurre un movimento. Poichè due frame successive sono molto simili 19

20 fra loro, la ridondanza temporale che s introdurrebbe codificando ogni frame sarebbe molto elevata. Per cui vengono codificate la differenza tra una frame e una sequenza di altre frame successive, caratterizzate da piccoli livelli d entropia. L algoritmo di compressione più utilizzato è il Motion Compensation (MC). L elaborazione principale di quest algoritmo è la motion vector search. Innanzitutto ogni immagine viene divisa in macroblocchi NxN, la frame corrente è la target frame ; viene effettuato un match tra il macroblocco della target frame e il più simile macroblocco delle frame precedenti o successive (la similarità è giudicata in base alla minima Mean Absolute Difference, MAD). Lo spostamento del macroblocco trovato con quello del target frame è il motion vector (MV); l MV viene ricercato solitamente nelle immediate vicinanze del macroblocco di partenza, e tale ricerca può essere effettuata anche su una rappresentazione multiscala e multirisoluzione. Uno dei primi standard per la compressione video è H.261. Il prinicipio di base è MC; fu introdotto per trasmettere videoconferenze su linee ISDN e ha rappresentato le basi della codifica MPEG. Esso è caratterizzato da un certo frame rate e da un ritardo, così come altri standard della famiglia H.xxx a cui appartiene. Una tipica frequenza di frame H.261 è costituita da Intraframes I (frame statiche, per il background) e Inter-frames P (frame dinamiche). Le I-frames vengono trattate come immagini indipendenti, quindi si applicano tecniche di conversioni simili a JPEG; le P-frames dipendono invece da I-frames e dalle precedenti P-frames, su di esse viene effettuata una codifica predittiva rispetto ad una P-frames precedente per eliminare la ridondanza temporale. MPEG è un comitato che si è occupato di standardizzare formati di rappresentazione audio e video. Il primo formato video è stato MPEG-1: è basato sul formato televisivo digitale SIF, supporta solo video non interlacciato (l interlacciamento è una tecnica che permette di aumentare la qualità video senza aumentare la banda) e basse risoluzioni spaziali (352x240). L algoritmo utilizzato è MC, basato su H.261 con macroblocchi, con la differenza che la ricerca è effettuata anche sulle frame successive (B-frame). I dati sono organizzati in modo gerarchico a livelli all interno del file: precisamente abbiamo un Group of Pictures (GOP), fatto di pictures, a loro volta divise in slice, divise in macroblocchi, divisi in blocchi su cui si applica alla fine la codifica differenziale. 20

Il campionamento. La digitalizzazione. Teoria e pratica. La rappresentazione digitale delle immagini. La rappresentazione digitale delle immagini

Il campionamento. La digitalizzazione. Teoria e pratica. La rappresentazione digitale delle immagini. La rappresentazione digitale delle immagini ACQUISIZIONE ED ELABORAZIONE DELLE IMMAGINI Teoria e pratica La digitalizzazione La digitalizzazione di oggetti legati a fenomeni di tipo analogico, avviene attraverso due parametri fondamentali: Il numero

Dettagli

gestione e modifica di immagini fotografiche digitali

gestione e modifica di immagini fotografiche digitali gestione e modifica di immagini fotografiche digitali il colore e le immagini la gestione delle immagini Il computer è in grado di gestire le immagini in formato digitale. Gestire vuol dire acquisirle,

Dettagli

Capitolo V : Il colore nelle immagini digitali

Capitolo V : Il colore nelle immagini digitali Capitolo V : Il colore nelle immagini digitali Lavorare con il colore nelle immagini digitali L uso dei colori nella visione computerizzata e nella computer grafica implica l incorrere in determinate problematiche

Dettagli

Informatica grafica e Multimedialità. 4 Immagini grafiche

Informatica grafica e Multimedialità. 4 Immagini grafiche Immagini raster e vettoriali Le immagini grafiche si distinguono in due classi differenti: immagini raster e immagini vettoriali. Le immagini raster, dette anche pittoriche o pixel-oriented, dividono l

Dettagli

Un ripasso di aritmetica: Rappresentazione binaria - operazioni. riporti

Un ripasso di aritmetica: Rappresentazione binaria - operazioni. riporti Un ripasso di aritmetica: Rappresentazione binaria - operazioni A queste rappresentazioni si possono applicare le operazioni aritmetiche: riporti 1 1 0 + 1 0 = 1 0 0 24 Un ripasso di aritmetica: Rappresentazione

Dettagli

C M A P M IONAM A E M NT N O

C M A P M IONAM A E M NT N O IMMAGINE DIGITALE Nelle immagini digitali, il contenuto fotografico (radiometria) viene registrato sotto forma di numeri. Si giunge a tale rappresentazione (RASTER) suddividendo l immagine fotografica

Dettagli

Librerie digitali. Video. Gestione di video. Caratteristiche dei video. Video. Metadati associati ai video. Metadati associati ai video

Librerie digitali. Video. Gestione di video. Caratteristiche dei video. Video. Metadati associati ai video. Metadati associati ai video Video Librerie digitali Gestione di video Ogni filmato è composto da più parti Video Audio Gestito come visto in precedenza Trascrizione del testo, identificazione di informazioni di interesse Testo Utile

Dettagli

connessioni tra i singoli elementi Hanno caratteristiche diverse e sono presentati con modalità diverse Tali relazioni vengono rappresentate QUINDI

connessioni tra i singoli elementi Hanno caratteristiche diverse e sono presentati con modalità diverse Tali relazioni vengono rappresentate QUINDI Documenti su Internet LINGUAGGI DI MARKUP Internet permette (tra l altro) di accedere a documenti remoti In generale, i documenti acceduti via Internet sono multimediali, cioè che possono essere riprodotti

Dettagli

Il colore. IGEA 2006-07 7 febbraio 2007

Il colore. IGEA 2006-07 7 febbraio 2007 Il colore IGEA 2006-07 7 febbraio 2007 La luce Radiazione elettromagnetica 380 740 nanometri (790 480 THz) Percezione della luce /1 Organi sensoriali: Bastoncelli Molto sensibili (anche a un solo fotone:

Dettagli

Le immagini digitali. Le immagini digitali. Caterina Balletti. Caterina Balletti. Immagini grafiche. Trattamento di immagini digitali.

Le immagini digitali. Le immagini digitali. Caterina Balletti. Caterina Balletti. Immagini grafiche. Trattamento di immagini digitali. 1 Le immagini digitali Le immagini digitali Università IUAV di venezia Trattamento di immagini digitali immagini grafiche immagini raster immagini vettoriali acquisizione trattamento geometrico trattamento

Dettagli

INFORMATICA E GRAFICA PER IL WEB

INFORMATICA E GRAFICA PER IL WEB INFORMATICA E GRAFICA PER IL WEB Psicologia e comunicazione A.A. 2013/2014 Università degli studi Milano-Bicocca docente: Diana Quarti INFORMATICA E GRAFICA PER IL WEB A.A. 2013/2014 docente: Diana Quarti

Dettagli

Corso di Visione Artificiale. Filtri parte I. Samuel Rota Bulò

Corso di Visione Artificiale. Filtri parte I. Samuel Rota Bulò Corso di Visione Artificiale Filtri parte I Samuel Rota Bulò Filtri spaziali Un filtro spaziale è caratterizzato da un intorno e un'operazione che deve essere eseguita sui pixels dell'immagine in quell'intorno.

Dettagli

La codifica delle immagini

La codifica delle immagini La codifica delle immagini La digitalizzazione La digitalizzazione di oggetti legati a fenomeni di tipo analogico, avviene attraverso due parametri fondamentali: 1. Il numero dei campionamenti o di misurazioni

Dettagli

Immagini digitali Appunti per la classe 3 R a cura del prof. ing. Mario Catalano

Immagini digitali Appunti per la classe 3 R a cura del prof. ing. Mario Catalano Immagini digitali LA CODIFICA DELLE IMMAGINI Anche le immagini possono essere memorizzate in forma numerica (digitale) suddividendole in milioni di punti, per ognuno dei quali si definisce il colore in

Dettagli

IMMAGINE BITMAP E VETTORIALI

IMMAGINE BITMAP E VETTORIALI BITMAP VETTORIALE VETTORIALE BITMAP IMMAGINE BITMAP è una immagine costituita da una matrice di Pixel. PIXEL (picture element) indica ciascuno degli elementi puntiformi che compongono la rappresentazione

Dettagli

Codifica delle Informazioni

Codifica delle Informazioni Codifica delle Informazioni Luca Bortolussi Dipartimento di Matematica e Informatica Università degli studi di Trieste Panoramica Le informazioni gestite dai sistemi di elaborazione devono essere codificate

Dettagli

Introduzione all analisi dei segnali digitali.

Introduzione all analisi dei segnali digitali. Introduzione all analisi dei segnali digitali. Lezioni per il corso di Laboratorio di Fisica IV Isidoro Ferrante A.A. 2001/2002 1 Segnali analogici Si dice segnale la variazione di una qualsiasi grandezza

Dettagli

Dal foglio di carta alla multimedialità

Dal foglio di carta alla multimedialità Dal foglio di carta alla multimedialità Multimediale Che utilizza più mezzi di comunicazione. Nell'ambito delle tecnologie educative significa utilizzare più mezzi didattici integrati. IPERTESTO E IPERMEDIA

Dettagli

Codifiche a lunghezza variabile

Codifiche a lunghezza variabile Sistemi Multimediali Codifiche a lunghezza variabile Marco Gribaudo marcog@di.unito.it, gribaudo@elet.polimi.it Assegnazione del codice Come visto in precedenza, per poter memorizzare o trasmettere un

Dettagli

Immagini vettoriali. Immagini raster

Immagini vettoriali. Immagini raster Immagini vettoriali Le immagini vettoriali sono caratterizzate da linee e curve definite da entità matematiche chiamate vettori. I vettori sono segmenti definiti da un punto di origine, una direzione e

Dettagli

Sommario. Definizione di informatica. Definizione di un calcolatore come esecutore. Gli algoritmi.

Sommario. Definizione di informatica. Definizione di un calcolatore come esecutore. Gli algoritmi. Algoritmi 1 Sommario Definizione di informatica. Definizione di un calcolatore come esecutore. Gli algoritmi. 2 Informatica Nome Informatica=informazione+automatica. Definizione Scienza che si occupa dell

Dettagli

Basi di Dati Multimediali. Fabio Strocco

Basi di Dati Multimediali. Fabio Strocco Basi di Dati Multimediali Fabio Strocco September 19, 2011 1 Contents 2 Introduzione Le basi di dati (o database) hanno applicazioni in molti campi, in cui è necessario memorizzare, analizzare e gestire

Dettagli

Test percettivi per la valutazione del contrasto di immagini digitali

Test percettivi per la valutazione del contrasto di immagini digitali Agenzia Nazionale per le Nuove Tecnologie, l Energia e lo Sviluppo Economico Sostenibile RICERCA DI SISTEMA ELETTRICO Test percettivi per la valutazione del contrasto di immagini digitali Alessandro Rizzi,

Dettagli

Il concetto di valore medio in generale

Il concetto di valore medio in generale Il concetto di valore medio in generale Nella statistica descrittiva si distinguono solitamente due tipi di medie: - le medie analitiche, che soddisfano ad una condizione di invarianza e si calcolano tenendo

Dettagli

Strutturazione logica dei dati: i file

Strutturazione logica dei dati: i file Strutturazione logica dei dati: i file Informazioni più complesse possono essere composte a partire da informazioni elementari Esempio di una banca: supponiamo di voler mantenere all'interno di un computer

Dettagli

Lezione 8. La macchina universale

Lezione 8. La macchina universale Lezione 8 Algoritmi La macchina universale Un elaboratore o computer è una macchina digitale, elettronica, automatica capace di effettuare trasformazioni o elaborazioni su i dati digitale= l informazione

Dettagli

Immagini vettoriali Immagini bitmap (o raster) Le immagini vettoriali .cdr.swf .svg .ai.dfx .eps.pdf .psd

Immagini vettoriali Immagini bitmap (o raster) Le immagini vettoriali .cdr.swf .svg .ai.dfx .eps.pdf .psd Esistono due tipi di immagini digitali: Immagini vettoriali, rappresentate come funzioni vettoriali che descrivono curve e poligoni Immagini bitmap, (o raster) rappresentate sul supporto digitale come

Dettagli

Capitolo 6 ELABORAZIONE DI IMMAGINI A COLORI

Capitolo 6 ELABORAZIONE DI IMMAGINI A COLORI Capitolo 6 ELABORAZIONE DI IMMAGINI A COLORI Il colore viene utilizzato nelle immagini digitali per due motivi principali: è un descrittore che semplifica l identificazione di un oggetto e la sua estrazione

Dettagli

Cosa è un foglio elettronico

Cosa è un foglio elettronico Cosa è un foglio elettronico Versione informatica del foglio contabile Strumento per l elaborazione di numeri (ma non solo...) I valori inseriti possono essere modificati, analizzati, elaborati, ripetuti

Dettagli

INFORMATICA. Elaborazione delle immagini digitali. Università degli Studi di Foggia Dipartimento di Medicina Clinica e Sperimentale

INFORMATICA. Elaborazione delle immagini digitali. Università degli Studi di Foggia Dipartimento di Medicina Clinica e Sperimentale INFORMATICA Università degli Studi di Foggia Dipartimento di Medicina Clinica e Sperimentale A.A. 2014/2015 II ANNO II SEMESTRE 2 CFU CORSO DI LAUREA MAGISTRALE IN SCIENZE E TECNICHE DELLE ATTIVITÀ MOTORIE

Dettagli

Corso di Visione Artificiale. Immagini digitali. Samuel Rota Bulò

Corso di Visione Artificiale. Immagini digitali. Samuel Rota Bulò Corso di Visione Artificiale Immagini digitali Samuel Rota Bulò Immagini digitali Un immagine viene generata dalla combinazione di una sorgente di energia e la riflessione o assorbimento di energia da

Dettagli

Elementi di teoria dei segnali /b

Elementi di teoria dei segnali /b Elementi di teoria dei segnali /b VERSIONE 29.4.01 Filtri e larghezza di banda dei canali Digitalizzazione e teorema del campionamento Capacità di canale e larghezza di banda Multiplexing e modulazioni

Dettagli

Informatica per la comunicazione" - lezione 7 -

Informatica per la comunicazione - lezione 7 - Informatica per la comunicazione - lezione 7 - Campionamento La codifica dei suoni si basa sulla codifica delle onde che li producono, a sua volta basata su una procedura chiamata campionamento.! Il campionamento

Dettagli

Introduzione all Information Retrieval

Introduzione all Information Retrieval Introduzione all Information Retrieval Argomenti della lezione Definizione di Information Retrieval. Information Retrieval vs Data Retrieval. Indicizzazione di collezioni e ricerca. Modelli per Information

Dettagli

Excel. A cura di Luigi Labonia. e-mail: luigi.lab@libero.it

Excel. A cura di Luigi Labonia. e-mail: luigi.lab@libero.it Excel A cura di Luigi Labonia e-mail: luigi.lab@libero.it Introduzione Un foglio elettronico è un applicazione comunemente usata per bilanci, previsioni ed altri compiti tipici del campo amministrativo

Dettagli

Organizzazione degli archivi

Organizzazione degli archivi COSA E UN DATA-BASE (DB)? è l insieme di dati relativo ad un sistema informativo COSA CARATTERIZZA UN DB? la struttura dei dati le relazioni fra i dati I REQUISITI DI UN DB SONO: la ridondanza minima i

Dettagli

Algoritmi e strutture dati. Codici di Huffman

Algoritmi e strutture dati. Codici di Huffman Algoritmi e strutture dati Codici di Huffman Memorizzazione dei dati Quando un file viene memorizzato, esso va memorizzato in qualche formato binario Modo più semplice: memorizzare il codice ASCII per

Dettagli

ELETTRONICA DIGITALE

ELETTRONICA DIGITALE ELETTRONICA DIGITALE Ebbe praticamente inizio nel 1946 con il calcolatore elettronico chiamato ENIAC, realizzato con 18.000 valvole termoioniche, occupava 180 mq e consumava 200 kw. Ma l'idea che sta alla

Dettagli

Informatica. Rappresentazione binaria Per esempio +101010000 diventa +0.10101 10 18/10/2007. Introduzione ai sistemi informatici 1

Informatica. Rappresentazione binaria Per esempio +101010000 diventa +0.10101 10 18/10/2007. Introduzione ai sistemi informatici 1 Informatica Pietro Storniolo storniolo@csai.unipa.it http://www.pa.icar.cnr.it/storniolo/info200708 Numeri razionali Cifre più significative: : sono le cifre associate ai pesi maggiori per i numeri maggiori

Dettagli

Architettura del. Sintesi dei livelli di rete. Livelli di trasporto e inferiori (Livelli 1-4)

Architettura del. Sintesi dei livelli di rete. Livelli di trasporto e inferiori (Livelli 1-4) Architettura del WWW World Wide Web Sintesi dei livelli di rete Livelli di trasporto e inferiori (Livelli 1-4) - Connessione fisica - Trasmissione dei pacchetti ( IP ) - Affidabilità della comunicazione

Dettagli

Database. Si ringrazia Marco Bertini per le slides

Database. Si ringrazia Marco Bertini per le slides Database Si ringrazia Marco Bertini per le slides Obiettivo Concetti base dati e informazioni cos è un database terminologia Modelli organizzativi flat file database relazionali Principi e linee guida

Dettagli

Scopo della lezione. Informatica. Informatica - def. 1. Informatica

Scopo della lezione. Informatica. Informatica - def. 1. Informatica Scopo della lezione Informatica per le lauree triennali LEZIONE 1 - Che cos è l informatica Introdurre i concetti base della materia Definire le differenze tra hardware e software Individuare le applicazioni

Dettagli

PDF created with pdffactory trial version www.pdffactory.com

PDF created with pdffactory trial version www.pdffactory.com Codifica di immagini Codifica di immagini o Un immagine è un insieme continuo di informazioni A differenza delle cifre e dei caratteri alfanumerici, per le immagini non esiste un'unità minima di riferimento

Dettagli

0.6 Filtro di smoothing Gaussiano

0.6 Filtro di smoothing Gaussiano 2 Figura 7: Filtro trapezoidale passa basso. In questo filtro l rappresenta la frequenza di taglio ed l, l rappresenta un intervallo della frequenza con variazione lineare di H, utile ad evitare le brusche

Dettagli

LE FUNZIONI A DUE VARIABILI

LE FUNZIONI A DUE VARIABILI Capitolo I LE FUNZIONI A DUE VARIABILI In questo primo capitolo introduciamo alcune definizioni di base delle funzioni reali a due variabili reali. Nel seguito R denoterà l insieme dei numeri reali mentre

Dettagli

Indice generale. OOA Analisi Orientata agli Oggetti. Introduzione. Analisi

Indice generale. OOA Analisi Orientata agli Oggetti. Introduzione. Analisi Indice generale OOA Analisi Orientata agli Oggetti Introduzione Analisi Metodi d' analisi Analisi funzionale Analisi del flusso dei dati Analisi delle informazioni Analisi Orientata agli Oggetti (OOA)

Dettagli

La Visione Artificiale. La vis ione delle macchine La vis ione umana Acquis izione di immag ine

La Visione Artificiale. La vis ione delle macchine La vis ione umana Acquis izione di immag ine La Visione Artificiale La vis ione delle macchine La vis ione umana Acquis izione di immag ine Copyright Alcune slide sono tratte dal testo: Digital Image Processing Materiale didattico relativo si trova

Dettagli

Corso di. Dott.ssa Donatella Cocca

Corso di. Dott.ssa Donatella Cocca Corso di Statistica medica e applicata Dott.ssa Donatella Cocca 1 a Lezione Cos'è la statistica? Come in tutta la ricerca scientifica sperimentale, anche nelle scienze mediche e biologiche è indispensabile

Dettagli

Rappresentazione delle immagini

Rappresentazione delle immagini Rappresentazione delle immagini Le immagini sono informazioni continue in tre dimensioni: due spaziali ed una colorimetrica. Per codificarle occorre operare tre discretizzazioni. Due discretizzazioni spaziali

Dettagli

Corrispondenze e funzioni

Corrispondenze e funzioni Corrispondenze e funzioni L attività fondamentale della mente umana consiste nello stabilire corrispondenze e relazioni tra oggetti; è anche per questo motivo che il concetto di corrispondenza è uno dei

Dettagli

la scienza della rappresentazione e della elaborazione dell informazione

la scienza della rappresentazione e della elaborazione dell informazione Sistema binario Sommario informatica rappresentare informazioni la differenza Analogico/Digitale i sistemi di numerazione posizionali il sistema binario Informatica Definizione la scienza della rappresentazione

Dettagli

Linguaggi e Paradigmi di Programmazione

Linguaggi e Paradigmi di Programmazione Linguaggi e Paradigmi di Programmazione Cos è un linguaggio Definizione 1 Un linguaggio è un insieme di parole e di metodi di combinazione delle parole usati e compresi da una comunità di persone. È una

Dettagli

La codifica delle Immagini. Prof. Francesco Accarino IIS Altiero Spinelli Via Leopardi 132Sesto San Giovanni

La codifica delle Immagini. Prof. Francesco Accarino IIS Altiero Spinelli Via Leopardi 132Sesto San Giovanni La codifica delle Immagini Prof. Francesco Accarino IIS Altiero Spinelli Via Leopardi 132Sesto San Giovanni Lettere e numeri non costituiscono le uniche informazioni utilizzate dagli elaboratori, infatti

Dettagli

1. BASI DI DATI: GENERALITÀ

1. BASI DI DATI: GENERALITÀ 1. BASI DI DATI: GENERALITÀ BASE DI DATI (DATABASE, DB) Raccolta di informazioni o dati strutturati, correlati tra loro in modo da risultare fruibili in maniera ottimale. Una base di dati è usualmente

Dettagli

Telerilevamento e GIS Prof. Ing. Giuseppe Mussumeci

Telerilevamento e GIS Prof. Ing. Giuseppe Mussumeci Corso di Laurea Magistrale in Ingegneria per l Ambiente e il Territorio A.A. 2014-2015 Telerilevamento e GIS Prof. Ing. Giuseppe Mussumeci Strutture di dati: DB e DBMS DATO E INFORMAZIONE Dato: insieme

Dettagli

EXCEL PER WINDOWS95. sfruttare le potenzialità di calcolo dei personal computer. Essi si basano su un area di lavoro, detta foglio di lavoro,

EXCEL PER WINDOWS95. sfruttare le potenzialità di calcolo dei personal computer. Essi si basano su un area di lavoro, detta foglio di lavoro, EXCEL PER WINDOWS95 1.Introduzione ai fogli elettronici I fogli elettronici sono delle applicazioni che permettono di sfruttare le potenzialità di calcolo dei personal computer. Essi si basano su un area

Dettagli

EXPLOit Content Management Data Base per documenti SGML/XML

EXPLOit Content Management Data Base per documenti SGML/XML EXPLOit Content Management Data Base per documenti SGML/XML Introduzione L applicazione EXPLOit gestisce i contenuti dei documenti strutturati in SGML o XML, utilizzando il prodotto Adobe FrameMaker per

Dettagli

Introduzione alla programmazione in C

Introduzione alla programmazione in C Introduzione alla programmazione in C Testi Consigliati: A. Kelley & I. Pohl C didattica e programmazione B.W. Kernighan & D. M. Ritchie Linguaggio C P. Tosoratti Introduzione all informatica Materiale

Dettagli

ARCHITETTURA DI RETE FOLEGNANI ANDREA

ARCHITETTURA DI RETE FOLEGNANI ANDREA ARCHITETTURA DI RETE FOLEGNANI ANDREA INTRODUZIONE È denominata Architettura di rete un insieme di livelli e protocolli. Le reti sono organizzate gerarchicamente in livelli, ciascuno dei quali interagisce

Dettagli

Matematica e Statistica

Matematica e Statistica Matematica e Statistica Prova d esame (0/07/03) Università di Verona - Laurea in Biotecnologie - A.A. 0/3 Matematica e Statistica Prova di MATEMATICA (0/07/03) Università di Verona - Laurea in Biotecnologie

Dettagli

Le immagini digitali. formati, caratteristiche e uso. Testo e foto di Mario Ceppi

Le immagini digitali. formati, caratteristiche e uso. Testo e foto di Mario Ceppi Le immagini digitali formati, caratteristiche e uso Testo e foto di Mario Ceppi GIF Ideale per la rappresentazione di immagini sul Web come gif animate, pulsanti e intestazioni, non è invece adatto alle

Dettagli

Unione Europea Repubblica Italiana Regione Calabria Cooperativa sociale

Unione Europea Repubblica Italiana Regione Calabria Cooperativa sociale INFORMATICA Lezione 1 Docente Ferrante Francesco fracco2004@alice.it Sito web: http://luis7.altervista.org Obiettivi del corso Una parte generale sull'introduzione dei concetti di base dell'informatica

Dettagli

Esame di INFORMATICA

Esame di INFORMATICA Università di L Aquila Facoltà di Biotecnologie Esame di INFORMATICA Lezione 4 MACCHINA DI VON NEUMANN Anni 40 i dati e i programmi che descrivono come elaborare i dati possono essere codificati nello

Dettagli

Mon Ami 3000 Varianti articolo Gestione di varianti articoli

Mon Ami 3000 Varianti articolo Gestione di varianti articoli Prerequisiti Mon Ami 3000 Varianti articolo Gestione di varianti articoli L opzione Varianti articolo è disponibile per le versioni Azienda Light e Azienda Pro e include tre funzionalità distinte: 1. Gestione

Dettagli

Access. P a r t e p r i m a

Access. P a r t e p r i m a Access P a r t e p r i m a 1 Esempio di gestione di database con MS Access 2 Cosa è Access? Access e un DBMS che permette di progettare e utilizzare DB relazionali Un DB Access e basato sui concetti di

Dettagli

Dispensa di Informatica I.1

Dispensa di Informatica I.1 IL COMPUTER: CONCETTI GENERALI Il Computer (o elaboratore) è un insieme di dispositivi di diversa natura in grado di acquisire dall'esterno dati e algoritmi e produrre in uscita i risultati dell'elaborazione.

Dettagli

Immagini digitali. Paolo Zatelli. Dipartimento di Ingegneria Civile ed Ambientale Università di Trento. Immagini digitali

Immagini digitali. Paolo Zatelli. Dipartimento di Ingegneria Civile ed Ambientale Università di Trento. Immagini digitali Immagini digitali Immagini digitali Paolo Zatelli Dipartimento di Ingegneria Civile ed Ambientale Università di Trento Paolo Zatelli Università di Trento 1 / 22 Immagini digitali Outline 1 Immagini digitali

Dettagli

ControlloCosti. Cubi OLAP. Controllo Costi Manuale Cubi

ControlloCosti. Cubi OLAP. Controllo Costi Manuale Cubi ControlloCosti Cubi OLAP I cubi OLAP Un Cubo (OLAP, acronimo di On-Line Analytical Processing) è una struttura per la memorizzazione e la gestione dei dati che permette di eseguire analisi in tempi rapidi,

Dettagli

Introduzione alle basi di dati. Gestione delle informazioni. Gestione delle informazioni. Sistema informatico

Introduzione alle basi di dati. Gestione delle informazioni. Gestione delle informazioni. Sistema informatico Introduzione alle basi di dati Introduzione alle basi di dati Gestione delle informazioni Base di dati Modello dei dati Indipendenza dei dati Accesso ai dati Vantaggi e svantaggi dei DBMS Gestione delle

Dettagli

Lezione 2: Immagini digitali (1)

Lezione 2: Immagini digitali (1) Lezione 2: Immagini digitali (1) Informatica e produzione Multimediale Docente: Umberto Castellani Immagini digitali Digitalizzazione o acquisizione di immagini del mondo reale (es. da una fotografia).

Dettagli

Capitolo 13: L offerta dell impresa e il surplus del produttore

Capitolo 13: L offerta dell impresa e il surplus del produttore Capitolo 13: L offerta dell impresa e il surplus del produttore 13.1: Introduzione L analisi dei due capitoli precedenti ha fornito tutti i concetti necessari per affrontare l argomento di questo capitolo:

Dettagli

ISTITUTO TECNICO ECONOMICO MOSSOTTI

ISTITUTO TECNICO ECONOMICO MOSSOTTI CLASSE III INDIRIZZO S.I.A. UdA n. 1 Titolo: conoscenze di base Conoscenza delle caratteristiche dell informatica e degli strumenti utilizzati Informatica e sistemi di elaborazione Conoscenza delle caratteristiche

Dettagli

2) Codici univocamente decifrabili e codici a prefisso.

2) Codici univocamente decifrabili e codici a prefisso. Argomenti della Lezione ) Codici di sorgente 2) Codici univocamente decifrabili e codici a prefisso. 3) Disuguaglianza di Kraft 4) Primo Teorema di Shannon 5) Codifica di Huffman Codifica di sorgente Il

Dettagli

Progettazione di Basi di Dati

Progettazione di Basi di Dati Progettazione di Basi di Dati Prof. Nicoletta D Alpaos & Prof. Andrea Borghesan Entità-Relazione Progettazione Logica 2 E il modo attraverso il quale i dati sono rappresentati : fa riferimento al modello

Dettagli

Corso di Informatica

Corso di Informatica Corso di Informatica Modulo T2 3-Compilatori e interpreti 1 Prerequisiti Principi di programmazione Utilizzo di un compilatore 2 1 Introduzione Una volta progettato un algoritmo codificato in un linguaggio

Dettagli

Relazioni statistiche: regressione e correlazione

Relazioni statistiche: regressione e correlazione Relazioni statistiche: regressione e correlazione È detto studio della connessione lo studio si occupa della ricerca di relazioni fra due variabili statistiche o fra una mutabile e una variabile statistica

Dettagli

Siamo così arrivati all aritmetica modulare, ma anche a individuare alcuni aspetti di come funziona l aritmetica del calcolatore come vedremo.

Siamo così arrivati all aritmetica modulare, ma anche a individuare alcuni aspetti di come funziona l aritmetica del calcolatore come vedremo. DALLE PESATE ALL ARITMETICA FINITA IN BASE 2 Si è trovato, partendo da un problema concreto, che con la base 2, utilizzando alcune potenze della base, operando con solo addizioni, posso ottenere tutti

Dettagli

Sistemi Informativi Territoriali. Map Algebra

Sistemi Informativi Territoriali. Map Algebra Paolo Mogorovich Sistemi Informativi Territoriali Appunti dalle lezioni Map Algebra Cod.735 - Vers.E57 1 Definizione di Map Algebra 2 Operatori locali 3 Operatori zonali 4 Operatori focali 5 Operatori

Dettagli

Immagini Digitali Immagini digitali

Immagini Digitali Immagini digitali Immagini digitali Processi e metodi per la codifica e il trattamento dei formati raster e vettoriali Immagini raster Fondamenti Le immagini raster, chiamate anche pittoriche o bitmap, sono immagini in

Dettagli

Le immagini digitali: introduzione

Le immagini digitali: introduzione Le immagini digitali: introduzione 1 L immagine digitale Un immagine pittorica è compsta da milioni di pigmenti colorati molto piccoli che, messi vicino l uno all altro, danno l impressione dei vari oggetti.

Dettagli

Dispensa di database Access

Dispensa di database Access Dispensa di database Access Indice: Database come tabelle; fogli di lavoro e tabelle...2 Database con più tabelle; relazioni tra tabelle...2 Motore di database, complessità di un database; concetto di

Dettagli

Hub-PA Versione 1.0.6 Manuale utente

Hub-PA Versione 1.0.6 Manuale utente Hub-PA Versione 1.0.6 Manuale utente (Giugno 2014) Hub-PA è la porta d ingresso al servizio di fatturazione elettronica verso la Pubblica Amministrazione (PA) a disposizione di ogni fornitore. Questo manuale

Dettagli

Il database management system Access

Il database management system Access Il database management system Access Corso di autoistruzione http://www.manualipc.it/manuali/ corso/manuali.php? idcap=00&idman=17&size=12&sid= INTRODUZIONE Il concetto di base di dati, database o archivio

Dettagli

Un ripasso di aritmetica: Conversione dalla base 10 alla base 16

Un ripasso di aritmetica: Conversione dalla base 10 alla base 16 Un ripasso di aritmetica: Conversione dalla base 1 alla base 16 Dato un numero N rappresentato in base dieci, la sua rappresentazione in base sedici sarà del tipo: c m c m-1... c 1 c (le c i sono cifre

Dettagli

CMS ERMES INFORMATICA

CMS ERMES INFORMATICA 01/07/2014 Guida di riferimento alla pubblicazione di contenuti sul portale Il presente documento costituisce una guida di riferimento all aggiornamento e alla pubblicazione di contenuti sui portali web

Dettagli

Il Campionameto dei segnali e la loro rappresentazione. 1 e prende il nome frequenza di

Il Campionameto dei segnali e la loro rappresentazione. 1 e prende il nome frequenza di Il Campionameto dei segnali e la loro rappresentazione Il campionamento consente, partendo da un segnale a tempo continuo ovvero che fluisce con continuità nel tempo, di ottenere un segnale a tempo discreto,

Dettagli

L informazione grafica. Le immagini digitali. Esempi. Due grandi categorie. Introduzione

L informazione grafica. Le immagini digitali. Esempi. Due grandi categorie. Introduzione 1 2 L informazione grafica Le immagini digitali grafica a caratteri grafica vettoriale Introduzione grafica raster 3 4 Due grandi categorie Esempi Immagini reali: acquisite da una scena reale mediante

Dettagli

BASI DI DATI per la gestione dell informazione. Angelo Chianese Vincenzo Moscato Antonio Picariello Lucio Sansone

BASI DI DATI per la gestione dell informazione. Angelo Chianese Vincenzo Moscato Antonio Picariello Lucio Sansone BASI DI DATI per la gestione dell informazione Angelo Chianese Vincenzo Moscato Antonio Picariello Lucio Sansone Libro di Testo 22 Chianese, Moscato, Picariello e Sansone BASI DI DATI per la Gestione dell

Dettagli

Archivi e database. Prof. Michele Batocchi A.S. 2013/2014

Archivi e database. Prof. Michele Batocchi A.S. 2013/2014 Archivi e database Prof. Michele Batocchi A.S. 2013/2014 Introduzione L esigenza di archiviare (conservare documenti, immagini, ricordi, ecc.) è un attività senza tempo che è insita nell animo umano Primi

Dettagli

Elaborazione testi: immagini

Elaborazione testi: immagini by Studio Elfra sas Gestione Immagini Aggiornato a Aprile 2009 Informatica di base 1 Elaborazione testi: immagini Il testo di un documento di Word può essere integrato con immagini di vario tipo: 2 1 Elaborazione

Dettagli

Come si misura la memoria di un calcolatore?

Come si misura la memoria di un calcolatore? Come si misura la memoria di un calcolatore? Definizione Il byte è definito come unità di misura di memoria. I multipli del byte sono: KiloByte (KB) - 1 KB = 2 10 byte = 1024 byte MegaByte (MB) - 1 MB

Dettagli

Database 1 biblioteca universitaria. Testo del quesito

Database 1 biblioteca universitaria. Testo del quesito Database 1 biblioteca universitaria Testo del quesito Una biblioteca universitaria acquista testi didattici su indicazione dei professori e cura il prestito dei testi agli studenti. La biblioteca vuole

Dettagli

Reti di Calcolatori. Il Livello delle Applicazioni

Reti di Calcolatori. Il Livello delle Applicazioni Reti di Calcolatori Il Livello delle Applicazioni Il DNS Gli indirizzi IP sono in formato numerico: sono difficili da ricordare; Ricordare delle stringhe di testo è sicuramente molto più semplice; Il Domain

Dettagli

Lezione 1. Introduzione e Modellazione Concettuale

Lezione 1. Introduzione e Modellazione Concettuale Lezione 1 Introduzione e Modellazione Concettuale 1 Tipi di Database ed Applicazioni Database Numerici e Testuali Database Multimediali Geographic Information Systems (GIS) Data Warehouses Real-time and

Dettagli

Esempi di funzione. Scheda Tre

Esempi di funzione. Scheda Tre Scheda Tre Funzioni Consideriamo una legge f che associa ad un elemento di un insieme X al più un elemento di un insieme Y; diciamo che f è una funzione, X è l insieme di partenza e X l insieme di arrivo.

Dettagli

La codifica delle immagini

La codifica delle immagini Lettere e numeri non costituiscono le uniche informazioni utilizzate dagli elaboratori ma si stanno diffondendo sempre di più applicazioni che utilizzano ed elaborano anche altri tipi di informazione:

Dettagli

Per studio di funzione intendiamo un insieme di procedure che hanno lo scopo di analizzare le proprietà di una funzione f ( x) R R

Per studio di funzione intendiamo un insieme di procedure che hanno lo scopo di analizzare le proprietà di una funzione f ( x) R R Studio di funzione Per studio di funzione intendiamo un insieme di procedure che hanno lo scopo di analizzare le proprietà di una funzione f ( x) R R : allo scopo di determinarne le caratteristiche principali.

Dettagli

ColorSplitter. La separazione automatica dei colori di Colibri.. Perché ColorSplitter? Come opera ColorSplitter?

ColorSplitter. La separazione automatica dei colori di Colibri.. Perché ColorSplitter? Come opera ColorSplitter? ColorSplitter La separazione automatica dei colori di Colibri.. ColorSplitter è una nuova funzionalità aggiunta a Colibri, che permette di elaborare un immagine trasformandola in una separata in canali

Dettagli

Giorgio Maria Di Nunzio

Giorgio Maria Di Nunzio Università degli Studi di Padova Dipartimento di Scienze Storiche, Geografiche e dell Antichità Fondamenti di Informatica A.A. 2012/2013 Giorgio Maria Di Nunzio Immagini Digitali Ä Dispense aggiuntive

Dettagli

SISTEMI DI NUMERAZIONE E CODICI

SISTEMI DI NUMERAZIONE E CODICI SISTEMI DI NUMERAZIONE E CODICI Il Sistema di Numerazione Decimale Il sistema decimale o sistema di numerazione a base dieci usa dieci cifre, dette cifre decimali, da O a 9. Il sistema decimale è un sistema

Dettagli