UNIVERSITÀ DEGLI STUDI DI TRIESTE Corso di Elaborazione Elettronica di Immagini IL COLORE PARTE 1 Gabriele Guarnieri
Sommario Percezione e acquisizione del colore 1 Percezione e acquisizione del colore 2 Colorimetria: lo spazio colore standard CIE-XYZ (1931) 3 Adattamento locale, bilanciamento del bianco 4 Spazi colore RGB e YUV/YCbCr
Funzionamento dell occhio Metamerismo e sintesi additiva Sensori di immagine e fotocamere digitali Pellicole fotografiche a colori PERCEZIONE E ACQUISIZIONE DEL COLORE
La sensibilità dell occhio Funzionamento dell occhio Metamerismo e sintesi additiva Sensori di immagine e fotocamere digitali Pellicole fotografiche a colori L occhio contiene due categorie di recettori: bastoncelli e coni. I bastoncelli: Sono 120 10 6, prevalentemente alla periferia della retina Sono sensibili a basse luminosità (1 fotone) Sono responsabili della visione notturna, o scotopica. I coni: Sono 6 10 6, prevalentemente al centro della retina (fovea) Sono meno sensibili alla luce (100 1000 fotoni) Sono responsabili della visione diurna, o fotopica.
Risposta dei recettori Funzionamento dell occhio Metamerismo e sintesi additiva Sensori di immagine e fotocamere digitali Pellicole fotografiche a colori I coni e i bastoncelli, illuminati da luce con spettro I(λ), producono una tensione elettrica V S(λ) I(λ) dλ S(λ) è detto spettro di assorbimento Esistono 3 tipi di coni, sensibili alle lunghezze d onda lunghe (L), medie (M) e corte (S). Questo consente di discriminare, in una certa misura, la lunghezza d onda della luce incidente Visione a colori.
Risposta dei recettori Funzionamento dell occhio Metamerismo e sintesi additiva Sensori di immagine e fotocamere digitali Pellicole fotografiche a colori Da sinistra: spettro di assorbimento (normalizzato) di coni S, bastoncelli, M e L J. K. Bowmaker, H. J. Dartnall, Visual pigments of rods and cones in a human retina, The Journal of Physiology, 298(1), pp. 501 511, 1980.
Metamerismo Percezione e acquisizione del colore Funzionamento dell occhio Metamerismo e sintesi additiva Sensori di immagine e fotocamere digitali Pellicole fotografiche a colori Il colore è dato da 3 grandezze scalari, funzione dello spettro I(λ) della luce incidente. La corrispondenza non è iniettiva. Spettri diversi possono corrispondere allo stesso colore: metameri. Conseguenza: Per riprodurre un colore, non è necessario riprodurre lo spettro. È sufficiente che le risposte L, M, S dei coni siano uguali
Metamerismo Percezione e acquisizione del colore Funzionamento dell occhio Metamerismo e sintesi additiva Sensori di immagine e fotocamere digitali Pellicole fotografiche a colori Esempio di metamerismo. Ai due spettri in figura corrisponde lo stesso colore percepito. S M L S M L 350 700 350 700
Sintesi additiva Percezione e acquisizione del colore Funzionamento dell occhio Metamerismo e sintesi additiva Sensori di immagine e fotocamere digitali Pellicole fotografiche a colori Idea: Riprodurre un colore dato mescolando opportunamente 3 colori primari, ad esempio rosso (R), verde (G) e blu (B): = + +
Sintesi additiva Percezione e acquisizione del colore Funzionamento dell occhio Metamerismo e sintesi additiva Sensori di immagine e fotocamere digitali Pellicole fotografiche a colori Dati: I valori L, M e S del colore da riprodurre I valori L, M e S delle 3 sorgenti primarie Impongo l uguaglianza Calcolo l intensità delle sorgenti primarie che produce lo stesso stimolo (sistema lineare 3 3). Il colore è riproducibile soltanto se le intensità così calcolate sono 0. L uso di rosso, verde e blu (RGB) consente di riprodurre una gamma di colori sufficientemente ampia.
Sensori di immagine Funzionamento dell occhio Metamerismo e sintesi additiva Sensori di immagine e fotocamere digitali Pellicole fotografiche a colori Al posto della pellicola, una fotocamera digitale ha un circuito integrato detto sensore di immagine (CCD o CMOS) Per motivi di costo, ogni pixel registra (tipicamente) un solo valore LMS, con uno schema a mosaico detto color filter array. I valori non misurati vengono interpolati (demosaicatura). Schema più comune: proposto da Bryce E. Bayer (Eastman Kodak, 1976)
Il colore nella fotografia su pellicola Funzionamento dell occhio Metamerismo e sintesi additiva Sensori di immagine e fotocamere digitali Pellicole fotografiche a colori Foto di Sergey Mikhaylovich Prokudin-Gorsky, 1911
Lo spazio colore standard CIE-XYZ (1931) Il diagramma di cromaticità LO SPAZIO COLORE STANDARD CIE-XYZ (1931)
Motivazione Percezione e acquisizione del colore Lo spazio colore standard CIE-XYZ (1931) Il diagramma di cromaticità Necessità di definire una misura del colore indipendente dal sistema di visualizzazione. Nel 1931 la Commission Internationale de l Eclairage (CIE) propone lo standard XYZ. Idea: Rappresentare il colore mediante le risposte dei coni: X = S L (λ) I(λ) dλ Y = S M (λ) I(λ) dλ Z =... Problema: Nel 1931 non era possibile misurare lo spettro di assorbimento dei coni Misura indiretta.
Esperimenti di color matching Lo spazio colore standard CIE-XYZ (1931) Il diagramma di cromaticità Proposti già nel XIX secolo (Grassmann); realizzati in modo rigoroso da Wright (1928) e Guild (1931). Un osservatore regola l intensità di 3 lampade primarie, in modo da riprodurre il colore di una sorgente monocromatica. Alcune lunghezze d onda non sono riproducibili Si aggiungono una o più componenti primarie alla sorgente di prova: R R R add I(λ) + I add (λ) G I(λ) G G add B B B add
Esperimenti di color matching Lo spazio colore standard CIE-XYZ (1931) Il diagramma di cromaticità
Esperimenti di color matching Lo spazio colore standard CIE-XYZ (1931) Il diagramma di cromaticità Variando la lunghezza d onda della sorgente di prova, si ottengono le seguenti color matching functions (CMF): r(λ) ḡ(λ) b(λ) 350 400 450 500 550 600 650 700 750 La CMF dipendono dalle 3 sorgenti primarie scelte e possono avere valori negativi
Definizione del modello Lo spazio colore standard CIE-XYZ (1931) Il diagramma di cromaticità Ipotesi: Le CMF calcolate sperimentalmente sono una combinazione lineare degli spettri di assorbimento dei coni Gli spettri di assorbimento dei coni sono funzioni non-negative Gli spettri di assorbimento vengono stimati calcolando una combinazione lineare delle CMF che produca valori 0 λ. Si è imposto inoltre che la coordinata Y corrisponda (o sia proporzionale) alla luminanza (vedremo).
Definizione del modello Lo spazio colore standard CIE-XYZ (1931) Il diagramma di cromaticità Le risposte dei coni, stimate in questo modo, sono le seguenti: x(λ) ȳ(λ) z(λ) 350 400 450 500 550 600 650 700 750 Le curve sono standardizzate e si trovano tabulate, es: http://cvrl.ioo.ucl.ac.uk/ http://www.cis.rit.edu/research/mcsl2/online/cie.php
Stime della risposta dei coni Lo spazio colore standard CIE-XYZ (1931) Il diagramma di cromaticità Esperimenti successivi hanno consentito di stimare le risposte dei coni con migliore accuratezza. Sono state proposte matrici per passare da XYZ a LMS. Esempio: matrice di Hunt-Pointer-Estevez L 0.38971 0.68898 0.07868 X M = 0.22981 1.18340 0.04641 Y S 0 0 1 Z 350 400 450 500 550 600 650 700 750
Il diagramma di cromaticità Lo spazio colore standard CIE-XYZ (1931) Il diagramma di cromaticità Rappresentazione grafica dello spazio colore XYZ. Lo spazio colore XYZ è tridimensionale. Per rappresentarlo su un piano, normalizzo le coordinate in modo da renderle adimensionali: x X X + Y + Z y Y X + Y + Z z Z X + Y + Z Le coordinate normalizzate sono linearmente dipendenti (x + y + z = 1) Basta rappresentarne due, tipicamente x e y.
Percezione e acquisizione del colore Il diagramma di cromaticità Lo spazio colore standard CIE-XYZ (1931) Il diagramma di cromaticità 0.9 0.8 0.7 0.6 0.5 0.4 0.3 0.2 510 505 500 520 525 515 530 495 490 485 535 540 545 20000 10000 550 6500 555 5000 560 4000 565 3000 570 2500 575 580 2000 585 590 1500 595 600 1000 610 620 640 700 0.1 480 475 470 460 380 0.0 0.0 0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8
Il diagramma di cromaticità Lo spazio colore standard CIE-XYZ (1931) Il diagramma di cromaticità I colori monocromatici si trovano sul bordo del diagramma. I numeri in figura indicano la lunghezza d onda La gamma rappresentabile mescolando 3 colori primari è data dal triangolo che li ha come vertici. In figura è rappresentata la gamma rappresentabile da un monitor tipico. I colori fuori gamma sono desaturati per consentirne la visualizzazione. In generale, la gamma rappresentabile con n colori primari è data dal più piccolo poligono convesso che li contiene. Uno spettro può essere pensato come la combinazione di infinite sorgenti monocromatiche L intera gamma visibile è data dai punti interni alla curva dei colori monocromatici
Adattamento locale Color constancy Bilanciamento del bianco IL COLORE NEL CONTESTO ADATTAMENTO LOCALE
Adattamento locale Adattamento locale Color constancy Bilanciamento del bianco L occhio umano è in grado di Funzionare correttamente in un intervallo di luminosità estremamente ampio senza saturare Percepire piccole variazioni di luminosità La pupilla regola la quantità globale di luce che entra nell occhio. Le cellule della retina sono in grado di modulare la loro risposta in funzione della media spaziale e temporale della luminosità (livello di adattamento locale), mediante meccanismi tuttora poco conosciuti (interazioni spaziali, reazioni, non-linearità).
Adattamento locale Adattamento locale Color constancy Bilanciamento del bianco Conseguenza: la percezione del colore non è determinata unicamente dalla risposta dei coni, ma soprattutto dalla sua variazione. Lo stesso stimolo fisico può produrre sensazioni diverse a seconda del contesto.
Color constancy Percezione e acquisizione del colore Adattamento locale Color constancy Bilanciamento del bianco Lo spettro L(λ) della luce che arriva all occhio è dato da due componenti: Spettro I(λ) della sorgente luminosa che illumina la scena Riflettanza R(λ) degli oggetti nella scena In generale, vale una legge moltiplicativa L(λ) = I(λ) R(λ) Tuttavia, lo spettro delle sorgenti luminose è estremamente variabile.
Color constancy Percezione e acquisizione del colore Adattamento locale Color constancy Bilanciamento del bianco 350 700 350 700 350 700 Incandescenza Solare (esempio) Fluorescente (esempio) Color constancy: Il colore percepito dall occhio dipende prevalentemente dalla riflettanza degli oggetti, ed è indipendente (entro certi limiti) dal colore della sorgente luminosa. Il fenomeno è tuttora poco conosciuto.
Bilanciamento del bianco Adattamento locale Color constancy Bilanciamento del bianco La color constancy funziona soltanto se la sorgente luminosa è sufficientemente forte (vedremo). Se si guarda una fotografia su monitor o stampata, la correzione non avviene È necessario compensare l effetto della sorgente luminosa: Fotografia analogica Pellicole tarate o filtri Fotografia digitale Bilanciamento del bianco
Bilanciamento del bianco Adattamento locale Color constancy Bilanciamento del bianco Una fotocamera digitale compensa il colore della sorgente luminosa moltiplicando i canali L, M e S per dei fattori di correzione opportuni Esistono diverse tecniche per calcolare i fattori moltiplicativi Preset Manuale Automatico... Il problema è tuttora oggetto di studio
Bilanciamento del bianco Adattamento locale Color constancy Bilanciamento del bianco Il bilanciamento del bianco non è in grado di correggere fotografie di scene illuminate da diverse sorgenti luminose Se la sorgente luminosa ha uno spettro eccessivamente irregolare, non è possibile compensarla (vedi: color rendering index)
Motivazione Definizione di uno spazio colore RGB Codifica digitale e correzione gamma Spazi colore YUV e YCbCr SPAZI COLORE RGB E YUV
Motivazione Percezione e acquisizione del colore Motivazione Definizione di uno spazio colore RGB Codifica digitale e correzione gamma Spazi colore YUV e YCbCr Due colori appaiono uguali quando le risposte dei coni sono uguali (metameri). Conseguenza: Per riprodurre un colore non è necessario riprodurre lo spettro. Un modo semplice per riprodurre una vasta gamma di colori consiste nel mescolare opportunamente 3 sorgenti primarie fissate. Lo spazio colore RGB rispecchia il funzionamento dei monitor e televisori device dependent.
Definizione di uno spazio colore RGB Motivazione Definizione di uno spazio colore RGB Codifica digitale e correzione gamma Spazi colore YUV e YCbCr Le coordinate RGB si ricavano dalle XYZ mediante un opportuna matrice. Per definire la matrice di trasformazione, è necessario specificare: Il colore dei primari Il punto di bianco che si ottiene accendendo i 3 primari contemporaneamente alla massima potenza Quindi uno spazio colore RGB è definito dalle coordinate colorimetriche (x, y) dei primari e del punto di bianco
Definizione di uno spazio colore RGB Motivazione Definizione di uno spazio colore RGB Codifica digitale e correzione gamma Spazi colore YUV e YCbCr Ricordiamo la definizione delle coordinate normalizzate x, y: x X X + Y + Z, y Y X + Y + Z La trasformazione inversa è possibile se si conosce la luminanza Y X Y = Y x x y k y y Z 1 x y z Imponiamo alcune normalizzazioni I valori RGB variano tra 0 e 1 Il bianco ha luminanza Y = 1
Definizione di uno spazio colore RGB Motivazione Definizione di uno spazio colore RGB Codifica digitale e correzione gamma Spazi colore YUV e YCbCr Indichiamo con M la matrice di trasformazione RGB XYZ. Si impongono le seguenti condizioni: 1 x R 0 x G 0 M 0 = k R y R, M 1 = k G y G, M 0 = k B 0 0 1 z R z G x B y B z B I fattori di scala k R, k G e k B si calcolano mediante il punto di bianco (esercizio): 1 M 1 = 1 x W y W y 1 W z W
Spazi colore RGB Percezione e acquisizione del colore Motivazione Definizione di uno spazio colore RGB Codifica digitale e correzione gamma Spazi colore YUV e YCbCr Sono stati definiti numerosi spazi colore RGB Denominazione Rosso Verde Blu Bianco CIE RGB 0.7347 0.2738 0.1666 E 0.2653 0.7174 0.0089 srgb / BT.709 0.64 0.33 0.30 0.60 0.15 0.06 D65 Adobe RGB 0.64 0.34 0.21 0.71 0.15 0.06 D65 PAL/SECAM 0.64 0.33 0.29 0.60 0.15 0.06 D65 RIMM/ROMM 0.7347 0.2653 0.1596 0.8404 0.0366 0.0001 D50 I punti di bianco utilizzati sono: E = (1/3, 1/3); D65 = (0.3127, 0.3290); D50 = (0.3457, 0.3585)
Spazi colore RGB Percezione e acquisizione del colore Motivazione Definizione di uno spazio colore RGB Codifica digitale e correzione gamma Spazi colore YUV e YCbCr Ad alcuni colori visibili corrispondono componenti RGB negative Non rappresentabili su un monitor. Una gamma ampia non è sempre preferibile: Maggiore rumore di quantizzazione Difficoltà costruttive (richiede sorgenti monocromatiche) Efficienza energetica (LCD). I monitor per PC utilizzano tipicamente lo spazio srgb. I televisori HD utilizzano lo spazio ITU-R BT.709 Adobe RGB è utilizzato talvolta nella grafica professionale.
Codifica digitale Percezione e acquisizione del colore Motivazione Definizione di uno spazio colore RGB Codifica digitale e correzione gamma Spazi colore YUV e YCbCr I valori RGB devono essere quantizzati per poter essere elaborati dal calcolatore. Una quantizzazione lineare non è adatta, per due motivi: Non linearità dell occhio (legge di Weber) Non linearità tubi catodici
Non linearità dell occhio Motivazione Definizione di uno spazio colore RGB Codifica digitale e correzione gamma Spazi colore YUV e YCbCr Si è dimostrato sperimentalmente che la percezione della luminanza è non lineare: La distanza percepita tra due livelli I e I + δi può essere stimata con la just noticeable difference (JND). Per luminanze alte (> 100 cd/m 2 circa) vale la legge di Weber.
Non linearità dell occhio Motivazione Definizione di uno spazio colore RGB Codifica digitale e correzione gamma Spazi colore YUV e YCbCr Se si usa una quantizzazione uniforme, il rumore è più visibile nelle zone scure. Sarebbero necessari 12 bit. È più efficiente usare una quantizzazione non uniforme, più fitta nelle zone scure. In pratica, ogni pixel viene mappato mediante una funzione non lineare opportuna e poi quantizzato linearmente. Problema: La JND è difficile da misurare e dipende da molti fattori (luminanza, persona, tipo di test pattern, metodo sperimentale).
Non linearità dei monitor Motivazione Definizione di uno spazio colore RGB Codifica digitale e correzione gamma Spazi colore YUV e YCbCr Il convertitore D/A della scheda video produce una tensione elettrica proporzionale al valore numerico del pixel La luminosità emessa da un tubo catodico è una funzione non lineare della tensione applicata L out V γ in, γ 2.2 2.5 Per visualizzare correttamente un immagine, è necessario distorcerla per compensare la caratteristica del monitor: correzione gamma.
Correzione gamma Percezione e acquisizione del colore Motivazione Definizione di uno spazio colore RGB Codifica digitale e correzione gamma Spazi colore YUV e YCbCr La non linearità dei monitor avvicina i livelli nelle zone scure, e quindi rende meno visibile la quantizzazione. Inoltre, è deterministica e facilmente misurabile. Procedimento di codifica: Si distorce l immagine con l inversa della curva del monitor (correzione gamma) Si quantizza linearmente l immagine distorta Si visualizza l immagine. Il tubo catodico esegue la distorsione inversa In questo modo, 8 bit sono sufficienti.
Correzione gamma Percezione e acquisizione del colore Motivazione Definizione di uno spazio colore RGB Codifica digitale e correzione gamma Spazi colore YUV e YCbCr In pratica, per la correzione gamma non si usa una semplice potenza perché potrebbe amplificare il rumore vicino all origine. Normativa srgb C srgb = { 12.92C C 0.0031308 1.055L 1/2.4 0.055 L > 0.0031308
Monitor medicali e curva DICOM Motivazione Definizione di uno spazio colore RGB Codifica digitale e correzione gamma Spazi colore YUV e YCbCr In un sistema tradizionale per la riproduzione di immagini (es. fotocamera elaborazione monitor), l ingresso e l uscita sono della stessa grandezza fisica (intensità luminosa) In un sistema medicale, l ingresso (misurato dalle macchine) ha grandezze fisiche diverse, tipicamente densità (radiografia, TAC) o concentrazione d acqua (risonanza magnetica) È necessario fare una conversione da una grandezza fisica all altra Si richiede che la conversione sia percettivamente uniforme, cioè che uguali variazioni di input siano ugualmente visibili, indipendentemente dallo sfondo.
Monitor medicali e curva DICOM Motivazione Definizione di uno spazio colore RGB Codifica digitale e correzione gamma Spazi colore YUV e YCbCr Una mappatura lineare non soddisfa i requisiti. È stata definita una mappatura non lineare, basata su un modello matematico dell occhio umano proposto negli anni 90 dal fisico olandese Peter G. J. Barten. La DICOM Grayscale Standard Display Function è una tabella con 1023 livelli di luminanza tali che la differenza fra 2 livelli adiacenti è uguale a 1 JND a quel livello Un monitor calibrato DICOM ha una risposta uguale ad una porzione della curva La mappatura viene fatta dal monitor stesso.
Monitor medicali e curva DICOM Motivazione Definizione di uno spazio colore RGB Codifica digitale e correzione gamma Spazi colore YUV e YCbCr
Spazi colore YUV e YCbCr Motivazione Definizione di uno spazio colore RGB Codifica digitale e correzione gamma Spazi colore YUV e YCbCr I televisori riproducono il colore mescolando primari RGB, ma il segnale è codificato in un formato diverso per motivi tecnici. I primi televisori erano in bianco e nero. Con l introduzione della televisione a colori, è sorto il problema di mantenere la compatibilità del segnale. Soluzione: rappresentare il segnale video mediante luma e croma.
Trasformazione RGB YUV Motivazione Definizione di uno spazio colore RGB Codifica digitale e correzione gamma Spazi colore YUV e YCbCr Si utilizza una trasformazione lineare, facilmente calcolabile mediante circuiti analogici: Y = 0.299R + 0.587G + 0.114B U = 0.4921(B Y ) V = 0.8773(R Y ) R, G e B sono non lineari (correzione gamma): Y di YUV Y di ZYX Si usa un nome apposito (luma) Al grigio corrisponde R = G = B = Y e U = V = 0.
Costruzione del segnale Motivazione Definizione di uno spazio colore RGB Codifica digitale e correzione gamma Spazi colore YUV e YCbCr Un canale televisivo in bianco e nero è formato da Luma e sincronismi in banda base Audio (mono) in FM a 5.5 MHz Il tutto modulato in VSB Nel segnale televisivo a colori, i segnali di croma U e V sono inseriti tra luma e audio: Risoluzione inferiore Modulazione AM su due portanti in quadratura a 4.43 MHz L occhio è poco sensibile alle variazioni di colore È possibile filtrare U e V per ridurre l occupazione di banda.
Trasmissione del segnale Motivazione Definizione di uno spazio colore RGB Codifica digitale e correzione gamma Spazi colore YUV e YCbCr La modulazione può introdurre artefatti (dot crawl) Se si trasmette un segnale video via cavo (es. tra VCR/DVD e TV), è possibile separare i segnali per migliorare la qualità: Composito S-Video Component
Codifica digitale YCbCr Motivazione Definizione di uno spazio colore RGB Codifica digitale e correzione gamma Spazi colore YUV e YCbCr Una trasformazione simile è usata nelle immagini e video digitali per facilitare la compressione. Input: RGB con correzione gamma, valori in [0, 1]. Trasformazione: Y = K R R + K G G + K B B, P B = 1 2 B Y 1 K B, P R = 1 2 R Y 1 K R { 0.299, 0.587, 0.114 Immagini, Video SD (BT.601) K R,G,B = 0.2126, 0.7152, 0.0722 Video HD (BT.709) Output: Y [0, 1]; P B, P R [ 1/2, 1/2]
Codifica digitale YCbCr Scalaggio per immagini: Y 256Y C B 256P B + 128 C R 256P R + 128 Motivazione Definizione di uno spazio colore RGB Codifica digitale e correzione gamma Spazi colore YUV e YCbCr Scalaggio per video: Y 219Y + 16 C B 224P B + 128 C R 224P R + 128 Valori in [0, 256], limitati a [0, 255] Luma in [16, 235], croma in [16, 240] I segnali di croma sono decimati per ridurre il bitrate (chroma subsampling). Il metodo è identificato da apposite sigle. 4:1:1 4:2:0 4:2:2 4:4:4