Guido Corbò Note di relatività Generalità Il principio di relatività di Einstein consiste nell'aermare che le leggi della sica sono le stesse in qualsiasi sistema di riferimento inerziale. Ciò implica l'impossibilità di privilegiare un particolare sistema di riferimento inerziale rispetto ad un altro. Le leggi della meccanica classica, contenute nell'equazione f = ma sono eettivamente invarianti nel passaggio da un sistema inerziale ad un altro, se si assumono le trasformazioni di Galileo. Invece, le equazioni di Maxwell non sono invarianti sotto trasformazioni di Galileo. Infatti, da tali trasformazioni si ricava la legge classica di composizione delle velocità. Per esempio v x = v x V (1) se V è (l'unica) componente della velocità con la quale trasla, lungo l'asse x, il riferimento O (gura 1). y V y' z O x z' O' x' Figura 1: Il sistema O trasla rispetto ad O con una certa velocità V. 1
D'altra parte, nel vuoto, la soluzione generale delle equazioni di Maxwell per una propagazione lungo l'asse x è Φ = f(x ct) + g(x + ct) (2) cioè una propagazione con velocità isotropa; ovvero con la stessa velocità tanto nel verso delle x crescenti quanto in quello delle x decrescenti. Secondo le trasformazioni di Galileo, in un nuovo riferimento O avremmo due velocità diverse per la propagazione in un senso e nell'altro; ma ciò signicherebbe che l'equazione d'onda dovrebbe avere una struttura diversa nel nuovo riferimento, in contraddizione con il principio di relatività. Non rimane che ammettere che la velocità della luce sia un invariante rispetto alle trasformazioni da un sistema inerziale ad un altro. La richiesta che la velocità della luce sia un'invariante impone la condizione che si abbia, per il fronte di un'onda luminosa: x 2 + y 2 + z 2 = c 2 t 2 (3) x 2 + y 2 + z 2 = c 2 t 2 (4) Per semplicità, possiamo denire x 0 = ct x 0 = ct (5) x 0 ha dunque le stesse dimensioni siche delle altre variabili x, y e z (quelle di una lunghezza) e possiamo quindi scrivere le (3) e (4) come x 2 + y 2 + z 2 = x 0 2 (6) x 2 + y 2 + z 2 = x 0 2 La relazione più semplice possibile, tra vecchie e nuove coordinate, è una relazione lineare; dunque possiamo ipotizzare che, per un moto traslatorio lungo l'asse x, le coordinate y e z restino immutate e che si abbia dunque: y = y (7) z = z x = αx + βx 0 x 0 = γx + δx 0 2
Sostituendo nella seconda delle (6) si ottiene: Sviluppando: (αx + βx 0 ) 2 + y 2 + z 2 = (γx + δx 0 ) 2 (8) α 2 x 2 + β 2 x 02 + 2αβxx 0 + y 2 + z 2 = (γ 2 x 2 + δ 2 x 02 + 2γδxx 0 ) (9) D'altra parte, deve essere x 2 +y 2 +z 2 = x 0 2 ; e dunque si deve avere identicamente α 2 γ 2 = 1 (10) δ 2 β 2 = 1 αβ γδ = 0 Possiamo allora utilizzare la seguente parametrizzazione: α = cosh ξ γ = sinh ξ (11) δ = cosh ϕ β = sinh ϕ La terza delle (10) mostra che ξ = ϕ; dunque abbiamo: x = x cosh ϕ + x 0 sinh ϕ (12) x 0 = x sinh ϕ + x 0 cosh ϕ Possiamo ricavare il signicato sico della quantità ϕ. Infatti, se l'origine O del sistema di assi (cioè x = 0) trasla di moto rettilineo uniforme con una velocità che ha soltanto componente lungo l'asse x pari a V deve essere, per ogni t 0 = V t cosh ϕ + ct sinh ϕ (13) ovvero tanh ϕ = sinh ϕ cosh ϕ = V c Da questa si ricava (osserviamo che cosh ϕ è sempre positivo): (14) cosh ϕ = 1 1 V 2 /c 2 sinh ϕ = 3 V/c 1 V 2 /c 2 (15)
In denitiva, possiamo scrivere così le relazioni tra i due sistemi di coordinate, che vengono chiamate trasformazioni di Lorentz: x = x V t 1 V 2 /c 2 (16) y = y z = z t = t (V/c2 )x 1 V 2 /c 2 È molto utile introdurre una nuova notazione per le coordinate spaziali. Precisamente, ponendo un indice in alto: scriviamo così le trasformazioni di Lorentz: dove abbiamo posto x x 1 y x 2 z x 3 (17) x 1 = x1 βx 0 1 β 2 (18) x 2 = x 2 x 3 = x 3 È utile anche porre questa denizione: x 0 = x0 βx 1 1 β 2 γ = β = V c e scrivere le trasformazioni di Lorentz in questo modo: (19) 1 1 β 2 (20) x 1 = (x 1 βx 0 )γ (21) x 2 = x 2 x 3 = x 3 x 0 = (x 0 βx 1 )γ 4
Contrazione di Lorentz Le trasformazioni di Lorentz implicano l'esistenza di fenomeni che non sono previsti dalla meccanica galileiana. Uno di tali fenomeni è conosciuto come contrazione di Lorentz o contrazione delle lunghezze. Vediamo di cosa si tratta. In meccanica galileiana, la lunghezza di un segmento, per esempio la lunghezza di una sbarra rigida, è una quantità assoluta; nel senso che qualsiasi osservatore, che intenda misurarla, trova sempre lo stesso valore l 0. È ovvio che cosa si intenda per misura di una sbarra che è a riposo rispetto ad un osservatore: questi sovrappone alla sbarra una riga graduata che consente la valutazione della misura (gura 2). y V y' z O x z' O' x' A l 0 x' B x' Figura 2: Una sbarra è ferma nel riferimento O. Per un osservatore solidale ad O, rispetto al quale la sbarra è dunque in movimento, l'operazione da eseguire è, in linea di principio, la seguente: egli deve marcare nello stesso istante la posizione dei due estremi della sbarra che gli scorre davanti; e successivamente misurare la distanza tra tali posizioni. Ci aspettiamo che il risultato sia ancora l 0. Le cose vanno eettivamente così in meccanica galileiana ma vanno diversamente dal punto di vista relativistico. Supponiamo infatti che, come è illustrato nella gura precedente, la sbarra sia posta lungo l'asse delle ascisse e trasli lungo tale asse con velocità V rispetto ad un osservatore solidale ad O. La relazione tra le coordinate di O e quelle di O, 5
che segue la sbarra, è data dalle trasformazioni di Lorentz; in particolare x = x V t 1 V 2 /c 2 (22) Per le posizioni degli estremi A e B della sbarra devono valere evidentemente x A = x A V t A 1 V 2 /c 2 x B = x B V t B 1 V 2 /c 2 (23) dove t A e t B sono gli istanti nei quali viene rilevata da O la posizione dei due estremi, rispettivamente. Sottraendo membro a membro si ha x B x A = x B x A V (t B t A ) 1 V 2 /c 2 (24) Il primo membro è la lunghezza l 0 della sbarra a riposo in O ; d'altra parte, x B x A, che gura al secondo membro, può essere interpretata come lunghezza l della sbarra misurata in O se in tale riferimento la misura è eseguita, come abbiamo già notato, nello stesso istante per i due estremi; cioè t B = t A. Da ciò risulta l l 0 = ovvero l = l 0 1 V 1 2 /c 2 (25) V 2 /c 2 In altre parole, vista da O, la sbarra risulta contratta della quantità 1 V 2 /c 2. Arriviamo allo stesso risultato anche se deniamo la lunghezza l della sbarra in movimento in altro modo. Precisamente, possiamo pensare di misurare il tempo che trascorre tra il passaggio dei due estremi della sbarra per uno stesso punto del riferimento O; e poi moltiplicare tale intervallo di tempo per la velocità V con la quale scorre la sbarra. Riferendoci ancora alla (24), poniamo x B = x A e otteniamo l 0 = x B x A = V (t B t A ) (26) 1 V 2 /c 2 dalla quale otteniamo t B t A = l 0 V 1 V 2 /c 2 (27) (notiamo che se per esempio V > 0, come nelle gure precedenti, t B t A risulta negativo: giustamente, l'estremo A passa davanti all'osservatore dopo l'estremo B). Dalla (27) otteniamo dunque V (t B t A ) = l 0 1 V 2 /c 2 (28) 6
che coincide con la (25). Dilatazione dei tempi In meccanica galileiana, ci aspettiamo che la durata di un certo fenomeno sia una quantità assoluta, indipendente dal sistema di riferimento. Ma, anche in questo caso, la relatività porta ad un nuovo risultato. Precisamente, immaginiamo che il fenomeno in questione sia l'accensione di una lampadina ad un certo istante t A e il successivo spegnimento ad un istante t B, con la lampadina ferma nel sistema di riferimento O. Per quanto tempo rimane accesa la lampadina, per un osservatore O che trasla con velocità V? Lo vediamo, come sempre, dalle trasformazioni di Lorentz. In particolare, da t = t (V/c2 ) x 1 V 2 /c 2 (29) Per l'istante di accensione e quello dello spegnimento valgono evidentemente Sottraendo membro a membro: t A = t A (V/c 2 ) x A t B = t B (V/c 2 ) x B 1 (30) 1 V 2 /c 2 V 2 /c 2 t B t A = t B t A (V/c 2 ) (x B x A ) 1 V 2 /c 2 (31) Al primo membro compare la durata T del fenomeno misurata da O ; al secondo membro compare la durata T = t B t A per il sistema nel quale, d'altra parte, la lampadina è ferma in una certa posizione: x B = x A. Dunque T = T 1 V 2 /c 2 (32) ovvero, per l'osservatore in movimento rispetto alla lampadina, l'intervallo di tempo risulta dilatato della quantità 1 1 V 2 /c 2 (33) 7
L'intervallo di tempo (innitesimo) misurato tra due eventi che avvengono nello stesso punto dello spazio (tridimensionale) viene chiamato intervallo di tempo proprio tra tali eventi e viene indicato con il simbolo dτ. In un generico sistema di riferimento risulta quindi: dt = γdτ (34) Due gemelli non sono coetanei! Supponiamo che un ipotetico astronauta compia un lungo viaggio spaziale e poi torni sulla Terra, dove lo ha aspettato suo fratello gemello. Al momento della partenza, i due hanno evidentemente la stessa età. Che età avranno quando si incontrano di nuovo sulla Terra? Per l'astronauta è passato un tempo τ2 T a = dτ = τ 2 τ 1 (35) τ 1 Per il gemello sulla Terra è passato il tempo T T = t2 t 1 dt = τ2 τ 1 γ dτ > poiché γ > 1. Ciò signica che T a < T T meno del fratello. τ2 dτ = T a (36) τ 1 ovvero che l'astronauta è invecchiato Composizione delle velocità Dalle trasformazioni di Lorentz si ricava facilmente la legge di composizione relativistica delle velocità. Per semplicità riferiamoci alla sola componente x. Per incrementi innitesimi delle coordinate spazio-temporali, si ha: dx = dx V dt 1 V 2 /c 2 (37) dt = dt (V/c2 ) dx 1 V 2 /c 2 (38) 8
Dividendo membro a membro per dt : v x = dx dt = dx V dt dt (V/c 2 ) dx E dividendo per dt numeratore e denominatore: v x = dx dt = (39) v x V 1 (V/c 2 ) v x (40) Si vede che, nel limite di traslazioni a piccola velocità rispetto a quella della luce, la legge di composizione relativistica diventa quella galileiana. Come semplice esercizio, possiamo vericare che la relazione precedente conferma l'invarianza della velocità della luce. Ponendo infatti v x = c si ha: c c V = 1 (V/c 2 )c = c (41) È inoltre semplice vedere che la composizione di due velocità inferiori a quella della luce fornisce una velocità anch'essa inferiore a quella della luce. Basta per questo dimostrare che si ha comunque v x v x V = < c (42) 1 (V/c 2 ) v x per qualsiasi valore di v x e V (purché entrambe minori di c). La disuguaglianza precedente si può scrivere infatti v x V < c V c v x (43) ovvero v x (1 + V/c) < c (1 + V/c) (44) che è sicuramente vera dal momento che v x < c. Quadrivettori Possiamo pensare alle x, y, z e ct come alle componenti x µ del raggio vettore in uno spazio a quattro dimensioni che viene chiamato spazio di Minkowski. 9
Chiameremo dunque quadrivettore un vettore appartenente a tale spazio. In generale, un quadrivettore è una grandezza che, sotto una trasformazione di Lorentz ovvero una trasformazione da un sistema inerziale ad un altro, si trasforma come x, y, z e ct. Una qualsiasi grandezza sica vettoriale sarà dunque di fatto una grandezza quadrivettoriale. Le quattro componenti vengono chiamate componenti controvarianti e sono scritte con un indice in alto. Ricordiamo che e scriveremo così un generico quadrivettore: x 0 = ct x 1 = x x 2 = y x 3 = z (45) a µ = (a 1, a 2, a 3, a 0 ) (46) Chiameremo componenti spaziali le prime tre componenti del quadrivettore; e componente temporale la quarta componente. Potremo indicare anche così: a µ = (a, a 0 ) (47) dove il carattere grassetto indica, come al solito, un vettore nello spazio tridimensionale. È molto semplice vericare che per due quadrivettori a µ e b µ la quantità a 0 b 0 a 1 b 1 a 2 b 2 a 3 b 3 (48) risulta invariante sotto trasformazioni di coordinate, cioè sotto trasformazioni di Lorentz; dunque essa può denire il prodotto scalare tra i due quadrivettori: a b a 0 b 0 a 1 b 1 a 2 b 2 a 3 b 3 (49) Possiamo anche scrivere così, sottintendendo la somma su indici ripetuti: dove a b = g µν a µ b ν (50) g µν = 0 se µ ν g 00 = 1; g 11 = 1; g 22 = 1; g 33 = 1 (51) g µν viene chiamato tensore metrico o semplicemente metrica dello spazio quadridimensionale. Con l'ausilio di g µν possiamo denire le componenti covarianti di un quadrivettore, che sono scritte con un indice in basso: a µ = g µν a ν (52) 10
e possiamo dunque scrivere il prodotto scalare anche così: In particolare possiamo calcolare il prodotto scalare a b = a µ b µ = a µ b µ (53) a a = (a 0 ) 2 (a 1 ) 2 (a 2 ) 2 (a 3 ) 2 (54) che è naturale denire norma del quadrivettore a. Poiché le quantità a µ sono arbitrarie, vediamo che la norma di un quadrivettore può essere positiva, negativa o nulla. Corrispondentemente, diciamo che il quadrivettore è di tipo tempo (timelike), spazio (spacelike) o luce (lightlike). Inversione temporale e causalità Consideriamo un evento P 1 : per esempio il lampo di un ash fotograco che avviene ad un certo istante t 1 nel punto dello spazio di coordinate (x 1, y 1, z 1 ); ed un altro evento P 2 che immaginiamo sia un altro lampo all'istante t 2 in un altro punto di coordinate (x 2, y 2, z 2 ). Ai due eventi corrispondono dunque i raggi vettori x µ 1 = (x 1, y 1, z 1, ct 1 ) x µ 2 = (x 2, y 2, z 2, ct 2 ) (55) Si denisce distanza tra i due eventi il vettore s µ = x µ 2 x µ 1 = (x 2 x 1, y 2 y 1, z 2 z 1, c(t 2 t 1 )) (56) Osserviamo ora che se la distanza tra i due eventi P 1 e P 2 è di tipo spacelike, la successione temporale di essi può risultare invertita, a patto di osservare tali eventi da un opportuno sistema di riferimento. Supponiamo per semplicità che i due lampi avvengano sull'asse x (dunque con coordinate y e z uguali a zero) e che sia c 2 (t 2 t 1 ) 2 (x 2 x 1 ) 2 < 0 (57) ed inoltre che, in un dato sistema di riferimento, sia t 2 > t 1 (58) x 2 > x 1 (59) 11
Possiamo scrivere dunque che per tali eventi: c (t 2 t 1 ) < x 2 x 1 (60) ovvero c (t 2 t 1 ) < 1 (61) x 2 x 1 Osserviamo ora i due eventi precedenti da un altro sistema di riferimento. Con una trasformazione di Lorentz abbiamo cioè t 1 = t 1 (V/c 2 ) x 1 (62) 1 V 2 /c 2 t 2 = t 2 (V/c 2 ) x 2 (63) 1 V 2 /c 2 t 2 t 1 = t 2 t 1 (V/c 2 )(x 2 x 1 ) 1 V 2 /c 2 (64) Vericare se è possibile che nel nuovo sistema di riferimento t 2 t 1 sia negativo, equivale a vericare se è possibile che si possa ottenere t 2 t 1 V c 2 (x 2 x 1 ) < 0 (65) ovvero V > (t 2 t 1 ) c c (66) x 2 x 1 D'altra parte, ricordando la (61), ciò signica che V deve essere maggiore di una certa velocità comunque minore di c: cosa che è sempre possibile avere. Da ciò segue che l'evento P 1 può essere la causa dell'evento P 2 solo se la distanza tra tali eventi è di tipo timelike o lightlike; diversamente esisterebbero sistemi di riferimento rispetto ai quali osserveremmo un eetto che precede temporalmente la sua causa: in contraddizione con il principio di causalità. Trasformazioni di Lorentz generiche Scriviamo così una generica trasformazione di Lorentz: x µ = Λ µ νx ν (67) 12
della quale la (21) è il caso particolare che riguarda un moto traslatorio di O lungo l'asse x (con assi paralleli). Per un generico quadrivettore, del quale x µ è il prototipo, vale altrettanto la seguente legge di trasformazione, che è dunque la legge di trasformazione per le componenti controvarianti: Tale relazione può essere invertita, scrivendo dunque dove Θ µ ν è la matrice inversa di Λ µ ν: a µ = Λ µ νa ν (68) a µ = Θ µ νa ν (69) Θ ν µ Λ µ σ = δ ν σ (70) Ricordiamo che il prodotto scalare a b è un invariante. Scriviamo allora, cambiando opportunamente nome agli indici muti: a b = a µ b µ = a ρ b ρ = Λ ρ σa σ b ρ = a σ b σ (71) Poiché tale uguaglianza deve essere valida per qualsiasi valore di a σ segue b σ = Λ ρ σb ρ (72) che è simile alla (68) a parte lo scambio delle quantità relative ad O e O. Invertendo tale relazione scriviamo b µ = Θ ν µ b ν (73) Le equazioni di Maxwell non omogenee Ci accorgiamo che nello spazio quadridimensionale di Minkowski è molto semplice scrivere le equazioni di Maxwell in forma compatta. A questo scopo, inventiamoci la seguente matrice antisimmetrica F µν (ponendo dunque gli indici in alto). È proprio il caso di dire inventiamoci perché, per il momento, questa 13
tabella non ha alcun particolare signicato; è soltanto un utile metodo di scrittura e gli indici µ e ν sono semplicemente indici di riga e di colonna: F µν = 0 B z B y E x /c B z 0 B x E y /c B y B x 0 E z /c E x /c E y /c E z /c 0 E inventiamoci anche questa matrice colonna: j µ = Nelle espressioni precedenti, l'indice zero deve essere pensato come indice quattro, riferendosi cioè alla quarta riga o alla quarta colonna, a seconda dei casi. Ebbene, le equazioni di Maxwell non omogenee sono contenute in questa relazione: µ F µν = µ 0 j ν (76) dove abbiamo denito µ (77) x µ Infatti, poniamo per esempio ν = 1. Otteniamo: ovvero cioè: j x j y j z cρ (74) (75) 1 F 11 + 2 F 21 + 3 F 31 + 0 F 01 = µ 0 j 1 (78) B z y B y z 1 E x c 2 t = µ 0 j 1 (79) E x (rotb) x = µ 0 j x + µ 0 ε 0 (80) t Ponendo ν = 2, 3 si ottengono equazioni simili per le altre componenti. Ponendo ν = 0 otteniamo invece: ovvero 1 F 10 + 2 F 20 + 3 F 30 + 0 F 00 = µ 0 j 0 (81) 1 E x c x + 1 E y c y + 1 E z c z = µ 0cρ (82) 14
cioè dive = µ 0 c 2 ρ = ρ/ε 0 (83) È inoltre molto semplice scrivere l'equazione di continuità. Infatti si ha ovviamente: µ ν F µν = 0 (84) poiché sulla quantità antisimmetrica F µν agisce l'operazione µ ν che è evidentemente simmetrica negli indici µ e ν. D'altra parte, per la (76), si ha µ ν F µν = µ 0 µ j µ (85) dalle (84) e (85) si ha dunque: µ j µ = 0 (86) che è proprio l'equazione di continuità. Scrivendo esplicitamente, infatti: ovvero 1 j 1 + 2 j 2 + 3 j 3 + 0 j 0 = 0 (87) div j + 1 c t j4 = div j + ρ t = 0 (88) Campi tensoriali nello spazio di Minkowski In un dato sistema di riferimento, un campo scalare è denito da una funzione ordinaria delle coordinate spaziali e del tempo (di solito, nelle applicazioni, tale funzione è continua e derivabile un numero arbitrario di volte). Un classico esempio è fornito dalla temperatura in una certa zona della Terra: la temperatura è infatti funzione della latitudine, longitudine e quota del punto che ci interessa; e cambia al trascorrere del tempo. Scriviamo dunque T = T (x, y, z, ct) T (x) (89) intendendo brevemente con x l'insieme delle quattro coordinate spazio-temporali. Se cambiamo sistema di riferimento, lo stesso campo delle temperature sarà descritto da una nuova funzione T (x ) per la quale deve dunque valere: T (x ) = T (x) (90) 15
con x ν = Λ ν µ x µ (91) Altrettanto, si può parlare di campo vettoriale v µ (x) se in due diversi sistemi di riferimento si ha comunque: v µ (x)e µ = v ν (x )e ν (92) dove con e µ e e ν sono indicati i versori degli assi coordinati nei rispettivi sistemi di riferimento. D'altra parte, per i versori, vale la legge di trasformazione e µ = Λ ν µe ν (93) Da ciò segue: v µ (x) Λ ν µ e ν = v ν (x )e ν (94) ovvero: v ν (x ρ = Λ ρ σ x σ ) = Λ ν µ v µ (x) (95) Per le componenti covarianti di un campo vettoriale vale evidentemente v ν(x ) = Θ ρ ν v ρ (x) (96) In generale, abbiamo campi tensoriali per i quali si verica, ad esempio: T µν (x ρ = Λ ρ σ x σ ) = Λ µ α Λ ν β T αβ (x) (97) Vogliamo ora mostrare che il gradiente di un campo scalare è un campo vettoriale con indice covariante o, come si dice brevemente, è un vettore covariante. Dato un campo ϕ(x) dobbiamo calcolare le derivate rispetto alle coordinate che, come sappiamo, sono le componenti controvarianti del raggio vettore. In altri termini, dobbiamo calcolare ϕ(x) (98) x µ In un altro sistema di riferimento scriviamo, altrettanto: x µ ϕ (x ) (99) D'altra parte, possiamo scrivere facilmente questa serie di uguaglianze: x µ ϕ (x ) = xν ϕ(x) = x µ x µ 16 x ϕ(x) = ν Θν µ x ν ϕ(x) (100)
La prima uguaglianza segue dal fatto che ϕ è un campo scalare; la seconda dalla regola di derivazione delle funzioni composte; e la terza dalla proprietà (91). La (100) rappresenta dunque proprio quanto volevamo dimostrare. Si può scrivere anche così: x µ ϕ(x) = µϕ(x) (101) facendo apparire in modo più esplicito la natura covariante dell'indice µ. Possiamo allora ricavare dalla (86) una conseguenza molto importante. Poiché l'operatore µ produce un indice covariante e µ j µ è una quantità scalare (in rispetto del principio di relatività deve essere nulla in qualsiasi sistema di riferimento, ovvero la conservazione della carica elettrica deve comunque valere), segue che j µ è necessariamente un vettore controvariante. Stabilito questo, dalla (76) segue che F µν è necessariamente un tensore controvariante che è chiamato tensore elettromagnetico. Con queste conclusioni, le semplici tabelle (74) e (75) acquistano un valore del tutto rilevante: esse mostrano il contenuto di un campo tensoriale e vettoriale rispettivamente. In altri termini, gli indici µ e ν di riga e di colonna sono eettivamente indici di Lorentz, caratteristici di vettori (o tensori) nello spazio di Minkowski. Si dice allora che le equazioni di Maxwell, scritte nella (76) sono espresse in forma covariante nel senso che sono appunto relazioni tra enti vettoriali o tensoriali nello spazio di Minkowski. In generale, per rispettare il principio di relatività, tutte le equazioni della sica dovranno dunque risultare covarianti. Meccanica relativistica Passando allo studio della dinamica del punto materiale, ci accorgiamo subito che l'equazione newtoniana, così come è scritta, F = d dt p (102) è sicuramente non covariante, poiché è una relazione tra vettori dello spazio ordinario tridimensionale e non tra vettori o tensori quadridimensionali. Dobbiamo quindi rimpiazzare la (102) con un'equazione covariante che, d'altra 17
parte, riproduca la (102) stessa nel limite di velocità piccole rispetto a quella della luce. Cominciamo con il denire le quantità cinematiche rilevanti. Supponiamo di individuare un punto materiale in movimento in un certo riferimento inerziale R che, ad un dato istante t, ha coordinate spaziali x, y e z. Ciò equivale a conoscere il raggio vettore x µ = (x, y, z, ct) (103) Supponiamo che in tale istante il punto abbia una velocità (tridimensionale) v. Dopo un intervallo di tempo innitesimo dt, il punto si è spostato di una quantità innitesima e l'incremento del raggio vettore risulta La sua norma è dx µ = (dx, dy, dz, cdt) = (v x dt, v y dt, v z dt, cdt) (104) (dx µ ) 2 = (c 2 v 2 x v 2 y v 2 z) dt 2 = (c 2 v 2 ) dt 2 (105) dove con v 2 denotiamo il quadrato del modulo tridimensionale della velocità. Osserviamo ora il punto materiale da un altro sistema di riferimento R che si muove di moto traslatorio rispetto a R proprio con velocità v. La norma rimane la stessa; d'altra parte, rispetto ad R il punto materiale è fermo. Per conseguenza, vale la seguente uguaglianza: (dx µ ) 2 = c 2 dt 2 = (c 2 v 2 ) dt 2 = (dx µ ) 2 (106) dalla quale si vede che l'intervallo di tempo dt, misurato nel sistema di riferimento che in quell'istante segue il punto materiale nel suo movimento, è un invariante relativistico (poiché lo sono (dx µ ) 2 e c 2 ). Tale intervallo di tempo viene di solito indicato con il simbolo dτ e, come abbiamo già avuto occasione di dire, viene chiamato intervallo di tempo proprio. Si ha dunque: dt = dt 1 v 2 /c 2 dτ (107) Riconsideriamo l'elemento spazio-temporale (che è un quadrivettore innitesimo) dx µ = (dx, cdt) (108) 18
Dividendo per dτ (che è una quantità scalare) otteniamo dunque un altro quadrivettore: u µ dxµ dτ = v 1 v 2 /c, c 2 1 v 2 /c 2 = (γv, γc) (109) che è naturale denire come quadrivelocità, giacché la sua parte spaziale coincide proprio con l'ordinario vettore velocità, nel limite non relativistico. Notiamo che la quadrivelocità ha norma costante (positiva) uguale a c 2 : ( ) (u µ ) 2 = γ 2 c 2 γ 2 v 2 = γ 2 c 2 1 v2 c 2 = c 2 (110) Moltiplicando per la massa m del punto materiale deniamo altrettanto il quadrimpulso: mv p µ m u µ = 1 v 2 /c, mc 2 1 v 2 /c 2 = (γmv, γmc) (111) che evidentemente ha norma costante uguale a m 2 c 2. Per quanto riguarda la dinamica, ci riferiamo alla forza di Lorentz che, d'altra parte, è una forza fondamentale della Natura; per la quale non sono necessari modelli fenomenologici, come invece accade per le forze elastiche o le forze di attrito ecc. In termini di vettori tridimensionali sappiamo che: Per la componente x, per esempio: In termini del tensore elettromagnetico: D'altra parte, per denizione di u µ : f = q (E + v B) (112) f x = q (E x + v y B z v z B y ) (113) f x = q (cf 10 + v y F 21 v z F 13 ) (114) f x = q ( ) cf 10 + u2 γ F 21 u3 γ F 13 19 (115)
Ora studiamo con cura il seguente passaggio, nel quale abbassiamo gli indici della quadrivelocità. Ricordiamoci che, per la struttura di g µν, si ha u 0 = u 0, u i = u i (questa è una regola generale da tenere sempre presente: la quarta componente di un quadrivettore rimane immutata abbassando (o innalzando) il suo indice; le componenti spaziali cambiano segno). Ricordiamoci anche dell'antisimmetria del tensore elettromagnetico. Con queste indicazioni è facile rendersi conto che si ha: f 1 = f x = q ( u0 γ F 10 + u 2 γ F 12 + u 3 γ F 13 + u 1 γ F 11 ) = q γ u νf 1ν (116) (l'ultimo addendo è identicamente nullo e lo abbiamo aggiunto nell'espressione (115); in questo modo però ci siamo avvantaggiati ottenendo una scrittura nella quale compaiono tutti gli indici sommati). Espressioni analoghe si ottengono per le altre componenti spaziali di f e in denitiva possiamo vericare che: γf i = qf iν u ν (117) dove con l'indice i abbiamo denotato la componente che può essere x, y o z. A questo punto è naturale introdurre un'analoga espressione f 0, denita da γf 0 = qf 0ν u ν (118) e scrivere γf µ = qf µν u ν (119) Al secondo membro abbiamo un quadrivettore e allora lo è altrettanto il primo membro che denisce così la quadriforza F µ : F µ γf µ = qf µν u ν (120) A parte il fattore γ, la parte spaziale coincide con l'espressione tridimensionale della forza di Lorentz f ; e la parte temporale risulta F 0 = γ q c E v (121) In denitiva, scrivendo esplicitamente la parte spaziale e quella temporale, abbiamo il quadrivettore ( F µ = γf, γ q E c v ) ( = γf, γ 1 f c v ) (122) 20
L'ultimo passaggio è giusticato dal fatto che la parte magnetica della forza di Lorentz non contribuisce (si ha un prodotto misto nullo). Dobbiamo ora uguagliare la quadriforza ad un'espressione che contenga la variazione di impulso, come è suggerito dall'equazione newtoniana. Per rispettare la covarianza, non possiamo avere altro che: La parte spaziale risulta: F dp = dτ = d dτ ovvero mv F µ = dpµ dτ 1 v 2 /c = 1 d 2 1 v 2 /c 2 dt f = d dt (123) mv 1 v 2 /c 2 (124) mv (125) 1 v 2 /c 2 che, per piccole velocità, si riduce all'equazione di Newton f = m dv/dt. Una conseguenza molto importante viene dalla quarta componente della (123) per la quale risulta: mc 2 f v dt = d (mc 2 γ) = d (126) 1 v 2 /c 2 Al primo membro compare il lavoro compiuto dalla forza di Lorentz nel tempo dt; dunque al secondo membro deve comparire la variazione di energia cinetica de. Questo ci suggerisce la seguente espressione per E: E = mc 2 1 v 2 /c 2 (127) In particolare, per piccole velocità, sviluppando in serie rispetto a v 2, si ha: ( E mc 2 1 + 1 v 2 ) 2 c 2 = mc 2 + 1 2 mv2 (128) che, a parte il valore costante mc 2, coincide con l'espressione classica. D'altra parte, se l'espressione corretta per l'energia cinetica è la (127), non possiamo omettere il termine mc 2 che risulta dunque presente anche per velocità nulle. Questo termine è chiamato energia di riposo che compete ad un punto materiale di massa m. Il solo fatto che un corpo abbia massa m implica pertanto 21
che esso possieda comunque un'energia pari a mc 2 : massa ed energia sono dunque strettamente correlate. Discuteremo più avanti l'eettiva validità della (127). Un'altra relazione importante lega l'energia all'impulso di una particella. Ricordiamo infatti che Moltiplicando per c: p µ = p, mc 1 v 2 /c 2 cp µ = cp, mc 2 = (cp, E) 1 v 2 /c 2 da questa si ricava c 2 p 2 = E 2 c 2 p 2 (129) nella quale p è la parte spaziale del quadrimpulso: mv (130) 1 v 2 /c 2 p = Ricordiamo inoltre che p 2 = p µ 1 p µ = 1 v 2 /c 2 (mc2 mv 2 ) = m 2 c 2 (131) e dunque, dalla (129): E 2 = c 2 p 2 + m 2 c 4 (132) A questo punto, è molto importante studiare il caso limite nel quale si considerano particelle di massa nulla. In meccanica classica, ad una particella di massa nulla competono impulso ed energia nulli. In pratica ciò signica che, in meccanica classica, non esistono particelle di massa nulla. O, per meglio dire, la eventuale presenza di particelle a massa nulla non è osservabile: non possiamo accorgerci se esse intervengono in un qualsiasi processo, dal momento che esse non apportano alcuna variazione di impulso o di energia (e anche di momento angolare). La situazione è completamente diversa in relatività: la presenza di particelle di massa nulla è assolutamente ammissibile ed osservabile. Ce ne accorgiamo dalla (131): nel limite di m che tende a zero osserviamo che il quadrimpulso è di tipo luce: p 2 = p µ p µ = 0 (133) 22
ma ciò non signica che la parte spaziale e quella temporale di p µ siano separatamente nulle. Per di più, dalla (132), possiamo anche osservare che una particella di massa nulla possiede un'energia cinetica: E = c p (134) D'altra parte, è semplice ricavare la relazione che lega E al modulo spaziale dell'impulso p e alla velocità v di una particella di massa m. Dalla (130) si ha infatti, prendendo i moduli e moltiplicando per c 2 : E = c2 p v (135) Confrontando con la (134) si vede che per una particella di massa nulla si ha necessariamente v = c; ovvero una particella di massa nulla si muove necessariamente alla velocità della luce. Questi risultati non sono in contraddizione con le espressioni (127) e (130) che sembrerebbero fornire impulso ed energia comunque nulli, quando m tende a zero. Infatti, tali limiti sono eettivamente zero se v è diversa da c: in questo caso la particella è inosservabile, come in meccanica classica; ma se si ammette che il passaggio al limite m 0 sia accompagnato da v che tende a c, i limiti in questione possono benissimo essere diversi da zero. Notiamo che la relazione (134) è quella che lega energia e impulso di un'onda piana monocromatica. Ciò ci permette di interpretare la propagazione del campo elettromagnetico come propagazione di particelle di massa nulla: i fotoni. Rimane la questione della validità della (127), dalla quale derivano le circostanze che abbiamo appena esposto. l'energia di risposo per la quale deve valere In particolare, vogliamo valutare E = mc 2 (136) Si deve proprio ad Einstein un argomento a riprova di ciò. Immaginiamo un vagone di massa M e di lunghezza L all'estremo sinistro del quale sia posto il ash di una macchina fotograca. All'altro estremo sia posto uno schermo S che assorbe la luce che gli viene inviata orizzontalmente, lungo l'asse x verso destra. Se p x è l'impulso del campo elettromagnetico associato alla luce del ash, non c'è dubbio che, dopo il lampo, il vagone subirà un rinculo 23
acquistando una quantità di moto p x (a meno che, ma questo è assolutamente irragionevole, non si voglia rinunciare al principio di conservazione dell'impulso). Quando poi la luce sarà arrivata ed assorbita da S, il vagone tornerà ad avere quantità di moto nulla. Di quanto si è spostato il vagone, viaggiando con impulso p x, prima che la luce venga assorbita? È evidente che la velocità del vagone è v x = p x /M (137) e il trasferimento della luce è avvenuto in un tempo t che è praticamente: dunque il vagone si è spostato della quantità t = L/c (138) x vagone = v x t = Lp x Mc = EL Mc 2 (139) e di altrettanto si è spostato il suo centro di massa. D'altra parte, durante tutto l'esperimento che si è svolto all'interno del vagone, il centro di massa del sistema complessivo deve essere rimasto dov'era inizialmente. Come possiamo riconciliare la (139) con quest'ultima circostanza? Evidentemente, il trasferimento della quantità di energia raggiante E = pc da un estremo all'altro, per un tratto L, è stato equivalente ad un trasferimento di massa m, per lo stesso tratto L in modo tale da avere: ml = M x vagone = EL c 2 (140) ovvero: E = mc 2 (141) Estensione al caso di forze arbitrarie Possiamo estendere le considerazioni fatte, a proposito della forza di Lorentz, al caso di forze di qualsiasi natura. Osserviamo intanto che, comunque si denisca la quadriforza, questa è necessariamente ortogonale al quadrimpulso. Ciò è conseguenza del fatto che il quadrimpulso ha norma costante: 0 = d dτ (pµ ) 2 = 2p µ dp µ dτ = 2p µf µ (142) 24
Consideriamo ora un punto materiale P di massa m che, ad un certo istante, nel riferimento O, ha velocità (tridimensionale) v. Consideriamo un altro sistema di riferimento O che trasla rispetto ad O proprio con velocità v. Rispetto a quest'ultimo riferimento, P è fermo in quell'istante; dunque la sua quadrivelocità è il vettore v µ = (0, γc) (143) D'altra parte, la quadriforza è comunque ortogonale alla quadrivelocità e si dovrà avere in O, quali che siano le componenti spaziali f : anché F µ = (f, 0) (144) F v = 0 La quantità f deve coincidere con la forza newtoniana, poiché nel sistema O il punto materiale si muove a velocità molto piccola rispetto a quella della luce (è addirittura fermo!) Per semplicità, immaginiamo che P si muova lungo l'asse x e sia sottoposto ad una forza anch'essa diretta lungo l'asse x. Avremo dunque F µ = (f x, 0, 0, 0) (145) Le trasformazioni di Lorentz ci dicono ora quali componenti ha la quadriforza nel sistema originale O. Precisamente, si vede che e allora scriviamo l'equazione (123) F x = γf x (146) F 0 = γβf x ovvero, ricordando che (γf x, γβf x ) = d dτ (mγv x, mγc) (147) dt = γdτ (γf x, γβf x ) = γ d dt (mγv x, mγc) (148) 25
Semplicando il fattore γ: La componente spaziale di questa equazione è: (f x, βf x ) = d dt (mγv x, mγc) (149) f x = d dt mv x 1 v 2 x/c 2 (150) che, per piccole velocità, si riduce alla formula galileiana. Dall'equazione per la parte temporale ricaviamo βf x = d dt mγc f x v x dt = d(mc 2 γ) = d mc 2 1 v 2 /c 2 (151) Al primo membro compare il lavoro fatto dalla forza nel tempo dt; dunque al secondo membro deve comparire la variazione di energia cinetica de. Anche ora vediamo dunque che la relatività ci suggerisce l'espressione E = mc 2 1 v 2 /c 2 (152) 26