La relatività ristretta: l’inizio della rivoluzione di Einstein

Ufficio Brevetti di Berna, anno 1905. Un giovane pressoché sconosciuto al mondo scientifico, Albert Einstein, pubblica vari articoli sulla prestigiosa rivista Annalen der Physik. Tre di questi, tutti contenuti nel volume 17 della rivista, aprono tre nuovi filoni di ricerca della fisica del XX secolo. Il primo articolo, pubblicato a marzo, introduce per la prima volta l’idea di quanto di luce, l’embrione di quello che dal 1926 in poi verrà chiamato fotone. Il secondo articolo, pubblicato a maggio, tratta del moto browniano, e segna una svolta nella trattazione dei moti disordinati di particelle. Il terzo, pubblicato a giugno con il titolo “Elettrodinamica dei corpi in movimento”, contiene la teoria della relatività ristretta, di cui parleremo in questo articolo.

 

La relatività galileiana

Qual è il significato del termine “relatività”? Relatività in fisica non vuol dire che “tutto è relativo”, al contrario significa definire quali siano le condizioni che rendono invarianti nella forma le leggi della natura, quando si passa da un sistema di riferimento a un altro (cioè da un osservatore a un altro) in moto relativo. Meglio avrei fatto, dirà Einstein in seguito, a usare il termine “invarianza” invece del termine “relatività”.

Per comprendere la teoria della relatività di Einstein si deve partire dalla meccanica classica, e cioè dalle leggi che Newton introduce nel 1687 nella sua opera Principi Matematici della filosofia naturale. È in quest’opera che compare definitivamente il principio di inerzia, che asserisce che “un corpo non soggetto a forze persevera nel suo stato di quiete o di moto rettilineo e uniforme”. Grazie al principio di inerzia, come si capì in seguito, la meccanica di Newton sottende in modo naturale quello che è stato chiamato verso la fine dell’Ottocento principio di relatività galileiana.

Secondo questo principio, dato un sistema in cui vale il principio di inerzia, qualunque altro sistema che si muove di moto rettilineo uniforme (cioè con velocità costante) rispetto a questo è ancora un sistema inerziale, e le leggi della meccanica newtoniana restano invariate in forma in tutta la classe dei sistemi inerziali.

Eppure, a un certo punto, la meccanica di Newton, che per circa due secoli era stata considerata la “teoria universale” (cioè valida per tutti i fenomeni naturali), viene declassata a teoria approssimata. Infatti, alla fine dell’Ottocento si cominciò a capire che le leggi che unificano i fenomeni elettrici, magnetici e ottici, scoperte da Maxwell nel 1864, non obbedivano al principio di relatività galileiana. Consideriamo, per esempio, un treno che si muove con una certa velocità e al suo interno un passeggero che cammina nel corridoio di un vagone nello stesso verso del moto del treno. Per il principio di relatività galileiana, un osservatore fermo a terra conclude che il passeggero si muove rispetto a lui con una velocità che è la somma delle velocità del treno e del passeggero. Invece, le equazioni di Maxwell, in contrasto con la relatività galileiana, prevedono che la velocità c di un raggio di luce, emesso per esempio da un laser sul treno, per l’osservatore a terra non è la somma di c e della velocità del treno, ma è ancora c. In altri termini, la velocità della luce è sempre c, indipendentemente dallo stato di moto della sorgente.

 

La relatività ristretta

Il principio di relatività (ristretta), introdotto da Einstein nel 1905, stabilisce le nuove trasformazioni delle coordinate spaziotemporali tra sistemi inerziali che lasciano invariate le leggi di Maxwell: si passa dalle trasformazioni galileiane a quelle di Lorentz. Queste erano già state introdotte da Lorentz e Poincaré, ma si deve a Einstein la comprensione delle conseguenze che queste implicano sulle nozioni di spazio e tempo. Ecco quindi che l’elettromagnetismo (relatività ristretta) diventa più fondamentale della meccanica di Newton. La meccanica di Newton non viene per questo abbandonata, ma viene considerata solo una teoria approssimata, valida nel dominio circoscritto degli oggetti che si muovono con velocità (molto) minori di quella della luce.

Albert Einstein nel 1905, il suo “annus mirabilis” (immagine: wikipedia)

Ma vediamo in dettaglio alcuni aspetti della teoria della relatività ristretta di Einstein, così come appaiono nel suo articolo del 1905 dal titolo “Elettrodinamica dei corpi in movimento”. L’articolo inizia con le seguenti parole:

È noto che l’elettrodinamica di Maxwell – così come essa è oggi comunemente intesa – conduce, nelle sue applicazioni a corpi in movimento, ad asimmetrie che non sembrano conformi ai fenomeni. Si pensi per esempio alle interazioni elettrodinamiche tra un magnete e un conduttore. [Se il magnete si muove si genera un campo elettrico, se si muove il circuito non c’è un campo elettrico ma una forza elettromotrice] […] Esempi come questo, come pure i tentativi falliti di individuare un qualche movimento della Terra relativamente al “mezzo luminifero” suggeriscono che i fenomeni elettrodinamici, al pari di quelli meccanici, non possiedono proprietà corrispondenti all’idea di quiete assoluta. Essi suggeriscono piuttosto che […] per tutti i sistemi di coordinate per i quali valgono le equazioni della meccanica varranno anche le stesse leggi elettrodinamiche e ottiche. Eleveremo questa congettura (il contenuto della quale verrà detto in quanto segue “principio di relatività”) al rango di postulato; supporremo inoltre – un postulato, questo, solo apparentemente incompatibile col precedente – che la luce, nello spazio vuoto, si propaghi sempre con una velocità determinata c, che non dipende dallo stato di moto del corpo che la emette.

Questi due postulati sembrerebbero “apparentemente inconciliabili”. Sulla loro base infatti, come già notato, due osservatori in moto relativo dovrebbero concludere che uno stesso fascio di luce ha per entrambi la stessa velocità c in contrasto con le trasformazioni che esprimono la relatività galileiana.

Per capire come riconciliare i due postulati, osserva Einstein, è necessario ripensare le nozioni di spazio e tempo, eliminando da queste alcuni caratteri mutuati dal senso comune e introducendone di nuovi, come la relatività della simultaneità, dai quali conseguono la contrazione delle lunghezze e la dilatazione dei tempi nel passaggio da un sistema di riferimento inerziale a un altro. Proprio di questo si occupa la prima parte dell’articolo, dove Einstein introduce una nuova cinematica, dimostrando quanto naturali, ancorché contrari al senso comune, siano i nuovi caratteri dello spazio e del tempo. Questa parte è particolarmente significativa per comprendere sia la svolta radicale di Einstein rispetto agli approcci di Lorentz e Poincaré, sia i contenuti della relatività ristretta. Vale quindi la pena di riassumerne i tratti essenziali.

 

Che cosa vuol dire “simultaneo”?

Nella prima sezione della cinematica, dal titolo “Definizione di simultaneità”, Einstein chiarisce che cosa si intende per “tempo”. Ricordiamo innanzitutto che un sistema di riferimento è formato da un sistema di coordinate e un orologio, e che un sistema di riferimento è inerziale se in esso vale il principio di inerzia. Si consideri un punto materiale in quiete in un dato riferimento inerziale S; la sua posizione in S «può essere determinata» – afferma Einstein – «con un campione di lunghezza rigido, utilizzando le regole della geometria euclidea, ed essere espressa in coordinate cartesiane» (x,y,z). Se ora vogliamo descrivere il moto di un punto materiale si devono esprimere i valori delle coordinate in funzione del tempo. Questa descrizione matematica, tuttavia, «non ha significato fisico se prima non si chiarisce che cosa si intende per tempo». Per questo è importante notare che ogni nostro giudizio in cui interviene il tempo è un giudizio su eventi simultanei. Per esempio, quando affermiamo che un treno arriva alle 7 intendiamo dire che la posizione delle lancette dell’orologio sul 7 e l’arrivo del treno sono eventi simultanei. Per chiarire il significato fisico di tempo bisogna quindi partire da una definizione convincente di simultaneità.

A questo fine consideriamo due osservatori A e B collocati in due punti dello spazio di un sistema inerziale che effettuano misure di tempo per eventi che si verificano nelle loro immediate vicinanze. In tal modo abbiamo definito un tempo tA per A e un tempo tB per B. Per poter confrontare le letture dei tempi dei due osservatori è necessario “sincronizzare” gli orologi. Questo viene fatto “per definizione” nel modo seguente (usiamo qui una versione equivalente ma semplificata rispetto a quella del 1905, esposta da Einstein successivamente). Supponiamo che da A al tempo tA parta un raggio di luce verso B, e da B al tempo tB parta un raggio di luce verso A. Diremo allora che i raggi sono stati inviati simultaneamente (cioè tA = tB) se la luce proveniente da A e quella proveniente da B vengono percepite da un osservatore M posto nel punto medio del segmento che congiunge la posizione di A con quella di B nello stesso istante tM.

Due raggi di luce, emessi uno dal punto A e uno dal punto B, sono stati inviati simultaneamente (cioè tA = tB) se la luce proveniente da A e quella proveniente da B sono percepite da un osservatore M posto nel punto medio del segmento AB nello stesso istante tM.

Questa definizione di sincronizzazione è applicabile in modo consistente a un qualunque numero di orologi fermi in punti diversi del sistema inerziale. Da questa definizione discende una definizione di simultaneità e di tempo: «il tempo di un evento», scrive Einstein, «è quello indicato, simultaneamente al prodursi dell’evento stesso, da un orologio stazionario situato nel luogo dell’evento e sincronizzato per ogni determinazione temporale con un dato orologio stazionario».

Cosa succede della simultaneità nel passaggio da un sistema inerziale a un altro? Per rispondere a questa domanda Einstein analizza nella seconda sezione dal titolo “Relatività di lunghezze e tempi” un altro esperimento ideale. Prendiamo ancora due raggi di luce emessi simultaneamente da due sorgenti A e B, in quiete in un riferimento inerziale S e poste (per semplicità) in due punti dell’asse delle x di S. Sia S’ un altro sistema riferimento inerziale. Per semplicità supponiamo che l’asse cartesiano x’ di S’ coincida con quello x di S e gli assi y’ e z’ di S’ siano paralleli ai rispettivi assi di S. Sia inoltre S’ in moto uniforme rispetto a S con velocità v diretta lungo le x crescenti di S, e tale che all’istante t in cui per S si verificano i bagliori in A e B il punto medio M’ coincida con il punto medio M, A’ coincida con A e B’ con B. Se S’ fosse fermo, M’ verrebbe raggiunto simultaneamente dalla luce emessa da A e da B; siccome però M’ va incontro alla luce emessa da B e si allontana dalla luce emessa da A, allora esso sarà raggiunto prima dalla luce emessa da B e poi da quella emessa da A. I due eventi simultanei in S risulteranno non simultanei in S’.

Il sistema S’ (in alto) si muove con una velocità v diretta verso destra rispetto al sistema stazionario S (in basso). A causa del moto relativo tra i due sistemi di riferimento e alla costanza della velocità della luce, l’emissione dei raggi luminosi che avviene in A e B, simultanea nel sistema di riferimento S, non è percepita come simultanea nel sistema di riferimento S’.

Se ne conclude che la nozione di simultaneità non ha significato assoluto: il dissincronismo tra osservatori in moto implica che ci sono tanti tempi quanti sono i riferimenti inerziali. Questo risultato e la sua interpretazione segnano una svolta rispetto all’approccio di Lorentz e Poincaré: non esiste un tempo assoluto, ma esistono solo tempi relativi ai diversi sistemi inerziali considerati.

 

Una nuova concezione del tempo

A questo punto è essenziale per la descrizione fisica degli eventi specificare quali relazioni intercorrono tra le misure fatte da osservatori diversi in quiete rispetto a diversi riferimenti inerziali. E infatti nella terza sezione della cinematica Einstein espone la “teoria delle trasformazioni delle coordinate e del tempo” nel passaggio da un sistema inerziale all’altro ricavando le trasformazioni di Lorentz. Sostituendo alle trasformazioni delle coordinate della meccanica di Newton (trasformazioni galileiane) le nuove trasformazioni delle coordinate si supera l’apparente contraddizione tra i due principi, quello di relatività e quello di costanza della velocità della luce. Questo implica però, come sarà chiaro in seguito (a partire in particolare dal contributo di Minkowski del 1908) una nuova struttura, non più euclidea, dello spazio-tempo.

Vale la pena sottolineare che descrivere gli eventi attribuendo loro quattro coordinate invece di tre non ha nulla che fare con la relatività ristretta. Questo tipo di rappresentazione può essere usata anche nella meccanica newtoniana. La differenza sta nel modo in cui viene considerata la coordinata temporale. Per la fisica newtoniana il tempo è assoluto, cioè uguale per tutti gli osservatori. Grazie a questo carattere assoluto del tempo il continuo quadridimensionale può essere scisso in un continuo tridimensionale e in uno unidimensionale: il passaggio dall’immagine statica (rappresentazione del moto in quattro dimensioni) all’immagine dinamica (rappresentazione del moto in tre dimensioni) possiede nella fisica classica un significato valido per tutti gli osservatori: in questo senso è ‘oggettivo’. Nella teoria della relatività invece la coordinata temporale è relativa al sistema di riferimento usato e muta nel passaggio da un sistema di riferimento all’altro. La scissione dello spazio quadridimensionale in uno a tre dimensioni e in uno a una dimensione è un procedimento dipendente dall’osservatore, privo di significato ‘oggettivo’. L’immagine statica è quindi più conveniente e ‘oggettiva’ di quella dinamica.

Le nuove nozioni di spazio e tempo e le trasformazioni che le accompagnano (le trasformazioni di Lorentz) sono perfettamente conformi all’elettromagnetismo espresso dalle equazioni di Maxwell. La meccanica classica con le trasformazioni galileiane deve essere considerata alla stregua di una teoria approssimata da riformularsi nell’ambito della nuova cinematica relativistica. La formulazione relativistica (o come si dice, covariante) della meccanica classica, cui contribuirà in modo decisivo Max Planck, permetterà di cogliere a pieno i portati della nuova teoria, ivi compresa l’equivalenza tra massa ed energia espressa dalla celebre formula E = mc2.

 

La nascita dello spazio-tempo

Con questi fondamentali passi Einstein recuperava il valore universale al principio di relatività: le contrazioni delle lunghezze e la dilatazione dei tempi non erano ipotesi ad hoc, come per Lorentz, ma erano invece parte essenziale della geometria dello spazio-tempo. La struttura della nuova geometria spaziotemporale fu formulata da Hermann Minkowski e illustrata nel suo intervento all’Ottantesima Assemblea degli scienziati naturali e dei medici tedeschi svoltasi a Colonia nel 1908. Minkowski per la prima volta presentava nella forma moderna (tensoriale) sia le equazioni di Maxwell-Lorentz, sia quelle della meccanica del punto materiale, facilitando la futura transizione dalla relatività ristretta a quella generale. «Le idee sullo spazio e sul tempo che vi presenterò», scrive Minkowski aprendo il suo intervento, «affondano le loro radici nella fisica sperimentale, e in questo risiede la loro forza. Sono idee radicali. Da ora in poi lo spazio da solo ed il tempo da solo sono condannati a svanire in mere ombre, e solo una sorta di unione di entrambi conserverà una realtà indipendente».

Se vuoi approfondire i temi che caratterizzano la relatività ristretta puoi leggere il saggio Capire davvero la relatività di Dan Styer della collana Chiavi di lettura edita da Zanichelli.

Per la lezione

Prosegui la lettura

Commenti

Lascia un commento

Il tuo indirizzo email non sarà pubblicato. I campi obbligatori sono contrassegnati *