Optik [8., überarbeitete Auflage] 9783111025599, 9783111025254

Readers appreciate this textbook primarily for its balanced didactic approach. It explains the mathematics of wave motio

364 128 202MB

German Pages 1381 [1382] Year 2023

Report DMCA / Copyright

DOWNLOAD FILE

Polecaj historie

Optik [8., überarbeitete Auflage]
 9783111025599, 9783111025254

Table of contents :
Vorwort
Inhalt
1 Ein kurzer Ausflug in die Geschichte
2 Die Wellenbewegung
3 Theorie des Elektromagnetismus, Photonen und Licht
4 Die Ausbreitung des Lichts
5 Geometrische Optik
6 Geometrische Optik: Weiterführende Themen
7 Superposition von Wellen
8 Polarisation
9 Interferenz
10 Beugung
11 Fourier-Optik
12 Grundlagen der Kohärenztheorie
13 Moderne Optik
Anhang 1: Theorie des Elektromagnetismus
Anhang 2: Kirchhoffsche Beugungstheorie
Lösungen ausgewählter Aufgaben
Literatur
Sachverzeichnis

Citation preview

Eugene Hecht Optik De Gruyter Studium

Weitere empfehlenswerte Titel Experimentalphysik Band 4: Optik, Strahlung Wolfgang Pfeiler 2021 ISBN 978-3-11-067563-4, e-ISBN (PDF) 978-3-11-067571-9

Polarization of Light In Classical, Quantum, and Nonlinear Optics Maria Chekhova, Peter Banzer, 2021 ISBN 978-3-11-066801-8, e-ISBN (PDF) 978-3-11-066802-5

Solid State Physics Siegfried Hunklinger, Christian Enss, 2022 ISBN 978-3-11-066645-8, e-ISBN (PDF) 978-3-11-066650-2 Neuauflage der deutschen Ausgabe für 2023 geplant

Festkörperphysik Rudolf Gross, Achim Marx, 2022 ISBN 978-3-11-078234-9, e-ISBN (PDF) 978-3-11-078239-4

Physik im Studium – Ein Brückenkurs Jan Peter Gehrke, Patrick Köberle, 2021 ISBN 978-3-11-070392-4, e-ISBN (PDF) 978-3-11-070393-1

Eugene Hecht

Optik

 8. Auflage

Autor Prof. Dr. Eugene Hecht [email protected] Übersetzerin & Lektorin Dr. Karen Lippert [email protected]

Die amerikanische Originalausgabe erschien 2016 unter dem Titel „Optics – 5th Edition“ bei Pearson Education, Inc., USA. Copyright 2016 Pearson Education, Inc., USA Published by arrangement with Pearson Education, Inc., USA – All rights reserved

ISBN 978-3-11-102525-4 e-ISBN (PDF) 978-3-11-102559-9 e-ISBN (EPUB) 978-3-11-102584-1 Library of Congress Control Number: 2022951361 Bibliografische Information der Deutschen Nationalbibliothek Die Deutsche Nationalbibliothek verzeichnet diese Publikation in der Deutschen Nationalbibliografie; detaillierte bibliografische Daten sind im Internet über http://dnb.dnb.de abrufbar. © 2023 Walter de Gruyter GmbH, Berlin/Boston Umschlaggestaltung: Parker, David / Science Photo Library Satz: le-tex publishing services GmbH, Leipzig Druck und Bindung: CPI books GmbH, Leck www.degruyter.com

To Ca, b. w. l.

Vorwort Mit der Erstellung der vorliegenden fünften Auflage wurden drei übergreifende Ziele verfolgt: die Verbesserung didaktischer Details, die Modernisierung der Darstellungsweise (zum Beispiel gibt es nun etwas mehr über Photonen, Zeiger und Fourieroptik) und die Aktualisierung des Inhalts, vor allem im Hinblick auf neue Technologien (zum Beispiel gibt es nun einen Abschnitt zu Atominterferometern und einen über Metamaterialien). Die Optik ist ein sich schnell entwickelndes Gebiet, und die vorliegende Auflage soll dem Leser einen aktuellen Einstieg ermöglichen, wobei der Fokus auf der Didaktik liegt. Dabei gab es mehrere Zielsetzungen: (1) Die zentrale Rolle der atomaren Streuprozesse bei fast allen Aspekten der Optik sollte klar herausgearbeitet werden. (2) Die grundlegend quantenmechanische Natur des Lichts (tatsächlich von allen Quantenteilchen) sollte von Beginn an eingeführt werden, auch wenn das Buch methodisch eher traditionell angelegt ist. Daher wird der Leser neben den vertrauten Photonenbildern auch Elektronen- und Neutronenbeugungsmuster finden. (3) Die Fouriertheorie als ein sehr mächtiges Werkzeug, das in der modernen Analyse so weit verbreitet ist, sollte bereits sehr früh eingeführt werden. Aus diesem Grund werden die Konzepte der Raumfrequenz und der räumlichen Periode bereits in Kapitel 2 vorgestellt und grafisch veranschaulicht. Auf Wunsch von Studierenden habe ich über den gesamten Text mehr als einhundert vollständig ausgearbeitete Beispiele eingestreut, in denen die im jeweiligen Abschnitt behandelten Prinzipien angewendet werden. Außerdem sind zweihundert neue Aufgaben (ohne Lösungen) in den entsprechenden Übungsabschnitten am Ende der Kapitel hinzugekommen. Lehrende können auf Anfrage eine vollständige Zusammenstellung sämtlicher Aufgabenlösungen erhalten. Nach dem Motto „Ein Bild sagt mehr als tausend Worte“ wurde der Text durch zahlreiche neue Diagramme und Fotos ergänzt. Die didaktische Stärke des Buches liegt darin, dass der behandelte Stoff tatsächlich erklärt wird. Diesem Ansatz bleibt auch die vorliegende Auflage treu. Seit Veröffentlichung der vierten Auflage habe ich jedes Jahr Optik unterrichtet, und dabei sind mir einige Stellen im Buch aufgefallen, die zum Vorteil der Studierenden noch klarer formuliert werden könnten. Aus diesem Grund werden in der vorliegenden Überarbeitung Dutzende kleine Fallstricke angesprochen und bei den Herleitungen

https://doi.org/10.1515/9783111025599-201

VI

Vorwort

viele Zwischenschritte mit angegeben. Alle Zeichnungen wurden eingehend auf Korrektheit geprüft. Einige wurden geändert, um die Verständlichkeit zu verbessern. Substanzielle Erweiterungen wurden an folgenden Stellen vorgenommen: In Kapitel 2 (Die Wellenbewegung) wurde ein Abschnitt über verdrilltes Licht hinzugefügt. In Kapitel 3 (Theorie des Elektromagnetismus, Photonen und Licht) gibt es nun eine elementare Behandlung der Differentialoperatoren Divergenz und Rotation, eine zusätzliche Diskussion über Photonen sowie Unterabschnitte zu gequetschtem Licht und zur negativen Brechung. Kapitel 4 (Die Ausbreitung des Lichts) wurde ergänzt um Kommentare zur optischen Dichte und zu elektromagnetischen Randbedingungen, desweiteren um eine ausführlichere Darstellung abklingender Wellen sowie um Unterabschnitte zur Brechung von Licht an Punktquellen, zur negativen Brechung, zur Strahlkonstruktion nach Huygens und zur Goos-Hänchen-Verschiebung. Kapitel 5 (Geometrische Optik) enthält zahlreiche neue Zeichnungen, die das Verhalten von Linsen und Spiegeln illustrieren, außerdem zusätzliche Anmerkungen zur Faseroptik sowie Unterabschnitte zu virtuellen Objekten, zur Strahlverfolgung in der Brennebene und zu mikrostrukturierten Fasern. In Kapitel 6, in dem die Behandlung der geometrischen Optik weitergeführt wird, gibt es eine neue Darstellung der einfachen Strahlverfolgung durch eine dicke Linse. Kapitel 7 (Superposition von Wellen) bietet einen neuen Abschnitt über negative Phasengeschwindigkeiten, eine deutlich erweiterte Behandlung der Fourieranalyse mit vielen Diagrammen, die – ohne Rechnung – zeigen, wie die Methode funktioniert, und eine Diskussion des optischen Frequenzkamms (dessen Erfinder 2005 mit dem Nobelpreis ausgezeichnet wurden). In Kapitel 8 (Polarisation) wird dargelegt, wie die mächtige Zeigermethode angewendet werden kann, um polarisiertes Licht zu analysieren. Außerdem gibt es hier eine neue Diskussion über das Transmissionsverhalten von Polarisatoren und einen Unterabschnitt über Wellenfronten und Strahlen in einachsigen Kristallen. Kapitel 9 (Interferenz) beginnt mit einer kurzen Diskussion über Beugung und Kohärenz im Zusammenhang mit dem Experiment von Young. Es gibt mehrere neue Unterabschnitte, darunter Nahfeld / Fernfeld, Interferenz von Teilchen und Messung der Kohärenzlänge. Kapitel 10 (Beugung) entält einen neuen Unterabschnitt Zeiger und die Amplitude des elektrischen Feldes. Dutzende von neu hinzugekommenen Diagrammen und Fotos illustrieren eine Vielzahl von Beugungsphänomenen, Kapitel 11 (Fourieroptik) umfasst nun einen Unterabschnitt Zweidimensionale Bilder, in dem durch eine bemerkenswerte Serie von Illustrationen gezeigt wird, wie durch Kombination von räumlichen Frequenzkomponenten Bilder erzeugt werden. Kapitel 12 (Grundlagen der Kohärenztheorie) enthält mehrere neue Unterabschnitte von einführendem Charakter, darunter Muster und Kohärenz sowie Beugung und verschwindende Streifen. Dazu gibt es eine Reihe von zusätzlichen, sehr instruktiven Abbildungen. In Kapitel 13 (Moderne Optik) wurde die Behandlung von Lasern erweitert und aktualisiert; es wurden Tabellen und Abbildungen ergänzt, ebenso einige neue Unterabschnitte, darunter Optoelektronische Bildrekonstruktion.

Vorwort

VII

Die vorliegende fünfte Auflage bietet in erheblichem Umfang neues Material, das besonders für Lehrende auf dem Gebiet der Optik von Interesse sein dürfte. Beispielsweise können wir nun, zusätzlich zu ebenen, sphärischen und zylindrischen Wellen, auch schraubenförmige Wellen erzeugen, für die die Fläche konstanter Phase während der Propagation durch den Raum eine Wendelfläche bildet (Abschnitt 2.11). Abgesehen von der Mathematik bereitet es Studierenden oft Schwierigkeiten zu verstehen, was die Operatoren Divergenz und Rotation physikalisch bedeuten. Diesem Problem wurde in der vorliegenden Überarbeitung Rechnung getragen, indem im Rahmen von Abschnitt 3.1.5 in sehr einfacher Weise erläutert wird, was die Operatoren eigentlich machen. Das Phänomen der negativen Brechung ist Gegenstand aktueller Forschung. Eine kurze Einführung in die physikalischen Grundlagen, die dabei eine Rolle spielen, ist nun in Kapitel 4 zu finden. Huygens entwarf eine Methode zur Konstruktion gebrochener Strahlen, die schon für sich genommen ihren Reiz hat, doch sie bietet zudem einen bequemen Zugang, um die Brechung in anisotropen Kristallen zu verstehen. Wenn man die Wechselwirkung von elektromagnetischen Wellen mit Materie untersucht (beispielsweise bei der Herleitung der fresnelschen Gleichungen), dann macht man Gebrauch von den Randbedingungen. Da manche der Studierenden vielleicht noch nicht sehr vertraut mit der Theorie des Elektromagnetismus sind, enthält die fünfte Auflage eine kurze Diskussion der physikalischen Ursprünge dieser Bedingungen (Abschnitt 4.6.1). Das Buch bietet nun auch eine kurze Einführung der Goos-Hänchen-Verschiebung, die bei der Totalreflexion auftritt (Abschnitt 4.7.1). Dies ist ein sehr interessantes Stück Physik, das in einführenden Abhandlungen häufig übergangen wird. Die Strahlverfolgung in der Brennebene ist eine unkomplizierte Methode, um den Strahlenverlauf in komplizierten Linsensystemen zu konstruieren. Die Behandlung dieser einfachen, aber mächtigen Methode wurde ebenfalls neu in die vorliegende Auflage aufgenommen; sie funktioniert gut im Seminarraum und ist ein paar Minuten der Vorlesungszeit wert. Durch mehrere neue Diagramme wird nun klarer, was es mit virtuellen Bildern und virtuellen Objekten auf sich hat, die von Linsensystemen erzeugt werden. Der weit verbreitete Einsatz von Glasfasern hat eine aktualisierte Darstellung bestimmter Aspekte dieses Themas notwendig gemacht. Zu dem neu aufgenommenen Stoff gehören unter anderem ein Abschnitt zu mikrostrukturierten Fasern sowie allgemeinere Ausführungen zu photonischen Kristallen. Ergänzend zu der normalerweise etwas formellastigen und leider „trockenen“ mathematischen Behandlung der Fouriertheorie enthält das Buch nun eine faszinierende

VIII

Vorwort

grafische Analyse, durch die deutlich wird, was die verschiedenen Integrale bewirken. Dieser Stoff eignet sich hervorragend für den Grundkurs. Um die Addition von harmonischen Wellen für die Studierenden zu visualisieren, wird ausgiebig von Zeigern Gebrauch gemacht. Die Methode ist sehr nützlich bei der Behandlung von orthogonalen Feldkomponenten, welche die verschiedenen Polarisationszustände konstituieren. Darüber hinaus liefert die Methode ein hübsches Werkzeug, mit dem man das Verhalten von Wellenplatten analysieren kann. Das Experiment von Young und allgemein die Doppelstrahlinterferenz spielen sowohl in der klassischen Optik als auch in der Quantenoptik eine zentrale Rolle. Allerdings ist die übliche Einführung in diese Thematik allzu vereinfachend, da sie die Limitierungen durch die Phänomene Beugung und Kohärenz vernachlässigt. Bei der Analyse wird nun bereits frühzeitig auf diese Komplikationen eingegangen (Abschnitt 9.1.1). Die traditionelle Behandlung der Interferenz wird erweitert durch die Verwendung von Zeigern, die die Amplitude des elektrischen Feldes grafisch repräsentieren. Damit haben die Studierenden eine alternative Möglichkeit zu visualisieren, was passiert (Abschnitt 9.3.1). Auch die Beugung lässt sich bequem mittels Zeigern beschreiben. Dieses Verfahren führt auf natürliche Weise zu der klassischen Vibrationskurve, die an Feynmans Zugang zur Quantenmechanik über Wahrscheinlichkeitsamplituden erinnert. Auf jeden Fall bietet sie den Studierenden eine alternative Möglichkeit, das Phänomen der Beugung zu verstehen, und zwar eine, die nahezu ohne Rechnung auskommt. Leser, die sich für Fourieroptik interessieren, finden nun eine wunderbare Serie von Abbildungen, die zeigt, wie aus sinusförmigen räumlichen Frequenzbeiträgen ein erkennbares zweidimensionales Bild generiert werden kann – in unserem Fall ein Porträt des jungen Einstein. Diese außergewöhnliche Sequenz von Bildern sollte unbedingt diskutiert werden, sogar in einem Einführungskurs, in dem der Stoff aus Kapitel 11 ansonsten wahrscheinlich noch zu schwierig ist. Um die weiterführende Behandlung der Kohärenz in Abbildung 12 für eine breitere Leserschaft zugänglicher zu machen, enthält die vorliegende Auflage eine Einführung, die fast ohne Mathematik auskommt und die die Grundlage für die traditionelle Darstellung schafft. Schließlich wurde der Stoff über Laser erweitert (wenngleich er auch jetzt nur einführenden Charakter hat) und stärker mit dem aktuellen Stand der Laserphysik in Einklang gebracht. In den seit der vierten Auflage vergangenen Jahren haben mir Dutzende Kollegen aus allen Teilen der Welt Kommentare, Hinweise, Vorschläge, Artikel und Fotos für diese neue Auflage zukommen lassen – ihnen allen gilt mein aufrichtiger Dank. Besonders hervorheben möchte ich Professor Chris Mack (University of Texas, Austin) und Dr. Andreas Karpf von der Adelphi University. Zu großem Dank verpflichtet bin ich auch meinen vielen Studierenden, an denen ich die neuen Texte ausgetestet habe. Sie

Vorwort

IX

haben zudem die neuen Aufgaben durchgearbeitet (nicht selten in Klausuren) und mir bei der Aufnahme von einigen der neuen Fotos geholfen. In Bezug auf Letzteres danke ich besonders Tanya Spellman, George Harrison und Irina Ostrazhnyuk für die Stunden, die sie mit der Kamera in der Hand verbracht haben. Die Unterstützung durch das Team von Addison Wesley weiß ich in höchstem Maße zu schätzen. Mein besonderer Dank gilt der Programmleiterin Katie Conley, die den Entstehungsprozess der vorliegenden fünften Auflage mit viel Geschick und Aufmerksamkeit von Anfang bis Ende geleitet hat. Das Lektorat besorgte gewissenhaft und geduldig Joanne Boehme – sie hat einen großartigen Job gemacht. Jim Atherton von Atherton Customs zeichnete Hunderte von komplexen Diagrammen. Die Ergebnisse sind wirklich außergewöhnlich und sprechen für sich. Die vorliegende Auflage wurde unter der stets präsenten Führung von John Orr von Orr Book Services entwickelt. Sein ausdauernder Einsatz für die Herstellung eines korrekten und schönen Buches verdient besonderes Lob. In einer Zeit, in der das traditionelle Verlagswesen einen radikalen Wandel durchlebt, hielt er kompromisslos an den höchsten Standards fest, wofür ich sehr dankbar bin. Es war wirklich ein Vergnügen und ein Privileg mit einem so hochprofessionellen Fachmann zusammenzuarbeiten. Schließlich danke ich meiner lieben Freundin, außergewöhnlichen Korrekturleserin und Ehefrau Carolyn Eisen Hecht, die geduldig die Mühen einer weiteren Auflage eines weiteren Buches ertrug. Ihr Humor, ihre Nachsichtigkeit, ihre emotionale Großzügigkeit und ihr guter Rat waren sehr wichtig. Wer mir Kommentare und Hinweise zur vorliegenden Auflage oder auch Vorschläge für eine künftige Auflage zukommen lassen möchte, erreicht mich an der Adelphi University, Physics Department, Garden City, NY, 11530 oder besser noch unter [email protected].

Inhalt Vorwort

V

1 1.1 1.2 1.3 1.4 1.5

Ein kurzer Ausflug in die Geschichte Vorbemerkung . . . . . . . . . . . . . Die Ursprünge . . . . . . . . . . . . . Vom siebzehnten Jahrhundert an . . . . Das neunzehnte Jahrhundert . . . . . . Das zwanzigste Jahrhundert . . . . . .

. . . . .

. . . . .

. . . . .

. . . . .

. . . . .

. . . . .

. . . . .

. . . . .

. . . . .

. . . . .

. . . . .

. . . . .

. . . . .

. . . . .

. . . . .

. . . . .

1 1 1 4 8 13

2 2.1 2.1.1 2.2 2.3 2.4 2.5 2.6 2.7 2.8 2.9 2.10 2.11

Die Wellenbewegung Eindimensionale Wellen . . . . . . . . Die Differentialgleichung einer Welle . Harmonische Wellen . . . . . . . . . . Phase und Phasengeschwindigkeit . . . Das Superpositionsprinzip . . . . . . . Die komplexe Darstellung . . . . . . . Zeiger und die Addition von Wellen . . Ebene Wellen . . . . . . . . . . . . . . Die dreidimensionale Wellengleichung Kugelwellen . . . . . . . . . . . . . . Zylinderwellen . . . . . . . . . . . . . Verdrilltes Licht . . . . . . . . . . . . . Aufgaben . . . . . . . . . . . . . . . .

. . . . . . . . . . . . .

. . . . . . . . . . . . .

. . . . . . . . . . . . .

. . . . . . . . . . . . .

. . . . . . . . . . . . .

. . . . . . . . . . . . .

. . . . . . . . . . . . .

. . . . . . . . . . . . .

. . . . . . . . . . . . .

. . . . . . . . . . . . .

. . . . . . . . . . . . .

. . . . . . . . . . . . .

. . . . . . . . . . . . .

. . . . . . . . . . . . .

. . . . . . . . . . . . .

. . . . . . . . . . . . .

19 20 24 28 35 40 43 46 49 57 59 63 65 67

3 3.1 3.1.1 3.1.2 3.1.3 3.1.4 3.1.5 3.2 3.2.1 3.3

Theorie des Elektromagnetismus, Photonen und Licht Die Grundgleichungen des Elektromagnetismus . . . . . . Das faradaysche Induktionsgesetz . . . . . . . . . . . . . Der gaußsche Satz für das elektrische Feld . . . . . . . . . Der gaußsche Satz für das magnetische Feld . . . . . . . . Das ampèresche Verkettungsgesetz . . . . . . . . . . . . . Die maxwellschen Gleichungen . . . . . . . . . . . . . . Elektromagnetische Wellen . . . . . . . . . . . . . . . . . Transversalwellen . . . . . . . . . . . . . . . . . . . . . . Energie und Impuls . . . . . . . . . . . . . . . . . . . . .

. . . . . . . . .

. . . . . . . . .

. . . . . . . . .

. . . . . . . . .

. . . . . . . . .

. . . . . . . . .

77 78 79 84 87 87 92 97 100 104

Inhalt

XII 3.3.1 3.3.2 3.3.3 3.3.4 3.4 3.4.1 3.4.2 3.4.3 3.4.4 3.5 3.5.1 3.6 3.6.1 3.6.2 3.6.3 3.6.4 3.6.5 3.6.6 3.6.7 3.7

Der Poynting-Vektor . . . . . . . . . Die Bestrahlungsstärke . . . . . . . . Photonen . . . . . . . . . . . . . . . Strahlungsdruck und Impuls . . . . . Strahlung . . . . . . . . . . . . . . . Linear beschleunigte Ladungen . . . Synchrotronstrahlung . . . . . . . . . Elektrische Dipolstrahlung . . . . . . Die Emission von Licht durch Atome Licht in Materie . . . . . . . . . . . . Dispersion . . . . . . . . . . . . . . Das elektromagnetische Spektrum . . Radiowellen . . . . . . . . . . . . . . Mikrowellen . . . . . . . . . . . . . Infrarotstrahlung . . . . . . . . . . . Sichtbares Licht . . . . . . . . . . . . Ultraviolettes Licht . . . . . . . . . . Röntgenstrahlung . . . . . . . . . . . Gammastrahlung . . . . . . . . . . . Quantenfeldtheorie . . . . . . . . . . Aufgaben . . . . . . . . . . . . . . .

. . . . . . . . . . . . . . . . . . . . .

. . . . . . . . . . . . . . . . . . . . .

. . . . . . . . . . . . . . . . . . . . .

. . . . . . . . . . . . . . . . . . . . .

. . . . . . . . . . . . . . . . . . . . .

. . . . . . . . . . . . . . . . . . . . .

. . . . . . . . . . . . . . . . . . . . .

. . . . . . . . . . . . . . . . . . . . .

. . . . . . . . . . . . . . . . . . . . .

. . . . . . . . . . . . . . . . . . . . .

. . . . . . . . . . . . . . . . . . . . .

. . . . . . . . . . . . . . . . . . . . .

. . . . . . . . . . . . . . . . . . . . .

. . . . . . . . . . . . . . . . . . . . .

. . . . . . . . . . . . . . . . . . . . .

. . . . . . . . . . . . . . . . . . . . .

. . . . . . . . . . . . . . . . . . . . .

104 109 113 124 128 130 132 135 138 142 146 158 158 160 162 164 167 168 170 170 173

4 4.1 4.2 4.2.1 4.2.2 4.2.3 4.3 4.3.1 4.4 4.4.1 4.4.2 4.4.3 4.5 4.6 4.6.1 4.6.2 4.6.3 4.7 4.7.1 4.8

Die Ausbreitung des Lichts Einführung . . . . . . . . . . . . . . . . . . . . Rayleigh-Streuung . . . . . . . . . . . . . . . . Streuung und Interferenz . . . . . . . . . . . . . Die Transmission von Licht durch dichte Medien Transmission und Brechungsindex . . . . . . . . Reflexion . . . . . . . . . . . . . . . . . . . . . Das Reflexionsgesetz . . . . . . . . . . . . . . . Brechung . . . . . . . . . . . . . . . . . . . . . Das Brechungsgesetz . . . . . . . . . . . . . . . Das huygenssche Prinzip . . . . . . . . . . . . . Lichtstrahlen und Normalkongruenz . . . . . . . Das fermatsche Prinzip . . . . . . . . . . . . . . Der elektromagnetische Ansatz . . . . . . . . . Wellen an einer Grenzfläche . . . . . . . . . . . Die fresnelschen Gleichungen . . . . . . . . . . Interpretation der fresnelschen Gleichungen . . . Innere Totalreflexion . . . . . . . . . . . . . . . Die abklingende Welle . . . . . . . . . . . . . . Optische Eigenschaften von Metallen . . . . . .

. . . . . . . . . . . . . . . . . . .

. . . . . . . . . . . . . . . . . . .

. . . . . . . . . . . . . . . . . . .

. . . . . . . . . . . . . . . . . . .

. . . . . . . . . . . . . . . . . . .

. . . . . . . . . . . . . . . . . . .

. . . . . . . . . . . . . . . . . . .

. . . . . . . . . . . . . . . . . . .

. . . . . . . . . . . . . . . . . . .

. . . . . . . . . . . . . . . . . . .

. . . . . . . . . . . . . . . . . . .

181 181 182 185 187 192 197 199 204 205 217 220 222 231 231 234 239 253 256 263

Inhalt

XIII

4.9 4.10 4.11 4.11.1 4.11.2

Alltägliche Aspekte der Wechselwirkung zwischen Licht und Materie Die stokessche Behandlung der Reflexion und Brechung . . . . . . . Photonen, Wellen und Wahrscheinlichkeit . . . . . . . . . . . . . . . Quantenelektrodynamik . . . . . . . . . . . . . . . . . . . . . . . . Photonen und die Gesetze der Reflexion und Brechung . . . . . . . . Aufgaben . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

269 279 281 284 287 288

5 5.1 5.2 5.2.1 5.2.2 5.2.3 5.3 5.3.1 5.3.2 5.3.3 5.4 5.4.1 5.4.2 5.4.3 5.5 5.5.1 5.5.2 5.6 5.6.1 5.7 5.7.1 5.7.2 5.7.3 5.7.4 5.7.5 5.7.6 5.7.7 5.8 5.8.1 5.8.2 5.9

Geometrische Optik Einführung . . . . . . . . . . . . . . . . . . Linsen . . . . . . . . . . . . . . . . . . . . . Asphärische Flächen . . . . . . . . . . . . . Brechung an Kugelflächen . . . . . . . . . . Dünne Linsen . . . . . . . . . . . . . . . . . Blenden . . . . . . . . . . . . . . . . . . . . Apertur- und Feldblenden . . . . . . . . . . Eintritts- und Austrittspupillen . . . . . . . . Das Öffnungsverhältnis und die Blendenzahl Spiegel . . . . . . . . . . . . . . . . . . . . Ebene Spiegel . . . . . . . . . . . . . . . . . Asphärische Spiegel . . . . . . . . . . . . . Sphärische Spiegel . . . . . . . . . . . . . . Prismen . . . . . . . . . . . . . . . . . . . . Dispersionsprismen . . . . . . . . . . . . . . Reflexionsprismen . . . . . . . . . . . . . . Faseroptik . . . . . . . . . . . . . . . . . . . Technologie der Glasfaserübertragung . . . . Optische Systeme . . . . . . . . . . . . . . . Das Auge . . . . . . . . . . . . . . . . . . . Die Brille . . . . . . . . . . . . . . . . . . . Die Lupe . . . . . . . . . . . . . . . . . . . Okulare . . . . . . . . . . . . . . . . . . . . Das Mikroskop . . . . . . . . . . . . . . . . Die Kamera . . . . . . . . . . . . . . . . . . Das Fernrohr . . . . . . . . . . . . . . . . . Wellenfrontumformung . . . . . . . . . . . . Adaptive Optik . . . . . . . . . . . . . . . . Phasenkonjugation . . . . . . . . . . . . . . Gravitationslinsen . . . . . . . . . . . . . . Aufgaben . . . . . . . . . . . . . . . . . . .

. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

303 303 305 306 310 316 349 349 350 356 359 360 365 368 377 377 381 386 393 407 408 414 424 428 430 433 437 452 453 458 461 464

6 6.1 6.2

Geometrische Optik: Weiterführende Themen Dicke Linsen und Linsensysteme . . . . . . . . . . . . . . . . . . . . Strahlenverlaufsberechnung . . . . . . . . . . . . . . . . . . . . . .

481 481 488

. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

Inhalt

XIV 6.2.1 6.3 6.3.1 6.3.2 6.4 6.5

Matrizenmethoden . . . . . . . Aberrationen . . . . . . . . . . Monochromatische Aberrationen Chromatische Aberrationen . . GRIN-Systeme . . . . . . . . . Abschließende Bemerkungen . Aufgaben . . . . . . . . . . . .

. . . . . . .

. . . . . . .

. . . . . . .

. . . . . . .

. . . . . . .

. . . . . . .

. . . . . . .

. . . . . . .

. . . . . . .

. . . . . . .

. . . . . . .

. . . . . . .

. . . . . . .

. . . . . . .

. . . . . . .

. . . . . . .

490 505 506 528 538 543 544

7 7.1 7.1.1 7.1.2 7.1.3 7.1.4 7.2 7.2.1 7.2.2 7.3 7.3.1 7.4 7.4.1 7.4.2 7.4.3 7.4.4

Superposition von Wellen Die Addition von Wellen gleicher Frequenz . . . Die algebraische Methode . . . . . . . . . . . . Die komplexe Methode . . . . . . . . . . . . . . Zeigeraddition . . . . . . . . . . . . . . . . . . Stehende Wellen . . . . . . . . . . . . . . . . . Die Addition von Wellen verschiedener Frequenz Schwebungen . . . . . . . . . . . . . . . . . . . Gruppengeschwindigkeit . . . . . . . . . . . . . Anharmonische periodische Wellen . . . . . . . Fourierreihen . . . . . . . . . . . . . . . . . . . Nichtperiodische Wellen . . . . . . . . . . . . . Fourier-Integrale . . . . . . . . . . . . . . . . . Impulse und Wellenpakete . . . . . . . . . . . . Die Kohärenzlänge . . . . . . . . . . . . . . . . Diskrete Fourier-Transformation . . . . . . . . . Aufgaben . . . . . . . . . . . . . . . . . . . . .

. . . . . . . . . . . . . . . .

. . . . . . . . . . . . . . . .

. . . . . . . . . . . . . . . .

. . . . . . . . . . . . . . . .

. . . . . . . . . . . . . . . .

. . . . . . . . . . . . . . . .

. . . . . . . . . . . . . . . .

. . . . . . . . . . . . . . . .

. . . . . . . . . . . . . . . .

. . . . . . . . . . . . . . . .

. . . . . . . . . . . . . . . .

549 550 550 557 558 561 570 571 574 584 584 603 606 610 615 620 632

8 8.1 8.1.1 8.1.2 8.1.3 8.1.4 8.1.5 8.2 8.2.1 8.3 8.3.1 8.3.2 8.3.3 8.4 8.4.1 8.4.2

Polarisation Die Natur des polarisierten Lichts . . Lineare Polarisation . . . . . . . . . Zirkulare Polarisation . . . . . . . . . Elliptische Polarisation . . . . . . . . Natürliches Licht . . . . . . . . . . . Der Drehimpuls und das Photonenbild Polarisatoren . . . . . . . . . . . . . Das malussche Gesetz . . . . . . . . Dichroismus . . . . . . . . . . . . . Der Drahtgitterpolarisator . . . . . . Dichroitische Kristalle . . . . . . . . Das Polaroidfilter . . . . . . . . . . . Doppelbrechung . . . . . . . . . . . Kalkspat . . . . . . . . . . . . . . . Doppelbrechende Kristalle . . . . . .

. . . . . . . . . . . . . . .

643 643 644 648 651 654 655 657 658 660 660 662 663 668 670 677

. . . . . . . . . . . . . . .

. . . . . . .

. . . . . . . . . . . . . . .

. . . . . . .

. . . . . . . . . . . . . . .

. . . . . . .

. . . . . . . . . . . . . . .

. . . . . . .

. . . . . . . . . . . . . . .

. . . . . . . . . . . . . . .

. . . . . . . . . . . . . . .

. . . . . . . . . . . . . . .

. . . . . . . . . . . . . . .

. . . . . . . . . . . . . . .

. . . . . . . . . . . . . . .

. . . . . . . . . . . . . . .

. . . . . . . . . . . . . . .

. . . . . . . . . . . . . . .

. . . . . . . . . . . . . . .

. . . . . . . . . . . . . . .

Inhalt

XV

8.4.3 8.5 8.5.1 8.6 8.6.1 8.7 8.7.1 8.7.2 8.8 8.9 8.9.1 8.9.2 8.10 8.10.1 8.10.2 8.11 8.11.1 8.11.2 8.11.3 8.12 8.13 8.13.1 8.13.2 8.13.3

Doppelbrechende Polarisatoren . . . . . . . . . . . . . . . Streuung und Polarisation . . . . . . . . . . . . . . . . . . Polarisation durch Streuung . . . . . . . . . . . . . . . . . Polarisation durch Reflexion . . . . . . . . . . . . . . . . . Eine Anwendung der fresnelschen Gleichungen . . . . . . . Verzögerungsplättchen . . . . . . . . . . . . . . . . . . . . Phasenplättchen und Rhomboeder . . . . . . . . . . . . . . Kompensatoren . . . . . . . . . . . . . . . . . . . . . . . . Zirkularpolarisatoren . . . . . . . . . . . . . . . . . . . . . Polarisation von polychromatischem Licht . . . . . . . . . . Bandbreite und Kohärenzzeit einer polychromatischen Welle Interferenzfarben . . . . . . . . . . . . . . . . . . . . . . . Optische Aktivität . . . . . . . . . . . . . . . . . . . . . . Ein Modell . . . . . . . . . . . . . . . . . . . . . . . . . . Optisch aktive Biomoleküle . . . . . . . . . . . . . . . . . Erzwungene optische Effekte – Optische Modulatoren . . . Photoelastizität . . . . . . . . . . . . . . . . . . . . . . . . Der Faraday-Effekt . . . . . . . . . . . . . . . . . . . . . . Der Kerr-Effekt und der Pockels-Effekt . . . . . . . . . . . Flüssigkristalle . . . . . . . . . . . . . . . . . . . . . . . . Eine mathematische Beschreibung der Polarisation . . . . . Die stokesschen Parameter . . . . . . . . . . . . . . . . . . Die Jones-Vektoren . . . . . . . . . . . . . . . . . . . . . . Die Jones-Matrizen und die Mueller-Matrizen . . . . . . . . Aufgaben . . . . . . . . . . . . . . . . . . . . . . . . . . .

. . . . . . . . . . . . . . . . . . . . . . . . .

. . . . . . . . . . . . . . . . . . . . . . . . .

. . . . . . . . . . . . . . . . . . . . . . . . .

. . . . . . . . . . . . . . . . . . . . . . . . .

. . . . . . . . . . . . . . . . . . . . . . . . .

683 686 687 689 693 696 697 708 709 711 711 713 714 719 721 722 722 724 727 731 735 736 739 742 745

9 9.1 9.1.1 9.2 9.2.1 9.2.2 9.3 9.3.1 9.4 9.4.1 9.4.2 9.5 9.6 9.6.1 9.7 9.7.1

Interferenz Allgemeine Betrachtungen . . . . . . . . . . . . Nahfeld / Fernfeld . . . . . . . . . . . . . . . . Interferenzbedingungen . . . . . . . . . . . . . Zeitliche und räumliche Kohärenz . . . . . . . . Die Fresnel-Arago-Gesetze . . . . . . . . . . . . Interferometer mit Wellenfrontaufspaltung . . . . Das youngsche Doppelspaltexperiment . . . . . Interferometer mit Amplitudenaufspaltung . . . Dielektrische Schichten – Zweistrahlinterferenz . Spiegel-Interferometer . . . . . . . . . . . . . . Typen und Lokalisierung von Interferenzmustern Mehrstrahlinterferenz . . . . . . . . . . . . . . . Das Fabry-Perot-Interferometer . . . . . . . . . Anwendungen von Ein- und Mehrschichtfilmen . Mathematische Behandlung . . . . . . . . . . .

. . . . . . . . . . . . . . .

. . . . . . . . . . . . . . .

. . . . . . . . . . . . . . .

. . . . . . . . . . . . . . .

. . . . . . . . . . . . . . .

759 760 766 767 768 771 772 773 794 794 811 823 826 834 842 843

. . . . . . . . . . . . . . .

. . . . . . . . . . . . . . .

. . . . . . . . . . . . . . .

. . . . . . . . . . . . . . .

. . . . . . . . . . . . . . .

. . . . . . . . . . . . . . .

Inhalt

XVI 9.7.2 9.7.3 9.8 9.8.1 9.8.2 9.8.3 9.8.4

. . . . . . . .

. . . . . . . .

. . . . . . . .

847 849 852 852 856 857 859 863

10 Beugung 10.1 Einleitende Betrachtungen . . . . . . . . . . . . . . . . . . . . . 10.1.1 Undurchsichtige Hindernisse . . . . . . . . . . . . . . . . . . . . 10.1.2 Fraunhofer- und Fresnelbeugung . . . . . . . . . . . . . . . . . . 10.1.3 Mehrere kohärente Oszillatoren . . . . . . . . . . . . . . . . . . 10.2 Fraunhoferbeugung . . . . . . . . . . . . . . . . . . . . . . . . . 10.2.1 Beugung am Einzelspalt . . . . . . . . . . . . . . . . . . . . . . 10.2.2 Beugung am Doppelspalt . . . . . . . . . . . . . . . . . . . . . . 10.2.3 Beugung an vielen Spalten . . . . . . . . . . . . . . . . . . . . . 10.2.4 Beugung an einer rechteckigen Öffnung . . . . . . . . . . . . . . 10.2.5 Beugung an einer kreisrunden Öffnung . . . . . . . . . . . . . . 10.2.6 Das Auflösungsvermögen abbildender Systeme . . . . . . . . . . 10.2.7 Der Besselstrahl nullter Ordnung . . . . . . . . . . . . . . . . . . 10.2.8 Das Beugungsgitter . . . . . . . . . . . . . . . . . . . . . . . . . 10.3 Fresnelbeugung . . . . . . . . . . . . . . . . . . . . . . . . . . . 10.3.1 Die freie Ausbreitung einer Kugelwelle . . . . . . . . . . . . . . 10.3.2 Die Vibrationskurve . . . . . . . . . . . . . . . . . . . . . . . . 10.3.3 Kreisförmige Öffnungen . . . . . . . . . . . . . . . . . . . . . . 10.3.4 Kreisförmige Hindernisse . . . . . . . . . . . . . . . . . . . . . 10.3.5 Die fresnelsche Zonenplatte . . . . . . . . . . . . . . . . . . . . 10.3.6 Die fresnelschen Integrale und die Beugung am rechteckigen Loch 10.3.7 Die Cornu-Spirale . . . . . . . . . . . . . . . . . . . . . . . . . 10.3.8 Fresnelbeugung am Spalt . . . . . . . . . . . . . . . . . . . . . . 10.3.9 Beugung am halbunendlichen, undurchsichtigen Schirm . . . . . 10.3.10 Beugung an einem schmalen Hindernis . . . . . . . . . . . . . . 10.3.11 Das Prinzip von Babinet . . . . . . . . . . . . . . . . . . . . . . 10.4 Die skalare Beugungstheorie von Kirchhoff . . . . . . . . . . . . 10.5 Beugungswellen . . . . . . . . . . . . . . . . . . . . . . . . . . Aufgaben . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

. . . . . . . . . . . . . . . . . . . . . . . . . . . .

. . . . . . . . . . . . . . . . . . . . . . . . . . . .

873 873 877 879 882 887 887 903 909 924 929 937 942 945 960 960 966 968 978 981 986 991 997 1002 1005 1007 1009 1014 1016

Fourier-Optik Einleitung . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Fourier-Transformierte . . . . . . . . . . . . . . . . . . . . . . . . .

1029 1029 1030

11 11.1 11.2

Reflexmindernde Schichten . . . . . Periodische Mehrschichtsysteme . . . Anwendungen der Interferometrie . . Streulichtinterferenz . . . . . . . . . Das Twyman-Green-Interferometer . Das rotierende Sagnac-Interferometer Radarinterferometrie . . . . . . . . . Aufgaben . . . . . . . . . . . . . . .

. . . . . . . .

. . . . . . . .

. . . . . . . .

. . . . . . . .

. . . . . . . .

. . . . . . . .

. . . . . . . .

. . . . . . . .

. . . . . . . .

. . . . . . . .

. . . . . . . .

. . . . . . . .

. . . . . . . .

. . . . . . . .

Inhalt

XVII

11.2.1 11.2.2 11.2.3 11.3 11.3.1 11.3.2 11.3.3 11.3.4 11.3.5 11.3.6

Eindimensionale Transformierte . . . . . Zweidimensionale Transformierte . . . . Die diracsche Delta-Funktion . . . . . . Optische Anwendungen . . . . . . . . . Zweidimensionale Bilder . . . . . . . . . Lineare Systeme . . . . . . . . . . . . . Das Faltungsintegral . . . . . . . . . . . Fourier-Methoden in der Beugungstheorie Spektren und Korrelation . . . . . . . . . Übertragungsfunktionen . . . . . . . . . Aufgaben . . . . . . . . . . . . . . . . .

. . . . . . . . . . .

. . . . . . . . . . .

. . . . . . . . . . .

. . . . . . . . . . .

. . . . . . . . . . .

. . . . . . . . . . .

. . . . . . . . . . .

. . . . . . . . . . .

. . . . . . . . . . .

. . . . . . . . . . .

. . . . . . . . . . .

. . . . . . . . . . .

. . . . . . . . . . .

. . . . . . . . . . .

. . . . . . . . . . .

1030 1035 1041 1049 1049 1055 1060 1077 1085 1099 1109

12 12.1 12.2 12.2.1 12.3 12.4 12.4.1 12.5 12.5.1 12.5.2

Grundlagen der Kohärenztheorie Einführung . . . . . . . . . . . . . . . . . . . . . . . . . . Muster und Kohärenz . . . . . . . . . . . . . . . . . . . . . Beugung und verschwindende Streifen . . . . . . . . . . . . Die Sichtbarkeit . . . . . . . . . . . . . . . . . . . . . . . . Die wechselseitige Kohärenzfunktion und der Kohärenzgrad Zeitliche und räumliche Kohärenz . . . . . . . . . . . . . . Kohärenz und Stellarinterferometrie . . . . . . . . . . . . . Das Michelson-Stellarinterferometer . . . . . . . . . . . . . Korrelationsinterferometrie . . . . . . . . . . . . . . . . . . Aufgaben . . . . . . . . . . . . . . . . . . . . . . . . . . .

. . . . . . . . . .

. . . . . . . . . .

. . . . . . . . . .

. . . . . . . . . .

. . . . . . . . . .

1117 1117 1121 1127 1129 1138 1143 1146 1146 1151 1157

13 13.1 13.1.1 13.1.2 13.1.3 13.1.4 13.2 13.2.1 13.2.2 13.2.3 13.2.4 13.2.5 13.3 13.3.1 13.3.2 13.4 13.4.1 13.4.2

Moderne Optik Laser und Laserstrahlung . . . . . . . . . . . . . . . . . Strahlungsenergie und Materie im Gleichgewicht . . . . Induzierte Emission . . . . . . . . . . . . . . . . . . . . Der Laser . . . . . . . . . . . . . . . . . . . . . . . . . Fantastisches Licht . . . . . . . . . . . . . . . . . . . . Das Bild als räumliche Verteilung optischer Information Raumfrequenzen . . . . . . . . . . . . . . . . . . . . . Die abbesche Bildentstehungstheorie . . . . . . . . . . Räumliche Filterung . . . . . . . . . . . . . . . . . . . Phasenkontrast . . . . . . . . . . . . . . . . . . . . . . Die Dunkelfeld- und die Schlierenmethode . . . . . . . Holografie . . . . . . . . . . . . . . . . . . . . . . . . . Verfahren . . . . . . . . . . . . . . . . . . . . . . . . . Entwicklungen und Anwendungen . . . . . . . . . . . . Nichtlineare Optik . . . . . . . . . . . . . . . . . . . . Optische Gleichrichtung . . . . . . . . . . . . . . . . . Erzeugung von Harmonischen . . . . . . . . . . . . . .

. . . . . . . . . . . . . . . . .

. . . . . . . . . . . . . . . . .

. . . . . . . . . . . . . . . . .

. . . . . . . . . . . . . . . . .

. . . . . . . . . . . . . . . . .

1163 1163 1164 1172 1180 1206 1214 1214 1219 1222 1229 1235 1238 1238 1253 1262 1264 1264

. . . . . . . . . . . . . . . . .

. . . . . . . . . . . . . . . . .

XVIII

Inhalt

13.4.3 Frequenzmischung . . . . . . . . . . . . . . . . . . . . . . . . . . . 13.4.4 Selbstfokussierung von Licht . . . . . . . . . . . . . . . . . . . . . . Aufgaben . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

1268 1269 1271

Anhang 1: Theorie des Elektromagnetismus

1281

Anhang 2: Kirchhoffsche Beugungstheorie

1287

Lösungen ausgewählter Aufgaben

1289

Literatur

1335

Sachverzeichnis

1343

1

Ein kurzer Ausflug in die Geschichte

1.1

Vorbemerkung

Thema dieses Buches ist eine formale Behandlung eines Großteils der Optik, wobei der Schwerpunkt auf modernen Aspekten liegen wird. Dieses umfangreiche Wissen hat sich im Laufe von dreitausend Jahren Menschheitsgeschichte angesammelt. Bevor wir uns damit auseinandersetzen wollen, was man heutzutage unter Optik versteht, wollen wir kurz den Weg verfolgen, der uns bis hierher gebracht hat – zumindest, um dieses Wissensgebiet einmal im Kontext zu sehen.

1.2

Die Ursprünge

Die optische Technologie lässt sich bis in die Antike zurückverfolgen. In Exodus 38.8 (ca. 1200 v. Chr) lesen wir, wie Bezaleel bei der Vorbereitung von Lade und Tempel die „Spiegel der Frauen“ zu einem bronzenen Gefäß (einem Zeremonienbecken) umgoss. Die frühen Spiegel bestanden aus poliertem Kupfer und Bronze, später aus Spiegelmetall, einer zinnreichen Kupferlegierung. Einzelne Stücke aus dem alten Ägypten sind erhalten geblieben, unter anderem ein Spiegel in hervorragendem Zustand, den man zusammen mit anderen Geräten im Bereich der Arbeiterlager nahe der Pyramide von Sesostris dem Zweiten (ca. 1900 v. Chr.) im Niltal ausgrub. Die griechischen Philosophen Pythagoras, Demokrit, Empedokles, Plato, Aristoteles und andere entwickelten mehrere Theorien der Natur des Lichts; die Vorstellungen des Aristoteles finden sich in ähnlicher Weise in der Äthertheorie des neunzehnten Jahrhunderts wieder. Dass Licht sich geradlinig ausbreitet, war ebenso bekannt wie das Reflexionsgesetz, das Euklid 300 v. Chr. in seinem Buch Katoptrik beschrieb. Hero von Alexandria versuchte, beide Phänomene damit zu erklären, dass Licht stets den kürzesten Weg zwischen zwei Punkten nimmt. Eine Anspielung auf das Brennglas – eine Sammellinse, mit der man Feuer entzündete – findet sich in der Komödie Die Wolken von Aristophanes (424 v. Chr.). In Platos Staat wird erwähnt, dass Gegenstände, die man in Wasser taucht, an der Wasseroberfläche scheinbar abknicken. Kleomedes und später Claudius Ptolemäus (50 bzw. 130 n. Chr.) aus Alexandria untersuchten die Brechung; von Letzterem sind uns Tabellen mit ziemlich genauen Messwerten für Einfalls- und https://doi.org/10.1515/9783111025599-001

2

1 Ein kurzer Ausflug in die Geschichte

Brechungswinkel in verschiedenen Medien überliefert. Aus den Aufzeichnungen des Geschichtsschreibers Plinius (23 bis 79 n. Chr.) weiß man, dass auch die Römer das Brennglas kannten. In römischen Ruinen fand man Glas- und Kristallkugeln, in Pompeji eine plankonvexe Linse. Der römische Philosoph Seneca (3 v. Chr. bis 65 n. Chr.) berichtete, dass man eine wassergefüllte Glaskugel zur Vergrößerung benutzen kann. Wahrscheinlich haben römische Künstler solche Vergrößerungsgläser verwendet, um sich die Ausführung filigraner Arbeiten zu erleichtern. Nach dem Niedergang des Weströmischen Reiches (475 n. Chr.), der ungefähr dem Beginn des frühen Mittelalters entspricht, waren in Europa für längere Zeit kaum wissenschaftliche Erfolge zu verzeichnen. Die von griechisch-römisch-christlicher Kultur dominierten Mittelmeerländer fielen rasch unter die Herrschaft Allahs. So verschob sich das Zentrum der Gelehrsamkeit in die arabische Welt. Die Brechung wurde von Abu Sad al-Ala Ibn Sahl (940–1000) untersucht, der zur Zeit des Abbasidenkalifats in Bagdad wirkte und 984 die Schrift Über Brennspiegel und -gläser verfasste. Diese Schrift enthält eine akkurate schematische Darstellung der Brechung – die erste überhaupt. Ibn Sahl beschrieb sowohl parabolische als auch elliptische Brennspiegel und analysierte hyperbolische plankonvexe sowie hyperbolische bikonvexe Linsen. Der Gelehrte Abu Ali al Hasan ibn Haytham (965–1039), in der westlichen Welt auch unter dem Namen Alhazen bekannt, war ein äußerst produktiver Autor, der Werke zu einer Vielzahl von Themen verfasste, darunter 14 Bücher allein zur Optik. Er arbeitete am Reflexionsgesetz, indem er den Einfalls- und den Reflexionswinkel in eine gemeinsame Ebene senkrecht zur Grenzfläche legte; er beschäftigte sich mit Kugel- und Parabolspiegeln und beschrieb das menschliche Auge sehr ausführlich. Fermat vorwegnehmend schlug Alhazen vor, dass sich Licht in einem Medium entlang des schnellsten Weges ausbreitet. Gegen Ende des dreizehnten Jahrhunderts begann Europa langsam, aus seiner intellektuellen Erstarrung zu erwachen. Alhazens Werk wurde ins Lateinische übersetzt und hatte einen bedeutenden Einfluss auf die Schriften von Robert Grosseteste, Bischof von Lincoln (1175–1253), sowie auf die Arbeiten des polnischen Mathematikers Vitello (Witelo). Diese beiden Gelehrten erweckten die Optik als Wissenschaft wieder zum Leben. Ihre Arbeiten waren auch dem Franziskaner Roger Bacon (1215–1294) bekannt, der vielfach als der erste Wissenschaftler nach heutigem Verständnis betrachtet wird. Bacon kam wahrscheinlich als Erster auf die Idee, Linsen zur Korrektur des Sehvermögens zu verwenden, und deutete sogar die Möglichkeit an, mehrere Linsen zu einem Teleskop zu kombinieren. Er hatte auch eine Vorstellung davon, wie Lichtstrahlen eine Linse durchqueren. Nach Bacons Tod schlief die Optik wieder ein. Bereits im vierzehnten Jahrhundert findet man auf Gemälden europäischer Künstler allerdings Mönche mit Augengläsern. Inzwischen hatten Alchimisten auch ein flüssiges Zinnamalgam (eine Legierung aus Zinn und Quecksilber) entdeckt, das sich auf die Rückseite von Glasplatten streichen ließ: Der moderne Spiegel war geboren.

1.2 Die Ursprünge

3

Frühe Darstellung einer Marktszene in Europa. Der Mann links verkauft Brillen. (INTERFOTO/Alamy)

Leonardo da Vinci (1452–1519) beschrieb die „Camera obscura“, die durch die Arbeiten von Giovanni Battista Della Porta (1535–1615) auch der Allgemeinheit zugänglich gemacht wurde. Della Porta erläuterte 1589 in seiner Schrift Magia naturalis Mehrfachspiegel und Kombinationen von Sammel- und Zerstreuungslinsen. In diese erste Periode der Optik fallen, wie man sieht, nur relativ wenige wichtige Ereignisse. Der Anfang war gemacht – der Fortschritt allerdings ließ auf sich warten. Erst später, im siebzehnten Jahrhundert, sollte ein Sturm von technischen Umsetzungen und neuen aufregenden Entdeckungen über die Optik hereinbrechen.

Giovanni Battista Della Porta (1535–1615). (US National Library of Medicine)

1 Ein kurzer Ausflug in die Geschichte

4

1.3

Vom siebzehnten Jahrhundert an

Wer das Linsenfernrohr tatsächlich erfand, wissen wir nicht. Sicher ist lediglich, dass Hans Lippershey (1587–1619), ein holländischer Brillenhersteller, am 2. Oktober 1608 ein solches Gerät zum Patent anmeldete, wie man in Aufzeichnungen des Haager Archivs nachlesen kann. Galileo Galilei (1564–1642) hörte in Padua von dieser Erfindung und baute das Instrument innerhalb weniger Monate mit selbst geschliffenen Linsen nach. Fast genau zur selben Zeit wurde das Mikroskop erfunden, möglicherweise von dem Holländer Zacharias Janssen (1588–1632). Francisco Fontana (1580–1656) aus Neapel ersetzte das konkave Okular des Mikroskops durch eine konvexe Linse. In ähnlicher Weise wandelte Johannes Kepler (1571–1630) das Teleskop ab. 1611 veröffentlichte Kepler seine Dioptrik. Er hatte die innere Totalreflexion entdeckt und kam damit zu einer für kleine Winkel gültigen Näherung des Brechungsgesetzes: In diesem Fall sind Einfalls- und Brechungswinkel einander proportional. Kepler entwickelte die Optik erster Ordnung für Systeme mit dünnen Linsen und beschrieb in seinem Buch die genaue Funktionsweise sowohl des Keplerschen (mit einer Sammellinse als Okular) als auch des Galileischen (mit einer Zerstreuungslinse als Okular) Fernrohrs. Willebrord Snell (1591–1626), Professor in Leyden, fand 1621 empirisch das lange gesuchte Brechungsgesetz – dies war zweifellos eine der Sternstunden der Optik. Mit der Erkenntnis, wie Lichtstrahlen abgelenkt werden, wenn sie die Grenze zwischen zwei Medien durchqueren, öffnete Snell mit einem Schlag die Tür zur modernen angewandten Optik. René Descartes (1596–1650) formulierte das Brechungsgesetz erstmals in der uns heute vertrauten Form mit Sinustermen. Bei der Ableitung des Gesetzes betrachtete Descartes das Licht als einen Druck, der sich in einem elastischen Medium fortpflanzt. In La Dioptrique (1637) schrieb er: ...erinnere man sich an die Natur, die ich dem Licht zuschrieb, als ich sagte, dass Licht nichts anderes sei als eine bestimmte Bewegung oder Wirkung in einer sehr feinen Substanz, die die Poren aller anderen Gegenstände ausfüllt...

Johannes Kepler (1571–1630). (Nickolae/Fotolia)

1.3 Vom siebzehnten Jahrhundert an

5

René Descartes (1596–1650); Gemälde von Frans Hals. (Georgios Kollidas/Shutterstock)

Descartes betrachtete das Universum demnach als gefüllten Raum. Pierre de Fermat (1601–1665) bezweifelte dies und leitete, ausgehend von seinem eigenen Prinzip der kürzesten Zeit (1657), das Brechungsgesetz neu her. Das Phänomen der Beugung, also der Ablenkung des Lichts von der geradlinigen Ausbreitung beim Passieren eines Hindernisses, wurde erstmals von Professor Francesco Maria Grimaldi (1618–1663) am Jesuitenkolleg in Bologna beschrieben. Grimaldi beobachtete Lichtstreifen innerhalb des Schattens eines Stabes, welcher von einer kleinen Lichtquelle angestrahlt wurde. Robert Hooke (1635–1703), Kurator für Experimente bei der Royal Society, bemerkte später ebenfalls Beugungseffekte. Hooke untersuchte als Erster die farbigen Interferenzmuster, die durch dünne Schichten erzeugt werden (Micrographia, 1665). Er schlug vor, Licht als schnelle, sich mit großer Geschwindigkeit fortbewegende Schwingung des Mediums aufzufassen. Seine These, dass „jeder Stoß oder jede Schwingung des Leuchtkörpers eine Sphäre“ erzeuge, bildet den Beginn der Wellentheorie des Lichts. Im Todesjahr von Galilei wurde Isaac Newton geboren. Newtons Credo war, sich stets auf direkte Beobachtungen zu stützen und

Sir Isaac Newton (1642–1727). (Georgios Kollidas/Fotolia)

6

1 Ein kurzer Ausflug in die Geschichte

spekulative Hypothesen zu vermeiden. Den unterschiedlichen Auffassungen von der Natur des Lichts stand er daher lange Zeit unentschieden gegenüber: War Licht, wie manche behaupteten, korpuskular – also ein Strom von Teilchen? Oder war es eine Welle in einem alles durchdringenden Medium, dem Äther? Im Alter von 23 Jahren begann Newton mit seinen heute berühmten Dispersionsversuchen. Ich besorgte mir ein dreieckiges Glasprisma, um damit die berühmten Farbphänomene zu untersuchen. Newton schloss, dass weißes Licht als Mischung einer ganzen Reihe voneinander unabhängiger Farben zu betrachten sei. Er behauptete, die verschieden gefärbten Lichtpartikel regten den Äther zu charakteristischen Schwingungen an. Seine Theorie bediente demnach sowohl die Wellen- als auch die Teilchenhypothese, allerdings neigte er mit zunehmendem Alter der Letzteren mehr zu. Die Wellentheorie in ihrer damaligen Form lehnte er im Wesentlichen deshalb ab, weil sich die geradlinige Fortpflanzung des Lichts in seinen Augen nicht mithilfe von Wellen erklären ließ, die sich in alle Richtungen ausbreiten. Nach mehreren unzulänglichen Experimenten gab Newton den Versuch auf, Farbfehler von Linsenfernrohren zu beseitigen. Seine falsche Schlussfolgerung, dass dieses Problem generell nicht zu lösen sei, führte ihn zur Konstruktion von Spiegelfernrohren. Das erste derartige Instrument stellte er 1668 fertig. Es war nur rund 15 Zentimeter lang, und sein Durchmesser betrug nur rund vier Zentimeter, aber es lieferte bereits eine mehr als dreißigfache Vergrößerung. Zur selben Zeit, als Newton in England die Teilchenhypothese vertrat, erweiterte Christiaan Huygens (1629–1695) auf dem Kontinent die Wellentheorie in beträchtlichem Maße. Im Gegensatz zu Descartes, Hooke und Newton folgerte Huygens richtig, dass sich Licht beim Eintritt in dichtere Medien verlangsamt. Mithilfe seiner Wellentheorie konnte er das Reflexions- und das Brechungsgesetz herleiten und sogar die

Christiaan Huygens (1629–1695). (Porträt von Christiaan Huygens (ca. 1680), Abraham Bloteling. Stich. Rijksmuseum [Objektnummer RP-P-1896-A-19320])

1.3 Vom siebzehnten Jahrhundert an

7

Doppelbrechung am Calcitkristall (Kalkspat) erklären. Im Zuge seiner Untersuchungen am Kalkspat entdeckte er auch die Polarisation. Da es zwei verschiedene Arten der Brechung gibt, nehme ich an, dass auch zwei verschiedene Arten von Lichtwellen existieren... Licht war also entweder als Teilchenstrom oder als rasche Wellenbewegung ätherischer Materie zu verstehen. Einigkeit bestand über seine extrem hohe Fortpflanzungsgeschwindigkeit. In der Tat glaubten viele, Licht bewege sich unendlich schnell – eine Vorstellung, die mindestens bis auf Aristoteles zurückgeht. Dass die Lichtgeschwindigkeit endlich ist, fand der Däne Ole Christensen Rømer (1644–1710) heraus. Die Umlaufbahn von Io, dem nächsten Mond des Jupiter, liegt nahezu in der Ebene der Umlaufbahn des Planeten selbst um die Sonne. Rømer untersuchte sorgfältig die Finsternisse von Io während der Wanderung des Mondes durch den Schatten hinter Jupiter. 1676 sagte er voraus, dass Io am 9. November mehr als 10 Minuten später aus dem Schatten treten werde, als man es auf der Grundlage seiner jährlich gemittelten Bewegung erwartete. Io verhielt sich exakt Rømers Zeitplan entsprechend – ein Phänomen, das der Forscher korrekt mit der endlichen Geschwindigkeit des Lichts erklärte. Rømer konnte berechnen, dass das Licht ungefähr 22 Minuten brauchte, um die Sonnenumlaufbahn der Erde zu durchlaufen (rund 300 Millionen Kilometer). Die Arbeiten überzeugten unter anderem Huygens und Newton, die unabhängig voneinander den Durchmesser der genannten Umlaufbahn berechneten und so zu einer Lichtgeschwindigkeit von c = 2,3 × 108 bzw. 2,4 × 108 m/s gelangten.1 Das Gewicht Newtons drohte die Anhänger der Wellentheorie im achtzehnten Jahrhundert fast zu erdrücken. Trotzdem bekannte sich der prominente Mathematiker Leonhard Euler (1707–1783), wenn auch unbeachtet, zu dieser Hypothese. Euler meinte, die von Linsen erzeugten unerwünschten Farbeffekte träten im Auge deshalb nicht auf, weil die unterschiedlichen vorhandenen Medien die Dispersion unterdrücken (was eine irrige Annahme ist). Er schlug vor, diesen Effekt zur Konstruktion achromatischer Linsen auszunutzen. Samuel Klingenstjerna (1698–1765), Professor in Uppsala, vollzog Newtons Experimente zum Achromatismus nach und stellte fest, dass sie fehlerhaft waren. Klingenstjerna stand mit dem Londoner Optiker John Dollond (1706–1761) im Kontakt, der zu ähnlichen Ergebnissen gelangte. Dollond setzte 1758 schließlich ein Element aus Kronglas und ein zweites aus Flintglas zu einer achromatischen Linse zusammen – eine Erfindung, die nebenbei bemerkt von dem Amateurforscher Chester Moor Hall (1703–1771) aus Essex bereits vorweggenommen worden war. 1

A. Wróblewski, Am. J. Phys. 53 (7), Juli 1985, S. 620.

1 Ein kurzer Ausflug in die Geschichte

8

1.4

Das neunzehnte Jahrhundert

Dr. Thomas Young (1773–1829), einer der wahrhaft großen Geister seiner Zeit, erweckte die Wellentheorie des Lichts zu neuem Leben. 1801, 1802 und 1803 vertrat er diese Hypothese vor der Royal Society und erweiterte sie um ein neues grundlegendes Konzept, das so genannte Interferenzprinzip: Wenn zwei Wellenbewegungen verschiedenen Ursprungs dieselbe oder fast dieselbe Richtung aufweisen, so ergibt sich die gemeinsame Wirkung als Summe der Bewegungen jeder einzelnen Welle. Young konnte die Farbstreifen dünner Schichten erklären und die Wellenlängen verschiedener Farben aus Newtons Messwerten berechnen. Obwohl er mehrfach darauf hinwies, dass Newtons Erkenntnisse die eigentliche Grundlage seiner Arbeit bildeten, wurde Young heftig angegriffen. Eine wahrscheinlich von Lord Brougham verfasste Artikelreihe im Edinburgh Review sprach Youngs Schriften jeglichen Wert ab.

Thomas Young (1773–1829). (Smithsonian Institution)

Eine überzeugende Wiederbelebung der Wellentheorie verdanken wir Augustin Jean Fresnel (1788–1827) aus Broglie in der Normandie, der von den rund 13 Jahre zurückliegenden Bemühungen Youngs keine Kenntnis hatte. Fresnel vereinigte die Ideen von Huygens mit dem Interferenzprinzip. Er beschrieb die Fortpflanzung einer Primärwelle als Folge der Überlagerung und Interferenz sekundärer Kugelwellen, wodurch sich die Primärwelle jeden Augenblick neu bildet. In Fresnels Worten: Die Schwingungen einer Lichtwelle in allen ihren Punkten sind als Summe der Elementarbewegungen aufzufassen, die in demselben Moment durch die Wirkung aller einzelnen Teile der ungehinderten Welle in den jeweils vorhergehenden Positionen zu ihr übertragen werden.

1.4 Das neunzehnte Jahrhundert

9

Augustin Jean Fresnel (1788–1827). (US National Library of Medicine)

Man stellte sich die Lichtwellen, analog zu den Schallwellen in der Luft, longitudinal vor. Fresnel konnte die Beugungsmuster an verschiedenen Hindernissen und Öffnungen berechnen und die geradlinige Ausbreitung von Licht in homogenen, isotropen Medien zufriedenstellend erklären. Damit entkräftete er Newtons wichtigsten Einwand gegen die Wellentheorie. Als Fresnel schließlich erfuhr, dass Young das Interferenzprinzip vor ihm gefunden hatte, war er zwar etwas enttäuscht, schrieb dem Kollegen aber trotzdem, dass ihn dessen gute Gesellschaft tröste. Die beiden großen Männer wurden zu Verbündeten. Huygens kannte, wie auch Newton, das Phänomen der Polarisation in Kalkspatkristallen. Letzterer schrieb in seinem Werk Opticks: Jeder Lichtstrahl hat daher zwei entgegengesetzte Seiten... Erst 1808 entdeckte Étienne Louis Malus (1775–1812), dass diese „Zweiseitigkeit“ des Lichts nicht durch eine besondere Eigenschaft kristalliner Medien hervorgerufen wird, sondern auch bei der Reflexion in Erscheinung tritt. Fresnel und Dominique François Arago (1786–1853) wollten mit einer Versuchsreihe den Einfluss der Polarisation auf die Interferenz aufklären, scheiterten aber an ihrem longitudinalen Wellenbild – ein herber Rückschlag für die Wellentheorie. Über etliche Jahre hinweg kämpften Young, Arago und Fresnel mit diesem Problem, bis Young schließlich auf die Idee kam, die Schwingungen des Äthers als transversal, wie die Welle auf einer Saite, anzusehen. Die Zweiseitigkeit des Lichts ließ sich dann einfach als Ausdruck zweier zueinander orthogonaler, zur Ausbreitungsrichtung des Strahls transversaler Schwingungen des Äthers erklären. Fresnel entwickelte diesen Ansatz zu einer mechanistischen Beschreibung der Ätherschwingungen weiter, die ihn zu den heute bekannten Formeln für die Amplituden des reflektierten und des transmittierten Licht-

10

1 Ein kurzer Ausflug in die Geschichte

strahls führte. 1825 waren der Teilchentheorie des Lichts nur noch wenige beharrliche Anhänger geblieben. Die erste erdgebundene Bestimmung der Lichtgeschwindigkeit wurde 1849 von Armand Hippolyte Fizeau (1819–1896) vorgenommen. Fizeau stellte seine Vorrichtung, bestehend aus einem rotierenden Zahnrad und einem 8633 m davon entfernten Spiegel, im Vorstadtgebiet von Paris (zwischen Suresnes und Montmartre) auf. Ein Lichtpuls, der durch eine Öffnung des Zahnkranzes gelangte, wurde von dem Spiegel zurückgeworfen. Durch Abstimmung der Drehgeschwindigkeit des Rades erreicht Fizeau, dass der zurückkehrende Puls entweder durch eine Lücke des Zahnrades sichtbar war oder durch einen Zahn verdeckt wurde. Aus den Ergebnissen berechnete Fizeau die Lichtgeschwindigkeit zu 315 300 km/s. Ein Mitarbeiter bei der Berechnung der Lichtgeschwindigkeit war Fizeaus Kollege Jean Bernard Léon Foucault (1819–1868). 1834 hatte Charles Wheatstone (1802–1875) eine Anordnung mit rotierendem Spiegel konstruiert, um die Dauer eines elektrischen Funkens zu messen. Arago schlug vor, damit auch die Lichtgeschwindigkeit in dichten Medien zu bestimmen; er konnte das Experiment jedoch nie ausführen. Foucault setzte diese Arbeiten fort, die ihm später auch das Material zu seiner Dissertation lieferten. Am 6. Mai 1850 berichtete er der Akademie der Wissenschaften, dass die Lichtgeschwindigkeit in Wasser geringer sei als in Luft. Dieses Ergebnis stand in direktem Widerspruch zur Newtonschen Formulierung der Teilchentheorie und war ein harter Brocken für deren wenige verbliebene Anhänger. Parallel zu diesen Entwicklungen auf dem Gebiet der Optik machte auch die Untersuchung von Elektrizität und Magnetismus Fortschritte. 1845 stellte Michael Faraday (1791–1867), der Meister der Experimentalphysik, eine Verbindung zwischen Licht und Elektromagnetismus her. Er folgerte dies aus dem experimentellen Befund, dass sich die Polarisation eines Lichtstrahls durch ein an das Medium angelegtes starkes Magnetfeld ändern lässt. James Clerk Maxwell (1831–1879) fasste das empirische Wissen auf diesem Gebiet brillant zu einem einzigen Satz mathematischer Gleichungen zusammen und erweiterte es sogar. Ausgehend von dieser knappen, wunderbar symmetrischen Synthese konnte er auf rein theoretischem Weg zeigen, dass sich ein elektromagnetisches Feld als Transversalwelle im Äther fortpflanzen kann. Aus seinen Gleichungen leitete Maxwell einen Ausdruck für die Lichtgeschwindigkeit ab, in den die elektrischen und magnetischen Eigenschaften des Mediums √ eingehen: c = 1/ 0 μ0 . Durch Einsetzen der empirisch bestimmten Werte für diese Größen erhielt Maxwell einen Zahlenwert für die Lichtgeschwindigkeit, der dem gemessenen Wert entsprach! Die Schlussfolgerung war nun zwingend: Licht war als „elektromagnetische Störung in Form von Wellen“, die sich durch den Äther bewegen, aufzufassen. Im Alter von 48 Jahren starb Maxwell – acht Jahre zu früh, um die experimentelle Bestätigung seiner Ideen zu erleben, und viel zu früh für die Physik. Heinrich Rudolf Hertz (1857–1894) belegte die Existenz langer elektromagnetischer Wellen, indem er sie in einer ausführlichen Versuchsreihe erzeugte und nachwies. Seine Resultate veröffentlichte er 1888.

1.4 Das neunzehnte Jahrhundert

11

James Clerk Maxwell (1831–1879). (E. H.)

Die Akzeptanz der Wellentheorie schien zu diesem Zeitpunkt die Annahme der Existenz eines alles durchdringenden Mediums, des Lichtäthers, zu bedingen: Wo Wellen waren, musste selbstverständlich auch ein Trägermedium sein! So verwundert es nicht, dass große Anstrengungen unternommen wurden, die physikalische Natur dieses Äthers aufzuklären. Ein solcher Äther hätte jedoch einige recht seltsame Eigenschaften aufweisen müssen: Er hätte so dünn sein müssen, dass sich die Himmelskörper ungehindert darin bewegen können. Gleichzeitig hätte er die extrem hochfrequenten (rund 1015 Hz) Schwingungen des Lichts, das sich mit 300 000 km/s fortbewegt, tragen müssen. Dies wäre nur bei ungewöhnlich starken Rückstellkräften der Äthersubstanz denkbar gewesen. Die Fortpflanzungsgeschwindigkeit einer Welle in einem Medium hängt von den Eigenschaften des gestörten Substrats ab, nicht von der Bewegung des Wellenerregers. Grundlegend anders verhält sich ein Teilchenstrom, dessen entscheidender Parameter seine Geschwindigkeit in Bezug auf die Quelle ist. Bei der Untersuchung der Optik bewegter Körper stören manche Aspekte des Äthers. Davon ausgehend entwickelte sich in aller Stille ein eigener Forschungszweig, der schließlich zum nächsten großen Wendepunkt führte. James Bradley (1693–1792), damals Professor für Astronomie in Oxford, versuchte 1725, die Entfernung eines Sterns durch Beobachtung seiner Orientierung zu zwei verschiedenen Zeitpunkten im Jahr zu bestimmen. Die Position der Erde verändert sich beim Umlauf um die Sonne, wodurch eine lange Grundlinie für die Triangulation des Sterns entsteht. Bradley stellte zu seiner Überraschung fest, dass die „Fixsterne“ eine offensichtlich systematische Bewegung zeigten, die mit der Umlaufrichtung der Erde zusammenhängt und nicht, wie man angenommen hatte, mit deren Position im Raum. Man nennt diesen Effekt stellare Aberration; er ist analog zur bekannten Situation eines fallenden Regentropfens: Ein Tropfen, der bezüglich eines ruhenden Beobachters senkrecht zur Erde fällt, scheint den Einfallswinkel zu ändern, wenn der Beobachter sich bewegt. Das Teilchenmodell des Lichts liefert also eine natürliche Erklärung der stellaren Aberration. Auch die Wellentheorie kann das Phänomen zufriedenstellend erklären, allerdings unter der Annahme, dass der Äther keinerlei Störung erfährt, wenn die Erde ihn durchquert.

12

1 Ein kurzer Ausflug in die Geschichte

Illustrationen zur Optik. Aus Cyclopedia or An Universal Dictionary of Arts and Sciences, ed. Ephraim Chambers, erschienen bei James and John Knapton, London, 1728. (University of Wisconsin Digital Collections)

Nun wurde spekuliert, die Bewegung der Erde durch den Äther führe zu einem beobachtbaren Unterschied zwischen terrestrischen und extraterrestrischen Lichtquellen. Arago reagierte darauf mit einer Versuchsreihe, die keinerlei Hinweise auf Differenzen lieferte: Das Licht verhielt sich so, als ob die Erde bezüglich des Äthers ruhe. Um diesen Befund zu erklären, stellte Fresnel die Hypothese auf, das Licht werde bei der Durchquerung eines transparenten, sich bewegenden Mediums teilweise „mitgenommen“. Experimente von Fizeau, der Lichtstrahlen durch sich bewegende Wassersäulen laufen ließ, und von Sir George Biddell Airy (1801–1892), der die stellare Aberration 1871 mit einem wassergefüllten Fernrohr untersuchte, schienen Fresnels Hypothese zu stützen. Hendrik Antoon Lorentz (1853–1928) entwickelte unter der Annahme eines Äthers im absoluten Ruhezustand eine Theorie, die Fresnels Ideen einschloss. 1879 schlug Maxwell in einem Brief an D. P. Todd vom U.S. Nautical Almanac Office eine Anordnung zur Messung der Geschwindigkeit vor, mit der sich das Sonnensystem relativ zum Lichtäther bewegt. Diese Idee wurde von Albert Abraham Michelson (1852–1931), damals Dozent an der Marineakademie, aufgegriffen. Mit nur 26 Jahren

1.5 Das zwanzigste Jahrhundert

13

genoss Michelson bereits einen hervorragenden Ruf wegen seiner extrem präzisen Bestimmung der Lichtgeschwindigkeit. Einige Jahre später nahm er ein Experiment in Angriff, um den Effekt der Bewegung der Erde durch den Äther zu messen: Da die Lichtgeschwindigkeit im Äther konstant ist und die Erde sich relativ zum Äther bewegt (mit einer Bahngeschwindigkeit von 29,8 km/s), sollte die relativ zur Erde gemessene Lichtgeschwindigkeit von der Bewegung des Planeten beeinflusst sein. 1881 veröffentlichte Michelson seine Resultate. Es gab keine nachweisbare Bewegung der Erde relativ zum Äther – der Äther war stationär. Die Durchschlagskraft dieses überraschenden Ergebnisses wurde etwas geschmälert, als Lorentz auf einen Fehler in der Rechnung hinwies. Einige Jahre später tat sich Michelson, inzwischen Professor für Physik an der Case School of Applied Science in Cleveland (Ohio), mit dem bekannten Chemieprofessor Edward Williams Morley (1838–1923) vom Western Reserve zusammen, um die Experimente mit wesentlich größerer Genauigkeit zu wiederholen. Erstaunlicherweise waren ihre 1887 veröffentlichten Ergebnisse wiederum negativ: Alles in allem lässt sich mit ziemlicher Sicherheit folgern, dass die Relativbewegung zwischen Erde und Lichtäther, wenn es sie denn gibt, sehr langsam sein muss – langsam genug, um Fresnels Erklärung der Aberration zu widerlegen. Eine Erklärung der stellaren Aberration im Rahmen der Wellentheorie erfordert zwingend die Existenz einer Relativbewegung zwischen Erde und Äther, die durch das Michelson-Morley-Experiment jedoch ausgeschlossen werden konnte. Außerdem verlangen die Resultate von Fizeau und Airy die Annahme einer teilweisen Mitführung von Lichtteilchen durch die Bewegung des Mediums.

1.5

Das zwanzigste Jahrhundert

Jules Henri Poincaré begriff als Erster die Bedeutung der Tatsache, dass man experimentell keinerlei Effekte einer Bewegung relativ zum Äther fand. 1899 begann er, mit seinen Ansichten an die Öffentlichkeit zu treten, und 1900 sagte er: Unser Äther – gibt es ihn wirklich? Ich glaube nicht, dass genauere Beobachtungen jemals etwas anderes als relative Verschiebungen beweisen können. 1905 stellte Albert Einstein (1879–1955) seine spezielle Relativitätstheorie vor, in der er die Ätherhypothese ebenfalls, aber ganz unabhängig von Poincaré, ablehnte. Die Einführung eines „Lichtäthers“ wird sich insofern als überflüssig erweisen, als nach der zu entwickelnden Theorie [kein] „absolut ruhender Raum“ eingeführt [wird].

1 Ein kurzer Ausflug in die Geschichte

14

Albert Einstein (1879–1955). (Orren Jack Turner, Library of Congress Prints and Photographs Division [LC-USZ62-60242])

Weiter postulierte Einstein: Im leeren Raum breitet sich Licht stets mit einer bestimmten Geschwindigkeit c aus, die nicht vom Bewegungszustand des strahlenden Körpers abhängt. Die Experimente von Fizeau, Airy und Michelson/Morley ließen sich nun innerhalb der einsteinschen relativistischen Mechanik2 auf ganz natürliche Weise erklären. Die Physiker mussten sich lediglich von der Idee des Äthers verabschieden und zur Kenntnis nehmen, dass sich elektromagnetische Wellen im leeren Raum ausbreiten können – eine Alternative gab es nicht. Man stellte sich das Licht nun als eine sich selbst erhaltende Welle vor, wodurch sich der Schwerpunkt des Konzepts vom Äther zum Feld verlagerte. Die elektromagnetische Welle wurde zur eigenständigen Entität. Am 19. Oktober 1900 hielt Max Karl Ernst Ludwig Planck (1858–1947) vor der Deutschen Physikalischen Gesellschaft einen Vortrag, der den Beginn einer anderen bedeutenden Revolution des wissenschaftlichen Denkens einläutete – der Quantenmechanik, einer Theorie, die submikroskopische Phänomene erfasst. Aufbauend auf diesen Gedanken schlug Einstein 1905 eine neue Form der Teilchentheorie vor, die Licht als einen Strom von „Energiepartikeln“ auffasste. Jedem solchen Quantum an Strahlungsenergie oder Photon3 , wie man es später nannte, schrieb er eine Energie zu, die proportional zu seiner Frequenz ist: E = hν, wobei h die plancksche Konstante ist (Abb. 1.8). 2 3

Siehe z. B. Special Relativity von French, Kapitel 5. Der Begriff „Photon“ wurde von G. N. Lewis geprägt: Nature, 18. Dezember 1926.

1.5 Das zwanzigste Jahrhundert

15

Abb. 1.1: Eine überzeugende Illustration der Teilchennatur des Lichts liefert diese Bildserie, die mit einem positionsempfindlichen Fotovervielfacher aufgenommen wurde. Das Objekt ist ein Testbild aus hellen und dunklen Streifen; es wurden 8,5 × 103 Photonen pro Sekunde gezählt. Die Bilder sind nach der Belichtungszeit geordnet: (a) 8 ms, (b) 125 ms, (c) 1 s, (d) 10 s und (e) 100 s. Jeder Punkt steht für ein einzelnes empfangenes Photon. (Mit frdl. Erlaubnis der ITT Corporation, Electro-Optical Products Division, Tube and Sensor Laboratories, Fort Wayne, Indiana, USA.)

Bis zum Ende der 1920er-Jahre hatten Forscher wie Bohr, Born, Heisenberg, Schrödinger, de Broglie, Pauli, Dirac und andere die Quantenmechanik zu einer strukturierten, gut verifizierten Theorie erweitert. Nach und nach wurde klar, dass die Konzepte von Welle und Teilchen, die einander in der makroskopischen Welt so offensichtlich ausschließen, im submikroskopischen Bereich miteinander verschmelzen. Sich atomare Teilchen wie Neutronen und Elektronen als winzige lokalisierbare Materieklümpchen vorzustellen, reichte künftig nicht mehr aus. Tatsächlich zeigte sich, dass diese „Teilchen“ Interferenz- und Beugungsmuster erzeugen können, ganz genau so wie Licht. Photonen, Protonen, Elektronen, Neutronen und die ganze Schar der übrigen Elementarteilchen vereinigen daher Eigenschaften von Teilchen und Wellen. Doch herrschte zu diesem Zeitpunkt noch keinesfalls endgültige Klarheit: „Jeder Physiker meint, er wisse, was ein Photon ist“, schrieb Einstein. „Ich habe mein ganzes Leben damit zugebracht, dies herauszufinden, und weiß es doch immer noch nicht.“ Das Konzept der Relativität befreite das Licht vom Äther und zeigte die enge Beziehung zwischen Masse und Energie: E = mc2 . Zwei bisher fast als gegensätzlich angesehene Größen wurden austauschbar. Zudem etablierte die Quantenmechanik die

16

1 Ein kurzer Ausflug in die Geschichte

Vorstellung, dass einem Teilchen mit dem Impuls p eine Wellenlänge λ zugeordnet ist, wobei gilt p = h/λ. Das einfache Bild des subatomaren Materieklümpchens wurde unhaltbar und die Dichotomie von Welle und Teilchen wich einem Dualismus. Die Quantenmechanik beschreibt auch die Art und Weise, in der Licht von Atomen absorbiert und emittiert wird. Denken wir uns dazu ein Gas, das durch Erhitzen oder eine elektrische Entladung zum Leuchten gebracht wird. Das ausgesendete Licht hängt dann von der Struktur der Atome des Gases ab. Die Spektroskopie – der Zweig der Optik, der sich mit der Analyse von Spektren befasst – entwickelte sich aus den Arbeiten Newtons. William Hyde Wollaston (1766–1828) beobachtete 1802 als Erster dunkle Linien im Sonnenspektrum. Da die Öffnungen von Spektroskopen üblicherweise schlitzförmig sind, sah man schmale farbige Lichtstreifen, so genannte Spektrallinien. Unabhängig von Wollaston beschäftigte sich Joseph Fraunhofer (1787–1826) mit der Spektroskopie, und nachdem er zufällig die Doppellinie des Natriums entdeckt hatte, untersuchte er ebenfalls das Sonnenspektrum. Er war der Erste, der Wellenlängen mithilfe von Beugungsgittern bestimmte. Gustav Robert Kirchhoff (1824–1887) und Robert Wilhelm Bunsen (1811–1899), die gemeinsam in Heidelberg arbeiteten, zeigten, dass jede Atomart eigene, charakteristische Spektrallinien aussendet. 1913 veröffentlichte Niels Henrik David Bohr (1885–1962) eine vorläufige quantentheoretische Beschreibung des Wasserstoffatoms, mithilfe derer sich auch die Wellenlängen des Emissionsspektrums vorhersagen ließen. Das Licht wird, wie man nun wusste, von den äußeren Elektronen des Atoms emittiert – wie dieser Prozess abläuft, erklärt die Quantentheorie bis ins kleinste Detail mit unglaublicher Genauigkeit und Eleganz. In der zweiten Hälfte des zwanzigsten Jahrhunderts brach auch eine neue Blütezeit der angewandten Optik als eigenständiges Gebiet an. Seit den 1950er-Jahren ließen Forscher mathematische Methoden und Erkenntnisse der Kommunikationstheorie in die Optik einfließen. Ebenso wie der Begriff des Impulses der Mechanik eine andere Dimension verleiht, eröffnet das Konzept der Raumfrequenz einen neuen Weg zum Verständnis einer Vielzahl optischer Phänomene. Die Auswirkungen dieser modernen, durch das mathematische Formelgebäude der Fourier-Analyse strukturierten Sichtweise der Optik waren weit reichend. Hervorzuheben sind dabei die Theorien der Bilderzeugung und Bildverarbeitung, die Übertragungsfunktionen und die Idee der räumlichen Filterung. Mit dem Aufkommen digitaler Hochgeschwindigkeitsrechner verbesserten sich die Voraussetzungen zur Konstruktion komplexer optischer Systeme ganz erheblich. Asphärische Linsen bekamen eine neue praktische Bedeutung, und das beugungsbegrenzte Linsensystem mit einem bemerkenswert großen Bildfeld wurde in die Praxis umgesetzt. Um den extrem hohen Präzisionsanforderungen bei der Herstellung optischer Bauelemente gerecht zu werden, wurde die Technik des Polierens durch Ionenbeschuss eingeführt, mit der einzelne Atome von Oberflächen abgespalten werden können. Ein- und Mehrfachdünnschichtbeläge (etwa von Spiegeln und

1.5 Das zwanzigste Jahrhundert

17

reflexmindernden Oberflächen) wurden verbreitet eingesetzt, die Faseroptik entwickelte sich zum praktischen Kommunikationshilfsmittel, Dünnschicht-Lichtleiter wurden erforscht. Der infrarote Spektralbereich fand Anwendungen beispielsweise in Überwachungssystemen und Raketensteuerungen; dies wiederum bewirkte eine verstärkte Entwicklung von IR-Materialien. Zunehmend wurden auch Kunststoffe eingesetzt (für Linsen, asphärische Linsen, Fasern, kopierte Gitter usw.). Eine neue Klasse teilweise vitrifizierter Glaskeramiken mit äußerst geringem Ausdehnungskoeffizienten wurde entwickelt. Seit Ende der 1960er-Jahre widmete man sich verstärkt dem Bau von sowohl erdgebundenen als auch im Weltraum stationierten Observatorien, die das gesamte Spektrum erfassen. Diese Projekte werden im 21. Jahrhundert weiter energisch vorangetrieben. In den 1960er-Jahren schlug die Geburtsstunde des Lasers. Innerhalb des folgenden Jahrzehnts baute man Laser, die den Spektralbereich vom Ultravioletten bis zum Infraroten abdecken. Damit standen starke Quellen kohärenten Lichts zur Verfügung, mit deren Hilfe man einer ganzen Reihe optischer Effekte auf die Spur kam, so der Erzeugung von Oberschwingungen (Harmonischen) und der Frequenzmischung. Die Entwicklung neuer Geräte, die diese Effekte ausnutzen, folgte unmittelbar. Schnell entwickelte sich auch die Technologie zur Herstellung eines brauchbaren optischen Kommunikationssystems. Wichtige Forschungsfelder der modernen Kristalloptik waren und sind beispielsweise elektrooptische und akustooptische Modulatoren sowie die Erzeugung zweiter Harmonischer. Eine als Holographie bekannt gewordene Technik zur Wellenfrontrekonstruktion liefert nicht nur wundervolle dreidimensionale Bilder, sondern fand auch eine Reihe weiterer Einsatzgebiete (u. a. zerstörungsfreie Werkstoffprüfverfahren und Methoden zur Datenspeicherung). Die seit den 1960er-Jahren zu verzeichnende militärische Ausrichtung eines großen Teils der Entwicklungsarbeit auf dem Gebiet der Optik wurde nach der Jahrtausendwende mit noch größerem Nachdruck verfolgt. Das Spektrum reicht dabei von „intelligenten Bomben“, Spionagesatelliten und Infrarot-Nachtsichtgeräte bis hin zu „Todesstrahlen“. Durch ökonomische Erwägungen und die Forderung der Verbraucher nach einer Erhöhung der Lebensqualität gelangen optische Produkte jedoch zunehmend auf den „zivilen“ Markt. Lasern beispielsweise begegnen wir heute im täglichen Leben in vielfältiger Weise: Sie tasten die CD in der heimischen Musikanlage ab, lesen Strichcodes an der Kasse des Supermarkts, schneiden Stahl und sind bei Operationen in Krankenhäusern behilflich. Optische Displays blinken an Millionen von Uhren, Taschenrechnern und Computern auf der ganzen Welt. Wurden Informationen im vergangenen Jahrhundert fast ausschließlich mithilfe elektrischer Signale übertragen, setzen sich gegenwärtig mehr und mehr die effizienteren optischen Verfahren durch. In aller Stille vollzieht sich eine Revolution der Methoden der Informationsverarbeitung und -übermittlung, die unser Leben auch in den kommenden Jahren stark beeinflussen wird.

18

1 Ein kurzer Ausflug in die Geschichte

Wichtige Erkenntnisse brauchen ihre Zeit. Wie vergleichsweise mager ist das Erbe, das uns die vergangenen drei Jahrtausende Forschung auf dem Gebiet der Optik hinterlassen haben, doch die Geschwindigkeit, mit der die Wissenschaft neue Ergebnisse liefert, nimmt laufend zu. Und ist es nicht hochinteressant zu beobachten, wie sich die Antwort auf die ewig gleiche Frage im Laufe der Zeit langsam ändert: Was ist Licht?4

4

Weitere Informationen zur Geschichte der Optik finden sich beispielsweise in A History of Physics von F. Cajori, The Nature of Light von V. Ronchi und Auge und Licht im Mittelalter von D. C. Lindberg. Auszüge aus verschiedenen Originalarbeiten sind in A Source Book of Physics von W. F. Magie und Great Experiments in Physics von M. H. Shamos zu finden.

2

Die Wellenbewegung

Was ist Licht? Diese für die Optik als Wissenschaft zentrale Frage wird uns im Verlauf dieses Buches immer wieder beschäftigen. Ist Licht ein Wellen- oder ein Teilchenphänomen? Diese Frage schlüssig zu beantworten ist bei weitem komplizierter, als es zunächst scheinen mag. Das wesentliche Merkmal eines Teilchens ist seine Lokalisierbarkeit: Es existiert in einem definierten, eng begrenzten Gebiet des Raumes. Wenn wir versuchen, uns ein solches Teilchen vorzustellen, denken wir gewöhnlich an einen uns vertrauten makroskopischen Gegenstand – etwa einen Ball oder einen Kieselstein –, den wir im Geiste immer weiter schrumpfen lassen, bis er winzig klein wird. Aber ein Ball tritt mit seiner Umgebung in Wechselwirkung; sein Gravitationsfeld wird von jenem der Erde, der Sonne, des Mondes usw. beeinflusst und umgekehrt. Dieses Feld, das sich im Raum ausbreitet – was auch immer es genau ist –, lässt sich von dem Ball nicht trennen; es ist ein fester Bestandteil des Balls ebenso wie jedes beliebigen anderen Teilchens. Reale Teilchen wechselwirken über Felder. In gewisser Hinsicht ist das Feld das Teilchen, und das Teilchen ist das Feld. Dieser auf den ersten Blick etwas merkwürdig anmutende Zusammenhang ist Gegenstand der Quantenfeldtheorie, über die wir noch sprechen werden. Im Augenblick soll uns folgende Feststellung ausreichen: Falls Licht als Strom submikroskopischer Teilchen (Photonen) beschrieben werden kann, handelt es sich bei diesen keinesfalls um gewöhnliche klassische Teilchen etwa in Form winziger Kugeln. Das wesentliche Merkmal einer Welle dagegen ist, dass sie sich nicht lokalisieren lässt: Eine klassische fortschreitende Welle entspricht einer sich selbst erhaltenden Störung des Trägermediums, die sich durch den Raum bewegt und dabei Energie und Impuls transportiert. Man neigt dazu, sich eine ideale Welle als eine kontinuierliche Einheit vorzustellen, die sich über den Raum erstreckt. Sieht man sich reale Wellen dagegen genauer an (beispielsweise Wellen auf eine Saite), so stellt man fest, dass es sich in Wirklichkeit um ein zusammengesetztes Phänomen handelt, das von einer großen Zahl sich koordiniert bewegender Teilchen gebildet wird. Die Trägermedien dieser Wellen sind atomar (sie bestehen also aus Teilchen), sodass man das Phänomen nicht als etwas Kontinuierliches ansehen kann. Als einzige mögliche Ausnahme wäre die klassische elektromagnetische Welle zu nennen, die konzeptionell als kontinuierliche Einheit aufgefasst wird und in unserem Zusammenhang als Inbegriff der Welle im Gegensatz zum Teilchen gilt. Doch weiß man seit dem zwanzigsten Jahrhundert, dass die Energie einer elektromagnetischen Welle keineswegs kontinuierlich

https://doi.org/10.1515/9783111025599-002

2 Die Wellenbewegung

20

verteilt ist. Die klassische Formulierung der elektromagnetischen Theorie des Lichts, so schön sie auf makroskopischem Niveau auch sein mag, ist auf mikroskopischem Niveau zutiefst problematisch. Einstein schlug als Erster vor, die makroskopische elektromagnetische Welle als statistische Manifestation eines grundlegenden teilchenartigen mikroskopischen Phänomens aufzufassen. Im subatomaren Bereich bricht die klassische Vorstellung von einer physikalischen Welle zusammen. Doch für die Längenskalen, mit denen wir es normalerweise praktisch zu tun haben, führt die Anwendung der klassischen Theorie zu hervorragenden Ergebnissen. Sowohl die klassische als auch die quantenmechanische Behandlung des Lichts stützt sich auf eine mathematische Beschreibung der Wellenbewegung. Daher besprechen wir im folgenden Kapitel die Grundlagen beider Formalismen. Die angegebenen Konzepte lassen sich auf alle Arten physikalischer Wellen anwenden – von kleinen Oberflächenwellen in einer Tasse Tee bis zu Lichtpulsen, die von einer weit entfernen Galaxie zur Erde gelangen.

2.1

Eindimensionale Wellen

Ein grundlegendes Merkmal einer fortschreitenden Welle ist, dass es sich um eine sich selbst erhaltende Störung des Trägermediums handelt. Am vertrautesten für uns und am besten zu veranschaulichen sind mechanische Wellen (Abb. 2.1). Zu diesen gehören Seilwellen und Wellen an der Oberfläche von Flüssigkeiten, Schallwellen in der Luft und Druckwellen in Festkörpern und fluiden Medien. Schallwellen sind longitudinal – die Verschiebung des Mediums hat dieselbe Richtung wie die Bewegung der Welle. Seilwellen (und elektromagnetische Wellen) dagegen sind transversal – das Medium wird in einer Richtung ausgelenkt, die senkrecht zur Ausbreitungsrichtung

(a)

Abb. 2.1: Longitudinale (a) und transversale (b) Welle in einer Feder.

(b)

2.1 Eindimensionale Wellen

21

v

Abb. 2.2: Seilwelle.

der Welle ist. In allen Fällen wandert zwar die energietragende Störung durch das Material, die einzelnen beteiligten Atome entfernen sich jedoch nur minimal aus ihren Gleichgewichtspositionen: Die Störung pflanzt sich fort, das Trägermedium bleibt unbeweglich. Dies ist eine der Schlüsseleigenschaften, die eine Welle von einem Teilchenstrom unterscheiden. Der Wind, der über ein Kornfeld bläst, erzeugt scheinbar vorüberziehende Wellen, obwohl jede einzelne Ähre lediglich schwankt. Leonardo da Vinci war anscheinend der Erste, der erkannte, dass eine Welle ihr Trägermedium nicht fortbewegt, und genau dies ist die Eigenschaft, die es Wellen erlaubt, sich mit sehr hohen Geschwindigkeiten auszubreiten. Wir wollen nun herausfinden, welche Form die Wellengleichung haben muss. Dazu betrachten wir eine Störung ψ, die sich in positiver x-Richtung mit der konstanten Geschwindigkeit v bewegt. Die genaue Art der Störung ist momentan unwichtig. Es könnte sich ebenso um die vertikale Auslenkung eines Seils (Abb. 2.2) handeln wie um die Auslenkung der elektrischen oder magnetischen Feldstärke einer elektromagnetischen Welle (oder sogar der quantenmechanischen Wahrscheinlichkeitsamplitude einer Materiewelle). Da sich die Störung bewegt, muss sie sowohl vom Ort als auch von der Zeit abhängen: ψ(x, t) = f (x, t)

(2.1)

mit f (x, t) als einer speziellen Funktion oder Wellenform. Dargestellt ist dies in Abbildung 2.3 a: Hier bewegt sich ein Wellenpuls mit der Geschwindigkeit v im stationären Koordinatensystem S. Die Form der Störung zu einem beliebigen Zeitpunkt, beispielsweise bei t = 0, findet man, indem man die Zeit auf diesen konstanten Wert setzt. Durch ψ (x, t)t=0 = f (x, 0) = f (x)

(2.2)

ist dann die Form oder das Profil der Welle zu diesem Zeitpunkt gegeben. Für 2 f (x) = e−ax mit einer Konstante a findet man beispielsweise ein glockenförmiges

2 Die Wellenbewegung

22 (a)

S ψ = f (x, t) v x

0 S

(b)

ψ = f (x )

x

0 (c)

S

S

ψ = f (x − vt)

0

0

x x x

vt x

Abb. 2.3: Bewegtes Bezugssystem.

Profil, das einer Gaußfunktion entspricht. (Die Funktion ist symmetrisch bezüglich der Achse mit x = 0, weil x quadratisch eingeht.) Setzt man t = 0, so fertigt man sozusagen eine „Momentaufnahme“ des vorbeilaufenden Pulses an. Wir beschränken uns vorerst auf Wellen, die ihre Form bei der Fortpflanzung durch den Raum nicht ändern. Nach einer Zeit t hat sich der Puls um die Strecke vt in Richtung der x-Achse bewegt, ist ansonsten aber unverändert geblieben. Wir führen nun ein Koordinatensystem S  ein, das sich gemeinsam mit dem Puls mit der Geschwindigkeit v bewegt (Abb. 2.3 b). In diesem System hängt ψ nicht mehr von der Zeit ab; wenn wir uns mit S  bewegen, sehen wir ein unbewegliches, konstantes Profil, das durch Gleichung (2.2) gegeben ist. Die Koordinate ist hier nicht x, sondern x , sodass gilt   (2.3) ψ = f x . Die Störung sieht in S  zu jedem Zeitpunkt t genauso aus wie zum Zeitpunkt t = 0 (als S und S  denselben Ursprung hatten) in S (Abb. 2.3 c). Wir schreiben nun Gleichung (2.3) als Funktion von x, um die Welle in der Form zu erhalten, die ein in S ruhender Beobachter sehen würde. Aus Abbildung 2.3 c folgt x = x − vt

(2.4)

und Einsetzen in Gleichung (2.3) liefert ψ(x, t) = f (x − vt) ,

(2.5)

die allgemeinste Form der eindimensionalen Wellenfunktion. Um eine spezielle Form zu erhalten, müssen wir nun lediglich ein bestimmtes Profil (Gl. 2.2) wählen und

2.1 Eindimensionale Wellen

23

0

2

4

6

3.0

3.0

2.5

2.5

2.0

2.0

1.5

1.5

1.0

1.0

0.5

0.5

0

2

4

(a)

6

m/s

0

(b)

2

s

4

s

6

s

  Abb. 2.4: (a) Profil eines Pulses, gegeben durch die Funktion f (x) = 3/ 10x2 + 1 . (b) Das in (a)  gezeigte Profil bewegt sich nun als Welle in positiver x-Richtung (nach rechts): ψ (x, t) =  3/ 10 (x − vt)2 + 1 . Die Geschwindigkeit der Welle beträgt 1 m/s.

(x − vt) für x in f (x) einsetzen. Der Ausdruck beschreibt dann eine Welle mit dem gewünschten Profil, die sich mit der Geschwindigkeit v in positiver x-Richtung 2 bewegt. So entspricht beispielsweise ψ (x, t) = e−a(x−vt) einer glockenförmigen Welle. Um diesen Sachverhalt genauer zu veranschaulichen, wählen wir einen bestimmten   Puls aus – sagen wir, ψ (x) = 3/ 10x2 + 1 = f (x). Das zugehörige Profil ist in Abbildung 2.4 a zu sehen, und wenn wir annehmen, dass es sich dabei um eine Seilwelle handelt, entspräche ψ der vertikalen Auslenkung, wofür wir auch y schreiben könnten. Damit ist das Profil der Störung festgelegt, gleichgültig, ob es sich dabei um eine örtliche Verschiebung, einen Druck oder ein elektrisches Feld handelt. Um von f (x) zu ψ (x, t) zu gelangen, also die Beschreibung einer Welle zu erhalten, die sich mit der Geschwindigkeit v in positiver x-Richtung fortpflanzt, müssen wir x in f (x) durch (x − vt) ersetzen. Diese Substitution führt auf ψ (x, t) = 3/[10 (x − vt)2 + 1]. Legen wir v nun willkürlich auf beispielsweise 1 m/s fest und zeichnen wir die Funktionswerte bei t = 0, t = 1 s, t = 2 s und t = 3 s, so gelangen wir zu Abbildung 2.4 b, die wie erwartet zeigt, dass sich der Puls mit 1 m/s nach rechts fortpflanzt. Hätten wir dagegen für x in der Profilfunktion (x + vt) eingesetzt, würden wir feststellen, dass sich der Puls nach links bewegt. Betrachten wir das Profil der Welle ψ (in Gl. 2.5) nach Ablauf einer Zeit Δt, was einer Änderung von x um vΔt entspricht, so finden wir f [(x + vΔt) − v (t + Δt)] = f (x − vt) . Das Profil hat sich nicht verändert.

2 Die Wellenbewegung

24

Analog wird Gleichung (2.5), wenn sich die Welle in negativer x-Richtung fortpflanzt, zu ψ = f (x + vt)

mit v > 0.

(2.6)

Daraus können wir Folgendes schließen: Ungeachtet der Form der Störung müssen die Variablen x und t in der Funktion zu einer Einheit verbunden sein, d. h., sie müssen in Form einer einzigen Variablen (x ∓ vt) auftreten. Gleichung (2.5) schreibt man oft auch als Funktion von (t − x/v), weil   x − vt = F (t − x/v) (2.7) f (x − vt) = F − v gilt. Den Puls in Abbildung 2.2 und die durch Gleichung (2.5) beschriebene Störung bezeichnet man als eindimensional, weil die Wellen über Punkte streichen, die auf einer Linie liegen, weshalb nur eine Ortsvariable benötigt wird. Dass eine Seilwelle in einer zweiten Dimension sichtbar wird, sollte dabei nicht verwirren. Echte zweidimensionale Wellen breiten sich im Gegensatz dazu über eine Fläche aus (wie die Kräuselwellen auf einer Wasseroberfläche), und man benötigt zwei Ortsvariablen, um sie zu beschreiben.

2.1.1 Die Differentialgleichung einer Welle 1747 führte Jean Le Rond d’Alembert partielle Differentialgleichungen in die mathematische Behandlung physikalischer Zusammenhänge ein. Im gleichen Jahr veröffentlichte er eine Arbeit über die Bewegung schwingender Saiten, in der die so genannte Wellengleichung zum ersten Mal auftaucht. Durch diese lineare, homogene partielle Differentialgleichung werden üblicherweise physikalische Wellen in verlustfreien Medien definiert. Es gibt sehr viele verschiedene Arten von Wellen; jede wird durch ihre eigene Wellenfunktion ψ(x) beschrieben. Man kann diese Wellenfunktionen abhängig vom Druck oder von der Verschiebung formulieren oder sich auf elektromagnetische Felder beziehen – das ändert nichts an der Tatsache, dass bemerkenswerterweise alle diese Wellenfunktionen Lösungen derselben differentiellen Wellengleichung sind. Es handelt sich dabei um eine partielle Differentialgleichung, weil die Welle eine Funktion mehrerer voneinander unabhängiger Variabler (Ort und Zeit) ist. Linear ist eine Differentialgleichung, die aus einem oder mehreren Termen besteht, die ihrerseits jeweils ein Produkt aus einer Konstante und der Funktion ψ (x) oder einer von deren Ableitungen sind. Wichtig ist dabei, dass jeder Term nur in der ersten Potenz auftreten darf; auch Produkte aus ψ (x) und einer ihrer Ableitungen oder aus zwei Ableitungen sind nicht erlaubt. Als Ordnung einer Differentialgleichung bezeichnet man bekanntlich die Ordnung der höchsten enthaltenen Ableitung. Die Lösung einer Differentialgleichung der Ordnung N enthält N freie Konstanten.

2.1 Eindimensionale Wellen

25

ψ(x, t0 ) t = t0 Zeit konstant ψ(x0 , vt0 ) x

x0

ψ(x0 , t) x = x0 Ort konstant ψ(x0 , vt0 ) vt0

vt

Abb. 2.5: ψ in Abhängigkeit von x (oben) und von t.

Wir wollen nun die eindimensionale Form der Wellengleichung herleiten. Dabei stützen wir uns auf die Erkenntnis (siehe Abb. 2.5), dass zur Festlegung der einfachsten, sich mit konstanter Geschwindigkeit fortbewegenden Welle zwei Konstanten (Amplitude und Frequenz oder Wellenlänge) erforderlich sind, was auf zweite Ableitungen hindeutet. Da die Gleichung zwei unabhängige Variable enthält (hier x und t), können wir ψ(x, t) entweder nach x oder nach t differenzieren. Dazu bilden wir einfach die Ableitung nach einer der beiden Variablen und behandeln die jeweils andere als Konstante. Es gelten die üblichen Regeln der Differentiation; um den Unterschied zur „normalen“ Ableitung deutlich zu machen, kennzeichnet man partielle Ableitungen mit einem runden ∂ (also ∂/∂x). Wir wollen nun die Orts- und die Zeitabhängigkeit von ψ(x, t) zueinander in Beziehung setzen. Dazu bilden wir die partielle Ableitung von ψ(x, t) = f (x ) nach x bei konstantem t. Wir verwenden x = x ∓ vt, und mit ∂f ∂ψ = ∂x ∂x erhalten wir ∂f ∂x ∂f ∂ψ = =  ∂x ∂x ∂x ∂x

(2.8)

wegen ∂(x ∓ vt) ∂x = = 1. ∂x ∂x Bei konstant gehaltenem x ergibt sich als partielle Ableitung nach der Zeit ∂f ∂x ∂f ∂f ∂ψ = = (∓v) = ∓v  .   ∂t ∂x ∂t ∂x ∂x

(2.9)

2 Die Wellenbewegung

26

Durch Zusammenfassen der Gleichungen (2.8) und (2.9) erhalten wir ∂ψ ∂ψ = ∓v . ∂t ∂x Die Änderungsraten von ψ mit t und x sind also bis auf einen konstanten Faktor gleich, wie in Abbildung 2.5 gezeigt ist. Die zweiten partiellen Ableitungen der Gleichungen (2.8) und (2.9) sind ∂2f ∂2ψ = ∂x2 ∂x2 und ∂ ∂2ψ = 2 ∂t ∂t



(2.10)

∂f ∓v  ∂x



∂ = ∓v  ∂x



∂f ∂t

 .

Wegen ∂f ∂ψ = ∂t ∂t und ∂ ∂2ψ = ∓v  ∂t2 ∂x



∂ψ ∂t



folgt unter Verwendung von Gleichung (2.9) 2 ∂2ψ 2∂ f = v . ∂t2 ∂x2 Diese Gleichungen verbinden wir mit Gleichung (2.10) zu

1 ∂2ψ ∂2ψ = , ∂x2 v 2 ∂t2

(2.11)

der gesuchten eindimensionalen Wellengleichung. Beispiel 2.1 Die in Abbildung 2.4 gezeigte Welle ist gegeben durch ψ(x, t) =

3 . [10(x − vt)2 + 1]

Zeigen Sie, dass es sich hierbei um eine Lösung der eindimensionalen Wellengleichung handelt.

2.1 Eindimensionale Wellen

27

Lösung 1 ∂2ψ ∂2ψ = 2 2 ∂x v ∂t2 Ableiten nach x ergibt:  ∂ 3 ∂ψ = ∂x ∂x 10(x − vt)2 + 1 ∂ψ = (−1) 3 [10(x − vt)2 + 1]−2 20(x − vt) ∂x ∂ψ = (−1) 60 [10(x − vt)2 + 1]−2 (x − vt) ∂x −60(−2)20(x − vt)(x − vt) 60 ∂2ψ = − 2 2 3 ∂x [10(x − vt) + 1] [10(x − vt)2 + 1]2 2400(x − vt)2 60 ∂2ψ = − 2 2 3 ∂x [10(x − vt) + 1] [10(x − vt)2 + 1]2 Ableiten nach t ergibt:  ∂ 3 ∂ψ = ∂t ∂t 10(x − vt)2 + 1 ∂ψ = (−1)3[10(x − vt) + 1]−2 20(−v)(x − vt) ∂t ∂ψ = 60v(x − vt)[10(x − vt)2 + 1]−2 ∂t 60v(x − vt)(−2)20(x − vt)(−v) −60v 2 ∂2ψ = + ∂t2 [10(x − vt)2 + 1]3 [10(x − vt)2 + 1]2 2400v 2 (x − vt)2 60v 2 ∂2ψ = − ∂t2 [10(x − vt)2 + 1]3 [10(x − vt)2 + 1]2 Damit haben wir gezeigt, dass 1 ∂2ψ ∂2ψ = . ∂x2 v 2 ∂t2

Beachten Sie, dass Gleichung (2.11) eine homogene Differentialgleichung ist – das bedeutet, in der Gleichung tritt kein Term auf, der ausschließlich unabhängige Variablen enthält (etwa eine „Kraft“ oder eine „Quelle“). Mit anderen Worten, ψ steht in jedem Term der Gleichung, und damit gilt: Ist ψ eine Lösung, so sind auch alle Vielfachen von ψ Lösungen der Differentialgleichung. Gleichung (2.11) ist die Wellengleichung für ungedämpfte Systeme, die im betrachteten Gebiet keine Quellen aufweisen. Die

2 Die Wellenbewegung

28

Effekte der Dämpfung erfasst man durch Addition eines Terms ∂ψ/∂t. So entsteht eine allgemeinere Wellengleichung; wir werden später darauf zurückkommen (S. 153). Kontinuierliche Systeme werden stets durch partielle Differentialgleichungen beschrieben. Die Kontinuität der zeitlichen Entwicklung unseres Prozesses kommt dadurch zum Ausdruck, dass die Zeit eine der unabhängigen Variablen ist. Allgemein behandeln Feldtheorien kontinuierliche Verteilungen von räumlich und zeitlich variierenden Größen, weshalb sie durch partielle Differentialgleichungen formuliert werden können. Die maxwellsche Formulierung des Elektromagnetismus – ebenfalls eine Feldtheorie – liefert eine Abwandlung von Gleichung (2.11), aus der sich das Konzept der elektromagnetischen Welle unmittelbar ergibt (Abschn. 3.2). Zu Beginn dieser Diskussion beschäftigten wir uns mit Wellen, die ihr Profil im Laufe der Fortpflanzung nicht ändern. Ein solches Verhalten ist zwar nicht die Regel; unsere Vereinfachung führte uns aber zu einer allgemeinen Formulierung der Wellengleichung. Ist eine Funktion, die eine Welle repräsentiert, Lösung dieser Gleichung, so handelt es sich stets um eine Funktion von (x ∓ vt) – insbesondere eine, die zweimal (nichttrivial) sowohl nach x als auch nach t abgeleitet werden kann. Beispiel 2.2



√ Gegeben ist die Funktion ψ(x, t) = exp −4ax2 − bt2 + 4 ab xt , wobei a und b Konstanten sind. Beschreibt diese Funktion eine Welle? Wenn ja, geben Sie die Geschwindigkeit und die Richtung ihrer Propagation an. Lösung Wir faktorisieren den Ausdruck in der Klammer:

ψ(x, t) = exp −4a(x − b/4a t)2 . Dies ist eine zweimal differenzierbare Funktion von (x − vt) und somit eine Lösung von Gleichung (2.11), d. h., sie beschreibt eine Welle. Für sie gilt v = 12 b/a, und sie propagiert in die positive x-Richtung.

2.2

Harmonische Wellen

Wir wollen nun die (in mathematischer Hinsicht) einfachste Welle untersuchen. Ihr Profil wird durch eine Sinus- oder Kosinusfunktion beschrieben, und man nennt sie Sinuswelle, einfache harmonische Welle oder schlicht harmonische Welle. In Kapitel 7 werden wir sehen, dass man jede beliebige Wellenform durch eine Superposition (Überlagerung) harmonischer Wellen erhalten kann. Daraus erklärt sich die besondere Bedeutung dieses Wellentyps.

2.2 Harmonische Wellen

29

0 0

Abb. 2.6: Eine harmonische Funktion als Profil einer harmonischen Welle. Eine Wellenlänge entspricht einer Änderung der Phase ϕ um 2π rad.

Als Profil wählen wir die einfache Funktion ψ (x, t) |t=0 = ψ (x) = A sin kx = f (x) ;

(2.12)

k ist eine positive Konstante, die Wellenzahl. Diese Konstante müssen wir einführen, da sich der Sinus von einer einheitenbehafteten physikalischen Größe nicht bilden lässt: Der Sinus ist definiert als Verhältnis zweier Längen und somit dimensionslos. Folgerichtig erhält kx die Einheit Radiant, also keine „echte“ physikalische Einheit. Der Sinus läuft von –1 bis +1; der Maximalwert von ψ (x) ist demnach A. Man nennt diese maximale Störung auch Amplitude der Welle (Abb. 2.6). Um Gleichung (2.12) zu einer fortschreitenden Welle umzuformen, die sich mit der Geschwindigkeit v in positiver x-Richtung bewegt, müssen wir lediglich x durch (x − vt) ersetzen, sodass sich ergibt ψ (x, t) = A sin k (x − vt) = f (x − vt) .

(2.13)

Dies ist offensichtlich eine Lösung der Wellengleichung (siehe Aufgabe 2.24). Hält man entweder x oder t konstant, so erhält man eine sinusförmige Störung. Die Welle ist sowohl räumlich als auch zeitlich periodisch. Dabei bezeichnet man die räumliche Periode als Wellenlänge λ: Die Wellenlänge ist gleich der Anzahl der Längeneinheiten je Welle. Die in der Praxis bequemste Maßeinheit von λ ist das Nanometer (1 nm = 10−9 m); man findet auch das Mikrometer oder Mikron (1 µm = 10−6 m) sowie, besonders in der älteren Literatur, das Ångström (1 Å = 10−10 m). Eine Zunahme oder Abnahme von x um λ sollte keine Änderung von ψ bewirken, das bedeutet ψ (x, t) = ψ (x ± λ, t) .

(2.14)

Im Falle einer harmonischen Welle entspricht dies einer Änderung des Arguments der Sinusfunktion um ±2π, sodass wir schreiben können sin k (x − vt) = sin k [(x ± λ) − vt] = sin [k (x − vt) ± 2π] und somit |kλ| = 2π

2 Die Wellenbewegung

30

oder, weil sowohl k als auch λ nur positive Werte annehmen kann, k = 2π/λ .

(2.15)

Abbildung 2.6 zeigt das durch Gleichung (2.12) gegebene Profil, aufgetragen als Funktion von λ. Dabei ist ϕ das Argument der Sinusfunktion, auch Phase genannt, oder anders formuliert ψ(x) = A sin ϕ. Beachten Sie, dass an allen Stellen mit sin ϕ = 0 (also bei ϕ = 0, π, 2π, 3π usw.) ψ (x) = 0 wird; dies ist der Fall für x = 0, λ/2, λ, 3λ/2 usw. In analoger Weise können wir nun auch die zeitliche Periode τ untersuchen. Sie entspricht der Zeit, die eine Welle benötigt, um vollständig an einem ruhenden Beobachter vorbeizulaufen. In diesem Fall interessiert uns das zeitlich periodische Verhalten der Welle: ψ (x, t) = ψ (x, t ± τ )

(2.16)

und sin k (x − vt) = sin k [x − v (t ± τ )] sin k (x − vt) = sin [k (x − vt) ± 2π] . Dies führt zu |kvτ | = 2π . Auch alle diese Größen können nur positive Werte annehmen, also kvτ = 2π

(2.17)

oder 2π vτ = 2π , λ woraus folgt τ = λ/v .

(2.18)

Die Periode τ ist gleich der Anzahl der Zeiteinheiten je Welle (Abb. 2.7); ihr Kehrwert ist die Frequenz ν, die Anzahl der Wellen je Zeiteinheit (in diesem Fall pro Sekunde). So haben wir ν ≡ 1/τ mit der Frequenz ν, angegeben in Wellen pro Sekunde (Hertz, Hz). Gleichung (2.18) wird damit zu v = νλ.

(2.19)

2.2 Harmonische Wellen

31

Stellen Sie sich vor, an Ihnen als ruhendem Beobachter zögen Wellen auf einem Seil vorbei. Die Anzahl der Schwingungen pro Sekunde entspräche dann ν, die Länge jeder Welle wäre λ. Die Gesamtlänge der Störung, die in einer Sekunde an Ihnen vorbeiliefe, wäre gleich νλ. Wäre beispielsweise jede Welle 2 m lang und erfolgten 5 Schwingungen pro Sekunde, so könnten Sie innerhalb von einer Sekunde 10 m Wellen vorbeiziehen sehen. Genau diese Fortpflanzungsgeschwindigkeit einer Welle (gemessen in m/s) meinen wir mit v. Anders ausgedrückt: Da eine Wellenlänge λ innerhalb einer Zeitspanne τ vorbeizieht, muss die Ausbreitungsgeschwindigkeit der Welle λ/τ = νλ sein. Nebenbei bemerkt wurde diese Beziehung von Newton im Kapitel „Wie man die Geschwindigkeit von Wellen berechnet“ in den Principia (1687) abgeleitet. Zur Charakterisierung von Wellenbewegungen werden in der Literatur oft noch zwei andere Größen verwendet. Dies ist zum einen die Winkelgeschwindigkeit ω ≡ 2π/τ = 2πν

(2.20)

0 (a)

(b)

(c)

(d)

(e)

(f)

(g)

(angegeben in rad/s) und zum anderen die für die Spektroskopie wichtige Raumfrequenz oder Wellenzahl κ ≡ 1/λ

(2.21)

(angegeben in m−1 oder cm−1 ). Mit anderen Worten ist κ die Anzahl der Wellen je Längeneinheit (Meter). Alle genannten Größen lassen sich auch auf Wellen anwenden, die nicht harmonisch sind, vorausgesetzt, sie bestehen aus einem einzigen sich wiederholenden Profilelement (Abb. 2.8).

(h)

(i)

Abb. 2.7: Eine harmonische Welle, die sich entlang der x-Achse bewegt. Betrachtet man die dargestellte Störung als Seilwelle, so ist zu beachten, dass sich jeder Punkt des Seils nur in vertikaler Richtung verschiebt. Die Bedeutung des rotierenden Pfeils wird in Abschn. 2.6 erläutert.

2 Die Wellenbewegung

32

(a)

λ

(b)

(c)

λ

λ

Abb. 2.8: (a) Die von einem Saxophon erzeugte Wellenform. Sie setzt sich aus Profilelementen (b) zusammen, durch deren Wiederholung die Welle entsteht (c). Die Länge des Abschnitts, nach dem sich die Welle wiederholt, ist die Wellenlänge λ.

Beispiel 2.3 Ein Nd:YAG-Laser emittiert im Vakuum einen Strahl von 1,06 µm Wellenlänge. Bestimmen Sie (a) die zeitliche Frequenz des Strahls, (b) die zeitliche Periode und (c) die Raumfrequenz. Lösung (a) Aus v = νλ erhalten wir ν=

2,99 × 108 m/s v = = 2,82 × 1014 Hz λ 1,06 × 10−6 m

oder ν = 282 THz. (b) Die zeitliche Periode ist τ = 1/ν = 1/2,82 × 1014 Hz = 3,55 × 10−15 s oder 3,55 fs. (c) Die Raumfrequenz ist κ = 1/λ = 1/1,06 × 10−6 m = 943 × 103 m−1 , also 943 000 Wellen pro Meter.

2.2 Harmonische Wellen

33

Mithilfe der oben gegebenen Definitionen kann man eine Reihe einander äquivalenter Ausdrücke für die sich fortpflanzende harmonische Welle aufschreiben: ψ = A sin k (x∓ vt)  t x ∓ ψ = A sin 2π λ τ ψ = A sin 2π (κx ∓ νt) ψ = A sin (kx ∓ ωt)   x ∓t ψ = A sin 2πν v

[2.13] (2.22) (2.23) (2.24) (2.25)

Am häufigsten werden die Gleichungen (2.13) und (2.24) verwendet. Beachten Sie, dass es sich in jedem Fall um idealisierte Wellen unendlicher Ausdehnung handelt. Das bedeutet, dass x für jeden Wert von t zwischen −∞ und +∞ variiert. Jeder solchen Welle ist eine einzelne, konstante Frequenz zuzuordnen; die Welle heißt monochromatisch oder (besser) monoenergetisch. Reale Wellen sind nie monochromatisch. Selbst ein perfekter Sinusgenerator kann nicht seit unendlich langer Zeit in Betrieb sein und liefert daher Frequenzen in einem (allerdings kleinen) Bereich. Ist dieses Frequenzband sehr schmal, spricht man von einer quasimonochromatischen Welle. Bevor wir weitergehen, wollen wir Gleichung (2.13) durch ein Zahlenbeispiel anschaulicher machen. Es sei v = 1 m/s und λ = 2 m. Aus der Wellenfunktion 2π (x − vt) ψ = A sin λ wird unter Verwendung von SI-Einheiten ψ = A sin π (x − t) . Abb. 2.9 zeigt, wie sich die Welle mit einer Geschwindigkeit von 1 m/s nach rechts bewegt, während die Zeit von t = 0 [ψ = A sin πx] über t = 1 s [ψ = A sin π (x−1)] bis t = 2 s [ψ = A sin π (x−2)] fortschreitet. Beispiel 2.4 Gegeben ist die Funktion ψ(x, t) = (0,040) sin 2π



t y + 6,0 × 10−7 2,0 × 10−15

 ,

wobei wir annehmen wollen, dass alle Größen in geeigneten SI-Einheiten eingehen. (a) Hat dieser Ausdruck die Form einer Welle? Erläutern Sie Ihre Antwort. Falls ja, bestimmen Sie (b) die Frequenz, (c) die Wellenlänge, (d) die Amplitude, (e) die Ausbreitungsrichtung und (f) die Geschwindigkeit der Welle.

2 Die Wellenbewegung

34

Lösung (a) Wenn wir den Faktor 1/6,0 × 10−7 vor die Klammer ziehen, dann wird klar, dass ψ(y, t) eine zweimal differenzierbare Funktion von (y ± vt) ist – der Ausdruck beschreibt also eine harmonische Welle. (b) Wir können auch einfach Gleichung (2.22) verwenden, d. h. ψ = A sin 2π (x/λ + t/τ ) , woraus wir für die Periode τ = 2,0 × 10−15 s erhalten. Folglich ist ν = 1/τ = 5,0 × 1014 Hz. (c) Die Wellenlänge ist λ = 6,0 × 10−7 m. (d) Die Amplitude ist A = 0,040. (e) Die Welle pflanzt sich in die negative y-Richtung fort. (f) Die Geschwindigkeit ist v = νλ = (5,0 × 1014 Hz)(6,0 × 10−7 m) = 3,0 × 108 m/s. Alternativ können wir den Faktor 1/6,0 × 10−7 vor die Klammer ziehen. So erhalten wir für die Geschwindigkeit 6,0 × 10−7 /2,0 × 10−15 = 3,0 × 108 m/s.

x

ψ

0

0

1/2+A 1

2

0

x

ψ

0

0

1/2−A

2

0

x

ψ

0

0

1/2+A 0

3/2−A 2

0

1

2

3

x (m)

−A ψ = A sin π(x − 1) +A

t = 1.0 s

0

3/2+A

1

t=0

0

3/2−A

1

ψ = A sin πx +A

0

0

1

2

3

x (m)

−A ψ = A sin π(x − 2) +A

t = 2.0 s

0 1 −A

2

3

x(m)

Abb. 2.9: Eine fortschreitende Welle der Form ψ (x, t) = A sin k (x − vt), die sich mit einer Geschwindigkeit von 1 m/s nach rechts ausbreitet.

Raumfrequenz Periodische Wellen sind Strukturen, die sich durch Raum und Zeit bewegen, wobei sie durch die Wellenlänge, die zeitliche Periode und die zeitliche Frequenz charakterisiert sind. Die moderne Optik ist auch an stationären periodischen Verteilungen von Information interessiert, die konzeptionell an Momentaufnahmen von Wellen erinnern. Tatsächlich werden wir in den Kapiteln 7 und 11 sehen, dass gewöhnliche Bilder von Gebäuden, Menschen oder Zäunen mithilfe von räumlich periodischen Funktionen und einer als Fourier-Analyse bekannten Methode erzeugt werden können.

2.3 Phase und Phasengeschwindigkeit

35

Abb. 2.10: Sinusförmige Helligkeitsverteilung mit relativ kleiner Raumfrequenz.

Was wir hierbei im Hinterkopf behalten müssen, ist, dass optische Informationen in der gleichen Weise wie ein Wellenprofil periodisch im Raum verteilt sein können. Um dies zu veranschaulichen, konvertieren wir die Sinuskurve aus Abbildung 2.6 in ein Muster aus Streifen von gleichmäßig variierender Helligkeit, wie es in Abbildung 2.10 zu sehen ist. Diese sinusförmige Variation der Helligkeit hat eine räumliche Periode von einigen Millimetern (gemessen als Abstand zwischen zwei Helligkeitsmaxima). Hier entspricht ein Paar aus einem schwarzen und einem weißen Band einer „Wellenlänge“, das heißt, so viele Millimeter (oder Zentimeter) liegen innerhalb eines Bandpaares. Das Inverse hiervon – also eins geteilt durch eine räumliche Periode – ist die Raumfrequenz, die Anzahl der Bandpaare pro Millimeter (oder Zentimeter). Abbildung 2.11 zeigt ein ähnliches Muster mit einer kleineren räumlichen Periode und einer höheren Raumfrequenz. Dies sind einfache räumliche Frequenzverteilungen, die mit monochromatischen Profilen in der zeitlichen Dimension verwandt sind. Wir werden später sehen, wie aus individuellen räumlichen Frequenzverteilungen wie jenen in den Abbildungen 2.10 und 2.11 Bilder durch Superposition aufgebaut werden können.

Abb. 2.11: Sinusförmige Helligkeitsverteilung mit relativ hoher Raumfrequenz.

2.3

Phase und Phasengeschwindigkeit

Betrachten wir die Wellenfunktion einer beliebigen harmonischen Welle, zum Beispiel ψ (x, t) = A sin (kx − ωt) .

(2.26)

2 Die Wellenbewegung

36

Der Ausdruck, von dem der Sinus gebildet wird, ist der Phasenwinkel ϕ der Welle (auch Phase genannt): ϕ = (kx − ωt) .

(2.27)

Bei t = x = 0 gilt ψ (x, t) |t=0,x=0 = ψ (0, 0) = 0 , was offensichtlich ein Spezialfall ist. Allgemeiner gilt ψ (x, t) = A sin (kx − ωt + ε)

(2.28)

mit ε als Anfangsphase, Anfangsphasenwinkel oder Phasenkonstante. Um die physikalische Bedeutung von ε zu veranschaulichen, stellen wir uns vor, wir wollten eine fortschreitende harmonische Welle auf einem gespannten Seil erzeugen (Abb. 2.12). Dazu müssten wir die Hand, die das Seil hält, in einer Weise bewegen, dass ihre vertikale Verschiebung y zum Negativen ihrer Beschleunigung proportional wäre; dies entspräche einer einfachen harmonischen Bewegung (siehe Aufgabe 2.27). Bei t = 0 und x = 0 müsste sich die Hand aber nicht genau auf der x-Achse befinden, und sie müsste auch nicht mit einer Bewegung nach unten beginnen, wie es in Abbildung 2.12 der Fall ist. Sie könnte ebenso gut zuerst nach oben schwingen wie in Abbildung 2.13; dann wäre ε = π und wir hätten ψ (x, t) = y (x, t) = A sin (kx − ωt + π) oder, anders geschrieben, ψ (x, t) = A sin (ωt − kx)

(2.29)

oder

π . ψ (x, t) = A cos ωt − kx − 2 Die Phasenkonstante ist der konstante Beitrag zum Phasenwinkel, der am Erreger entsteht und nicht davon abhängt, wie weit oder wie lange die Welle bereits unterwegs ist. Der Phasenwinkel in Gleichung (2.26) ist (kx − ωt), in Gleichung (2.29) dagegen ist er (ωt − kx). Beide Gleichungen beschreiben Wellen, die sich in positiver xRichtung bewegen und bis auf den relativen Phasenunterschied von π identisch sind. Wenn in einer gegebenen Situation die Anfangsphase nicht von Bedeutung ist, kann man die Welle wahlweise mit Gleichung (2.26) oder (2.29) oder auch mit einer Kosinusfunktion beschreiben. Aus praktischen Gründen gibt man gelegentlich einer der Formen den Vorzug; in der Literatur treten alle beide häufig auf, und auch wir werden beide Formen verwenden.

2.3 Phase und Phasengeschwindigkeit

37

t=0

t=0

v t = τ /4

t = τ /4 v v t = τ /2

t = τ /2

v t = 3τ /4

v

t = 3τ /4

v v

t=τ

t=τ

v ε=0

Abb. 2.12: Mit ε = 0 gilt bei x = 0 und t = τ /4 = π/2ω: y = A sin (−π/2) = −A.

ε=π

Abb. 2.13: Mit ε = π gilt bei x = 0 und t = τ /4 = π/2ω: y = A sin (π/2) = A.

Der Phasenwinkel einer Störung, beispielsweise ψ (x, t) in Gleichung (2.28), beträgt ϕ (x, t) = (kx − ωt + ε) und ist offensichtlich eine Funktion von x und t. Die partielle Ableitung von ϕ nach t bei konstantem x ist die Änderungsrate des Phasenwinkels mit der Zeit,     ∂ϕ    (2.30)  ∂t  = ω . x Die Änderungsrate des Phasenwinkels in einem beliebigen festen Punkt entspricht der Winkelgeschwindigkeit der Welle, der Geschwindigkeit, mit der ein Punkt auf dem Seil in Abbildung 2.12 auf- und niederschwingt. Dieser Punkt muss dieselbe Anzahl von Zyklen pro Sekunde absolvieren wie die Welle; bei jedem Zyklus nimmt ϕ um 2π zu. Die Größe ω ist der Winkel, den die Phase pro Sekunde überstreicht. Die Größe k ist der Winkel, den die Phase pro Meter überstreicht In ähnlicher Weise können wir die Änderungsrate des Phasenwinkels mit dem Abstand bei konstantem t aufschreiben:     ∂ϕ    (2.31)  ∂x  = k . t

2 Die Wellenbewegung

38

Diese beiden Ausdrücke erinnern an eine Gleichung aus der Theorie der partiellen Ableitungen, die in der Thermodynamik häufig angewendet wird:   − (∂ϕ/∂t)x ∂x = . (2.32) ∂t ϕ (∂ϕ/∂x)t Der Term auf der linken Seite entspricht der Ausbreitungsgeschwindigkeit unter der Bedingung eines konstanten Phasenwinkels. Stellen wir uns eine harmonische Welle vor; wir wählen einen beliebigen Punkt auf ihrem Profil, beispielsweise ein Maximum. Während sich die Welle durch den Raum bewegt, bleibt die y-Verschiebung des gewählten Punktes konstant. Da der Phasenwinkel die einzige Variable der harmonischen Wellenfunktion ist, bleibt auch er für unseren Punkt konstant – und zwar bei einem Wert, der das y liefert, das dem gewählten Punkt entspricht. Der Punkt bewegt sich mit der Geschwindigkeit v gemeinsam mit dem Profil und der Bedingung des konstanten Phasenwinkels fort. Bilden wir nun die geeigneten partiellen Ableitungen von ϕ, wie sie beispielsweise durch Gleichung (2.29) gegeben sind, und setzen sie in Gleichung (2.32) ein, so erhalten wir   ω ∂x (2.33) = ± = ±v . ∂t ϕ k Die Einheit von ω ist rad/s und die Einheit von k ist rad/m. Mit dieser Geschwindigkeit bewegt sich das Wellenprofil fort; man nennt sie die Phasengeschwindigkeit der Welle. Die Phasengeschwindigkeit trägt ein positives Vorzeichen, wenn sich die Welle in Richtung zunehmender x bewegt; ansonsten ist das Vorzeichen negativ. Dies ist konsistent mit unserer Festlegung von v als dem Betrag der Wellengeschwindigkeit: v > 0. Betrachten wir nun den Prozess der Fortbewegung eines konstanten Phasenwinkels und seine Beziehung zu einer beliebigen harmonischen Wellengleichung, beispielsweise ψ = A sin k (x ∓ vt) mit ϕ = k (x − vt) = konstant. Mit zunehmendem t muss auch x wachsen; das gilt auch für x < 0 und damit ϕ < 0. Die Bedingung des konstanten Phasenwinkels bewegt sich dann in die Richtung, in der x zunimmt. Solange die beiden Terme in der Klammer voneinander subtrahiert werden, bewegt sich die Welle in positiver x-Richtung. Dagegen muss für ϕ = k (x + vt) = konstant x mit zunehmendem t abnehmen; die Bedingung des konstanten Phasenwinkels bewegt sich dann in die Richtung, in der x abnimmt.

2.3 Phase und Phasengeschwindigkeit

39

Beispiel 2.5 Eine fortschreitende Welle kann zur Zeit t = 0 in SI-Einheiten in der Form ψ(y, 0) = (0,030 m) cos(πy/2,0) geschrieben werden. Die Störung pflanzt sich mit einer Phasengeschwindigkeit von 2,0 m/s in der negativen y-Richtung fort. Schreiben Sie einen Ausdruck auf, der die Welle zur Zeit t = 6,0 s beschreibt. Lösung Wir schreiben die Welle in der Form   t y ± . ψ(y, t) = A cos 2π λ τ Hier ist A = 0,030 m und ψ(y, 0) = (0,030 m) cos 2π



y 4,0

 .

Wir brauchen die Periode, und wegen v = νλ = λ/τ erhalten wir für λ = 4,0 m τ = λ/v = (4,0 m)/(2,0 m/s) = 2,0 s. Folglich gilt   t y + . ψ(y, t) = (0,030 m) cos 2π 4,0 2,0 Das positive Vorzeichen in der Phase bedeutet, dass die Bewegung in die negative y-Richtung erfolgt. Bei t = 6,0 s haben wir   y + 3,0 . ψ(y, 6,0) = (0,030 m) cos 2π 4,0 Jeder Punkt einer harmonischen Welle mit gleich bleibender Stärke bewegt sich so, dass ϕ (x, t) zeitlich konstant ist oder anders ausgedrückt, so dass gilt dϕ (x, t) /dt = 0 oder dψ (x, t) /dt = 0. Dies trifft für alle Wellen zu, auch für nicht periodische; es führt uns (siehe Aufgabe 2.34) zu dem Ausdruck     ∂ψ ∂ψ . (2.34) ±v = − ∂t x ∂x t Daraus lässt sich bei bekanntem ψ (x, t) bequem v bestimmen. Beachten Sie, dass v immer positiv ist; ergibt der Bruch auf der rechten Seite eine negative Zahl, so bedeutet dies, dass die Bewegung in negativer x-Richtung verläuft. Abbildung 2.14 zeigt zweidimensionale Wellen auf der Oberfläche einer Flüssigkeit. In der Zeichnung kommt die sinusförmige Natur der Störung beim Auf und Ab des Mediums zum Ausdruck. Zur Veranschaulichung des Vorgangs bietet sich noch eine andere Sichtweise an: Die Kurven, die jeweils alle diejenigen Punkte miteinander verbinden, zu denen derselbe Phasenwinkel gehört, sind Kreise. Wenn nun A bei

2 Die Wellenbewegung

40

jedem bestimmten Abstand von der Quelle in jeder Richtung konstant ist und ϕ entlang eines bestimmten Kreises ebenfalls, so muss auch ψ entlang dieses Kreises konstant sein. Mit anderen Worten: Alle korrespondierenden Wellenberge und -täler liegen auf Kreisen – daher bezeichnen wir solche Wellen als Kreiswellen, die sich mit der Geschwindigkeit v von der Quelle aus nach außen ausbreiten.

Abb. 2.14: Idealisierte Kreiswellen. (Foto E. H.)

Eine Sonneneruption verursacht seismische Wellen, die sich über die Oberfläche ausbreiten.

2.4

Das Superpositionsprinzip

Aus der Form der Wellengleichung in Differentialschreibweise (2.11) wird eine interessante Eigenschaft der Wellen ersichtlich, die man bei einem klassischen Teilchenstrom nicht findet. Es seien die Wellenfunktionen ψ1 und ψ2 zwei separate Lösungen der Wellengleichung; dann ist auch (ψ1 + ψ2 ) eine Lösung. Dieses so genannte Superpositionsprinzip lässt sich leicht beweisen. Es muss gelten 1 ∂ 2 ψ1 ∂ 2 ψ2 1 ∂ 2 ψ2 ∂ 2 ψ1 = und = . ∂x2 v 2 ∂t2 ∂x2 v 2 ∂t2 Durch Addition beider Ausdrücke gelangen wir zu 1 ∂ 2 ψ1 1 ∂ 2 ψ2 ∂ 2 ψ1 ∂ 2 ψ2 + = 2 + 2 . 2 2 2 ∂x ∂x v ∂t v ∂t2

2.4 Das Superpositionsprinzip

41

Schreiben wir dies als 1 ∂2 ∂2 (ψ + ψ ) = (ψ1 + ψ2 ) , 1 2 ∂x2 v 2 ∂t2 dann sehen wir sofort, dass (ψ1 + ψ2 ) tatsächlich ebenfalls eine Lösung ist. Physikalisch bedeutet dies Folgendes: Gelangen zwei einzelne Wellen zum selben Ort im Raum, wo sie sich überlagern, dann kommt es einfach zu einer Addition beider Wellen (bzw. zu einer Subtraktion der einen Welle von der anderen) und die beiden ursprünglichen Wellen werden dauerhaft zerstört. Die resultierende Störung in jedem Punkt des Überlappungsgebietes ist gleich der algebraischen Summe der einzelnen Komponenten in diesem Punkt (siehe Abb. 2.15). Nachdem die Wellen das Überlappungsgebiet passiert haben, bewegen sie sich voneinander unbeeinflusst weiter. ψ(x, 0) 2 t=0 ψ1 (x0 )

1

ψ(x0 ) ψ2 (x0 ) ψ1 (x0 )

−1

0 kx0

−1

−2

1

kx (rad) 2

3

ψ1 = 1.0 sin kx ψ2 = 0.9 sin(kx + 1.0 rad) ψ = ψ1 + ψ2

ψ1 ψ2 ψ

Abb. 2.15: Superposition zweier Sinuswellen ψ1 und ψ2 gleicher Wellenlänge. Die Resultierende ist wieder eine Sinuswelle mit der gleichen Wellenlänge, die sich in jedem Punkt als algebraische Summe der Komponenten ergibt. Bei x = x0 ist also ψ (x0 ) = ψ1 (x0 )+ψ2 (x0 ); die Auslenkungen addieren sich. Die Amplitude von ψ ist A. Sie kann auf verschiedene Weisen berechnet werden; siehe Abbildung 2.19

Beachten Sie, dass wir hier über eine lineare Superposition von Wellen sprechen, wie man sie in der Praxis in der Regel antrifft. Sind die Amplituden der Wellen jedoch sehr groß, dann können sie das Medium in nichtlinearer Weise antreiben (was in Abschn. 13.4 behandelt wird). Im Moment wollen wir uns auf die lineare Wellengleichung konzentrieren, aus der sich ein lineares Superpositionsprinzip ergibt. Die Superposition von Wellen spielt auf die eine oder andere Weise in vielen Bereichen der Optik eine Rolle. Selbst die grundlegenden Prozesse von Reflexion und Brechung sind Ergebnisse der Streuung des Lichts an unzähligen einzelnen Atomen und somit nur mithilfe der Überlappung von Wellen zu erklären. Daher ist es immens wichtig, möglichst frühzeitig zumindest ein qualitatives Verständnis des Phänomens zu erarbeiten. Dazu wollen wir uns die beiden koexistierenden Wellen in Abbildung 2.15 genauer ansehen. In jedem Punkt (also bei jedem Wert von kx) addieren wir einfach ψ1 und ψ2 , die beide sowohl positiv als auch negativ sein können. Um dies schnell

42

2 Die Wellenbewegung

zu überprüfen, suchen wir uns einen Punkt, wo eine der beiden Wellen null wird: Bei ψ1 = 0 ist ψ = ψ2 , sodass sich die zu ψ und ψ2 gehörenden Kurven in diesem Punkt schneiden (zum Beispiel bei kx = 0 und kx = +3,14 rad). In den Punkten, wo sich die Amplituden der beiden ursprünglichen Wellen zu null addieren (unterschiedliches Vorzeichen, gleicher Zahlenwert), wird ψ = 0 (bei kx = +2,67 rad). Beachten Sie auch, wie ψ2 durch eine positive relative Phasendifferenz von 1 rad bezüglich ψ1 nach links verschoben wird. Wenn wir unsere Überlegungen anhand von Abbildung 2.16 fortsetzen, sehen wir, wie die Resultierende der Superposition zweier Wellen mit nahezu gleicher Amplitude von

Abb. 2.16: Die Superposition zweier sinusförmiger Wellen mit den Amplituden 1,0 und 0,9. Die Wellen sind in (a) phasengleich, in (b) eilt ψ1 um π/3 voraus, in (c) eilt ψ1 um 2π/3 voraus; in (d) sind die beiden Wellen außer Phase (die Phasenverschiebung beträgt π), sodass sie einander nahezu auslöschen. Die Ermittlung der Amplituden wird in Abbildung 2.20 erläutert.

2.5 Die komplexe Darstellung

43

der Phasendifferenz zwischen den beiden Wellen abhängt. In Abbildung 2.16 a ist die Phasendifferenz zwischen beiden Wellen gleich null; die Wellen sind in Phase, sie heben und senken sich gleichzeitig, wodurch sie einander verstärken. Die resultierende Welle hat dann zwar eine größere Amplitude als jede der Ausgangswellen, aber ihr Profil (sinusförmig), ihre Frequenz und ihre Wellenlänge stimmen mit denen der Komponenten überein. Sehen wir uns die Bilder 2.14 a–d nacheinander an, so fällt auf, dass die resultierende Amplitude mit wachsender Phasendifferenz kleiner wird und schließlich nahezu ganz verschwindet, wenn der Phasenunterschied gleich π ist. Die Wellen sind dann um 180◦ außer Phase. Wellen, die außer Phase sind, schwächen einander ab. Das gesamte hier beschriebene Phänomen nennt man Interferenz.

Überlappende und interferierende Wasserwellen.

2.5

Die komplexe Darstellung

Im Laufe der weiteren Analyse von Wellenphänomenen wird sich herausstellen, dass die Verwendung von Sinus- und Kosinusfunktionen zur Beschreibung harmonischer Wellen umständliche Rechenwege nach sich zieht. Die Formulierungen werden ziemlich kompliziert, und die zur Lösung der Gleichungen erforderlichen trigonometrischen Manipulationen sind nicht sehr übersichtlich. Mathematisch einfacher ist die Beschreibung mithilfe komplexer Zahlen. Komplexe Exponentialformen werden sowohl in der klassischen Mechanik als auch in der Quantenmechanik und ebenfalls in der Optik häufig benutzt. Die komplexe Zahl z hat die Form z = x + iy (2.35) √ mit i = −1; x und y, der Real- bzw. der Imaginärteil von z, sind reelle Zahlen. Abbildung 2.17 a zeigt die grafische Veranschaulichung dieses Sachverhalts durch ein Argand-Diagramm. Mit den Polarkoordinaten r und θ erhalten wir x = r cos θ und y = r sin θ , z = x + iy = r (cos θ + i sin θ) .

2 Die Wellenbewegung

44 Im

Im

Im Re

Re

Realteil (a)

(b)

Re (c)

(d)

Abb. 2.17: Das Argand-Diagramm dient zur Darstellung des Real- und des Imaginärteils einer komplexen Zahl. In Teil (a) werden als Koordinaten x und y verwendet; in Teil (b) sind die Koordinaten r und θ. Ändert sich θ gleichförmig mit der Zeit, so rotiert der Pfeil, wie in Teil (d) dargestellt, mit der Geschwindigkeit ω.

Aus der eulerschen Formel1 eiθ = cos θ + i sin θ folgt eiθ − e−iθ eiθ + e−iθ und sin θ = . 2 2i Außerdem können wir unter Verwendung der eulerschen Formel schreiben (Abb. 2.17 b) cos θ =

z = reiθ = r cos θ + ir sin θ . Hier ist r der Betrag von z, θ ist der Phasenwinkel von z in rad. Der Betrag der komplexen Zahl, auch als Modulus oder Absolutwert bezeichnet, wird oft mit |z| angegeben. Das konjugiert Komplexe zu z (Abb. 2.17 c, gekennzeichnet mit einem Stern, bildet man durch einen Vorzeichenwechsel aller i: z ∗ = (x + iy)∗ = (x − iy) , z ∗ = r (cos θ − i sin θ) , z ∗ = re−iθ . Die Addition und die Subtraktion komplexer Zahlen sind wie folgt erklärt: z1 ± z2 = (x1 + iy1 ) ± (x2 + iy2 ) und somit z1 ± z2 = (x1 ± x2 ) + i (y1 ± y2 ) . Dieser Rechenschritt ist der komponentenweisen Addition von Vektoren sehr ähnlich. Multiplikation und Division schreibt man am einfachsten in der polaren Form z1 z2 = r1 r2 ei(θ1 +θ2 ) 1

Falls Sie an der Gleichheit zweifeln, bilden Sie das Differential von z = cos θ + i sin θ mit r = 1. Sie erhalten dz = iz dθ; die Integration liefert z = exp (iθ).

2.5 Die komplexe Darstellung

45

beziehungsweise r1 z1 = ei(θ1 −θ2 ) . z2 r2 An dieser Stelle wollen wir einige Regeln einführen, die für die folgenden Berechnungen verwendet werden. Aus den trigonometrischen Additionstheoremen (Aufgabe 2.44) folgt direkt ez1 +z2 = ez1 ez2 und, mit z1 = x und z2 = iy, ez = ex+iy = ex eiy . Der Betrag einer komplexen Zahl ist gegeben durch √ r = |z| ≡ zz ∗ und |ez | = ex . Wegen cos 2π = 1 und sin 2π = 0 gilt ei2π = 1 . In gleicher Weise kann man schreiben eiπ = e−iπ = −1 und

e±iπ/2 = ±i .

Die Funktion ez ist periodisch, sie wiederholt sich alle i2π: ez+i2π = ez ei2π = ez . Jede komplexe Zahl kann man als Summe aus Realteil Re (z) und Imaginärteil Im (z) schreiben: z = Re (z) + i Im (z) . Damit ist 1 1 (z + z ∗ ) und Im (z) = (z − z ∗ ) . 2 2i Beide Ausdrücke folgen unmittelbar aus dem Argand-Diagramm (Abb. 2.17 a und c). So ist beispielsweise z + z ∗ = 2x, weil die Imaginärteile einander aufheben und Re (z) = x ist. Re (z) =

In der Polarkoordinaten-Schreibweise mit Re (z) = r cos θ

und

Im (z) = r sin θ

2 Die Wellenbewegung

46

eignet sich jeder der beiden Anteile zur Beschreibung einer harmonischen Welle. Bequemer ist es, mit dem Realteil zu arbeiten; die harmonische Welle wird dann geschrieben als

(2.36) ψ (x, t) = Re Aei(ωt−kx+ε) , was natürlich äquivalent ist zu ψ (x, t) = A cos (ωt − kx + ε) . Wo immer es zweckmäßig ist, werden wir daher die Wellenfunktion wie folgt aufschreiben und in unseren Berechnungen verwenden: ψ (x, t) = Aei(ωt−kx+ε) = Aeiϕ .

(2.37)

So nutzen wir die Einfachheit der Handhabung komplexer Exponentialfunktionen aus. Erst wenn wir das endgültige Resultat erhalten haben und eine reale Welle darstellen wollen, werden wir zum Realteil übergehen. Die Schreibweise von ψ (x, t) wie in Gleichung (2.37) ist weit verbreitet, wobei man dem Realteil selbstverständlich die reale Welle zuordnet. Die komplexe Darstellung gehört zum Handwerkszeug der modernen Physik, doch sollte man sich darüber im Klaren sein, dass sie mit Bedacht angewendet werden muss: Nachdem man eine Welle als komplexe Funktion geschrieben und dann auf diese Funktion irgendwelche Operationen angewendet hat, kann der Realteil nur dann rekonstruiert werden, wenn es sich bei diesen Operationen um Additionen, Subtraktionen, Multiplikation mit bzw. Division durch eine reelle Größe oder um eine Differentiation bzw. Integration bzgl. einer reellen Variable handelt. Multiplikative Operationen (einschließlich Skalarprodukt und Vektorprodukt) dürfen nur mit reellen Größen durchgeführt werden. Es kann zu falschen Ergebnissen führen, wenn man komplexe Größen multipliziert und dann den Realteil nimmt (siehe Aufgabe 2.47).

2.6

Zeiger und die Addition von Wellen

Den Pfeil im Argand-Diagramm (Abb. 2.17 d) lässt man mit der Frequenz ω rotieren; der Winkel wird gleich ωt gesetzt. So gelangt man zu einem Schema für die Darstellung (und später auch für die Addition) von Wellen, das wir an dieser Stelle qualitativ einführen und weiter hinten (Abschn. 7.1.3) quantitativ ableiten wollen. Abbildung 2.18 zeigt eine harmonische Welle mit der Amplitude A, die sich nach links bewegt. Der eingezeichnete Pfeil hat die Länge A und läuft mit konstanter Geschwindigkeit um, wobei er mit der x-Achse, unserer Referenzachse, den Winkel ωt einschließt. Der rotierende Pfeil bildet gemeinsam mit dem zugehörigen Phasenwinkel einen Zeiger oder Phasor, der alle Informationen über die damit verknüpfte harmonische Welle enthält. Für einen Zeiger werden in der Regel die Amplitude A und die Phase ϕ angegeben: A∠ϕ oder A(ϕ).

2.6 Zeiger und die Addition von Wellen

47

(a) ψ=A sin kx A

A∠0 kx

−A

(b) π/3

ψ=A sin(kx+π/3)

A∠π/3

kx π/3 (c) π/2

ψ=A sin(kx+π/2)

A∠π/2

kx π/2 ψ=A sin(kx+2π/3) A

2π/3

kx

2π/3 −A ψ=A sin(kx+π) A

(e)

π

A∠π kx

π

(d) A∠2π/3

Abb. 2.18: Dargestellt sind die Graphen der Funktion ψ = A sin (kx + ωt) für verschiedene Werte von ωt (nämlich 0, π/3, π/2, 2π/3 und π) und die zugehörigen Zeigerdiagramme. Wieder ist die Projektion des rotierenden Pfeils auf die vertikale Achse gleich dem Wert von ψ auf der Achse kx = 0.

Wir wollen uns dies anhand von Abbildung 2.18 schrittweise veranschaulichen. Der Zeiger in Abbildung 2.18 a hat einen Phasenwinkel von null; das bedeutet, er liegt auf der Bezugsachse. Als Referenz lässt sich auch die zugehörige Sinusfunktion verwenden. In Abbildung 2.18 b beträgt der Phasenwinkel +π/3 rad; die Sinusfunktion ist um diesen Betrag nach links verschoben. Daher liegt das erste Maximum dieser Sinuskurve bei einem kleineren Wert von kx als im Fall von Abbildung 2.18 (a); die Kurve ist der Referenz um π/3 rad voraus. Die Phasenwinkel in Abbildung 2.18(c), (d) und (e) betragen +π/2 rad, +2π/3 rad und +π rad. Die gesamte Kurvenfolge entspricht einer Welle ψ = A sin (kx + ωt), die sich nach links fortpflanzt. Der Zeiger, der entgegengesetzt dem Uhrzeigersinn in einer Weise rotiert, dass der Phasenwinkel zu jedem Zeitpunkt gleich ωt ist, kann als gleichwertige Darstellung dieser Welle gelten. Abbildung 2.7 zeigt eine ähnliche Situation; allerdings rotiert der Zeiger hier im Uhrzeigersinn, und die zugehörige Welle pflanzt sich nach rechts fort. Bei der Kombination mehrerer Wellenfunktionen sind in der Regel die resultierende Phase und die Amplitude von Interesse. Unter diesem Gesichtspunkt betrachten wir noch einmal die Addition der Wellen in Abbildung 2.16: Offensichtlich ergibt sich die Amplitude der resultierenden Welle, A, als Summe der Amplituden der Komponenten, wenn die zugehörigen Störungen in Phase sind: A = A1 + A2 = 1,0 + 0,9 = 1,9

2 Die Wellenbewegung

48

A2

Abb. 2.19: Die Summe zweier Zeiger A1 ∠ϕ1 und A2 ∠ϕ2 ist gleich A∠ϕ. Betrachten Sie in diesem Zusammenhang noch einmal Abbildung 2.15. Diese zeigt die Überlagerung zweier Sinuswellen mit den Amplituden A1 = 1,0 und A2 = 0,9 sowie den Phasen ϕ1 = 0 und ϕ2 = 1,0 rad.

A ϕ2 A1 ϕ

ϕ1

(Abb. 2.16 a). Dies entspricht der Addition zweier kolinearer Vektoren, die in dieselbe Richtung weisen. Sind dagegen die beiden Komponenten um 180◦ außer Phase (Abb. 2.16 d), entsteht eine Situation wie bei der Addition zweier entgegengesetzt gerichteter kolinearer Vektoren und A = A1 − A2 = 1,0− 0,9 = 0,1. Zwar sind Zeiger keine Vektoren, aber die Additionsregeln sind ähnlich. Später werden wir beweisen, dass man die Addition zweier Zeiger A1 ∠ϕ1 und A2 ∠ϕ2 ausführen kann, indem man das Ende des einen an die Spitze des anderen setzt (Abb. 2.19), also so, wie wir es von Vektoren gewohnt sind, um den resultierenden Zeiger A∠ϕ zu erhalten. Da die Zeiger mit einer gemeinsamen Geschwindigkeit ω rotieren, können wir sie einfach bei t = 0 einfrieren, ohne uns weiter Gedanken über ihre Zeitabhängigkeit zu machen; dies vereinfacht die bildliche Darstellung beträchtlich. Die vier Zeigerdiagramme in Abbildung 2.20 entsprechen den vier Wellenüberlagerungen, die in Abbildung 2.16 gezeigt sind. Befinden sich beide Wellen in Phase (wie in Abb. 2.16 a), so setzen wir ihre Phasenwinkel jeweils gleich null (Abb. 2.20 a) und zeichnen die Zeiger entlang der Referenzachse ϕ = 0 hintereinander ein. Unterscheiden sich die beiden Phasenwinkel um π/3 (wie in Abb. 2.16 b), so beträgt auch der relative Phasenwinkel der Zeiger π/3 (Abb. 2.20 b). Der Phasenwinkel der Resultierenden liegt dann zwischen 0 und π/3, wie man in Abb. 2.16 b und 2.20 b sieht, und

(a)

(c)

(b)

(d)

Abb. 2.20: Addition von Zeigern, die zwei Wellen mit den Amplituden A1 = 1,0 und A2 = 0,9 für vier verschiedene relative Phasen repräsentieren, siehe Abbildung 2.16.

2.7 Ebene Wellen

49

die Amplitude der Welle ist entsprechend geringer. Wenn sich die Phasenwinkel um 2π/3 unterscheiden (wie in Abb. 2.16 c), bilden die zugehörigen Zeiger ein nahezu gleichseitiges Dreieck (abgesehen davon, dass A1 > A2 ist); A liegt dann zwischen A1 und A2 . Ist schließlich der Unterschied der Phasenwinkel der beiden Wellen (bzw. Zeiger) gleich π (also 180◦ ), löschen die Wellen einander fast aus, und die Amplitude der Resultierenden wird minimal. Beachten Sie (Abb. 2.20 d), dass der resultierende Zeiger in Richtung der Referenzachse weist und damit denselben Phasenwinkel (null) hat wie A1 ∠ϕ1 . Er ist damit bezüglich A2 um 180◦ außer Phase, was analog auf die zugehörigen Wellen in Abbildung 2.16 d zutrifft. Dies war nur eine knappe Einführung des Konzepts der Zeiger und der Zeigeraddition. Wir kommen darauf in Abschnitt 7.1 zurück, wo die Methode ausgiebig genutzt wird.

2.7

Ebene Wellen

Eine Lichtwelle kann zu einem gegebenen Zeitpunkt im Raum durch ihre Frequenz, ihre Amplitude, die Richtung ihrer Propagation usw. beschrieben werden, doch das sagt nicht viel aus über die optischen Störungen, die in einem ausgedehnten räumlichen Gebiet herrschen. Um darüber etwas herauszufinden, führen wir das Konzept der Wellenfront ein. Licht ist ein Schwingungsphänomen, es korrespondiert mit harmonischen Oszillationen eines bestimmten Typs, und die eindimensionale Sinuswelle ist ein wichtiges Element, um eine erste Vorstellung von dem Phänomen zu gewinnen. Abbildung 2.14 zeigt, wie Sinuswellen, die sich radial in zwei Dimensionen ausbreiten, eine gemeinsame, expandierende Störung bilden, eine Kreiswelle. Jeder Scheitel, resultierend aus einer eindimensionalen, nach außen fortschreitenden kleinen Welle, liegt auf einem Kreis, und das gleiche gilt für die Wellentäler – tatsächlich gilt es für jeden vorgegebenen Wert der Welle. Für jede gegebene Phase (beispielsweise 5π/2) haben die Sinuskomponenten einen bestimmten Wert (beispielsweise 1,0) und alle Punkte mit diesem Wert liegen auf einem Kreis. Oder anders ausgedrückt, die Orte aller Punkte, an denen die Phasen aller eindimensionalen kleinen Wellen gleich sind, bilden ein Muster aus konzentrischen Kreisen, wobei jeder Kreis einer bestimmten Phase entspricht (für die Scheitel beispielsweise π/2, 5π/2, 9π/2 usw.) Ganz allgemein ist eine dreidimensionale Wellenfront in jedem Augenblick eine Fläche konstanter Phase, die auch als Phasenfront bezeichnet wird. Reale Wellenfronten haben gewöhnlich extrem komplizierte Konfigurationen. Die von einem Baum oder einem Gesicht reflektierte Lichtwelle ist eine ausgedehnte, irreguläre, gekrümmte Fläche voller Beulen und Dellen, die sich nach außen bewegt und verschwindet. Im Rest dieses Kapitels werden wir die mathematische Darstellung einiger außerordentlich nützlicher idealisierter Wellenfronten untersuchen, und zwar solcher, die unkompliziert genug sind, um sie durch einfache Ausdrücke beschreiben zu können. Das wohl einfachste Beispiel für eine dreidimensionale Welle ist die ebene Welle. Sie existiert zu einem gegebenen Zeitpunkt, wenn alle Flächen mit gleichem Phasenwinkel einen Satz von Ebenen bilden, die alle senkrecht zur Fortpflanzungsrichtung

2 Die Wellenbewegung

50

k )

(

k r (

i

0

j

(a)

)

0

(b)

Abb. 2.21: (a) Kartesische Einheits-Basisvektoren. (b) Eine ebene Welle, die in k-Richtung propagiert.

ausgerichtet sind. Dass wir uns dieser Art von Wellen näher zuwenden, hat praktische Gründe; beispielsweise lässt sich unter Verwendung optischer Geräte ohne weiteres Licht herstellen, das die Form ebener Wellen hat. Den mathematischen Ausdruck für eine Ebene, die senkrecht zu einem gegebenen Vektor k ist und durch einen Punkt (x0 , y0 , z0 ) verläuft, kann man leicht herleiten (Abb. 2.21). Wir schreiben den Ortsvektor zunächst als Linearkombination aus den Einheitsvektoren des kartesischen Koordinatensystems (Abb. 2.21 a), ˆ. r = xˆı + yˆj + z k Der Vektor beginnt in einem beliebigen Ursprung O und endet im Punkt (x, y, z), der sich zunächst irgendwo im Raum befinden kann. Ähnlich gilt ˆ. (r − r0 ) = (x − x0 )ˆı + (y − y0 )ˆj + (z − z0 ) k Wir setzen (r − r0 ) · k = 0

(2.38)

und zwingen damit den Vektor (r − r0 ), eine Ebene senkrecht zu k zu überstreichen, während sein Endpunkt (x, y, z) nacheinander alle erlaubten Werte annimmt. Mit ˆ k = kxˆı + kyˆj + kz k

(2.39)

kann man Gleichung (2.38) in der Form kx (x − x0 ) + ky (y − y0 ) + kz (z − z0 ) = 0

(2.40)

kx x + ky y + kz z = a

(2.41)

oder

2.7 Ebene Wellen

51

aufschreiben mit a = kx x0 + ky y0 + kz z0 = konstant .

(2.42)

Die kürzeste Form der Gleichung einer zu k senkrechten Ebene ist dann gerade k · r = konstant = a .

(2.43)

Auf der Ebene liegen alle Punkte mit gleicher Projektion auf die k-Richtung. Wir können nun einen Satz von Ebenen konstruieren, über die ψ(r) im Raum sinusförmig variiert: ψ(r) = A sin (k · r) , ψ(r) = A cos (k · r)

(2.44) (2.45)

ψ(r) = Aeik·r .

(2.46)

oder Für jeden dieser Ausdrücke ist ψ(r) konstant über jeder Ebene, die durch k · r = konstant festgelegt wird. Wir beschäftigen uns hier mit harmonischen Funktionen, die sich nach einer Verschiebung um λ in der Richtung von k im Raum wiederholen sollten. Abbildung 2.22 ist eine vereinfachte Darstellung eines solchen Ausdrucks. Nur einige wenige der unendlich vielen Ebenen sind eingezeichnet; jeder von ihnen entspricht ein anderes ψ(r). Da wir r in keiner Weise beschränkt haben, sind die Ebenen in Wirklichkeit auch räumlich unendlich weit ausgedehnt. Die Störung füllt den gesamten Raum.

0

A

0 =

-A

0

A

k (r) +A

0

-A

Versc h k-Ric iebung in htung

Abb. 2.22: Wellenfronten einer ebenen, harmonischen Welle.

2 Die Wellenbewegung

52

Abb. 2.23: Ein Strahl besteht aus harmonischen Elementarwellen gleicher Frequenz und Wellenlänge. Die Elementarwellen sind alle in Phase, d. h., sie haben überall auf den ebenen Flächen der beiden transversalen Schnitte die gleiche Phase. Der Strahl ist daher aus ebenen Wellen zusammengesetzt.

Ein anderer Ansatz zur Visualisierung harmonischer ebener Wellen ist in Abbildung 2.23 gezeigt, in der zwei Schnitte durch einen idealen zylindrischen Strahl zu sehen sind. Das Licht stellen wir uns vor als Überlagerung unendlich vieler sinusförmiger Elementarwellen, die sich alle mit der gleichen Frequenz im Gleichschritt entlang paralleler Wege fortbewegen. Die beiden Schnitte sind exakt eine Wellenlänge voneinander entfernt, sodass auf beiden die eingezeichneten Sinuskurven alle gerade ein Maximum haben. Die beiden Flächen konstanter Phase sind flache Scheiben und man sagt, dass der Strahl aus „ebenen Wellen“ besteht. Würde einer der beiden Schnitte ein wenig entlang des Strahls verschoben, wäre die Auslenkung der Welle auf dieser neuen Wellenfront eine andere, doch wir würden noch immer eine ebene Fläche erhalten. Würden wir die Position des Schnitts festhalten, während der Strahl durch ihn hindurchtritt, dann würde die Auslenkung der Welle an dieser Stelle sinusförmig variieren. Beachten Sie, dass alle eingezeichneten Elementarwellen die gleiche Amplitude (maximale Auslenkung) haben. Mit anderen Worten, die zusammengesetzte Welle hat überall die gleiche „Stärke“. Wir bezeichnen sie daher als homogene Welle. Die räumlich periodische Natur dieser harmonischen Funktionen lässt sich wie folgt ausdrücken:   λk . (2.47) ψ(r) = ψ r + k Hier ist k der Betrag von k und k/k ein Einheitsvektor parallel dazu (Abb. 2.24). In Exponentialschreibweise lautet die entsprechende Formulierung Aeik·r = Aeik·(r+λk/k) = Aeik·r eiλk .

2.7 Ebene Wellen

53

z

k × λk/k r rk

λ x

y Abb. 2.24: Ebene Wellen.

Damit dies stimmt, muss eiλk = 1 = ei2π sein. Deshalb gilt λk = 2π bzw. k = 2π/λ . Der Vektor k, dessen Betrag die bereits eingeführte Wellenzahl k ist, heißt Wellenvektor. In jedem festen Punkt im Raum, wo r konstant ist, sind auch der Phasenwinkel und ψ(r) konstant – kurz gesagt, die Ebenen sind feststehend. Wenn sie sich bewegen sollen, muss ψ(r) zeitlich variieren. Dies können wir erreichen, indem wir eine Zeitabhängigkeit einführen, analog zum Vorgehen im Fall der eindimensionalen Welle. Es ist dann ψ (r, t) = Aei(k·r∓ωt) ,

(2.48)

wobei A, ω und k konstant sind. Der Störung, die sich in Richtung k fortpflanzt, können wir in jedem Raum- und Zeitpunkt eine Phase zuordnen. Flächen, die zu einem bestimmten Zeitpunkt alle Punkte gleicher Phase miteinander verbinden, heißen Wellenfronten. Beachten Sie, dass der Wert der Wellenfunktion auf der Wellenfront nur dann konstant ist, wenn die Amplitude A in jedem Punkt der Wellenfront einen festen Wert annimmt. Allgemein ist A eine Funktion von r und nicht notwendigerweise im gesamten Raum, nicht einmal auf einer Wellenfront, konstant. Im letzteren Fall nennt man die Welle inhomogen. Erst später, wenn wir Laserstrahlen und die innere Totalreflexion behandeln, werden wir derartigen Wellen wieder begegnen. Die Phasengeschwindigkeit der durch Gleichung (2.48) gegebenen ebenen Welle ist gleich der Ausbreitungsgeschwindigkeit der Wellenfront. In Abbildung 2.24 ist rk die skalare Komponente von r in Richtung von k. Die Auslenkung ist auf einer

2 Die Wellenbewegung

54

Wellenfront konstant; nach einer Zeit dt, wenn sich die Front in Richtung k um drk fortbewegt hat, ist dann ψ(r, t) = ψ(rk + drk , t + dt) = ψ(rk , t)

(2.49)

oder in exponentieller Schreibweise Aei(k·r∓ωt) = Aei(krk +kdrk ∓ωt∓ω dt) = Aei(krk ∓ωt) , weshalb auch gelten muss k drk = ±ω dt . Der Betrag der Geschwindigkeit der Welle, drk /dt, ist ω drk = ± = ±v . (2.50) dt k Dieses Ergebnis hätten wir auch vorwegnehmen können, wenn wir das Koordinatensystem in Abbildung 2.24 so weit gedreht hätten, dass k parallel zur x-Achse ist. Für diese Orientierung gilt ψ(r, t) = Aei(kx∓ωt) wegen k · r = krk = kx. Die Welle wäre damit auf eine eindimensionale Störung zurückgeführt worden, wie sie bereits diskutiert wurde. y

θ

k2 k1

λ λ

z Abb. 2.25: Überlagerung zweier Wellen gleicher Wellenlänge, die sich in unterschiedlichen Richtungen fortpflanzen.

Betrachten wir nun die beiden Wellen in Abbildung 2.25. Sie haben dieselbe Wellenlänge λ, sodass gilt k1 = k2 = k = 2π/λ. Welle 1, die sich entlang der z-Achse fortpflanzt, kann man schreiben als   2π z − ωt . ψ1 = A1 cos λ Da k1 und r parallel sind, ist k1 · r = kz = (2π/λ) z. Ähnlich ist für Welle 2 k2 · r = kz z + ky y = (k cos θ) z + (k sin θ) y und  2π (z cos θ + y sin θ) − ωt . ψ2 = A2 cos λ

2.7 Ebene Wellen

55

Auf diese Ausdrücke werden wir bei der ausführlichen Behandlung der Interferenz noch einmal zurückkommen, insbesondere im Hinblick auf die Situation im Überlappungsgebiet. Die ebene harmonische Welle wird häufig in kartesischen Koordinaten geschrieben: ψ(x, y, z, t) = Aei(kx x+ky y+kz z∓ωt)

(2.51)

ψ(x, y, z, t) = Aei[k(αx+βy+γz)∓ωt] ,

(2.52)

oder wobei α, β und γ die Richtungskosinusterme von k sind (siehe Aufgabe 2.48). Der Betrag des Wellenvektors ist durch die Komponenten gegeben:  (2.53) |k| = k = kx2 + ky2 + kz2 und natürlich α2 + β 2 + γ 2 = 1 .

(2.54)

Beispiel 2.6 Wie wir im nächsten Kapitel sehen werden, kann das E-Feld einer ebenen elektromagnetischen Welle durch den folgenden Ausdruck angegeben werden: E = (100 V/m) ˆj ei(kz+ωt) . (a) Wie groß ist die Amplitude dieser Welle im elektrischen Feld? (b) In welche Richtung pflanzt sich die Welle fort? (c) Welche Richtung hat E? (d) Nehmen Sie an, die Geschwindigkeit der Welle ist 2,998 × 108 m/s und die Wellenlänge 500 nm. Bestimmen Sie hieraus die Frequenz. Lösung (a) Die Amplitude kann einfach abgelesen werden: 100 V/m. (b) Hier ist k · r = kz, d. h., die ebene Wellenfront ist senkrecht zur z-Achse. Oder anders formuliert, kx und ky sind null und k = kz . Die Phase (kz + ωt) enthält ein positives Vorzeichen, was bedeutet, dass die Welle in die negative z-Richtung propagiert. (c) Der Vektor E liegt in Richtung von j, aber weil die Welle harmonisch ist, ist die Richtung von E zeitabhängig und oszilliert. Wir sollten also besser sagen ±j. (d) v = νλ , 2,998 × 108 m/s v = , λ 500 × 10−9 m ν = 6,00 × 1014 Hz .

ν=

2 Die Wellenbewegung

56

Wir haben nun die ebenen Wellen unter besonderer Berücksichtigung harmonischer Funktionen untersucht. Diese Wellen sind in zweifacher Hinsicht von Bedeutung: erstens in physikalischer, denn Sinuswellen können mithilfe eines harmonischen Oszillators leicht erzeugt werden, und zweitens in formaler, denn jede dreidimensionale Welle lässt sich als Überlagerung ebener Wellen mit verschiedenen, definierten Amplituden und Ausbreitungsrichtungen formulieren.

Ein einzelner kollimierter Laserpuls, der über die Oberfläche eines Lineals streicht. Der ultrakurze Lichtblitz entspricht einem Abschnitt einer ebenen Welle, der nur 300 × 10−15 s andauerte und lediglich einen Bruchteil eines Millimeters lang war. (Mit frdl. Genehmigung von J. Valdmanis und N. H. Abramson.)

Es fällt nicht schwer, sich eine Reihe ebener Wellen (wie in Abb. 2.22) vorzustellen, deren Auslenkungen sich nicht harmonisch verhalten (siehe Foto). Im nächsten Abschnitt wird gezeigt, dass eine harmonische ebene Welle tatsächlich ein Spezialfall allgemeinerer ebener Wellen ist. Mathematisch erstreckt sich eine ebene Welle in alle Richtungen bis nach unendlich, was physikalisch natürlich nicht sein kann. Eine reale „ebene Welle“ ist etwas Endliches, das – egal wie groß es ist – einer mathematischen Ebene nur ähnelt. Da Linsen, Spiegel und Laserstrahlen allesamt endlich sind, ist diese Ähnlichkeit gewöhnlich gut genug. Beispiel 2.7 Eine ebene elektromagnetische Welle wird durch ihr elektrisches Feld E beschrieben. Sie hat die Amplitude E0 , die Kreisfrequenz ω, die Wellenlänge λ und bewegt sich mit der Geschwindigkeit c nach außen in Richtung des EinheitsPropagationsvektors √ ˆ = (4ˆi + 2ˆj)/ 20 k ˆ Schreiben Sie einen (nicht zu verwechseln mit dem Einheits-Basisvektor k). Ausdruck für E, den Betrag des elektrischen Feldes, auf. Lösung Wir suchen eine Gleichung der Form E(x, y, z, t) = E0 eik·(r−ωt) .

2.8 Die dreidimensionale Wellengleichung

57

Hierbei ist k · r = 2π/λ k · r, und wenn wir den gegebenen Wellenvektor einsetzen, erhalten wir π 2π ˆ = √ (4x + 2y) . k · r = √ (4ˆi + 2ˆj) · (xˆi + yˆj + z k) λ 20 λ 5 Folglich ist  i

E = E0 e

2.8

π √ λ 5

 (4x+2y)−ωt

.

Die dreidimensionale Wellengleichung

Die ebene Welle – ob harmonisch oder nicht – ist die einzige dreidimensionale Welle, die sich im Raum fortpflanzt, ohne ihr Profil zu ändern. Wellen generell als Störung mit unverändertem Profil aufzufassen, ist daher offensichtlich nicht korrekt. Alternativ kann man eine Welle als eine Lösung einer Wellengleichung definieren. Was wir nun brauchen, ist eine dreidimensionale Wellengleichung. Diese zu finden, sollte nicht schwer sein – wir müssen lediglich die bereits bekannte eindimensionale Form, Gleichung (2.11), verallgemeinern. In der dreidimensionalen Gleichung (in kartesischen Koordinaten) sollten die Ortsvariablen x, y und z symmetrisch erscheinen2 , was wir bei der folgenden Herleitung im Auge behalten müssen. Die durch Gleichung (2.52) gegebene Wellenfunktion ψ(x, y, z, t) ist eine spezielle Lösung der gesuchten Differentialgleichung. In Analogie zur Herleitung von Gleichung (2.11) berechnen wir die folgenden partiellen Ableitungen von Gleichung (2.52): ∂2ψ = −α2 k2 ψ ∂x2

(2.55)

∂2ψ = −β 2 k2 ψ ∂y 2

(2.56)

∂2ψ = −γ 2 k2 ψ ∂z 2

(2.57)

∂2ψ = −ω 2 ψ . ∂t2

(2.58)

und

2

In kartesischen Koordinaten wird keine der drei Achsen bevorzugt. Wir können daher in der Wellengleichung x gegen z, y gegen x und z gegen y austauschen (die Rechtshändigkeit des Systems soll erhalten bleiben), ohne dass sich die Aussage der Gleichung ändert.

2 Die Wellenbewegung

58

Durch Addition der drei Ableitungen nach den Ortsvariablen und unter Verwendung der Beziehung α2 + β 2 + γ 2 = 1 erhalten wir ∂2ψ ∂2ψ ∂2ψ + + = −k2 ψ . ∂x2 ∂y 2 ∂z 2

(2.59)

Wir verbinden dies mit der Ableitung nach der Zeit, Gleichung (2.58), und gelangen unter Beachtung von v = ω/k zur dreidimensionalen Wellengleichung 1 ∂2ψ ∂2ψ ∂2ψ ∂2ψ + + = . ∂x2 ∂y 2 ∂z 2 v 2 ∂t2

(2.60)

Sie sehen, dass x, y und z symmetrisch auftreten; die erhaltene Gleichung sieht exakt so aus, wie man es von einer Verallgemeinerung von Gleichung (2.11) erwarten konnte. Gleichung (2.60) schreibt man häufig verkürzt unter Verwendung des Laplace-Operators ∇2 , ∇2 ≡

∂2 ∂2 ∂2 + + , ∂x2 ∂y 2 ∂z 2

(2.61)

womit sie einfach zu 1 ∂2ψ (2.62) v 2 ∂t2 wird. Nachdem wir nun diese wichtige Gleichung hergeleitet haben, wollen wir kurz überprüfen, wie sich die ebene Welle in dieses Schema einfügt. Eine Funktion der Form ∇2 ψ =

ψ(x, y, z, t) = Aeik(αx+βy+γz∓vt)

(2.63)

ist äquivalent zu Gleichung (2.52) und damit eine Lösung von Gleichung (2.62). Man kann außerdem zeigen (Aufgabe 2.49), dass sowohl ψ(x, y, z, t) = f (αx + βy + γz − vt)

(2.64)

als auch ψ(x, y, z, t) = g(αx + βy + γz + vt)

(2.65)

ebene Wellen als Lösungen der Wellendifferentialgleichung sind. Die Funktionen f und g sind zweimal differenzierbar, ansonsten aber beliebig, und sie müssen mit Sicherheit nicht harmonisch sein. Eine Linearkombination der beiden Lösungen ergibt wieder eine Lösung, die wir in etwas anderer Form aufschreiben können: ψ(r, t) = C1 f (r · k/k − vt) + C2 g(r · k/k + vt) . C1 und C2 sind Konstanten.

(2.66)

2.9 Kugelwellen

59

Zur Beschreibung ebener Wellen sind kartesische Koordinaten besonders gut geeignet. Bei der Lösung physikalischer Probleme kann man die Symmetrie des Systems jedoch häufig besser ausnutzen, wenn man andere Koordinatensysteme wählt.

2.9

Kugelwellen

Wenn Sie einen Stein in ein wassergefülltes Becken werfen, so breiten sich die Oberflächenwellen vom Auftreffpunkt aus kreisförmig in zwei Dimensionen aus. Um dieses Bild auf drei Dimensionen zu erweitern, stellen wir uns eine kleine pulsierende Kugel vor, die von einer Flüssigkeit umgeben ist. Beim Ausdehnen und Zusammenziehen erzeugt die Quelle Druckvariationen, die sich als kugelförmige Wellen nach außen fortpflanzen. Betrachten wir nun eine idealisierte punktförmige Lichtquelle. Sie sendet die Strahlung radial, in alle Richtungen gleichmäßig, aus. Eine solche Quelle nennt man isotrop; die entstehenden Wellenfronten haben auch hier die Form konzentrischer Kugeln, deren Durchmesser bei der Ausbreitung in den umgebenden Raum zunimmt. Die offensichtliche Kugelsymmetrie der Wellenfronten legt nahe, sie mithilfe von Polarkoordinaten zu beschreiben (Abb. 2.26). In dieser Darstellung ist der Laplace-Operator     ∂2 1 ∂ ∂ 1 1 ∂ 2 2 ∂ r + 2 sin θ + 2 2 , (2.67) ∇ ≡ 2 r ∂r ∂r r sin θ ∂θ ∂θ r sin θ ∂φ2 wobei r, θ und φ definiert sind durch x = r sin θ cos φ,

y = r sin θ sin φ,

z = r cos θ .

z

r cos θ θ φ

θ in rs

r sin θ cos φ

r

P(r, θ, φ) r sin θ sin φ y

x

Abb. 2.26: Kugelkoordinaten.

2 Die Wellenbewegung

60

Wir erinnern uns, dass wir Kugelwellen beschreiben wollen. Dies sind sphärisch symmetrische Gebilde, die nicht von θ und φ abhängen, d. h., für sie gilt ψ(r) = ψ (r, θ, φ) = ψ (r) . Die Anwendung des Laplace-Operators auf ψ(r) liefert dann einfach   1 ∂ 2 2 ∂ψ r . ∇ ψ(r) = 2 r ∂r ∂r

(2.68)

Dieses Ergebnis können wir auch erhalten, ohne mit der Darstellung (2.67) für den Laplace-Operator vertraut zu sein. Wir beginnen mit der kartesischen Form des Laplace-Operators, Gleichung (2.61), lassen diesen auf die kugelsymmetrische Wellenfunktion ψ(r) wirken und formen dann jeden Term in Polarkoordinaten um. Wenn wir nur die Abhängigkeit von x berücksichtigen, erhalten wir ∂ψ ∂r ∂ψ = ∂x ∂r ∂x und ∂2ψ ∂2ψ = ∂x2 ∂r 2



∂r ∂x

2

+

∂ψ ∂ 2 r ∂r ∂x2

wegen ψ(r) = ψ(r) . Mit x2 + y 2 + z 2 = r 2 kommen wir zu x ∂r = , ∂x r

∂2r ∂ 1 ∂ (x) + x = 2 ∂x r ∂x ∂x

und x2 ∂ 2 ψ 1 ∂2ψ = + ∂x2 r 2 ∂r 2 r

    1 1 x2 = 1− 2 r r r

  x2 ∂ψ 1− 2 . r ∂r

Nach ∂ 2 ψ/∂x2 bilden wir nun ∂ 2 ψ/∂y 2 und ∂ 2 ψ/∂z 2 . Die Addition der Resultate führt dann zu ∇2 ψ(r) =

∂ 2 ψ 2 ∂ψ , + ∂r 2 r ∂r

2.9 Kugelwellen

61

was gerade Gleichung (2.68) entspricht. In etwas anderer Form ausgedrückt lautet das Ergebnis 1 ∂2 (rψ) . r ∂r 2 Die Wellengleichung können wir dann wie folgt formulieren: ∇2 ψ =

1 ∂2 1 ∂2ψ (rψ) = . r ∂r 2 v 2 ∂t2 Die Multiplikation beider Seiten mit r liefert

(2.69)

(2.70)

1 ∂2 ∂2 (rψ) = (rψ) . (2.71) ∂r 2 v 2 ∂t2 Man erkennt leicht, dass es sich dabei gerade um die eindimensionale Wellengleichung (2.11) handelt, wobei r die Ortsvariable ist und das Produkt (rψ) die Wellenfunktion. Die Lösung von Gleichung (2.71) ist dann einfach rψ (r, t) = f (r − vt) oder

f (r − vt) . (2.72) r Hierbei handelt es sich um eine Kugelwelle, die sich von der Quelle aus mit der konstanten Geschwindigkeit v radial nach außen hin fortpflanzt und deren Form, beschrieben durch die Funktion f , beliebig ist. Eine andere Lösung ist gegeben durch ψ (r, t) =

ψ (r, t) =

g (r + vt) . r

In diesem Fall zieht sich die Welle zum Ursprung hin zusammen.3 Dass dieser Ausdruck für r = 0 unendlich wird, ist von geringer praktischer Bedeutung. Ein Spezialfall der allgemeinen Lösung f (r − vt) g (r + vt) + C2 r r ist die harmonische Kugelwelle   A cos k (r ∓ vt) ψ (r, t) = r ψ (r, t) = C1

(2.73)

(2.74)

oder ψ (r, t) = 3

A ik(r∓vt) e r

(2.75)

Wenn die Welle nicht kugelsymmetrisch ist, sind die Lösungen komplizierter; siehe dazu C. A. Coulson, Wellen, Kapitel 1.

2 Die Wellenbewegung

62

mit der Konstante A als so genannter Quellstärke. Dieser Ausdruck steht zu einem beliebigen festen Zeitpunkt für einen Satz konzentrischer Kugeln, die den gesamten Raum ausfüllen. Jede Wellenfront oder Fläche konstanter Phase ist durch kr = konstant gegeben. Die Amplitude jeder Kugelwelle ist eine Funktion von r, wobei r −1 die Dämpfung beschreibt. Im Gegensatz zur ebenen Welle verändert die Kugelwelle bei der Ausbreitung und Entfernung vom Ursprung ihr Profil, weil ihre Amplitude abnimmt.4 Abbildung 2.27 veranschaulicht diese Zusammenhänge grafisch: Dargestellt ist eine „Mehrfachaufnahme“ eines kugelförmigen Pulses zu vier verschiedenen Zeitpunkten. Der Puls hat dieselbe räumliche Ausdehnung in jedem Punkt entlang jedes Radius r; das bedeutet, die Impulsbreite entlang der r-Achse ist konstant. In Abbildung 2.28 wurde versucht, die dem Diagramm in der vorhergehenden Abbildung entsprechende Kugelwelle in ihrer tatsächlichen Form zu zeigen. Man sieht die Hälfte des kugelförmigen Pulses zu zwei verschiedenen Zeitpunkten während der Ausbreitung der Welle nach außen. Diese Resultate hängen, wie wir wissen, nicht von der Richtung von r ab, da die Welle kugelsymmetrisch ist. Anstelle eines Pulses wie in den Abbildungen 2.27 und 2.28 hätten wir auch eine harmonische Welle zeichnen können. Die sinusförmige Auslenkung wäre in diesem Fall durch die Kurven ψ = A/r

und

ψ = −A/r

begrenzt. ψ(r, t) A/r A

t1 t2 t3

0

l

t4

v

r

Abb. 2.27: „Vierfach belichtetes Foto“ eines kugelförmigen Pulses.

Die auslaufende Kugelwelle, die von einer punktförmigen Quelle ausgeht, und die einlaufende Welle, die sich in einem Punkt zusammenzieht, sind natürlich Idealisierungen. In der Realität sind Lichtwellen nur annähernd sphärisch und ebenso nur annähernd eben. Der Radius einer Kugelwellenfront, die sich nach außen ausbreitet, nimmt zu. In genügend großer Entfernung von der Quelle lässt sich ein kleiner Ausschnitt aus der Wellenfront näherungsweise wie ein Teil einer ebenen Welle behandeln (Abb. 2.29). 4

Dieser Dämpfungsfaktor folgt direkt aus der Energieerhaltung. In Kapitel 3 werden wir eine Anwendung dieser Zusammenhänge speziell auf die elektromagnetische Strahlung kennen lernen.

2.10 Zylinderwellen

63

ψ

r

r

Abb. 2.28: Fronten einer Kugelwelle.

Abb. 2.29: Die Fronten einer Kugelwelle werden mit zunehmender Entfernung von der Quelle flacher.

2.10 Zylinderwellen Wir wollen nun kurz eine andere idealisierte Wellenform untersuchen – den unendlichen Kreiszylinder. Die exakte mathematische Behandlung dieses Falls ist zu kompliziert, um sie hier im Einzelnen wiederzugeben. Das Vorgehen soll deshalb nur umrissen werden. Die Anwendung des Laplace-Operators auf ψ in Zylinderkoordinaten (Abb. 2.30) liefert   ∂ψ 1 ∂2ψ ∂2ψ 1 ∂ 2 r + 2 2 + (2.76) ∇ ψ= r ∂r ∂r r ∂θ ∂z 2 mit x = r cos θ,

y = r sin θ

und

z = z.

Der einfache Fall der zylindrischen Symmetrie verlangt ψ (r) = ψ (r, θ, z) = ψ (r) . Die Unabhängigkeit von θ bedeutet, dass eine senkrecht auf der z-Achse stehende Ebene die Wellenfront in einem Kreis schneidet, dessen r bei verschiedenen Werten von z variieren darf. Durch die Unabhängigkeit von z wird die Wellenfront zusätzlich

2 Die Wellenbewegung

64 z

P (r, θ, z)

z

r cos θ θ

r

r sin θ y

Abb. 2.30: Zylinderkoordinaten.

x

beschränkt, und zwar auf einen Kreiszylinder, dessen Zentrum auf der z-Achse liegt und dessen Länge unendlich ist. Die Wellengleichung wird damit zu   ∂ψ 1 ∂2ψ 1 ∂ r = 2 2 . (2.77) r ∂r ∂r v ∂t Nach etlichen Umformungen, durch die man die Zeitabhängigkeit separiert, wird Gleichung (2.77) zur so genannten Besselgleichung. Deren Lösungen nähern sich für große Werte von r asymptotisch den einfachen trigonometrischen Formen an. Ist r hinreichend groß, so wird A ψ (r, t) ≈ √ eik(r∓vt) r und A ψ (r, t) ≈ √ cos k (r ∓ vt) . r

(2.78)

Dies entspricht einer Schar koaxialer Zylinder, die den gesamten Raum ausfüllen und von einer unbegrenzten Linienquelle ausgehen oder auf eine solche hinlaufen. Lösungen, die beliebige Funktionen enthalten, wie sie sowohl bei Kugelwellen (Gl. 2.73) als auch bei ebenen Wellen (Gl. 2.66) existieren, gibt es hier nicht. Wenn eine ebene Welle auf die Rückseite eines planen, undurchsichtigen Schirms trifft, der einen langen, dünnen Spalt aufweist, wird auf der Vorderseite des Schirms eine Zylinderwelle emittiert (Abb. 2.31). Diesen Effekt machte man sich verbreitet zur Erzeugung zylindrischer Lichtwellen zunutze (siehe Abschn. 9.3, Abb. 9.11).

2.11 Verdrilltes Licht

65

Abb. 2.31: Zylinderwellen, die an einem langen, schmalen Spalt erzeugt werden.

2.11 Verdrilltes Licht Seit den frühen 1990er-Jahren ist es möglich, beeindruckende spiralförmige Lichtstrahlen zu erzeugen. Die mathematischen Ausdrücke für solche Wellen sind zu kompliziert, um sie hier auszuarbeiten. Jedenfalls haben sie, wenn sie wie in Gleichung (2.52) in komplexer Form aufgeschrieben werden, einen Phasenterm exp(−iφ). Die Größe  ist eine ganze Zahl, und je größer ihr Wert ist, umso komplexer ist die Welle. Wir stellen uns wieder einen zylindrischen Strahl als einen Strom von sinusförmigen Elementarwellen vor, ähnlich wie in Abbildung 2.23. Anstatt eine Ebene zu bilden, windet sich die Fläche konstanter Phase nun aber wie ein Korkenzieher. Im einfachsten Fall (φ = ±1) folgt die Wellenfront einer einzelnen stetigen Spirale, die sich entweder rechtshändig oder linkshändig um die zentrale Propagationsachse windet. Diese Strahlen haben das, was man eine azimutale Phasenabhängigkeit nennt. Wenn wir entlang der zentralen Achse zum Ursprung blicken, ändert sich die Phase mit dem Winkel, ähnlich wie sich auf dem Ziffernblatt einer Uhr der Winkel zwischen der 126-Linie und dem Minutenzeiger ändert. Wenn eine Elementarwelle ein Maximum bei 12 hat wie in Abbildung 2.32, kann weiter unten auf der Achse bei 6 ein Minimum auftreten. Wenn wir uns das Bild genau anschauen und von 12 nach 1, von dort nach 2, 3 usw. gehen, dann sehen wir, dass die Elementarwellen voranschreiten. Die sinusförmigen Elementarwellen (die alle die Wellenlänge λ haben) sind weiterhin korreliert und alle ihre Maxima liegen auf einer spiralförmigen Linie. Wir nehmen nun an, dass die Durchstoßpunkte der Elementarwellen durch die Scheibe nicht mehr auf einem Kreis liegen, sondern die Scheibe ausfüllen; die Spirallinie konstanter Phase fährt eine gewundene Fläche ab, die wie eine langgezogene, flache Sprungfeder aussieht (eine Form, die zum Beispiel bei der archimedischen Schraube oder auch bei Spielzeugspiralen vorkommt). Diese Fläche konstanter Phase ist eine Wellenfront. Erweitern wir nun gedanklich Abbildung 2.32 zu einem Strahl, wobei wir übersehen wollen, dass ein realer Strahl sich bei seinem Voranschreiten verbreitern würde. Abbildung 2.33 zeigt eine Reihe von Elementarwellen, die räumlich gegeneinander so versetzt sind, dass ihre Maxima jeweils auf der Wellenfront liegen. Diese Wel-

66

2 Die Wellenbewegung

Abb. 2.32: Eine Gruppe von Elementarwellen ist exakt so angeordnet, dass ihre Phasen spiralförmig um die Strahlachse verlaufen. Die Bedingung der Phasenkonstanz ist auf einer Familie von Helices erfüllt, von denen eine als gestrichelte Linie eingezeichnet ist.

lenfront bildet eine voranschreitende Wendelfläche oder Helikoide, die sich auf der Länge λ einmal um die Achse windet, während sie sich mit Lichtgeschwindigkeit vorwärts bewegt. Diese spezielle helikoidale Wellenfront entspricht gerade einem Maximum (Peaks der Elementarwellen); sie könnte aber auch jeden beliebigen anderen Wert haben. Da der Strahl monochromatisch ist, gibt es eine verschachtelte, sich umschlingende Abfolge von Wellenfronten, von denen jede eine etwas andere Phase und Auslenkung hat, die sich von einer zur nächsten sinusförmigen Elementarwelle ändert.

Abb. 2.33: Verdrilltes Licht. Der leere Bereich in der Mitte der Helikoide bildet einen Schaft, der frei von Licht ist. Er entspricht einer Phasensingularität, um die herum eine Rotationsbewegung erfolgt. Die Struktur wird auch optischer Vortex genannt.

Betrachten wir noch einmal Abbildung 2.32 und stellen wir uns vor, dass alle Elementarwellen radial in Richtung Zentrum gerutscht sind, ohne dass sie sich sonst irgendwie verändert hätten. Entlang der zentralen Achse gäbe es dann ein Durcheinander an

Aufgaben

67

Wellen mit allen möglichen Phasen, die sich gegenseitig überlappen, mit dem Effekt, dass die Phase der zusammengesetzten Störung unbestimmt wäre. Die zentrale Achse entspricht also einer Phasensingularität. An jedem axialen Punkt gibt es zu jeder Elementarwelle, die einen positiven Beitrag leistet, eine andere Elementarwelle mit einem gleich großen negativen Beitrag. In jedem Fall muss das optische Feld entlang der zentralen Achse null sein, was bedeutet, dass die zentrale Achse und ihre unmittelbare Umgebung einem Bereich mit Intensität null entspricht (d. h., es gibt dort kein Licht). In der Mitte der Helikoide liegt also ein schwarzer Kern, der auch optischer Vortex genannt wird und um den sich das „verdrillte Licht“ wie ein Tornado windet. Auf einem Schirm erzeugt der Strahl einen hellen Ring, der von einem dunklen kreisförmigen Vortex umgeben ist. In Kapitel 8 werden wir zirkular polarisiertes Licht untersuchen, und obwohl dieses dem hier besprochenen verdrillten Licht zu ähneln scheint, handelt es sich um zwei völlig unterschiedliche Phänomene. Zum einen ist polarisiertes Licht mit dem Spin verbunden, während verdrilltes Licht ein Bahndrehmoment hat. Davon abgesehen muss verdrilltes Licht nicht einmal polarisiert sein. Wir werden auf diesen Punkt noch einmal zurückkommen, wenn wir uns mit dem Photonenspin befassen.

Aufgaben Lösungen zu den Aufgaben ohne ∗ finden Sie am Ende des Buches. 2.1* Zeigen Sie, dass die Funktion ψ(z, t) = (z + vt)2 eine nichttriviale Lösung der Wellengleichung ist. In welche Richtung propagiert die Welle? 2.2* Zeigen Sie, dass die Funktion ψ(y, t) = (y − 4t)2 eine Lösung der Wellengleichung ist. In welche Richtung propagiert die Welle? 2.3* Gegeben ist die Funktion ψ(z, t) =

A , (z − vt)2 + 1

wobei A eine Konstante ist. Zeigen Sie, dass dies eine Lösung der Wellengleichung ist. Bestimmen Sie die Geschwindigkeit der Welle sowie die Richtung ihrer Propagation. 2.4* Ein Argonionenlaser erzeugt typischerweise Strahlen hoher Leistung im grünen oder blauen Bereich des sichtbaren Spektrums. Bestimmen Sie die Frequenz eines solchen 514,5-nm-Strahls. 2.5* Zeigen Sie, dass die Funktion ψ(y, t) = A e−a(by−ct)

2

68

2 Die Wellenbewegung mit den Konstanten A, a, b und c eine Lösung der Wellengleichung ist. Die betrachtete Funktion wird Gauß-Funktion oder auch Glockenkurve genannt. Wie groß ist ihre Geschwindigkeit und in welche Richtung propagiert sie?

2.6

Wie viele „gelbe“ Lichtwellenlängen (λ = 580 nm) passen in einen Raum, dessen Breite der Dicke eines Blattes Papier (0,008 cm) entspricht? Welche Breite beansprucht dieselbe Anzahl von Mikrowellen (ν = 1010 Hz = 10 GHz, v = 3 × 108 m/s)?

2.7* Die Lichtgeschwindigkeit im Vakuum beträgt rund 3 × 108 m/s. Wie groß ist die Wellenlänge von rotem Licht mit einer Frequenz von 5 × 1014 Hz? Vergleichen Sie das Ergebnis mit der Wellenlänge einer elektromagnetischen Welle von 60 Hz. 2.8* In Kristallen kann man Ultraschallwellen mit Wellenlängen erzeugen, die mit denen des Lichts vergleichbar sind (5 × 10−5 cm), deren Frequenzen jedoch niedriger sind (6 × 108 Hz). Wie groß ist die Geschwindigkeit einer solchen Welle? 2.9* Ein Junge in einem Boot beobachtet Wellen auf der Wasseroberfläche. Sie erscheinen ihm wie eine endlose Folge von Wellenbergen, die in einem Abstand von jeweils einer halben Sekunde an seinem Boot vorüberziehen. Ein Wellenberg benötigt 1,5 s, um das 4,5 m lange Boot zu passieren. Berechnen Sie Frequenz, Schwingungsdauer und Wellenlänge der Welle. 2.10* Ein vibrierender Hammer trifft auf das Ende eines Stabes. Dabei entsteht eine periodische Druckwelle, die den 4,3 m langen Stab mit einer Geschwindigkeit von 3,5 km/s entlangläuft. Mit welcher Frequenz vibriert der Hammer? 2.11 Bei der Hochzeit von zwei Sporttauchern wird eine Violine im Swimmingpool versenkt. Gegeben ist die Geschwindigkeit von Druckwellen in reinem Wasser (1498 m/s). Wie groß ist die Wellenlänge, die auf dieser Violine dem Kammerton A (440 Hz) entspricht? 2.12* Ein Wellenpuls bewegt sich auf einer Saite in 2 s um 10 m fort. Welche Frequenz hat eine Störung mit einer Wellenlänge von 0,5 m, die auf dieser Saite erzeugt wird? 2.13* Zeigen Sie, dass für eine periodische Welle gilt ω = (2π/λ) v. 2.14* Fertigen Sie eine Tabelle an, deren Spalten mit Werten von θ zwischen −π/2 bis 2π in Intervallen von π/4 überschrieben sind. Tragen Sie in jede Spalte den zugehörigen Wert von sin θ ein, darunter den Wert von cos θ, darunter nacheinander die Werte von sin (θ − π/4), sin (θ − π/2), sin (θ − 3π/4) und sin (θ + π/2). Zeichnen Sie alle diese Funktionen in ein Diagramm und führen Sie sich den Effekt der Phasenverschiebung vor Augen. Die Funktion cos θ eilt der Funktion sin θ voraus; können Sie einen solchen Zusammenhang auch für die Funktionen sin θ und sin (θ − π/2) feststellen? 2.15* Fertigen Sie eine Tabelle an, deren Spalten mit Werten von kx zwischen x = −λ/2 und x = +λ in Intervallen von λ/4 überschrieben sind (natürlich ist k = 2π/λ). Tragen Sie in jede Spalte nacheinander die zugehörigen Werte von cos (kx − π/4) und cos (kx + 3π/4) ein. Zeichnen Sie dann Diagramme der Funktionen 15 cos (kx − π/4) und 25 cos (kx + 3π/4). 2.16* Fertigen Sie eine Tabelle an, deren Spalten mit Werten von ωt zwischen t = −τ /2 und t = +τ in Intervallen von τ /4 überschrieben sind (natürlich ist ω = 2π/τ ). Tragen Sie in jede Spalte die entsprechenden Werte von sin (ωt + π/4) und sin (π/4 − ωt) ein und zeichnen Sie beide Funktionen.

Aufgaben

69

2.17* Das Profil einer harmonischen Transversalwelle, die sich mit einer Geschwindigkeit von 1,2 m/s auf einem Seil fortpflanzt, ist gegeben durch   y = (0,02 m) sin 157 m−1 x . Bestimmen Sie Amplitude, Wellenlänge, Frequenz und Schwingungsdauer. 2.18* In Abbildung A.2.18 sehen Sie das Profil (t = 0) einer transversalen Seilwelle, die sich mit einer Geschwindigkeit von 20 m/s in positiver x-Richtung bewegt. (a) Berechnen Sie die Wellenlänge der Welle. (b) Berechnen Sie die Frequenz. (c) Schreiben Sie die Wellenfunktion für die Störung auf. (d) In jedem festen Punkt der x-Achse schwingt das Seil beim Vorbeilaufen der Welle als Funktion der Zeit. Zeichnen Sie einen Graphen von ψ als Funktion von t, der diese Oszillation im Punkt x = 0 zeigt. ψ(x, 0s) (m) 0.020

0.010

0

2.0

4.0

6.0

x (m)

−0.010 −0.020

Abb. A.2.18

2.19* Abbildung A.2.19 zeigt das Profil (t = 0) einer transversalen Seilwelle, die sich mit einer Geschwindigkeit von 100 cm/s in positiver z-Richtung bewegt. (a) Wie groß ist die Wellenlänge dieser Welle? (b) Betrachten Sie die zeitabhängige Schwingung eines festen Punktes auf der z-Achse beim Vorbeilaufen der Welle. Zeichnen Sie einen Graphen von ψ als Funktion von t, der diese Oszillation bei x = 0 zeigt. (c) Geben Sie die Frequenz der Welle an. ψ(z, 0s) (cm) 20.0

10.0 z (cm) −20.0 −10.0

0

10.0

20.0

30.0

40.0

−10.0 −20.0

Abb. A.2.19

2 Die Wellenbewegung

70

2.20* Eine Transversalwelle auf einem Seil pflanzt sich mit einer Geschwindigkeit von 40,0 cm/s in negativer y-Richtung fort. In Abbildung A.2.20 sehen Sie den Graphen von ψ als Funktion von t, der die Oszillation des Seils im Punkt y = 0 beschreibt. (a) Geben Sie die Periode der Welle an. (b) Wie groß ist die Frequenz der Welle? (c) Wie groß ist die Wellenlänge? (d) Skizzieren Sie das Profil der Welle (ψ als Funktion von y). ψ(0m, t) (cm) 2.0 1.0 t (s) −0.10

0

0.10

0.20

0.30

−1.0 −2.0

Abb. A.2.20

2.21 Gegeben sind die Wellenfunktionen ψ1 = 4 sin 2π (0,2x − 3t) und ψ2 =

sin (7x + 3,5t) 2,5

(Zeit in Sekunden, x in Metern). Bestimmen Sie jeweils (a) die Frequenz, (b) die Wellenlänge, (c) die Schwingungsdauer, (d) die Amplitude, (e) die Phasengeschwindigkeit und (f) die Richtung der Propagation. 2.22* Die Wellenfunktion einer Transversalwelle auf einem Seil sei gegeben durch ψ(x, t) = (30,0 cm) cos [(6,28 rad /m) x − (20,0 rad /s) t] . Berechnen Sie (a) die Frequenz, (b) die Wellenlänge, (c) die Periode, (d) die Amplitude, (e) die Phasengeschwindigkeit und (f) die Ausbreitungsrichtung dieser Welle. 2.23* Eine propagierende Welle ist in SI-Einheiten durch den Ausdruck   y 14 ψ(y, t) = 10 sin 2π(5,0 × 10 ) +t 3,0 × 108 gegeben. Bestimmen Sie für diese Welle (a) die Amplitude, (b) die Frequenz, (c) die Wellenlänge, (d) die Geschwindigkeit, (e) die Periode und (f) die Richtung der Propagation. 2.24* Zeigen Sie, dass ψ (x, t) = A sin k (x − vt) eine Lösung der Wellengleichung ist.

[2.13]

Aufgaben

71

2.25* Zeigen Sie, dass ψ(x, t) = A cos(kx − ωt) eine Lösung der Wellengleichung ist. 2.26* Beweisen Sie: ψ(x, t) = A cos(kx − ωt − π/2) ist äquivalent zu ψ(x, t) = A sin(kx − ωt) . 2.27 Zeigen Sie: Wenn die Auslenkung des Seils in Abbildung 2.12 gegeben ist durch y (x, t) = A sin [kx − ωt + ε] , so muss sich die Hand bei der Erzeugung dieser Welle vertikal in einfacher harmonischer Bewegung befinden. 2.28 Schreiben Sie den Ausdruck für eine harmonische Welle mit einer Amplitude von 103 V/m, einer Schwingungsdauer von 2,2 × 10−15 s und einer Geschwindigkeit von 3 × 108 m/s auf. Die Welle breitet sich in negativer x-Richtung aus und hat bei t = 0 und x = 0 einen Wert von 103 V/m. 2.29 Ein Puls sei beschrieben durch seine Auslenkung bei t = 0 von y (x, t) |t=0 =

C . 2 + x2

C ist eine Konstante. Zeichnen Sie das Profil der Welle! Schreiben Sie einen Ausdruck für die Welle als Funktion der Zeit t auf; die Geschwindigkeit soll v (in negativer xRichtung) sein. Skizzieren Sie das Profil bei t = 2 s für v = 1 m/s. 2.30* Bestimmen Sie den Betrag der Wellenfunktion ψ (z, t) = A cos [k (z + vt) + π] im Punkt z = 0 für t = τ /2 und für t = 3τ /4. 2.31 Stellt die folgende Funktion eine Welle dar? ψ (y, t) = (y − vt) A (A ist eine Konstante). Begründen Sie Ihre Entscheidung. 2.32* Berechnen Sie mithilfe von Gleichung (2.33) die Geschwindigkeit einer Welle, die (in SI-Einheiten) gegeben ist durch   ψ (y, t) = A cos π 3 × 106 y + 9 × 1014 t . 2.33* Die Auslenkung einer Welle auf einem Seil ist gegeben durch   z t ψ(z, t) = (0,020 m) sin 2π + . λ τ Die Welle bewegt sich mit einer Geschwindigkeit von 2,00 m/s und hat eine Periode von 1/4 s. Bestimmen Sie die Auslenkung des Seils in 1,50 m Entfernung vom Ursprung zur Zeit t = 2,2 s.

2 Die Wellenbewegung

72

2.34 Leiten Sie, ausgehend von dem folgenden Theorem, Gleichung (2.34) ab: Wenn z = f (x, y) und x = g (t), y = h (t), so ist dz ∂z dx ∂z dy = + . dt ∂x dt ∂y dt 2.35 Zeigen Sie unter Verwendung des Ergebnisses der vorherigen Aufgabe, dass man die Geschwindigkeit einer harmonischen Welle mit einer Phase ϕ (x, t) = k (x − vt) bestimmen kann, indem man dϕ/dt = 0 setzt. Wenden Sie diese Methode auf Aufgabe 2.32 an, um die Geschwindigkeit der dort angegebenen Welle zu bestimmen. 2

2.36* Eine gaußsche Welle hat das Profil ψ (x, t) = Ae−a(bx+ct) . Berechnen Sie unter Ausnutzung von ψ (x, t) = f (x ∓ vt) die Geschwindigkeit dieser Welle. Überprüfen Sie Ihre Antwort mithilfe von Gleichung (2.34). 2.37 Bestimmen Sie einen Ausdruck für das Profil einer harmonischen Welle, die sich in z-Richtung fortpflanzt; der Betrag der Welle ist bei z = −λ/12 gleich 0,866, bei z = +λ/6 gleich 0,5 und bei z = λ/4 gleich 0. 2.38 Welche der folgenden Gleichungen beschreiben wandernde Wellen? Wie ist die jeweilige Geschwindigkeit der Welle? a, b und c sind positive Konstanten. (a) ψ(z, t) = (az − bt)2 (b) ψ(x, t) = (ax + bt + c)2 (c) ψ(x, t) = 1/(ax2 + b) 2.39* Welche der folgenden Gleichungen beschreiben wandernde Wellen? Zeichnen Sie in diesen Fällen das Profil und bestimmen Sie die Geschwindigkeit sowie die Bewegungsrichtung. (a) ψ(y, t) = e−(a

2 2

y +b2 t2 −2abty)

(b) ψ(z, t) = A sin(az 2 − bt2 ) (c) ψ(x, t) = A sin 2π( xa + bt )2 (d) ψ(x, t) = A cos2 2π(t − x) 2.40 Gegeben sei die fortschreitende Welle 

√ ψ (x, t) = 5,0 exp −ax2 − bt2 − 2 ab xt . Bestimmen Sie die Propagationsrichtung der Welle. Berechnen Sie einige Werte von ψ und skizzieren Sie die Welle bei t = 0 mit a = 25 m−2 und b = 9,0 s−2 . Wie groß ist die Geschwindigkeit dieser Welle? 2.41* Eine Schallwelle mit einer Frequenz von 1,1 kHz breitet sich mit einer Geschwindigkeit von 330 m/s aus. Berechnen Sie die Phasendifferenz (in rad) zwischen zwei beliebigen, 10 cm voneinander entfernten Punkten dieser Welle.

Aufgaben

73

2.42 Eine Lichtwelle habe eine Phasengeschwindigkeit von 3 × 108 m/s und eine Frequenz von 6 × 1014 Hz. Wie groß ist der kürzeste Abstand zwischen zwei Punkten längs dieser Welle, deren Phasendifferenz 30◦ beträgt? Welche Phasenverschiebung entsteht in einem bestimmten Punkt während einer Zeitspanne von 10−6 s, und wie viele Wellenberge sind in dieser Zeit vorübergelaufen? 2.43 Schreiben Sie einen Ausdruck für die Welle in Abbildung A.2.43 auf. Bestimmen Sie Wellenlänge, Geschwindigkeit, Frequenz und Periode. t=0

ψ(z, t) (Einheit beliebig)

60 40 20 0 −20 −40 −60

z

t = 0.66 × 10−15 s 100

300

500

z (nm)

t = 1.33 × 10−15 s z

Abb. A.2.43 Harmonische Welle.

2.44* Zeigen Sie, indem Sie direkt mit Exponentialausdrücken arbeiten, dass der Betrag von ψ = Aeiωt gleich A ist. Leiten Sie dasselbe Ergebnis mithilfe der eulerschen Formel ab. Beweisen Sie, dass eiα eiβ = ei(α+β) ist. 2.45* Zeigen Sie, dass der Imaginärteil einer komplexen Zahl z durch (z − z ∗ ) /2i gegeben ist. 2.46* Betrachten Sie die komplexen Größen z1 = (x + iy1 ) und z2 = (x + iy2 ) und zeigen Sie, dass Re(z1 + z2 ) = Re(z1 ) + Re(z2 ) . 2.47* Betrachten Sie die komplexen Größen z1 = (x + iy1 ) und z2 = (x + iy2 ) und zeigen Sie, dass Re(z1 ) × Re(z2 ) = Re(z1 × z2 ) .

2 Die Wellenbewegung

74 2.48 Beweisen Sie ausgehend von Gleichung (2.51), dass ψ (x, y, z, t) = Aei[k(αx+βy+γz)∓ωt] und α2 + β 2 + γ 2 = 1

ist. Zeichnen Sie eine Skizze, die alle auftretenden Größen enthält. 2.49* Zeigen Sie, dass die Gleichungen (2.64) und (2.65), die ebene Wellen mit beliebigem Profil beschreiben, Lösungen der dreidimensionalen Wellengleichung sind. 2.50* Das elektrische Feld einer elektromagnetischen Welle ist in SI-Einheiten gegeben durch E = E0 ei(3x−

√ 2y−9,9×108 t)

.

(a) Wie lautet die Kreisfrequenz der Welle? (b) Schreiben Sie einen Ausdruck für k auf. (c) Wie groß ist der Betrag k? (d) Bestimmen Sie die Geschwindigkeit der Welle. 2.51* Gegeben sei die Funktion    ψ(z, t) = A exp − a2 z 2 + b2 t2 + 2abzt mit den Konstanten A, a und b (alle in geeigneten SI-Einheiten). Repräsentiert dieser Ausdruck eine Welle? Wenn ja, wie groß ist ihre Geschwindigkeit und in welche Richtung propagiert sie? 2.52 Die De-Broglie-Hypothese besagt, dass jedem Teilchen eine Wellenlänge zugeordnet werden kann, die durch den Quotienten aus der planckschen Konstante (h = 6,6 × 10−34 J · s) und dem Impuls des Teilchens gegeben ist. Vergleichen Sie die Wellenlänge des sichtbaren Lichts mit der Wellenlänge eines 6 kg schweren Steins, der sich mit einer Geschwindigkeit von 1 m/s bewegt. 2.53 Schreiben Sie in kartesischen Koordinaten einen Ausdruck für eine harmonische Welle mit der Amplitude A und der Frequenz ω auf, die sich in Richtung des Vektors k bewegt; dieser Vektor liegt auf einer Geraden, die durch den Ursprung des Koordinatensystems und den Punkt (4, 2, 1) verläuft. [Hinweis: Bestimmen Sie zunächst k und bilden Sie dann das Skalarprodukt mit r.] 2.54* Schreiben Sie in kartesischen Koordinaten einen Ausdruck für eine harmonische Welle mit der Amplitude A und der Frequenz ω auf, die sich in positiver x-Richtung bewegt. 2.55 Zeigen Sie, dass ψ (k · r, t) eine ebene Welle sein kann, wobei k senkrecht auf der Wellenfront steht. [Hinweis: r1 und r2 sollen Ortsvektoren zu zwei beliebigen Punkten auf der Ebene sein; zeigen Sie hierfür ψ (r1 , t) = ψ (r2 , t).] 2.56* Zeigen Sie explizit, dass die Funktion ψ(r, t) = A exp [i(k · r + ωt + ε)] für v = ω/k eine Welle beschreibt.

Aufgaben

75

2.57* Fertigen Sie eine Tabelle an, deren Spalten mit Werten von θ zwischen −π/2 und 2π in Intervallen von π/4 überschrieben sind. Tragen Sie in jede Spalte den zugehörigen Wert von sin θ, darunter den Wert von 2 sin θ ein. Addieren Sie die beiden Werte in jeder Spalte, sodass sich die jeweiligen Werte für die Funktion sin θ + 2 sin θ ergeben. Zeichnen Sie alle drei Funktionen in ein Diagramm und schauen Sie sich die relativen Amplituden und Phasen an. 2.58* Fertigen Sie eine Tabelle an, deren Spalten mit Werten von θ zwischen −π/2 und 2π in Intervallen von π/4 überschrieben sind. Tragen Sie in jede Spalte untereinander die zugehörigen Werte von sin θ und sin (θ − π/2) ein. Addieren Sie die Werte in jeder Spalte, sodass sich die Werte für die Funktion sin θ + sin (θ − π/2) ergeben. Zeichnen Sie alle drei Funktionen in ein Diagramm und schauen Sie sich die relativen Amplituden und Phasen an. 2.59* Zeichnen Sie analog zum Vorgehen in den beiden vorangegangenen Aufgaben die drei Funktionen (a) sin θ, (b) sin (θ − 3π/4) und (c) sin θ + sin (θ − 3π/4). Vergleichen Sie die Amplitude der Funktion (c) mit den Ergebnissen der Aufgaben 2.57 und 2.58. 2.60* Fertigen Sie eine Tabelle an, deren Spalten mit Werten von kx zwischen x = −λ/2 und x = +λ im Intervall von λ/4 überschrieben sind. Tragen Sie in jede Spalte untereinander die zugehörigen Werte von cos kx und von cos (kx + π) ein. Zeichnen Sie dann die Funktionen cos kx, cos (kx + π) und [cos kx + cos (kx + π)] in ein Diagramm und vergleichen Sie.

3

Theorie des Elektromagnetismus, Photonen und Licht

Die Arbeiten von J. Clerk Maxwell und spätere Entwicklungen seit dem Ausgang des achtzehnten Jahrhunderts bewiesen die elektromagnetische Natur des Lichts. Wie wir noch sehen werden, führt die klassische Elektrodynamik unvermeidlich zum Konzept des kontinuierlichen Energietransports durch elektromagnetische Wellen. Im Gegensatz dazu beschreibt die Quantenelektrodynamik (siehe Abschnitt 3.7), eine modernere Theorie, die elektromagnetische Wechselwirkung und den Energietransport mithilfe masseloser Elementarteilchen, so genannter Photonen. Nicht immer tritt die Quantennatur der Strahlungsenergie in der Praxis in Erscheinung – oft ist sie für die Optik auch nicht von praktischer Bedeutung. In vielen Situationen ist es weder möglich noch erwünscht, mit einer Messanordnung einzelne Lichtquanten zu registrieren. Ist die Wellenlänge des Lichts klein im Vergleich zur Größe eines Messgerätes, so darf man – in erster Näherung – mit der geometrischen Optik arbeiten. Genauer und insbesondere bei Geräten kleinerer Abmessung besser geeignet ist die physikalische Optik (Wellenoptik), bei der die Wellennatur des Lichts als dominierend betrachtet wird. Zum großen Teil kann man diese Theorie aufbauen, ohne exakt erklären zu müssen, um welche Art Welle es sich handelt. Für die klassische physikalische Optik reicht es aus, Licht als elektromagnetische Welle aufzufassen. Licht können wir uns als „dünnste“ Form der Materie vorstellen. Eine der grundlegenden Thesen der Quantenmechanik besagt tatsächlich, dass sowohl Licht als auch Materieteilchen gleichzeitig Eigenschaften von Welle und Teilchen (Welle-TeilchenDualismus) aufweisen. Erwin C. Schrödinger (1887–1961), einer der Begründer der Quantentheorie, formulierte: In den neuen Vorstellungen ist die Unterscheidung [zwischen Welle und Teilchen] verschwunden, da entdeckt wurde, dass alle Teilchen auch Welleneigenschaften besitzen und umgekehrt. Keines der beiden Konzepte muss aufgegeben werden – vielmehr sind beide zu vereinigen. Welcher Aspekt hervortritt, hängt nicht vom physikalischen Objekt ab, sondern von dem Messgerät, mit dem man dieses untersuchen will.1 1

Erwin C. Schrödinger (1887–1991), Science Theory and Man, Dover Publications, New York, 1957.

https://doi.org/10.1515/9783111025599-003

78

3 Theorie des Elektromagnetismus, Photonen und Licht

Die Quantenmechanik ordnet einer Wellengleichung ein Teilchen zu, beispielsweise ein Photon, ein Elektron oder ein Proton. Handelt es sich um materielle Teilchen (wie die beiden Letzteren), so werden die Wellenaspekte durch eine Feldgleichung, die Schrödinger-Gleichung, eingeführt. Die Wellennatur des Lichts wird in Form der klassischen elektromagnetischen Feldgleichungen von Maxwell dargestellt; davon ausgehend lässt sich eine quantenmechanische Behandlung der Photonen und ihrer Wechselwirkung mit Ladungen aufbauen. Die duale Natur des Lichts ist offensichtlich: Einerseits pflanzt sich Licht wie eine Welle im Raum fort, andererseits verhält es sich bei Vorgängen wie Emission oder Absorption wie ein Teilchenstrom. Die elektromagnetische Energie der Strahlung wird nicht kontinuierlich erzeugt und vernichtet, wie es bei klassischen Wellen der Fall ist, sondern in Quanten oder Photonen. Beim Durchgang durch eine Linse, ein Loch oder ein Gitter herrschen jedoch die Welleneigenschaften des Lichts vor. In der makroskopischen Welt ist uns ein solches Verhalten nicht vertraut, da die Wellenlänge eines Objekts umgekehrt proportional zu dessen Impuls ist: Schon einem Sandkorn (das sich kaum bewegt) ist eine so winzige Wellenlänge zugeordnet, dass man sie in keinem denkbaren Experiment beobachten könnte. Das Photon besitzt keine Ruhemasse; einen Lichtstrahl hat man sich daher als Strom einer gewaltigen Anzahl niederenergetischer Photonen vorzustellen. Im Rahmen dieses Modells wirken dichte Photonenströme so, dass sie wohldefinierte klassische Felder erzeugen. Ganz grob können wir dies mit Strömen von Fahrgästen auf einem Bahnhof während der Hauptverkehrszeit vergleichen: Jede einzelne Person verhält sich individuell, als „menschliches Quantum“, aber alle Personen bewegen sich auf ähnlichen Bahnen, da sie ein gemeinsames Ziel ansteuern. Ein weit entfernter, kurzsichtiger Beobachter sieht einen scheinbar kontinuierlichen, ruhigen Strom. Die Bewegung der Fahrgäste in ihrer Gesamtheit ist vorhersagbar; das Verhalten des Individuums dagegen ist, zumindest für den Beobachter, uninteressant. Im Mittel ist die von einer großen Anzahl von Photonen transportierte Energie äquivalent zu der Energie, die von einer klassischen elektromagnetischen Welle übertragen wird. Aus diesem Grunde ist und bleibt die Felddarstellung elektromagnetischer Phänomene so nützlich. Allerdings sollte klar sein, dass die scheinbar kontinuierliche Natur elektromagnetischer Wellen eine Fiktion der makroskopischen Welt ist, ähnlich wie die kontinuierliche Natur gewöhnlicher Materie eine Fiktion ist – es ist bloß nicht ganz so einfach. Wir wollen das Licht also ganz pragmatisch als elektromagnetische Welle betrachten, dabei allerdings nicht vergessen, dass diese Beschreibung in manchen Situationen nicht adäquat ist.

3.1

Die Grundgleichungen des Elektromagnetismus

In diesem Abschnitt wollen wir einige Grundbegriffe besprechen und Ideen entwickeln, die wir für das Verständnis des Lichts als elektromagnetische Welle benötigen. Aus Experimenten wissen wir, dass Ladungen, selbst im Vakuum, miteinander wechselwirken. Erinnern wir uns an den bekannten Versuch zur Elektrostatik, der zeigt, wie

3.1 Die Grundgleichungen des Elektromagnetismus

79

eine Holundermarkkugel die Anwesenheit eines geladenen Stabes „spürt“, ohne diesen zu berühren. Eine mögliche Erklärung wäre, dass jedes geladene Objekt einen Strom unbekannter Teilchen (virtueller Photonen) emittiert (oder absorbiert). Der Austausch dieser Teilchen zwischen den Ladungen ließe sich dann als Wechselwirkung interpretieren. Alternativ, aus klassischer Sicht, können wir uns auch vorstellen, dass jede Ladung von einem so genannten elektrischen Feld umgeben ist. Dann müssen wir nur noch annehmen, dass jede Ladung direkt mit dem umgebenden Feld in Wechselwirkung tritt. Wirkt auf eine Ladung q eine Kraft FE , so ist das elektrische Feld E an der Stelle der Ladung definiert durch FE = qE. Wir beobachten außerdem, dass auf eine bewegte Ladung eine andere Kraft FM wirkt, die proportional zur Geschwindigkeit v der Ladung ist. Dies führt uns zur Definition eines weiteren Feldes, der magnetischen Induktion (dem Magnetfeld) B durch FM = qv × B. Wirken auf eine Ladung gleichzeitig ein elektrisches und ein magnetisches Feld, folgt F = qE + qv × B. Die Einheit von E ist Volt / Meter oder Newton / Coulomb. Die Einheit von B ist Tesla. Wie wir noch sehen werden, erzeugen sowohl elektrische Ladungen als auch zeitlich variierende Magnetfelder elektrische Felder. Magnetfelder werden analog von elektrischen Strömen und zeitlich variierenden elektrischen Feldern erzeugt. Die gegenseitige Abhängigkeit von E und B ist ein zentraler Punkt bei der Beschreibung von Licht.

3.1.1 Das faradaysche Induktionsgesetz „Magnetismus in Elektrizität umwandeln“ – diese kurze Notiz, von Michael Faraday 1822 aufgeschrieben, steht für eine Herausforderung, die Faraday sich selbst stellte, voller Vertrauen auf die Lösbarkeit der Aufgabe. Nach einigen mit anderweitigen Arbeiten ausgefüllten Jahren wandte Faraday sich 1831 dem Problem der elektromagnetischen Induktion wieder zu. Seine erste Versuchsanordnung enthielt zwei auf einen Holzkern gewickelte Spulen (Abb. 3.1 a). Eine davon, die Primärspule, war mit einem Schalter und einer Batterie verbunden, die andere, die Sekundärspule, mit einem Galvanometer. Wenn Faraday den Schalter schloss, beobachtete er einen kurzen (a)

(b) Holzkern Galvanometer

i

B

Sekundärwicklung

Spule

Sekundärwicklung

Primärwicklung

Batterie

Schalter

Primärwicklung

B

Eisenkern

Abb. 3.1: (a) Beginnt in einer der beiden Spulen ein Strom zu fließen, so baut sich ein zeitabhängiges Magnetfeld auf, das einen Strom in der anderen Spule induziert. (b) Primär- und Sekundärspule sind durch einen Eisenkern gekoppelt.

80

3 Theorie des Elektromagnetismus, Photonen und Licht

Ausschlag des Galvanometers in eine Richtung; anschließend stellte sich das Gerät sofort wieder auf null, ungeachtet dessen, dass in der Primärspule nach wie vor ein konstanter Strom floss. Wurde der Schalter wieder geöffnet (und damit der Stromfluss durch die Primärspule unterbrochen), so schlug das Galvanometer erneut kurz aus, diesmal jedoch in die entgegengesetzte Richtung. Um die „magnetische Kraft zu konzentrieren“, wickelte Faraday nun zwei Spulen um gegenüberliegende Abschnitte eines Weicheisenrings (Abb. 3.1 b). Der Effekt war unverkennbar: Ein veränderliches Magnetfeld erzeugt einen Strom. Diese Änderung des Feldes war, wie Faraday feststellen sollte, der für die elektromagnetische Induktion entscheidende Aspekt. Indem er einen Magneten in eine Spule steckte, zeigte Faraday, dass an den Enden der Spule eine Spannung anliegt, die man auch als elektromotorische Kraft (EMK) bezeichnet. (Der Begriff elektromotorische Kraft ist irreführend – schließlich handelt es sich um eine Spannung, nicht um eine Kraft – und wird nur noch selten verwendet. Wir benutzen die Abkürzung EMK und denken dabei an ihre physikalische Bedeutung.) Die Amplitude der EMK hängt davon ab, wie schnell der Magnet bewegt wird: Die induzierte EMK ist eine Funktion der Änderungsrate von B, nicht des Wertes von B selbst. Ein schwacher, aber schnell bewegter Magnet kann eine größere EMK induzieren als ein starker, langsam bewegter.

Abb. 3.2: Die größere Leiterschleife wird von einem größeren zeitabhängigen magnetischen Fluss durchdrungen, zwischen ihren Enden wird eine größere Spannung induziert.

Wir betrachten nun ein veränderliches B-Feld, das durch zwei verschiedene Leiterschleifen hindurchläuft (Abb. 3.2). Dabei wird zwischen den Enden der größeren Schleife (links) eine größere EMK induziert. Mit anderen Worten: Bei veränderlichem Magnetfeld ist die induzierte EMK zur Fläche A der Leiterschleife proportional, die senkrecht zur Änderungsrichtung des Feldes überstrichen wird. Kippt man die Schleife allmählich nach vorn (Abb. 3.3), dann wird die senkrecht zum Feld stehende Fläche A⊥ immer kleiner (A⊥ = A cos θ); bei θ = 90◦ ist die EMK null, weil die überstrichene Fläche der Schleife null ist. Für ΔB/Δt = 0 gilt EMK ∝ A⊥ . Dieser Zusammenhang gilt auch umgekehrt: Ist das Feld konstant, so ist die induzierte EMK proportional zur Änderungsrate der senkrecht zum Feld stehenden Fläche. Wird eine in einem konstanten B-Feld befindliche Spule gebogen, gedreht oder auch nur zusammengedrückt, wobei sich die senkrecht durchdrungene Fläche ändert, so ist die induzierte EMK proportional zu ΔA⊥ /Δt und zu B. Fassen wir zusammen: Bei A⊥ = konstant gilt EMK ∝ A⊥ ΔB/Δt, bei B = konstant gilt EMK ∝ BΔA⊥ /Δt.

3.1 Die Grundgleichungen des Elektromagnetismus

81

Abb. 3.3: (a) Die induzierte EMK ist proportional zu der vom Magnetfeld – senkrecht zum Feld – durchdrungenen Fläche. (b) Diese Fläche ist proportional cos θ.

Die beschriebenen Beobachtungen legen nahe, dass die EMK von den Änderungsraten sowohl von B als auch von A⊥ abhängt, also von der Änderungsrate des Produkts A⊥ B. Wir erinnern uns an die Definition des Flusses als Produkt zwischen einem Feld und der Fläche, die senkrecht von diesem Feld durchdrungen wird. Folglich ist der magnetische Fluss durch die Leiterschleife gleich ΦM = B⊥ A = BA⊥ = BA cos θ . Allgemeiner formuliert: Wenn B zeitlich variiert (was wahrscheinlich der Fall ist), dann ist der magnetische Fluss durch eine offene, von einer Leiterschleife umschlossene Fläche (Abb. 3.4) gegeben durch ¨ B · dS , (3.1) ΦM = A

wobei dS senkrecht zur Oberfläche nach außen zeigt. Die um die Schleife erzeugte Spannung (EMK) ist dann dΦM . (3.2) dt Das Minuszeichen sagt uns, dass die induzierte Spannung einen induzierten Strom antreibt, der wiederum ein induziertes magnetisches Feld erzeugt, welches der Flussänderung entgegenwirkt, die die Ursache für sein Entstehen war. Dies ist die lenzsche Regel, mit deren Hilfe man leicht die Richtung induzierter Felder herausfinden kann. Wenn das induzierte magnetische Feld der Flussänderung nicht entgegenwirken würde, würde diese Änderung unbegrenzt anwachsen. Wir sollten uns jedoch nicht allzu EMK = −

3 Theorie des Elektromagnetismus, Photonen und Licht

82

Abb. 3.4: B-Feld durch eine offene Fläche A, welche durch die geschlossene Kurve C begrenzt wird.

sehr an das Bild von Drähten, Strömen und induzierter Spannung klammern – uns geht es vor allem um die Beziehungen zwischen elektrischem und magnetischem Feld. Sehr allgemein ausgedrückt ist die EMK eine Potentialdifferenz, also eine Differenz der potentiellen Energie pro Ladungseinheit. Eine Differenz der potentiellen Energie pro Ladungseinheit entspricht einer pro Ladungseinheit verrichteten Arbeit, also einer Kraft pro Ladungseinheit mal Abstand und folglich einem elektrischen Feld mal Abstand. Die EMK existiert nur infolge der Anwesenheit eines elektrischen Feldes, ˛ E · d. (3.3) EMK = C

Integriert wird über eine geschlossene Kurve C (die Leiterschleife). Wir setzen die Gleichungen (3.2) und (3.3) gleich und erhalten mithilfe von Gleichung (3.1) ¨ ˛ d E · d = − B · dS . (3.4) dt A C Hierbei liefern uns die Skalarprodukte die Beträge von E und B parallel zur Kurve C bzw. senkrecht zur Fläche A. Beachten Sie, dass A keine geschlossene Fläche ist (wie dies in den Gleichungen (3.7) und (3.9) der Fall sein wird). Unsere Diskussion ging von einer Leiterschleife aus und führte zu Gleichung (3.4), einem Ausdruck, der sich – abgesehen vom Weg C – nicht mehr auf eine Schleife im physikalischen Sinn bezieht. Tatsächlich kann der Integrationsweg beliebig gewählt werden, er muss sich auch nicht innerhalb oder in der Nähe eines Leiters befinden. Das in Gleichung (3.4) enthaltene elektrische Feld entsteht nicht durch die Anwesenheit elektrischer Ladungen, sondern nur durch die Anwesenheit eines zeitlich veränderlichen Magnetfeldes. Sind keine Ladungen vorhanden, die als Quellen oder Senken wirken, so sind die Feldlinien in sich geschlossen (Abb. 3.5). Wir können die Richtung

3.1 Die Grundgleichungen des Elektromagnetismus

83

des induzierten E-Feldes überprüfen, indem wir uns in dem von dem zunehmenden Fluss senkrecht durchdrungenen Gebiet eine Leiterschleife vorstellen. Das E-Feld im Bereich der Schleife muss so sein, dass ein Strom induziert wird. Dieser Strom (der mit Blick nach unten im Uhrzeigersinn fließt) würde gemäß der lenzschen Regel ein nach unten gerichtetes Magnetfeld induzieren, das dem zunehmenden nach oben gerichteten Fluss entgegenwirkt. B

E

ΦM nimmt zu

Abb. 3.5: Zeitlich variierendes B-Feld. Um jeden Punkt, wo sich ΦM ändert, bildet das E-Feld geschlossene Linien. Stellen Sie sich einen Strom vor, der durch E angetrieben wird. Dieser würde ein nach unten gerichtetes B-Feld induzieren, das dem aufwärts gerichteten B-Feld, also seiner eigenen Ursache, entgegenwirkt.

Wir interessieren uns nun für elektromagnetische Wellen, die sich im Raum ausbreiten, wo es keine Leiterschleifen gibt; der magnetische Fluss ändert sich dort, weil sich B ändert. Das Induktionsgesetz [Gl. (3.4)] kann dann wie folgt formuliert werden: ¨ ˛ ∂B · dS . (3.5) E · d = − C A ∂t B ist normalerweise auch eine Funktion der Ortsvariablen, deshalb wird es partiell nach der Zeit abgeleitet. Dieser Ausdruck ist faszinierend, denn er bedeutet: Mit einem zeitlich veränderlichen Magnetfeld ist stets ein elektrisches Feld verknüpft. Für beliebige Felder wird das Linienintegral um einen geschlossenen Weg Zirkulation dieses Feldes genannt. Hier ist sie gleich der an einer Ladungseinheit verrichteten Arbeit, wenn diese einmal entlang des Weges bewegt wird.

3 Theorie des Elektromagnetismus, Photonen und Licht

84

3.1.2 Der gaußsche Satz für das elektrische Feld Ein weiteres grundlegendes Gesetz des Elektromagnetismus trägt den Namen des deutschen Mathematikers Karl Friedrich Gauß (1777–1855). Es beschreibt die Beziehung zwischen dem Fluss des elektrischen Feldes und der Ladung als Quelle dieses Flusses. Die Ideen stammen aus der Fluiddynamik, wo die Begriffe des Feldes und des Flusses ursprünglich eingeführt wurden.

Johann Karl Friedrich Gauß (Pearson Education, Inc.)

Die Strömung eines Fluids, dargestellt durch ein Geschwindigkeitsfeld, wird grafisch durch Strömungslinien gekennzeichnet – ähnlich, wie das elektrische Feld durch Feldlinien verdeutlicht wird. Abbildung 3.6 zeigt einen Ausschnitt aus einer strömenden Flüssigkeit. Ein Teilbereich ist von einer imaginären geschlossenen Fläche (in Form eines Rohrs) umgeben. Der Volumenfluss, die Rate des Ausströmens der Flüssigkeit aus diesem Rohr, ist gleich dem Flüssigkeitsvolumen, das einen bestimmten Punkt des Rohrs pro Zeiteinheit passiert. Dabei muss der Volumenfluss durch die beiden Stirnflächen des Rohrs gleich groß sein (was pro Sekunde hineinfließt, fließt auch pro Sekunde wieder heraus). Der Nettofluss bezüglich der geschlossenen Fläche ist somit null. Stellen wir uns nun vor, durch die geschlossene Fläche würde ein Röhrchen gesteckt, das Flüssigkeit aus dem Rohr abzieht (eine Senke) oder in das Rohr zugibt (eine Quelle). Der Nettofluss ist dann natürlich verschieden von null.

v2

A1

v1

A2

Abb. 3.6: Strömung einer Flüssigkeit durch ein Rohr. Beachten Sie, dass die Vektoren an den Stirnflächen nach außen zeigen.

3.1 Die Grundgleichungen des Elektromagnetismus

85

E

dS

Abb. 3.7: E-Feld durch eine geschlossene Fläche A.

Um diese Ideen auf das elektrische Feld zu übertragen, betrachten wir eine imaginäre geschlossene Fläche A, die sich in einem beliebigen elektrischen Feld befindet (Abb. 3.7). Der Fluss des elektrischen Feldes durch A sei ‹ E · dS , (3.6) ΦE = A

wobei das verwendete Integralzeichen daran erinnern soll, dass es sich um eine geschlossene Fläche handelt. Der Vektor dS zeigt senkrecht zur Fläche nach außen. Hat das elektrische Feld in dem von der geschlossenen Fläche umgebenen Raum weder Quellen noch Senken, so ist der Nettofluss des Feldes durch die Fläche gleich null. Diese Regel gilt allgemein für alle derartigen Felder. Was geschieht nun, wenn das Feld innerhalb des umschlossenen Volumens Quellen oder Senken aufweist? Betrachten wir zur Beantwortung dieser Frage eine Kugelfläche mit dem Radius r, die eine in der Mitte befindliche positive Punktladung im Vakuum umgibt. Das E-Feld zeigt überall radial nach außen und steht in jedem beliebigen Abstand r senkrecht auf der Kugelfläche: E = E⊥ , also ‹ ‹ E⊥ dS = E dS . ΦE = A

A

E ist auf der Kugelfläche konstant und darf vor das Integral gezogen werden: ‹ dS = E4πr 2 . ΦE = E A

Nach dem coulombschen Gesetz ist das elektrische Feld der Punktladung E=

1 q· , 4π0 r 2

3 Theorie des Elektromagnetismus, Photonen und Licht

86 weshalb gilt ΦE =

q· . 0

Dies ist der elektrische Fluss, der mit einer einzelnen Punktladung q· innerhalb der geschlossenen Fläche verknüpft ist. Da sämtliche Ladungsverteilungen aus Punktladungen zusammengesetzt sind, ist es vernünftig, den Nettofluss infolge einer Anzahl innerhalb der Fläche befindlicher Ladungen als 1  q· ΦE = 0 anzusetzen. Durch Verknüpfung der beiden Gleichungen für ΦE gelangen wir zum gaußschen Satz, ‹ 1  E · dS = q· 0 A

Der Satz besagt, dass in einem gegebenen Volumen eine positive Nettoladung enthalten sein muss, wenn mehr aus dem Volumen herausfließt als hineingeflossen ist; entsprechend muss das Volumen eine negative Nettoladung enthalten, wenn weniger herausfließt. Um mit dieser Gleichung zu rechnen ist es nützlich, die Ladungsverteilung als kontinuierlich anzunehmen. Das von A umschlossene Volumen sei V , und die Dichte der Ladungsverteilung sei ρ; dann können wir den gaußschen Satz in der Form ˚ ‹ 1 E · dS = ρ dV (3.7) 0 A

V

aufschreiben. Dieses Feld wird durch eine Ladung erzeugt, und der Nettofluss des Feldes durch eine beliebige geschlossene Fläche ist proportional zur eingeschlossenen Gesamtladung. Die Dielektrizitätskonstante Für den Spezialfall des Vakuums ist die absolute Dielektrizitätskonstante gegeben durch 0 = 8,8542 × 10−12 C2 / N · m2 (elektrische Feldkonstante, Influenzkonstante). Der Wert von 0 ist per Definition festgelegt, und dieser krumme numerische Wert ist eher eine Folge der gewählten Einheiten, als dass er irgendetwas über die Natur des Vakuums aussagen würde. Befindet sich die Ladung hingegen in einem anderen Medium, so erscheint dessen absolute Dielektrizitätskonstante  anstelle von 0 in Gleichung (3.7). In dieser Gleichung hat  natürlich einerseits die Funktion, die Einheiten auszugleichen; andererseits spielt die Konstante eine grundlegende Rolle bei der Beschreibung des Plattenkondensators (siehe Abschn. 3.1.4). Dort ist  der vom Medium abhängige Proportionalitätsfaktor zwischen der Kapazität und der Geometrie des Bauelements. Ein verbreitetes Verfahren zu Messung der Dielektrizitätskonstante eines Stoffes besteht darin, diesen zwischen die Platten eines Kondensators zu bringen.

3.1 Die Grundgleichungen des Elektromagnetismus

87

Im Grunde beschreibt die Dielektrizitätskonstante das Verhalten eines Materials im elektrischen Feld: Sie erfasst sozusagen, in welchem Maße das Material vom umgebenden Feld durchdrungen wird, oder anders gesagt, wie viel von dem Feld das Medium „zulässt“. Als die Forschungsarbeiten auf diesem Gebiet begannen, benutzte man noch kein einheitliches System physikalischer Einheiten; das führte unvermeidlich zu Verwirrung. Man musste die Zahlenwerte von  in jedem gebräuchlichen Einheitensystem tabellieren, was zumindest Zeitverschwendung war. Im Fall der Dichte lag das Problem ähnlich; hier behalf man sich durch die Angabe spezifischer Größen (also Verhältnissen von Dichten). So kam man auf die Idee, nicht Werte von  zu tabellieren, sondern eine neue, nicht vom Einheitensystem abhängige Verhältnisgröße, die dimensionslose relative Dielektrizitätskonstante KE . Die absolute Dielektrizitätskonstante eines Stoffes ist dann gegeben durch  = KE 0

(3.8)

und natürlich ist KE für das Vakuum 1,0. Unser Interesse an KE ist ein Vorgriff auf die Tatsache, dass diese Größe mit der Lichtgeschwindigkeit in dielektrischen Medien wie Glas, Luft und Quarz zusammenhängt, worauf wir später zurückkommen werden.

3.1.3 Der gaußsche Satz für das magnetische Feld Es gibt kein magnetisches Gegenstück zur elektrischen Ladung – trotz intensiven Suchens, selbst in Proben von der Mondoberfläche, wurden niemals isolierte magnetische Monopole gefunden. Im Gegensatz zum elektrischen Feld hat das Magnetfeld keine Quelle oder Senke, also keinen Punkt, von dem das Feld ausgeht oder in den es sich zusammenzieht. Magnetische Felder beschreibt man anhand von Stromverteilungen: Man kann sich einen Elementarmagneten als winzige Leiterschleife vorstellen, innerhalb derer sich die magnetischen Feldlinien schließen. Die Anzahl der Feldlinien, die in eine beliebige, in einem Magnetfeld befindliche geschlossene Oberfläche eintreten, ist gleich der Anzahl der aus dieser Fläche austretenden Feldlinien, denn innerhalb des umschlossenen Volumens gibt es keine magnetischen Monopole (Abb. 3.8). Die magnetische Flussdichte ΦM durch die Oberfläche hindurch ist gleich null. Damit gelangen wir zum gaußschen Satz für das Magnetfeld: ‹ B · dS = 0 . (3.9) ΦM = A

3.1.4 Das ampèresche Verkettungsgesetz Eine andere Gleichung, die in unserem Zusammenhang eine Rolle spielt, stammt von André Marie Ampère (1775–1836). Der physikalische Ursprung dieses Verkettungsgesetzes (auch Durchflutungsgesetz genannt) ist nicht unbedingt offensichtlich – es

3 Theorie des Elektromagnetismus, Photonen und Licht

88

dS

B

Abb. 3.8: B-Feld, das eine geschlossene Fläche A durchdringt.

r

B

Δ

i

Abb. 3.9: Magnetfeld um einen stromführenden Leiter.

erfordert etwas Arbeit, es zu begründen, doch die Mühe lohnt sich. Betrachten wir dazu einen geraden, stromführenden Leiter im Vakuum und das ihn umgebende kreisförmige Magnetfeld (Abb. 3.9). Aus Experimenten wissen wir, dass sich um einen geraden, von einem Strom i durchflossenen Leiter das Magnetfeld B = μ0 i/2πr aufbaut. Versetzen wir uns nun zurück ins neunzehnte Jahrhundert. Damals stellte man sich vor, es gebe eine magnetische Ladung qm ; diese Monopolladung sei so definiert, dass in einem Magnetfeld B eine Kraft qm B in Richtung von B auf sie wirke (äquivalent zur elektrischen Ladung qe , auf die im E-Feld eine Kraft qe E wirkt). Diesen nach Norden zeigenden Monopol tragen wir nun in Gedanken entlang einer Kreisbahn, die senkrecht zu dem durch ihren Mittelpunkt verlaufenden Leiter ausgerichtet ist, und überlegen, welche Arbeit dabei verrichtet wird. Die Richtung der Kraft ändert sich während des Prozesses, weil sich die Richtung von B ändert. Wir müssen den kreisförmigen Weg deshalb in winzige Abschnitte Δ teilen und die zu den einzelnen Abschnitten gehörigen Teilarbeiten summieren. Die Arbeit ist gleich der Kraftkomponente parallel zur Verschiebung, multipliziert mit dieser Verschiebung, ΔW= qm B || Δ, und die insgesamt vom Feld verrichtete Arbeit ergibt sich folglich als qm B || Δ. B zeigt überall in Richtung der Tangente an den Weg, sodass gilt B || = B = μ0 i/2πr; dies ist um den Kreis herum konstant. Sind also qm und B Konstanten, so wird die Summe zu   Δ = qm B2πr B || Δ = qm B qm  mit Δ = 2πr als Umfang des kreisförmigen Weges.

3.1 Die Grundgleichungen des Elektromagnetismus

89

Setzen wir nun für B den äquivalenten, von r abhängigen Ausdruck ein, der den Strom enthält (nämlich μ0 i/2πr), so können wir r kürzen: Die verrichtete Arbeit hängt nicht von der Wahl der Kreisbahn ab. Bei der Bewegung senkrecht zu B wird keine Arbeit verrichtet; die Arbeit ist daher gleich, egal ob wir qm die Kreisbahn entlang bewegen oder auf einem Radius verschieben (vom Leiter aus nach außen oder zum Leiter hin nach innen), welchen wir schrittweise von einem Kreissegment zum nächsten verlagern. Tatsächlich hängt W überhaupt nicht vom Weg ab – für jeden geschlossenen Weg, der um den Draht herumführt, erhält man denselben Wert. Wir setzen nun den stromabhängigen Ausdruck für B ein und erhalten  B || Δ = qm (μ0 i/2πr) 2πr . qm Dann kürzen wir die „Ladung“ qm , wodurch sich der folgende, recht bemerkenswerte Ausdruck ergibt:  B || Δ = μ0 i . Summiert wird entlang eines beliebigen geschlossenen Weges um den Strom herum. Wie Sie sehen, ist die „magnetische Ladung“ verschwunden. Das ist angenehm, weil wir nicht hoffen können, unser Gedankenexperiment mit einem Monopol tatsächlich ausführen zu können. Die Physik ist trotzdem in sich konsistent; die Gleichung sollte gelten, ob es magnetische Monopole nun gibt oder nicht. Sind außerdem mehrere stromführende Leiter von unserem geschlossenen Weg umgeben, so überlagern die entstehenden Felder einander zu einem Nettofeld, für welches unsere Gleichung ebenso gilt wie für alle einzelnen Komponenten:   i. B || Δ = μ0 Für Δ → 0 wird die Summe zum Integral entlang eines geschlossenen Weges, ˛  B · d = μ0 i. C

Diese Gleichung nennt man heute das ampèresche Verkettungsgesetz. Es verknüpft ein Integral von B entlang einer Tangente an eine geschlossene Kurve C mit dem Strom i, der insgesamt innerhalb der Kurve C fließt. Ist der Querschnitt des Stromflusses nicht gleichförmig, so schreibt man das ampèresche Gesetz mithilfe der Stromdichte auf (das ist der Strom pro Flächeneinheit, integriert über die Fläche): ¨ ˛ B · d = μ0 J · dS . (3.10) C

A

Die offene Fläche A wird von C begrenzt (siehe Abb. 3.10). Die Größe μ0 ist die Permeabilität des Vakuums (magnetische Feldkonstante), definiert als μ0 = 4π ×

3 Theorie des Elektromagnetismus, Photonen und Licht

90

J

dS

C

B

Abb. 3.10: Stromdichte durch eine offene Fläche A.

10−7 N · s2 / C2 . Fließt der Strom nicht im Vakuum, so erscheint in Gleichung (3.10) die Permeabilität μ des betreffenden Mediums. Analog zu Gleichung (3.8) ist μ = KM μ0 ,

(3.11)

wobei KM die dimensionslose relative Permeabilität ist. Gleichung (3.10) liefert zwar in vielen Situationen befriedigende Resultate, sie ist aber nicht die ganze Wahrheit. Die betrachtete Fläche wird nicht näher spezifiziert – es wird lediglich verlangt, dass sie von der Kurve C begrenzt sein soll. Probleme bereitet dies vor allem, wenn man das Aufladen eines Kondensators betrachtet, wie in Abbildung 3.11 a gezeigt ist: Durch die Fläche A1 fließt ein Nettostrom i, und entlang der Kurve C baut sich ein Magnetfeld auf; die rechte Seite von Gleichung (3.10) ist damit verschieden von null, und für die linke Seite muss dies ebenfalls gelten. Bezieht man sich hingegen auf die Fläche A2 , so fließt kein Strom, und das Feld muss null sein – obwohl sich im Vergleich zum ersteren Fall physikalisch nichts geändert hat. Offensichtlich ist der Ansatz also nicht korrekt. Bewegte Ladungen sind nicht die einzige Quelle von Magnetfeldern. Zwischen den Platten eines Kondensators kann man während des Auf- oder Entladens ein B-Feld messen (Abb. 3.11 b), welches sich nicht von dem Feld unterscheiden lässt, das die

3.1 Die Grundgleichungen des Elektromagnetismus

i

C A1

i

91

A2 (a) B

i E i

B E nimmt zu

(b)

B

Abb. 3.11: (a) Das ampèresche Gesetz sagt nichts darüber aus, welche Fläche (A1 oder A2 ) vom Weg C umschlossen wird. Ein Strom fließt aber durch A1 und nicht durch A2 . Der Ansatz muss demnach fehlerhaft sein. (b) BFeld mit begleitendem zeitabhängigem E-Feld zwischen den Platten eines Kondensators.

Zuleitungen umgibt, obwohl kein Strom wirklich durch den Kondensator fließt. Wenn A die Fläche einer Platte ist und Q die darauf befindliche Ladung, so ist jedoch Q . A Verändert sich die Ladung, so ändert sich auch das elektrische Feld. Wenn wir auf beiden Seiten die Ableitung bilden, erhalten wir E=



i ∂E = , ∂t A

und (∂E/∂t) ist effektiv eine Stromdichte. Maxwell stellte die Hypothese der Existenz eines solchen Mechanismus auf und nannte die Größe JD ≡ 

∂E ∂t

(3.12)

Verschiebungsstromdichte2 . Als einer der wichtigsten Beiträge Maxwells gilt die Neuformulierung des ampèreschen Gesetzes,  ¨  ˛ ∂E · dS . (3.13) B · d = μ J+ ∂t C A Die Gleichung besagt, dass ein zeitabhängiges elektrisches Feld stets von einem Magnetfeld begleitet wird, selbst wenn J = 0 ist (Abb. 3.12). 2

Maxwells eigene Worte und Vorstellungen zu diesem Thema werden kommentiert von A. M. Bork in Am. J. Phys. 31, 854 (1963). Übrigens spricht man „Clerk“ wie „Clark“ aus.

3 Theorie des Elektromagnetismus, Photonen und Licht

92 E

B

ΦE nimmt zu

Abb. 3.12: Ein zeitlich variierendes E-Feld. Um jeden Punkt, in dem sich ΦE ändert, bilden die Magnetfeldlinien geschlossene Schleifen. Nach Gleichung (3.12) ist ein aufwärts zeigendes elektrisches Feld äquivalent mit einem nach unten gerichteten Verschiebungsstrom. Die Rechte-Hand-Regel besagt, dass das induzierte B-Feld entgegen dem Uhrzeigersinn zirkuliert, wenn man von oben schaut.

3.1.5 Die maxwellschen Gleichungen Die Integralausdrücke (3.5), (3.7), (3.9) und (3.13) nennt man maxwellsche Gleichungen. Wir erinnern uns, dass sie durch eine Verallgemeinerung experimenteller Ergebnisse zustande gekommen sind. Die einfachste Aussage der Gleichungen bezieht sich auf das Verhalten von elektrischem und magnetischem Feld im Vakuum, wenn  = 0 , μ = μ0 und ρ sowie J gleich null sind. In diesem Fall ist ¨ ˛ ∂B · dS , (3.14) E · d = − C A ∂t ¨ ˛ ∂E · dS , (3.15) B · d = μ0 0 C A ∂t ‹ B · dS = 0 , (3.16) A ‹

E · dS = 0 .

(3.17)

A

Abgesehen von einem skalaren Faktor treten das elektrische und das magnetische Feld in den Gleichungen bemerkenswert symmetrisch auf: Beide Felder beeinflussen sich gegenseitig. Die mathematische Symmetrie lässt auf ein hohes Maß an physikalischer Symmetrie schließen. Wenn jedem Punkt in einem räumlichen Gebiet ein Vektor zugeordnet ist, dann haben wir es mit einem Vektorfeld zu tun. Beispiele für Vektorfelder sind das elektrische und das magnetische Feld. Die maxwellschen Gleichungen in der obigen Form beschreiben

3.1 Die Grundgleichungen des Elektromagnetismus

93

diese Felder mithilfe von Integralen, die über Kurven und Flächen in diesem Gebiet genommen werden. Im Gegensatz dazu kann jede der maxwellschen Gleichungen auch mithilfe von Ableitungen in bestimmten Punkten des Raumes geschrieben werden. Durch diese Umformulierung eröffnet sich eine völlig neue Perspektive. Wir wollen dieses Vorgehen zumindest in groben Zügen skizzieren (eine ausführliche Darstellung finden Sie in Anhang 1). Dazu führen wir zunächst einen wichtigen Differentialoperator, den Nablaoperator, ein. In kartesischen Koordinaten lautet dieser ∂ ∂ ˆ ∂ . + ˆj +k ∇ = ˆi ∂x ∂y ∂z Der Nablaoperator ist formal ein Vektor, sodass seine Anwendung auf ein Vektorfeld entweder als Skalarprodukt oder als Kreuzprodukt interpretiert werden kann. Das ˆ können Ergebnis ist entsprechend ein Skalar oder ein Vektor. Mit E = Exˆi+Eyˆj+Ez k wir also schreiben    ∂ ∂ ∂ ˆ ˆ ˆ . ˆ +j +k · Exˆi + Eyˆj + Ez k ∇·E= i ∂x ∂y ∂z Dies wird als die Divergenz des Vektorfeldes E bezeichnet: div E = ∇ · E =

∂Ez ∂Ex ∂Ey + + . ∂x ∂y ∂z

Diesen Namen hat der große englische Elektroingenieur und Physiker Oliver Heaviside (1850–1925) eingeführt. Die Divergenz von E ist die Änderung von Ex entlang der x-Achse plus die Änderung von Ey entlang der y-Achse plus die Änderung von Ez entlang der z-Achse. Sie kann positiv, negativ oder null sein. Die Gleichung sagt uns, wie wir die Divergenz zu berechnen haben, doch sie hilft uns nicht weiter, wenn wir verstehen wollen, was sie physikalisch bedeutet. Da ein sich bewegendes Fluid leichter zu visualisieren und sicherlich auch leichter verbal zu beschreiben ist als ein statisches elektrisches Feld, geraten die Vorstellungen und Bilder leicht durcheinander. Am besten können Sie sich das Ganze vorstellen, indem Sie ein strömendes Flüssigkeitsfeld in seinem stationären Zustand zeichnen und in Gedanken ein Foto davon machen – das elektrische Feld aufgrund einer Ladungsverteilung ist analog zu diesem statischen Bild. Eine positive Divergenz bedeutet vereinfacht gesagt, dass sich das Feld ausbreitet oder von einem bestimmten Punkt weg bewegt. In jedem Punkt des Feldes, aus dem mehr „herausfließt“ als hinein, gibt es eine positive Divergenz. Wie wir beim gaußschen Gesetz gesehen haben, erzeugt eine Quelle einen Nettofluss durch eine sie umgebende geschlossene Fläche, und entsprechend erzeugt eine Quelle (eine positive Ladung) an einem Punkt im Raum eine positive Divergenz an diesem Punkt. Die Divergenz an einem Punkt kann alles andere als offensichtlich sein, weil sie sowohl von der Stärke des Feldes abhhängt als auch von seiner Neigung, entweder

3 Theorie des Elektromagnetismus, Photonen und Licht

94

zu dem betrachteten Punkt zu konvergieren oder von dort zu divergieren. Betrachten wir zum Beispiel eine positive Ladung im Punkt P1 . Das elektrische Feld „fließt“ nach außen – wobei das „fließen“ hier nicht wörtlich genommen werden sollte – und im Punkt P1 gibt es eine positive Divergenz. In einem Punkt P2 in der Umgebung von P1 breitet sich das Feld tatsächlich wie 1/r 2 aus (was eine positive Divergenz beiträgt), doch gleichzeitig schwächt es sich mit 1/r 2 ab (was eine negative Divergenz beiträgt). Das Ergebnis ist, dass div E überall abseits der Punktladung null ist. Das Feld hat nicht die Neigung, von irgendeinem Punkt in seiner Umgebung, den es durchfließt, zu divergieren. Diese Schlussfolgerung lässt sich verallgemeinern: Eine von null verschiedene Divergenz des elektrischen Feldes tritt nur an Orten auf, an denen sich Ladungen befinden. Wiederum vereinfacht gesagt, ist der Fluss das, was netto durch eine Oberfläche „fließt“, und die Divergenz ist das, was netto aus einem Punkt „herausfließt“. Durch eine weitere wichtige mathematische Definition lassen sich die beiden Größen miteinander in Beziehung setzen: ‹ 1 E · dS = div E = ∇ · E . lim ΔV →0 ΔV A

Mit anderen Worten, wir nehmen einen beliebigen Punkt des Vektorfeldes und legen um ihn herum eine kleine geschlossene Fläche mit dem Flächeninhalt A und dem kleinen Volumen ΔV . Wir schreiben einen Ausdruck für den Nettofluss des Feldes durch A auf – das ist das in der obigen Gleichung auftrende Doppelintegral – und dividieren diesen durch das in A eingeschlossene Volumen, um den Fluss pro Volumeneinheit zu erhalten. Dann lassen wir das Volumen auf einen Punkt zusammenschrumpfen. Das Ergebnis ist die Divergenz des Feldes in diesem Punkt. Wir können den Prozess des Schrumpfens anhalten, wenn die Oberfläche sehr, sehr klein ist, und nachschauen, ob der Fluss positiv, negativ oder null ist; wenn wir das Schrumpfen fortsetzen, erhalten wird im Limes entsprechend eine positive, eine negative oder eine verschwindende Divergenz. Wir sehen also, dass der Fluss und die Divergenz tatsächlich zwei eng verwandte Konzepte sind. Aus dem gaußschen Gesetz in Integralform, Gleichung (3.7), folgt, dass der Nettofluss gleich der eingeschlossenen Nettoladung ist. Divison durch das Volumen liefert die Ladungsdichte ρ in diesem Punkt. Die differentielle Form des gaußschen Gesetzes für elektrische Felder lautet somit ρ . [A1.9] ∇·E= 0 Wenn wir wissen, wie sich das E-Feld im Raum von einem Punkt zum anderen ändert, dann können wir in jedem beliebigen Punkt die Ladungsdichte berechnen (oder umgekehrt).

3.1 Die Grundgleichungen des Elektromagnetismus

95

Auf ganz ähnliche Weise erhalten wir aus dem gaußschen Gesetz für das Magnetfeld, Gleichung (3.9), und der Tatsache, dass es keine magnetischen Ladungen gibt, die differentielle Form des gaußschen Gesetzes für magnetische Felder: ∇ · B = 0.

[A1.10]

Die Divergenz des magnetischen Feldes ist in jedem Punkt des Raumes null. Betrachten wir nun noch einmal das faradaysche Induktionsgesetz [Gl. (3.14)], das wir ebenfalls in eine differentielle Form überführen wollen. Die Aussage des Gesetzes besteht darin, dass ein zeitlich variierendes B-Feld immer von einem E-Feld mit geschlossenen Feldlinien begleitet wird. Die linke Seite von Gleichung (3.14) ist die Zirkulation des elektrischen Feldes. Um das Gesetz in eine differentielle Form zu überführen, benötigen wir einen Differentialoperator, der als Rotation3 (kurz „rot“) bezeichnet wird, da er die Tendenz des Feldes widerspiegelt, um einen Punkt im Raum zu zirkulieren. Der Rotationsoperator wird durch den Vektor ∇× symbolisiert. In kartesischen Koordinaten ist die Rotation eines Vektorfeldes E    ∂ ∂ ˆ ∂ × Exˆi + Eyˆj + Ez k ˆ . + ˆj +k ∇ × E = ˆi ∂x ∂y ∂z Ausmultipliziert ergibt dies       ∂Ey ˆ ∂Ex ∂Ez ˆ ∂Ey ∂Ex ˆ ∂Ez − − − i+ j+ k. ∇×E= ∂y ∂z ∂z ∂x ∂x ∂y Jeder der Klammerausdrücke spiegelt die Tendenz des E-Felds wider, um den zugehörigen Einheitsvektor zu zirkulieren. Der erste Term beschreibt also die Zirkulation des Feldes in der xy-Ebene um den Einheitsvektor ˆi in einem bestimmten Punkt des Raumes. Die Gesamtzirkulation ist die vektorielle Summe der Einzelbeiträge. Um die mathematische Beziehung zwischen der Zirkulation des elektrischen Feldes und seiner Rotation zu beleuchten, kommen wir noch einmal auf das faradaysche Induktionsgesetz zurück und betrachten einen Punkt P in einem elektrischen Feld, der auf einer kleinen, von der geschlossenen Kurve C begrenzten Fläche ΔA liegt. Die Zirkulation des Feldes ist durch die linke Seite von Gleichung (3.14) gegeben, während auf der rechten Seite ein Flächenintegral steht. Um die Zirkulation pro Flächeneinheit zu erhalten, teilen wir das Linienintegral durch ΔA. Wir wollen wissen, wie stark das Feld um den Punkt zirkuliert; also lassen wir C – und folglich ΔA – bis auf P zusammenschrumpfen. Das heißt, wir machen C infinitesimal, wodurch wir von der Zirkulation pro Flächeneinheit zur Rotation übergehen: ˛ 1 E · d = rot E = ∇ × E . lim ΔA→0 ΔA C 3

Anmerkung des Übersetzers: Im Englischen ist die vom Maxwell vorgeschlagene Bezeichnung curl üblich.

3 Theorie des Elektromagnetismus, Photonen und Licht

96

Auch wenn wir es nicht wirklich hergeleitet haben (dies wird in Anhang 1 nachgeholt), können wir doch aus Gleichung (3.14) die differentielle Form des faradayschen Induktionsgesetzes ablesen: ∂B . [A1.5] ∂t In der Elektrostatik beginnen und enden elektrische Felder bei Ladungen; es gibt keine geschlossenen Feldlinien und keine Zirkulation. Daher ist die Rotation für jedes elektrostatische Feld null. Nur elektrische Felder, die von zeitlich variierenden BFeldern erzeugt werden, haben eine Rotation. ∇×E=−

Auf das ampèresche Gesetz können im Wesentlichen die gleichen Argumente angewendet werden. Der Einfachheit halber beschränken wir uns hier auf den Vakuumfall [Gl. (3.15)]. Wir betrachten also die Zirkulation eines Magnetfeldes, das durch ein zeitlich variierendes elektrisches Feld entsteht. Analog zu den obigen Überlegungen können wir die differentielle Form des ampèreschen Gesetzes folgendermaßen schreiben: ∂E . ∂t Diese Vektorgleichungen sind wunderbar kompakt und leicht zu merken. In kartesischen Koordinaten entsprechen sie den folgenden acht Differentialgleichungen: ∇ × B = μ 0 0

Faradaysches Induktionsgesetz (i) (ii) (iii)

∂Ey ∂Bx ∂Ez − =− ∂y ∂z ∂t ∂B ∂Ex ∂Ez y − =− ∂z ∂x ∂t ∂Ex ∂Bz ∂Ey − =− ∂x ∂y ∂t

(3.18)

Ampèresches Gesetz (i) (ii) (iii)

∂By ∂Ex ∂Bz − = μ 0 0 ∂y ∂z ∂t ∂Ey ∂Bx ∂Bz − = μ 0 0 ∂z ∂x ∂t ∂Bx ∂Ez ∂By − = μ 0 0 ∂x ∂y ∂t

(3.19)

Gaußsches Gesetz für das magnetische Feld ∂Bz ∂Bx ∂By + + =0 ∂x ∂y ∂z

(3.20)

3.2 Elektromagnetische Wellen

97

Gaußsches Gesetz für das elektrische Feld ∂Ez ∂Ex ∂Ey + + =0 ∂x ∂y ∂z

(3.21)

Wir haben nun das notwendige Rüstzeug erworben, um zu begreifen, wie sich untrennbar miteinander verbundene, sich gegenseitig erhaltende elektrische und magnetische Felder im Raum ausbreiten – als eine Einheit, ohne Ladungen und Ströme, losgelöst von Materie und Äther.

3.2

Elektromagnetische Wellen

Eine vollständige, mathematisch elegante Herleitung der elektromagnetischen Wellengleichung wurde in den Anhang 1 verlagert. An dieser Stelle wollen wir, was nicht weniger wichtig ist, die physikalischen Prozesse eher intuitiv beschreiben. Drei Fakten, auf die wir eine qualitative Vorstellung stützen können, stehen uns zur Verfügung: die Symmetrie der maxwellschen Gleichungen, die Wechselbeziehung zwischen EFeld und B-Feld in diesen Gleichungen und die Tatsache, dass die beiden Felder generell senkrecht aufeinander stehen. Beim Studium von Elektrizität und Magnetismus fällt schnell auf, dass eine Reihe von Beziehungen die Form von Kreuzprodukten zwischen Vektoren (oder, wenn man so will, Rechte-Hand-Regeln) annimmt. Dies bedeutet, dass ein bestimmtes Ereignis eine senkrecht dazu ausgerichtete Antwort nach sich zieht. In unserem Zusammenhang ist besonders interessant, dass ein zeitabhängiges E-Feld ein B-Feld erzeugt, das stets senkrecht auf der Richtung steht, in der sich das E-Feld ändert (Abb. 3.12). Entsprechend erzeugt ein zeitlich variierendes B-Feld ein E-Feld, das überall senkrecht zu der Richtung verläuft, in der B sich ändert (Abb. 3.5). Davon ausgehend können wir allgemein eine transversale Natur der beiden Felder in einer elektromagnetischen Störung erwarten. Betrachten wir eine Ladung, die auf irgendeine Art aus der Ruhelage beschleunigt wird. Solange sich die Ladung nicht bewegt, ist sie von einem konstanten, radialen elektrischen Feld umgeben, das sich in alle Richtungen bis ins Unendliche ausdehnt. Beginnt die Ladung sich zu bewegen, so ändert sich das E-Feld in ihrer unmittelbaren Nachbarschaft; diese Änderung pflanzt sich mit einer bestimmten, endlichen Geschwindigkeit im Raum fort. Dieses zeitlich variierende elektrische Feld induziert ein magnetisches Feld entsprechend den Gleichungen (3.15) und (3.19). Wenn sich die Ladung mit konstanter Geschwindigkeit bewegt, ist die Änderungsrate des E-Feldes ebenfalls konstant, und das entstehende Magnetfeld hängt nicht von der Zeit ab. In unserem Fall soll die Ladung jedoch beschleunigt werden – das bedeutet, ∂E/∂t ist nicht konstant, und das resultierende Magnetfeld ist zeitabhängig. Entsprechend den Gleichungen (3.14) oder (3.18) erzeugt das zeitlich variierende Magnetfeld wiederum ein elektrisches Feld, und der Prozess setzt sich fort: E-Feld und B-Feld sind direkt

3 Theorie des Elektromagnetismus, Photonen und Licht

98

aneinander gekoppelt. Ändert sich eines der beiden Felder, so erzeugt es ein neues Feld, das sich ein wenig weiter ausdehnt, und auf diese Weise bewegt sich die Störung Punkt für Punkt im Raum fort. Ein sehr mechanistischer, aber anschaulicher Vergleich bietet sich an: Wir stellen uns die elektrischen Feldlinien als dicht beieinander liegende, radial verteilte Bindfäden vor. Zupft man an dieser Anordnung, so wird jeder einzelne Faden verformt; die Knickstellen wandern von der Störungsquelle nach außen. In ihrer Gesamtheit bilden die Knicke zu jedem Zeitpunkt eine dreidimensionale Störung im Kontinuum des (elektrischen) Feldes. Zutreffender betrachtet man das E- und das B-Feld als zwei Aspekte eines einzigen physikalischen Phänomens, des elektromagnetischen Feldes, dessen Quelle eine bewegte Ladung ist. Eine in einem solchen Feld erzeugte Störung pflanzt sich unabhängig von ihrer Quelle im Raum als Welle fort. In einem endlosen Kreislauf, verknüpft zu einer Einheit, erneuern sich die zeitabhängigen Felder gegenseitig. Die elektromagnetischen Felder, die uns vom relativ nahe gelegenen, mit bloßem Auge sichtbaren Andromedanebel erreichen, waren über zwei Millionen Jahre lang unterwegs! Bis jetzt haben wir die Ausbreitungsrichtung der Welle bezüglich der Feldkomponenten noch nicht diskutiert. Die hohe Symmetrie der maxwellschen Gleichungen für das Vakuum legt jedoch nahe, dass die Richtung der Fortpflanzung der Störung sowohl in Bezug auf E als auch in Bezug auf B symmetrisch ist. Daraus folgt unmittelbar, dass eine elektromagnetische Welle nicht rein longitudinal sein kann (jedenfalls, solange E und B nicht parallel zueinander sind). Wir wollen unsere Vermutungen nun mathematisch untermauern. In Anhang 1 wird gezeigt, wie man die maxwellschen Gleichungen für das Vakuum zu zwei sehr übersichtlichen Vektorausdrücken umformen kann: ∇ 2 E = 0 μ 0

∂2E ∂t2

[A1.26]

∇ 2 B = 0 μ 0

∂2B . ∂t2

[A1.27]

und

Der Laplace-Operator4 ∇2 wirkt auf jede Komponente von E und B, sodass die beiden Vektorgleichungen für insgesamt sechs Skalargleichungen stehen. 4

ˆ 2 Ez . In kartesischen Koordinaten ist ∇2 E = ˆı∇2 Ex + ˆj∇2 Ey + k∇

3.2 Elektromagnetische Wellen

99

In kartesischen Koordinaten lauten die Gleichungen ∂ 2 Ex ∂ 2 Ex ∂ 2 Ex ∂ 2 Ex + + =  μ 0 0 ∂x2 ∂y 2 ∂z 2 ∂t2 ∂ 2 Ey ∂ 2 Ey ∂ 2 Ey ∂ 2 Ey + + =  μ 0 0 ∂x2 ∂y 2 ∂z 2 ∂t2 2 2 2 ∂ Ez ∂ Ez ∂ Ez ∂ 2 Ez + + =  μ 0 0 ∂x2 ∂y 2 ∂z 2 ∂t2

(3.22)

und ∂ 2 Bx ∂ 2 Bx ∂ 2 Bx ∂ 2 Bx + + =  μ 0 0 ∂x2 ∂y 2 ∂z 2 ∂t2 ∂ 2 By ∂ 2 By ∂ 2 By ∂ 2 By + + =  μ 0 0 ∂x2 ∂y 2 ∂z 2 ∂t2 2 2 2 ∂ Bz ∂ Bz ∂ Bz ∂ 2 Bz + + =  μ . 0 0 ∂x2 ∂y 2 ∂z 2 ∂t2

(3.23)

Ausdrücke, die wie diese die Ortsabhängigkeit einer physikalischen Größe zu ihrer Zeitabhängigkeit in Beziehung setzen, wurden bereits lange vor Maxwells Arbeiten untersucht; man wusste auch schon, dass sie Wellenphänomene beschreiben. Jede einzelne Komponente des elektromagnetischen Feldes (Ex , Ey , Ez , Bx , By und Bz ) erfüllt die skalare Wellengleichung 1 ∂2ψ ∂2ψ ∂2ψ ∂2ψ + + = 2 2 2 2 2 ∂x ∂y ∂z v ∂t

[2.60]

unter der Voraussetzung 1 . v=√ 0 μ 0

(3.24)

Zur Bestimmung von v verwendete Maxwell die Resultate von Experimenten, die Wilhelm Weber (1804–1891) und Rudolph Kohlrausch (1809–1858) 1856 in Leipzig vorgenommen hatten. In SI-Einheiten ist der Wert von μ0 heute auf 4π×10−7 m· kg/C2 festgelegt; bis vor kurzem hätte man außerdem 0 bestimmen müssen (durch einfache Messungen am Kondensator). Auf jeden Fall ist (in modernen Einheiten geschrieben)    0 μ0 ≈ 8,85 × 10−12 s2 C2 /m3 · kg 4π × 10−7 m · kg/C2 oder 0 μ0 ≈ 11,12 × 10−18 s2 /m2 .

3 Theorie des Elektromagnetismus, Photonen und Licht

100

Nun kam der spannende Moment: Die aus diesen Zusammenhängen vorhergesagte Geschwindigkeit aller elektromagnetischen Wellen im Vakuum war 1 = 3 × 108 m/s . v≈√ 0 μ 0 Dieser theoretisch erhaltene Wert stimmte bemerkenswert gut mit der Lichtgeschwindigkeit überein, die Fizeau kurz zuvor gemessen hatte (315 300 km/s). Maxwell kannte Fizeaus Experimente von 1849 mit einem rotierenden Zahnrad und merkte dazu an: Diese Geschwindigkeit (d. h. ihr theoretisch vorhergesagter Wert) ist der Lichtgeschwindigkeit so nahe, dass man mit großer Wahrscheinlichkeit folgern kann, dass es sich bei Licht selbst (einschließlich der Wärmestrahlung und anderer möglicherweise existierender Strahlungsarten) um eine elektromagnetische Störung in Form von Wellen handelt, welche sich durch das elektromagnetische Feld entsprechend den Gesetzen des Elektromagnetismus fortpflanzt (James Clerk Maxwell, 1852). Diese brillante Analyse kann als einer der bedeutendsten intellektuellen Triumphe aller Zeiten gelten. Es hat sich inzwischen eingebürgert, die Lichtgeschwindigkeit im Vakuum mit dem Symbol c (von lateinisch celer, „schnell“) zu bezeichnen. Seit der 17. Conférence Générale des Poids et Mesures 1983 in Paris gilt eine neue Definition des Meters; die Lichtgeschwindigkeit im Vakuum wurde damit auf exakt c = 2,997 924 58 × 108 m/s festgelegt. Die durch (3.24) gegebene Lichtgeschwindigkeit hängt weder von der Bewegung der Lichtquelle noch von der des Beobachters ab. Dies ist eine bemerkenswerte Schlussfolgerung und es ist erstaunlich, dass scheinbar niemand ihre Tragweite erkannt hat – bis Einstein 1905 die spezielle Relativitätstheorie formulierte.

3.2.1 Transversalwellen Die experimentell bewiesene transversale Natur des Lichts muss nun im Kontext der Theorie des Elektromagnetismus erklärt werden. Betrachten wir dazu den recht einfachen Fall einer ebenen Welle, die sich im Vakuum in positiver x-Richtung fortpflanzt. Die elektrische Feldstärke ist eine Lösung von Gleichung (A1.26), wobei E über jeder der unendlich vielen, senkrecht auf der x-Achse stehenden Ebenen konstant ist. E ist daher nur eine Funktion von x und t, also E = E (x, t). Kehren wir nun zu den maxwellschen Gleichungen zurück, insbesondere zu Gleichung (3.21) (man liest sie „Die Divergenz von E ist gleich null.“). Da E weder von y noch von z abhängt, reduziert sich die Gleichung auf ∂Ex = 0. ∂x

(3.25)

3.2 Elektromagnetische Wellen

101

Ist Ex ungleich null – gibt es also eine Feldkomponente in der Ausbreitungsrichtung der Welle –, dann besagt Gleichung (3.25), dass diese Feldkomponente nicht von x abhängt: Zu jedem beliebigen Zeitpunkt ist Ex für alle Werte von x konstant. Für eine Welle, die sich in positiver x-Richtung ausbreitet, kann dies natürlich nicht gelten. Also muss Ex gleich null sein, damit Gleichung (3.25) erfüllt ist – die elektromagnetische Welle besitzt in der Richtung ihrer Ausbreitung keine Feldkomponente. Das mit der ebenen Welle verknüpfte elektrische Feld ist somit ausschließlich transversal. Um eine Welle vollständig zu beschreiben, müssen wir aus diesem Grunde die zeitliche Entwicklung der Richtung des E-Feldes angeben, die so genannte Polarisierung des Lichts, die in Kapitel 8 ausführlich behandelt wird. Im Augenblick wollen wir uns ohne Beschränkung der Allgemeinheit ausschließlich auf linear polarisierte Wellen beziehen, also solche, bei denen sich die Richtung des schwingenden E-Vektors nicht ändert. Wir orientieren dafür unser Koordinatensystem so, dass das elektrische Feld parallel zur y-Achse ausgerichtet ist, woraufhin E = ˆjEy (x, t)

(3.26)

ist. Wir bilden die Rotation und verwenden Gleichung (3.18). Wegen Ex = Ez = 0 und weil Ey nur eine Funktion von x, nicht aber von y und z ist, erhalten wir ∂Ey ∂Bz =− . (3.27) ∂x ∂t Bx und By sind folglich konstant und für uns momentan uninteressant. Das zeitabhängige Magnetfeld kann nur in z-Richtung eine Komponente haben. Offensichtlich ist die linear polarisierte Welle im Vakuum daher transversal (Abb. 3.13). Außer bei senkrechtem Einfall pflanzen sich solche Wellen in realen Medien nicht transversal fort, weil das Material Energie absorbieren oder freie Ladungen enthalten kann. Für den Moment werden wir ausschließlich dielektrische Medien (also Nichtleiter) betrachten, die homogen, isotrop, linear und stationär sind. In diesem Fall sind ebene elektromagnetische Wellen transversal. y

E c z

x B

Abb. 3.13: Die Feldkonfiguration einer ebenen harmonischen elektromagnetischen Welle, die sich im Vakuum fortpflanzt.

3 Theorie des Elektromagnetismus, Photonen und Licht

102

Abgesehen von unserer Forderung, dass die Welle linear polarisiert sein soll, haben wir die Form der Störung noch nicht festgelegt. Daher sind unsere Schlussfolgerungen von sehr allgemeiner Natur, sie können sowohl auf einzelne Pulse als auch auf kontinuierliche Wellen angewendet werden. Wir haben bereits herausgearbeitet, dass harmonische Funktionen von besonderer Bedeutung sind, da man jede beliebige (periodische) Welle mithilfe der Fourieranalyse (Abschn. 7.3) aus sinusförmigen Komponenten zusammensetzen kann. Also beschränken wir unsere Diskussion auf harmonische Wellen und schreiben Ey (x, t) auf als

x +ε . (3.28) Ey (x, t) = E0y cos ω t − c Die Geschwindigkeit der Fortpflanzung ist c. Durch direkte Integration von Gleichung (3.27) gelangt man zur zugehörigen magnetischen Flussdichte ˆ ∂Ey dt . Bz = − ∂x Mithilfe von Gleichung (3.28) erhalten wir ˆ

x E0y ω + ε dt sin ω t − Bz = − c c oder

1 x +ε . Bz (x, t) = E0y cos ω t − c c

(3.29)

Die Integrationskonstante, die dem zeitunabhängigen Feld entspricht, wurde im letzteren Fall vernachlässigt. Beim Vergleich dieses Ergebnisses mit Gleichung (3.28) sieht man sofort, dass Ey = cBz

(3.30)

ist. Da sich Ey und Bz nur durch einen skalaren Faktor voneinander unterscheiden und die Zeitabhängigkeit beider Komponenten demnach gleich ist, sind E und B in allen ˆ z (x, t) Punkten des Raumes in Phase. Außerdem stehen E = ˆjEy (x, t) und B = kB senkrecht aufeinander, und ihr Kreuzprodukt E×B zeigt in die Fortpflanzungsrichtung der Welle, ˆı (Abb. 3.14). In gewöhnlichen dielektrischen Materialien, die vor allem nichtleitend und nicht magnetisch sind, kann Gleichung (3.30) verallgemeinert werden zu E = vB , √ wobei v die Geschwindigkeit der Welle im Medium und v = 1/ μ ist. Ebene Wellen sind zwar wichtig, aber bei weitem nicht die einzigen Lösungen der Maxwell-Gleichungen. Im vorherigen Kapitel haben wir gesehen, dass die Wellengleichung viele Lösungen hat, darunter auch Zylinder- und Kugelwellen (Abb. 3.15).

3.2 Elektromagnetische Wellen

103

z

E r

c

B

y x Abb. 3.14: (a) Orthogonale harmonische E- und B-Felder einer linear polarisierten Welle. (b) Die Welle breitet sich in Richtung von E × B aus.

Abb. 3.15: Ausschnitt aus der Front einer Kugelwelle in großer Entfernung von der Quelle.

Es muss an dieser Stelle aber noch einmal darauf hingewiesen werden, dass elektromagnetische Kugelwellen in der Realität nicht existieren, wenngleich sie ein nützliches Konzept sind, das wir gelegentlich aufgreifen werden. Es gibt keine Anordnung von Emittern, deren Strahlungsfelder so kombiniert werden können, dass sie echte Kugelwellen erzeugen. Außerdem wissen wir aus der Quantenmechanik, dass die Strahlungsemission grundsätzlich anisotrop ist. Wie ebene Wellen sind auch Kugelwellen nur eine Näherung. Beispiel 3.1 Eine sinusförmige, ebene elektromagnetische Welle mit einer Amplitude von 1,0 V/m und einer Wellenlänge von 2,0 m propagiert im Vakuum in die positive z-Richtung. (a) Schreiben Sie für den Fall, dass das elektrische Feld in x-Richtung verläuft und E(0, 0) = 0 ist, einen Ausdruck für E(z, t) auf. (b) Schreiben Sie einen Ausdruck für B auf. (c) Verifizieren Sie, dass E × B in die Richtung der Propagation zeigt.

3 Theorie des Elektromagnetismus, Photonen und Licht

104

Lösung (a) Es ist E(z, t) = ˆi(1,0 V/m) sin k(z −ct) mit k = 2π/2 = π, und daher E(z, t) = ˆi(1,0 V/m) sin π(z − ct). Das elektrische Feld zeigt offensichtlich in x-Richtung und es gilt E(0, 0) = 0. (b) Gemäß Gleichung (3.30) ist E = cB und somit B(z, t) = ˆj(1,0 V/m)/c sin π(z − ct). (c) E × B hat die Richtung von ˆi × ˆj. Dieses Kreuzprodukt hat die Richtung des ˆ d. h. die z-Richtung. Basisvektors k,

3.3

Energie und Impuls

Eine der wichtigsten Eigenschaften einer elektromagnetischen Welle ist, dass sie Energie und Impuls transportiert. Das Licht selbst des sonnennächsten Sterns legt rund vierzig Billionen Kilometer zurück, um zur Erde zu gelangen, und ist dann noch immer energiereich genug, um an den Elektronen in unserem Auge Arbeit zu verrichten.

3.3.1 Der Poynting-Vektor Jede elektromagnetische Welle existiert in einem bestimmten Gebiet des Raumes. Es erscheint daher sinnvoll, die Strahlungsenergie pro Volumeneinheit zu betrachten, die Energiedichte u. Nehmen wir an, ein elektromagnetisches Feld könne auf irgendeine Weise Energie speichern. Dies ist ein wichtiger logischer Schritt, der das Feld zur physikalischen Realität macht: Besitzt das Feld Energie, so ist es ein „Ding an sich“. Diese Energie ist außerdem kontinuierlich verteilt, weil das klassische Feld kontinuierlich ist. Wir wollen nun sehen, wohin uns diese Annahmen führen. Angenommen, ein Plattenkondensator mit der Kapazität C wird auf eine Spannung V geladen. Wir können uns vorstellen, dass die im Kondensator gespeicherte Energie ( 12 CV 2 ) durch Interaktion der Ladungen im Feld E zwischen den Platten sitzt. Wenn die Plattenfläche A ist und der Plattenabstand d, dann ist C = 0 A/d. Im Zwischenraum ist die Energie pro Volumeneinheit uE =

1 2 2 CV

=

1 2 2 (0 A/d)(Ed)

. Ad Ad Die Energiedichte des elektrischen Feldes im Vakuum ist daher 0 (3.31) uE = E 2 . 2 Analog dazu kann die Energiedichte eines einzelnen Magnetfeldes bestimmt werden, indem man eine Spule mit der Induktivität L betrachtet, die einen Strom I führt. Eine einfache Zylinderspule ohne Kern (Luftspule) mit der Querschnittsfläche A, der Länge l und n Windungen pro Längeneinheit hat die Induktivität L = μ0 n2 lA. Das

3.3 Energie und Impuls

105

Magnetfeld im Inneren der Spule ist B = μ0 nI, und somit ist die Energiedichte in diesem Gebiet uB =

1 2 2 LI

=

1 2 2 2 (μ0 n lA)(B/μ0 n)

. Al Al Und wenn wir noch einen Schritt weiter gehen, erhalten wir die Energiedichte für ein beliebiges Magnetfeld im Vakuum uB =

1 2 B . 2μ0

(3.32)

Die Beziehung E = cB wurde speziell für ebene Wellen hergeleitet, ist aber recht √ allgemein anwendbar. Mit c = 1/ 0 μ0 folgt uE = uB .

(3.33)

Die Energie einer sich durch den Raum bewegenden elektromagnetischen Welle entfällt zu gleichen Teilen auf deren elektrische und magnetische Feldkomponente. So ist u = uE + uB ,

(3.34)

u = 0 E

(3.35)

2

oder äquivalent u=

1 2 B . μ0

(3.36)

Vergessen Sie dabei nicht, dass die Felder sich ändern und dass u eine Funktion der Zeit ist. Zur Darstellung des Flusses der elektromagnetischen Energie, der mit einer Welle verbunden ist, wollen wir den Energietransport pro Zeiteinheit (die Leistung) durch eine Flächeneinheit hindurch mit S bezeichnen. In SI-Einheiten wird S in W/m2 angegeben. Abbildung 3.16 zeigt eine elektromagnetische Welle, die sich mit der Geschwindigkeit c durch eine Fläche A bewegt. Während eines sehr kurzen

c Δt

Abb. 3.16: Der Fluss der elektromagnetischen Energie.

3 Theorie des Elektromagnetismus, Photonen und Licht

106

Zeitintervalls Δt fließt nur diejenige Energie u (c Δt A) durch A, die in einem zylindrischen Volumen (c Δt A) enthalten ist. So ist u c Δt A = uc Δt A oder mit Gleichung (3.35) S=

S=

1 EB . μ0

(3.37)

(3.38)

Wir nehmen nun vernünftigerweise (für isotrope Medien) an, dass die Energie in Ausbreitungsrichtung der Welle fließt. Der zugehörige Vektor S ist dann S=

1 E×B μ0

(3.39)

oder S = c2 0 E × B .

(3.40)

Der Betrag von S ist die Leistung pro Flächeneinheit, die durch eine Fläche fließt, deren Normale parallel zu S ist. Nach John Henry Poynting (1852–1914) wurde der Vektor Poynting-Vektor benannt. Bevor wir fortfahren, sei darauf hingewiesen, dass gemäß der Quantenmechanik die mit einer elektromagnetischen Welle verbundene Energie tatsächlich quantisiert ist; sie ist nicht kontinuierlich. Andererseits liefert die klassische Theorie unter gewöhnlichen Umständen eine sehr gute Näherung, und deshalb werden wir Lichtwellen weiterhin so behandeln, als wären sie ein kontinuierlicher „Stoff“, der die Fähigkeit besitzt, ein räumliches Gebiet auszufüllen. Wir wollen dieses Ergebnis nun auf eine harmonische, linear polarisierte (das heißt, die Richtungen des elektrischen und des magnetischen Feldes sind festgelegt) ebene Welle anwenden, die sich im Vakuum in Richtung von k ausbreitet: E = E0 cos (k · r − ωt) , B = B0 cos (k · r − ωt) .

(3.41) (3.42)

Unter Verwendung von Gleichung (3.40) kommen wir zu S = c2 0 E0 × B0 cos2 (k · r − ωt) .

(3.43)

Dies ist der Momentanwert des Energieflusses je Flächen- und Zeiteinheit. Die Mittelung harmonischer Funktionen Offensichtlich schwankt E × B zwischen Maxima und Minima. Bei Frequenzen von etwa 1015 Hz (optischen Frequenzen) ist S eine sehr schnell variierende Funktion der Zeit (die Frequenz von S ist infolge des Kosinusquadrat-Terms doppelt so hoch wie die Frequenzen der beiden Felder, die jeweils einen Kosinusterm enthalten). Der

3.3 Energie und Impuls

107

Oben: Ergebnis einer Elektronenuntersuchung. Zu sehen sind die Oszillationen des elektrischen Feldes eines intensiven Pulses von rotem Licht (ca. 750 nm), der nur aus einigen wenigen Zyklen besteht. Die Zeitskala liegt im Femtosekundenbereich. Unten: Die erste mehr oder weniger direkte Messung eines oszillatorischen E-Feldes einer Lichtwelle. (Max-Planck-Institut für Quantenoptik)

Momentanwert von S ist daher eine Größe, deren direkte Messung sehr schwierig ist (siehe Foto). Günstiger ist eine zeitliche Mittelung. Dazu betrachten wir die in einem endlichen Zeitintervall von beispielsweise einer Fotozelle, einer Fotoplatte oder der Netzhaut des menschlichen Auges absorbierte Energie. Die spezifische Gestalt von Gleichung (3.43) und die besondere Rolle, die harmonische Funktionen in unseren Betrachtungen spielen, lassen es ratsam erscheinen, dass wir uns kurz mit den Mittelwerten solcher Funktionen beschäftigen. Der zeitliche Mittelwert einer Funktion f (t) in einem Intervall T wird mit f (t) T bezeichnet und ist gegeben durch ˆ 1 t+T /2 f (t) dt . f (t) T = T t−T /2

3 Theorie des Elektromagnetismus, Photonen und Licht

108

Welcher Wert sich für f (t) T ergibt, hängt weitgehend von T ab. Zur Bestimmung des Mittelwerts einer harmonischen Funktion gehen wir wie folgt vor:  ˆ 1 t+T /2 iωt 1 iωt t+T /2 e  = e dt = , e T T t−T /2 iωT t−T /2   iωt  1 iω(t+T /2) iω(t−T /2) e = − e e T iωT   iωt  1 iωt iωT /2 −iωT /2 e = − e e . e T iωT 

und

iωt



Der Term in der Klammer erinnert uns an sin ωT /2; wir können daher schreiben    iωt  sin ωT /2 iωt e . = e T ωT /2 Der Klammerausdruck auf der rechten Seite kommt in der Optik so häufig vor, dass er eine eigene Bezeichnung erhalten hat: (sin u) /u heißt Kardinalsinus, kurz sinc u. Zerlegen wir den Ausdruck in Real- und Imaginärteil, so haben wir cos ωt T = (sinc u) cos ωt

und

sin ωt T = (sinc u) sin ωt .

Der Mittelwert der Kosinusfunktion ist wieder eine Kosinusfunktion mit derselben Frequenz, aber der Amplitude einer sinc-Funktion, die ausgehend von ihrem Anfangswert 1,0 sehr schnell abfällt (Abb. 3.17). Wegen sinc u = 0 für u = ωT /2 = π, was bei T = τ der Fall ist, beträgt der Mittelwert von cos ωt in einem Intervall T , das gerade einer Periode entspricht, null. Das gilt ebenso für jedes T , das einer ganzen Zahl von Perioden entspricht, und trifft auch für sin ωt zu. Diese Tatsache verwundert nicht, denn das Integral in der Definition entspricht der Fläche unter der jeweiligen Kurve; in beiden Fällen ist die negative Fläche unterhalb der x-Achse gleich der positiven 1

sin u u

0.8 0.6 0.4 0.2

0 −0.2

5

10

15 20 u (rad)

25

30

Abb. 3.17: Die Funktion sinc u. Bei u = π, 2π, 3π usw. ist der Funktionswert null.

3.3 Energie und Impuls

109

2 1 cos ωt

0.8 0.6 1/2 0.4 0.2 0

2

4

6

8 (rad)

10

12

14 ωt

Abb. 3.18: Die Lücken unterhalb der Linie bei 1 wurden mit den Spitzen oberhalb dieser Linie 2 ausgefüllt. Der Mittelwert sollte demnach 12 betragen.

Fläche oberhalb der x-Achse, sodass die Summe der Flächenanteile null ist. Nach dem Ablauf einiger Perioden wird der sinc-Term so klein, dass man die Fluktuationen um null herum vernachlässigen kann: cos ωt T und sin ωt T sind dann nahezu null. In Aufgabe 3.16 sollen Sie zeigen, dass cos2 ωt T = 12 [1+sinc ωT cos 2ωt] ist; dieser Term oszilliert mit einer Frequenz von 2ω um den Wert 12 und erreicht Letzteren bei fortschreitendem T innerhalb weniger Perioden. Im Falle des Lichts ist τ ≈ 10−15 s; bereits eine Mittelung über eine Mikrosekunde entspricht dann T ≈ 109 τ – das ist viel mehr, als erforderlich wäre, um die sinc-Funktion vernachlässigbar klein werden zu   lassen, sodass cos2 ωt = 12 ist. Auch Abbildung 3.18 lässt dieses Ergebnis vermuten: Wir schneiden die Gipfel der Fläche unter der Funktion oberhalb von 12 ab und füllen damit die Lücken aus, die unterhalb von 12 vorhanden sind. Nach hinreichend vielen Zyklen nähert sich die Fläche unter f (t), geteilt durch T (dies ist gerade f (t) T ), dem Wert 12 .

3.3.2 Die Bestrahlungsstärke Wenn wir von der „Lichtmenge“ sprechen, die auf eine Oberfläche fällt, meinen wir damit die (über ein Zeitintervall und diese Fläche integrierte) Bestrahlungsstärke5 I, die durchschnittliche Energie pro Flächen- und Zeiteinheit. Jeder Detektor für Strahlung hat ein Eintrittsfenster, das heißt, gemessen wird die Strahlungsenergie, die auf einer bestimmten Fläche A auftrifft. Um die Abhängigkeit des Ergebnisses von der Größe von A zu eliminieren, dividiert man den Messwert durch A. Außerdem kann man natürlich keinen Momentanwert des Energieflusses messen, sondern man integriert über eine endliche Zeit T , die Messdauer. Will man den Nettoenergiefluss pro Flächeneinheit bestimmen, der von T abhängt, ist eine solche integrierende Messung offensichtlich wenig sinnvoll; aus einer zweiten Messung unter gleichen Bedingungen, 5

Früher bezeichnete man den Energiefluss pro Flächen- und Zeiteinheit in der Physik allgemein als „Intensität“. In der Optik wird dieser Begriff gemäß internationaler Übereinkunft zunehmend durch „Bestrahlungsstärke“ ersetzt.

3 Theorie des Elektromagnetismus, Photonen und Licht

110

aber mit einem anderen T kann man ein anderes Ergebnis erhalten. Daher dividiert man noch durch T und erhält so eine in der Praxis höchst nützliche Größe – nämlich I, den Mittelwert der Energie pro Zeit- und Flächeneinheit. Ein Maß für I ist der zeitliche Mittelwert (T  τ ) des Betrages des Poynting-Vektors, S T . Für den Spezialfall harmonischer Felder und Gleichung (3.43) ist   S T = c2 0 |E0 × B0 | cos2 (k · r − ωt) .   Wegen cos2 (k · r − ωt) T = 12 für T  τ (siehe Aufgabe 3.15) gilt S T =

c2 0 |E0 × B0 | 2

oder

c0 2 E . (3.44) 2 0 Die Bestrahlungsstärke ist proportional zum Quadrat der Amplitude des elektrischen Feldes. Zwei weitere einfache Möglichkeiten, diesen Fakt auszudrücken, sind c  2 (3.45) B T I= μ0 und   (3.46) I = 0 c E 2 T . I ≡ S T =

Innerhalb eines linearen, homogenen, isotropen Dielektrikums ergibt sich für die Bestrahlungsstärke   (3.47) I = v E 2 T . Da, wie gezeigt wurde, E viel effektiver Kräfte auf Ladungen ausübt oder an Ladungen Arbeit verrichtet als B, wollen wir E als optisches Feld bezeichnen und fast ausschließlich Gleichung (3.46) verwenden. Beispiel 3.2 Stellen Sie sich eine ebene harmonische Welle vor, die in einem homogenen, isotropen Dielektrikum in z-Richtung propagiert. Angenommen, die Welle, deren Amplitude E0 sei, hat zur Zeit t = 0 bei z = 0 die Auslenkung null. (a) Zeigen Sie, dass die Energiedichte der Welle gegeben ist durch u(t) = E02 sin2 k(z − vt) . (b) Bestimmen Sie einen Ausdruck für die Bestrahlungsstärke der Welle.

3.3 Energie und Impuls

111

Lösung (a) Aus Gleichung (3.34), angewendet auf ein Dielektrikum, folgt u=

1 2  2 E + B 2 2μ

mit E = E0 sin k(z − vt) .

Mit E = vB erhalten wir u=

1 E2  2 E + = E 2 = E02 sin2 k(z − vt) . 2 2μ v 2

(b) Die Bestrahlungsstärke folgt aus Gleichung (3.37), nämlich S = uv, bzw. S = vE02 sin2 k(z − vt) und somit 1 I = S T = vE02 . 2 Die Rate des Flusses der Strahlungsenergie ist eine Leistung, genannt Strahlungsfluss und gemessen in Watt. Dividieren wir den Strahlungsfluss, der auf eine Fläche fällt oder aus dieser austritt, durch diese Fläche, dann erhalten wir die Strahlungsflussdichte in W/m2 . Im ersteren Fall spricht man von der Bestrahlungsstärke, im letzteren vom Emissionsvermögen und in beiden Fällen von der Flussdichte. Die Bestrahlungsstärke ist ein Maß für die Leistungskonzentration. Die schwächsten Sterne, die man am Nachthimmel mit bloßem Auge sehen kann, haben Bestrahlungsstärken von nur etwa 0,6 × 10−9 W/m2 . Beispiel 3.3 Das elektrische Feld einer ebenen elektromagnetischen Welle ist gegeben durch E = (−2,99 V/m) ˆj ei(kz−ωt) . Bestimmen Sie für die Werte ω = 2,99 × 1015 rad/s und k = 1,00 × 107 rad/m (a) den zugehörigen magnetischen Feldvektor und (b) die Bestrahlungsstärke der Welle. Lösung (a) Die Welle pflanzt sich in die +z-Richtung fort. E0 zeigt in die ˆ oder z zeigt, muss Richtung von −ˆj oder −y. Da E × B in die Richtung von k ˆ B0 in die Richtung von i oder +x zeigen. Es gilt E0 = vB0 und v = ω/k = 2,99 × 1015 /1,00 × 107 = 2,99 × 108 m/s und daher     2,99 V/m ˆi ei(kz−ωt) = 10−8 T ˆi ei(kz−ωt) . B= 8 2,99 × 10 m/s

3 Theorie des Elektromagnetismus, Photonen und Licht

112

(b) Da die Geschwindigkeit 2,99 × 108 m/s ist, haben wir es mit einem Vakuum zu tun, und folglich ist c0 2 (2,99×108 m/s)(8,854×10−12 C2 / N· m2 ) E = (2,99 V/m)2 2 0 2 = 0,0118 W/m2 .

I=

Das quadratische Entfernungsgesetz

r2

r1

Wir haben bereits gesehen, dass die Kugelwelle als Lösung der Wellengleichung eine Amplitude besitzt, die umgekehrt proportional zu r ist. Wir wollen diese Beziehung nun im Kontext der Energieerhaltung untersuchen. Betrachten wir dazu eine isotrope, punktförmige Quelle im Vakuum, die in alle Raumrichtungen gleichmäßig Energie (also Kugelwellen) aussendet. Wir umgeben die Quelle dazu mit zwei konzentrischen Kugelflächen der Radien r1 und r2 , wie in Abbildung 3.19 gezeigt ist.

Abb. 3.19: Die Geometrie des quadratischen Entfernungsgesetzes.

E0 (r1 ) und E0 (r2 ) seien die Amplituden der Welle auf der ersten bzw. zweiten Fläche. Gemäß der Energieerhaltung muss die Energie, die pro Sekunde durch die erste Fläche fließt, gleich der Energie sein, die in dieser Zeit durch die zweite Fläche fließt, denn es gibt keine anderen Quellen oder Senken. Wir multiplizieren I mit der Kugelfläche und ziehen die Wurzel; so ergibt sich r1 E0 (r1 ) = r2 E0 (r2 ) . Da r1 und r2 beliebig sind, folgt rE0 (r) = konstant . Die Amplitude muss also umgekehrt proportional zu r abnehmen. Die Bestrahlungsstärke einer Punktquelle ist proportional zu 1/r 2 ; diesen bekannten Zusammenhang

3.3 Energie und Impuls

113

nennt man quadratisches Entfernungsgesetz. Mithilfe einer Strahlungsquelle und eines fotografischen Belichtungsmessers kann man das Gesetz leicht nachprüfen.

3.3.3 Photonen Licht wird in Form winziger, diskreter „Partikel“ elektromagnetischer „Materie“, den Photonen, absorbiert und emittiert. Dies wurde oft nachgewiesen und ist allgemein anerkannt.6 Gewöhnlich besteht ein Lichtstrahl aus so vielen winzig kleinen Energiequanten, dass seine Teilchennatur makroskopisch nicht mehr in Erscheinung tritt: Man sieht ein kontinuierliches Phänomen. Solche Effekte sind in der Natur nicht selten. Die Kräfte, die eine große Anzahl Gasmoleküle ausüben, machen sich in einem Windstoß als scheinbar kontinuierlicher Druck bemerkbar – aber mikroskopisch ist das Phänomen diskret. Die Analogie zwischen einem Gas und einem Photonenstrahl werden wir uns noch zunutze machen. Der große französische Physiker Louis de Broglie drückte es so aus: „Licht ist, kurz gesagt, die feinste Form der Materie.“ Jede Form von Materie, einschließlich Licht, ist gequantelt, besteht also aus kleinen Elementarteilchen – Quarks, Leptonen, W-Bosonen, Z-Bosonen und Photonen. Diese Einheitlichkeit gehört zu den überzeugendsten Argumenten zugunsten der Teilchennatur des Photons. Es sei jedoch betont, dass wir hier von Quantenteilchen sprechen, die etwas völlig anderes sind als die gewöhnlichen „Partikel“, die uns im Alltag begegnen. Das Versagen der klassischen Theorie 1900 erarbeitete Max Planck eine vorläufige und nicht völlig fehlerfreie Analyse der so genannten Hohlraumstrahlung. Ungeachtet der Irrtümer der Theorie passte der Ausdruck, den Planck erhalten hatte, hervorragend zu den verfügbaren experimentellen Ergebnissen – eine Leistung, der bis zu diesem Zeitpunkt noch kein Ansatz auch nur nahe gekommen war. Planck betrachtete elektromagnetische Wellen im Gleichgewicht innerhalb einer isothermen Kammer (eines Hohlraums; eine ausführliche Behandlung erfolgt in Abschn. 13.1.1). Sämtliche elektromagnetische Energie innerhalb des Raums wird von dessen Wänden absorbiert oder emittiert, von außen kann keine Strahlung eindringen. Auf diese Weise entspricht die spektrale Zusammensetzung der Hohlraumstrahlung derjenigen, die von einer idealen schwarzen Oberfläche ausgesendet wird. Plancks Ziel bestand darin, das Spektrum der Strahlung vorauszusagen, die den Hohlraum durch eine kleine Öffnung verlässt. An dieser Frage verzweifelte der Forscher fast; schließlich wandte er sich der klassischen statistischen Analyse von Maxwell und Boltzmann zu, die als Grundlage der kinetischen Gastheorie entwickelt worden war. Philosophisch betrachtet, handelt es sich dabei um eine vollständig deterministische Behandlung – sie geht davon aus, dass man (zumindest im Prinzip) die Bewegung jedes einzelnen Atoms im System verfolgen kann. Folglich sind die Atome voneinander 6

Siehe den Übersichtsartikel „Evolution of the modern photon“ von R. Kidd, J. Ardini und A. Anton, Am. J. Phys. 57 (1), 27 (1989).

3 Theorie des Elektromagnetismus, Photonen und Licht

114

unabhängig, man kann sie durchnummerieren und unterscheiden. Aus rein rechentechnischen Gründen stellte Planck die Hypothese auf, dass jeder Oszillator, der die Wände des Hohlraums streift, nur diskrete, zu seiner Schwingungsfrequenz proportionale Energiemengen absorbieren und emittieren kann. Diese Energiebündel entsprachen ganzzahligen Vielfachen von hν. Die Größe h nennt man heute plancksche Konstante (plancksches Wirkungsquantum), ihr Wert liegt bei 6,626 × 10−34 J · s. Planck war ansonsten ziemlich konservativ und beharrte auf dem klassischen Wellenbild des Lichts – lediglich die Oszillatoren sollten quantisiert sein. J. J. Thomson, der Entdecker des Elektrons, entwickelte die Idee weiter, indem er 1903 vorschlug, dass sich elektromagnetische Wellen grundsätzlich von anderen Wellenarten unterscheiden; vielleicht, meinte er, gibt es tatsächlich örtliche Ansammlungen von Strahlungsenergie. Thomson hatte beobachtet, dass nur vereinzelte Atome eines von hochfrequenter elektromagnetischer Strahlung (Röntgenstrahlung) getroffenen Gases ionisiert werden – als ob die Strahlungsenergie nicht kontinuierlich über die Wellenfront verteilt wäre, sondern sich an bestimmten Stellen konzentrierte (siehe Foto).

Ein Röntgenstrahl tritt von links in eine Nebelkammer ein. Die Spuren stammen von Elektronen, die entweder durch den photoelektrischen Effekt (lange Spuren, die seitlich vom Strahl abweichen) oder durch den Compton-Effekt (kurze Spuren ungefähr in Richtung des Strahls) erzeugt wurden. Aus klassischer Sicht sollte die Energie eines Röntgenstrahls gleichförmig entlang transversaler Wellenfronten verteilt sein. Die Streuung erscheint jedoch als diskreter, zufälliger Prozess. (Smithsonian Report, 1915.)

Der Begriff des Photons, wie wir ihn heute verwenden, kam 1905 durch Einsteins brillante theoretische Arbeit zum photoelektrischen Effekt ins Spiel. Wird ein Metall elektromagnetischer Strahlung ausgesetzt, emittiert es Elektronen. Die Einzelheiten dieses Prozesses waren bereits jahrzehntelang untersucht worden, ohne dass eine schlüssige Beschreibung im Rahmen der Theorie des Elektromagnetismus gelungen wäre. Einsteins erstaunlicher Ansatz bestand darin, dass das elektromagnetische Feld selbst quantisiert sein sollte. Jedem der Bestandteile dieses Feldes, den Photonen, ordnete Einstein eine Energie zu, die dem Produkt aus dem planckschen Wirkungsquantum und der Frequenz des Strahlungsfeldes entspricht: E = hν .

(3.48)

Photonen sind stabile, ungeladene, masselose Elementarteilchen, die sämtlich die Lichtgeschwindigkeit (c) haben. Alle bisher durchgeführten Experimente haben ergeben, dass – sollte das Photon eine Ladung haben – diese um den Faktor 5 × 10−30 kleiner sein muss als die Ladung des Elektrons und seine Masse – falls es überhaupt

3.3 Energie und Impuls

115

eine hat – weniger als 10−52 kg betragen muss. Wenn wir versuchen, uns das Photon als eine winzige Konzentration an elektromagnetischer Energie vorzustellen, dann hätte diese eine räumliche Ausdehnung von weniger als 10−20 m. Mit anderen Worten gilt wie im Falle des Elektrons, dass bislang kein einziges Experiment irgendeinen Hinweis auf eine endliche Größe des Photons erbracht hat. Mit einer Größe von null (was immer das bedeutet) hat das Photon vermutlich keine inneren Bestandteile und muss daher als „fundamental“, also als ein Elementarteilchen angesehen werden. 1924 legte Satyendra N. Bose einen neuen, überzeugenden Beweis der planckschen Theorie der Hohlraumstrahlung vor, indem er statistische Methoden auf Lichtquanten anwendete. Bose betrachtete den Hohlraum als angefüllt mit einem „Photonengas“, dessen elementare Bestandteile er als nicht voneinander unterscheidbar auffasste. Die letztere Annahme, einer der wichtigsten Schritte der quantenmechanischen Argumentation, sagt aus, dass die Teilchen austauschbar sind – dies hat einen grundlegenden Einfluss auf die statistische Formulierung. In mathematischer Hinsicht steht jedes Teilchen dieses „Quantengases“ in Beziehung zu jedem anderen Teilchen; kein Teilchen ist vom System in seiner Gesamtheit statistisch unabhängig. Die quantenmechanische Wahrscheinlichkeitsfunktion, die das statistische Verhalten der Wärmestrahlung beschreibt, nennt man heute Bose-Einstein-Verteilung. So wurde das Photon – was auch immer es in Wirklichkeit ist – zum unentbehrlichen Hilfsmittel der theoretischen Physik. 1932 führten zwei sowjetische Physiker, Jewgeni M. Brumberg und Sergei I. Wawilow, eine Reihe von einfachen Experimenten durch, die bestätigten, dass Licht ein Quantenphänomen ist. Vor dem Aufkommen elektronischer Detektoren (z. B. von Photomultiplieren) entwickelten sie eine photometrische Technik, mit der man mit bloßem Auge den statistischen Charakter von Licht studieren kann. Der Trick bestand darin, die Bestrahlungsstärke auf ein Niveau zu senken, das sehr nahe an der Sehschwelle lag. Das taten sie in einem dunklen Raum, in dem sie einen außerordentlich schwachen (≈ 200×10−18 W) Strahl von grünem Licht (505 nm) auf eine Blende richteten, die für kurze Intervalle (0,1 s) geöffnet werden konnte. In jedem dieser Intervalle gingen im Mittel 50 Photonen durch die geöffnete Blende. Das Auge kann theoretisch ein paar der Photonen „sehen“, aber 50 lag etwa an der Grenze dessen, was zuverlässig detektiert werden kann. Brumberg und Wawilow schauten also einfach auf die Blende und zeichneten ihre Beobachtungen auf. Wenn Licht eine klassische Welle mit gleichmäßig über die Wellenfronten verteilter Energie wäre, hätten die Wissenschaftler jedesmal einen schwachen Lichtblitz sehen müssen, wenn sich die Blende öffnet. Wenn Licht dagegen ein unregelmäßiger Strom von Photonen wäre, sähe die Sache ganz anders aus. Was die Experimentatoren sahen, war eindeutig: In der Hälfte der Intervalle mit geöffneter Blende sahen sie einen Blitz und in der anderen Hälfte sahen sie nichts, wobei die Reihenfolge der unterschiedlichen Ergebnisse völlig zufällig war. Brumberg und Wawilow zogen hieraus den richtigen Schluss: Die Zufälligkeit der Beobachtung lag an der inherent quantenmechanischen und damit fluktuierenden Natur des Strahls – wenn

116

3 Theorie des Elektromagnetismus, Photonen und Licht

der Strahl gerade genug Photonen enthielt, um die Wahrnehmungsschwelle zu überschreiten, dann sahen sie den Strahl, und wenn die Photonenzahl unter der Schwelle lag, dann sahen sie nichts. Wie erwartet, reduzierte sich die Anzahl der Nichtbeobachtungen sehr schnell, als sie die Bestrahlungsstärke erhöhten. Im Gegensatz zu „gewöhnlichen “ Objekten kann man Photonen nicht sehen; sämtliche Informationen über die Photonen bezieht man aus Vorgängen, bei denen sie entweder entstehen oder vernichtet werden. Niemals „sieht“ man Licht, das den Raum durchflutet. Was man sieht, sind die Effekte der Wechselwirkung des Lichts mit seiner Umgebung, und solche Effekte entstehen nur, wenn Photonen erzeugt werden oder verschwinden. Am Anfang und am Ende von Photonen stehen geladene Teilchen und meist werden sie von Elektronen emittiert oder absorbiert. Diese wiederum stammen meistens aus Elektronenhüllen der Atome. Die Quantennatur des Emissionsprozesses wurde durch etliche Experimente bestätigt. Stellen wir uns zum Beispiel eine sehr schwache Lichtquelle vor, die in jeweils gleichen Abständen von identischen, hochempfindlichen Strahlungsdetektoren umgeben ist. Hätte die Emission – egal, wie schwach sie ist – die Form einer kontinuierlichen Welle, wie es die klassische Theorie besagt, so müsste jeder ausgesendete Puls von allen Detektoren gleichzeitig empfangen werden. Doch genau dies geschieht nicht: Die Detektoren registrieren unabhängig voneinander einzelne Ereignisse, was offensichtlich im Einklang mit der Hypothese steht, dass Atome lokalisierte Lichtquanten in zufällige Richtungen aussenden. Weiterhin konnte man zeigen, dass sich ein Atom, das Licht (also ein Photon) emittiert, bei diesem Prozess ein wenig in die entgegengesetzte Richtung bewegt – vergleichbar etwa dem Rückstoß, der beim Schuss aus einer Pistole auftritt. In Abbildung 3.20 sieht man, wie mit überschüssiger Energie angereicherte („angeregte“, siehe Abschn. 3.4.4) Atome zu einem scharfen Strahl fokussiert werden. Nach kurzer Zeit senden die Atome in alle Richtungen Photonen aus und fliegen dabei selbst in die jeweils entgegengesetzte Richtung, wobei sie oft seitlich aus dem Strahl ausbrechen. Auf diese Weise verbreitert sich der Strahl – es handelt sich hier eindeutig um einen quantenmechanischen Effekt, der ausgehend vom klassischen Bild der symmetrischen Welle nicht zu erklären ist. Wo innerhalb eines Strahls hält sich ein bestimmtes Photon auf? Dies ist eine Frage, die wir nicht beantworten können. Die Bewegung eines Photons lässt sich nicht verfolgen wie der Flug einer Kanonenkugel. Herumfliegende Photonen können nicht mit beliebiger Genauigkeit lokalisiert werden, doch zumindest können wir sagen, dass es in Propagationsrichtung besser möglich ist als transversal dazu. Man kann zeigen, dass die longitudinale Unbestimmtheit ungefähr von der Ordnung der Wellenlänge des Lichts ist. Daher kann die Darstellung eines Photons in Form eines kurzen elektromagnetischen Wellenzuges (wie in Abbildung 3.20) nützlich sein, doch dieses Bild ist mit Vorsicht zu genießen. Wir könnten darauf bestehen, das Photon als ein „Teilchen“ zu betrachten, so etwas wie ein winziges Kügelchen, und uns naiverweise vorstellen, dass es sich irgendwo im Bereich des Wellenzuges befindet.

3.3 Energie und Impuls

117

emittierte Photonen

Atome

Anregungsenergie

Abb. 3.20: Atome in angeregten Zuständen, die zu einem scharfen Strahl fokussiert werden und Photonen aussenden, werden durch den „Rückstoß“ in seitlicher Richtung abgelenkt; der Strahl verbreitert sich. Zu einer solchen Verbreiterung kommt es nicht, wenn der Strahl von Atomen gebildet wird, die nicht angeregt sind (die sich also in ihrem Grundzustand befinden).

Diese Vorstellung ist jedoch sehr problematisch. Wir können sagen, dass das sich mit der Geschwindigkeit c durch den Raum bewegende Photon – das nur bei c existiert – ein winziges, stabiles, ladungs- und masseloses Objekt ist. Es ist Träger von Energie, linearem Impuls und Drehimpuls; es zeigt ein Verhalten, das elektromagnetisch und oszillatorisch ist, und es kann etwas unlokalisiert sein, eher ein „Hauch“ als ein traditionelles „Teilchen“. Es ist, wie auch die anderen Elementarteilchen, ein Quantenteilchen. Der Hauptunterschied ist, dass andere Elementarteilchen eine Masse haben und in Ruhe existieren können, was für das Photon nicht der Fall ist. Kurz gesagt ist das Objekt, das wir Photon nennen, die Summe seiner Eigenschaften, die in zahllosen Experimenten aufgedeckt wurden. Über diese Formulierung hinaus gibt es tatsächlich bis heute keine befriedigende makroskopische Beschreibung. Photonenströme Wenn man Phänomene untersucht, an denen eine sehr große Zahl von Individuen – in unserem Falle Photonen – beteiligt ist, muss man in der Regel auf statistische Verfahren zurückgreifen. Neben der klassischen Maxwell-Boltzmann-Statistik (für unterscheidbare Teilchen) gibt es zwei quantenmechanische Ansätze (für ununterscheidbare Teilchen), die Bose-Einstein- und die Fermi-Dirac-Statistik. Der erstgenannte Ansatz gilt für Teilchen, die nicht vom paulischen Ausschlussprinzip betroffen sind (also solche mit ganzzahligem Spin oder einem Spin von null); mithilfe des letzteren Ansatzes beschreibt man alle anderen Teilchen (deren Spins ungeradzahlige Vielfache von 12 sind). Teilchen mit einem Spin von 1, deren Ensembles sich gemäß der Bose-Einstein-Statistik verhalten und zu denen auch das Photon gehört, heißen Bosonen; Teilchen mit einem Spin von 12 (wie das Elektron), deren Ensembles sich gemäß der Fermi-Dirac-Statistik verhalten, heißen Fermionen. Elementarteilchen haben definierende physikalische Eigenschaften wie Ladung und Spin, die unveränderlich sind. Wenn diese gegeben sind, dann ist vollständig spezifiziert, um welche Art von Teilchen es sich handelt. Zusätzlich besitzt jedes

3 Theorie des Elektromagnetismus, Photonen und Licht

118

Elementarteilchen veränderliche Eigenschaften wie Energie, Impuls und Spinausrichtung, die seinen momentanen Bedingungen entsprechen. Wenn alle diese variablen Größen gegeben sind, dann ist durch diese der Zustand des Teilchens definiert, in dem es sich in diesem Moment befindet. Fermionen sind Einzelgänger: Nur jeweils ein Fermion kann einen bestimmten Zustand einnehmen. Bosonen dagegen sind gesellig – unbegrenzt viele können in ein und demselben Zustand vorliegen, und außerdem bilden sie gern größere Teilchenverbände. Wird ein bestimmter Zustand von sehr vielen Photonen gleichzeitig besetzt, so verschwindet die „Körnung“ des Lichtstrahls, und das elektromagnetische Feld erscheint als kontinuierliches Trägermedium einer elektromagnetischen Welle. Eine monochromatische (monoenergetische) ebene Welle können wir daher einem Strom von Photonen mit hoher Populationsdichte gleichsetzen, wobei sich die einzelnen Photonen im selben Zustand befinden (das heißt, ihre Frequenz, Energie, Richtung und ihr Impuls stimmen überein). Verschiedene monochromatische ebene Wellen gehören zu verschiedenen Photonenzuständen. Im Gegensatz zu den Photonen sind Elektronen Fermionen – das bedeutet, dass nicht einmal zwei, geschweige denn sehr viele von ihnen einen gemeinsamen Zustand besetzen können. Ein monoenergetischer Elektronenstrahl erscheint daher, im Unterschied zu elektromagnetischen Wellen, makroskopisch betrachtet nicht als klassische kontinuierliche Welle. Für einen gleichförmigen monochromatischen Lichtstrahl der Frequenz ν entspricht die Größe I/hν der durchschnittlichen Anzahl von Photonen, die pro Zeiteinheit auf einer zur Strahlrichtung senkrechten Flächeneinheit auftreffen – das ist die Photonenflussdichte. In der Realität ist ein Lichtstrahl bestenfalls quasimonochromatisch mit einer mittleren Frequenz ν0 , und I/hν0 ist dann die mittlere Photonenflussdichte. Der mittlere Photonenfluss eines quasimonochromatischen einfallenden Strahls mit einem Querschnitt A ist gegeben durch Φ=

P AI = . hν0 hν0

(3.49)

Dabei ist P die optische Leistung, gemessen in Watt. Der mittlere Photonenfluss ist gleich der durchschnittlichen Anzahl der pro Zeiteinheit auftreffenden Photonen (Tab. 3.1). Ein kleiner He-Ne-Laser mit einer Leistung von 1 mW und einer Wellenlänge von 632,8 nm liefert beispielsweise einen mittleren Photonenfluss von 1,0 × 10−3 W P = hν0 (6,626 × 10−34 J · s) (2,998 × 108 m/s) / (632,8 × 10−9 m) = 3,2 × 1015 Photonen pro Sekunde. Stellen wir uns einen gleichförmigen Lichtstrahl vor, der mit konstanter Stärke (also mit konstantem Strahlungsfluss) auf einen Schirm trifft. Die Strahlungsenergie wird

3.3 Energie und Impuls

119

Tabelle 3.1: Mittlere Photonenflussdichte für verschiedene Lichtquellen und Situationen.

Lichtquelle

Mittlere Photonenflussdichte Φ/A Einheit: (Photonen/s·m2)

Laserstrahl (10 mW, He-Ne-Laser, fokussiert auf 20 µm) Laserstrahl (1 mW, He-Ne-Laser) Helles Sonnenlicht Licht in Innenräumen Licht in der Dämmerung Mondlicht Sternenlicht

1026 1021 1018 1016 1014 1012 1010

dabei in Form unzähliger, zufällig verteilter kleiner Blitze auf den Schirm übertragen. Wo und zu welchem Zeitpunkt ein einzelnes Photon auf den Schirm trifft, kann nicht vorhergesagt werden. Der Lichtstrahl erscheint uns zwar als Strom vieler zufällig verteilter Photonen, aber diese Schlussfolgerung ist durch die Beobachtungen nicht belegt (allerdings ist sie verlockend). Es steht lediglich fest, dass ein Lichtstrahl seine Energie in Form unzähliger kleiner „Einschläge“ überträgt, welche innerhalb des Strahls räumlich und zeitlich zufällig verteilt sind. Betrachten wir nun ein Bild, das auf einen Schirm fällt, etwa ein Interferenzmuster oder das Gesicht einer Frau. In dem Photonenstrom, der das Bild formt, herrscht ein statistisches Durcheinander: Wir können nicht vorhersagen, wann ein Photon auf eine bestimmte Stelle trifft. Berechnen können wir aber die Wahrscheinlichkeit dafür, dass ein Photon oder mehrere in einem endlichen Zeitintervall in einem bestimmten Bereich des Schirms eintreffen. In jedem Bereich des Schirms ist der gemessene (oder klassisch berechnete) Wert der Bestrahlungsstärke proportional der Wahrscheinlichkeit, in diesem Bereich ein Photon zu finden. In Abbildung 1.1 lässt sich verfolgen, wie einzelne Photonen auf einem Schirm auftreffen. Das Bild wurde mithilfe eines speziellen Photovervielfachers gewonnen. Um die photonische Natur der Strahlung noch anschaulicher zu machen, wollen wir das einfallende Licht nun mit einem ganz anderen, gewöhnlicheren fotografischen Verfahren registrieren. In einer fotografischen Emulsion befinden sich fein verteilte, mikroskopisch kleine (ca. 10−6 m) Silberhalogenid-Kristalle, die jeweils ungefähr 1010 Silberatome enthalten. Bei der Wechselwirkung eines solchen Kristalls mit einem einzelnen Photon kann eine Silber-Halogen-Bindung gespalten und damit ein Silberatom freigesetzt werden. Ein oder mehrere solche Atome bilden einen Entwicklungskeim in der belichteten Schicht. Zur Entwicklung setzt man den Film einer reduzierenden Chemikalie aus, welche die belichteten Kristalle löst und an ihrer Stelle ein Körnchen aus elementarem Silber hinterlässt. Abbildung 3.21 zeigt eine Serie von Bildern mit zunehmender Belichtung. Bei sehr schwachem Licht mit nur wenigen tausend einfallenden Photonen entstehen ungefähr ebenso viele Silberkörnchen, die ein Muster bilden, das nur entfernt an das fotografier-

3 Theorie des Elektromagnetismus, Photonen und Licht

120

Abb. 3.21: Diese elektronisch verstärkten Fotos beweisen eindrucksvoll, dass einzelne „Lichtteilchen“ mit der Materie in Wechselwirkung treten. Bei extrem geringer Beleuchtung sieht man ein Muster fast zufällig verteilter Photonen (jeder Punkt entspricht einem Photon); bei wachsender Lichtstärke tritt die quantisierte Natur des Prozesses immer mehr in den Hintergrund. (Siehe Advances in Biological and Medical Physics V, 1957, 211–242.) (Mit frdl. Genehmigung der Radio Corporation of America.)

te Gesicht erinnert. Bei steigender Photonenzahl (mit jedem Bild um etwa den Faktor zehn) wird das Bild immer klarer und besser erkennbar. Wirken viele Millionen Photonen bei der Entstehung des Bildes mit, so erscheint dieses gewohnt kontinuierlich; die statistische Natur des Photonenstrahls ist nicht mehr erkennbar. Photonenzählung Kann über die statistische Natur eines Photonenstroms, den wir als Lichtstrahl sehen, überhaupt irgendetwas ausgesagt werden? Um diese Frage zu beantworten, haben sich Forscher Experimente überlegt, um einzelne Photonen buchstäblich zu zählen. Sie stellten dabei fest, dass das Muster der ankommenden Photonen von der Lichtquelle abhängt.7 Die theoretischen Details wollen wir an dieser Stelle nicht näher beleuchten, aber es ist recht interessant, zumindest die Ergebnisse für zwei Extremfälle zu betrachten – für das kohärente und das chaotische Licht. 7

Siehe P. Koczyk, P. Wiewior und C. Radzewicz, „Photon counting statistics – Undergraduate experiment“, Am. J. Phys. 64(3), 240 (1996) sowie A. C. Funk und M. Beck, „Sub-Poissonian photocurrent statistics: Theory and undergraduate experiment“, Am. J. Phys. 65 (6), 492 (1997).

3.3 Energie und Impuls

121

t Zeit gezählte Photonen

t 0

Zeit

Abb. 3.22: Ergebnis der Photonenzählung bei konstanter optischer Leistung: Die einzelnen Photonen kommen völlig unabhängig voneinander am Detektor an.

Anzahl der Intervalle, in denen N Photonen gezählt wurden

Leistung

P (t)

10 000 5000 2500 0

50

100

N

Abb. 3.23: Das Balkendiagramm zeigt eine typische Wahrscheinlichkeits- oder Photonenzahlverteilung für einen Lichtstrahl konstanter Bestrahlungsstärke.

Betrachten wir einen idealen, kontinuierlichen Laserstrahl mit konstanter Bestrahlungsstärke; wir erinnern uns, dass Letztere nach Gleichung (3.46) eine zeitgemittelte Größe ist. Konstant ist dann auch die optische Leistung P , ebenfalls eine zeitgemittelte Größe, und gemäß Gleichung (3.49) ist der mittlere Photonenfluss des Strahls gleich Φ. Abbildung 3.22 zeigt die zufällige Verteilung der eintreffenden Photonen auf einer Zeitskala, die klein gegen das Intervall ist, innerhalb dessen die Bestrahlungsstärke gemittelt wird. Für die makroskopische Größe P misst man daher einen konstanten Wert, obwohl die zugrundeliegende Energieübertragung ein diskontinuierlicher Prozess ist. Nun schicken wir den Strahl durch eine Blende, die während einer kurzen Messzeit T (etwa 10 µs bis 10 ms) geöffnet bleibt, und zählen die Photonen, die in dieser Zeit am Photodetektor ankommen. Dies wiederholen wir nach jeweils einer kurzen Pause etliche zehntausend Mal. Das Ergebnis ist in dem Balkendiagramm in Abbildung 3.23 dargestellt – hier ist die Anzahl der Versuche, bei denen N Photonen gezählt wurden, in Abhängigkeit von N aufgetragen. Nur in wenigen Versuchen zählt man sehr wenige oder sehr viele Photonen. Die mittlere Anzahl der auftreffenden Photonen beträgt Nav = ΦT = P T /hν0 . Die Form des Diagramms, die man mithilfe der Wahrscheinlichkeitstheorie herleiten kann, ähnelt stark der bekannten Poisson-Verteilung. Der Graph repräsentiert die Wahrscheinlichkeit, innerhalb eines Versuchsintervalls T kein Photon, ein Photon, zwei Photonen und so weiter zu zählen. Eine Poisson-Verteilung mit dieser symmetrischen Gestalt erhält man auch, wenn man die Teilchen zählt, die von einer radioaktiven Probe mit langer Halbwertszeit in einem bestimmten Intervall zufällig ausgesendet werden, oder wenn man die Regentropfen zählt, die während eines gleichmäßigen Schauers auf eine bestimmte Fläche fallen. Auch die Wahrscheinlichkeit, mit einer Münze „Kopf“ zu werfen, aufgetragen gegen die Zahl der bei über ca. 20 Würfen insgesamt geworfenen Köpfe (N ), ist eine Poisson-Verteilung: Die höchste Wahrscheinlichkeit bei Nmax = 20 tritt in der Nähe des Mittelwerts Nmit auf, genauer gesagt, bei 12 Nmax = 10; die geringsten Wahrscheinlichkeiten findet man für N = 0 und N = 20. Am wahrscheinlichsten ist es, bei 20

3 Theorie des Elektromagnetismus, Photonen und Licht

122

Versuchen 10-mal „Kopf“ zu werfen; die Wahrscheinlichkeit, niemals „Kopf“ oder niemals „Zahl“ zu werfen, ist dagegen verschwindend klein. Wie das Licht in einem idealen Laser auch immer entsteht – allem Anschein nach handelt es sich dabei um einen Strom von Photonen, die zufällig und statistisch unabhängig voneinander am Ziel eintreffen. Aus Gründen, die noch erläutert werden, ist ein idealer monoenergetischer Strahl – eine monoenergetische ebene Welle – der Inbegriff des so genannten kohärenten Lichts. Es überrascht nicht, dass die statistische Verteilung der Anzahl der ankommenden Photonen von der Natur ihrer Quelle abhängt. Diese Verteilung unterscheidet sich grundlegend für eine ideale kohärente Quelle als das eine Extrem und eine vollständig inkohärente oder chaotische Quelle als das andere Extrem. Ein stabilisierter Laser ist eine näherungsweise kohärente Quelle, thermische Lichtquellen wie etwa eine Glühlampe, ein Stern oder eine Gasentladungslampe dagegen sind näherungsweise chaotisch. Bei gewöhnlichem Licht treten Fluktuationen in der Bestrahlungsstärke und daher auch in der optischen Leistung auf. Diese Fluktuationen sind korreliert (Abb. 3.24), was entsprechend auch auf die (obwohl zeitlich zufällige) zugehörige Anzahl emittierter Photonen zutrifft. Je größer die optische Leistung ist, desto größer ist auch die Anzahldichte der Photonen. Da die Ankunft der Photonen auf dem Detektor nicht als zufällige Folge voneinander unabhängiger Ereignisse angesehen werden kann, muss die Bose-Einstein-Statistik angewendet werden (Abb. 3.25). Die wahrscheinlichste Trefferzahl in einem gegebenen Intervall ist hier null, im Falle von Laserlicht entspricht sie dagegen der mittleren gemessenen Trefferzahl. Ein Laserstrahl und ein Strahl gewöhnlichen Lichts sind aus diesem Grunde voneinander unterscheidbar, selbst wenn ihre Bestrahlungsstärke und ihr Frequenzspektrum übereinstimmen – ein Befund, der über die klassische Theorie hinausgeht. Gequetschtes Licht Ein Lichtfeld kann durch seine Stärke (also die Amplitude oder die Energie) und seine Phase gekennzeichnet werden. Dementsprechend ist es hilfreich, das Lichtfeld durch einen Zeiger darzustellen, der ebenfalls eine Amplitude und eine Phase hat. Die Quantentheorie besagt jedoch, dass mit beiden Größen eine inhärente Unbestimmtheit verbunden ist. Wenn alles andere konstant gehalten wird, werden aufeinanderfolgende

Leistung

P (t)

t Zeit gezählte Photonen

0

Zeit

Abb. 3.24: Mit einer thermischen Quelle erhält man eine zeitlich variierende optische Leistung und das durch die weißen Linien dargestellte Muster der gezählten Photonen. Man sieht jetzt korrelierte Fluktuationen, da die einzelnen Photonen nicht mehr unabhängig voneinander ankommen. Die Tatsache, dass es zu einer Clusterbildung kommt, wird als „Photon Bunching“ bezeichnet.

Wahrscheinlichkeit, in einem Intervall T genau N Photonen zu zählen

3.3 Energie und Impuls

123

Poisson

Bose-Einstein 0

Nmit

N

Abb. 3.25: Poisson- und Bose-Einstein-Verteilung bei der Photonenzählung.

Messungen jeder dieser Größen leicht verschiedene Werte liefern, sodass es stets eine gewisse Nichtdeterminiertheit gibt. Sowohl die Länge als auch die Richtung des Zeigers, welcher das optische Feld repräsentiert, werden immer etwas verschmiert sein. Außerdem sind die beiden Konzepte auf eine spezielle Weise miteinander verbunden, die an das heisenbergsche Unschärfeprinzip erinnert: Die Nichtdeterminiertheit der Energie, das Verschmieren der Messwerte, ist umgekehrt proportional zur Nichtdeterminiertheit der Phase. Das Produkt aus beiden muss größer als der Minimalwert h/4π (oder bestenfalls gleich diesem) sein, der durch die plancksche Konstante festgelegt ist. Die Größe h/4π ist auch als Wirkungsquantum bekannt, da sie allen Änderungen eine untere Grenze setzt. Diese Art der Verwandschaft sollte nicht überraschend sein für zwei Konzepte, die so eng miteinander verbunden sind. Für das Licht einer Glühlampe ist das Produkt der Unbestimmtheiten viel größer als h/4π. Für Laserlicht dagegen sind die Unbestimmteiten tendenziell sehr klein und miteinander vergleichbar. Tatsächlich kann für einen gut stabilisierten Laserstrahl das Produkt der Unbestimmtheiten den Wert h/4π erreichen. Alle Bemühungen, den Schwankungsbereich bei der Messung der Amplitude zu verringern, werden zu einem größeren Verschmieren bei der Messung der Phase führen. Umgekehrt gilt natürlich das Gleiche. Abbildung 3.22 zeigt für weißes Licht aus einem Dauerstrichlaser das Eintreffen der Photonen. Wenn wir die einfallende Energie über ein angemessen langes Zeitintervall mitteln, erweist sich die Bestrahlungsstärke als relativ konstant. Dabei ist klar, dass es sehr wohl schnelle Fluktuationen gibt – das zufällige Durcheinander unkorrelierter Photonen, das als Quantenrauschen oder auch Schrotrauschen bekannt ist. Tatsächlich wird es in einem Lichtstrahl immer Fluktuationen geben, ebenso wie in jeder anderen Art von Strahl. Von Laserlicht sagt man, dass es sich in einem kohärenten Zustand oder Glauber-Zustand befibndet (nach Roy Glauber, der 2005 mit dem Nobelpreis für Physik ausgezeichnet wurde). Die Photonen clustern nicht allzu sehr, und folglich kommt es kaum zum so genannten Photon Bunching. In Abbildung 3.24 ist die Situation eine andere. Hier kommt das thermische Licht von einer chaotischen (oder thermischen) Quelle, und in den stärker ausgeprägten Fluktuationen der Bestrahlungsstärke manifestiert sich das zugrundeliegende Bunching der Lichtquanten.

124

3 Theorie des Elektromagnetismus, Photonen und Licht

Man könnte erwarten, dass Schrotrauschen das schwächste Rauschen ist, das ein Strahl aufweisen kann, und gut stabilisierte Laser erreichen tatsächlich dieses Niveau. Nichtsdestoweniger ist es heute möglich, das Voranschreiten der Photonen in einem Laserstrahl noch gleichmäßiger zu machen. Solches hochorganisiertes Licht, das unter der Bezeichnung amplitudengequetschtes Licht bekannt ist, hat eine sehr schmale Photonenverteilung (Abb. 3.25), da fast alle gleich großen Sampling-Intervalle ziemlich genau die gleiche Anzahl von Photonen aufnehmen. Die resultierende Kurve ist eine Sub-Poisson-Verteilung. Die Photonen kommen in nahezu gleichmäßigen Zeitabständen nacheinander an, immer eins nach dem anderen. Dieses Muster wird als Anti-Bunching bezeichnet. Die Beobachtung von Licht mit Sub-Poisson-Verteilung wird allgemein als direkter Nachweis der Existenz von Photonen betrachtet. Das Resultat der Amplitudenquetschung ist ein Strahl von „nichtklassischem Licht“ mit nahezu konstanter Bestrahlungsstärke und stark reduziertem Photonenrauschen. Tatsächlich ist das Rauschniveau niedriger als das mit der Existenz unabhängiger Photonen verbundene Schrotrauschen. Ein bemerkenswerter Aspekt im Zusammenhang mit gequetschtem Licht ist daher, dass die Photonen Quantenkorrelationen zeigen; sie sind nicht völlig unabhängig voneinander. Natürlich verbreitern wir durch das Quetschen der Unbestimmtheit in der Amplitude die Unbestimmtheit in der Phase, doch das ist bei den meisten heutigen Anwendungen kein Thema. Wir können gequetschtes oder nicht-klassisches Licht als Licht definieren, bei dem die beiden Unbestimmtheiten deutlich verschieden sind. Die Erforschung von gequetschtem Licht begann erst in den 1980er-Jahren und es ist Forschungsgruppen, die sehr glatte Strahlen benötigen, bereits gelungen, das Photonenrauschen um bis zu 90 % zu reduzieren.

3.3.4 Strahlungsdruck und Impuls Johannes Kepler vermutete bereits 1619, der Druck des Sonnenlichts sei dafür verantwortlich, dass der Schweif eines Kometen stets von der Sonne wegzeigt. Besonders bei den späteren Befürwortern der Korpuskulartheorie des Lichts fand dieses Argument Anklang, denn diese stellten sich einen Lichtsstrahl als Teilchenstrom vor, der ganz offensichtlich eine Kraft ausübt, wenn er auf Materie trifft. Eine Zeit lang schien es, als ob dieser Effekt letztlich die Überlegenheit der Korpuskulartheorie über die Wellentheorie besiegelte – doch alle Versuche, diese Strahlungskraft nachzuweisen, scheiterten, weshalb das Interesse an diesem Thema langsam schwand. Ausgerechnet Maxwell griff die Idee 1873 wieder auf, indem er nachwies, dass Wellen tatsächlich eine Kraft ausüben. „In einem Medium, in dem sich Wellen fortpflanzen“, schrieb er, „gibt es senkrecht zu den Wellenfronten einen Druck, dessen Zahlenwert gleich demjenigen der Energie pro Volumeneinheit ist.“ Trifft eine elektromagnetische Welle auf einen Stoff, so tritt sie mit den Ladungen im Inneren des Materials in Wechselwirkung. Gleichgültig, ob die Welle teilweise absorbiert oder vollständig reflektiert wird, übt sie auf die Ladungen und damit auf die Oberfläche selbst eine Kraft aus. Handelt es sich bei dem Stoff beispielsweise um

3.3 Energie und Impuls

125

einen guten elektrischen Leiter, so erzeugt das elektrische Feld der Welle Ströme und diese wiederum Magnetfelder, die ihrerseits eine Kraft auf die Ströme ausüben. Die resultierende Kraft lässt sich mithilfe der klassischen elektromagnetischen Theorie berechnen. Aus dem zweiten newtonschen Gesetz (welches besagt, dass die Kraft gleich der Geschwindigkeit der Impulsänderung ist) folgt, dass die Welle selbst einen Impuls trägt. Tatsächlich kann man vernünftigerweise annehmen, dass jedem Energiefluss ein Impuls zugeordnet ist: Jede Bewegung besitzt einen Zeit- und einen Ortsaspekt. Maxwell zeigte, dass der Strahlungsdruck P gleich der Energiedichte der elektromagnetischen Welle ist. Gemäß den Gleichungen (3.31) und (3.32) für das Vakuum ist uE =

0 2 E 2

und

uB =

1 2 B . 2μ0

Wegen P = u = uE + uB ist P=

1 2 0 2 E + B . 2 2μ0

Alternativ können wir den Druck mithilfe von Gleichung (3.37) auch in Abhängigkeit vom Betrag des Poynting-Vektors schreiben: S (t) . (3.50) c Zu beachten sind die Einheiten der beiden Seiten dieser Gleichung: Leistung pro Fläche und Geschwindigkeit oder (äquivalent) Kraft mal Geschwindigkeit geteilt durch Fläche und Geschwindigkeit (bzw. einfach Kraft pro Fläche). Dies entspricht dem Momentandruck, der auf eine vollständig absorbierende Fläche durch einen senkrecht zu ihr einfallenden Strahl ausgeübt wird. P (t) =

Da sich E- und B-Feld schnell verändern, verändert sich auch S (t) schnell; es ist daher sehr praktisch, einen mittleren Strahlungsdruck, angegeben in Newton pro Quadratmeter, einzuführen: S (t) T I = . c c Derselbe Druck wirkt auf eine Quelle, die selbst Energie abstrahlt. P (t) T =

(3.51)

Kommen wir auf Abbildung 3.16 zurück: Ist p der Impuls, so ist die von dem Strahl auf eine absorbierende Oberfläche ausgeübte Kraft gleich Δp . (3.52) Δt Ist pV gleich dem Impuls pro Volumeneinheit der Strahlung, so wird in jedem Zeitintervall Δt ein Impuls Δp = pV (c Δt A) auf A übertragen, und AP =

AP =

S pV (c Δt A) =A . Δt c

3 Theorie des Elektromagnetismus, Photonen und Licht

126

Zwei winzige Windrädchen von ca. 5µm Durchmesser (was etwa 1/15 des Durchmessers eines menschlichen Haares ist). Diese mikroskopischen Rädchen sind so klein, dass sie durch den Druck eines Lichtstrahls gedreht werden können. (Galajda und Ormos, Ungarische Akademie der Wissenschaften)

Die Volumendichte des elektromagnetischen Impulses ist folglich pV =

S . c2

(3.53)

Beispiel 3.4 In einem homogenen, isotropen, linearen Dielektrikum zeigt der PoyntingVektor in die Richtung des Impulses einer ebenen Welle. Zeigen Sie, dass die Volumendichte des Impulses allgemein durch den Vektor pV = E × B ausgedrückt werden kann. Beweisen Sie anschließend, dass für die ebene Welle aus Beispiel 3.1 gilt  pV = E02 sin2 k(z − vt) k . v Lösung Gemäß Gleichung (3.39) ist S=

1 E × B. μ

Nach Gleichung (3.53) gilt in einem Dielektrikum, in dem die Geschwindigkeit der Welle v ist, pV =

S , v2

und mit S=

1 E×B μ

3.3 Energie und Impuls

127

ergibt dies pV =

μ E × B = E × B. μ

Für eine ebene, in z-Richtung propagierende Welle ist E = E0 sin k(z − vt) . Unter Verwendung der Ergebnisse aus Beispiel 3.1 erhalten wir pV =

S  = E02 sin k(z − vt) k . 2 v v

Reflektiert die beleuchtete Oberfläche das einfallende Licht vollständig und hat der einfallende Strahl die Geschwindigkeit c, so hat der reflektierte Strahl die Geschwindigkeit −c. Dies ist genau das Doppelte der Impulsänderung, die bei der Absorption auftrat; damit erhalten wir S (t) T . c Beachten Sie dabei, dass aus den Gleichungen (3.50) und (3.52) folgt: Wenn eine Energiemenge E pro Quadratmeter und Sekunde transportiert wird, so wird auch der zugehörige Impuls von E/c pro Quadratmeter und Sekunde übertragen. P (t) T = 2

Im Photonenbild ist jedem Strahlungsquant eine Energie E = hν zugeordnet. Daraus folgt, dass wir für ein Photon einen Impuls vom Betrag h E = c λ erwarten. Sein Impulsvektor ist dann p=

(3.54)

p = k mit k als Ausbreitungsvektor und  = h/2π. Alle diese Aussagen lassen sich gut mit der speziellen Relativitätstheorie vereinbaren, die zwischen der Masse m, der Energie und dem Impuls eines Teilchens den Zusammenhang

 2 1/2 E = (cp)2 + mc2 herstellt. Für ein Photon ist m = 0 und E = cp. Mithilfe des Compton-Effekts wurden diese quantenmechanischen Vorstellungen experimentell bestätigt, indem die Energie und der Impuls bestimmt wurden, die bei der Wechselwirkung eines Elektrons mit einem einzelnen Röntgenphoton auf das Elektron übertragen werden (siehe das Foto auf S. 114).

3 Theorie des Elektromagnetismus, Photonen und Licht

128

Die mittlere Flussdichte elektromagnetischer Energie, die von der Sonne ausgehend senkrecht auf eine Fläche unmittelbar außerhalb der Erdatmosphäre fällt, beträgt ungefähr 1400 W/m2 . Geht man von der vollständigen Absorption dieser Strahlung aus, so erhält man einen Strahlungsdruck von 4,7×10−6 N/m2 ; der Atmosphärendruck beträgt zum Vergleich ungefähr 105 N/m2 . Man sieht, dass der Druck der Sonnenstrahlung auf die Erde winzig klein ist, aber immerhin entspricht er, für den gesamten Planeten summiert, rund zehn Tonnen. Selbst direkt auf der Oberfläche der Sonne ist der Strahlungsdruck relativ gering (siehe Aufgabe 3.40). Innerhalb des glühenden Sterns ist der Druck erwartungsgemäß merklich größer; er spielt eine nicht unbedeutende Rolle als stabilisierende Gegenkraft zur Gravitation. Obwohl die von der Sonne ausgehende Flussdichte recht gering ist, kann sie sich – über längere Zeiträume betrachtet – durchaus bemerkbar machen. Hätte man sie beispielsweise bei der Berechnung der Flugbahn der Viking-Sonde nicht berücksichtigt, so hätte der Raumflugkörper den Mars um 15 000 km verfehlt. Berechnungen zeigen, dass sich der Strahlungsdruck der Sonne sogar zum Antrieb eines Raumfahrzeugs innerhalb der Umlaufbahnen der inneren Planeten ausnutzen lässt.8 Vielleicht durchpflügen eines Tages gewaltige Raumschiffe mit riesigen reflektierenden Segeln, angetrieben vom Druck der Sonnenstrahlung, den dunklen Ozean unseres Sonnensystems. Der von Licht ausgeübte Druck wurde bereits 1901 von dem russischen Experimentator Pjotr Nikolajewitsch Lebedev (1866–1912) und, unabhängig davon, von den Amerikanern Ernest Fox Nichols (1869–1924) und Gordon Ferrie Hull (1870–1956) gemessen. In Anbetracht der damals verfügbaren Lichtquellen vollbrachten die drei Forscher eine großartige Leistung. Heute kann man einen Laserstrahl so weit fokussieren, dass sich sein Radius dem theoretischen Grenzwert von einer Wellenlänge nähert. Die Bestrahlungsstärke und daher auch der Druck sind beträchtlich, selbst wenn die Leistung des Lasers nur wenige Watt beträgt. Daher berücksichtigt man den Strahlungsdruck inzwischen bei den verschiedensten Anwendungen von der Isotopentrennung und Teilchenbeschleunigung und dem Kühlen und Einfangen von Atomen (Abschn. 3.4.4) bis hin zum Anheben kleiner Objekte durch Licht (Foto S. 129). Licht kann auch einen Drehimpuls mit sich führen, was allerdings eine Reihe von Fragen aufwirft, die wir in Abschnitt 8.1.5 behandeln werden.

3.4

Strahlung

Obwohl sich alle Formen elektromagnetischer Strahlung im Vakuum mit derselben Geschwindigkeit fortpflanzen, unterscheiden sie sich in ihren Wellenlängen und Frequenzen. Wir teilen das elektromagnetische Spektrum in verschiedene Gebiete – etwa die Radiowellen, die Mikrowellen, die Infrarotstrahlung usw. – ein. Dabei dürfen wir jedoch nicht vergessen, dass alle elektromagnetischen Wellen ihrer Natur nach gleich 8

Der „Sonnenwind“ genannte Strom geladener Teilchen ist als Antriebsmedium für ein Raumfahrzeug 1000- bis 100 000-mal weniger effektiv als das Sonnenlicht.

3.4 Strahlung

129

Das winzige Sternchen ist ein Glaskügelchen mit einem Durchmesser von weniger als drei Hundertstel Millimetern. Es wird von einem nach oben gerichteten Laserstrahl (250 mW) in der Luft gehalten. (Mit frdl. Genehmigung der Bell Laboratories.)

sind: Die maxwellschen Gleichungen gelten unabhängig von der Wellenlänge. Daher ist die Frage naheliegend, welcher gemeinsame Mechanismus der Ursprung all dieser Arten von elektromagnetischer Strahlung sein könnte. Die Antwort ist, dass es ungleichförmig bewegte (beschleunigte) Ladungen sind, was nicht besonders überrascht, wenn wir bedenken, dass wir uns mit Wellen im elektromagnetischen Feld beschäftigen und dass dieses Feld von Ladungen aufgebaut wird. Zu einer stationären Ladung gehört ein konstantes elektrisches Feld; ein Magnetfeld entsteht nicht, also wird auch keine Strahlung ausgesendet – woher sollte die dafür notwendige Energie auch kommen? Eine gleichförmig bewegte Ladung hat sowohl ein elektrisches als auch ein Magnetfeld, strahlt aber ebenfalls nicht: Bewegte man sich gemeinsam mit der Ladung, so verschwände der Strom und damit B, und wir wären wieder beim vorangegangenen Fall, denn eine gleichförmige Bewegung ist stets relativ. Diese Überlegung ist vernünftig: Es ergäbe keinen Sinn, wenn eine Ladung sofort aufhörte zu strahlen, sobald sich der Beobachter mit ihr gemeinsam fortbewegt. Übrig bleiben noch beschleunigte Ladungen, die ohne jeden Zweifel strahlen. Im Photonenbild wird dies durch die Vorstellung unterstrichen, dass die Wechselwirkung zwischen Materie und Strahlungsenergie letztlich auf der Wechselwirkung zwischen Photonen und Ladungen beruht. Allgemein wissen wir, dass freie (also nicht innerhalb eines Atoms gebundene) Ladungen elektromagnetische Strahlung aussenden, wenn sie beschleunigt werden. Das gilt gleichermaßen für Ladungen, deren Geschwindigkeit sich auf einer geraden Strecke (in einem Linearbeschleuniger) ändert, für Ladungen, die sich auf einer Kreisbahn (z. B. in einem Zyklotron) bewegen, und für Ladungen, die einfach in einer Radioantenne hin- und herschwingen. Jede Ladung, die sich ungleichförmig bewegt, strahlt. Ein freies geladenes Teilchen kann spontan ein Photon absorbieren oder emittieren, und die Zahl der Geräte, die diesen Mechanismus praktisch ausnutzen, wächst ständig – Beispiele sind der Freie-Elektronen-Laser (1977) und das Synchrotron als Strahlungsquelle.

3 Theorie des Elektromagnetismus, Photonen und Licht

130

3.4.1 Linear beschleunigte Ladungen Betrachten wir eine Ladung, die sich mit konstanter Geschwindigkeit bewegt. Sie ist mit einem unveränderlichen radialen elektrischen Feld und einem umgebenden zirkularen Magnetfeld verbunden. Obwohl sich das elektrische Feld in jedem Punkt des Raumes ständig ändert, kann man jeden beliebigen Momentanwert berechnen, indem man einfach davon ausgeht, dass die Bewegung der Feldlinien an die der Ladung gekoppelt ist. Das Feld verformt sich nicht, und daher strahlt die Ladung nicht. Das elektrische Feld einer ruhenden Ladung können wir, wie in Abbildung 3.26 gezeigt, durch gerade Feldlinien darstellen, die gleichmäßig und radial um die Ladung verteilt sind. Bewegt sich die Ladung mit der konstanten Geschwindigkeit v, so bleiben die Feldlinien gerade und radial, aber sie sind nicht mehr gleichmäßig verteilt. Diese Ungleichmäßigkeit tritt allerdings erst bei hohen Geschwindigkeiten in Erscheinung, bei v  c ist sie vernachlässigbar.

v

(a)

(b)

Abb. 3.26: (a) Elektrisches Feld eines ruhenden Elektrons. (b) Elektrisches Feld eines bewegten Elektrons.

Abbildung 3.27 zeigt im Gegensatz dazu die Feldlinien eines Elektrons, das gleichmäßig nach rechts beschleunigt wird. Die Punkte O1 , O2 , O3 und O4 entsprechen den Positionen des geladenen Teilchens nach gleichen Zeitintervallen. Die Feldlinien sind nun gekrümmt – dieser Unterschied fällt sofort ins Auge. Abbildung 3.28 zeigt das Feld eines Elektrons zu einem beliebigen Zeitpunkt t2 . Vor t = 0 befand sich das Teilchen in Ruhe im Punkt O. Bis zum Zeitpunkt t1 wurde die Ladung dann gleichmäßig auf die Geschwindigkeit v beschleunigt, die anschließend konstant gehalten wurde. Wir können erwarten, dass die Feldlinien die Information über diese Beschleunigung in irgendeiner Weise mit sich tragen, und es gibt gute Gründe anzunehmen, dass sich diese Information mit der Geschwindigkeit c fortbewegt. Wäre beispielsweise t2 = 10−8 s, so wäre in keinem Punkt, der weiter als 3 m von O entfernt ist, spürbar, dass sich die Ladung bewegt hat. Alle Feldlinien in diesem Gebiet wären gleichmäßig, gerade und auf O als Zentrum gerichtet, als ob die Ladung noch immer in O ruhte. Zum Zeitpunkt t2 befindet sich das Elektron im Punkt O2 und bewegt sich mit der konstanten Geschwindigkeit v. Die Feldlinien in der Umgebung von O2 müssen dann den in Abbildung 3.26 b gezeigten ähneln. Der gaußsche Satz fordert, dass die Linien außerhalb der Kugel mit dem Radius ct2 mit denen innerhalb der Kugel mit dem Radius c (t2 − t1 ) verbunden sind, weil sich dazwischen keine Ladungen befinden.

3.4 Strahlung

131

3 2 1

Abb. 3.27: Elektrisches Feld eines gleichförmig beschleunigten Elektrons.

Abb. 3.28: Die elektrischen Feldlinien knicken ab.

Offensichtlich werden die Feldlinien verformt, wenn das Teilchen beschleunigt wird: Sie werden geknickt. Die exakte Form der Linien innerhalb dieses Knicks ist hier nicht von Interesse. Wichtig ist, dass das elektrische Feld nun eine transversale Komponente ET besitzt, die sich in Pulsform nach außen hin fortpflanzt. In jedem beliebigen Punkt des Raumes ist das transversale elektrische Feld eine Funktion der Zeit und wird deshalb von einem Magnetfeld begleitet. Die radiale Komponente des elektrischen Feldes fällt mit 1/r 2 ab, die transversale Komponente mit 1/r. In großem Abstand von der Ladung tritt nur noch die transversale Komponente des Pulses signifikant in Erscheinung; man nennt sie das Strahlungsfeld.9 Im Falle einer sich langsam (v  c) bewegenden positiven Ladung kann man zeigen, dass das elektrische und das magnetische Strahlungsfeld proportional sind zu r× (r × a) bzw. (a × r) mit der Beschleunigung a. Für eine negative Ladung gilt, wie in Abbildung 3.29 gezeigt ist, jeweils die Umkehrung. Zu beachten ist dabei, dass die Bestrahlungsstärke eine Funktion von θ ist und dass I (0) = I (180◦ ) = 0 ist, während I (90◦ ) = I (270◦ ) Maxima sind. Am stärksten ist die Energieabstrahlung senkrecht zu der Beschleunigung, welche die Strahlung verursacht. Die Ladung kann nur so viel Energie abstrahlen, wie ihr von außen zugeführt wird. Die Quelle dieser Energie ist die Beschleunigungskraft, die wiederum Arbeit an der Ladung verrichtet. 9

Die Einzelheiten des Rechenweges unter Verwendung der Methode von J. J. Thomson zur Analyse der Knickstelle sind zu finden in J. R. Tessman und J. T. Finnell jr., „Electric Field of an Accelerating Charge“, Am. J. Phys. 35, 523 (1967). Als allgemeines Nachschlagewerk zu diesem Thema empfiehlt sich zum Beispiel Marion und Heald, Classical Electromagnetic Radiation, Kapitel 7.

3 Theorie des Elektromagnetismus, Photonen und Licht

132

E×B B

E

I(θ) r θ

a

(v  c)

B E E×B

Abb. 3.29: Das Strahlungsmuster einer linear beschleunigten Ladung hat die Form eines Torus; im linken Bild wurde dieser aufgeschnitten, um den Querschnitt zu zeigen.

3.4.2 Synchrotronstrahlung Ein freies geladenes Teilchen auf einer beliebig gekrümmten Bahn bewegt sich beschleunigt und strahlt daher. Auf diese Weise lässt sich Strahlungsenergie erzeugen – sowohl in der Natur als auch im Labor. Das Synchrotron, ein in den 1940er-Jahren entwickeltes Gerät, ist eine Strahlungsquelle, die nach diesem Prinzip funktioniert. Schwärme von geladenen Teilchen, in der Regel Elektronen oder Positronen, werden durch die Wechselwirkung mit einem angelegten Magnetfeld auf einer großen, im Wesentlichen kreisförmigen Bahn mit einer exakt gesteuerten Geschwindigkeit bewegt. Die Umlauffrequenz bestimmt dabei die Grundfrequenz der Emission (welche auch Oberschwingungen enthält), die sich mehr oder weniger kontinuierlich nach Wunsch einstellen lässt. Es ist übrigens unumgänglich, mit Teilchenschwärmen zu arbeiten: Ein kontinuierlicher Teilchenstrom strahlt nicht. Die Verteilung der Strahlung, die von einem langsam auf einer Kreisbahn rotierenden Teilchen ausgesendet wird, ähnelt einem Torus (siehe Abb. 3.29). Auch hier ist die Strahlung symmetrisch um a verteilt; der Vektor a entspricht in diesem Fall der zentripetalen Beschleunigung, die nach innen gerichtet auf dem Radius liegt, der vom Mittelpunkt der kreisförmigen Umlaufbahn zur Ladung verläuft. Wieder wird die Energie am stärksten senkrecht zu der sie verursachenden Beschleunigung abgestrahlt. Je höher die Geschwindigkeit ist, desto mehr „sieht“ ein im Laborsystem ruhender Beobachter die rückwärts gerichtete Keule des Strahlungsmusters zusammenschrumpfen, während sich die vorwärts gerichtete Keule in der Bewegungsrichtung dehnt. Bei Geschwindigkeiten nahe c sendet der Teilchenstrom (dessen Durchmesser etwa dem einer Stecknadel entspricht) seine Strahlung hauptsächlich in Richtung eines

3.4 Strahlung

133

v

B

Abb. 3.30: Strahlung einer Ladung, die auf einer Kreisbahn umläuft.

schmalen Kegels aus, der tangential zur Umlaufbahn in die Momentanrichtung von v zeigt (Abb. 3.30). Für v ≈ c ist die Strahlung stark in der Ebene der Bewegung polarisiert. Den Strahlungskegel kann man sich wie einen wenige Millimeter breiten Lichtkegel eines Scheinwerfers vorstellen; er bewegt sich mit dem auf der Bahn kreisenden Teilchenschwarm wie der Lichtkegel eines Zuges, der um eine Kurve fährt. Bei jedem Umlauf blitzt der Strahl einen winzigen Moment lang (< 12 ns) durch eines der vielen Fenster in den Wänden des Gerätes. Wie später noch begründet wird, besteht ein Signal, das nur kurze Zeit andauert, aus einem breiten Frequenzspektrum. So entsteht eine Quelle sehr intensiver, schnell pulsierender Strahlung, deren Frequenz in einem weiten Bereich (vom Infraroten über sichtbares Licht bis zur Röntgenstrahlung) regelbar ist. Mithilfe von Magneten („Wigglern“) kann man erreichen, dass die Elektronen auf ihrer Kreisbahn zu Oszillationen angeregt werden – dabei kommt es zu Ausbrüchen von Röntgenstrahlung äußerst hoher Intensität. Mit einem solchen Strahlenbündel kann man mühelos ein fingerstarkes Loch in eine drei Millimeter dicke Bleiplatte bohren – es ist mehrere hunderttausend Mal leistungsfähiger als die Strahlung eines Röntgengerätes, das etwa ein Zahnarzt benutzt und dessen Leistung nur einen Bruchteil eines Watts beträgt. Bereits 1947 wurde in einem Elektronensynchrotron auf diese Weise Licht erzeugt, was die Betreiber der Beschleuniger anfangs jedoch lediglich für ein energieverschwendendes Ärgernis hielten. Erst Jahrzehnte später erkannte man, dass sich diese

Der erste „Lichtstrahl“, der aus dem UV-Elektronenspeicherring der National Synchrotron Light Source nach außen drang (1982, Brookhaven National Library).

134

3 Theorie des Elektromagnetismus, Photonen und Licht

(a)

(b)

Abb. 3.31: (a) Synchrotronstrahlung aus dem Krebsnebel. In jeder der vier Aufnahmen wird nur der Anteil des Lichts gezeigt, dessen E-Feld in die jeweils angegebene Richtung weist. (Mit frdl. Genehmigung der Observatorien Mount Wilson und Palomar.) (b) Der Krebsnebel in unpolarisiertem Licht.

Art der Lichterzeugung selbst als Forschungsinstrument benutzen lässt (siehe Foto S. 133). Im Weltraum existieren vermutlich Gebiete, die von starken Magnetfeldern durchflutet werden. Geladene Teilchen, die in eine solche „Magnetfalle“ geraten, bewegen sich darin auf kreis- oder spiralförmigen Bahnen und senden Synchrotronstrahlung aus, wenn ihre Geschwindigkeit hinreichend hoch ist. Abbildung 3.31 zeigt fünf Aufnahmen des extragalaktischen Krebsnebels.10 Der Nebel strahlt in einem Frequenzbereich, 10

Man nimmt an, dass der Krebsnebel aus den Überresten eines explodierten Sterns besteht, die in den Weltraum hinausgeschleudert wurden. Aus der Expansionsgeschwindigkeit der Materie berechneten die Astronomen, dass die Explosion im Jahre 1050 stattgefunden haben muss. Dieses Ergebnis wird durch Angaben in alten chinesischen Aufzeichnungen (in der Chronik des Observatoriums Peking) gestützt. Sie berichten von einem extrem hellen Stern in der Himmelsregion, wo sich heute

3.4 Strahlung

135

der von Radiowellen bis zum fernen Ultraviolett reicht. Handelt es sich bei der Quelle tatsächlich um eingefangene zirkulierende Ladungen, so kann man starke Polarisationseffekte erwarten. Diese erkennt man in den ersten vier Fotos, die durch ein Polarisationsfilter aufgenommen wurden. In jedem Bild ist die Richtung des elektrischen Feldvektors eingezeichnet. Da es sich um Synchrotronstrahlung handelt, ist das E-Feld in der Ebene der Umlaufbahn polarisiert, und wir können schließen, dass jedes Foto einer bestimmten, einheitlichen Orientierung des Magnetfelds entspricht – senkrecht jeweils zu den Umlaufbahnen und zu E. Man nimmt an, dass der größte Teil der niederfrequenten Radiowellen, die aus dem Weltraum auf die Erde gelangen, durch Synchrotronstrahlung entstanden ist. 1960 identifizierten Radioastronomen anhand dieser langwelligen Emissionen eine spezielle Klasse kosmischer Objekte, die Quasare. 1955 registrierte man polarisierte Radiowellen vom Jupiter. Als ihren Ursprung erkannte man Elektronen, die sich in den Strahlungsgürteln um den Planeten auf spiralförmigen Bahnen bewegen.

3.4.3 Elektrische Dipolstrahlung Der vielleicht anschaulichste Mechanismus, durch den elektromagnetische Wellen erzeugt werden, ist ein oszillierender Dipol – zwei Ladungen, eine positiv und eine negativ, die entlang einer geraden Linie hin- und herschwingen. Dieser Prozess ist sehr einfach und trotzdem der wichtigste. Sowohl sichtbares Licht als auch ultraviolette Strahlung entsteht hauptsächlich infolge der Umordnung der äußeren, schwach gebundenen Elektronen von Atomen und Molekülen. Aus der quantenmechanischen Betrachtung folgt, dass die Quelle der Strahlung im Wesentlichen das elektrische Dipolmoment des Atoms ist. Die Abstrahlung von Energie durch Materie ist zwar ein quantenmechanischer Vorgang, aber seine Geschwindigkeit lässt sich anhand des klassischen oszillierenden Dipols berechnen. Aus diesem Grunde bildet der schwingende Dipol die Grundlage für das Verständnis der Art und Weise, wie Atome, Moleküle und sogar Atomkerne elektromagnetische Wellen absorbieren und emittieren. Abbildung 3.32 zeigt schematisch die Verteilung des elektrischen Feldes in der Umgebung eines elektrischen Dipols. In dieser Anordnung schwingt eine negative Ladung linear und in einfacher harmonischer Bewegung um eine gleich große, aber stationäre positive Ladung. Ist die Kreisfrequenz der Oszillation gleich ω, so hat das zeitabhängige Dipolmoment p (t) die skalare Form p = p0 cos ωt .

(3.55)

Dabei kann p(t) das Gesamtmoment der oszillierenden Ladung in atomarem Maßstab oder sogar ein oszillierender Strom in einer Fernsehantenne sein. der Krebsnebel befindet: Im ersten Jahr der Periode Chihha, am Tag Chi-chou des fünften Monats [der 4. Juli 1054] erschien ein großer Stern... Nach über einem Jahr verschwand er langsam wieder. Mit großer Wahrscheinlichkeit ist der Krebsnebel das Überbleibsel dieser Supernova.

3 Theorie des Elektromagnetismus, Photonen und Licht

136 x

x

B

x x

x x

x

x x

(a)

x

E

(b)

(c)

(d)

(e)

Abb. 3.32: Das elektrische Feld eines oszillierenden elektrischen Dipols.

Bei t = 0 ist p = p0 = qd, wobei d der anfängliche Maximalabstand zwischen den Ladungsmittelpunkten ist (Abb. 3.32 a). Das Dipolmoment ist ein Vektor, der in die Richtung von −q nach +q zeigt. Abbildung 3.32 enthält eine Folge von Feldlinienbildern, bei denen der Abstand der Ladungen und daher auch das Dipolmoment abnehmen, durch null gehen und dann ihre Richtung umkehren. Wenn die Ladungen einander überdecken, ist p = 0, und die Feldlinien sind in sich geschlossen. In unmittelbarer Umgebung des Atoms hat das E-Feld die Form eines statischen elektrischen Dipols. Etwas weiter außen – in dem Gebiet, wo sich geschlossene Schleifen bilden – gibt es keine spezifische Wellenlänge. Bei der ausführlichen Behandlung erweist sich der Sachverhalt als recht kompliziert, denn das elektrische Feld enthält Beiträge von fünf Termen. Weit vom Dipol entfernt, in der so genannten Wellen- oder Fernzone, nimmt das Feld eine viel einfachere Form an. Dort hat sich eine bestimmte Wellenlänge herausgebildet; E und B sind transversal, stehen senkrecht aufeinander und sind in Phase. Insbesondere ist E=

p0 k2 sin θ cos (kr − ωt) 4π0 r

(3.56)

3.4 Strahlung

137

z

E E×B B r pθ y

Abb. 3.33: Richtungen der Felder eines oszillierenden elektrischen Dipols.

x

und B = E/c; die Felder sind orientiert, wie es in Abbildung 3.33 dargestellt ist. Der Poynting-Vektor S = E × B/μ0 zeigt stets radial nach außen in die Fernzone. Dort sind die Magnetfeldlinien Kreise, die konzentrisch um die Dipolachse angeordnet sind und in einer Ebene senkrecht zu dieser Achse liegen. Dies ist verständlich, da B aus dem zeitlich variierenden Oszillatorstrom entsteht. Die Bestrahlungsstärke (radial von der Quelle nach außen gerichtet) folgt aus Gleichung (3.44) und ist I (θ) =

p20 ω 4 sin2 θ . 32π 2 c3 0 r 2

(3.57)

Auch hier findet man eine umgekehrte Proportionalität zum Abstandsquadrat. Die Winkelverteilung der Flussdichte ist torisch (Abb. 3.29). Die Richtung der Beschleunigung entspricht der Symmetrieachse des Strahlungsmusters. Die Bestrahlungsstärke ist eine Funktion von ω 4 : Mit steigender Frequenz wird die Strahlung stärker. Diese Erkenntnis wird bei der Diskussion der Streuung noch eine Rolle spielen. Eine „Sendeantenne“, in der Ströme freier Elektronen hin- und herschwingen, ist schnell aufgebaut: Man bringt einfach einen Wechselstromgenerator zwischen zwei leitenden Stangen an. Abbildung 3.34 a zeigt eine entsprechende Anordnung, einen gewöhnlichen Langwellen-Sendemast. Besonders effektiv arbeitet eine solche Antenne, wenn ihre Länge der Wellenlänge der übertragenen Strahlung oder, zweckmäßiger, 1 2 λ entspricht. Die abgestrahlte Welle wird am Dipol dann synchron mit dem oszillierenden elektrischen Strom gebildet, der sie erzeugt. Leider sind Langwellen jedoch mehrere hundert Meter lang; die Hälfte des 12 λ-Dipols in Abbildung 3.34 musste man daher notgedrungen in die Erde eingraben. Dadurch beträgt die Höhe der oberirdischen Anlage immerhin nur 14 λ. Außerdem entsteht durch diese Einbeziehung des Erdbodens eine so genannte Bodenwelle, die sich nahe der Oberfläche unseres Planeten fortpflanzt – dort, wo ein Radiohörer üblicherweise seinen Empfänger aufstellt. Die Reichweite eines solchen Radiosenders beträgt ungefähr 40 bis 150 km.

3 Theorie des Elektromagnetismus, Photonen und Licht

138 (a)

E

(b)

E

B

Abb. 3.34: (a) Elektromagnetische Wellen, die von einem Funkturm abgestrahlt werden. (b) Autoantennen ragen oft ungefähr einen Meter weit senkrecht in die Höhe. Das vertikal oszillierende elektrische Feld einer vorbeilaufenden Radiowelle induziert über der Länge der Antenne eine Spannung, die zum Eingangssignal des Empfängers wird.

3.4.4 Die Emission von Licht durch Atome Der wichtigste Mechanismus, der für die natürliche Emission und Absorption von Strahlungsenergie – insbesondere von sichtbarem Licht – verantwortlich ist, beruht auf Ladungen (Elektronen), die innerhalb von Atomen gebunden sind. Die winzigen, negativ geladenen Teilchen umkreisen den schweren positiv geladenen Atomkern in Form einer Art weit entfernter, schwach geladener „Wolke“. Sowohl die chemischen als auch die optischen Eigenschaften werden entscheidend von den Außen- oder Valenzelektronen bestimmt. Der Rest der Wolke bildet „abgeschlossene“, im Wesentlichen inerte Schalen, die nahe am Kern liegen und fest an diesen gebunden sind. In jeder dieser geschlossenen Schalen befindet sich eine bestimmte Anzahl von Elektronenpaaren. Auch wenn nicht vollständig klar ist, was innerhalb des Atoms passiert, wenn es strahlt, wissen wir doch mit einiger Sicherheit, dass die Emission durch eine Umordnung der äußeren Ladungen der Elektronenwolke verursacht wird. Dieser Mechanismus ist die in der Natur vorherrschende Lichtquelle. In der Regel sind die Elektronen eines Atoms in einer bestimmten stabilen Konfiguration angeordnet, die der niedrigsten Gesamtenergie entspricht. Dabei nimmt jedes Elektron das niedrigste ihm zur Verfügung stehende Energieniveau ein; das Atom als Ganzes ist dann in seinem so genannten Grundzustand. Ungestört verharrt das Atom unendlich lange in diesem Zustand, doch durch jegliche Zufuhr von Energie – etwa einen Zusammenstoß mit einem anderen Atom, einem Elektron oder einem Photon – kann das Atom in einen anderen, höher gelegenen Energiezustand angehoben werden. Dabei können die Elektronen nur ganz bestimmte Konfigurationen einnehmen, zu denen jeweils bestimmte Gesamtenergien des Atoms gehören. Neben dem Grundzustand

3.4 Strahlung

139

ΔE = hv E = hv

(a) Grundzustand kurz vor der Anregung

(b) Anregung des Grundzustandes

E = hv Photon

(c) Rückkehr in den Grundzustand unter Emission eines Photons

(d) Grundzustand etwa 10−8 Sekunden später

Abb. 3.35: Die Anregung eines Atoms. (a) Die Energiemenge hν wird dem Atom zugeführt. (b) Exakt diese Energiemenge ist erforderlich, um das Atom in einen angeregten Zustand anzuheben. Daher absorbiert das Atom die Energie und wird angeregt. (c) Das Atom emittiert ein Photon und fällt dadurch nach etwa 10−8 Sekunden in seinen Grundzustand (d) zurück.

sind dies die so genannten angeregten Zustände. Wenn sich mindestens ein Elektron eines Atoms nicht auf seinem niedrigsten Energieniveau befindet, nennt man das Atom angeregt. Dieser Zustand ist instabil und nicht von Dauer. Bei niedrigen Temperaturen findet man die Atome gewöhnlich im Grundzustand. Steigt die Temperatur an, stoßen immer mehr Atome mit ihren Nachbarn zusammen. Dieser Mechanismus führt zu einer Reihe relativ schwacher Anregungen (Glimmentladungen, Flammen, Funken usw.), bei denen nur den äußersten ungepaarten Elektronen Energie zugeführt wird. Wir wollen uns zunächst mit diesen Übergängen äußerer Elektronen beschäftigen, bei denen Licht im sichtbaren sowie im nahen UV- und IRBereich emittiert wird. Wenn auf ein Atom (in der Regel eines seiner Valenzelektronen), auf welche Art auch immer, genügend Energie übertragen wird, so kann das Atom plötzlich zu einem höheren Energieniveau springen (Abb. 3.35). Den schnellen Übergang des Elektrons vom Grundzustand zu einer der nächsthöheren Sprossen seiner (quantisierten) Energieleiter

140

3 Theorie des Elektromagnetismus, Photonen und Licht

nennt man Quantensprung. Dabei ist die bei diesem Prozess aufgenommene Energie stets gleich der Energiedifferenz zwischen Grund- und angeregtem Zustand, und da die Energien dieser Zustände spezifisch und definiert sind, kann ein Atom nur ganz bestimmte Energiemengen aufnehmen: Die Absorption ist quantisiert. Der angeregte Zustand eines Atoms ist ein kurzlebiges Resonanzphänomen. Gewöhnlich fällt das Atom nach etwa 10−9 bis 10−8 Sekunden von selbst in einen Zustand niedrigerer Energie, meist den Grundzustand, zurück, wobei es die Anregungsenergie wieder abgibt. Letzteres kann in Form von Licht oder (besonders in dichten Stoffen) Wärmeenergie, die durch Zusammenstöße zwischen den Atomen des Materials erzeugt wird, erfolgen. (Wie wir in Kürze sehen werden, ist der zuletzt genannte Mechanismus für die Absorption von Licht bei einer Resonanzfrequenz und die Transmission oder Reflexion bei allen anderen Frequenzen verantwortlich – ein Phänomen, dem wir den größten Teil der Farbigkeit unserer Umwelt verdanken.) Ist der Atomübergang von einer Lichtemission begleitet (wie in verdünnten Gasen), so ist die Energie des Photons exakt gleich der vom Atom abgegebenen, quantisierten Energie. Nach ΔE = hν ist sowohl mit dem Photon als auch mit dem Übergang zwischen den beiden speziellen Zuständen eine bestimmte Frequenz, eine so genannte Resonanzfrequenz, verknüpft. Jedes Atom hat etliche solcher Resonanzfrequenzen (mit unterschiedlichen Übergangswahrscheinlichkeiten), bei denen es Energie besonders effizient absorbieren und emittieren kann. Das Atom strahlt ein Energiequantum ab, das wahrscheinlich spontan bei der Verschiebung des Elektrons erzeugt wird. Was während des Übergangs (innerhalb des erwähnten Intervalls von etwa 10−8 Sekunden) genau geschieht, ist noch weitgehend ungeklärt. Trotzdem können wir versuchen, uns den Vorgang zu veranschaulichen: Vielleicht gibt das Elektron seine Energie bei einer allmählich gedämpften Schwingungsbewegung mit der spezifischen Resonanzfrequenz ab. Semiklassisch kann man sich das emittierte Licht dann als kurzen schwingenden Puls oder Wellenzug vorstellen, der weniger als ca. 10−8 Sekunden andauert. Dieses Bild steht im Einklang mit mehreren experimentellen Beobachtungen (siehe Abschn. 7.4.2, Abb. 7.45). Den elektromagnetischen Puls stellt man sich am besten als unlösbar mit dem Photon verbunden vor. In gewisser Hinsicht ist der Puls ein semiklassischer Ausdruck für die Wellennatur des Lichts. Puls und Photon sind aber nicht vollkommen äquivalent: Der elektromagnetische Wellenzug ist ein klassisches Bild, das die Fortpflanzung und räumliche Ausbreitung des Lichts sehr gut beschreibt, aber seine Energie ist nicht quantisiert – und das ist ein wesentliches Merkmal eines Photons. Wenn wir also von Photonenwellenzügen sprechen, steckt hinter diesem Begriff mehr als ein klassischer oszillierender Puls einer elektromagnetischen Welle. Natürlich haben wir den Wellenzug vor allem eingeführt, um eine Grundlage für die Diskussion der Frequenz des Lichts zu schaffen. Dies ist wahrscheinlich das Hauptproblem jedes naiven Photonenmodells: Wo steckt die Frequenz? Die Emissionsspektren von einzelnen Atomen oder von Gasen unter niedrigem Druck, deren Atome nicht merklich miteinander wechselwirken, bestehen aus scharfen „Li-

3.4 Strahlung

141

nien“, also definierten, für die jeweilige Atomsorte charakteristischen Frequenzen. Durch die Bewegung der Atome, Zusammenstöße und ähnliche Vorgänge entsteht immer eine gewisse Frequenzverbreiterung – eine Emissionslinie ist niemals streng monochromatisch. Jeder Übergang eines Atoms zwischen zwei Energieniveaus ist trotzdem durch eine Emission in einem bestimmten engen Frequenzbereich gekennzeichnet. Die Emissionslinien von Festkörpern und Flüssigkeiten, in denen die Atome miteinander in Wechselwirkung treten, sind dagegen stark verbreitert und erscheinen als Frequenzbänder. Bringt man zwei Atome einander sehr nahe, so üben sie aufeinander eine Wirkung aus, und die Energieniveaus beider Atome werden leicht angehoben. In einem Festkörper sind nun sehr viele verschiedene Wechselwirkungen zwischen Atomen möglich, sodass die Energie jedes Niveaus aufgespaltet wird und an deren Stelle nahezu kontinuierliche Energiebänder entstehen. Stoffe dieser Art emittieren und absorbieren in einem weiten Frequenzbereich. Optische Kühlung Photonen sind in der Lage, ihren Impuls auf bewegte Atome oder Ionen zu übertragen und deren Bewegung dadurch drastisch zu beeinflussen. Ungefähr zehntausend aufeinanderfolgende Absorptions- und Emissionszyklen können ein Atom, das sich anfangs mit einer Geschwindigkeit von 700 m/ s bewegte, nahezu vollständig abbremsen. Da die Temperatur allgemein proportional zur mittleren kinetischen Energie der Teilchen des betreffenden Systems ist, nennt man diesen Vorgang optische Kühlung oder Laserkühlung. Auf diese Weise lassen sich Temperaturen im Mikrokelvin-Bereich erreichen. Die Laserkühlung bildet mittlerweile die Grundlage verschiedenster Anwendungen, etwa der Atomuhr, der Atominterferometrie und der Fokussierung von Atomstrahlen. Uns interessiert dieses Gebiet, weil es die Überlegungen aus den Abschnitten 3.3.4 und 3.4.4 auf überzeugende, praxisnahe Weise zusammenführt. Abbildung 3.36 zeigt einen Strahl aus Atomen mit jeweils der Masse m, die sich mit der Geschwindigkeit v bewegen. Auf diesen Strahl trifft ein entgegengesetzt gerichteter Laserstrahl; der Fortpflanzungsvektor der Laserphotonen sei kL . Die Laserfrequenz νL wird unmittelbar unterhalb der Resonanzfrequenz v0 der Atome gewählt. Infolge seiner Eigenbewegung „sieht“ jedes einzelne Atom die ankommenden Photonen mit einer durch den Doppler-Effekt um den Betrag |kL · v| /2π = νL (1 + v/c) nach oben verschobenen Frequenz.11 Stellt man die Laserfrequenz so ein, dass ν0 = νL (1 + v/c) ist, so erfolgen die Zusammenstöße zwischen Atomen und Photonen resonant. Dabei überträgt jedes Photon seinen Impuls kL auf das absorbierende Atom, dessen Geschwindigkeit dadurch um Δv abnimmt, wobei gilt mΔv = kL . 11

Betrachten wir einen Beobachter, der sich mit der Geschwindigkeit v0 auf eine Quelle zubewegt, die Wellen mit der Geschwindigkeit v und der Frequenz νQ aussendet. Infolge des Doppler-Effekts nimmt der Beobachter die Wellen mit der Frequenz ν0 = νQ (v + v0 ) wahr. Weitere Einzelheiten finden Sie in nahezu allen einführenden Lehrbüchern der Physik, beispielsweise in E. Hecht, Physics: Calculus; Abschn. 11.11.

3 Theorie des Elektromagnetismus, Photonen und Licht

142

v

kL Photonen

Atome m

Abb. 3.36: Bei der Laserkühlung trifft ein Atomstrahl mit einem Laserstrahl zusammen.

Die Atomwolke ist nicht sehr dicht; jedes angeregte Atom kann unter spontaner Emission eines Photons mit der Energie hν0 in den Grundzustand zurückkehren. Diese Emission erfolgt in zufällige Richtung, und so geht – trotz des Rückstoßes – der im Laufe von Tausenden Absorptions-Emissions-Zyklen im Mittel zurückgewonnene Impuls gegen null. Die Impulsänderung des Atoms während jedes Zyklus ist dann effektiv kL ; das Atom wird langsamer. In jedem Zyklus (aus dem Blickwinkel eines im Laborsystem ruhenden Beobachters) absorbiert das Atom ein Photon mit der Energie hνL , emittiert ein Photon mit der Energie hν0 und verliert dabei die kinetische Energie hνL v/c, die proportional zur Doppler-Verschiebung ist. Bewegt sich ein Atom hingegen in die entgegengesetzte Richtung – also von der Lichtquelle weg –, so „sieht“ es die Photonen mit einer Frequenz von νL (1 − v/c), die hinreichend weit von ν0 entfernt ist, um keine (oder wenig) Absorption und keinen Impulsübertrag zu erlauben. Beachten Sie, dass der Strahlungsdruck frequenzabhängig ist und dass die auf die Atome wirkende Kraft über den Doppler-Effekt mit der Geschwindigkeit verknüpft ist. Deshalb müssen ν0 und νL in einem geeigneten Verhältnis gehalten werden, wenn v abnimmt. Um dies zu bewerkstelligen, gibt es verschiedene geschickte Verfahren.

3.5

Licht in Materie

Von besonderer Bedeutung für die Optik ist die Reaktion von Dielektrika und Nichtleitern auf elektromagnetische Felder. Wir werden uns mit den verschiedensten durchsichtigen dielektrischen Stoffen in Form von beispielsweise Linsen, Prismen, Platten und Filmen und selbstverständlich auch mit der uns umgebenden Luft beschäftigen. Bringt man ein homogenes, isotropes Dielektrikum in ein Vakuum, so wird in den maxwellschen Gleichungen 0 zu  und μ0 zu μ. Die Phasengeschwindigkeit im Medium wird dann zu 1 (3.58) v=√ . μ

3.5 Licht in Materie

143

Das Zahlenverhältnis zwischen der Geschwindigkeit einer Welle im Vakuum und derjenigen in einem Medium heißt absoluter Brechungsindex n und ist gegeben durch  μ c . (3.59) n≡ =± v 0 μ 0 Mithilfe der Dielektrizitätskonstante und der relativen Permeabilität des betreffenden Stoffes kann man n durch n = ± KE KM (3.60) ausdrücken, wobei n gewöhnlich positiv ist. Es gibt magnetische Stoffe, die im Infrarot- und im Mikrowellenbereich des elektromagnetischen Spektrums durchlässig sind. Aber wir interessieren uns vorrangig für Stoffe, die für sichtbares Licht transparent sind. Diese sind alle mehr oder weniger „unmagnetisch“, und KM weicht nur um wenige Zehntausendstel von 1,0 ab; beispielsweise ist für Diamant KM = 1,0 − 2,2 × 10−5 . Setzt man in Gleichung (3.60) KM = 1,0, so erhält man die so genannte Maxwell-Relation (3.61) n ≈ KE . Dabei ist KE die statische Dielektrizitätskonstante. Wie aus Tabelle 3.2 hervorgeht, ist diese Beziehung lediglich für einige einfache Gase eine gute Näherung. Das Problem liegt darin, dass KE und daher auch n in Wirklichkeit von der Frequenz abhängen. Diese Abhängigkeit des Brechungsindex von der Wellenlänge (Farbe) des eingestrahlten Lichts ist ein bekannter, wichtiger Effekt, der als Dispersion bezeichnet wird. Da die Ursache der Dispersion auf mikroskopischem Niveau zu suchen ist, wird der Effekt von den maxwellschen Gleichungen nicht erfasst. Isaac Newton zerlegte bereits vor 300 Jahren weißes Licht mithilfe von Prismen in seine verschiedenfarbigen Bestandteile – er konnte die Dispersion zwar noch nicht erklären, kannte sie aber. Tabelle 3.2: Die Maxwell-Relation.

Gase bei 0 ◦ C, 1013 hPa √ KE n Substanz

Flüssigkeiten bei 20 ◦ C √ Substanz KE n

Festkörper bei 20 ◦ C √ Substanz KE n

Luft Helium Wasserstoff Kohlendioxid

Benzol Wasser Ethanol Tetrachlorkohlenstoff Schwefelkohlenstoff

Diamant Bernstein Quarzglas Natriumchlorid

1,000 294 1,000 034 1,000 131 1,000 49

1,000 293 1,000 036 1,000 132 1,000 45

1,51 8,96 5,08 4,63

1,501 1,333 1,361 1,461

5,04

1,628

4,06 1,6 1,94 2,37

2,419 1,55 1,458 1,50

Die Werte von KE entsprechen den niedrigsten möglichen Frequenzen; das sind in einigen Fällen nur 60 Hz. Die Messung von n erfolgte jeweils bei ungefähr 0,5 × 1015 Hz, das verwendete Licht stammt aus einer Natriumdampflampe (λ = 589,29 nm).

3 Theorie des Elektromagnetismus, Photonen und Licht

144

Beispiel 3.5 Eine elektromagnetische Welle pflanzt sich in einem homogenen Dielektrikum mit einer Frequenz von ω = 2,10 × 1015 rad/s und k = 1,10 × 107 rad/m fort. Das elektrische Feld der Welle ist E = (180 V/m) ˆj ei(kx−ωt) . Bestimmen Sie (a) die Richtung von B, (b) die Geschwindigkeit der Welle, (c) das zugehörige B-Feld, (d) den Brechungsindex, (e) die Dielektrizitätskonstante und (f) die Bestrahlungsstärke der Welle. ˆ da sich die Welle in die Richtung von Lösung (a) B liegt in der Richtung von k, E × B bewegt, also in die Richtung von ˆi oder die positive x-Richtung. (b) Die Geschwindigkeit ist v = ω/k 2,10 × 1015 rad/s 1,10 × 107 rad/m = 1,909 × 108 m/s oder 1,91 × 108 m/s

v=

(c) E0 = vB0 = (1,909 × 108 m/s)B0 180 V/m = 9,43 × 10−7 T 1,909 × 108 m/s ˆ ei(kx−ωt) B = (9,43 × 10−7 T) k

B0 =

(d) n = c/v = (2,99 × 108 m/s)/(1,909 × 108 m/s) und n = 1,5663 ≈ 1,57 √ (e) n = KE n2 = KE KE = 2,453  = 0 KE = (8,8542 × 10−12 ) 2,453 = 2,172 × 10−11 C2 / N · m2 (f) I =

v 2 E 2 0 (2,172 × 10−11 C2 / N · m2 )(1,909 × 108 m/s)(180 V/m)2 2 2 = 67,2 W/m

I=

3.5 Licht in Materie

145

Streuung und Absorption Was ist die physikalische Ursache für die Frequenzabhängigkeit von n? Um diese Frage zu beantworten, müssen wir die Wechselwirkung einer einfallenden elektromagnetischen Welle mit dem Atomgitter des bestrahlten Dielektrikums untersuchen. Ein Atom kann auf ankommende Strahlung auf zwei verschiedene Arten reagieren, je nachdem, wie groß die Frequenz des Lichts (bzw. die Energie der Photonen, denn E = hν) ist. Allgemein wird ein Lichtstrahl an jedem Atom gestreut, das heißt, seine Richtung wird geändert, ohne dass er anderweitig beeinflusst wird. Entspricht die Energie des Photons dem Unterschied zwischen dem Grund- und einem angeregten Zustand des Atoms, so „absorbiert“ dieses das Licht und gelangt durch einen Quantensprung auf das höhere Energieniveau. In gewöhnlichen Gasen unter einem Druck von mindestens 102 Pa sowie in Flüssigkeiten und Festkörpern sind die Atome einander dicht benachbart. Sehr wahrscheinlich wird die Anregungsenergie dann durch Stoßprozesse in Bewegungs- und Wärmeenergie umgewandelt, bevor ein Photon ausgesendet werden kann. Den Vorgang der Aufnahme eines Photons und seine Umwandlung in thermische Energie nannte man früher „Absorption“ – heute meint man mit diesem Begriff den Prozess der Energieaufnahme, ungeachtet dessen, welche weiteren Energieumwandlungen anschließend erfolgen. Wenn Wärmeenergie entsteht, wollen wir den Vorgang besser als dissipative Absorption bezeichnen. Bis zu einem gewissen Grad absorbieren alle Medien bei irgendeiner Frequenz (oder mehreren) dissipativ. Im Gegensatz zu einem solchen Anregungsprozess spricht man von Grundzustandsoder Nichtresonanzstreuung, wenn die Frequenz der ankommenden Strahlung niedriger ist als die Resonanzfrequenz. Betrachten wir dazu die Wechselwirkung eines Atoms im Grundzustand mit einem Photon, dessen Energie zu niedrig ist, um das Atom in einen Zustand höherer Energie anzuregen. Auch dabei wird die Elektronenwolke durch das elektromagnetische Feld in Schwingungen versetzt. Das Atom verbleibt im Grundzustand, und seine Elektronenwolke schwingt relativ zum positiv geladenen Kern leicht mit der Frequenz des einfallenden Lichts. So entsteht ein oszillierender Dipol, der sofort mit der gleichen Frequenz zu strahlen beginnt. Das erzeugte Streulicht besteht aus Photonen, die in zufälliger Richtung davonfliegen und deren Energie derjenigen der eingestrahlten Photonen entspricht: Die Streuung ist elastisch. Das Atom ist einem kleinen Dipoloszillator vergleichbar – dieses Modell benutzte Hendrik Antoon Lorentz (1878), als er die maxwellsche Theorie im Rahmen der klassischen Physik auf die Welt der Atome erweiterte. Ist das einfallende Licht nicht polarisiert, so streuen die atomaren Oszillatoren in zufällige Richtungen. Wird ein Atom mit Licht bestrahlt, wiederholen sich Anregung und spontane Emission in rascher Folge. Bei einer Emissionslebensdauer von rund 10−8 Sekunden kann ein Atom bis zu 108 Photonen pro Sekunde aussenden, vorausgesetzt, es wird genügend Energie zugeführt, um das Atom immer wieder aufs Neue anzuregen. Atome haben einen großen Absorptionsquerschnitt – das bedeutet, sie treten mit resonantem Licht

146

3 Theorie des Elektromagnetismus, Photonen und Licht

stark in Wechselwirkung, sodass die Sättigung (d. h. die unablässige Emission und Wiederanregung) eines Gases unter niedrigem Druck bereits bei mäßigen Bestrahlungsstärken (ca. 102 W/m2 ) eintritt. Daher kann man Atome leicht dazu bringen, pro Sekunde 100 Millionen Photonen auszusenden. Ganz allgemein können wir uns vorstellen, dass ein von einem gewöhnlichen Lichtstrahl beleuchtetes Medium als „Quelle“ einer großen Zahl von Photonen wirkt, die in alle Richtungen fliegen und entweder durch elastische oder durch resonante Streuung entstanden sind. Ein solcher Energiestrom ähnelt einer klassischen Kugelwelle. Wir betrachten das Atom daher (vereinfacht!) als punktförmige Quelle elektromagnetischer Kugelwellen, sollten aber an Einsteins Mahnung denken, dass „ausgesendete Strahlung in Form von Kugelwellen nicht existiert“. Wird ein Stoff, der im Sichtbaren keine Resonanz aufweist, mit Licht durchflutet, so kommt es zur Nichtresonanzstreuung; jedes beteiligte Atom erscheint als winziger Ausgangspunkt kugelförmiger Elementarwellen. Je näher die Frequenz des eingestrahlten Lichts an einer Resonanzfrequenz des Atoms liegt, desto intensiver ist die Wechselwirkung, desto mehr Energie wird also in dichten Stoffen absorbiert und in Wärme verwandelt. Durch genau diesen Mechanismus der selektiven Absorption (siehe Abschn. 4.9) werden viele Dinge für uns sichtbar – er sorgt dafür, dass wir Haare, Haut und Kleidung, Blätter, Äpfel und Anstriche als farbig wahrnehmen.

3.5.1 Dispersion Als Dispersion bezeichnen wir das Phänomen, dass der Brechungsindex eines Mediums frequenzabhängig ist. Alle materiellen Medien sind dispersiv; nur das Vakuum ist nicht dispersiv. Die maxwellsche Theorie behandelt die Materie als kontinuierlich und drückt ihre elektrische bzw. magnetische Antwort auf anliegende E- bzw. B-Felder durch die Materialkonstanten  und μ aus. Die Größen KE und KM sind folglich ebenfalls konstant, was dazu führt, dass n unrealistischerweise nicht von der Frequenz abhängt. Um die Dispersion (also die Frequenzabhängigkeit des Brechungsindex) theoretisch zu erfassen, muss die Materie in ihrer atomaren Natur betrachtet und ein frequenzabhängiger Aspekt dieser Natur einbezogen werden. Nach H. A. Lorentz lässt sich das Verhalten eines isotropen dielektrischen Mediums durch Mittelung der Beiträge sehr vieler Atome beschreiben. Wird ein elektrisches Feld an ein Dielektrikum angelegt, so wird die Ladungsverteilung innerhalb des Stoffes gestört. Dabei werden elektrische Dipolmomente erzeugt, die ihrerseits zum inneren Feld beitragen. Einfacher ausgedrückt trennt das äußere Feld im Medium positive und negative Ladungen (welche paarweise Dipole bilden), die dann eine zusätzliche Feldkomponente beitragen. Das resultierende Dipolmoment

3.5 Licht in Materie

147

CO H

O

Cl

HCl

C

O

Cm

Cm Cm

C

H H

H O

O

O

CO

Abb. 3.37: Dipolmomente ausgewählter Moleküle.

pro Volumeneinheit nennt man elektrische Polarisation P. Für die meisten Stoffe sind P und E zueinander proportional und können zufriedenstellend durch die Beziehung ( − 0 ) E = P

(3.62)

verknüpft werden. Die elektrische Polarisation ist ein Maß für den Unterschied zwischen den elektrischen Feldern mit und ohne Medium. Für  = 0 gilt P = 0. Die Einheit von P ist C · m/ m3 , also C/ m2 . Ein Mechanismus der Umverteilung der Ladung und der sich daraus ergebenden Polarisierung kann der folgende sein: Manche Moleküle besitzen infolge ungleich verteilter Valenzelektronen ein permanentes Dipolmoment. Solche Moleküle sind polar; das gewinkelte Wassermolekül ist ein typisches Beispiel (Abb. 3.37). Jede Wasserstoff-Sauerstoff-Bindung ist polar, wobei das H-Ende der Bindung positiver ist als das O-Ende. Durch die Wärmebewegung zeigen die Dipole ungeordnet in zufällige Richtungen. Legt man ein elektrisches Feld an, so richten sich die Dipole gleichmäßig aus; diesen Vorgang nennt man Orientierungspolarisation. Handelt es sich dagegen um Atome oder unpolare Moleküle, so stört das angelegte Feld deren Elektronenwolke – die negativen Ladungen werden relativ zum positiv geladenen Kern verschoben, wobei ein Dipolmoment entsteht. Neben dieser Elektronenpolarisation gibt es noch einen weiteren Prozess, der speziell für ionisch gebundene Stoffe wie den Ionenkristall NaCl eine Rolle spielt. Ein elektrisches Feld verschiebt die positiv und die negativ geladenen Ionen relativ zueinander, wobei Dipolmomente induziert werden, und es kommt zur Ionen- oder Atompolarisation. Wird ein Dielektrikum einer elektromagnetischen Welle ausgesetzt, so wirken auf die Ladungsverteilung im Material zeitlich veränderliche Kräfte und/oder Drehmomente,

148

3 Theorie des Elektromagnetismus, Photonen und Licht

die zur elektrischen Feldkomponente der Welle proportional sind.12 In polaren, dielektrischen Fluiden rotieren die Moleküle rasch und richten sich ständig nach dem zeitabhängigen E-Feld aus. Aber diese Moleküle sind groß und haben daher ein merkliches Trägheitsmoment. Bei hohen Frequenzen ω der elektromagnetischen Strahlung können die Moleküle den schnellen Veränderungen des Feldes nicht mehr folgen; ihr Beitrag zu P nimmt ab, und KE wird beträchtlich kleiner. Die Dielektrizitätskonstante von Wasser liegt bis 1010 Hz ziemlich konstant bei 80, danach fällt sie rasch ab. Elektronen haben dagegen ein kleines Trägheitsmoment, weshalb sie dem Feld sogar noch bei optischen Frequenzen (ca. 5 × 1014 Hz) folgen können und zu KE (ω) beitragen. Die Abhängigkeit des absoluten Brechungsindex n von ω wird daher durch das Zusammenwirken verschiedener Mechanismen der elektrischen Polarisation bestimmt, welche bei der betrachteten Frequenz Beiträge beisteuern. Aus diesen Überlegungen lässt sich ein analytischer Ausdruck für n(ω) finden, der die Ereignisse auf atomarem Niveau berücksichtigt. Die Elektronenwolke ist durch die elektrische Anziehung an den positiven Kern gebunden und wird in einer Art Gleichgewichtskonfiguration gehalten. Ohne viel über die inneratomaren Wechselwirkungen zu wissen, können wir eine rücktreibende Kraft vermuten, die das System bei kleinen Auslenkungen aus dem Gleichgewicht wieder in dieses zurückbringt – ähnlich, wie man es bei mechanischen Systemen beobachtet, die durch eine Auslenkung nicht völlig zerstört werden. Außerdem ist anzunehmen, dass diese Kraft bei kleinen Verschiebungen x aus dem Gleichgewicht (F = 0) eine lineare Funktion von x ist. In anderen Worten: Trägt man F (x) in Abhängigkeit von x auf, so schneidet der Graph die x-Achse an der Gleichgewichtsposition (x = 0) und bildet auf beiden Seiten nahezu eine Gerade. Bei kleinen Verschiebungen können wir also annehmen, dass die Rückstellkraft die Form F = −kE x hat, wobei kE eine Art Elastizitätskonstante (ähnlich einer Federkonstante) ist. Ein gebundenes Elektron, das kurzzeitig aus seiner Ruhelage ausgelenkt wird, schwingt anschließend um diese mit seiner Eigen- oder Resonanzfrequenz ω0 = kE /me , wobei me die Elektronenmasse ist. Dies ist die Oszillatorfrequenz des nicht angeregten Systems und daher gilt F = −ω02 me x. Indem wir ω0 verwenden, was eine beobachtbare Größe ist, können wir das aus dem Federmodell herrührende kE loswerden. Wir können uns die Materie als eine Ansammlung sehr vieler polarisierbarer, eng benachbarter und im Vergleich zur Wellenlänge des Lichts kleiner Atome im Vakuum vorstellen. Fällt eine Lichtwelle auf ein solches Medium, so kann man sich jedes Atom als einen klassischen getriebenen Oszillator denken, wobei die treibende Kraft das zeitlich veränderliche elektrische Feld E (t) der Welle ist (das Feld soll in x-Richtung angelegt sein). Abbildung 3.38 b zeigt eine mechanische Darstellung eines solchen Oszillators in einem isotropen Medium, wobei die negativ geladene Elektronenwolke 12

Kräfte, die durch die magnetische Feldkomponente erzeugt werden, haben die Form FM = qv×B; im Falle der elektrischen Feldkomponente lautet der Ausdruck FE = qE. Wegen v  c ist FM jedoch im Allgemeinen vernachlässigbar, wie aus Gleichung (3.30) folgt.

3.5 Licht in Materie

149

(a)

E

(b) E

Abb. 3.38: (a) Störung der Elektronenwolke durch ein angelegtes elektrisches Feld. (b) Mechanisches Oszillatormodell eines isotropen Mediums. Alle Federn sind gleich, der Oszillator kann in alle Richtungen gleichermaßen schwingen.

(„Schale“) durch viele identische Federn am positiv geladenen Kern befestigt ist. Selbst bei Bestrahlung mit hellem Sonnenlicht ist die Amplitude der Schwingungen nicht größer als 10−17 m. Die Kraft (FE ), die vom E (t)-Feld einer harmonischen Welle der Frequenz ω auf ein Elektron mit der Ladung qe ausgeübt wird, hat die Form FE = qe E (t) = qe E0 cos ωt .

(3.63)

Beachten Sie dabei, dass treibende und rücktreibende Kraft in entgegengesetzte Richtungen zeigen; Letztere erhält daher ein Minuszeichen: F = −kE x = −me ω02 x. Die Bewegungsgleichung wird folglich vom zweiten newtonschen Gesetz geliefert, das besagt, dass die Summe der Kräfte gleich der Masse, multipliziert mit der Beschleunigung, ist: d2 x . (3.64) dt2 Der erste Term auf der linken Seite entspricht der treibenden Kraft, der zweite der in entgegengesetzter Richtung wirkenden rücktreibenden Kraft. Um diese Gleichung zu erfüllen, muss x eine Funktion sein, deren zweite Ableitung sich nicht allzu sehr von x qe E0 cos ωt − me ω02 x = me

3 Theorie des Elektromagnetismus, Photonen und Licht

150

selbst unterscheidet. Weiterhin können wir annehmen, dass das Elektron mit derselben Frequenz schwingt wie E (t). Wir „erraten“ unter diesen Voraussetzungen die Lösung x (t) = x0 cos ωt und setzen diese in die Bewegungsgleichung ein, um die Amplitude x0 zu erhalten. Es ergibt sich x (t) = 

qe /me  E0 cos ωt ω02 − ω 2

(3.65)

x (t) = 

qe /me  E (t) . ω02 − ω 2

(3.66)

oder

x (t) entspricht der Verschiebung der Elektronenwolke relativ zum Kern. Es hat sich eingebürgert, qe als positiv anzusehen und von der Auslenkung des Oszillators zu sprechen. Ohne die einfallende Welle als treibende Kraft schwingt der Oszillator mit seiner Resonanzfrequenz ω0 . Ist die Frequenz des Feldes kleiner als ω0 , so stimmen E (t) und x (t) im Vorzeichen überein – das bedeutet, dass der Oszillator der ausgeübten Kraft folgen kann (mit ihr in Phase ist). Für ω > ω0 dagegen ist die Verschiebung x (t) der momentan wirkenden Kraft qe E (t) entgegen gerichtet; Kraft und Verschiebung sind um 180◦ außer Phase. Wir sprechen hier über oszillierende Dipole, d. h., bei ω0 > ω entspricht die Relativbewegung der positiven Ladung einer Schwingung in Feldrichtung. Oberhalb der Resonanz ist die Ladung relativ zum Feld um 180◦ phasenverschoben; man sagt, der Dipol eilt um 180◦ (π rad) nach (siehe Abb. 4.9). Das Dipolmoment ist gleich dem Produkt aus der Ladung qe und deren Verschiebung. Wenn die Zahl der beitragenden Elektronen je Volumeneinheit gleich N ist, so ist die elektrische Polarisation oder Dichte der Dipolmomente gleich P = qe xN .

(3.67)

Mit Gleichung (3.66) folgt hieraus q 2 N E/me , P = e 2 ω0 − ω 2

(3.68)

und aus Gleichung (3.62) folgt  = 0 +

P (t) q 2 N/me . = 0 +  e2 E (t) ω0 − ω 2

(3.69)

3.5 Licht in Materie

151

Unter Ausnutzung der Beziehung n2 = KE = /0 finden wir einen Ausdruck für n als Funktion von ω, die so genannte Dispersionsgleichung:   N qe2 1 . (3.70) n2 (ω) = 1 + 0 me ω02 − ω 2   Übersteigt die Feldfrequenz zunehmend die Resonanzfrequenz, so ist ω02 − ω 2 < 0 und die Phasenverschiebung des Oszillators relativ zur treibenden Kraft nähert sich 180◦ an. Die erzeugte elektrische Polarisation ist relativ zum elektrischen Feld folglich um einen ähnlichen Betrag phasenverschoben; die Dielektrizitätskonstante und daher auch der Brechungsindex sind kleiner als 1. Fällt die Feldfrequenz zunehmend unter  die Resonanzfrequenz ab, so ist ω02 − ω 2 > 0, und die elektrische Polarisation ist mit dem angelegten elektrischen Feld nahezu phasengleich. Sowohl die Dielektrizitätskonstante als auch der zugehörige Brechungsindex sind größer als 1. Offensichtlich bildet der zweitgenannte Fall nur die eine Hälfte des Geschehens – trotzdem beobachtet man dieses Verhalten allgemein in Stoffen jeder Art. Ob unsere Analyse sinnvoll ist, können wir mithilfe eines Dispersionsprismas (Abschn. 5.5.1) herausfinden, das aus dem untersuchten Material besteht. Zunächst schreiben wir Gleichung (3.70) um wie in Aufgabe 3.62: −1  2 = −Cλ−2 + Cλ−2 n −1 0 . Wegen ω = 2πc/λ ist die Konstante C = 4π 2 c2 0 me /N qe2 . In Abbildung 3.39 wurde (n2 − 1)−1 in Abhängigkeit von λ−2 aufgetragen; die Zahlenwerte stammen aus einem Studentenversuch. Ein Kronglasprisma wurde mit den verschiedenen Frequenzen beleuchtet, die ein He-Entladungsrohr liefert, und für jede wurde der Brechungsindex gemessen (Tab. 3.3). Tatsächlich ist der erhaltene Graph eine Gerade (y = mx + b) mit dem Anstieg −C, die die y-Achse bei Cλ−2 0 schneidet. Daraus folgt eine Resonanzfrequenz von 2,95 × 1015 Hz, die im ultravioletten Bereich liegt. Lässt man die Frequenz des Lichts, mit dem man einen Stoff bestrahlt, ansteigen, so finden generell mehrere Übergänge von n > 1 nach n < 1 statt. Dies deutet darauf hin, dass es nicht nur eine Resonanzfrequenz ω0 gibt, sondern mehrere. Zur Verallgemeinerung des Sachverhalts nehmen wir an, dass sich in jeder Volumeneinheit (n2 −1)−1 0.7600 0.7500 2

0.7400 0.7300 0.7200 0.7100 0.7000 0

1

3

4 6 57 8

10 9 11

1213

14

1.00 2.00 3.00 4.00 5.00 6.00 7.00 λ−2 (10−6 nm−2 )

Abb. 3.39: (n2 −1)−1 aufgetragen über λ−2 für die Daten in Tabelle 3.3. Siehe N. Gauthier, Phys. Teach. 25, 502 (1987).

152

3 Theorie des Elektromagnetismus, Photonen und Licht

Tabelle 3.3: Dispersion von Kronglas. Die Wellenlängen entsprechen einer He-Gasentladungsröhre. Die angegebenen Brechungsindizes sind Messwerte.

1. 2. 3. 4. 5. 6. 7.

Wellenlänge λ (nm)

Brechungsindex n

728,135 706,519 und 706,570 667,815 587,562 und 587,587 504,774 501,567 492,193

1,534 6 1,535 2 1,536 29 1,539 54 1,544 17 1,544 73 1,545 28

Wellenlänge λ (nm) Brechungsindex n 8. 9. 10. 11. 12. 13. 14.

471,314 447,148 438,793 414,376 412,086 402,619 388,865

1,546 24 1,549 43 1,550 26 1,553 74 1,554 02 1,555 30 1,557 67

N Moleküle befinden, von denen jedes aus fj Oszillatoren mit den Eigenfrequenzen ω0j besteht (j = 1, 2, 3, ...). Dann ist   N qe2  fj 2 (3.71) n (ω) = 1 + 2 − ω2 . 0 me ω0j j Dasselbe Resultat liefert die quantenmechanische Behandlung; allerdings müssen einige Terme neu interpretiert werden. Die ω0j sind dann die Eigenfrequenzen, bei denen ein Atom Strahlungsenergie absorbieren oder emittieren kann; die fj sind Wichtungs faktoren, erfüllen die Bedingung j fj = 1 und heißen Oszillatorstärken. Sie geben an, in welchem Ausmaß jede einzelne Mode auftritt. Da sie damit gleichzeitig ein Maß für die Wahrscheinlichkeit eines bestimmten Atomübergangs sind, nennt man sie auch Übergangswahrscheinlichkeiten. Auch im Rahmen der klassischen Theorie müssen die fj -Terme neu interpretiert werden, da sich aus experimentellen Daten ergibt, dass sie sämtlich kleiner als 1 sein müssen. Dies widerspricht offensichtlich der Definition, die uns zu Gleichung (3.71) führte. Die Annahme lautet nun, dass ein Molekül viele Schwingungsmoden besitzt, die sich jeweils in Eigenfrequenz und Oszillatorstärke unterscheiden. Entspricht ω einer der Eigenfrequenzen, so wird n – im Widerspruch zur praktischen Beobachtung – diskontinuierlich. Die Ursache hierfür ist, dass der Dämpfungsterm ignoriert wurde, der eigentlich in den Nenner der Summe gehört hätte. Übrigens ist diese Dämpfung teilweise eine Folge des Energieverlustes, der auftritt, wenn die angeregten Oszillatoren ihre Energie wieder abstrahlen. In Festkörpern, Flüssigkeiten und Gasen unter hohem Druck (≈ 103 atm) sind die Abstände zwischen den Atomen etwa zehn Mal kleiner als in einem Gas bei Standardtemperatur und -druck, sodass die Wechselwirkungen stark sind und eine Art „Reibungskraft“ auftritt. Dadurch werden die Oszillatoren gedämpft, und sie geben ihre Energie in Form von „Wärme“ (zufälligen Molekülbewegungen) in den Stoff ab.

3.5 Licht in Materie

153

Beziehen wir eine zur Geschwindigkeit proportionale Dämpfung der Form me γdx/dt in die Bewegungsgleichung ein, so wird die Dispersionsgleichung (3.71) zu   N qe2  fj 2 (3.72) n (ω) = 1 + 2 − ω 2 + iγ ω . 0 me ω j 0j j Für dünne Medien wie Gase ist dieser Ausdruck gut anwendbar; doch will man eine entsprechende Gleichung für dichte Medien formulieren, muss man ein weiteres Problem lösen. Jedes Atom tritt mit seinem lokalen elektrischen Feld in Wechselwirkung, aber im Gegensatz zu den bisher betrachteten isolierten Teilchen wirkt auf die Atome in einem dichten Stoff außerdem das durch seine Nachbarn induzierte Feld. Daher „spürt“ ein Atom außer dem angelegten elektrischen Feld eine zweite Komponente13 P (t) /30 . Wir wollen es an dieser Stelle nicht im Detail herleiten, doch wie man zeigen kann, gilt   fj N qe2  n2 − 1 . (3.73) = 2 − ω 2 + iγ ω n2 + 2 30 me ω j 0j j Bisher haben wir nur Elektronen als Oszillatoren betrachtet; zu denselben Resultaten gelangen wir aber auch, wenn wir die Schwingungen gebundener Ionen untersuchen. In diesem Fall wird me durch die beträchtlich größere Masse des Ions ersetzt – daher spielen die Beiträge der Ionenpolarisation nur in der Umgebung einer Resonanz (ω0j = ω) eine Rolle, während die Elektronenpolarisation über das gesamte optische Spektrum hinweg von Bedeutung ist. In Abschnitt 4.8 werden wir sehen, welche Auswirkungen die Einbeziehung komplexer Brechungsindizes hat. Im Moment wollen wir uns überwiegend auf Situationen mit 2 − ω 2  γ ω) und reellem n beschränken. Hier ist vernachlässigbarer Absorption (ω0j j   N qe2  fj n2 − 1 = . (3.74) 2 2 n +2 30 me ω0j − ω 2 j Die Eigenfrequenzen von Stoffen, die uns farblos und transparent erscheinen, liegen außerhalb des Spektralbereichs des sichtbaren Lichts. Gläser beispielsweise haben intensive Eigenschwingungen im Ultravioletten: Dort sind sie „undurchsichtig“. 2  ω 2 , so kann man ω 2 in Gleichung (3.74) vernachlässigen, woraus Ist dagegen ω0j sich im betreffenden Frequenzgebiet ein im Wesentlichen konstanter Brechungsindex ergibt. Die wichtigsten Eigenfrequenzen von Gläsern liegen bei Wellenlängen um 100 nm; die Mitte des sichtbaren Spektralbereichs liegt ungefähr bei dem Fünffachen 2  ω 2 . Steigt ω langsam auf ω , so fällt (ω 2 − ω 2 ) immer (500 nm), und dort ist ω0j 0j 0j weiter ab und n wächst allmählich mit der Frequenz, wie Abbildung 3.40 zeigt. Man 13

Dies gilt für isotrope Medien und wird in nahezu jedem Lehrbuch des Elektromagnetismus ausführlich hergeleitet.

3 Theorie des Elektromagnetismus, Photonen und Licht

154

Schwerflintglas

Brechungsindex n

1.7

1.6

Leichtflintglas

Quarz, kristallin 1.5

Borosilicat-Kronglas Polyacrylat Quarzglas

1.4 0

200

400 600 800 Wellenlänge λ (nm)

1000

Abb. 3.40: Abhängigkeit des Brechungsindex von der Wellenlänge für verschiedene Medien.

n √

Ke 1 ω01

0 infrarot

2.8

ω02 sichtbar

3 × 1015

ω03

ultraviolett

3 × 1014

Röntgen

Abb. 3.41: Der Brechungsindex als Funktion der Wellenlänge.

Frequenz ν (Hz) 3 × 1013

5 × 1012

Thalliumbromiodid

2.4 Brechungsindex

ω

Thalliumchlorbromid

AgCl KI

KBr NaCl KCl SiO2 1.6 CaF 2 LiF NaF BaF2 1.2 2.0

0.8 100

200

ultraviolett

CsI

AgCl

CsBr

CsI KI CsBr KBr KCl SiO2 NaCl NaF LiF 10,000 60,000 4000 BaF2 CaF2

400 600 800 sichtbar

2000

infrarot

Wellenlänge λ (nm)

Abb. 3.42: Der Brechungsindex als Funktion der Wellenlänge und der Frequenz für verschiedene Kristalle mit optischer Bedeutung. (Grundlage: Daten, die von The Harshaw Chemical Co. publiziert wurden.)

3.5 Licht in Materie

155

nennt dies die normale Dispersion. Nähert sich ω im Ultravioletten einer Eigenfrequenz, setzt die Resonanz der Oszillatoren ein. Ihre Amplituden werden rasch größer, gleichzeitig kommt es zur Dämpfung und zur intensiven Absorption der Energie der einfallenden elektromagnetischen Welle. Wird in Gleichung (3.73) ω0j = ω, dann überwiegt offensichtlich der Dämpfungsterm. Die Bereiche in unmittelbarer Nachbarschaft der verschiedenen ω0j (Abb. 3.41) heißen Absorptionsbänder. Dort ist dn/dω negativ; man nennt den Vorgang anomale Dispersion. Der blaue Bestandteil von weißem Licht, das durch ein gläsernes Prisma fällt, hat einen höheren Brechungsindex als der rote – daher wird Ersterer in einem größeren Winkel abgelenkt (siehe Abschn. 5.5.1). Verwenden wir stattdessen ein Prisma, das mit einer im Sichtbaren absorbierenden Farbstofflösung gefüllt ist, so verändert sich das Spektrum merklich (siehe Aufgabe 3.59). Jeder Stoff besitzt irgendwo innerhalb des elektromagnetischen Spektrums Absorptionsbanden. Der aus dem späten neunzehnten Jahrhundert übernommene Begriff der „anomalen“ Dispersion ist daher sicherlich irreführend. Wie wir bereits gesehen haben, können auch Atome innerhalb eines Moleküls um ihre Ruhelage schwingen. Da die Atomkerne jedoch relativ schwer sind, liegen die Eigenfrequenzen bei niedrigen Werten (im Infraroten). Moleküle wie H2 O und CO2 zeigen sowohl im Ultravioletten als auch im Infraroten Resonanzen. Gelangen während der Herstellung Wassermoleküle oder Oxide in ein Stück Glas, so absorbiert auch dieses im Infraroten. Abbildung 3.42 zeigt n als Funktion von ω vom ultravioletten bis zum infraroten Bereich für einige Kristalle, die in der Optik von Bedeutung sind. Zu beachten ist der unterschiedlich rasche Abfall der Kurven mit steigender Wellenlänge. Für Radiowellen, deren Frequenzen noch unterhalb des Infraroten liegen, ist Glas wieder durchlässig. Gefärbtes Glas dagegen zeigt eine deutliche Resonanz im sichtbaren Spektralbereich; dort absorbiert das Material Licht eines bestimmten Frequenzbereichs, während es die Komplementärfarbe durchlässt. Ist schließlich die Anregungsfrequenz größer als alle ω0j eines Stoffes, so wird n2 < 1 und n < 1. Diese Situation tritt beispielsweise ein, wenn man Röntgenstrahlen auf eine Glasplatte lenkt. Verblüffenderweise wird dann anscheinend v > c, was der speziellen Relativitätstheorie widerspricht. Dieses Verhalten werden wir bei der Diskussion der Gruppengeschwindigkeit (Abschn. 7.2.2) noch genauer besprechen. Wir können also zunächst festhalten, dass n (ω) im sichtbaren Spektralbereich überwiegend von der Elektronenpolarisation bestimmt wird. Klassisch stellt man sich vor, dass elektronische Oszillatoren mit der Frequenz der einfallenden Welle schwingen. Unterscheidet sich diese Frequenz merklich von jeder Eigenfrequenz des betreffenden Stoffes, so werden nur kleine Schwingungen ausgeführt; nur geringe Energiemengen werden absorbiert und in Wärme umgewandelt. An Resonanzstellen dagegen sind die Schwingungen intensiv, das Feld verrichtet an den Ladungen bedeutend mehr Arbeit. Der Welle wird elektromagnetische Energie entnommen, diese wird in mechanische Energie umgewandelt und als Wärme (Bewegung) im Stoff verteilt. Es tritt ein Absorptionsmaximum oder eine Absorptionsbande auf. Während der Stoff für andere

156

3 Theorie des Elektromagnetismus, Photonen und Licht

Frequenzen im Wesentlichen transparent ist, wird er bei Bestrahlung mit einer seiner Eigenfrequenzen undurchlässig (siehe Foto der Linsen).

Halbleiterlinsen aus ZnSe, CdTe, GaAs und Ge. Diese Werkstoffe sind im Infrarotbereich (2 bis 30 µm) sehr gut durchlässig, im sichtbaren Bereich dagegen sind sie völlig undurchlässig. (Mit frdl. Genehmigung von Two-Six Incorporated.)

Negative Brechung Wie bereits festgestellt wurde, hängt der Brechungsindex eines Materials gemäß Gleichung (3.59) von der Dielektrizitätskonstante und der magnetischen Permeabilität ab: n = ± μ/0 μ0 . Dabei kann die Wurzel positiv oder negativ sein, doch lange Zeit hat sich niemand mit der zweiten Möglichkeit beschäftigt. 1968 zeigte dann der russische Physiker Victor G. Veselago, dass ein Material, für das sowohl die Dielektrizitätskonstante als auch die Permeabilität negativ ist, einen negativen Brechungsindex haben muss, was zu einer Reihe bizarrer Eigenschaften führt. Zu jener Zeit waren Substanzen verfügbar, für die unter geeigneten Umständen und in begrenzten Frequenzbereichen entweder  < 0 oder μ < 0 gilt. Es war jedoch kein transparentes oder zumindest durchscheinendes Material bekannt, das beide Bedingungen gleichzeitig erfüllte. Es ist daher nicht erstaunlich, dass die Theorie lange Zeit auf wenig Interesse stieß. Eine Lichtwelle ist ungefähr fünftausendmal so groß wie ein Atom, und wenn sie durch ein Dielektrikum propagiert, dann „sieht“ sie die individuellen Atome nicht, an deren Vielzahl sie gestreut wird. Allenfalls kann man sagen, dass sich die Welle verhält, als würde sie ein mehr oder weniger kontinuierliches Medium „sehen“, und folglich behält sie während ihrer Propagation ihre globalen Charakteristika. Das gleiche würde für eine Welle mit einer wesentlich größeren Wellenlänge gelten, etwa für eine Mikrowelle mit einer Wellenlänge von einigen Zentimetern, die durch ein Gebiet propagiert, das mit kleinen, dicht benachbarten Antennen gefüllt ist, an denen sie gestreut wird. Ende des 20. Jahrhunderts begannen Forscher damit, dreidimensionale Arrays solcher kleinen Streuer herzustellen. Einige davon bestanden aus kleinen offenen Ringen, die, wenn ein oszillierendes magnetisches Feld in sie eindringt, eine Kapazität, eine Induktivität und folglich eine Resonanzfrequenz haben, genau wie ein Atom in einem Dielektrikum. Um das Feld zu streuen, wurden Gitter aus winzigen leitenden Drähten in die Struktur integriert. Die so konstruierten Medien erhielten die Bezeichnung Metamaterialien, und unmittelbar oberhalb ihrer Resonanzfrequenz weisen sie tatsächlich negative Brechungsindizes auf.

3.5 Licht in Materie

157

Diese Anordnung kleiner leitender Streuer wird zur Herstellung eines Metamaterials verwendet. Es arbeitet im Mikrowellenbereich und hat die Eigenschaften < 0, μ < 0 und n < 0. (Ames Laboratory, USDOE)

Materialien mit negativem Brechungsindex haben viele erstaunliche Eigenschaften, von denen wir einige später genauer betrachten werden (Abschn. 4.4.1). Eines der merkwürdigsten Phänomene hat mit dem Poynting-Vektor zu tun. In einem gewöhnlichen homogenen, isotropen Material wie Glas sind die Phasengeschwindigkeit einer elektromagnetischen Welle und ihr Poynting-Vektor (die Richtung des Energiestroms) gleich. Dies ist für Materialien mit negativem Brechungsindex nicht der Fall. Während E × B weiterhin die wichtige Richtung des Energiestroms ist, hat die Phasengeschwindigkeit die entgegengesetzte Richtung; die Welle propagiert vorwärts, während die Kräuselungen, aus denen sie besteht, sich rückwärts bewegen. Weil die Phasengeschwindigkeit in die dem Kreuzprodukt entgegengesetzte Richtung zeigt, welche durch die Rechte-Hand-Regel bestimmt ist, werden Materialien mit negativem Brechungsindex auch als linkshändige Materialien bezeichnet. Heute ist dieses Forschungsgebiet fest etabliert. Es ist gelungen, aus einer Vielzahl von Strukturen Medien mit negativem Brechungsindex herzustellen, darunter so genannte photonische Kristalle, die aus Dielektrika bestehen. Da es theoretisch möglich ist, Metamaterialien zu kreieren, die im sichtbaren Bereich arbeiten, sind aufregende neue Anwendungen zu erwarten, darunter Superlinsen und „Tarnkappen“.

Je kleiner die Streuer in einem Metamaterial sind, um so kürzer ist die Betriebswellenlänge. Die hier abgebildeten winzigen Resonatoren sind etwa halb so groß wie die Wellenlänge des Lichts, und sie sind so konstruiert, dass sie bei etwa 200 THz arbeiten. (Ames Laboratory, USDOE)

3 Theorie des Elektromagnetismus, Photonen und Licht

158

3.6

Das elektromagnetische Spektrum

Als Maxwell 1867 die erste ausführliche Abhandlung seiner Theorie des Elektromagnetismus veröffentlichte, kannte man nur den Frequenzbereich, der sich vom Ultravioletten bis zum Infraroten erstreckt. Für die Optik ist tatsächlich vorwiegend dieser Bereich von Bedeutung, aber er ist nur ein kleiner Teil des elektromagnetischen Spektrums (siehe Abb. 3.43). In diesem Abschnitt werden die wichtigsten Frequenzbereiche vorgestellt, in die man das Spektrum gewöhnlich unterteilt; einige dieser Bereiche überlappen einander geringfügig.

3.6.1 Radiowellen 1887, acht Jahre nach Maxwells Tod, gelang es Heinrich Hertz – damals Professor an der Technischen Hochschule Karlsruhe –, elektromagnetische Wellen zu erzeugen und nachzuweisen.14 Sein Sender war eine schwingende Entladung über eine Funkenstrecke (eine Art oszillierender elektrischer Dipol). Als Empfänger benutzte Hertz eine offene Drahtschleife, die an einem Ende mit einem Messingknopf, am anderen Ende mit einer feinen Kupferspitze versehen war. Ein kleiner Funken, der zwischen den beiden Enden übersprang, diente als Nachweis einer einfallenden elektromagnetischen Welle. Hertz fokussierte die Strahlung, bestimmte ihre Polarisation, beobachtete Reflexion und Brechung, erzeugte durch Interferenz stehende Wellen und maß sogar deren Wellenlänge (in der Größenordnung von einem Meter). In Hertz’ eigenen Worten: Es gelang mir, verschiedene Strahlen elektrischer Kraft zu erzeugen und damit die elementaren Experimente vorzunehmen, die man gewöhnlich mit Licht und Wärmestrahlung ausführt... Vielleicht können wir sie weiterhin als Lichtstrahlen mit sehr großer Wellenlänge bezeichnen. Die beschriebenen Experimente scheinen mir jedenfalls jeden Zweifel an der identischen Natur von Licht, Wärmestrahlung und elektromagnetischen Wellen auszuräumen. (Heinrich Hertz, Journal of Science, 1889) Heute ordnen wir die von Hertz damals untersuchten Wellen dem radiofrequenten Teil des elektromagnetischen Spektrums zu. Diese Frequenzen liegen im Bereich von wenigen Hertz bis 109 Hz, was Wellenlängen von vielen Kilometern bis etwa 0,3 m entspricht. Solche Wellen werden von elektrischen Schwingkreisen ausgesendet. Der Wechselstrom in Hochspannungsleitungen mit einer Frequenz von 50 Hz sendet Strahlung einer Wellenlänge von 6×106 m aus. Theoretisch gibt es keine obere Grenze für die Wellenlänge. Wellen mit einer Länge von über 40 Milliarden Metern gelangen aus dem Weltraum auf die Erde. Das hochfrequente Ende des Radiobandes wird für die Übertragung von Rundfunk- und Fernsehprogrammen benutzt. 14

Wahrscheinlich war in Wirklichkeit David Hughes der Erste, dem dies gelang, jedoch blieben Hughes’ 1879 vorgenommene Versuche unveröffentlicht und viele Jahre lang unbemerkt.

109

106

103

1 THz

1 GHz

1 MHz

1 kHz

1 km

1m

1 cm

1μ 1 eV

1 keV

105

102 103

21 cm H-Linie 100

10−2

10−6

10−9

10−10

1 MeV

10−11

10−6

100 10−1

10

103

106

hν Energie der Photonen (eV)

10−27

UKW

Radar

Wechselstrom

Radiowellen

Rundfunk

Mikrowellen

Infrarot

Sichtbares Licht

Ultraviolett

Röntgenstrahlen

γ-Strahlen

UHF VHF TV

10−20

10−19

10−18

10−14

hν Energie der Photonen (J)

Abb. 3.43: Das elektromagnetische Spektrum der Photonen.

1012

1015 1014

1Å 1 nm

10−13

(m)

(Hz)

1022

λ Wellenlänge

ν Frequenz

IonisationsKammer

Geigerund Szintillationszähler

Nachweis

Elektronenspin Kernspin

Elektronische Schaltkreise

Kristall

Innere und Photoelektrischer äußere Photomultiplier Elektronen Valenzelektronen Auge MolekülBolometer schwingungen und Thermosäule -rotationen

Innere Elektronen

Atomkerne

Mikroskopische Quelle

Wechselstromgeneratoren

Elektronische Schaltkreise

Magnetron Klystron Wanderfeldröhre

Heiße Körper

Laser Lichtbogen Funken Glühlampen

Synchrotron

Röntgenröhren

Beschleuniger

Künstliche Erzeugung

3.6 Das elektromagnetische Spektrum 159

160

3 Theorie des Elektromagnetismus, Photonen und Licht

Die Energie eines Photons aus dem Radiobereich mit einer Frequenz von 1 MHz (106 Hz) ist sehr gering, sie beträgt 6,62 × 10−28 J oder 4 × 10−9 eV. Die Kornstruktur der Strahlung tritt deshalb nicht in Erscheinung – man bemerkt nur einen gleichmäßigen Energiefluss.

3.6.2 Mikrowellen Der Frequenzbereich der Mikrowellen erstreckt sich von 109 Hz bis etwa 3 × 1011 Hz; die zugehörigen Wellenlängen liegen zwischen 30 cm und 1 mm. Strahlung mit Wellenlängen zwischen weniger als 1 cm und ca. 30 m kann die Erdatmosphäre durchdringen. Daher sind Mikrowellen für den Funkverkehr mit Raumschiffen und für die Radioastronomie von Bedeutung. Insbesondere senden ungeladene Wasserstoffatome, die in weiten Bereichen des Universums vorkommen, 21-cm-Mikrowellen (bei 1420 MHz) aus. Diese Strahlung lieferte viele Informationen über die Struktur der Milchstraße und anderer Galaxien. Moleküle können Energie absorbieren und emittieren, indem sich der Bewegungszustand ihrer atomaren Bestandteile ändert – diese werden in Rotationen oder Schwingungen versetzt. Die jeder Bewegung zugeordnete Energie ist wiederum quantisiert, sodass Moleküle außer den Energieniveaus der Elektronen noch Rotations- und Schwingungsniveaus besitzen. Das elektrische Feld einer einfallenden elektromagnetischen Welle kann nur auf polare Moleküle eine Kraft ausüben. Die Dipole richten sich im Feld aus, und nur sie können ein Photon absorbieren und durch einen Rotationsübergang in einen angeregten Zustand gelangen. Schwere Moleküle lassen sich nicht leicht in Bewegung bringen; ihre Rotationsresonanzen sind daher bei niedrigen Frequenzen zu erwarten (im fernen Infrarot, 0,1 mm, bis zum Mikrowellenbereich, 1 cm). Wassermoleküle beispielsweise sind polar (siehe Abb. 3.37). Werden sie von einer elektromagnetischen Welle getroffen, versuchen sie, sich relativ zu deren zeitlich veränderlichem E-Feld auszurichten. Besonders heftig erfolgt die Bewegung, wenn die eingestrahlte Frequenz einer der Resonanzen des Moleküls entspricht.

Bild eines Schokoriegels, das mithilfe von TStrahlen aufgenommen wurde. Die unter der Schokolade verborgenen Nüsse werden durch Brechungseffekte sichtbar gemacht. (Mit frdl. Genehmigung von V. Rudd, Picometrix, Inc.). Mikrowellenantennen auf dem Eiffelturm.

3.6 Das elektromagnetische Spektrum

161

Aufnahme eines 28 × 106 km2 großen Gebietes nordöstlich von Alaska, die vom Satelliten Seasat aus 800 km Höhe aufgenommen wurde. Das Bild sieht etwas ungewöhnlich aus, denn es handelt sich um ein Radar- oder Mikrowellenfoto. Der grau gefleckte Bereich rechts ist Kanada. Das kleine, helle, muschelförmige Gebilde links davon ist Banks Island; es ist eingebettet in ein schwarzes Band aus einjährigem, ufernahem Meereis. Weiter links erkennt man glatt und grau das offene Meer. Dunkelgrau gefleckt erscheint ganz links das polare Packeis. Wolken sind nicht zu sehen, denn sie werden von der Radarstrahlung mühelos durchdrungen.

Mikrowellenstrahlung bei oder nahe einer solchen Frequenz wird daher effizient absorbiert. Eine allgemein bekannte Anwendung dieses Effekts ist der Mikrowellenherd (12,2 cm, 2,45 GHz). Bei unpolaren Molekülen wie Kohlendioxid, Wasserstoff, Stickstoff, Sauerstoff und Methan können Rotationsübergänge nicht durch die Absorption von Photonen angeregt werden. Mikrowellen verwendet man heute für die verschiedensten Zwecke – für die Übertragung von Telefongesprächen und Fernsehbildern, zum Kochen und Backen, für Flugleitsysteme (Radar) und Radarfallen, zur Aufklärung der Ursprünge des Weltalls, zum Öffnen von Garagentoren und zur Abbildung der Oberfläche unseres Planeten (siehe Foto oben). Auch in der Wellenoptik macht man sich Mikrowellen zunutze, da man die Versuchsanordnungen auf diese Weise auf bequem handhabbare Maße vergrößern kann. Die Photonen am niederfrequenten Ende des Mikrowellenbandes sind sehr energiearm, und man sollte annehmen, dass sie ausschließlich von elektrischen Schwingkreisen erzeugt werden. Allerdings kann derartige Strahlung auch bei Atomübergängen emittiert werden – dann nämlich, wenn die beteiligten Energieniveaus einander eng benachbart sind. Der scheinbare Grundzustand des Cäsiumatoms ist ein gutes Beispiel dafür; es handelt sich dabei eigentlich um ein Paar sehr dicht beieinander liegender Energieniveaus. Der Übergang zwischen beiden erfordert nur eine geringe Energiezufuhr (4,14 × 10−5 eV), dabei findet eine Emission von Mikrowellen mit einer Frequenz von 9,192 631 77 × 109 Hz statt. Dies ist die Grundlage für die bekannte „Cäsiumuhr“, den gegenwärtigen Standard für die Frequenz- und Zeitmessung. Der Übergangsbereich zwischen dem Mikrowellen- und dem Infrarotgebiet (ungefähr 50 GHz bis 10 THz) wird auch als Terahertz- oder T-Strahlung bezeichnet. Trockene, unpolare Materialien wie Kunststoffe, Papier und Fett absorbieren T-Strahlung in der Regel nicht, Wasser hingegen absorbiert sie und Metalle reflektieren sie (infolge ihrer ungebundenen Elektronen). Aus diesem Grund lässt sich die T-Strahlung verwenden, um innere, ansonsten unsichtbare Strukturen von Gegenständen abzubilden (siehe Foto S. 160 rechts).

162

3 Theorie des Elektromagnetismus, Photonen und Licht

3.6.3 Infrarotstrahlung Der infrarote Frequenzbereich, der sich ungefähr von 3 × 1011 Hz bis 4 × 1014 Hz erstreckt, wurde 1800 von dem berühmten Astronomen Sir William Herschel (1738– 1822) entdeckt. Wie der Name besagt, liegt das Frequenzband unmittelbar unterhalb des sichtbaren roten Lichts. Die Infrarot- oder IR-Region unterteilt man gewöhnlich in vier Bereiche: das nahe IR (nahe dem sichtbaren Licht, zwischen 780 und 3000 nm), das mittlere IR (3000 − 6000 nm), das ferne IR (6000 − 15 000 nm) und das extreme IR (15 000 nm bis 1 mm). Diese Einteilung ist nicht streng festgelegt, und die Nomenklatur ist nicht allgemeingültig. Strahlung am langwelligen Ende des Bandes gewinnt man entweder durch Mikrowellenoszillatoren oder durch glühende Medien (molekulare Oszillatoren). Jeder Stoff strahlt und absorbiert im Infrarotbereich durch die thermische Anregung seiner Moleküle.

Ein IR-Foto. Das Hemd sieht im sichtbaren Bereich dunkelbraun aus, und das Unterhemd ist, ebenso wie der Ball, schwarz. (Foto E. H.)

Bei jeder Temperatur oberhalb des absoluten Nullpunkts (−273 ◦ C) senden alle Moleküle IR-Strahlung aus, die allerdings auch sehr schwach sein kann (Abschn. 13.1.1). Heiße Körper wie elektrische Heizspiralen, glühende Kohlen und der gewöhnliche Zimmerheizkörper geben ebenfalls Infrarotstrahlung ab. Nahezu die Hälfte der elektromagnetischen Energie, die uns von der Sonne erreicht, liegt im Infrarotbereich – selbst eine normale Glühlampe strahlt weitaus mehr infrarotes als sichtbares Licht aus. Auch wir Menschen strahlen, wie alle anderen Warmblüter auch, (relativ schwach) im Infraroten. Das Spektrum beginnt bei 3000 nm, die Intensität erreicht bei ca. 10 000 nm ein Maximum und fällt im langwelligeren Bereich langsam ab, bis ins extreme IR und in vernachlässigbarem Ausmaß darüber hinaus. Diese Emission wird in Nachtsichtgeräten und von einigen gefährlichen nachtaktiven Schlangen (der Grubenotter, Fam. Crotalidae, und der Boa constrictor, Fam. Boidae) ausgenutzt.

3.6 Das elektromagnetische Spektrum

163

Außer der Rotation kann ein Molekül unterschiedliche Schwingungsbewegungen vollführen, wobei die einzelnen Atome relativ zueinander in unterschiedlicher Weise ausgelenkt werden. Auch unpolare Moleküle schwingen – selbst lineare Systeme wie CO2 haben drei Grundschwingungen und eine Reihe von Schwingungsenergieniveaus, von denen jedes durch Photonen angeregt werden kann. Die Schwingungsabsorptionsund -emissionsspektren liegen allgemein im IR (1000 nm bis 0,1 mm). Für viele Moleküle befinden sich sowohl Rotations- als auch Schwingungsresonanzen im IR, und die Absorption erfolgt sehr effektiv – daher wird die IR-Strahlung oft irreführend als „Wärmestrahlung“ bezeichnet, was man leicht nachvollziehen kann, wenn man sein Gesicht eine Weile in die Sonne hält und spürt, wie warm es dabei wird.

Wärmebild des Autors. Der Bart (kühlere Region) ist deutlich zu sehen; Kennern der ersten Auflage dieses Buches wird außerdem der inzwischen zurückgegangene Haaransatz auffallen. (Foto E. H.)

Zur Messung der Infrarotstrahlung verwendet man Geräte, die auf die Wärme reagieren, welche an einer schwarzen Oberfläche durch Absorption im IR-Bereich entsteht. Beispielsweise gibt es Thermopaare, pneumatische (z. B. Golay-Zellen) und pyroelektrische Detektoren sowie Bolometer. Der eigentliche Messvorgang beruht dabei auf der Temperaturabhängigkeit einer induzierten Spannung, eines Widerstandes, eines Gasvolumens oder einer permanenten elektrischen Polarisation. Über ein Abtastsystem kann man den Detektor an eine Kathodenstrahlröhre koppeln und auf diese Weise eine Momentaufnahme erzeugen, die einem Fernsehbild ähnelt (siehe Foto). Solche so genannten Wärmebilder werden für verschiedenste diagnostische Zwecke, beispielsweise in der Medizin und der Elektrotechnik, benötigt. Ebenso verfügbar sind fotografische Filme, die im nahen IR (< 1300 nm) empfindlich sind. IR-Spionagesatelliten spüren geheime Raketenstarts auf, andere IR-Satelliten suchen nach Getreidekrankheiten oder spähen in den Weltraum; es gibt „wärmesuchende“, IR-gelenkte Raketen, IR-Laser und IR-Teleskope. Kleine Temperaturunterschiede zwischen Objekt und Umgebung führen zu charakteristischen IR-Emissionen, anhand derer man Hirntumore und Brustkrebsherde ebenso erkennen kann wie einen lauernden Einbrecher. Der CO2 -Laser, eine gut handhabbare kontinuierliche Leistungsquelle (100 W und mehr), wird verbreitet in der Industrie eingesetzt, etwa zum Präzisionsschneiden von Werkstoffen und zur Wärmebehandlung.

164

3 Theorie des Elektromagnetismus, Photonen und Licht

Die Emissionen dieses Lasers im extremen IR (18,3 µm bis 23,0 µm) werden von der menschlichen Haut sehr gut absorbiert – so erhält man ein effektives Skalpell, das unblutig schneidet, da es das verletzte Gewebe sofort wieder verschweißt.

3.6.4 Sichtbares Licht Sichtbares Licht ist elektromagnetische Strahlung in einem schmalen Frequenzband zwischen ca. 3,84 × 1014 Hz und ca. 7,69 × 1014 Hz (siehe Tab. 3.4). Es entsteht im Allgemeinen durch eine Umordnung der Valenzelektronen in Atomen und Molekülen. (Nicht zu vergessen ist dabei allerdings die Synchrotronstrahlung, die auf einem anderen Mechanismus beruht.)15

Aufnahme eines Arms, angefertigt mit breitbandiger Lichtstrahlung (zwischen 468,5 nm, sichtbares Licht, und 827,3 nm, nahes Infrarot). Dieses Verfahren wird in der Biomedizin vielfältig angewendet, unter anderem zur Früherkennung von Hautkrebs.

In einem glühenden Stoff, wie dem Glühfaden einer Glühbirne oder dem Feuerball der Sonne, werden die Elektronen in zufälligen Richtungen beschleunigt und stoßen häufig zusammen. Dabei wird in einem weiten Frequenzbereich die so genannte Wärmestrahlung emittiert, die eine wichtige Lichtquelle ist. Bei einer elektrischen Entladung in einer gasgefüllten Röhre, einer so genannten Gasentladungsröhre, werden dagegen Atome angeregt. Sie senden daraufhin Strahlung aus, die aus einer Reihe definierter Frequenzbanden oder Linien besteht, welche für die jeweils angeregte Atomsorte (genauer gesagt, für die Lage der beteiligten Energieniveaus) charakteristisch sind. Verwendet man als Gas das Isotop Krypton-86, so sind die Emissionslinien besonders schmal: Sie haben keine Hyperfeinstruktur, da der Kernspin des Isotops gleich null ist. Die Breite der orangeroten Kr-86-Linie, die im Vakuum bei einer Wellenlänge von 605,780 210 5 nm erscheint, beträgt in halber Höhe nur 0,000 47 nm oder etwa 400 MHz. Man verwendete diese Linie daher bis 1983 als internationalen Standard der Längenmessung (1 650 763,73 Wellenlängen entsprechen genau einem Meter). 15

Es ist nicht notwendig, Licht ausgehend von der Physiologie des Menschen zu definieren – es wäre wahrscheinlich nicht einmal sehr sinnvoll! Siehe beispielsweise T. J. Wang, „Visual Response of the Human Eye to X Radiation.“ Am. J. Phys. 35, 779 (1967).

3.6 Das elektromagnetische Spektrum

165

Tabelle 3.4: Ungefähre Bereiche der Frequenz und der Vakuumwellenlänge für die verschiedenen Farben.

Farbe

λ0 (nm)

ν (THz) ∗

Farbe

λ0 (nm)

ν (THz) ∗

Rot Orange Gelb

780–622 622–597 597–577

384–482 482–503 503–520

Grün Blau Violett

577–492 492–455 455–390

520–610 610–659 659–769



1 Terahertz (THz) = 1012 Hz, 1 Nanometer (nm) = 10−9 m.

Newton erkannte als Erster, dass weißes Licht in Wirklichkeit eine Mischung aus allen Farben des sichtbaren Spektrums ist und dass die Farben, die man beim Durchgang von weißem Licht durch ein Glasprisma sieht, nicht von diesem erzeugt werden. Jahrhundertelang hatte man geglaubt, das Prisma würde das Licht verändern – Newton entdeckte, dass es das Licht lediglich in seine Farbbestandteile aufspaltet. Der Begriff weiß hängt demnach damit zusammen, wie wir das Tageslichtspektrum auf der Erde empfinden, dessen breite Frequenzverteilung auf der violetten Seite schneller abfällt als auf der roten (Abb. 3.44). Das für die Farbwahrnehmung zuständige sensorische Feld unserer Großhirnrinde „versteht“ unter weiß eine Mischung vieler verschiedener Frequenzen, wobei die Energie aller Teile des Spektrums ungefähr gleich ist. Das für uns weiße Licht ist also eine Mischung vieler Spektralfarben zu gleichen Teilen. Eine nicht geringe Zahl unterschiedlicher Frequenzmischungen erscheint uns mehr oder weniger weiß. Ein Blatt Papier beispielsweise zeigt im Licht einer Glühlampe ein „anderes“ Weiß als bei Tageslicht. Die Weißempfindung wird von vielen Paaren farbiger Lichtstrahlen erzeugt (zum Beispiel 656 nm, rot, und 492 nm, cyan). Zwischen den verschiedenen „Weißtönen“ kann das Auge nicht immer unterscheiden, da es das Licht nicht durch Zerlegung in seine harmonischen Komponenten analysieren kann, wie es etwa das Ohr mit dem Schall vermag (siehe Abschn. 7.3). Die thermische Strahlung eines idealen Emitters, also eines so genannten schwarzen Körpers, hängt von seiner Temperatur ab (siehe Abb. 13.2). Die meisten heißglühenden Objekte entsprechen im Wesentlichen einem schwarzen Körper und emittieren einen breiten Frequenzbereich, wobei umso mehr Energie am niederfrequenten Ende des Spektrums abgegeben wird, je kühler das Objekt ist. Außerdem ist das Objekt umso heller, je heißer es ist. Obwohl über dem absoluten Nullpunkt grundsätzlich alles elektromagnetische Strahlung emittiert, müssen Gegenstände doch ziemlich heiß werden, bevor sie anfangen, im sichtbaren Bereich ordentlich zu strahlen. Tatsache ist, dass Sie hauptsächlich im infraroten Bereich emittieren und überhaupt kein detektierbares Licht abgeben. Dagegen glüht die Flamme eines Streichholzes bei vergleichsweise niedrigen 1700 K rot-orange, die mit 1850 K etwas heißere Flamme einer Kerze ist eher gelb und das von einer Glühlampe (2800–3300 K) emittierte Spektrum enthält etwas mehr Blau und leuchtet gelb-weiß. Bei noch höheren 6500 K erreichen

absolute Bestrahlungsstärke ( µW/cm2/nm)

700

Tageslicht 10

5

0 400

450

500 550 600 650 Wellenlänge (nm)

weiße Wolke 1

0.5

0 400

450

500 550 600 650 Wellenlänge (nm)

GE Soft White Fluoreszenzlampe 20

10

0

400

450

500 550 600 650 Wellenlänge (nm)

700

750

blauer Himmel 0.4

0.2

0 400

450

500 550 600 650 Wellenlänge (nm)

700

Westinghouse Weißlicht-LED 1

0.5

absolute Bestrahlungsstärke (µW/cm 2/nm)

absolute Bestrahlungsstärke ( µW/cm2/nm) absolute Bestrahlungsstärke (µW/cm 2/nm) absolute Bestrahlungsstärke (µW/cm 2/nm)

700

absolute Bestrahlungsstärke (µW/cm 2/nm)

3 Theorie des Elektromagnetismus, Photonen und Licht

166

0

400

450

500 550 600 650 Wellenlänge (nm)

700

750

GE Soft White Glühlampe 3 2 1 0

400

450

500 550 600 650 Wellenlänge (nm)

700

750

Abb. 3.44: Verschiedene spektrale Verteilungen von Licht. (Dr. Gottipaty N. Rao, Adelphi University)

wir ein Spektrum, das üblicherweise als Tageslicht bezeichnet wird. Digitalkameras, DVDs und viele andere Anwendungen sind auf eine Farbtemperatur von 6500 K ausgelegt. Die Farbempfindung ist die subjektive physiologische und psychologische Reaktion des Menschen in erster Linie auf die verschiedenen Frequenzbereiche zwischen 384 THz und 769 THz in der Reihenfolge Rot, Orange, Gelb, Grün, Blau, Violett (siehe Tab. 3.4). Dabei ist die Farbigkeit keine Eigenschaft des Lichts selbst, sondern sie wird durch die elektrochemische Sinneswahrnehmung im Auge, in den Nervenbahnen und im Gehirn hervorgerufen. Wir sollten daher nicht „gelbes Licht“ sagen, sondern „von uns als gelb empfundenes Licht“. Verschiedene Frequenzmischungen können interessanterweise dieselbe Farbempfindung im sensorischen Feld auslösen. Ein roter Lichtstrahl (mit einem Frequenzmaximum bei 430 THz), der von einem grünen Lichtstrahl (mit einem Maximum bei 540 THz) überlagert wird, erzeugt einen gelben Farbeindruck, obwohl die Mischung keinen Anteil aus dem so genannten gelben Bereich des Spektrums besitzt. Das sensorische Feld scheint den einfallenden Fre-

3.6 Das elektromagnetische Spektrum

167

quenzbereich zu mitteln und „sieht“ Gelb (Abschn. 4.9). Aus diesem Grund kommt ein Farbbildschirm mit den drei Grundfarben Rot, Grün und Blau aus. In hellem Sonnenlicht mit einer Photonenflussdichte von 1021 Photonen pro Quadratmeter und Sekunde tritt die Quantennatur des Lichts kaum in Erscheinung. Anders verhält es sich bei sehr schwachen Strahlenbündeln: Da die Photonen im sichtbaren Bereich genug Energie (hν ≈ 1,6 bis 3,2 eV) besitzen, um sich durch individuelle Effekte bemerkbar zu machen, wird die Körnung des Lichts deutlich. Die Forschung auf dem Gebiet des menschlichen Sehvermögens zeigt, dass unseren Augen bereits 10 „sichtbare“ Photonen, möglicherweise sogar ein einziges, registrieren kann.

3.6.5 Ultraviolettes Licht Im elektromagnetischen Spektrum schließt sich dem Bereich des sichtbaren Lichts der Bereich der ultravioletten Strahlung an. Das UV-Licht (ca. 8 × 1014 Hz bis 3 × 1016 Hz) wurde von Johann Wilhelm Ritter (1776–1810) entdeckt. Die Energien der UV-Photonen liegen zwischen ca. 3,2 und 100 eV. Die ultraviolette Strahlung von der Sonne besitzt daher mehr als genug Energie, um die Atome in der Hochatmosphäre zu ionisieren – so entsteht die Ionosphäre. Außerdem liegen die Energien der UV-Photonen im Bereich der Energie vieler chemischer Reaktionen, welche daher durch UV-Licht ausgelöst werden können. Zum Glück enthält unsere Atmosphäre Ozon (O3 ), das einen Großteil der UV-Strahlung der Sonne absorbiert: Gelangte diese ungehindert auf die Erdoberfläche, wäre sie für uns tödlich. Bei Wellenlängen unter ungefähr 290 nm wirkt UV-Strahlung keimtötend. Mit zunehmender Frequenz gewinnen die Teilchenaspekte der Strahlung an Bedeutung. Wir können ultraviolettes Licht nur schlecht sehen, da die Hornhaut besonders bei geringen Wellenlängen und die Augenlinse oberhalb von 300 nm stark absorbiert. Jemand, dem wegen eines grauen Stars eine Linse entfernt wurde, kann UV-Licht (λ > 300 nm) sehen. Insekten, zum Beispiel die Honigbiene, reagieren ebenso auf UV-Licht wie unter anderem Tauben: Sie können UV-beleuchtete Muster erkennen und sich möglicherweise dadurch auch bei Bewölkung am Sonnenstand orientieren. Atome emittieren UV-Strahlung, wenn Elektronen von hoch angeregten Niveaus wieder in den Grundzustand zurückkehren. Das Valenzelektron des Natriumatoms kann zum Beispiel immer weiter angeregt werden, bis es sich schließlich vom Atom löst; zurück bleibt ein Ion. Dieses kann sich anschließend wieder mit einem freien Elektron vereinigen, welches sehr schnell in den Grundzustand übergeht – höchstwahrscheinlich in Form einer Reihe von Sprüngen, wobei jedes Mal ein Photon ausgesendet wird. Das Elektron kann den Grundzustand aber auch in einem einzigen weiten Sprung erreichen und dabei ein einzelnes UV-Photon (5,1 eV) emittieren. Wenn die inneren, fest gebundenen Elektronen eines Atoms angeregt werden, kann UV-Strahlung noch höherer Energie erzeugt werden.

168

3 Theorie des Elektromagnetismus, Photonen und Licht

UV-Fotografie der Venus, aufgenommen von der Sonde Mariner 10. (DVIDS/NASA)

Die ungepaarten Valenzelektronen isolierter Atome sind wichtige Quellen farbigen Lichts. Vereinigen sich solche Atome jedoch zu Molekülen oder Festkörpern, so bilden sich chemische Bindungen, wobei sich in der Regel alle Valenzelektronen zu Paaren zusammenfinden. Diese sind häufig stärker an den Kern gebunden; die Anregungsenergien von Molekülen liegen daher oft im kürzerwelligen UV. Elektronenspektren dieser Art findet man bei Atmosphärenbestandteilen wie N2 , O2 , CO2 und H2 O. Heute gibt es UV-empfindliche fotografische Filme, UV-Mikroskope, UV-Laser und UV-Teleskope auf Erdumlaufbahnen.

3.6.6 Röntgenstrahlung Die Röntgenstrahlung wurde 1895 mehr oder weniger zufällig von Wilhelm Conrad Röntgen (1845–1923) entdeckt. Ihr Frequenzbereich erstreckt sich von ungefähr 2,4 × 1016 Hz bis 5 × 1019 Hz. Die Wellenlängen sind sehr gering, meistens kleiner als die Abmessungen von Atomen. Aufgrund ihrer hohen Energie (100 eV bis 0,2 MeV) können Röntgenphotonen einzeln, wie winzige Geschosse, mit Materie in Wechselwirkung treten, wobei die körnige Natur der Strahlung in Erscheinung tritt. Ein besonders zweckmäßiger Mechanismus zur Erzeugung von Röntgenstrahlen ist das schnelle Abbremsen geladener, sich mit hoher Geschwindigkeit bewegender Teilchen: Trifft zum Beispiel ein Strahl schneller Elektronen auf Materie (eine Kupferplatte), so entsteht die so genannte Bremsstrahlung mit einem breiten Frequenzspektrum. Die Ursache dafür ist die Ablenkung der Elektronen durch Zusammenstöße mit Kupferkernen, wobei Erstere Röntgenphotonen aussenden. Durch den Elektronenbeschuss können die Atome des Targets außerdem ionisiert werden. Falls dabei ein Elektron einer inneren, fest an den Kern gebundenen Schale herausgeschlagen wird, kehrt die Elektronenwolke unter Emission eines Röntgenphotons in den Grundzustand zurück. Solche Emissionen können nur bei bestimmten Wellenlängen erfolgen, die für die Struktur der Energieniveaus des Targetatoms spezifisch sind; man nennt sie daher auch charakteristische Strahlung.

3.6 Das elektromagnetische Spektrum

169

Röntgenbild der Sonne, aufgenommen im März 1970. In der südöstlichen Ecke sieht man den Rand des Mondes. (Mit frdl. Genehmigung von Dr. G. Vaiana und der NASA.)

Ein traditionelles „Röntgenbild“, wie es in der medizinischen Diagnostik verwendet wird, ist nicht viel aussagekräftiger als ein Schattenbild und kommt einer Fotografie nicht im Entferntesten nahe. Bisher ist es noch nicht gelungen, brauchbare Linsen für Röntgenstrahlung herzustellen. Neuerdings benutzt man jedoch Spiegel zur Fokussierung des Strahls (siehe Abschn. 5.4), was zur Entwicklung völlig neuer, detailgetreuerer Abbildungsverfahren führte. Damit erhält man aufschlussreiche Bilder verschiedenster Objekte vom implodierenden Fusionskügelchen bis zu mehrere Millionen Grad heißen kosmischen Röntgenquellen wie der Sonne (siehe Foto oben), entfernten Quasaren und Schwarzen Löchern. Röntgenteleskope auf Erdumlaufbahnen ermöglichen spannende Einblicke in die Tiefen des Alls (siehe Fotos unten). Es gibt Röntgenmikroskope, Pikosekunden-Streakkameras für den Röntgenbereich, Beu-

Links: Der Krebsnebel (6000 Lichtjahre von der Erde entfernt) wird von den Überresten eines explodierten Sterns gebildet, eine Supernova, die im Jahr 1054 beobachtet wurde. Der Nebel ist eine helle Quelle von langwelliger Radiostrahlung. Die individuellen Photonenenergien sind hier relativ klein. Beachten Sie, dass der Hintergrund von enntfernten Sternen in dem Bild fehlt. 2. v. l.: Im Zentrum des Krebsnebels (lokalisiert im Sternbild Stier) befindet sich ein schnell drehender Neutronenstern oder Pulsar, der 20 mal pro Sekunde Strahlungsblitze emittiert. Dieses Bild wurde mit Nahinfrarot-Strahlung aufgenommen. Relative heiße Bereiche erscheinen auf dem Foto hell. Einige Sterne im Hintergrund erscheinen in sichtbarem Licht heller als in Nahinfrarot-Strahlung und umgekehrt. 2. v. r.: Optische Abbildung des Krebsnebels; das Licht, das hier zu sehen ist, stammt von Teilchen mittlerer Energie. Die fadenförmigen Gebilde entstehen aus zehntausende Grad heißen Gasen. Rechts: Diese erstaunlich detailreiche Röntgenaufnahme des Krebsnebels (siehe Abschn. 3.4.2) wurde vom Röntgenobservatorium Chandra aufgenommen. Gut zu erkennen sind die Regionen des Pulsars, in denen sich die energiereichsten Teilchen sammeln.

170

3 Theorie des Elektromagnetismus, Photonen und Licht

gungsgitter und Interferometer für Röntgenstrahlung; die Forschungen auf dem Gebiet der Röntgenholographie gewinnen an Bedeutung. 1984 gelang es einer Gruppe vom Lawrence Livermore National Laboratory erstmals, Laserstrahlung mit einer Wellenlänge von 20,6 nm zu erzeugen. Obwohl diese streng genommen in den extremen UV-Bereich gehört, liegt sie doch nahe genug am Röntgenbereich, um sie als den ersten weichen Röntgenlaser anzusehen.

3.6.7 Gammastrahlung Die Gammastrahlen bilden das hochenergetische (104 bis etwa 1019 eV), kurzwellige Ende des elektromagnetischen Spektrums. Emittiert werden sie bei Übergängen innerhalb des Atomkerns. Schon ein einzelnes Gamma-Photon ist so energiereich, dass man es problemlos nachweisen kann. Seine Welleneigenschaften jedoch sind aufgrund der extrem geringen Wellenlänge nahezu nicht mehr zu erkennen. Damit haben wir alle Frequenzbereiche des elektromagnetischen Spektrums von den Radiowellen bis zur Gammastrahlung besprochen. Irgendwo in der Mitte (bei logarithmischer Darstellung des Spektrums) befindet sich die Region des sichtbaren Lichts. Dessen Energie ist quantisiert, was auf die Energie elektromagnetischer Strahlung allgemein zutrifft. Was wir jedoch „sehen“, hängt hier im Besonderen davon ab, wie wir „hinsehen“.

3.7

Quantenfeldtheorie

Ein geladenes Teilchen übt auf andere geladene Teilchen eine Kraft aus. Es überzieht seine Umgebung mit einem Netz elektromagnetischer Wechselwirkungen, das sich weit in den Raum erstreckt. Diese Vorstellung führt zum Begriff des elektrischen Feldes, der Verkörperung der elektromagnetischen Wechselwirkung auf makroskopischer Ebene. Das statische elektrische Feld ist ein räumliches Gebilde, das die Wechselwirkungen zwischen den Ladungen zusammenfasst. Dank Faraday wurde der Feldbegriff erweitert: Faradays Idee war, dass eine einzelne Ladung ein elektrisches Feld im Raum erzeugt und dass jede Ladung, die in dieses Feld gebracht wird, direkt mit dem Feld wechselwirkt und umgekehrt. Aus der Abbildung einer Ladungsverteilung (wodurch immer diese auch entstand) wurde ein Ding, ein Feld, das seinerseits Kräfte ausüben kann. Das Bild erscheint bis dahin noch einfach, wenn einem auch manche Frage in den Sinn kommt: Ist das statische elektrische Feld an sich physikalisch real? Wenn ja, füllt es dann einen Raum mit Energie, und wie geht dies vor sich? Fließt dabei irgendetwas? Wie wirkt das Feld auf eine Ladung? Braucht es Zeit, um seine Wirkung zu entfalten? Nachdem das elektromagnetische Feld zur Realität geworden war, stellten sich die Physiker Störungen dieses dünnen, die Leere des Raumes erfüllenden „Mediums“ vor. Licht wurde zur elektromagnetischen Welle im elektromagnetischen Feld. Sich vorzustellen, wie sich eine Welle in einem existierenden Medium fortbewegt, ist nicht

3.7 Quantenfeldtheorie

171

Abb. 3.45: Ultrakurzer grüner Lichtblitz, erzeugt von einem neodymdotierten Glaslaser. Der Puls dringt durch eine wassergefüllte Zelle, an deren Wand man eine Millimetereinteilung erkennt. Während der Belichtungszeit von 10 ps bewegte sich der Puls um etwa 2,2 mm vorwärts. (Mit frdl. Genehmigung der Bell Laboratories.)

schwer; schwieriger ist es schon, einen lokalisierten, in den Raum ausgesendeten Puls (wie in Abb. 3.45) zu erklären. Es gibt kein statisches, den Raum ausfüllendes Feld, das sich vor dem Puls erstreckt – dieses Medium muss der Puls während seiner Fortbewegung erst erschaffen. Im Prinzip kann man sich auch das vorstellen, aber es entspricht keineswegs dem, was man als klassische Welle bezeichnen würde. Jede herkömmliche Welle benötigt als Ausgangspunkt ein Medium im Gleichgewicht, das in jedem Punkt existiert, bevor die Welle ankommt und nachdem sie vorübergezogen ist. Konzeptionell ist die Idee der elektromagnetischen Welle, so schön sie mathematisch auch ist, also nicht ganz einfach zu durchdringen. Bereits 1905 meinte Einstein, die klassischen Gleichungen der Theorie des Elektromagnetismus beschrieben das Verhalten der Mittelwerte der betreffenden Größen. „Es erscheint mir absurd“, schrieb er an Planck, „dass die Energie kontinuierlich im Raum verteilt sein sollte, wenn man nicht annimmt, dass es einen Äther gibt ... Faradays Darstellung mag bei der Entwicklung der Elektrodynamik nützlich gewesen sein – daraus folgt meiner Meinung nach jedoch nicht, dass man diese Theorie in allen Einzelheiten aufrechterhalten muss.“ Zwar konnte die klassische Theorie alles, was man messen konnte, hervorragend erklären, aber die ungeheuer feine Körnung des Phänomens der elektromagnetischen Strahlung blieb völlig unberücksichtigt. Einstein schlug vor, dass das elektrische und das magnetische Feld quantisiert, also nicht kontinuierlich sind, und Teilcheneigenschaften aufweisen. Nicht zu vergessen ist auch, dass die klassische Theorie Jahrzehnte vor der Entdeckung des Elektrons ausgearbeitet wurde. Wenn die Ladung (die grundlegende Quelle des Elektromagnetismus) quantisiert war, sollte dies nicht in irgendeiner Weise in der Theorie zum Ausdruck kommen?

172

3 Theorie des Elektromagnetismus, Photonen und Licht

Unser Leitbild ist heute die Quantenmechanik, eine sehr mathematische Theorie, mit der sich vieles berechnen und vorhersagen lässt, die jedoch in unbefriedigender Weise abstrakt ist. Die Teildisziplin, die sich mit Teilchen und ihren Wechselwirkungen beschäftigt – die Quantenfeldtheorie (QFT) – ist die grundlegende und zweifellos die erfolgreichste aller physikalischen Theorien. Lichtquanten werden in dieser Theorie ganz zwanglos aus der Quantisierung des elektromagnetischen Feldes erklärt. Die offensichtliche Schlussfolgerung daraus lautet, dass alle Mikroteilchen in derselben Weise von ihren eigenen Feldern abstammen: Das Feld ist das Objekt. Das Elektron ist dann das Quantum des Elektronenfeldes, das Proton das Quantum des Protonenfeldes usw. Einen Großteil des zwanzigsten Jahrhunderts lang waren die Feldtheoretiker damit befasst, die Details der Quantenfeldtheorie auszuarbeiten. In der modernen Quantenfeldtheorie gibt es zwei unterschiedliche philosophische Strömungen: Die eine stellt das Feld, die andere das Teilchen in den Mittelpunkt. Im ersten Fall werden die Felder als die Grundlage aller Dinge angesehen, Teilchen sind nur die Quanten der Feldes. Im zweiten Fall werden die Teilchen als fundamentale Einheiten betrachtet, Felder sind dann nur die makroskopischen, kohärenten Zustände der Teilchen. Die Feldtradition geht auf L. de Broglie (1923), E. Schrödinger, P. Jordan und W. Pauli zurück, deren Forschungsarbeiten den Grundstein der Wellenmechanik, einer speziellen Variante der Quantenmechanik, legten. Die Teilchentradition nahm ihren Anfang in den frühen Arbeiten W. Heisenbergs (1925), dessen geistiger Mentor P. A. M. Dirac war (dieser hatte die Teilchenvorstellung mit seiner Idee des ElektronPositron-Paars eigentlich begründet). Ein spezieller Zweig der Quantenfeldtheorie, der eine relativistische quantenmechanische Behandlung der elektromagnetischen Wechselwirkung anstrebt, ist die Quantenelektrodynamik (QED), deren Verfechter ebenfalls in eine teilchenorientierte und eine feldorientierte Gruppe zerfallen. Einige grundlegende Ideen der Quantenelektrodynamik machte R. P. Feynman einem größeren Auditorium zugänglich; sofern sie die Optik betreffen, werden wir sie im Verlaufe des Buches noch diskutieren (Abschn. 4.11). Die moderne Physik geht unter Heranziehung der Quantenfeldtheorie davon aus, dass alle Felder quantisiert sind. Die vier fundamentalen Kräfte (Gravitation; elektromagnetische, starke und schwache Wechselwirkung) werden jeweils von einem bestimmten Feldteilchen übermittelt. Diese so genannten Messenger-(Boten-)Bosonen werden von den miteinander in Wechselwirkung befindlichen materiellen Teilchen (Elektronen, Protonen usw.) ständig absorbiert und emittiert – dieser Austausch ist die Wechselwirkung. Zum elektrischen Feld gehört als vermittelndes Teilchen das virtuelle Photon, ein masseloser Bote, der sich mit Lichtgeschwindigkeit fortbewegt und Träger von Impuls und Energie ist. Die Abstoßung zwischen zwei Elektronen oder die Anziehung zwischen einem Elektron und einem Photon kommt daher durch die Emission und Absorption virtueller Photonen, genauer gesagt durch den damit verbundenen Impulsübertrag, zustande; der Impulstransport ist ein Maß für die wirkende Kraft. „Virtuell“ nennt man die Messenger-Bosonen des elektromagnetischen Feldes, weil sie

Aufgaben

173

nicht unabhängig von der Wechselwirkung existieren. Man kann sie niemals mit einem Messinstrument nachweisen – mag dies auch philosophisch unbefriedigend sein und es erschweren, die Existenz dieser Boten tatsächlich zu belegen. Im Unterschied zu realen Photonen sind virtuelle Photonen nur ein Hilfsmittel der Wechselwirkung. Sie sind theoretische Konstrukte, deren metaphysischer Zustand noch zu bestimmen ist.16 Die Messenger-Bosonen können makroskopisch als kontinuierliches Feld in Erscheinung treten, vorausgesetzt, sie können sich zu sehr großen Gruppen zusammenfinden. Elementarteilchen besitzen einen speziellen Eigendrehimpuls, den Spin, der die Gruppeneigenschaften bestimmt. Die Quantentheorie besagt, dass das erwünschte Feldverhalten nur dann auftreten kann, wenn der Drehimpuls der zugehörigen Messenger-Bosonen ein ganzzahliges Vielfaches von h/2π ist (also 0, 1h/2π, 2h/2π, 3h/2π usw.) Der Spin des virtuellen Photons ist gleich 1, sein Drehimpuls beträgt (h/2π). Die außerordentlich wichtige Gruppe der Wechselwirkungen, zu denen Spin1-Messengerteilchen gehören, nennt man Eichkräfte, für die das elektromagnetische Feld ein Modell ist. Heute erklärt man die magisch anmutende Fernwirkung mit einem nicht weniger mysteriösen Austausch von Teilchen, aber zumindest gibt es eine mathematische Theorie, die das Phänomen beschreibt und sehr zufriedenstellende Vorhersagen ermöglicht.

Aufgaben Lösungen zu den Aufgaben ohne ∗ finden Sie am Ende des Buches. 3.1

Betrachten Sie die ebene elektromagnetische Welle (inSI-Einheiten), die gegeben ist  durch Ex = 0, Ey = 2 cos 2π × 1014 (t − x/c) + π/2 und Ez = 0. (a) Bestimmen Sie Wellenlänge, Frequenz, Ausbreitungsrichtung, Amplitude, Anfangsphase und Polarisation dieser Welle. (b) Schreiben Sie einen Ausdruck für die magnetische Flussdichte auf.

3.2

Formulieren Sie je einen Ausdruck für die elektrische und die magnetische Feldkomponente einer ebenen harmonischen Welle, die sich in z-Richtung ausbreitet. Die Welle soll linear polarisiert sein, die Schwingungsebene befinde sich in einem Winkel von 45◦ zur xy-Ebene.

3.3* Zeigen Sie unter Beachtung von Gleichung (3.30), dass der Ausdruck k × E = ωB für eine ebene Welle mit konstanter Richtung des elektrischen Feldes gilt! 16

Eine ausführliche Diskussion der hier angesprochenen Probleme findet sich in H. R. Brown und R. Harré, Philosophical Foundations of Quantum Field Theory.

3 Theorie des Elektromagnetismus, Photonen und Licht

174

3.4* Betrachten wir eine elektromagnetische Welle, deren E-Feld in y-Richtung zeigt. Weisen Sie nach, dass die Anwendung von Gleichung (3.27), ∂E ∂B =− , ∂x ∂t auf die harmonische Welle mit E = E0 cos(kx − ωt)

B = B0 cos(kx − ωt)

in Übereinstimmung mit Gleichung (3.30) liefert E0 = cB0 . 3.5* Eine elektromagnetische Welle ist durch die folgende Funktion gegeben (in SI-Einheiten):

  1 √ 7 15 E = −3ˆı + 3 3ˆj 104 V/m ei[ 3 ( 5x+2y)π×10 −9,42×10 t] . Bestimmen Sie (a) die Schwingungsrichtung des elektrischen Feldes, (b) den skalaren Wert der Amplitude des elektrischen Feldes, (c) die Ausbreitungsrichtung der Welle, (d) die Wellenzahl und die Wellenlänge, (e) die Frequenz und die Winkelgeschwindigkeit und (f) die Geschwindigkeit der Welle. 3.6

Das elektrische Feld einer elektromagnetischen Welle, die sich in positiver x-Richtung fortpflanzt, ist gegeben durch E = E0ˆj sin

πz cos (kx − ωt) . z0

(a) Beschreiben Sie das Feld verbal. (b) Bestimmen Sie einen Ausdruck für k. (c) Wie groß ist die Phasengeschwindigkeit der Welle? 3.7* Das elektrische Feld E(z, t) einer elektromagnetischen Welle im Vakuum sei an einem bestimmten Ort und zu einer bestimmten Zeit durch E = (10 V/m)(cos 0,5π)ˆi gegeben. Schreiben Sie einen Ausdruck für das zugehörige B-Feld auf. 3.8* Eine harmonische elektromagnetische Welle mit einer Wellenlänge von 550 nm, deren elektrisches Feld in z-Richtung zeigt, breitet sich im Vakuum in y-Richtung aus. (a) Geben Sie die Frequenz der Welle an. (b) Wie groß sind ω und k? (c) Die Amplitude des elektrischen Feldes sei gleich 600 V/m. Wie groß ist die Amplitude des Magnetfeldes? (d) Schreiben Sie je einen Ausdruck von E(t) und für B(t) auf; beide Größen seien bei x = 0 und t = 0 gleich null. Setzen Sie alle erforderlichen Einheiten ein. 3.9* Das E-Feld einer elektromagnetischen Welle wird beschrieben durch

π E = (ˆi + ˆj)E0 sin kz − ωt + 6 Schreiben Sie einen Ausdruck für das B-Feld auf. Bestimmen Sie B(0, 0).

Aufgaben

175

3.10* Bestimmen Sie für die Welle aus der vorherigen Aufgabe E(−λ/2, 0) und skizzieren Sie die Vektordarstellung für diesen Moment. 3.11* Eine ebene elektromagnetische Welle, gegeben durch E(x, y, z, t) = E0ˆi ei(ky−ωt) , bewegt sich in y-Richtung durchs Vakuum. Bestimmen Sie für diese elektromagnetische Welle einen Ausdruck für das zugehörige Magnetfeld. Skizzieren Sie E0 , B0 und k, den Propagationsvektor. 3.12* Das B-Feld einer elektromagnetischen Welle im Vakuum sei B(x, y, z, t) = E0ˆj ei(kz+ωt) . Schreiben Sie einen Ausdruck für das zugehörige E-Feld auf. In welche Richtung propagiert die Welle? 3.13* Berechnen Sie, wie viel Energie zugeführt werden muss, um einen Plattenkondensator durch Ladungsübertragung von einer Platte zur anderen aufzuladen. Nehmen Sie an, dass die Energie im Feld zwischen den Platten gespeichert ist, und berechnen Sie die Energie pro Volumeneinheit, uE , in diesem Bereich [siehe Gl. (3.31)]. [Hinweis: Da die Energie während dieses Prozesses zunimmt, müssen Sie entweder integrieren oder den Mittelwert E/2 nehmen.] 3.14* Beweisen Sie ausgehend von Gleichung (3.32), dass die Energiedichten des elektrischen und des Magnetfeldes einer elektromagnetischen Welle gleich sind (also uE = uB ). 3.15 Der zeitliche Mittelwert einer Funktion f (t) in einem Intervall T ist gegeben durch ˆ 1 t+T f (t) T = f (t ) dt . T t Die Variable t ist nur ein „Platzhalter“ und τ = 2π/ω sei die Periode einer harmonischen Funktion. Zeigen Sie, dass dann für T = τ und für T  τ gilt 

 1 sin2 (k · r − ωt) = , 2  2  1 cos (k · r − ωt) = 2 und sin (k · r − ωt) cos (k · r − ωt) = 0 . 3.16* Zeigen Sie, dass die folgende allgemeinere Formulierung von Aufgabe 3.15 für jedes Intervall T gilt: 

cos2 ωt

 T

=

1 [1 + sinc ωT cos 2ωT ] . 2

3.17* Zeigen Sie in Analogie zur vorherigen Aufgabe, dass für jedes Intervall T gilt: 

sin2 ωt

 T

=

1 [1 − sinc ωT cos 2ωT ] . 2

3 Theorie des Elektromagnetismus, Photonen und Licht

176

3.18* Beweisen Sie, dass die Bestrahlungsstärke einer harmonischen elektromagnetischen Welle gegeben ist durch I=

1 E2 . 2cμ0 0

Bestimmen Sie dann die mittlere Rate des Energietransports pro Flächeneinheit durch eine ebene Welle mit einer Amplitude von 15,0 V/ m. 3.19* Ein 1,0-mW-Laser erzeugt einen nahezu parallelen Strahl mit einer Querschnittsfläche von 1,0 cm2 bei einer Wellenlänge von 650 nm. Bestimmen Sie die Amplitude des elektrischen Feldes in diesem Strahl unter der Annahme, dass die Wellenfronten homogen sind und dass das Licht sich im Vakuum ausbreitet. 3.20* Ein nahezu zylindrischer Laserstrahl trifft senkrecht auf eine perfekt absorbierende Fläche. Die Bestrahlungsstärke des Strahls (von dem wir annehmen, dass er entlang 2 seines √ Querschnitts homogen ist) beträgt 40 W/cm . Wenn der Strahldurchmesser 2,0/ π cm ist, wie viel Energie wird dann pro Minute absorbiert? 3.21* Gegeben ist der folgende Ausdruck für das E-Feld einer elektromagnetischen Welle, die sich in einem homogenen Dielektrikum ausbreitet: E = (−100 V/m) ˆj ei(kz−ωt) . Dabei gilt ω = 1,80 × 1015 rad/s und k = 1,20 × 107 rad/m. (a) Bestimmen Sie das zugehörige B-Feld. (b) Bestimmen Sie den Brechungsindex. (c) Berechnen Sie die Dielektrizitätskonstante. (d) Bestimmen Sie die Bestrahlungsstärke. (e) Skizzieren Sie E0 , B0 und den Propagationsvektor k. 3.22* Eine Glühlampe habe eine Strahlungsleistung von 20 W (vor allem im Infraroten). Berechnen Sie die Bestrahlungsstärke 1,00 m von der Lampe entfernt unter der Annahme, dass Sie diese als Punktquelle behandeln können. 3.23* Wir betrachten eine linear polarisierte, ebene elektromagnetische Welle im Vakuum, die sich in x-Richtung fortpflanzt. Ihre Schwingungsebene ist die xy-Ebene, ihre Frequenz beträgt 10 MHz, die Amplitude sei E0 = 0,08 V/m. (a) Wie groß sind Periode und Wellenlänge dieser Welle? (b) Schreiben Sie einen Ausdruck für E (t) und für B (t) auf. (c) Berechnen Sie die Flussdichte S der Welle. 3.24* Die von der Sonne in Form elektromagnetischer Strahlung im Mittel abgegebene Leistung, ihre Leuchtkraft L, beträgt 3,9 × 1026 W. Wie groß ist die mittlere Amplitude des zu dieser Energie gehörenden mittleren elektrischen Feldes am oberen Rand der Erdatmosphäre (1,5 × 1011 m von der Sonne entfernt)? 3.25 Eine linear polarisierte, ebene harmonische Welle mit einer skalaren Amplitude von 10 V/m breitet sich längs einer Gerade in der xy-Ebene aus, die mit der x-Achse einen Winkel von 45◦ bildet. Ihre Schwingungsebene ist die xy-Ebene. Beschreiben Sie diese Welle mit einem Vektorausdruck unter der Annahme, dass sowohl kx als auch ky positiv sind. Berechnen Sie die Flussdichte der Welle im Vakuum. 3.26 Ein Laser emittiert 2-ns-Pulse von UV-Strahlung. Der Strahldurchmesser sei 2,5 mm. Jeder Puls soll eine Energie von 6 J mitführen. (a) Wie lang ist ein solcher Wellenzug im Raum? (b) Wie groß ist die mittlere Energie pro Volumeneinheit eines Pulses?

Aufgaben

177

3.27* Ein Laser sendet im Vakuum Pulse elektromagnetischer Energie aus, die jeweils 10−12 s lang andauern. Die Strahlungsflussdichte beträgt 1020 W/m2 . Berechnen Sie die Amplitude des elektrischen Feldes des Strahls. 3.28 Der Strahl eines 1-mW-Lasers hat einen Durchmesser von 2 mm; die Divergenz des Strahls soll vernachlässigbar klein sein. Berechnen Sie die Energiedichte in unmittelbarer Nähe des Lasers. 3.29* Ein Heuschreckenschwarm mit einer Dichte von 100 Insekten pro Kubikmeter fliegt mit einer Geschwindigkeit von 6 m/min nach Norden. Wie groß ist die Flussdichte der Insekten – das bedeutet, wie viele Heuschrecken passieren in jeder Sekunde eine zur Flugrichtung senkrechte Fläche von einem Quadratmeter Inhalt? 3.30 Stellen Sie sich vor, Sie stehen in der Nähe einer Antenne, die ebene Wellen mit einer Frequenz von 100 MHz abstrahlt; die Flussdichte betrage an Ihrem Standort 19,88 × 10−2 W/m2 . Berechnen Sie die Flussdichte der Photonen (die Anzahl der Photonen je Flächen- und Zeiteinheit). Wie viele Photonen findet man durchschnittlich in einem Kubikmeter dieses Gebietes? 3.31* Wie viele Photonen werden pro Sekunde von einer gelben 100-W-Glühlampe emittiert, wenn man die Wärmeverluste vernachlässigt und das Licht als quasimonochromatisch mit einer Wellenlänge von 550 nm betrachtet? (In Wirklichkeit gibt eine gewöhnliche 100-W-Glühlampe nur 2,5 % der gesamten emittierten Leistung in Form von Licht ab!) 3.32 Durch die 3-V-Glühlampe einer Taschenlampe fließt ein Strom von rund 0,25 A. Dabei wird ungefähr 1,0 % der Leistung in Licht umgewandelt (λ ≈ 550 nm). Der Strahl habe einen Querschnitt von 10 cm2 und sei näherungsweise zylindrisch. (a) Wie viele Photonen werden pro Sekunde emittiert? (b) Wie viele Photonen sind in jedem Meter des Strahls enthalten? (c) Wie groß ist die Flussdichte des Strahls beim Verlassen der Lampe? 3.33* Eine isotrope, quasimonochromatische Punktlichtquelle strahlt mit einer Leistung von 100 W. Wie groß ist die Flussdichte in einem Abstand von einem Meter? Wie groß ist die Amplitude des E- und des B-Feldes in diesem Punkt? 3.34 Belegen Sie mit energetischen √ Argumenten, dass die Amplitude einer Zylinderwelle umgekehrt proportional zu r ist. Stellen Sie die Vorgänge schematisch dar! 3.35* Wie groß ist der Impuls eines Röntgenphotons mit einer Frequenz von 1019 Hz? 3.36 Wir betrachten eine elektromagnetische Welle, die auf ein Elektron trifft. Kinematisch lässt sich leicht zeigen, dass der Mittelwert der Änderungsrate des Impulses p des Elektrons proportional ist zum Mittelwert der Änderungsrate der Arbeit W , die die Welle am Elektron verrichtet. Insbesondere gilt     1 dW dp ˆı . = dt c dt Zeigen Sie, dass der Strahlungsdruck durch Gleichung (3.51) gegeben ist, wenn diese Impulsänderung einem vollständig absorbierenden Material verliehen wird. 3.37* Eine harmonische, ebene elektromagnetische Welle mit einer Wellenlänge von 0,12 m pflanzt sich im Vakuum in die positive z-Richtung fort. Sie oszilliert entlang der

3 Theorie des Elektromagnetismus, Photonen und Licht

178

x-Achse, sodass das E-Feld bei t = 0 und z = 0 einen Maximalwert von +6,0 V/m hat. (a) Schreiben Sie einen Ausdruck für E(z, t) auf. (b) Schreiben Sie einen Ausdruck für das Magnetfeld auf. (c) Schreiben Sie einen Ausdruck für die Impulsstromdichte der Welle auf. 3.38* Leiten Sie einen Ausdruck für den Strahlungsdruck ab, wenn ein senkrecht einfallender Strahl vollständig reflektiert wird. Verallgemeinern Sie Ihr Ergebnis für einen beliebigen Einfallswinkel θ bezüglich der Normalen. 3.39 Auf einen vollständig absorbierenden Schirm fällt 100 s lang Licht mit einer Leistung von 300 W. Berechnen Sie den Impuls, der dabei auf den Schirm übertragen wird. 3.40 Die Erdatmosphäre ist rund 1,5 × 1011 m von der Sonne entfernt. Der Betrag des Poynting-Vektors für das in der Erdatmosphäre ankommende Sonnenlicht beträgt etwa 1,4 kW/m2 . (a) Berechnen Sie den mittleren Strahlungsdruck, der auf einen der Sonne zugewandten metallischen Reflektor ausgeübt wird. (b) Wie groß ist (näherungsweise) der mittlere Strahlungsdruck an der Oberfläche der Sonne (Durchmesser: 1,4 × 109 m)? 3.41* Ein Lichtstrahl mit konstanter Bestrahlungsstärke (I) fällt senkrecht auf eine Oberfläche, welche den Bruchteil α der Strahlung absorbiert. Zeigen Sie, dass der Strahlungsdruck an der Oberfläche durch P = (2 − α) I/c gegeben ist! 3.42* Ein Lichtstrahl mit einer Bestrahlungsstärke von 2,00 × 106 W/ m2 trifft senkrecht auf eine Fläche, von der er zu 70 % reflektiert und zu 30 % absorbiert wird. Berechnen Sie den Strahlungsdruck auf die Fläche. 3.43 Welche Kraft wird auf die ebene, stark reflektierende, der Sonne zugewandte Wand (40 m × 50 m) eines Raumschiffes auf einer Erdumlaufbahn ausgeübt? 3.44 Eine parabolische Radarantenne mit einem Durchmesser von 2 m sendet pro Sekunde 500 Pulse mit einer Leistung von 200 kW aus. Jeder Puls dauert 2 µs. Bestimmen Sie die mittlere Rückstoßkraft, die auf die Antenne ausgeübt wird. 3.45 Ein 100 kg schwerer Astronaut schwebt im All; als Antrieb steht ihm nur die Strahlung einer 10-W-Lampe zur Verfügung (deren Energievorrat allerdings unerschöpflich ist). Wie lange dauert es, bis der Astronaut eine Geschwindigkeit von 10 m/s erreicht hat? 3.46 Betrachten Sie die Ladung in Abbildung 3.26 b. Sie bewegt sich gleichförmig. Zeichnen Sie eine Kugel um die Ladung und beweisen Sie mithilfe des Poynting-Vektors, dass die Ladung nicht strahlt. 3.47* Die elektrische Feldstärke einer ebenen, harmonischen, linear polarisierten Welle in einem Stück Glas ist gegeben durch Ez = E0 cos π1015 (t − x/0,65c) . Bestimmen Sie (a) die Frequenz der Strahlung, (b) ihre Wellenlänge und (c) den Brechungsindex des Glases!

Aufgaben

179

3.48* Wie groß ist die Lichtgeschwindigkeit in Diamant (Brechungsindex 2,42)? 3.49* Die Wellenlänge einer Strahlung im Vakuum betrage 540 nm. Wie groß ist sie in Wasser (n = 1,33)? 3.50* Die Lichtgeschwindigkeit sei in einem bestimmten Medium um 10 % geringer als im Vakuum. Wie groß ist der Brechungsindex dieses Mediums? 3.51 Die Geschwindigkeit von Licht (Phasengeschwindigkeit) in Fabulit (SrTiO3 ) beträgt 1,245 × 108 m/s. Wie groß ist der Brechungsindex des Materials? 3.52* Welchen Weg legt gelbes Licht innerhalb einer Sekunde in Wasser (n = 1,33) zurück? 3.53* Eine Lichtwelle mit einer Wellenlänge von 500 nm im Vakuum tritt in eine 1 cm dicke Glasplatte (Brechungsindex 1,60) ein und durchläuft die Platte senkrecht zur Oberfläche. Wie viele Wellenberge und -täler passen zwischen die beiden Grenzflächen der Platte? 3.54* Gelbes Licht aus einer Natriumdampflampe (λ0 = 589 nm) passiert einen 20 m langen Tank mit Glycerin (n = 1,47) innerhalb der Zeit t1 . Ist derselbe Tank mit Schwefelkohlenstoff (n = 1,63) gefüllt, so ist die benötigte Zeit gleich t2 . Wie groß ist t1 − t2 ? 3.55* Eine Lichtwelle bewegt sich im Vakuum von A nach B. In ihren Weg wird eine 1 mm dicke, planparallele Glasplatte (ng = 1,50) gebracht. Wenn die Wellenlänge der Strahlung im Vakuum 500 nm beträgt, wie viele Wellen passen dann in den Raum zwischen A und B (mit bzw. ohne Glasplatte)? Welche Phasenverschiebung entsteht durch die Einführung der Platte? 3.56 Die Dielektrizitätskonstante von Wasser bei niedrigen Frequenzen variiert zwischen 88,00 (0 ◦ C) und 55,33 (100 ◦ C). Erklären Sie dieses Verhalten. Innerhalb desselben Temperaturbereiches fällt der Brechungsindex (λ = 589,3 nm) lediglich von 1,33 auf 1,32. Warum ändert sich n im Vergleich zu KE nur so geringfügig? 3.57 Zeigen Sie, dass der Brechungsindex von Substanzen geringer Dichte (z. B. Gasen), die nur eine einzige Resonanzfrequenz besitzen, durch n≈1+

N qe2 20 me (ω02 − ω 2 )

gegeben ist! 3.58* Im nächsten Kapitel werden wir feststellen, dass eine Substanz Strahlung umso besser reflektiert, je mehr sich ihr Brechungsindex von dem des umgebenden Mediums unterscheidet [Gl. (4.47)]. (a) Warum beträgt die Dielektrizitätskonstante von Eis bei Frequenzen im Mikrowellenbereich etwa 1, in Wasser dagegen etwa das 80-Fache? (b) Warum durchdringt ein Radarstrahl problemlos Eis, wird aber von dichtem Regen stark reflektiert? 3.59 Fuchsin ist ein intensiver Anilinfarbstoff. Seine alkoholische Lösung ist tiefrot; diese Färbung kommt durch die Absorption des grünen Anteils des Spektrums zustande. (Wie Sie vielleicht erwarten, reflektiert die Oberfläche von Fuchsinkristallen grünes Licht recht stark.) Stellen Sie sich ein dünnwandiges, mit alkoholischer Fuchsinlösung gefülltes Prisma vor. Welches Spektrum entsteht aus einfallendem weißem Licht? Die anomale Dispersion wurde übrigens 1840 von Fox Talbot erstmals beobachtet, den

180

3 Theorie des Elektromagnetismus, Photonen und Licht Namen gab ihr 1862 Le Roux. Dessen Arbeiten gerieten zunächst in Vergessenheit und wurden erst acht Jahre später von C. Christiansen wiederentdeckt.

3.60* Prüfen Sie nach, ob die Einheiten beider Seiten von Gleichung (3.71) übereinstimmen. 3.61 Die Resonanzfrequenz von Bleikristall liegt im Ultravioletten nahe des sichtbaren Spektralbereichs, die von geschmolzenem Siliciumdioxid dagegen im fernen UV. Skizzieren Sie mithilfe der Dispersionsgleichung n als Funktion von ω für den sichtbaren Spektralbereich. 3.62* Zeigen Sie, dass man Gleichung (3.70) wie folgt umschreiben kann:  2 −1 n −1 = −Cλ−2 + Cλ−2 0 mit C = 4π 2 c2 0 me /N qe2 . 3.63 Augustin Louis Cauchy (1789–1857) leitete für Stoffe, die im sichtbaren Spektralbereich durchlässig sind, einen Ausdruck für n (λ) ab, der folgender geometrischen Reihe entspricht: n = C1 + C2 /λ2 + C3 /λ4 + ... Alle C sind Konstanten. Welche physikalische Bedeutung von C1 lässt sich aus Abbildung 3.41 ablesen? 3.64 Wir kommen auf die vorangegangene Aufgabe zurück: Zwischen je zwei Absorptionsbanden gibt es ein Gebiet, in dem die Cauchy-Beziehung (mit einem anderen Satz Konstanten) sehr gute Resultate liefert. Verdeutlichen Sie sich dies und überlegen Sie anhand von Abbildung 3.41, was sich über die verschiedenen Werte von C1 aussagen lässt, wenn ω über das gesamte Spektrum hinweg abnimmt. Berechnen Sie mithilfe von Abbildung 3.40 Näherungswerte von C1 und C2 für Borosilicat-Kronglas im Sichtbaren; berücksichtigen Sie dabei nur die ersten beiden Terme der Cauchy-Gleichung. 3.65* Kristalliner Quarz hat bei einer Wellenlänge von 410 (550) nm einen Brechungsindex von 1,557 (1,547). Berechnen Sie die Werte von C1 und C2 in der Cauchy-Beziehung (nur die beiden ersten Terme sollen berücksichtigt werden) sowie den Brechungsindex von Quarz bei 610 nm. 3.66* Folgende Gleichung wurde 1871 von Sellmeier hergeleitet:  Aj λ2 n2 = 1 + . λ2 − λ20j j Die Aj sind Konstanten, und jedes λ0j ist die zur Eigenfrequenz ν0j gehörende Wellenlänge im Vakuum (λ0j ν0j = c). Diese Formulierung ist der Cauchy-Beziehung hinsichtlich ihrer praktischen Anwendbarkeit deutlich überlegen. Zeigen Sie, dass die Cauchy-Beziehung bei λ  λ0j eine Näherung der Sellmeier-Gleichung ist. [Hinweis: Schreiben Sie den obigen Ausdruck mit nur dem ersten Term in der Summe auf; erweitern Sie ihn nach dem binomischen Satz, ziehen Sie die Wurzel aus n2 und erweitern Sie nochmals.] 3.67* Um das Kohlendioxidmolekül CO2 in seine atomaren Bestandteile zu zerlegen, ist ein UV-Photon mit einer Energie von 11 eV erforderlich. Welche Frequenz muss eine dazu geeignete Strahlung mindestens haben?

4

Die Ausbreitung des Lichts

4.1

Einführung

In diesem Kapitel wollen wir uns mit drei grundlegenden Phänomenen beschäftigen, der Transmission, der Reflexion und der Brechung. Wir werden sie zunächst auf zwei verschiedenen Wegen klassisch beschreiben – erstens anhand der allgemeinen Begriffe von Wellen und Strahlen, zweitens, etwas spezieller, im Rahmen der Theorie des Elektromagnetismus. Anschließend wollen wir mit einer sehr vereinfachten Behandlung der Quantenelektrodynamik (QED) die Voraussetzungen zu einer modernen Interpretation schaffen. Den meisten Studenten sind einfache Gesetzmäßigkeiten der Ausbreitung von Licht, wie das Reflexions- und das Brechungsgesetz, bereits begegnet. Vielleicht fanden Sie diese Zusammenhänge unkompliziert und offensichtlich – das sind sie aber nur, weil sie von einem makroskopischen Standpunkt ausgehen, dessen Oberflächlichkeit in die Irre führen kann. Die Reflexion beispielsweise scheint auf den ersten Blick leicht erklärbar zu sein: Licht prallt von einer Oberfläche ab, wird zurückgeworfen wie ein Ball. In Wirklichkeit handelt es sich dabei jedoch um einen in seiner Komplexität wunderbaren Vorgang, der das korrelierte Verhalten unzähliger einzelner Atome beinhaltet. Je genauer man sich mit diesen Prozessen beschäftigt, umso interessanter werden sie. Neben diesen elementaren Problemen gibt es viele offene Fragen, deren Beantwortung wir uns zuwenden wollen: Wie pflanzt sich Licht in Materie fort? Was genau geschieht dabei mit dem Licht? Warum kann sich Licht scheinbar mit einer Geschwindigkeit verschieden von c ausbreiten, wenn die Photonen nur bei Lichtgeschwindigkeit existieren können? An jeder Begegnung von Licht mit Materie sind viele Teilchen gemeinsam beteiligt: Ein Strahl von Photonen passiert ein Gitter von Atomen, die durch elektromagnetische Felder im Raum in der Schwebe gehalten werden. Die Einzelheiten dieser Reise bestimmen, dass etwa der Himmel blau ist und das Blut rot, dass die Hornhaut unserer Augen durchsichtig ist, unsere Hände dagegen nicht, und dass Schnee im Unterschied zum Regen weiß aussieht. Im Grunde beschäftigt sich das gesamte Kapitel mit der Streuung, insbesondere mit dem Prozess der Absorption und der sofortigen ReEmission elektromagnetischer Strahlung durch die Elektronen, die in Atomen und Molekülen gebunden sind. Transmission, Reflexion und Brechung sind makroskopische Manifestationen von Streuvorgängen auf submikroskopischer Ebene. https://doi.org/10.1515/9783111025599-004

4 Die Ausbreitung des Lichts

182

Zunächst wollen wir die Ausbreitung von Strahlungsenergie in verschiedenen homogenen Medien untersuchen.

4.2

Rayleigh-Streuung

Stellen Sie sich einen eng begrenzten Sonnenstrahl mit einem breiten Frequenzspektrum vor, der sich im leeren Raum ausbreitet. Abgesehen von einer minimalen Verbreiterung des Strahls wird dabei sämtliche Energie mit der Geschwindigkeit c nach vorne bewegt. Es gibt keine Streuung; von der Seite betrachtet, ist der Strahl unsichtbar. Er wird nicht langsamer, und seine Intensität nimmt auch nicht ab. Als man 1987 am Himmel die Explosion eines Sterns verfolgen konnte, der 1,7×105 Lichtjahre von uns entfernt ist, war der Lichtblitz, der die Erde erreichte, bereits 170 000 Jahre lang unterwegs gewesen. Photonen sind zeitlos. Nun bringen wir einen Lufthauch in den leeren Raum, jeweils einige Moleküle Stickstoff, Sauerstoff usw. Keines dieser Moleküle hat eine Resonanz im sichtbaren Spektralbereich – keines von ihnen kann daher durch sichtbares Licht in einen Zustand höherer Energie angeregt werden; das Gas erscheint uns farblos. Jedes der Moleküle verhält sich wie ein kleiner Oszillator, dessen Elektronenwolke im Grundzustand durch ein ankommendes Photon in Schwingungen versetzt werden kann. Unmittelbar nach dem Einsetzen dieser Schwingung beginnt das Molekül seinerseits Licht auszusenden: Ein Photon wird absorbiert, und sofort wird ein anderes Photon derselben Frequenz (und Wellenlänge) emittiert. Das heißt, das Licht wird elastisch gestreut. Die Moleküle sind in zufälliger Richtung orientiert, daher senden sie die Photonen in verschiedenste Richtungen aus (Abb. 4.1). Bereits bei sehr schwachem Licht ist die Zahl der an diesem Vorgang beteiligten Photonen ungeheuer hoch, und die Moleküle scheinen kleine klassische Elementarwellen zu streuen (Abb. 4.2) – die Energie wird in jede Richtung ausgesendet. Diese Streuung ist unter den gewählten Bedingungen jedoch noch sehr schwach, da das Gas stark verdünnt ist. Die Ausbreitung des Strahls wird daher wenig beeinflusst, auch wenn das durchdrungene Volumen sehr groß ist. Die Amplituden der Schwingungen im Grundzustand und daher auch die Amplituden des Streulichts nehmen mit der Frequenz zu, weil alle Moleküle elektronische Resonanzen im UV-Bereich besitzen. Je näher die eingestrahlte Frequenz einer Resonanzfrequenz kommt, desto intensiver reagieren die Oszillatoren. Aus diesem Grund wird violettes Licht stark seitlich aus dem Strahl heraus gestreut, blaues Licht etwas weniger, grünes noch weniger usw. Der Strahl, der aus dem Gas austritt, enthält daher mehr Rotanteile, während das Streulicht (Sonnenlicht enthält im Vergleich zu Blau nicht besonders viel Violett) besonders viel Blau enthält. Das menschliche Auge neigt außerdem dazu, die Kakophonie der gestreuten Frequenzen – reich an Violett, Blau und Grün – zu einem Hintergrund aus Weiß und einem lebhaften 476-nm-Blau zu mitteln, was zu dem uns vertrauten hellblauen Himmel führt.1 1

G. S. Smith, Human color vision and unsaturated blue color of daytime sky, Am. J. Phys. 73, 590 (2005).

4.2 Rayleigh-Streuung blaues Licht, seitwärts gestreut

(a)

weißes Licht

blaues Licht, seitwärts gestreut

(b)

183

rot-orange-gelb

Moleküle der Luft

Abb. 4.1: (a) Sonnenlicht fällt durch ein Gebiet, in dem wenige Gasmoleküle verteilt sind. Seitlich wird vor allem blaues Licht gestreut – darum ist unser Himmel blau. Das ungestreute Licht, das einen besonders großen Rotanteil enthält, kann man nur bei niedrigem Sonnenstand sehen. (b) Infolge der atmosphärischen Streuung erreichen die Sonnenstrahlen ein Gebiet, das sich bis zu 18◦ hinter die Beleuchtungsgrenze erstreckt. Innerhalb dieser Dämmerungszone nimmt die Beleuchtung langsam bis zur völligen Dunkelheit ab.

Abb. 4.2: Eine ebene Welle, die von links auf ein Atom fällt, führt zur Aussendung von kugelförmigen Elementarwellen. Dies ist ein kontinuierlicher Prozess: In jeder Sekunde streut ein Atom Hunderte Millionen Photonen in alle Richtungen.

Lange vor dem Aufkommen der Quantenmechanik analysierte Lord Rayleigh (1871) gestreutes Sonnenlicht anhand molekularer Oszillatoren. Mithilfe eines einfachen, aus der Dimensionsanalyse (siehe Aufgabe 4.1) abgeleiteten Arguments folgerte Rayleigh richtig, dass die Intensität des Streulichts proportional zu 1/λ4 ist und daher mit ν 4 wächst. Vor Rayleighs Arbeiten hatte man angenommen, dass das Himmelsblau durch Streuung an winzigen Staubteilchen zustande kommt. Die Streuung von Licht durch Teilchen, deren Dimensionen kleiner als eine Wellenlänge (genauer gesagt, kleiner als ca. λ/10) sind, bezeichnet man seitdem als Rayleigh-Streuung. In die genannte Kategorie fallen Atome und Moleküle mit Ausdehnungen im ein- bis zweistelligen Nanometerbereich; die Wellenlänge des Lichts beträgt dagegen rund 500 nm. Zusätzlich streuen Inhomogenitäten, solange sie klein sind, das Licht. Winzige Fasern, Blasen, Partikel und Tröpfchen – all dies sorgt für Streuung. Bei der Rayleigh-Streuung hat

184

4 Die Ausbreitung des Lichts

die genaue Form der Streuung gewöhnlich kaum Konsequenzen. Das Ausmaß der Streuung ist proportional zum Durchmesser der Streuer, geteilt durch die Wellenlänge der einfallenden Strahlung. Demnach wird das blaue Ende des Spektrums am stärksten gestreut. Die Rayleigh-Streuung ist verantwortlich für blaue Augen, die blauen Federn eines Blauhähers, den blauen Schwanz des Blauschwanz-Skinks und das blaue Hinterteil des Pavians. Im Tierreich wird nahezu jede blaue Färbung, viele Grüntöne und sogar manche Purpurfärbung durch Streuung verursacht. Winzige Alveolarzellen in den Federn des Hähers lassen diese blau erscheinen; das Grün der Federn des Papageis entsteht durch eine Mischung aus Blau (Streuung) und Gelb (Absorption). Auch für das Blau von Venen ist die Streuung mitverantwortlich. Wie wir gleich sehen werden, streut eine dichte, einheitliche Substanz nicht merklich in seitlicher Richtung; dies trifft auf einen Großteil der unteren Atmosphäre zu. Würde blaues Licht in Höhe des Meeresspiegels stark nach außen gestreut, so erschiene ein weit entfernter Berg rötlich, was aber in der Realität nicht der Fall ist, selbst wenn die Entfernung viele Kilometer beträgt. Auch in den mittleren Schichten der Atmosphäre ist die Dichte noch hinreichend groß, um die Rayleigh-Streuung zu unterdrücken. Zur blauen Farbe des Himmels muss daher ein anderer Prozess beitragen. Die Wärmebewegung der Luft in der mittleren Atmosphäre führt zu schnell veränderlichen, zufälligen lokalen Dichteschwankungen. Dadurch konzentrieren sich die Moleküle kurzzeitig in bestimmten Regionen des Raumes und strahlen bevorzugt in eine bestimmte Richtung. M. Smoluchowski (1908) und A. Einstein (1910) entwickelten unabhängig voneinander die Grundlagen einer Theorie der Streuung an diesen Fluktuationen, wobei sie zu ähnlichen Resultaten gelangten wie Rayleigh. Die Streuung an Inhomogenitäten der Dichte ist immer dann von Bedeutung, wenn Licht in einem Medium große Entfernungen zurücklegt, beispielsweise in einem Glasfaserkabel für die Telekommunikation (Abschn. 5.6.1).

Da er keine Atmosphäre hat, an der das Sonnenlicht gestreut wird, zeigt der Himmel des Mondes ein unheimliches Schwarz.

Sonnenlicht, das aus einer Richtung in die Atmosphäre strahlt, wird in alle Richtungen gestreut. Hätte die Erde keine Atmosphäre, so erschiene uns der Himmel so schwarz wie der leere Raum, so schwarz wie der Himmel über dem Mond. Steht die Sonne

4.2 Rayleigh-Streuung

185

sehr tief über dem Horizont, dann passieren ihre Strahlen (anders als am Mittag) eine ausgedehnte Luftschicht. Die Blau- und Violettanteile werden dabei stark zur Seite abgelenkt, während sich entlang der Sichtlinie vor allem rote und gelbe Anteile fortpflanzen. Auf diese Weise entstehen die vertrauten feurig-roten Sonnenuntergänge.

4.2.1 Streuung und Interferenz In dichten Medien trägt eine ungeheuer große Anzahl eng beieinander liegender Atome oder Moleküle eine ebenso große Anzahl gestreuter elektromagnetischer Elementarwellen bei. Diese Elementarwellen überlagern einander und interferieren in einer Weise, die in dünnen Medien nicht auftritt. Je dichter der Stoff ist, in dem sich das Licht fortpflanzt, umso bedeutungsloser wird die seitliche Streuung. Um dies zu verstehen, müssen wir uns mit dem Phänomen der Interferenz beschäftigen. Die Interferenz kam in Abschnitt 2.4 bereits zur Sprache, in den Kapiteln 7 und 9 wollen wir sie noch ausführlicher behandeln. An dieser Stelle sollen lediglich einige Grundgedanken eingeführt werden. Erinnern Sie sich, dass wir die Interferenz als Überlagerung (Superposition) zweier oder mehrerer Wellen erklärt hatten, in deren Ergebnis eine Störung entsteht, die der Summe der Beiträge der überlagerten Wellen entspricht. Abbildung 2.16 zeigt zwei harmonische Wellen derselben Frequenz, die sich in gleicher Richtung fortbewegen. Sind beide exakt phasengleich (Abb. 2.16 a), so ist die Resultierende in jedem Punkt gleich der Summe der jeweiligen Amplituden. Dieser extreme Fall heißt vollständig konstruktive Interferenz. Beträgt der Phasenunterschied dagegen 180◦ , so löschen die Wellen einander aus – es handelt sich um das andere Extrem, die vollständig destruktive Interferenz (Abb. 2.16 d). Die Theorie der Rayleigh-Streuung geht davon aus, dass die Streuzentren (Moleküle) zufällig im Raum verteilt sind; die gestreuten sekundären Elementarwellen haben keine besondere Phasenbeziehung zueinander, sodass man kein definiertes Interferenzmuster findet. Diese Situation tritt ein, wenn der Abstand zwischen den Streuzentren in der Größenordnung einer Wellenlänge oder mehr liegt, wie in einem dünnen Gas. Abbildung 4.3 a zeigt einen von links einfallenden parallelen Lichtstrahl, ein so genanntes primäres Lichtfeld (in diesem Fall aus ebenen Wellen bestehend). Der Strahl beleuchtet eine Anordnung weit voneinander entfernter Moleküle. Eine kontinuierliche Folge primärer Wellenfronten bewegt sich durch den Stoff, wobei jedes Molekül abwechselnd Energie aufnimmt und abgibt und dabei Licht in alle Richtungen streut – insbesondere in Richtung eines seitlich gelegenen Punktes P . Die Wege, die die Elementarwellen bis zu P zurücklegen müssen, unterscheiden sich im Vergleich zu λ stark voneinander. Daher kommen einige Elementarwellen etwas eher an P an als andere, wobei die Unterschiede einen nicht geringen Bruchteil von λ ausmachen können (Abb. 4.3 b). Mit anderen Worten, die Elementarwellen sind merklich phasenverschoben. (Bedenken Sie, dass sich auch die Moleküle selbst bewegen, was die Phasen ebenfalls beeinflusst.) Zu jedem Zeitpunkt interferieren manche Elementarwellen konstruktiv, andere destruktiv, und in diesem Durcheinander einander überlagernder Wellen mittelt sich

4 Die Ausbreitung des Lichts

186

(a)

(b)

P

P

2

2

1 3

P

1 4

(c) 3

4

Abb. 4.3: (a) Lichtstreuung an Molekülen, die weit voneinander entfernt sind. (b) Die Wellen kommen mit sehr vielen verschiedenen Phasen am Punkt P an; daher ist eine Verstärkung durch Interferenz nahezu ausgeschlossen. (c) Am leichtesten lässt sich dieser Zusammenhang vielleicht anhand von Zeigern verstehen. Bei der Ankunft in P unterscheiden sich die Phasenwinkel der Zeiger stark voneinander. Ordnet man die Zeiger Spitze-zu-Ende an, so entsteht eine Art Spirale und der resultierende Zeiger bleibt klein. Denken Sie daran, dass wir es in Wirklichkeit mit Millionen winziger Zeiger zu tun haben, nicht mit wenigen langen, wie sie hier gezeigt werden.

die Interferenz heraus. Werden in zufälliger Weise locker verteilte Streuzentren von einer Primärwelle getroffen, so senden sie Elementarwellen aus, die in allen Richtungen des Raumes außer der Vorwärtsrichtung voneinander unabhängig sind. Seitliches Streulicht verlässt den Strahl unbeeinflusst von Interferenzerscheinungen. Genau diese Situation findet man in der dünnen Hochatmosphäre (rund 150 km oberhalb der Erdoberfläche), wo die Streuung des blauen Lichts größtenteils stattfindet. Dass die Bestrahlungsstärke des Streulichts eine Funktion von 1/λ4 ist, sieht man leicht, wenn man auf das Konzept der Dipolstrahlung (Abschn. 3.4.3) zurückkommt. Jedes Molekül wird als elektronischer Oszillator behandelt, der vom einfallenden Feld in Schwingungen versetzt wird. Sind die Streuzentren weit voneinander entfernt und daher im Wesentlichen voneinander unabhängig, so strahlt jedes Zentrum entsprechend Gleichung (3.56). Die gestreuten elektrischen Felder sind dann ebenfalls voneinander unabhängig; es tritt keine laterale Interferenz auf. Entsprechend ist die Nettobestrahlungsstärke P gleich der algebraischen Summe der von jedem Zentrum ausgehenden Beiträge. Für ein einzelnes Zentrum berechnet sich die Bestrahlungsstärke aus Gleichung (3.57), und sie ist eine Funktion von ω 4 . Die Erfindung des Lasers erleichterte die direkte Beobachtung der Rayleigh-Streuung in Gasen unter niedrigem Druck entscheidend. Die erhaltenen Ergebnisse bestätigen die Theorie.

4.2 Rayleigh-Streuung

187

Die Vorwärtsbewegung Wir wollen nun diskutieren, inwiefern die Vorwärtsrichtung etwas Besonderes ist und warum sich eine Welle in jedem Medium vorwärts bewegt. Betrachten wir dazu Abbildung 4.4; zu beachten ist dabei, dass die Wegstrecke des Lichts bis zu einem in Ausbreitungsrichtung gelegenen Punkt P durch die Streuung nur sehr wenig beeinflusst wird. (Die gestreuten Elementarwellen kommen mehr oder weniger phasengleich in P an und interferieren im Wesentlichen konstruktiv.)

P

Abb. 4.4: Wir betrachten eine von links kommende ebene Welle. Das Licht wird mehr oder weniger in Vorwärtsrichtung gestreut.

Eine etwas genauere Beschreibung gibt Abbildung 4.5. In zeitlich aufeinanderfolgenden Momentaufnahmen sehen wir die Wechselwirkungen zweier Moleküle A und B mit einer einfallenden ebenen Primärwelle. Durchgezogene Kreisbögen stehen für sekundäre Wellenberge (positive Maxima), gestrichelte Kreisbögen für sekundäre Wellentäler (negative Maxima). In Bild (a) trifft die primäre Wellenfront auf Molekül A, das eine kugelförmige Elementarwelle aussendet. Vorerst wollen wir annehmen, diese Elementarwelle sei relativ zur einfallenden Primärwelle um 180◦ phasenverschoben. (Eine erzwungene Schwingung ist i. d. R. gegenüber der erzwingenden Schwingung phasenverschoben, siehe Abschn. 4.3.2.) Dies bedeutet, dass A als Antwort auf einen Wellenberg (ein positives E-Feld) ein Wellental (ein negatives E-Feld) abstrahlt. Bild (b) zeigt die Überlagerung der kugelförmigen Elementarwelle mit der Primärfront. Beide bewegen sich gemeinsam fort, allerdings nicht im „Gleichschritt“. Die einfallende Wellenfront trifft auf Teilchen B, das seinerseits eine Elementarwelle aussendet (wiederum um 180◦ phasenverschoben). In (c) und (d) sehen wir die Vorwärtsbewegung der beiden (phasengleichen) Elementarwellen. Dieses Resultat ist unabhängig von der Anzahl und der genauen räumlichen Verteilung der streuenden Teilchen. Aufgrund der Asymmetrie, die der Strahl selbst mitbringt, addieren sich alle gestreuten Elementarwellen in Vorwärtsrichtung konstruktiv.

4.2.2 Die Transmission von Licht durch dichte Medien Nehmen wir nun an, dass der betrachtete Ausschnitt des Raumes mehr Gasmoleküle enthält. Ein Würfel, dessen Kanten eine Wellenlänge lang sind, enthält dann sehr viele Moleküle. Man sagt, das Medium habe eine merkliche optische Dichte. (Dieser Terminus leitet sich möglicherweise von den Ergebnissen früher Experimente ab, welche zeigten, dass der Brechungsindex von Gasen proportional zu ihrer Dichte ist.) Liegt λ im Bereich des sichtbaren Lichts, so enthält ein solcher λ3 -Würfel bei Standardbedin-

4 Die Ausbreitung des Lichts

188 primäre Wellenfronten (a)

A

B λ (b)

A

B Elementarwelle (c)

A

B sekundäre Wellenfront

(d)

A

B

Abb. 4.5: In Vorwärtsrichtung kommen die gestreuten Elementarwellen phasengleich auf ebenen Wellenfronten an: Tal mit Tal, Berg mit Berg.

gungen rund drei Millionen Moleküle. Wenn die Streuzentren derart dicht beieinander liegen, kann man nicht mehr davon ausgehen, dass die gestreuten Elementarwellen (λ ≈ 500 nm) an einem Punkt P mit zufällig verteilter Phase ankommen – jetzt spielt die Interferenz eine Rolle. Dies trifft gleichermaßen auf Flüssigkeiten und Festkörper zu, denn dort sind die Atome noch etwa 10-mal dichter gepackt und außerdem mit weit größerer Ordnung verteilt. Der Lichtstrahl trifft dann auf ein gleichförmiges Medium ohne symmetriebrechende Diskontinuitäten. Die gestreuten Elementarwellen interferieren auch hier in Vorwärtsrichtung konstruktiv (dies hängt nicht von der Anordnung der Teilchen ab), aber in allen anderen Raumrichtungen herrscht jetzt die destruktive Interferenz (Auslöschung) vor. In einem homogenen, dichten Medium wird wenig oder überhaupt kein Licht seitlich oder rückwärts gestreut. Abbildung 4.6 veranschaulicht diesen Sachverhalt. Wir sehen einen Lichtstrahl, der sich durch ein geordnetes Netzwerk nahe beieinander liegender Streuzentren bewegt. Entlang der Wellenfronten des Strahls werden Schichten von Molekülen in Phase

4.2 Rayleigh-Streuung

189

Atome Lichtstrahl

A B

λ Die Entfernung zwischen A und B beträgt λ/2.

Abb. 4.6: Eine ebene Welle fällt von links auf ein Medium, das aus sehr vielen, dicht gepackten Atomen besteht. Eine Wellenfront unter vielen regt zwei Atome A und B an, die fast genau eine halbe Wellenlänge voneinander entfernt sind. Die von diesen Atomen ausgesendeten Elementarwellen löschen einander aus: Berg trifft auf Tal, sodass die Welle senkrecht zum Strahl vollkommen verschwindet. Dies erfolgt immer wieder; wenig oder kein Licht wird zur Seite gestreut.

angeregt, sie strahlen, werden wieder angeregt usw. Wenn nun ein Molekül A eine Kugelwelle aussendet, wird diese in Transversalrichtung stets durch eine andere Elementarwelle ausgelöscht, die von einem Molekül B stammt, das gerade um λ/2 von A entfernt ist. Da λ hier tausende Male größer ist als die Streuzentren und die Abstände zwischen ihnen, gibt es mit großer Wahrscheinlichkeit stets Paare von Molekülen, deren gestreute Elementarwellen sich in lateraler Richtung gegenseitig auslöschen. Auch bei einem nicht perfekt geordneten Medium setzt sich das elektrische Nettofeld in einem Punkt in beliebiger transversaler Richtung aus sehr vielen winzigen Streufeldern zusammen. Jedes dieser Streufelder ist relativ zu den anderen ein klein wenig phasenverschoben, sodass die Summe aller Felder zwar von Punkt zu Punkt verschieden, aber stets klein ist (Abb. 4.7). Vom Standpunkt der Energieerhaltung aus betrachtet ist dies durchaus sinnvoll: Es kann nicht in jeder Richtung zur konstruktiven Interferenz kommen. Die Interferenz führt nur zu einer Umverteilung der Energie, indem sie in bestimmten Regionen des Raumes eine Auslöschung, in anderen dagegen eine Verstärkung von Wellen verursacht.

(a)

(b)

Abb. 4.7: (a) Kommen sehr viele kleine, geringfügig phasenverschobene Wellen an einem Punkt des Raumes an, so heben sich positive und negative Komponenten des E-Feldes gegenseitig nahezu auf. (b) Die kleinen Zeiger, die zu den gezeigten Wellen gehören, reihen sich zu einem kreisförmigen Gebilde aneinander. Die Resultierende (deren Schwingungen von der Anzahl der beitragenden Wellen abhängen) ist stets klein.

190

4 Die Ausbreitung des Lichts

Atom

Wellenfront

Abb. 4.8: Eine ebene Welle, die sich nach unten bewegt und auf eine gleichmäßige Anordnung von Atomen trifft. Die Elementarwellen werden in alle Richtungen gestreut und überlagern sich in Vorwärtsrichtung (nach unten) zu einer ebenen Sekundärwelle.

Je dichter, gleichförmiger und geordneter (also je homogener) das Medium ist, desto vollständiger werden die Wellen in lateraler Richtung ausgelöscht und desto geringer ist der Anteil der Streuung in anderen Richtungen als der Vorwärtsrichtung. Der Strahl pflanzt sich dann im Wesentlichen ungehindert vorwärts fort (Abb. 4.8). Der pro Molekül gestreute Anteil des Lichts ist sehr gering. Ein grüner Lichtstrahl muss in der Atmosphäre eine Strecke von rund 150 km zurücklegen, bevor die Hälfte seiner Energie gestreut wird. In einem gegebenen Volumen einer Flüssigkeit befinden sich ungefähr 1000-mal mehr Moleküle als im selben Volumen eines Gases (bei Atmosphärendruck); wir können also erwarten, dass Licht in einer Flüssigkeit stärker gestreut wird. Der Ordnungszustand der Moleküle ist in einer Flüssigkeit allerdings viel ausgeprägter als in einem Gas, und die Dichteschwankungen sind geringer. Beide Effekte sollten die Streuung in seitlicher und rückwärtiger Richtung wirksam unterdrücken. Tatsächlich beobachtet man in Flüssigkeiten eine stärkere Streuung pro Volumeneinheit als in Gasen, aber sie ist nicht 1000-mal so hoch, wie es dem Verhältnis der Moleküldichte entspräche, sondern nur 5- bis 50-mal. Auf einzelne Moleküle umgerechnet, streuen Flüssigkeiten also viel weniger stark als Gase. Lässt man einige Tropfen Milch in ein Glas Wasser fallen und beleuchtet das Ganze mit

4.2 Rayleigh-Streuung

191

weißem Licht, so sieht man seitlich einen feinen, aber unübersehbaren Schleier blauen Streulichts, und der austretende Lichtstrahl erscheint deutlich rötlich. Transparente amorphe Festkörper wie Glas und Kunststoffe streuen Licht ebenfalls lateral, jedoch nur sehr schwach. Regelmäßige Kristalle mit fast perfekt geordneten Strukturen, beispielsweise Quarz und Glimmer, streuen noch weniger. Natürlich wirken Verunreinigungen aller Art (Schwebstoffe und Blasen in Flüssigkeiten, Risse und Fremdstoffe in Festkörpern) als Streuzentren; sind diese sehr klein, wie im Falle des Mondsteins, eines Halbedelsteins, so erscheint das austretende Licht bläulich. John Tyndall untersuchte 1869 die Streuung an kleinen Partikeln. Er fand, dass der gestreute Anteil des langwelligeren Lichts proportional zur Teilchengröße (beginnend beim Bruchteil einer Wellenlänge) zunimmt. Relativ große Wassertropfen streuen weißes Licht ohne merklichen Farbeffekt, wie man am Weiß der Wolken sehen kann. Dies gilt ebenso für die mikroskopisch kleinen Fett- und Proteinkügelchen in Milch. Besteht ein Partikel aus nur wenigen Molekülen, so sind diese einander eng benachbart und die von ihnen ausgesendeten Elementarwellen interferieren konstruktiv. Die Streuung ist stark. Nähern sich die Dimensionen des Partikels einer Wellenlänge, so sind die an den Rändern ausgesendeten Elementarwellen nicht mehr unbedingt phasengleich; die Streuung nimmt ab. Dieser Effekt betrifft zunächst die kleinen Wellenlängen (blau), sodass das Partikel einen größeren Anteil des roten Endes des sichtbaren Spektralbereichs streut (und zwar zunehmend in Vorwärtsrichtung). Eine erste theoretische Analyse der Streuung an kugelförmigen Partikeln beliebiger Größe wurde 1908 von Gustav Mie veröffentlicht. Die Mie-Streuung hängt nur schwach von der Wellenlänge ab und wird von ihr unabhängig (das heißt, dass einfallendes weißes Licht auch als weißes Licht austritt), wenn die Partikelgröße λ übersteigt. Bei der Mie-Streuung verlangt die Theorie, dass die Streuer nahezu kugelförmig sind. Das Ausmaß der Streuung wächst mit dem Durchmesser der transparenten Blasen, Kristalle, Fasern usw., welche die Streuung bewirken. Anders als bei der Rayleigh-Streuung wird bei der Mie-Streuung stärker in Vorwärtsrichtung gestreut als in Rückwärtsrichtung. Die Rayleigh-Streuung ist der Grenzfall der MieStreuung für kleine Teilchen, was sicher nicht überrascht. An einem trüben Tag sieht der Himmel grau aus: Die Wolken bestehen dann aus größeren Wassertropfen. Auch manche billigen Plastikbehälter für Lebensmittel und Müllbeutel aus weißer Plastikfolie geben ein blassbläuliches Streulicht ab, und das durchgelassene Licht erscheint orange. Das Material der Müllbeutel enthält, um diese undurchsichtig zu machen, zwei bis zweieinhalb Prozent TiO2 in Form kleiner klarer Kügelchen (n = 2,76) mit einem Durchmesser von etwa 200 nm, und diese Partikel senden bläulich-weißes Mie-Streulicht aus.2 2

Erst vor kurzem beobachtete man (zufällig), dass die effektive Lichtgeschwindigkeit in inhomogenen, undurchsichtigen Stoffen wie Milch und weißer Farbe auf immerhin ein Zehntel des erwarteten Werts abgesenkt sein kann. Siehe S. John, „Localization of Light“, Phys. Today 44, 32 (1991).

192

4 Die Ausbreitung des Lichts

Wenn die Durchmesser der transparenten Teilchen etwa 10 Wellenlängen erreichen, lassen sich die bekannten Gesetze der geometrischen Optik gut anwenden, weshalb es sinnvoll ist, den Prozess als geometrische Streuung zu bezeichnen.

4.2.3 Transmission und Brechungsindex Die Transmission von Licht durch ein homogenes Medium ist eine ununterbrochene Folge von Streuvorgängen. Jeder einzelne Streuprozess bringt eine Phasenverschiebung in das Lichtfeld ein, die sich schließlich als Abweichung der scheinbaren Phasengeschwindigkeit des durchgelassenen Strahls von der Lichtgeschwindigkeit c bemerkbar macht. Dadurch ergibt sich ein von eins verschiedener Brechungsindex (n = v/c) des Mediums, obwohl Photonen nur bei Lichtgeschwindigkeit existieren können. Um den Ursachen hierfür auf den Grund gehen, betrachten wir noch einmal Abbildung 4.5. Wir erinnern uns, dass sich alle gestreuten Elementarwellen in Vorwärtsrichtung phasengleich überlagern und dabei eine Sekundärwelle bilden. Aus der Erfahrung wissen wir, dass sich diese Sekundärwelle mit dem Rest der Primärwelle zur einzigen im Medium beobachtbaren Störung, der durchgelassenen Brechungswelle, zusammensetzt. Sowohl die primäre als auch die sekundäre elektromagnetische Welle pflanzt sich im Raum zwischen den Atomen mit der Lichtgeschwindigkeit c fort. Aber der Brechungsindex des Mediums kann verschieden von eins sein; die Phasengeschwindigkeit der gebrochenen Welle kann größer oder kleiner als c erscheinen. Die Erklärung dieses Widerspruchs liegt in der Phasenbeziehung zwischen Primär- und Sekundärwelle. Nach dem klassischen Modell können die elektronischen Oszillatoren nur dann nahezu vollständig phasengleich mit der treibenden Kraft (der Primärwelle) schwingen, wenn deren Frequenz niedrig ist. Bei steigender Frequenz des elektromagnetischen Feldes bleiben die Oszillatoren zurück, die Phasenverschiebung wächst. Eine ausführliche Analyse ergibt, dass die Phase bei der Resonanz um 90◦ nacheilt und bei Frequenzen, die deutlich über dem jeweiligen Eigenwert liegen, bis auf nahezu 180◦ oder eine halbe Wellenlänge anwächst. Aufgabe 4.4 untersucht die Phasenverschiebung für einen gedämpften, angeregten Oszillator, und Abbildung 4.9 fasst die Resultate zusammen. Neben der Phasenverzögerung ist noch ein zweiter Effekt zu beachten. Wenn sich die gestreuten Elementarwellen wieder vereinigen, so eilt die resultierende Sekundärwelle3 selbst den Oszillatoren um 90◦ nach. Diese beiden Mechanismen bewirken gemeinsam, dass die Sekundärwelle der Primärwelle bei Frequenzen unterhalb der Resonanz um 90◦ bis 180◦ nacheilt (Abb. 4.10), bei Frequenzen oberhalb der Resonanz dagegen um 180◦ bis 270◦ . Eine Phasenverzögerung von δ ≥ 180◦ ist aber äquivalent mit einem Phasenvorsprung von 360◦ − δ [zum Beispiel ist cos (θ − 270◦ ) = cos (θ + 90◦ ), wie man auf der rechten Seite von Abb. 4.9 b erkennen kann]. 3

Dieser Punkt wird klarer, wenn wir im Kapitel zur Diffraktion die Huygens-Fresnel-Theorie diskutieren. Die meisten Lehrbücher des Elektromagnetismus behandeln das Problem der Strahlung einer Schicht schwingender Ladungen, wobei sich die Phasenverschiebung um 90◦ ganz zwanglos ergibt (siehe Aufgabe 4.5).

4.2 Rayleigh-Streuung

Nacheilen

180◦ 180◦

ω0 (b)

0

ω

270◦

90◦

(a) nacheilende Phase sekundär

Elektrisches Feld

Vorauseilen

90◦

270◦ Phase der Sekundärwelle

90◦

180◦

t

t

(b) vorauseilende Phase

Elektrisches Feld

(a)

Phasenverschiebung des Oszillators

primär

Elektrisches Feld

Amplitude des Oszillators

193

t sekundär (c)

Brechungsindex

n>1 v c) und einen Brechungsindex kleiner als eins nach sich. Der Streuprozess ist auch hier kontinuierlich, und die kumulative Phasenverschiebung baut sich während des Durchgangs des Lichtstrahls durch das Medium auf. Daher ist ε eine Funktion der im Dielektrikum durchlaufenen Wegstrecke, wie auch zu erwarten ist, da v konstant sein soll (siehe Aufgabe 4.5). In den meisten Situationen, die in der Optik eine Rolle spielen, ist v < c und n > 1 (siehe Tab. 4.1). Eine wichtige Ausnahme bildet die Fortpflanzung von Röntgenstrahlung (ω > ω0 , v > c und n < 1). Tabelle 4.1: Brechungsindizes verschiedener Stoffe (Näherungswerte)∗ .

Luft Wassereis Wasser Ethanol Kerosin Quarzglas Tetrachlorkohlenstoff Olivenöl Terpentin

1,000 29 1,31 1,333 1,36 1,448 1,458 4 1,46 1,47 1,472

Methacrylsäuremethylester Benzol Plexiglas Zedernöl Kronglas Natriumchlorid leichtes Flintglas Polycarbonat Polystyrol

1,492 1,501 1,51 1,51 1,52 1,544 1,58 1,586 1,591

Schwefelkohlenstoff dichtes Flintglas Saphir Lanthan-Flintglas Zirkon (ZrO2 ·SiO2 ) schweres Flintglas Fabulit (SrTiO3 ) Diamant Rutil (TiO2 ) Galliumphosphid (GaP)

1,628 1,66 1,77 1,80 1,923 1,89 2,409 2,417 2,907 3,50



Die exakten Werte hängen von den physikalischen Bedingungen (Reinheit, Druck usw.) ab. Die angegebenen Werte beziehen sich auf eine Wellenlänge von 589 nm.

Wir können nun auch die Form von n (ω) im gesamten Frequenzbereich verstehen, wie sie in Abbildung 4.9 c dargestellt ist. Bei Frequenzen weit unterhalb von ω0 sind die Amplituden der Oszillatoren und daher auch der Sekundärwellen sehr klein, die Phasenwinkel betragen annähernd 90◦ . Die Brechungswelle eilt folglich nur geringfügig nach, und n ist nur wenig größer als 1. Mit zunehmender Frequenz steigen die Amplituden der Sekundärwellen an, und deren Phasenverschiebung wächst ebenfalls. Daher nimmt die Geschwindigkeit der Welle allmählich ab, n > 1 nimmt zu. Die Amplituden der Sekundärwellen wachsen immer weiter, aber die Phasenverschiebung nähert sich 180◦ , wenn ω sich ω0 nähert. Der Zuwachs der Phasenverzögerung nimmt demnach ab; am Wendepunkt (ω = ω  ) beginnt die Verzögerung wieder kleiner zu werden, und die Geschwindigkeit der Brechungswelle steigt an (dn/dω < 0). Dies setzt sich fort bis ω = ω0 , wo die Brechungswelle eine merklich verminderte Amplitude aufweist, Phase und Geschwindigkeit dagegen unverändert sind. In diesem mehr oder weniger in der Mitte der Absorptionsbande gelegenen Punkt ist n = 1 und v = c. Bei Frequenzen etwas oberhalb von ω0 eilen die Sekundärwellen mit relativ großen Amplituden voraus; die Brechungswelle hat einen Phasenvorsprung, und die Phasengeschwindigkeit ist größer als c (n < 1). Nimmt ω weiter zu, läuft das gesamte Szenario in umgekehrter Richtung ab (allerdings wird die Symmetrie durch frequenz-

4 Die Ausbreitung des Lichts

196

abhängige Asymmetrien der Amplituden und der Streuung gestört). Bei noch höheren Frequenzen eilen die Sekundärwellen, jetzt mit sehr kleiner Amplitude, um 90◦ voraus. Die Brechungswelle hat dann einen sehr geringen Phasenvorsprung; n nähert sich allmählich 1. Die genaue Form der Funktion n (ω) hängt von der jeweiligen Dämpfung des Oszillators ab sowie vom Ausmaß der Absorption, welches wiederum von der Anzahl der beteiligten Oszillatoren abhängt. Eine exakte Lösung des Fortpflanzungsproblems ist der so genannte Auslöschungssatz von Ewald-Oseen. Der mathematische Formalismus enthält Integraldifferentialgleichungen und ist zu kompliziert, als dass wir ihn hier ausführlich diskutieren könnten. Die Ergebnisse sollen jedoch kurz dargestellt werden. Es zeigt sich, dass die von den elektronischen Oszillatoren erzeugte elektromagnetische Welle im Wesentlichen aus zwei Termen besteht. Einer davon löscht gerade die Primärwelle innerhalb des Mediums aus. Der andere pflanzt sich als einzige beobachtbare Störung mit einer Geschwindigkeit von v = c/n durch das Dielektrikum fort.4 Im Folgenden werden wir vereinfachend annehmen, dass sich eine Lichtwelle in einem beliebigen Medium stets mit v = c fortpflanzt. Es sei auch erwähnt, dass der Brechungsindex temperaturabhängig ist (siehe Tabelle 4.2), doch dieser Prozess ist nicht gut verstanden. Tabelle 4.2: Temperaturabhängigkeit des Brechungsindex von Wasser.

0◦ C

1,3338



20 C

1,3330



40 C

1,3307

60◦ C

1,3272



1,3230

80 C

Offensichtlich muss auch ein quantenmechanisches Modell dem Photon eine Wellenlänge zuordnen. Mathematisch geschieht dies einfach durch die Beziehung p = h/λ, womit natürlich noch nicht geklärt ist, was die Welleneigenschaft bewirkt. Die Wellennatur des Lichts scheint sich nicht ignorieren zu lassen – auf die eine oder andere Weise muss sie in die Theorie einbezogen werden. Ausgehend von einer PhotonenWellenlänge können wir dann auf den Gedanken der relativen Phase zurückkommen: Der Brechungsindex entsteht, wenn die Phasen der (sich mit Lichtgeschwindigkeit bewegenden) Photonen durch Absorptions- oder Emissionsprozesse beschleunigt oder verzögert werden. 4

Eine ausführliche Behandlung findet sich in Optik von Born und Wolf, Springer-Verlag 1965, Abschnitt 2.4.2; dies ist allerdings eine schwer verständliche Lektüre. Siehe auch Reali, „Reflection from dielectric materials“, Am. J. Phys. 50, 1133 (1982).

4.3 Reflexion

4.3

197

Reflexion

Ein Lichtstrahl, der auf die Oberfläche eines transparenten Stoffes (beispielsweise eines Stückchens Glas) fällt, „sieht“ ein ausgedehntes Netzwerk dicht gepackter Atome, die den Strahl streuen. Die Wellenlänge des Lichts liegt in der Größenordnung von 500 nm, während die Atome und die Zwischenräume zwischen ihnen sehr viel kleiner sind (ca. 0,2 nm). Beim Durchgang durch ein optisch dichtes Medium löschen die gestreuten Elementarwellen einander in allen Richtungen mit Ausnahme der Vorwärtsrichtung aus, sodass der einfallende Strahl im Wesentlichen erhalten bleibt. Die Voraussetzung dafür ist jedoch, dass der Stoff kontinuierlich ist – dies trifft mit Sicherheit nicht auf eine Grenzfläche zwischen zwei transparenten Medien (etwa Luft und Glas) zu. Ein bestimmter Anteil eines Lichtstrahls, der auf eine solche Grenzfläche trifft, wird stets rückwärts gestreut. Dieses Phänomen nennen wir Reflexion. Erfolgt der Übergang zwischen den beiden Medien allmählich – ändert sich also die Dielektrizitätskonstante (oder der Brechungsindex) langsam über eine Wegstrecke hinweg, die mindestens einer Wellenlänge entspricht –, so spielt die Reflexion fast keine Rolle. Ist diese Wegstrecke jedoch erheblich kürzer (λ/4 oder weniger), so ist die Änderung fast diskontinuierlich. Innere und äußere Reflexion Wir stellen uns einen Lichtstrahl vor, der durch ein großes, homogenes Stück Glas fällt (Abb. 4.12). Nun wollen wir den Glasblock genau auf halbem Wege senkrecht zum Strahl durchschneiden und die beiden Teile voneinander trennen, wodurch zwei glatte, ebene Flächen entstehen, die der Lichtstrahl durchlaufen muss (Abb. 4.12 b). Bevor der Schnitt ausgeführt wurde, gab es im Glasstück keine nach links laufende Lichtwelle: Wir wissen, dass sich der Strahl nur in Vorwärtsrichtung (in diesem Fall nach rechts) ausbreiten kann. Doch nun muss sich eine Welle (Strahl I) nach links fortpflanzen, und zwar genau derjenige Teil des einfallenden Strahls, der von der Oberfläche des rechten Teilstücks zurückgeworfen wurde. Wir schließen daraus, dass sich in der Strahl II

Strahl I

Lichtstrahl

(a)

(b)

Abb. 4.12: (a) Ein Lichtstrahl in einem dichten homogenen Medium, beispielsweise Glas. (b) Schneidet man den Glasblock durch und entfernt die beiden Teile voneinander, so entstehen zwei neue Grenzflächen, an denen das Licht zurückgeworfen wird, und zwar durch äußere (Strahl 1) und innere (Strahl 2) Reflexion. Presst man die Teile wieder zusammen, so löschen diese reflektierten Strahlen einander idealerweise aus.

198

4 Die Ausbreitung des Lichts

Umgebung der Oberfläche des rechten Blocks „ungepaarte“ Streuzentren befinden, deren rückwärts ausgesendete Elementarwellen nicht ausgelöscht werden können. Die „andere Hälfte“ der Streuzentren, die denen der rechten Oberfläche vor dem Schnitt unmittelbar benachbart war, befindet sich nun auf dem linken Teilstück des Glases; als die beiden Teile noch miteinander verbunden waren, sendete diese Gruppe der Streuzentren ebenfalls Elementarwellen rückwärts, die bezüglich des Strahls I um 180◦ außer Phase waren und diesen Strahl auslöschten. Jetzt erzeugen sie den reflektierten Strahl II. Jedes Molekül streut rückwärts – im Prinzip tragen sämtliche Moleküle zur reflektierten Welle bei. In der Praxis ist jedoch vor allem eine dünne Schicht (mit einer Tiefe von ca. λ/2) ungepaarter atomarer Oszillatoren in unmittelbarer Nähe der beiden Oberflächen für die Reflexion verantwortlich. Im Falle einer Grenzfläche zwischen Luft und Glas werden rund vier Prozent der Energie des senkrecht in der Luft auf das Glas fallenden Strahls in dieser Weise reflektiert. Dieser Befund hängt nicht von der Dicke des Glasstücks ab. Strahl I wird vom Teilstück auf der rechten Seite zurückgeworfen. Da das Licht dabei aus einem optisch dünneren Medium auf ein optisch dichteres Medium trifft, spricht man von äußerer Reflexion. In anderen Worten: Der Brechungsindex des Eintrittsmediums (ni ) ist kleiner als der Brechungsindex des brechenden Mediums (nt ). Dasselbe gilt im Prinzip für die Schicht ungepaarter Oszillatoren auf dem linken Teilstück des Glases: Auch diese Grenzfläche reflektiert 4 % des einfallenden Strahls rückwärts (als Strahl II). Der Strahl tritt nun aber senkrecht aus dem Glas in die Luft, das heißt, ni > nt – diese Situation nennt man innere Reflexion. Bringt man die beiden Teilstücke immer näher zueinander, sodass ein sehr schmaler Spalt (beispielsweise ein dünner Luftfilm) entsteht, nimmt der reflektierte Anteil des Lichts immer weiter ab und verschwindet schließlich ganz, wenn die Stücke wieder miteinander verschmelzen. Merken Sie sich, dass die durch innere bzw. äußere Reflexion entstandenen Lichtstrahlen relativ zueinander um 180◦ phasenverschoben sind; wir werden darauf später zurückkommen (eine ausführlichere Behandlung findet sich in Abschn. 4.10). Mit einem gewöhnlichen Spiegel hat jeder schon die Erfahrung gemacht, dass weißes Licht weiß zurückgeworfen wird (und nicht etwa blau). Um dies zu erklären, erinnern wir uns zunächst daran, dass die für die Reflexion verantwortliche Streuzentrenschicht eine effektive Dicke von etwa λ/2 hat (siehe Abb. 4.6). Je größer also die Wellenlänge des einfallenden Lichts ist, desto stärker ist die am Prozess beteiligte Schicht (bis zu ungefähr 1000 Atomlagen), und desto mehr Streuzentren wirken zusammen. Dies gleicht den Effekt aus, dass das Streulicht jedes einzelnen Zentrums von λ abhängt (denken Sie an 1/λ4 ). Insgesamt entsteht so der Eindruck, dass die Oberfläche eines transparenten Mediums alle Wellenlängen ungefähr gleich gut reflektiert und der reflektierte Strahl daher nicht anders gefärbt ist als der einfallende. Darum (wie wir noch genauer besprechen werden) sieht diese Buchseite bei weißem Licht weiß aus.

4.3 Reflexion

199

4.3.1 Das Reflexionsgesetz Abbildung 4.13 zeigt einen Lichtstrahl, der aus Fronten ebener Wellen besteht. Er fällt unter einem bestimmten Winkel auf die glatte, ebene Oberfläche eines optisch dichten Mediums, zum Beispiel Glas. Dieses dichte Medium sei von Vakuum umgeben. Verfolgen wir nun eine Wellenfront, die den Molekülen an der Oberfläche begegnet (Abb. 4.14). Der Einfachheit halber haben wir in Abbildunge 4.15 nur ein paar Moleküllagen an den Grenzflächen eingezeichnet. Beim Eindringen regt die Wellenfront ein Streuzentrum nach dem anderen an; jedes davon emittiert einen Strom von Photonen, den man als halbkugelförmige Elementarwelle im Eintrittsmedium betrachten kann. Da die Wellenlänge erheblich größer ist als die Abstände zwischen den Molekülen, überlagern die rückwärts ins Eintrittsmedium gestreuten Elementarwellen einander konstruktiv in einer einzigen Richtung. So entsteht ein definierter reflektierter Strahl. Anders ist die Situation, wenn es sich bei dem einfallenden Licht um kurzwellige Röntgenstrahlung handelt: Dann gibt es mehrere reflektierte Strahlen. Derselbe Effekt tritt auf, wenn die Streuzentren im Vergleich zu λ (im Bereich des sichtbaren Lichts) weit voneinander entfernt sind (etwa im Falle eines Beugungsgitters, Abschn. 10.2.8). Die Richtung des reflektierten Strahls wird vom konstanten Phasenunterschied zwischen den atomaren Streuzentren bestimmt. Dieser wiederum hängt vom Winkel zwischen dem einfallenden Strahl und der Grenzfläche ab, vom so genannten Einfallswinkel. In Abbildung 4.16 liegt die Strecke AB parallel zu einer einfallenden Wellenfront, die Strecke CD liegt parallel zu einer reflektierten Wellenfront: Durch die Reflexion wird AB in CD umgewandelt. Mithilfe von Abbildung 4.15 sieht man sofort, dass die von A ausgesendete Elementarwelle phasengleich mit der gerade in D emittierten Elementarwelle ist (welche von der durch B laufenden Welle angeregt wurde), wenn die Strecken AC und BD gleich lang sind. Mit anderen Worten: Wenn alle von den Streuzentren an der Oberfläche ausgesendeten Elementarwellen einander phasengleich überlagern und eine einzige reflektierte ebene Welle bilden, muss AC = BD sein. Da die beiden Dreiecke eine gemeinsame Hypotenuse besitzen, gilt dann sin θr sin θi = . BD AC Im Einfallsmedium bewegen sich alle Wellen mit der gleichen Geschwindigkeit vi . Daraus folgt, dass Punkt B auf der Wellenfront dieselbe Zeit (Δt) benötigt, um Punkt D an der Oberfläche zu erreichen, wie die von A emittierte Elementarwelle, um Punkt C zu erreichen. Dies bedeutet BD = vi Δt = AC und damit unter Berücksichtigung der obigen Beziehung sin θi = sin θr , also θi = θr

(4.3)

oder in Worten: Der Einfallswinkel ist gleich dem Reflexionswinkel. Diese Beziehung bildet den ersten Teil des Reflexionsgesetzes. Sie tauchte erstmalig in dem Euklid zugeschriebenen Werk Katoptrik auf. Für einen entlang der Flächennormale (also senkrecht zur Oberfläche) einfallenden Strahl ist θi = 0◦ (also auch θr = 0◦ ); ein

4 Die Ausbreitung des Lichts

200 einfallender Strahl

Vakuum

reflektierter Strahl

(a) transmittierter oder gebrochener Strahl (a) einfallender Strahl

(b) reflektierter Strahl

(c)

(b)

gebrochener Strahl

Abb. 4.13: Ein Strahl ebener Wellen trifft auf eine Ansammlung von Molekülen, die ein Stück durchsichtiges Glas oder Plastik bilden. Ein Teil des einfallenden Lichts wird reflektiert und ein Teil wird gebrochen.

(d)

(e)

Abb. 4.14: Eine ebene Welle regt Atome an einer Grenzfläche an. Diese strahlen nahezu kontinuierlich Elementarwellen ab, wodurch reflektierte und gebrochene Wellen entstehen. In der Realität ist die Wellenlänge des Lichts mehrere tausend Mal so groß wie die Atome und die Abstände zwischen ihnen.

(f) Abb. 4.15: Reflexion einer Welle als Folge der Streuung.

4.3 Reflexion

201

Vakuum C

B

θi A

θr Medium

D

Abb. 4.16: Von links kommende ebene Wellen werden nach rechts reflektiert. Die reflektierte Wellenfront CD wird aus Wellen gebildet, die an den Atomen der Oberfläche zwischen A und D gestreut wurden. Im selben Moment, in dem die erste Elementarwelle von A kommend C erreicht, emittiert das Atom in D ebenfalls und die Wellenfront CD ist komplett.

Modernes phasengesteuertes Gruppenradar (phased-array radar). Die Anordnung kleiner einzelner Antennen verhält sich im Wesentlichen wie eine Anordnung von Atomen auf einer glatten Oberfläche. Durch Einführung einer geeigneten Phasenverschiebung zwischen benachbarten Reihen kann man die „Blickrichtung“ der Antenne beliebig ausrichten. Die ähnliche Phasenverschiebung an einer reflektierenden Fläche wird vom Einfallswinkel θi der auf der Atomschicht auftreffenden Welle bestimmt.

Spiegel reflektiert einen solchen Strahl in sich selbst. Ist θi ≈ 90◦ (also auch θr ≈ 90◦ ), so spricht man von streifendem Einfall. Lichtstrahlen Unter Verwendung von Wellenfronten lassen sich nicht alle Zusammenhänge klar darstellen. Es ist daher zweckmäßig, die Fortpflanzung des Lichts auf andere Weise anschaulich zu machen. In früherer Zeit stellte man sich Lichtstrahlen als geradlinige Ströme vor, die im Lateinischen als „radii“ bezeichnet wurden (daher stammt beispielsweise der englische Begriff „ray“). Ein solcher Strahl entspricht einer Linie, die in Richtung des Flusses der Strahlungsenergie verläuft. Es handelt sich dabei um ein mathematisches Konstrukt ohne physikalische Entsprechung. In einem homogenen Medium sind Lichtstrahlen gerade. Ist das Medium außerdem isotrop (verhält es sich in jeder Raumrichtung gleich), so stehen die Lichtstrahlen senkrecht auf den Wellenfronten. Von einer Punktquelle, die Kugelwellen aussendet, zeigen die Strahlen demnach radial nach außen. Lichtstrahlen, die zu einer ebenen Welle gehören, sind parallel. Um die Darstellung zu vereinfachen, zeichnen wir keine Strahlenbündel, sondern nur jeweils einen einfallenden und einen reflektierten Strahl (Abb. 4.17 a). Alle Winkel werden jetzt relativ zur Flächennormalen angegeben; die Zahlenwerte von θi und θr ändern sich dadurch nicht (siehe Abb. 4.16).

4 Die Ausbreitung des Lichts

202

Ei

nf all se be ne θi θr

λ

θr

he äc zfl en Gr

θi

(a) (b) Abb. 4.17: (a) Ein Strahlenbündel ebener Wellen wird durch einen einzelnen Strahl repräsentiert. Sowohl der Einfallswinkel θi als auch der Reflexionswinkel θr wird bezüglich zu einer Senkrechten zur spiegelnden Fläche angegeben. (b) Der einfallende und der reflektierte Strahl definieren die Einfallsebene, die senkrecht auf der spiegelnden Fläche steht.

Der Panzerkreuzer Aurora, der eine Schlüsselrolle in der Oktoberrevolution in Russland (1917) spielte, liegt in St. Petersburg vor Anker. Wo die Wasseroberfläche glatt ist, beobachtet man eine spiegelnde Reflexion. Das Spiegelbild verschwimmt an den von Wellen gekräuselten Stellen, weil hier diffuse Reflexion auftritt.

Das Reflexionsgesetz war im antiken Griechenland bereits bekannt; es kann durch Beobachtung der Verhältnisse an einem ebenen Spiegel ohne weiteres abgeleitet werden. Heutzutage verwendet man für diese Experimente eine Blitzlampe oder, noch besser, einen Laser niedriger Leistung. Der zweite Teil des Reflexionsgesetzes besagt, dass der einfallende Strahl, die Flächennormale und der reflektierte Strahl in einer gemeinsamen Ebene – der so genannten Einfallsebene – liegen (Abb. 4.17 b). Die Bedeutung dieser Aussage wird sofort offensichtlich, wenn man versucht, ein Objekt in einem Raum mit einem Lichtstrahl zu beleuchten, der vorher von einem Spiegel reflektiert wurde. Abbildung 4.18 a zeigt einen Lichtstrahl, der auf eine reflektierende, glatte Oberfläche fällt („glatt“ heißt, dass die Unebenheiten der Fläche klein im Vergleich zu einer Wellenlänge sind). Das von Millionen und Abermillionen Atomen ausgesendete reflektierte Licht überlagert sich dann zu einem einzigen definierten Strahl; man

4.3 Reflexion (a)

203 (b)

spiegelnde Reflexion

diffuse Reflexion

(c)

Abb. 4.18: (a) Spiegelnde Reflexion, (b) diffuse Reflexion. (c) Dieser Bildteil zeigt schematisch einige Reflexionen, die zwischen den beiden Extremfällen – rein spiegelnd und rein diffus – liegen. Reale Reflexionen haben meist eine solche Mischform.

Das Stealth-Jagdflugzeug F-117A zeichnet sich durch ein extrem geringes Radarprofil aus; d. h., es reflektiert nur einen kleinen Teil der ankommenden Mikrowellenstrahlung zurück zum Sender. Man erreicht dies, indem man den Fall θi = θr ≈ 0 möglichst vermeidet: Die Flächen der Außenhülle sind nur schwach geneigt, infolge des Reflexionsgesetzes werden die Radarwellen dann von der Quelle weg gestreut.

nennt dies spiegelnde Reflexion. Wenn die Hügel und Täler auf der Oberfläche klein gegen λ sind, kommen die gestreuten Elementarwellen bei θi = θr im Wesentlichen phasengleich an. Von dieser Situation gehen die Abbildungen 4.13, 4.15, 4.16 und 4.17 aus. Ist jedoch die Oberfläche im Vergleich zu λ rau, dann ist zwar der Einfallswinkel

4 Die Ausbreitung des Lichts

204

für jeden einzelnen Strahl noch immer gleich dem Reflexionswinkel, aber insgesamt werden die Strahlen in alle möglichen Richtungen zurückgeworfen; man nennt dies diffuse Reflexion. Beide Situationen sind Extreme, das Verhalten der meisten realen Oberflächen liegt irgendwo dazwischen. Das Papier dieser Buchseite streut infolge des Herstellungsverfahrens Licht ziemlich diffus, der Einband hingegen kommt der spiegelnden Reflexion deutlich näher.

Bringen Sie zwei Stecknadeln vor einem ebenen Spiegel an und richten Sie an ihren Bildern zwei weitere Stecknadeln aus. So können Sie das Reflexionsgesetz leicht nachprüfen. (Foto E. H.)

4.4

Brechung

Abbildung 4.13 zeigt einen Lichtstrahl, der unter einem bestimmten Winkel (θi = 0) auf eine Oberfläche fällt. Diese Grenzfläche ist eine Inhomogenität – die Atome auf dieser Fläche streuen das Licht sowohl rückwärts (in Form des reflektierten Strahls) als auch vorwärts (in Form des durchgelassenen oder transmittierten Strahls). Der einfallende Strahl wird dabei abgeknickt oder „von seinem Weg abgelenkt“, wie es Newton ausdrückte; man nennt diesen Effekt Brechung. Betrachten wir den durchgelassenen (gebrochenen) Strahl. Klassisch ausgedrückt, sendet jedes angeregte Molekül an der Oberfläche Elementarwellen in das dichte Medium (Glas), die sich mit der Lichtgeschwindigkeit c ausbreiten. Diese Elementarwellen überlagern sich zu einer Sekundärwelle, die wiederum, gemeinsam mit dem ungestreuten Anteil der Primärwelle, die durchgelassene Welle bildet. Dieser Prozess wiederholt sich immer und immer wieder, während sich die Welle im Medium fortpflanzt. Welche Darstellung wir auch immer wählen – im Augenblick des Eintritts in das dichtere Medium existiert eine einzige (Netto-)Welle, ein einziges (Netto-)Feld. Wie bereits gezeigt wurde, breitet sich die durchgelassene Welle in der Regel mit einer effektiven Geschwindigkeit von vt < c aus, als ob die Atome an der Grenzfläche „langsame“ Elementarwellen aussendeten, die sich zu einer „langsamen“ durchgelassenen Welle vereinigen. Auf dieses Bild kommen wir bei der Besprechung des huygensschen Prinzips zurück. Jedenfalls ist das kooperative Phänomen der durchgelassenen

4.4 Brechung

205

elektromagnetischen Welle langsamer als die einfallende elektromagnetische Welle, und daher werden die Wellenfronten an der Grenzfläche gebrochen und verschoben (das heißt, bezüglich der Einfallsrichtung gedreht): Der Strahl „knickt ab“.

4.4.1 Das Brechungsgesetz

Einfallsmedium B

ni vi Δt

θi

A

D θt

vt Δt nt

E brechendes Medium

Abb. 4.19: Brechung von Wellen. Die Atome in der Nähe der Oberfläche des brechenden Mediums senden Elementarwellen aus, die einander konstruktiv zu einem gebrochenen Strahl überlagern.

Abbildung 4.19 schließt sich unmittelbar an die Abbildungen 4.13 und 4.16 an. Gezeigt ist die Momentaufnahme einiger Wellenfronten. Wir erinnern uns daran, dass jede Wellenfront eine Fläche konstanter Phase ist; in dem Ausmaß, in dem die Phase des Nettofeldes durch das durchlassende Medium verzögert wird, wird auch jede einzelne Wellenfront verzögert. Beim Durchgang durch die Grenzfläche wird die Wellenfront aufgrund der Geschwindigkeitsänderung „geknickt“. Alternativ können wir Abbildung 4.19 auch als in gleichen Zeitabständen mehrfach belichtete Aufnahme einer einzigen Wellenfront betrachten. Innerhalb des Intervalls Δt erreicht Punkt B auf der Wellenfront (die sich mit der Geschwindigkeit vi bewegt) Punkt D; dieselbe Zeitspanne benötigt der durchgelassene Anteil dieser Wellenfront (der sich mit vt bewegt), um Punkt E zu erreichen. Befindet sich das Glas (nt = 1,5) im Vakuum (ni = 1), Luft (ni = 1,0003) oder einem anderen Medium, für das gilt nt > ni , vt < vi und AE < BD, so knickt die Wellenfront ab. Die gebrochene Wellenfront läuft durch D und E und schließt mit der Grenzfläche einen Winkel θt ein. Wieder haben die Dreiecke ABD und AED (Abb. 4.19) dieselbe Hypotenuse AD, sodass gilt sin θt sin θi = BD AE mit BD = vi Δt und AE = vt Δt. Hieraus folgt sin θt sin θi = . vi vt

4 Die Ausbreitung des Lichts

206

Multipliziert man beide Seiten mit c, dann ergibt sich unter Berücksichtigung von ni = c/vi und nt = c/vt ni sin θi = nt sin θt .

(4.4)

Beachten Sie, dass die Größen ni , nt , θi und θt wegen der Dispersion im Allgemeinen frequenzabhängig sind (siehe Abschnitt 3.5.1). Diese Gleichung gilt für jede Frequenz, aber die Ablenkung ist für jede Frequenz unterschiedlich. Gleichung (4.4) ist der erste Teil des Brechungsgesetzes, das nach seinem Entdecker, Willebrord Snell van Royen (Snellius) auch snelliussches Gesetz genannt wird. Die ursprüngliche Analyse von Snellius (1591–1626) ist verloren gegangen. Zeitgenössische Berichte beziehen sich aber auf einen Ansatz, wie er durch Abbildung 4.20 verdeutlicht wird. Die Beobachtungen ergaben, dass sich das Abknicken der Strahlen durch das (für alle θi konstante) Verhältnis zwischen xi und xt quantifizieren ließ. Verständlicherweise nannte man diese Konstante den Brechungsindex. Mit anderen Worten ist xi ≡ nt ; xt in Luft entspricht dies wegen xi = sin θi und xt = sin θt Gleichung (4.4). Inzwischen wissen wir, dass der Brite Thomas Harriot dieselbe Schlussfolgerung schon vor 1601 zog; anscheinend behielt er sie aber für sich.

Abb. 4.20: Descartes’ Schema zur Herleitung des Brechungsgesetzes. Der Kreis hat den Radius 1.

Die Brechungsindizes verschiedener Materialien wurden zunächst als physikalische Konstanten auf einfache experimentelle Weise bestimmt. Später konnte Newton das snelliussche Gesetz aus seiner eigenen Korpuskulartheorie ableiten. Damit stellte sich auch die Bedeutung von n als Maß für die Geschwindigkeit des Lichts heraus. Noch später zeigte sich, dass sich das snelliussche Gesetz ganz zwanglos aus der maxwellschen Theorie des Elektromagnetismus ergibt. Wiederum ist es zweckmäßig, die Darstellung der Wellenfronten (Abb. 4.19) in ein Strahlendiagramm (Abb. 4.21) zu übertragen. Alle Winkel sind relativ zur Flächen-

4.4 Brechung

207

normalen angegeben. Außer Gleichung (4.4) fließt hier noch die Tatsache ein, dass der einfallende, der reflektierte und der gebrochene Strahl in ein und derselben Ebene, der ˆi , Einfallsebene, liegen. Mit anderen Worten: Die Einheitsvektoren der Ausbreitung, k ˆ ˆ kt und kr , sind koplanar (Abb. 4.22). Beispiel 4.1 Ein Lichtstrahl in Luft trifft mit einer bestimmten Frequenz auf ein Stück Glas. Das Glas hat bei dieser Frequenz einen Brechungsindex von 1,52. Nehmen Sie an, dass der durchgelassene Strahl einen Winkel von 19,2◦ mit der Flächennormalen bildet, und bestimmen Sie den Winkel, unter dem das Licht auf die Grenzfläche fällt. Lösung Nach dem snelliusschen Gesetz ist sin θi =

nt 1,52 sin 19,2◦ = 0,4999 sin θt = ni 1,00

und damit θi = 30◦ . Ist ni < nt (dies ist der Fall, wenn der Strahl aus dem Medium mit dem kleineren Brechungsindex kommt), so gilt nach dem snelliusschen Gesetz sin θi > sin θt ; da diese Funktion zwischen 0◦ und 90◦ nur positive Werte annimmt, gilt dann auch θi > θt . Der Strahl behält seine Richtung beim Eintritt in das Medium mit dem höheren Brechungsindex nicht bei, sondern er knickt in Richtung der Normalen ab (Abb. 4.23 a). Die Umkehrung dieser Beziehung gilt ebenfalls: Beim Eintritt in ein Medium mit einem niedrigeren Brechungsindex knickt der Strahl von der Normalen weg ab (siehe auch Abb. 4.23 b). Beachten Sie, dass beide Aussagen in beiden Richtungen gelten: Man könnte die Pfeile in Abbildung 4.23 ohne weiteres umkehren. Es ist üblich, von der optischen Dichte eines transparenten Materials zu sprechen. Das Konzept ist zweifellos aus der weit verbreiteten, allerdings nicht ganz richtigen Vorstellung abgeleitet, dass die Brechungsindizes verschiedener Materialien immer proportional zu ihren Massendichten sind. Abbildung 4.25 zeigt eine willkürliche Auswahl von dichten, transparenten Materialien. Wie man hier sieht, ist eine Korrelation vorhanden, aber sie ist inkonsistent. Beispielsweise hat Acrylglas eine spezifische Dichte von 1,19 und einen Brechungsindex von 1,491, während Styrol eine geringere spezifische Dichte (1,06) und gleichzeitig einen höheren Brechungsindex (1,590) hat. Trotzdem ist der Begriff der optischen Dichte – bezogen auf den Brechungsindex und nicht auf die Massendichte – für den Vergleich von unterschiedlichen Materialien nützlich.

4 Die Ausbreitung des Lichts

208 Ei

nf all se be ne

θi

ni

θr

zfl en Gr

θt

he äc

nt

Abb. 4.21: Der einfallende, der reflektierte und der gebrochene Strahl liegen in der Einfallsebene.

Abb. 4.22: Brechung bei verschiedenen Einfallswinkeln. Die untere Grenzfläche des Glasstücks ist kreisförmig geschliffen; daher verläuft der gebrochene Strahl stets entlang eines Radius und steht damit immer senkrecht auf der unteren Grenzfläche. (PSSC College Physics, D. C. Heath & Co., 1968)

Das Bild eines Stiftes, gesehen durch ein dickes, durchsichtiges Stück Plastik. Die Verschiebung des Bildes kommt durch die Brechung des Lichts an der Grenzfläche Plastik/Luft zur Normalen hin zustande. Bauen Sie eine ähnliche Anordnung mit einem schmalen Objekt (etwa einem beleuchteten Spalt) auf und messen Sie die Winkel exakt; so können Sie das snelliussche Gesetz direkt nachprüfen. (Foto E. H.)

Abb. 4.23: Das Abknicken von Lichtstrahlen an einer Grenzfläche: (a) Tritt ein Lichtstrahl in ein optisch dichteres Medium (mit einem größeren Brechungsindex, ni < nt ) ein, so knickt der Strahl zur Normalen der Grenzfläche hin ab. (b) Fällt ein Lichtstrahl aus einem dichteren in ein dünneres Medium (ni > nt ), so knickt er von der Normalen weg ab.

4.4 Brechung

209

Abb. 4.24: Ein Lichtstrahl dringt von unten in ein Medium ein und pflanzt sich nach oben fort. (a) Hier gibt es zwei Stücke Plexiglas in deutlichem Abstand voneinander. Dazwischen befindet sich Luft. (b) Nachdem der Abstand zwischen den Stücken verringert wurde, überlappen sich zwei der reflektierten Strahlen und bilden rechts den hellen Strahl in der Mitte. (c) Hier wurde die dünne Luftschicht durch Rizinusöl ersetzt, was die Grenzfläche zwischen den beiden Stücken fast zum Verschwinden bringt – ebenso wie den reflektierten Strahl in der Mitte. (d) Im Vergleich dazu ein einzelnes Stück Plexiglas. (G. Calzà, T. Lopez-Arias, L. M. Gratton, and S. Oss, genehmigter Nachdruck aus The Physics Teacher 48, 270 (2010), American Association of Physics Teachers)

4 Die Ausbreitung des Lichts

210

Brechungsindex

1.8

1.7

1.6

1.5

2

3

4 5 spezifische Dichte

6

Abb. 4.25: Brechungsindex, aufgetragen über der spezifischen Dichte, für eine willkürliche Auswahl von dichten, transparenten Materialien.

Das snelliussche Gesetz kann man auch in der Form sin θi = nti sin θt

(4.5)

aufschreiben; nti ≡ nt /ni ist dann der relative Brechungsindex der beiden Medien. Beachten Sie, dass nti = vi /vt ; außerdem ist nti = 1/nit . Für den Übergang von Luft in Wasser ist nwa ≈ 4/3, und für den Übergang von Luft in Glas ist nga ≈ 3/2. Beispiel 4.2 Ein schmaler Laserstrahl pflanzt sich in Wasser (Brechungsindex 1,33) fort und trifft unter einem Winkel von 40,0◦ mit der Normalen auf eine Glasfläche (Brechungsindex 1,65). (a) Bestimmen Sie den relativen Brechungsindex. (b) Welchen Transmissionswinkel hat der Strahl im Glas? Lösung (a) Definitionsgemäß gilt nt nti = ni nG 1,65 = 1,24 . nGW = = nW 1,33 (b) Mit dem snelliusschen Gesetz erhalten wir sin θt = (sin θi )/nti = (sin 40◦ )/1,24 = 0,5184 und θt = 31,2◦ .

4.4 Brechung

211

ˆt k ˆr k

θt

ˆn u

θr θi Grenzfläche ˆi k ni

nt

Abb. 4.26: Geometrie der Strahlen.

Es sei u ˆn ein senkrecht auf der Grenzfläche stehender Einheitsvektor, der vom Eintrittsmedium in das durchlassende Medium zeigt (Abb. 4.26). Wie Sie in Aufgabe 4.33 nachprüfen können, lässt sich das vollständige Brechungsgesetz vektoriell wie folgt formulieren:



 ˆi × u ˆt × u ˆ n = nt k ˆn (4.6) ni k oder alternativ ˆ t − ni k ˆi = (nt cos θt − ni cos θi ) u ˆn . nt k

(4.7)

Brechung von Licht an einer Punktquelle Alle unsere gewohnten Lichtquellen sind tatsächlich multiple Punktquellen, und daher wollen wir nun die Brechung eines divergierenden Strahlenbündels an einer einzelnen Punktquelle untersuchen. Stellen wir uns zwei homogene dielektrische Medien vor, die durch eine ebene Grenzfläche separiert sind (siehe Abbildung 4.27). Ein Leuchtpunkt S auf der linken Seite sendet Licht aus, von dem ein Teil die Grenzfläche erreicht, wo es gebrochen wird. In Abbildung 4.27 a wird es leicht in Richtung der Achse gebrochen und in Abbildung 4.27 b von ihr weg. Die Strahlen werden in Abhängigkeit vom Winkel unterschiedlich abgelenkt, und obwohl sie alle von dem gleichen axialen Punkt S kommen, werden sie in beiden Diagrammen im Allgemeinen nicht in den gleichen Punkt zurück projiziert. Wenn wir allerdings das Licht zu einem schmalen Kegel einschränken, werden die Strahlen nur schwach abgelenkt, sodass sie nur wenig von der Flächennormale abweichen. In diesem Fall scheinen sie tatsächlich aus einem gemeinsamen Punkt P zu kommen, wie in beiden Teilen von Abbildung 4.27 zu sehen ist (die Öffnungswinkel sind übertrieben groß gezeichnet, damit die Beschriftungen in die Bilder passen). Wenn S also zum Beispiel in Abbildung 4.27 b ein Fleck auf einem Fisch ist, der das Licht aus dem Wasser zurück reflektiert (in der Abbildung

4 Die Ausbreitung des Lichts

212 (b)

(a)

P

S

S

O

ni < nt

nt

θt A O

P ni > nt a

θt

nt a'

Abb. 4.27: Ablenkung des Lichts an der ebenen Grenzfläche zwischen zwei transparenten Materialien. Stellen Sie sich vor, dass S in Teil (b) unter Wasser liegt, und drehen Sie das Bild in Gedanken um 90◦ entgegen dem Uhrzeigersinn. Ein Beobachter aus der Luft würde S in P abgebildet sehen.

nach rechts), dann ist der Kegel der Strahlen, die in die winzige Pupille des Auges eines Beobachters eintreten, so schmal, dass ein ziemlich scharfes Bild von S auf der Netzhaut gebildet wird. Und da das Auge-Hirn-System gelernt hat, Licht zu verarbeiten, indem es so wahrgenommen wird, als würde es sich entlang gerader Linien ausbreiten, erscheint der Fleck und folglich jener Teil des Fisches bei P . Die Positionen von S und P werden als konjugierte Punkte bezeichnet. Das Objekt bei S befindet sich in einer „Objektweite“ a von der Grenzfläche entfernt, und das Bild bei P liegt in einer Entfernung a , der „Bildweite“, von O. Unter Verwendung der Dreiecke SAO und PAO in Abbildung 4.27 b ergibt sich a tan θi = a tan θt . Da der Strahlkegel schmal ist, sind θi und θt klein. Wir können daher auf beiden Seiten den Tangens durch den Sinus ersetzen und erhalten mit dem snelliusschen Gesetz a /a = nt /ni . Wenn wir senkrecht nach unten (in Abbildung 4.27 b also nach links) auf einen Fisch schauen (es gilt hier nt = 1, ni = 4/3 und nt /ni = 3/4), der sich 4,0 m unter der Oberfläche befindet, dann wird er in einer Entfernung von nur 3,0 m erscheinen. Umgekehrt wird der senkrecht nach oben schauende Fisch Sie, wenn Sie sich 3,0 m über der Oberfläche befinden, 4,0 m über der Oberfläche sehen. Wenn der vom Punkt S ausgehende Strahlenkegel weit ist, wird die Situation komplizierter (siehe Abb. 4.28). Betrachtet unter einem nennenswerten Winkel mit der Flächennormale erscheinen die durchgelassenen Strahlen wieder so, als würden sie von vielen unterschiedlichen Punkten kommen. Werden diese Strahlen zurück verlängert, liegen sie tangential auf einer Kurve, die Kaustik genannt wird. Mit anderen Worten, es scheint so, als würden unterschiedliche Strahlen durch unterschiedliche Punkte (P ) gehen, die alle auf der Kaustik liegen; je weiter der Strahlenkegel sich bei S öffnet, umso größer ist der Brechungswinkel und umso höher auf der Kaustik liegt P .

4.4 Brechung

213

Luft

P

Wasser ni > nt S

Abb. 4.28: Eine Punktquelle ist in ein optisch dichtes Material eingebettet – beispielsweise ein Fisch in einem Teich. Beobachter sehen S irgendwo auf der Kurve, je nachdem, welche Strahlen sie sehen. In der Zeichnung scheint der Strahl, der in das Auge des Betrachters eintritt, von P zu kommen.

Ein Kegel, der von aus S kommenden Strahlen gebildet wird und der schmal genug ist, um in das Auge einzutreten, wird so gesehen, als würde er von P kommen (Abbildung 4.29). Dieser Punkt liegt zum einen höher und ist zum anderen horizontal gegenüber dem Beobachter versetzt (d. h. entlang der Kaustik verschoben). Zusammen hat dies den Effekt, der auf dem Foto auf Seite 214 in Gestalt des geknickten Bleistiftes zu sehen ist und der das Fischen mit der Harpune so schwierig macht. Abbildung 4.29 legt einen einfachen Demonstrationsversuch nahe: Werfen Sie eine Münze in einen undurchsichtigen Becher und verschieben Sie den Becher horizontal, während Sie in diesen hineinschauen, und zwar solange, bis der Becherrand den direkten Blick auf die Münze gerade eben versperrt. Wenn Sie nun den Becher, ohne den Kopf zu bewegen, langsam mit Wasser füllen, werden Sie die Münze schließlich sehen.

Luft

P Wasser S

Abb. 4.29: Ein in Wasser eingetauchtes Objekt wird durch die Oberfläche betrachtet.

Beispiel 4.3 Ein Strahl fällt, wie in der folgenden Abbildung skizziert, auf ein Stück Glas mit dem Brechungsindex 1,55. Bestimmen Sie die Winkel θ1 bis θ8 .

4 Die Ausbreitung des Lichts

214

θ1

θ2

θ3 θ4

35.0°

θ8 θ5 θ6

Glas

θ7

Luft

Lösung Nach dem Brechungsgesetz ist θ1 = 35,0◦ . Aus dem snelliusschen Gesetz folgt 1 sin 35,0◦ = 1,55 sin θ2 sin 35,0◦ = 0,3700 sin θ2 = 1,55 und θ2 = 21,719◦ ≈ 21,7◦ . Wegen θ2 + θ3 = 90◦ ist θ3 = 68,281◦ ≈ 68,3◦ . Aus dem Brechungsgesetz erhalten wir θ3 = θ4 = 68,3◦ = θ5 = θ6 . Aus θ6 +θ7 = 90◦ folgt θ7 = 90◦ − θ6 = 21,7◦ . An der rechten Grenzfläche können wir wieder das snelliussche Gesetz anwenden, um den Winkel θ8 zu bestimmen: 1,55 sin 21,719◦ = 1,00 sin θ8 0,5736 = sin θ8 und somit θ8 = 35,0◦ . Der Strahl verlässt den Quader also mit dem gleichen Winkel, mit dem er links auf die Grenzfläche getroffen ist.

Strahlen, die vom eingetauchten Teil des Stiftes ausgehen, knicken an der Wasseroberfläche ab, bevor sie das Auge des Beobachters erreichen (Foto E. H.).

4.4 Brechung

215

Eine gebrochene Schildkröte. (Anya Levinson und Tom Woosnam)

Abbildung 4.19 zeigt die drei wichtigen Veränderungen des Strahls beim Durchgang durch die Grenzfläche. (1) Richtungsänderung: Der vordere Anteil der Wellenfront wird im Glas abgebremst; der noch in der Luft befindliche hintere Anteil bewegt sich schneller, wodurch die Welle in Richtung der Normalen abknickt. (2) Verbreiterung: Der Strahl im Glas hat einen größeren Durchmesser als der Strahl in der Luft, das heißt, die Energiedichte ist im ersteren Fall geringer. (3) Wellenlängenänderung: Die Wellenlänge nimmt beim Eintritt in das Glas ab, da die Frequenz sich nicht ändert, während die Geschwindigkeit sinkt. Mit λ = v/ν = c/nν ist λ0 . (4.8) n Aus dieser Beziehung kann man entnehmen, dass die Farbigkeit des Lichts weniger mit seiner Wellenlänge als vielmehr mit seiner Frequenz (oder Energie, denn E = hν) verknüpft ist, die im Gegensatz zur Wellenlänge nicht vom Ausbreitungsmedium des Strahls abhängt. Die Farbe ist ein weitgehend physio-psychologisches Phänomen (siehe Abschn. 4.9), das man mit Vorsicht diskutieren muss. Trotzdem ist es zwar vereinfachend, aber nützlich, sich „blaue“ Photonen energiereicher als „rote“ Photonen vorzustellen. Wenn wir über Wellenlängen in Bezug zur Farbe sprechen, wollen wir uns stets auf die Wellenlänge im Vakuum λ0 beziehen. λ=

In allen bisher behandelten Situationen haben wir angenommen, dass sowohl der reflektierte als auch der gebrochene Strahl dieselbe Frequenz hat wie der einfallende Strahl. Alles in allem ist dies auch sinnvoll. Licht mit der Frequenz ν fällt auf ein Medium und versetzt die Moleküle vermutlich in einfache harmonische Bewegung. Mit Sicherheit ist das der Fall, wenn die Amplitude der Schwingung sehr klein, also das anregende elektrische Feld schwach ist. Für helles Sonnenlicht beträgt das E-Feld nur etwa 1000 V/m (das B-Feld ist schwächer als ein Zehntel des Magnetfeldes an der Erdoberfläche). Das ist recht wenig im Vergleich zu den Feldern, die einen kristallinen Festkörper zusammenhalten (in der Größenordnung von 1011 V/m, ungefähr so stark wie das Feld, das ein Elektron im Atom festhält). Wir können somit in der Regel davon ausgehen, dass sich die Oszillatoren harmonisch bewegen und dass die Frequenz daher konstant bleibt: Das Medium verhält sich linear. Ist die Amplitude des E-Feldes des

4 Die Ausbreitung des Lichts

216

einfallenden Lichtstrahls – beispielsweise eines starken Laserstrahls – dagegen außergewöhnlich hoch, so kann sich das Medium bei bestimmten Frequenzen nichtlinear verhalten. Es werden dann außer der Grundfrequenz ν Oberwellen (Harmonische, 2ν, 3ν usw.) reflektiert und gebrochen. Heutzutage kann man so genannte Frequenzverdoppler (Generatoren für die zweite Harmonische, 2ν) kaufen (siehe Abschn. 13.4.2). Sie bestehen aus einem in geeigneter Weise orientierten Kristall mit nichtlinearen Eigenschaften (vor allem Kaliumdihydrogenphosphat, KDP, und Ammoniumdihydrogenphosphat, ADP). Ein einfallender roter Lichtstrahl (694,3 nm) verlässt einen solchen Kristall mit einer Wellenlänge im UV-Bereich (347,15 nm). Ein Detail des oben diskutierten Stoffes sollten wir noch etwas eingehender behandeln: Wir nahmen (sinnvollerweise) an, dass jeder Punkt der Grenzfläche in Abb. 4.13 a mit einem bestimmten Punkt auf der einfallenden, der reflektierten und der durchgelassenen Welle zusammenfällt. Mit anderen Worten: Es gibt eine feste Phasenbeziehung zwischen allen Wellen in allen Punkten der Grenzfläche. Wenn die einfallende Wellenfront die Fläche überstreicht, ist jeder ihrer Punkte gleichzeitig ein Punkt sowohl auf der reflektierten als auch auf der durchgelassenen Front. Dies nennt man die Kontinuität der Wellenfront; eine mathematische Begründung dafür wird in Abschnitt 4.6.1. gegeben. Interessanterweise hat Sommerfeld gezeigt5 , dass die Gesetze der Reflexion und Brechung (unabhängig von der Art der Welle) direkt aus der Forderung nach der Kontinuität der Wellenfront folgen, was man durch Lösung von Aufgabe 4.30 nachvollziehen kann. Negative Brechung Obwohl sie noch in den Kinderschuhen steckt, verspricht die Technologie der Metamaterialien einige interessante Anwendungen. Ein besonders faszinierender Aspekt ist dabei die negative Brechung. Noch ist es nicht möglich, ein Stück linkshändiges Material einfach aus dem Katalog zu bestellen, sodass wir hier nicht über praktische Dinge reden. Vielmehr wollen wir uns auf die Physik konzentrieren, die wirklich außergewöhnlich ist. Allgemein fließt Energie in die Richtung des Poynting-Vektors, der in die Richtung der Strahlen zeigt. Eine Welle pflanzt sich in Richtung des Propagationsvektors fort, der senkrecht auf den Wellenfronten steht. In einem homogenen isotropen Dielektrikum wie Glas sind alle diese Richtungen gleich. In linkshändigen Materialien ist dies nicht der Fall. In der Simulation, deren Ergebnis in Abbildung 4.30 dargestellt ist, sehen wir eine horizontale Platte eines Materials mit negativem Brechungsindex, umgeben von Luft, Glas, Wasser oder einem anderen gewöhnlichen Medium. Ein Strahl mit sehr flachen Wellenfronten erreicht von oben links die obere Grenzfläche. Solange er in einem gewöhnlichen Material mit positivem Brechungsindex ist, wird er auf seinem Weg ein wenig breiter. Wenn der Strahl dann in die Platte mit negativem Brechungsindex eintritt, propagiert er, anstatt in Richtung der Normale in den vierten Quadranten 5

A. Sommerfeld, Optik. Siehe auch J. J. Sein, Am. J. Phys. 50, 180 (1982).

4.4 Brechung

217

abgelenkt zu werden, in den dritten Quadranten, wobei der Winkel immerhin mit dem snelliusschen Gesetz im Einklang steht. Beachten Sie, dass die Wellenfronten jetzt nicht mehr auseinanderlaufen, sondern vielmehr konvergieren. Im stationären Zustand laufen die Elementarwellen tatsächlich rückwärts, also nach rechts in Richtung der ersten Grenzfläche. Dabei haben sie eine negative Phasengeschwindigkeit.

Abb. 4.30: Ein Lichtstrahl fällt von oben auf eine Platte aus einem Material mit negativem Brechungsindex. Über und unter der Platte ist Luft.

In dem Material mit negativem Brechungsindex zeigt der Propagationsvektor nach rechts oben, während die Strahlen nach links unten zeigen. Die Phasengeschwindigkeit der Elementarwellen zeigt nach rechts oben, obwohl der Poynting-Vektor (die Strahlrichtung) nach links unten zeigt. Die Energie fließt wie gewöhnlich in Richtung des sich fortpflanzenden Strahls, was in diesem Fall allerdings links unten ist. An der unteren Grenzfläche, wo die Welle wieder in das gewöhnliche Material eintritt, klappt die Welle an der Flächennormale um in den vierten Quadranten und propagiert parallel zum ursprünglichen einfallenden Strahl, ganz so, als würde sie ein Stück Glas durchlaufen. Alles ist nun wieder normal, und der durchgelassene Strahl läuft wie gewöhnlich auseinander, während er nach unten rechts propagiert.

4.4.2 Das huygenssche Prinzip Nehmen wir an, ein Lichtstrahl fällt durch eine ungleichförmige Glasplatte (Abb. 4.31), sodass die Gestalt Σ der Wellenfront gestört wird. Wie können wir die neue Form Σ bestimmen? Und wie wird Σ zu einem späteren Zeitpunkt aussehen, vorausgesetzt, das Licht breitet sich in der Zwischenzeit ungehindert aus?

4 Die Ausbreitung des Lichts

218 S

Σ

Glas

Σ

Abb. 4.31: Störung eines Ausschnitts aus einer Wellenfront beim Durchgang durch ein Material mit ungleichförmiger Dicke.

Ein erster Schritt zur Lösung dieses Problems erschien 1690 in gedruckter Form – in dem Werk Traité de la Lumière, das zwölf Jahre früher von dem holländischen Physiker Christiaan Huygens geschrieben worden war. In diesem Werk formulierte Huygens das später nach ihm benannte Prinzip. Dieses huygenssche Prinzip besagt, dass jeder Punkt einer primären Wellenfront Ausgangspunkt kugelförmiger sekundärer Elementarwellen ist, sodass die Wellenfront zu einem späteren Zeitpunkt die Einhüllende dieser Elementarwellen bildet. Ein weiterer wichtiger Punkt ist folgender: Die sekundären Elementarwellen breiten sich mit der gleichen Frequenz ν und der gleichen Geschwindigkeit vt aus wie die Primärwelle. Mit dieser Erkenntnis legte Huygens, ein ausgezeichneter Forscher, den Grundstein für eine zwar recht naive, aber doch bemerkenswert gut funktionierende Theorie der Streuung. Diese sehr frühe Behandlung hat verständlicherweise manche Schwäche; beispielsweise kommt das Konzept der Interferenz nicht vor, sodass auch die laterale Streuung nicht erklärt werden kann. Die Idee, dass die Geschwindigkeit der Sekundärwellen durch das Medium bestimmt wird (diese Geschwindigkeit kann sogar anisotrop sein, wie noch gezeigt werden soll – siehe z. B. Abschn. 8.4), war außerdem nicht mehr als eine begründete Vermutung. Ungeachtet dessen kommt man ausgehend vom huygensschen Prinzip zum snelliusschen Gesetz, und zwar auf ähnlichem Weg wie bei unserer Herleitung von Gleichung (4.4). Wie wir später noch sehen werden, ist das huygenssche Prinzip eng verwandt mit einer mathematisch anspruchsvolleren Methode, die als Fourier-Analyse bekannt ist. Wahrscheinlich hält man sich am besten nicht lange mit den physikalischen Details auf (so sollte man nicht danach fragen, wie sich Licht im Vakuum ausbreiten kann), sondern benutzt das Prinzip einfach als Hilfsmittel, als eine nützliche Erfindung, die zu richtigen Ergebnissen führt. Nicht zu vergessen ist schließlich, dass es – falls Einstein Recht hatte – lediglich gestreute Photonen gibt und die Elementarwellen selbst nur in der Theorie existieren. Ist das Medium homogen, so dürfen wir Elementarwellen mit endlichen Radien konstruieren; ist das Medium dagegen inhomogen, müssen wir uns die Radien unendlich klein vorstellen. Abbildung 4.32 veranschaulicht diesen Sachverhalt. Gezeigt ist eine Wellenfront Σ sowie eine Reihe sekundärer kugelförmiger Elementarwellen, deren Radien sich nach einer Zeit t auf vt ausgedehnt haben. Die Einhüllende dieser Ele-

4.4 Brechung

219

mentarwellen soll dann die vorangeschrittene Primärwelle Σ sein. Wir können diesen Prozess durch mechanische Schwingungen eines elastischen Mediums visualisieren, wie es auch Huygens tat, der von einem alles durchdringenden Äther ausging: Wenn wir die Ausbreitung dieser Wellen untersuchen, müssen wir noch berücksichtigen, dass jedes Teilchen der Materie, in der sich die Welle fortpflanzt, seine Bewegung nicht nur dem nächsten Nachbarn in Ausbreitungsrichtung des Strahls mitteilt, sondern auch allen anderen Nachbarn, die es berührt und die seiner Bewegung Widerstand leisten. So entsteht um jedes Teilchen eine Welle, deren Mittelpunkt das betreffende Teilchen ist. (Christiaan Huygens, 1690, Traité de la Lumière [Abhandlung über das Licht]) Im 19. Jahrhundert modifizierte Fresnel das huygenssche Prinzip erfolgreich, indem er die Interferenz einführte. Noch etwas später zeigte Kirchhoff, dass das FresnelHuygens-Prinzip unmittelbar aus der Wellengleichung (2.60) folgt, womit das Prinzip eine solide mathematische Grundlage erhielt. Dass das Prinzip neu formuliert werden musste, geht aus Abbildung 4.32 hervor, wo irreführenderweise nur halbkugelförmige Elementarwellen eingezeichnet sind.6 Hätten wir die Kugelwellen vollständig eingezeichnet, so erschiene eine rückläufige Welle, die sich auf die Quelle zubewegt, was der Beobachtung widerspräche. Über dieses Problem brauchen wir uns keine Gedanken zu machen, da es von Fresnel und Kirchhoff theoretisch berücksichtigt wurde.

Abb. 4.32: Nach dem huygensschen Prinzip pflanzt sich eine Welle so fort, als ob sie aus einer Anordnung von Punktquellen bestünde, deren jede eine Kugelwelle aussendet.

Strahlkonstruktion nach Huygens Huygens war einer der großen Gelehrten seiner Zeit, und zusätzlich zu seiner Wellentheorie entwickelte er auch eine Methode zur grafischen Darstellung gebrochener 6

Siehe E. Hecht, Phys. Teach. 18, 149 (1980).

4 Die Ausbreitung des Lichts

220

θi ni

einfallender Strahl durchgelassener Strahl

1/nt

Q

O

1/ni nt > ni θt

Abb. 4.33: Konstruktion des gebrochenen Strahls nach Huygens.

Strahlen. Zusammen mit der Elementarwellenkonstruktion ist dieses Strahlschema sehr nützlich, wenn man herausfinden will, wie Licht in einem anisotropen kristallinen Medium propagiert (siehe Kapitel 8). Betrachten wir also Abbildung 4.33, in der ein Strahl im Punkt O auf eine Grenzfläche zwischen zwei transparenten, homogenen, isotropen Dielektrika mit den Brechungsindizes ni und nt trifft. Wir haben O in die Mitte gelegt und zwei Kreise gezeichnet: den einfallenden Kreis mit dem Radius 1/ni und den gebrochenen Kreis mit dem Radius 1/nt . Beide Radien entsprechen den Geschwindigkeiten geteilt durch c in den beiden Medien. Nun verlängern wir die Linie des einfallenden Strahl, bis sie den größeren (einfallenden) Kreis schneidet. Im Schnittpunkt legen wir die Tangente an den einfallenden Kreis und verlängern sie in Richtung der Grenzfläche, bis sie diese im Punkt Q schneidet. Diese Linie entspricht einer ebenen einfallenden Wellenfront. Nun ziehen wir eine Linie von Q, die den kleineren (gebrochenen oder durchgelassenen) Kreis tangiert. Von diesem Tangentenpunkt ziehen wir eine Linie zurück nach O – das wird der gebrochene Strahl. Heute ist die Methode von Huygens vor allem von pädagogischem Wert. An dem Beweis, dass sie dem snelliusschen Gesetzt entspricht, können Sie sich in Aufgabe 4.10 üben.

4.4.3 Lichtstrahlen und Normalkongruenz In der Praxis lassen sich sehr schmale Lichtstrahlenbündel oder -büschel erzeugen (z. B. Laserstrahlen). Einen Strahl können wir uns dann als unendlich schmales Lichtbündel (also als Ergebnis eines Grenzüberganges) vorstellen. Wir erinnern uns, dass Strahlen in einem isotropen Medium (d. h., in einem Medium, das sich in allen Raumrichtungen identisch verhält) orthogonale Trajektorien der Wellenfronten sind – mit anderen Worten, die Strahlen stehen in jedem Schnittpunkt mit den Wellenfronten senkrecht auf diesen. Offensichtlich verläuft ein solcher Strahl parallel zum Ausbreitungsvektor k. Wie Sie vielleicht schon vermuten, trifft dies auf anisotrope Medien, die wir später genauer untersuchen wollen (Abschn. 8.4.1), nicht zu. In homogenen, isotropen Stoffen bilden die Lichtstrahlen gerade Linien: Da es im Medium keine Vorzugsrichtung gibt, kann der Strahl aus Symmetriegründen nicht in eine bestimmte Richtung gekrümmt sein. Da außerdem die Ausbreitungsgeschwindigkeit in allen

4.4 Brechung

221

Richtungen dieselbe ist, muss auch der Abstand zwischen zwei Wellenfronten, gemessen längs eines Strahls, überall derselbe sein.7 Punkte, in denen ein einziger Strahl eine Reihe von Wellenfronten schneidet, nennt man korrespondierende Punkte (z. B. A, A und A in Abb. 4.34). Offensichtlich ist der zeitliche Abstand zwischen zwei beliebigen korrespondierenden Punkten auf je zwei aufeinanderfolgenden Wellenfronten gleich. Hat sich also die Wellenfront Σ nach einer Zeit t in die Wellenfront Σ verwandelt, so ist dieselbe Zeit t notwendig, um den Abstand zwischen allen Paaren korrespondierender Punkte zu durchlaufen. Dies gilt auch dann, wenn die Wellenfront unterdessen von einem isotropen Medium in ein anderes übergegangen ist. Es bedeutet nur, dass jeder Punkt auf Σ innerhalb von t auf einem Strahl die Front Σ erreicht.

S

A Σ

B 

B

B

A Σ

Glas A Σ

Abb. 4.34: Wellenfronten und Strahlen.

Kann man zu einer Strahlengruppe eine Fläche finden, auf der alle Strahlen senkrecht stehen, so bilden diese Strahlen eine so genannte Normalkongruenz. Beispielsweise stehen die von einer Punktquelle ausgehenden Strahlen senkrecht auf einer Kugel, deren Mittelpunkt die Quelle ist. Wir wollen noch kurz eine andere Technik ansprechen, mit der wir ebenfalls die Fortpflanzung von Licht in verschiedenen isotropen Medien beschreiben können. Die Grundlage hierfür bildet der Satz von Malus und Dupin (formuliert 1808 von E. Malus und modifiziert 1816 von C. Dupin), der besagt, dass die Normalkongruenz einer Strahlengruppe auch nach beliebig vielen Brechungen und Reflexionen erhalten bleibt (wie in Abb. 4.34). Nach unserer gegenwärtigen Sichtweise der Wellentheorie ist dieser Satz äquivalent der Aussage, dass die Strahlen in isotropen Medien stets orthogonal zu den Wellenfronten bleiben, ungeachtet aller während der Fortpflanzung auftretenden Vorgänge. In Aufgabe 4.32 wird gezeigt, dass man sowohl das Brechungsgesetz als auch das snelliussche Gesetz aus dem Satz von Malus und Dupin herleiten kann. Meist ist es zweckmäßig, zunächst den Strahlengang durch ein optisches System zu verfolgen und anschließend die Wellenfronten zu rekonstruieren; bei Letzterem macht man sich die Orthogonalität zwischen Strahl und Wellenfront sowie die oben erläuterten gleichen Übergangszeiten korrespondierender Punkte zunutze. 7

Ist der Stoff inhomogen oder sind mehrere Medien beteiligt, so ist die optische Weglänge (siehe Abschn. 4.5) zwischen den Wellenfronten überall gleich.

4 Die Ausbreitung des Lichts

222

4.5

Das fermatsche Prinzip

Die Gesetze von Reflexion und Brechung und sogar ganz allgemein die Art, in der Licht sich ausbreitet, können wir auch aus einer völlig anderen, verblüffenden Perspektive betrachten, die uns das fermatsche Prinzip eröffnet. Die im Folgenden erläuterten Vorstellungen hatten einen gewaltigen Einfluss auf die Entwicklung des physikalischen Denkens auch über die klassische Optik hinaus. Heron von Alexandria, der irgendwann zwischen 150 v. Chr. und 250 n. Chr. lebte, formulierte als Erster das so genannte Variationsprinzip. In seiner Formulierung des Reflexionsgesetzes stellte er fest, dass das Licht sich stets den kürzestmöglichen Weg sucht, um über eine reflektierende Fläche von einem Punkt S zu einem Punkt P zu gelangen. In Abbildung 4.35 sieht man dies sofort; gezeigt ist eine Punktquelle S, die eine Anzahl Strahlen aussendet, welche dann nach P „reflektiert“ werden. Natürlich kann man nur einen dieser Wege tatsächlich beobachten. Zeichnen wir Strahlen, die von S  , dem Bild von S, ausgehen, so hat sich keiner der Abstände geändert (SAP = S  AP, SBP = S  BP usw.). Der kürzeste dieser Wege ist aber offensichtlich die Strecke S  BP , die θi = θr entspricht. Durch eine ähnliche Argumentation (Aufgabe 4.35) lässt sich zeigen, dass die Punkte S, B und P alle in der bereits definierten Einfallsebene liegen müssen. Herons interessante Beobachtung wurde über 1500 Jahre lang nicht weiter beachtet, bis Fermat 1657 sein berühmtes Prinzip der kürzesten Zeit darlegte, das sowohl die Reflexion als auch die Brechung umfasst. Ein Lichtstrahl, der auf dem Weg zwischen zwei Punkten die Grenzfläche zwischen einem Eintrittsmedium und einem brechenden Medium durchquert, nimmt demnach nicht den geraden (räumlich kürzesten) Weg. Fermat formulierte Herons Aussage wie folgt neu: Ein Lichtstrahl nimmt stets denjenigen Weg zwischen zwei Punkten, den er in der kürzestmöglichen Zeit durchlaufen kann. Wie wir noch feststellen werden, ist auch diese Formulierung unvollständig, ja sogar fehlerhaft. Im Moment wollen wir uns aber damit begnügen. Wenden wir uns Abbildung 4.36 zu, um ein Beispiel für die Anwendung des fermatschen Prinzips auf die Brechung zu besprechen. Wir minimieren die Zeit, die der Strahl benötigt, um von S nach P zu gelangen, bezüglich der Variablen x. Mit anderen Worten: Eine Änderung von x bewegt den Punkt O. Die kleinstmögliche Durchlaufzeit entspricht dann voraussichtlich dem tatsächlichen Weg. Es ist t= oder

SO OP + vi vt √

t=

 h2 + x2 + vi

b2 + (a − x)2 vt

.

4.5 Das fermatsche Prinzip

223

S

S P

h θi

ni

O

nt

x A

θi θr B

θt C reflektierende Fläche

b

a S Abb. 4.35: Der kürzeste Weg von der Quelle S zum Auge des Beobachters in P .

a x

P

Abb. 4.36: Die Anwendung des fermatschen Prinzips auf die Brechung.

Zur Minimierung von t (x) bezüglich x müssen wir dt/dx = 0 setzen, also x − (a − x) dt = √ +  = 0. dx vi h2 + x2 v b2 + (a − x)2 t Mithilfe der Abbildung können wir dies umschreiben zu sin θt sin θi = , vi vt was genau dem snelliusschen Gesetz, Gleichung (4.4), entspricht. Ein Lichtstrahl, der in der kürzesten Zeit von S nach P gelangt, erfüllt gleichzeitig das Brechungsgesetz. Stellen wir uns nun ein Material aus m Schichten mit unterschiedlichen Brechungsindizes vor (Abb. 4.37). Die von S bis P benötigte Zeit ist dann m   sm  si s1 s2 + + ··· + = t= v1 v2 vm vi i=1

Dabei ist si die Weglänge und vi die Geschwindigkeit der i-ten Schicht. Es gilt dann 1 ni si , t= c m

(4.9)

i=1

wobei die Summe als optische Weglänge (OWL) bezeichnet wird, im Gegensatz zur  s gegeben ist. Im Falle eines inhomogenen räumlichen Weglänge, die durch m i i=1

4 Die Ausbreitung des Lichts

224

S n1

S1

n2

S2

n3

S3

ni

Si

nm−i

Sm−i

ion scheinbare Posit

nm

Sm P

Erde

Abb. 4.37: Ein Lichtstrahl, der durch ein aus Schichten aufgebautes Material fällt.

Strahle n von der So nne gerade r Weg zur So nne

Abb. 4.38: Ablenkung von Strahlen in inhomogenen Medien: Die Sonne scheint höher am Himmel zu stehen, weil die Strahlen beim Durchgang durch die Atmosphäre abgelenkt werden.

Mediums, wo n eine Funktion des Ortes ist, muss man anstelle der Summe natürlich ein Integral schreiben: ˆ P n (s) ds . (4.10) OWL = S

Die optische Weglänge entspricht der im Vakuum zurückgelegten Strecke, die gleich der im Medium mit dem Brechungsindex n zurückgelegten Strecke s ist. Anders ausgedrückt: Beide Strecken entsprechen derselben Anzahl von Wellenlängen, OWL/λ0 = s/λ, und derselben Phasenänderung während der Ausbreitung des Lichts. Wegen t = (OWL) /c können wir das fermatsche Prinzip auch anders formulieren: Zwischen zwei Punkten S und P nimmt Licht stets den Weg mit der geringsten optischen Weglänge. Fermatsches Prinzip und Fata Morganen Lichtstrahlen, die von der Sonne durch die inhomogene Erdatmosphäre fallen, krümmen sich stets so, dass die unteren, dichteren Schichten so schnell wie möglich durchlaufen werden, um die optische Weglänge zu minimieren (Abb. 4.38). Daher kann man die Sonne noch sehen, wenn sie in Wirklichkeit bereits hinter dem Horizont verschwunden ist. Aus einem ähnlichen Grund scheint eine Straße, die man aus einem flachen Winkel betrachtet, die Umgebung zu reflektieren, als ob sie mit Wasser bedeckt wäre (Abb. 4.39). Nahe der Oberfläche der Straße ist die Luft wärmer und daher weniger dicht als in

4.5 Das fermatsche Prinzip

225 kühle Luft

(a)

heiße Luft scheinbar reflektierende Oberfläche (b)

Abb. 4.39: (a) Bei sehr kleinen Winkeln scheinen die Strahlen von unterhalb der Straße zu kommen wie bei der Spiegelung in einer Pfütze. (b) Foto dieses „Pfützeneffekts“. (Foto mit frdl. Genehmigung von Matt Malloy und Dan McIsaac, NAU Physics & Astronomy.)

größerer Entfernung. Gladstone und Dale fanden experimentell, dass für ein Gas mit der Dichte ρ gilt (n − 1) ∝ ρ . Aus der Zustandsgleichung des idealen Gases folgt dann wegen p ∝ P/T bei konstantem Druck (n − 1) ∝ 1/T : Je heißer die Straße ist, desto geringer ist der Brechungsindex der unmittelbar über ihr befindlichen Luftschicht. Gemäß dem fermatschen Prinzip verläuft ein Strahl, der in Abbildung 4.39 a von einem Zweig aus leicht nach unten gerichtet ist, so, dass die OWL minimal wird. Ein solcher Strahl biegt sich nach oben und durchläuft deshalb eine längere Strecke in der weniger dichten Luft, als es bei geradem Verlauf der Fall gewesen wäre. Um diesen Effekt richtig zu verstehen, zerlegen wir die Luft gedanklich in unendlich viele infinitesimale waagerechte Schichten mit jeweils konstantem n. Beim Durchlaufen dieser Schichten knickt ein Strahl (entsprechend dem snelliusschen Gesetz) an jeder Grenzfläche ein wenig nach oben ab (ähnlich Abb. 4.36 – stellen Sie das Bild auf den Kopf und lassen Sie die Strahlen rückwärts verlaufen). Trifft ein Strahl nahezu senkrecht auf die Schichtenanordnung, so ist natürlich der Einfallswinkel auf jede Grenzfläche klein; der Strahl knickt nur unmerklich ab und trifft bald auf den Boden, wo man ihn nicht mehr wahrnimmt. Ein Lichtstrahl hingegen, der flach genug einfällt, könnte schließlich streifend auf eine der Grenzflächen treffen – er würde dann vollständig reflektiert und sich beim Durchlaufen der zunehmend dichteren Luftschichten allmählich wieder nach oben

4 Die Ausbreitung des Lichts

226 a) warm

kalt

b) kalt

warm

Abb. 4.40: Der „Pfützeneffekt“ lässt sich auch im Wellenbild erklären: Die Geschwindigkeit und folglich auch die Wellenlänge nimmt im weniger dichten Medium zu. Daher knicken die Wellenfronten und die Strahlen ab. Den gleichen Effekt beobachtet man bei Schallwellen: (a) Ist die bodennahe Luft kalt, so hört man Geräusche über größere Entfernungen als gewöhnlich; (b) ist die bodennahe Luft warm, so scheint sie den Schall zu verschlucken.

biegen (stellen Sie wieder Abb. 4.36 auf den Kopf, aber lassen Sie die Strahlen vorwärts verlaufen). Ein Beobachter, links außerhalb von Abbildung 4.39 positioniert, verlängert die eintreffenden Strahlen in Gedanken nach hinten: Sie scheinen von einer reflektierenden Oberfläche auszugehen. In Abhängigkeit vom genauen Standort sieht man verschiedene „Pfützen“, stets erscheinen diese aber weit entfernt und verschwinden, wenn man sich ihnen nähert. Besonders einfach ist dies auf langen Asphaltstraßen zu beobachten. Die einzige Bedingung ist, dass Sie in nahezu streifendem Einfall auf die Straße blicken, weil die Strahlen nur ganz allmählich abknicken.8 Einen ganz ähnlichen Effekt beobachtet man bei Schallwellen. Abbildung 4.40 erklärt die Zusammenhänge im Wellenbild: Die Temperaturänderung bewirkt eine Änderung der Wellengeschwindigkeit und folglich der Wellenlänge, und die Wellenfronten knicken ab. (Die Schallgeschwindigkeit ist proportional zur Quadratwurzel der Temperatur.) Ein von der Mittagssonne erhitzter Strand scheint schallschluckend zu wirken und kann Ihnen seltsam still vorkommen; abends kühlt sich der Sand vor den höheren Luftschichten ab und Geräusche sind nun weithin zu hören. Moderne Formulierung des fermatschen Prinzips Die ursprüngliche Formulierung des fermatschen Prinzips des kürzesten Zeit weist einige ernsthafte Fehler auf und muss korrigiert werden. Dazu erinnern wir uns, dass wir dasjenige x bestimmen können, für das eine gegebene Funktion f (x) einen 8

Siehe zum Beispiel T. Kosa und P. Palffy-Muhoray, „Mirage mirror on the wall“, Am. J. Phys. 68 (12) 1120 (2000).

4.5 Das fermatsche Prinzip

227

stationären Punkt hat, indem wir df /dx = 0 setzen und diese Gleichung nach x auflösen. Als stationär bezeichnen wir einen Punkt, in dem die Steigung des Graphen der Funktion f (x) gleich null ist. Das trifft für Maxima, Minima oder Wendepunkte mit waagerechter Tangente zu.

OW L

Die moderne Formulierung des fermatschen Prinzips lautet: Zwischen zwei Punkten S und P durchläuft ein Lichtstrahl stets eine optische Weglänge, die bezüglich der Variationen dieses Weges stationär ist. Daraus folgt, dass der Graph von OWL als Funktion von x in der Umgebung eines stationären Punktes etwas abgeflacht ist. Der stationäre Punkt entspricht dem tatsächlich durchlaufenen Weg; in erster Näherung ist die optische Weglänge von Pfaden, die in unmittelbarer Nachbarschaft des tatsächlichen Weges liegen, gleich deren OWL.9 In Situationen, wo die OWL minimal wird (etwa bei der in Abb. 4.36 gezeigten Brechung), sieht der Graph der OWL ungefähr so aus wie in Abbildung 4.41. Eine geringe Änderung von x in der Nähe von O beeinflusst die OWL nur wenig, wesentlich mehr Einfluss hat eine ähnlich große Änderung weit von O entfernt. Direkt neben dem Weg mit der kürzesten OWL gibt es also Wege, deren OWL fast ebenso kurz sind – eine Tatsache, die dazu beiträgt, dass sich Lichtstrahlen so „geschickt“ krümmen und biegen können.

O

x

Abb. 4.41: Die Position des Punktes O in Abb. 4.36 entspricht einer minimalen optischen Weglänge.

Wir betrachten einen Lichtstrahl, der sich in einem homogenen isotropen Medium von Punkt S nach Punkt P fortpflanzt (Abb. 4.42). Die Atome innerhalb des Materials, die durch die einfallende Störung angeregt werden, beginnen in alle Richtungen zu strahlen. Verschiedene Elementarwellen, die sich auf Wegen in unmittelbarer Nähe eines stationären Pfades ausbreiten, erreichen P mit nur geringfügig verschiedenen optischen Weglängen; daher kommen sie nahezu phasengleich in P an und verstärken einander. Stellen Sie sich jede Elementarwelle als winzigen Zeiger vor, der eine vollständige Umdrehung ausführt, während die Welle entlang eines beliebigen Strahls um eine Wellenlänge fortschreitet. Da alle Werte der OWL ungefähr gleich sind, weisen die Zeiger in P alle in ungefähr die gleiche Richtung; obwohl sie klein sind, summieren sie sich zum vorherrschenden Beitrag. Elementarwellen, deren Weg weiter vom stationären Pfad entfernt ist (Gruppe II in Abb. 4.42 b), erreichen P beträchtlich außer Phase und löschen einander daher tendenziell aus. Mit anderen Worten: Die Winkel zwischen den winzigen Zeigern sind 9

Die erste Ableitung der optischen Weglänge verschwindet in deren Taylorentwicklung, weil der Weg stationär ist.

4 Die Ausbreitung des Lichts

228

P

S

(a)

(b)

Gruppe II

S

Gruppe I

P

Abb. 4.42: (a) Das Licht könnte jeden beliebigen Weg zwischen S und P nehmen; der tatsächlich gewählte Weg entspricht aber offenbar einer stationären OWL. Auf allen anderen Wegen löschen die Wellen einander aus. (b) Wenn sich beispielsweise auf jedem der drei oberen Wege eine kleine Lichtmenge ausbreitet, so erreichen die Wellen P mit drei verschiedenen Phasen und interferieren mehr oder weniger destruktiv.

groß; ordnet man die Zeiger Spitze-zu-Ende an, entsteht eine Art Spirale, und der Nettobeitrag bleibt klein. Das Argument wird überzeugender, wenn wir bedenken, dass es in jeder Gruppe Millionen von Wegen gibt und nicht nur die jeweils drei eingezeichneten. Die Energie wird also effektiv auf demjenigen Weg zwischen S und P transportiert, der das fermatsche Prinzip erfüllt. Dies gilt unabhängig davon, ob wir es mit interferierenden elektromagnetischen Wellen oder mit Wahrscheinlichkeitsamplituden von Photonen zu tun haben. Wir können erwarten, dass unsere Argumente für alle Ausbreitungsprozesse gelten10 , zum Beispiel für die Reflexion an einem ebenen Spiegel (Abb. 4.35). Von S ausgehende Kugelwellen überstreichen dort den ganzen Spiegel und trotzdem sieht ein Beobachter in P eine klar begrenzte Punktquelle anstelle eines großen Lichtflecks, der sich über den gesamten Spiegel erstreckt. Nur für Strahlen mit θi ≈ θr (wie Gruppe I in Abb. 4.43) ist die OWL stationär; die zugehörigen Elementarwellen treffen nahezu phasengleich in P ein und verstärken einander. Alle anderen Strahlen (etwa Gruppe II in Abb. 4.43) leisten vernachlässigbare Beiträge zu der bei P ankommenden Energie. Stationäre Wege Um uns vor Augen zu führen, dass die optische Weglänge eines Strahls nicht unbedingt ein Minimum sein muss, betrachten wir Abbildung 4.44. Sie zeigt ein Segment eines dreidimensionalen ellipsoidförmigen Hohlspiegels. Befinden sich die Quelle S und der Beobachter P in den Brennpunkten des Ellipsoids, dann ist die Länge der Strecke SQP definitionsgemäß konstant, unabhängig von der genauen Lage von Q auf dem Ellipsoid. Außerdem gilt aufgrund der geometrischen Eigenschaften der Ellipse θi ≈ θr für jede Position von Q. Alle optischen Wege, die von S über eine Reflexion 10

Bei der Behandlung der QED in diesem Kapitel und der fresnelschen Zonenplatte in Kapitel 10 kommen wir auf die hier angesprochenen Zusammenhänge zurück.

4.5 Das fermatsche Prinzip

229

S

(a)

P Gruppe I

Gruppe II 1 23

123

(b) 3 1 2

Gruppe I

3 2

P Gruppe II

1

2

1 P 3

3

2 1

Abb. 4.43: An einem ebenen Spiegel reflektierte Strahlen. Nur die Strahlen aus Gruppe I – mit stationärer OWL – gehören zu Wellen, die ungefähr phasengleich in P eintreffen. Die zugehörigen Zeiger addieren sich zu einer nahezu geraden Linie, wodurch eine resultierende Welle mit merklicher Amplitude entsteht (vom Ende von 1 zur Spitze von 3). Die Zeiger für Gruppe II haben große Unterschiede im Phasenwinkel, sie addieren sich zu einer Art Spirale mit sehr kleiner resultierender Amplitude (wieder vom Ende von 1 zur Spitze von 3). Eigentlich müssten wir anstelle der drei relativ langen Zeiger in jeder Gruppe natürlich Millionen winzigster Zeiger zeichnen.

nach P verlaufen, sind daher exakt gleich – ein Minimum gibt es nicht und die optische Weglänge ist eindeutig stationär bezüglich Variationen. Strahlen, die von S ausgehend auf den Spiegel treffen, kommen im Brennpunkt P an. Anders ausgedrückt wird die von S emittierte Strahlungsenergie von den Elektronen an der Oberfläche des Spiegels in einer Weise gestreut, dass nur in P eine Verstärkung der Elementarwellen auftritt; bis zu P haben alle Elementarwellen dieselbe Strecke zurückgelegt, und sie sind dort alle phasengleich. Genau derselbe Weg SQP wäre ein relatives Minimum, wenn man in Q eine spiegelnde Tangente an die Ellipse legte. Dies wurde im Zusammenhang mit Abbildung 4.35 gezeigt. Das andere Extrem liegt vor, wenn die verspiegelte Fläche sich zu einer Kurve innerhalb der Ellipse krümmt, siehe die gestrichelte Linie in Abbildung 4.44 c. Der gleiche Strahl SQP würde dann ein relatives Maximum der OWL abfahren. Um dies zu sehen, betrachten wir Abbildung 4.44 c, wo es für jeden Punkt B einen entsprechenden Punkt C gibt. Wir wissen, dass SQ + P Q = SB + P B , da Q und B beide auf der Ellipse liegen. Aber es gilt SB > SC und P B > P C und daher SQ + P Q > SC + P C . Dies gilt für alle C, außer bei Q. Folglich ist SQ + P Q ein Maximum für die Kurve innerhalb der Ellipse. Dies ist richtig, obwohl andere ungenutzte Wege (mit θi = θr ) kürzer sind (abgesehen von unzulässig gekrümmten Wegen). In allen Fällen bewegen sich die Strahlen also in Übereinstimmung mit dem neu formulierten fermatschen Prinzip längs einer stationären OWL. Beachten Sie, dass das Prinzip nur etwas über den Pfad selbst aussagt, nicht aber über die Richtung. Ein Strahl nimmt von S nach P denselben Weg wie von P nach S; dies ist das sehr nützliche Umkehrungsprinzip.

4 Die Ausbreitung des Lichts

230

S P

(a) Q

S

i

r

P

(b) Q

B C

S

O

(c)

P

Abb. 4.44: Reflexion an einem Ellipsoid. Man beobachte die Reflexion von Wellen an den Rändern einer mit Wasser gefüllten Bratpfanne; es ist aufschlussreich, ein bisschen damit zu spielen, obwohl Bratpfannen in der Regel rund sind. (Foto mit frdl. Genehmigung von PSSC College Physics, D. C. Heath & Co., 1968.)

Fermats Leistungen regten viele Forscher zu dem Versuch an, die newtonschen Gesetze der Mechanik durch ähnliche Variationsformulierungen zu ersetzen. Arbeiten vieler Männer wie Pierre de Maupertuis (1698–1759) und Leonhard Euler ebneten schließlich den Weg zur Mechanik des Joseph Louis Lagrange (1736–1813) und damit zum Prinzip der kleinsten Wirkung, das von William Rowan Hamilton (1805–1865) formuliert wurde. Die augenfällige Ähnlichkeit zwischen dem fermatschen und dem hamiltonschen Prinzip spielte eine wichtige Rolle bei der Entwicklung der Quantenmechanik durch Schrödinger. 1942 zeigte Richard Phillips Feynman (1918–1988), dass man die Quantenmechanik auch alternativ mithilfe eines Variationsansatzes entwickeln kann. Die fortschreitende Evolution der Variationsprinzipien bringt uns über den modernen Formalismus der Quantenoptik zurück zum Gegenstand unserer Betrachtungen. Das fermatsche Prinzip ist weniger ein Rechenverfahren als eine allgemeine Auffassung von der Ausbreitung des Lichts. Es gibt einen Einblick in die tieferen Zusammenhänge der Dinge, ohne sich mit detaillierten Mechanismen zu beschäftigen, und ist daher auf eine Vielzahl von Situationen anwendbar.

4.6 Der elektromagnetische Ansatz

4.6

231

Der elektromagnetische Ansatz

Bis jetzt haben wir Reflexion und Brechung aus der Sicht der Theorie der Streuung, des Theorems von Malus und Dupin sowie des fermatschen Prinzips betrachtet. Die Theorie des Elektromagnetismus bietet einen anderen, sogar noch leistungsfähigeren Ansatz: Sie diskutiert auch die Flussdichten des einfallenden, des reflektierten und des gebrochenen Strahls, wozu die bisher besprochenen Verfahren nicht in der Lage waren.

4.6.1 Wellen an einer Grenzfläche Wir betrachten eine ebene, monochromatische einfallende Welle der Form Ei = E0i exp [i (ki · r − ωi t)]

(4.11)

oder, einfacher, Ei = E0i cos (ki · r − ωi t) ,

(4.12)

wobei die Flächen konstanter Phase diejenigen sind, für die k · r = konst. gilt. E0i soll zeitlich konstant sein, das heißt, die Welle ist linear polarisiert. Dies bedeutet keine Beschränkung der Allgemeinheit, denn jede Form des Lichts lässt sich durch zwei orthogonale, linear polarisierte Wellen darstellen, wie wir in Kapitel 8 noch besprechen werden. Sowohl der zeitliche Nullpunkt (t = 0) als auch der räumliche Nullpunkt O (r = 0) sind willkürlich gewählt. Ohne weitere Annahmen bezüglich der Richtungen, Frequenzen, Wellenlängen, Phasen und Amplituden können wir die reflektierte und die gebrochene Welle daher wie folgt aufschreiben: Er = E0r cos (kr · r − ωr t + εr )

(4.13)

Et = E0t cos (kt · r − ωt t + εt ) .

(4.14)

und Die so genannten Phasenkonstanten εr und εt müssen wir einführen, da der Anfangsort unbestimmt ist. In Abbildung 4.45 befinden sich die Wellen in unmittelbarer Umgebung einer ebenen Grenzfläche zwischen zwei verlustfreien Dielektrika mit den Brechungsindizes ni und nt . Die Gesetze des Elektromagnetismus (Abschn. 3.1) stellen bestimmte Forderungen an die Felder, die auch als Randbedingungen bezeichnet werden. Insbesondere muss die zur Grenzfläche tangentiale Komponente von E stetig durch diese Fläche verlaufen. Um zu verstehen, warum das so ist, betrachten wir Abbildung 4.46, in der die Grenzfläche zwischen den beiden Dielektrika gezeigt ist. Eine elektromagnetische Welle trifft von oben auf die Grenzfläche, und die Pfeile repräsentieren das einfallende und das durchgelassene E-Feld sowie die entsprechenden B-Felder. Zunächst wollen wir uns auf die E-Felder konzentrieren. Wir zeichnen einen kleinen geschlossenen Weg C (gestrichelte Linie), der in jedem der beiden Medien parallel zur Grenzfläche verläuft. Das faradaysche Induktionsgesetz [Gl. (3.5)] besagt, dass das Aufsummieren (über ein

4 Die Ausbreitung des Lichts

232

kr

ki

y

θi θr

ni θt

nt b

ˆn u

r

O z

x

e äch nzfl e r G

kt Einf allse bene

Abb. 4.45: Ebene Wellen, die auf eine Grenzfläche zwischen zwei homogenen, isotropen, verlustfreien dielektrischen Medien fallen.

Linienintegral) der parallel zum Wegelement d liegenden Komponenten von E, jede mal d, zu einem Ergebnis (einer Spannungsdifferenz) führt, das gleich der zeitlichen Änderungsrate des magnetischen Flusses durch die von C begrenzte Fläche ist. Wenn wir aber die gestrichelte Schleife sehr eng zusammenziehen, wird es keinen Fluss durch C geben, und der Beitrag zum Linienintegral entlang der oberen Linie (rechts entlang) muss den Beitrag entlang der unteren Linie (links entlang) gerade aufheben. Auf diese Weise wird die Netto-Spannungsdifferenz entlang C null. Wenn die tangentialen Komponenten von Ei und Et in der unmittelbaren Umgebung der Grenzfläche gleich sind (also beide nach rechts zeigen), geht das Integral über C tatsächlich gegen null, weil die Wegstücke über und unter der Grenzfläche entgegengesetzte Richtungen haben. Mit anderen Worten, die zur Grenzfläche tangentiale Komponente von E muss auf beiden Seiten der Fläche gleich sein.

Abb. 4.46: Randbedingungen an der Grenzfläche zwischen zwei Dielektrika.

Da u ˆn der Einheitsvektor längs der Flächennormale ist, ist das Kreuzprodukt des elektrischen Feldes mit u ˆn , unabhängig von der Richtung des elektrischen Feldes in der Wellenfront, senkrecht zu u ˆn und tangential zur Grenzfläche. Folglich ist ˆ n × Er = u ˆ n × Et u ˆ n × Ei + u

(4.15)

ˆn × E0r cos (kr · r − ωr t + εr ) u ˆ n × E0i cos (ki · r − ωi t) + u =u ˆ n × E0t cos (kt · r − ωt t + εt ) .

(4.16)

oder

4.6 Der elektromagnetische Ansatz

233

Diese Beziehung muss zu jedem Zeitpunkt und in jedem Punkt der Grenzfläche (y = b) gelten. Folglich müssen Ei , Er und Et in genau derselben Weise von den Variablen r und t abhängen, also (ki · r − ωi t) |y=b = (kr · r − ωr t + εr ) |y=b = (kt · r − ωt t + εt ) |y=b .

(4.17)

Unter dieser Voraussetzung heben die Kosinusterme in Gleichung (4.16) einander auf, und der verbleibende Ausdruck hängt nicht von t und r ab, wie es tatsächlich sein muss. Da dies für beliebige Zeitpunkte gelten muss, müssen die Koeffizienten von t gleich sein: ωi = ωr = ωt .

(4.18)

Wir erinnern uns, dass die Elektronen innerhalb des Mediums (lineare) erzwungene Schwingungen mit der Frequenz der einfallenden Welle ausführen. Jegliches Streulicht hat ebenfalls dieselbe Frequenz. Weiterhin gilt (ki · r) |y=b = (kr · r + εr ) |y=b = (kt · r + εt ) |y=b ,

(4.19)

worin r an der Grenzfläche endet. Die Werte von εr und εt gehören jeweils zu einer bestimmten Position von O, wodurch die Beziehung vom Ort unabhängig wird. (Man könnte den Ursprung beispielsweise so wählen, dass r senkrecht zu ki , nicht aber zu kr oder kt ist.) Aus den beiden ersten Termen ergibt sich [(ki − kr ) · r]y=b = εr .

(4.20)

Mithilfe von Gleichung (2.43) erkennt man sofort, dass diese Beziehung lediglich aussagt, dass der Endpunkt von r eine Fläche senkrecht zum Vektor (ki − kr ) überstreicht (dies ist natürlich die Grenzfläche). Etwas anders ausgedrückt, ist (ki − kr ) parallel zu u ˆ n . Weil sich die einfallende und die reflektierte Welle im selben Medium ausbreiten, ist ki = kr . Aus der Tatsache, dass (ki − kr ) keine Komponente in der Ebene der Grenzfläche hat, also u ˆ n × (ki − kr ) = 0 ist, schließen wir ki sin θi = kr sin θr . Dies ist genau das Brechungsgesetz θi = θr . ˆn ist, liegen die drei Vektoren ki , kr und u ˆn alle Da außerdem (ki − kr ) parallel zu u in derselben Ebene, nämlich der Einfallsebene. Aus Gleichung (4.19) folgt wiederum [(ki − kt ) · r]y=b = εt ;

(4.21)

ˆn sind daher steht auch (ki − kt ) senkrecht auf der Grenzfläche, und ki , kr , kt und u sämtlich koplanar. Wie oben müssen die tangentialen Komponenten von ki und kt gleich sein, woraus folgt ki sin θi = kt sin θt .

(4.22)

4 Die Ausbreitung des Lichts

234

Wegen ωi = ωt können wir nun beide Seiten mit c/ωi multiplizieren und erhalten ni sin θi = nt sin θt . Dies ist genau das snelliussche Gesetz. Hätten wir schließlich den Ursprung O in die Grenzfläche gelegt, so wären, wie man aus den Gleichungen (4.20) und (4.21) sieht, εr und εt gleich null. Diese Situation ist zwar nicht so anschaulich, aber einfacher zu behandeln, weswegen wir uns von jetzt an darauf beziehen wollen.

4.6.2 Die fresnelschen Gleichungen Wir wissen nun, welche Beziehung zwischen Ei (r, t), Er (r, t) und Et (r, t) an der Grenzfläche besteht. Nun wollen wir uns dem Zusammenhang zwischen den Amplituden E0i , E0r und E0t zuwenden. Dazu nehmen wir an, dass eine ebene, monochromatische Welle auf die ebene Grenzfläche zwischen zwei isotropen Medien fällt. Unabhängig von der Polarisation der Welle zerlegen wir deren E- und BFeld in Komponenten parallel und senkrecht zur Einfallsebene und behandeln diese Komponenten getrennt voneinander. Fall 1: E steht senkrecht auf der Einfallsebene. Es stehe E senkrecht auf der Einfallsebene, und B sei parallel zu Einfallsebene (Abb. 4.47). Unter Berücksichtigung von E = vB ist ˆ × E = vB k

(4.23)

ˆ · E = 0. k

(4.24)

und ˆ bilden ein rechts(Das bedeutet, E, B und der Einheitsvektor der Ausbreitung, k, händiges Koordinatensystem.) Wir nutzen wieder die Stetigkeit der tangentialen Komponenten des E-Feldes; dann ist an der Grenze zu jeder Zeit und an jedem Ort E0i + E0r = E0t ,

(4.25)

wobei sich die Kosinusterme gegenseitig aufheben. Die Feldvektoren haben wir uns eigentlich bei y = 0 vorzustellen – sie wurden lediglich um der Klarheit der Abbildung willen etwas von der Grenzfläche entfernt eingezeichnet. Er und Et müssen aus Symmetriegründen senkrecht auf der Einfallsebene stehen; wir vermuten dann, dass sie an der Grenzfläche nach außen zeigen, wenn Ei nach außen zeigt. Die Richtungen des B-Feldes gehen aus Gleichung (4.23) hervor. Um eine weitere Gleichung zu erhalten, machen wir uns noch eine zweite Randbedingung zunutze. Substanzen, die durch die Welle elektrisch polarisiert werden, beeinflussen die Eigenschaften des Feldes. Während die tangentiale Komponente von E durch die Grenzfläche hindurch stetig ist, trifft dies auf die senkrechte Komponente nicht zu – stattdessen ist die senkrechte Komponente des Produktes E auf beiden

4.6 Der elektromagnetische Ansatz

235

θi

ki

z

Br

Er

x

Gr

en

z fl

θt Bt

kr

θr

he

Bi

äc

E

i

y

kt

Et

(a) Er

Ei Bi Grenzfläche

ki

θi

θr

uˆ n θ t

kr Br

ni nt

x

Et

Bt

kt (b)

Bi

ki

θi

θi

θi Bi cosθi

(c)

Abb. 4.47: Das E-Feld der einlaufenden Welle ist normal zur Einfallsebene. Eingezeichnet sind die Felder an der Grenzfläche; sie wurden etwas verschoben, damit auch die Vektoren Platz haben.

Seiten der Grenzfläche gleich. In ähnlicher Weise gilt: Die senkrechte Komponente von B ist ebenso stetig wie die tangentiale Komponente von μ−1 B. Um das zu illustrieren, betrachten wir noch einmal Abbildung 4.46 und beachten das ampèrsche Gesetz [Gl. (3.13)], wobei diesmal die Pfeile für die B-Felder stehen sollen. Da die Permeabilität für die beiden Medien unterschiedlich sein kann, teilen wir beide Seiten der Gleichung durch μ. Wenn wir die gestrichelte Linie verschwindend klein werden lassen, geht die von C umschlossene Fläche A gegen null und die rechte Seite von Gleichung (3.13) verschwindet. Das bedeutet, dass wir beim Aufsummieren (in Form eines Linienintegrals) der parallel zu den Wegelementen d liegenden Komponenten von B/μ – jeweils mal d – über den gesamten Weg C das Ergebnis null erhalten müs-

4 Die Ausbreitung des Lichts

236

sen. Folglich muss der Nettowert von B/μ unmittelbar über der Grenzfläche gleich dem Nettowert unmittelbar unter der Grenzfläche sein. Die magnetischen Eigenschaften der beiden Medien erscheinen hier in Form von deren Permeabilitäten μi und μt . Diese Randbedingung ist in der Praxis einfach anzuwenden, insbesondere, wenn man die Reflexion an der Oberfläche eines elektrischen Leiters betrachtet.11 Die Stetigkeit der tangentialen Komponente von B/μ fordert nun, dass −

Br Bt Bi cos θi + cos θr = − cos θt . μi μr μt

(4.26)

Wenn die tangentiale Komponente des B-Feldes in die negative x-Richtung zeigt, wie dies für die einfallende Welle der Fall ist, dann geht sie mit einem Minuszeichen ein. Die linke und die rechte Seite von Gleichung (4.26) sind die Gesamtbeträge von B/μ parallel zur Grenzfläche im Eintrittsmedium bzw. im brechenden Medium. x wächst in positiver Richtung; die skalaren Komponenten von Bi und Bt erscheinen daher mit negativem Vorzeichen. Aus Gleichung (4.23) folgt Bi = Ei /vi , Br = Er /vr

(4.27) (4.28)

Bt = Et /vt .

(4.29)

und Wegen vi = vr und θi = θr kann man Gleichung (4.26) umschreiben zu 1 1 (Ei − Er ) cos θi = Et cos θt . μi vi μt vt

(4.30)

Unter Verwendung der Gleichungen (4.12), (4.13) und (4.14) und der bereits gezeigten Tatsache, dass die darin enthaltenen Kosinusterme bei y = 0 gleich sind, erhalten wir nt ni (E0i − E0r ) cos θi = E0t cos θt . (4.31) μi μt Gemeinsam mit Gleichung (4.25) ergibt sich dann   ni nt E0r μi cos θi − μt cos θt = ni nt E0i ⊥ μi cos θi + μt cos θt und

11



E0t E0i

 = ⊥

2 nμii cos θi ni μi

cos θi +

nt μt

cos θt

.

(4.32)

(4.33)

Da wir zunächst nur das E- und das B-Feld in die Diskussion einbeziehen wollen, haben wir die H enthaltenden Ausdrücke bisher vermieden. Es ist H = μ−1 B .

[A1.14]

4.6 Der elektromagnetische Ansatz

237

Der Index ⊥ soll daran erinnern, dass diese Beziehungen nur gelten, wenn E senkrecht auf der Einfallsebene steht. Die Beziehungen (4.32) und (4.33), die so genannten fresnelschen Gleichungen, gelten völlig allgemein für jedes lineare, isotrope und homogene Medium. In der Praxis hat man es meist mit Dielektrika zu tun, für die μi ≈ μt ≈ μ0 ist. Die häufigste Form der Gleichungen ist daher   E0r ni cos θi − nt cos θt = (4.34) r⊥ ≡ E0i ⊥ ni cos θi + nt cos θt bzw.   E0t 2ni cos θi = . (4.35) t⊥ ≡ E0i ⊥ ni cos θi + nt cos θt r⊥ ist der so genannte Amplituden-Reflexionskoeffizient, t⊥ ist der AmplitudenTransmissionskoeffizient. Fall 2: E ist parallel zur Einfallsebene. Zwei ähnliche Gleichungen lassen sich für den Fall herleiten, dass das ankommende E-Feld in der Einfallsebene liegt, wie es in Abbildung 4.48 gezeigt ist. Die Stetigkeit der tangentialen Komponenten von E zu beiden Seiten der Grenzfläche führt zu E0i cos θi − E0r cos θr = E0t cos θt .

(4.36)

Analog zur oben dargelegten Herleitung ergibt sich aus der Stetigkeit der tangentialen Komponenten von B/μ 1 1 1 E0i + E0r = E0t . μi vi μr vr μt vt

(4.37)

y

Ei θi

kr

θr Br

z

Et Bt

kt

äc he

ki

Gr en zfl

Bi

Er

x

Er

Ei

kr

Bi Grenzfläche

ki

Br

θi θr

ni nt x

ˆ n θt u

Et

Bt kt Abb. 4.48: Eine einfallende Welle, deren E-Feld in der Einfallsebene liegt.

4 Die Ausbreitung des Lichts

238

Unter Verwendung von μi = μr und θi = θr können wir diese Beziehungen zu zwei weiteren fresnelschen Gleichungen zusammenfügen,   ni nt E0r μt cos θi − μi cos θt = ni (4.38) r || ≡ nt E0i || μi cos θi + μt cos θt und

 t || ≡

E0t E0i

 = ||

2 nμii cos θi ni μi

cos θt +

nt μt

cos θi

.

(4.39)

Wenn die beiden Dielektrika, zwischen denen die betrachtete Grenzfläche liegt, im Wesentlichen „unmagnetisch“ (siehe Abschn. 3.5) sind, so werden die Amplitudenkoeffizienten zu r || =

nt cos θi − ni cos θt ni cos θt + nt cos θi

(4.40)

t || =

2ni cos θi . ni cos θt + nt cos θi

(4.41)

und

Eine weitere Vereinfachung erreichen wir unter Verwendung des snelliusschen Gesetzes. Die fresnelschen Gleichungen für dielektrische Medien lassen sich dann wie folgt aufschreiben (Aufgabe 4.43): r⊥ = −

sin (θi − θt ) , sin (θi + θt )

(4.42)

r || = +

tan (θi − θt ) , tan (θi + θt )

(4.43)

t⊥ = +

2 sin θt cos θi , sin (θi + θt )

(4.44)

t || = +

2 sin θt cos θi . sin (θi + θt ) cos (θi − θt )

(4.45)

Allerdings ist hier etwas Vorsicht geboten. Wir erinnern uns, dass die Richtungen (genauer gesagt, die Phasen) der Felder in den Abbildungen 4.47 und 4.48 zufällig gewählt wurden. Ebenso hätten wir annehmen können, dass beispielsweise Er in Abbildung 4.47 nach innen zeigt, wodurch sich auch die Richtung von Br umgekehrt hätte. Damit hätte sich für r⊥ ein positives Vorzeichen ergeben, alle anderen Amplitudenkoeffizienten hätten sich nicht geändert. Die Vorzeichen in den Gleichungen (4.42) bis (4.45) gehören zu einem bestimmten Satz gewählter Feldrichtungen. Wie wir noch sehen werden, bedeutet das Minuszeichen in Gleichung (4.42) lediglich, dass unsere Vermutung bezüglich Er in Abbildung 4.47 falsch war. Beachten Sie aber, dass die Literatur in dieser Hinsicht nicht einheitlich ist und dass Sätze von Beziehungen mit allen möglichen Variationen von Vorzeichen als fresnelsche Gleichungen bezeichnet

4.6 Der elektromagnetische Ansatz

239

werden. Um Verwirrung zu vermeiden, müssen stets die Richtungen der Felder angegeben werden, für welche die Gleichungen hergeleitet wurden. Beispiel 4.4 Eine elektromagnetische Welle hat eine Amplitude von 1,0 V/m und trifft unter einem Winkel von 30,0◦ mit der Flächennormale von Luft auf Glas (Brechungsindex 1,60). Das elektrische Feld der Welle ist senkrecht zur Einfallsebene. Bestimmen Sie die Amplitude der reflektierten Welle. Lösung Wegen (E0r )⊥ = r⊥ (E0i )⊥ = r⊥ (1 V/m) suchen wir nach r⊥ = −sin(θi − θt )/sin(θi + θt ) .

[4.42]

Dazu brauchen wir zuerst θt , wobei uns das snelliussche Brechungsgesetz hilft: ni sin θi = nt sin θt ni 1 sin 30,0◦ = 0,3125 sin θt = sin θi = nt 1,60 θt = 18,21◦ Damit erhalten wir r⊥ = −

sin 11,8◦ sin(30,0◦ − 18,2◦ ) 0,2045 = − = −0,274 =− sin(30,0◦ + 18,2◦ ) sin 48,2◦ 0,7455

und schließlich (E0r )⊥ = r⊥ (E0i )⊥ = r⊥ (1,0 V/m) = −0,27 V/m .

4.6.3 Interpretation der fresnelschen Gleichungen Welche physikalischen Konsequenzen sich aus den fresnelschen Gleichungen ergeben, wollen wir im folgenden Abschnitt untersuchen. Insbesondere werden wir bestimmen, welche Anteile der Amplituden und Flussdichten reflektiert bzw. gebrochen werden. Daneben interessieren wir uns auch für die Phasenverschiebungen, die im Zuge der betrachteten Prozesse auftreten können. Amplitudenkoeffizienten Zunächst wollen wir die Form der Amplitudenkoeffizienten im gesamten Bereich von θi herausfinden. Bei nahezu senkrechtem Einfall (θi ≈ 0) werden die Tangensterme in Gleichung (4.43) annähernd gleich den zugehörigen Werten der Sinusfunktion:  sin (θi − θt ) . [r || ]θi =0 = [−r⊥ ]θi =0 = sin (θi + θt ) θi =0

4 Die Ausbreitung des Lichts

240

Mit der physikalischen Bedeutung des negativen Vorzeichens beschäftigen wir uns später. Durch Umformung der Sinusterme und Anwendung des snelliusschen Gesetzes wird der Ausdruck zu  nt cos θi − ni cos θt , (4.46) [r || ]θi =0 = [−r⊥ ]θi =0 = nt cos θi + ni cos θt θi =0 was ebenso aus den Gleichungen (4.34) und (4.40) folgt. Wenn θi gegen null geht, gehen cos θi und cos θt gegen eins, und wir haben [r || ]θi =0 = [−r⊥ ]θi =0 =

nt − ni . nt + ni

(4.47)

Diese Gleichheit der Reflexionskoeffizienten kommt zustande, weil die Einfallsebene bei θt = 0 nicht mehr bestimmt ist. An einer Grenzfläche zwischen Luft (ni = 1) und Glas (nt = 1,5) beispielsweise sind die Amplituden-Reflexionskoeffizienten bei nahezu senkrechtem Einfall gleich ±0,2 (siehe Aufgabe 4.58). Für nt > ni folgt aus dem snelliusschen Gesetz θi > θt und r⊥ ist negativ für alle θi (Abb. 4.49). Im Gegensatz dazu ist r || gemäß Gleichung (4.43) bei θi = 0 zunächst positiv, wird allmählich kleiner und geht bei (θi + θt ) = 90◦ durch null, weil tan π/2 dort unendlich ist. Der zugehörige Wert des Einfallswinkels heißt Polarisationswinkel θp (siehe Abschn. 8.6.1). Zu beachten ist, dass r || → 0 bei θp ; genau dort wird die Phasenverschiebung 180◦ . Das bedeutet, dass das E-Feld nicht umklappt, egal, von welcher Seite θi sich θp nähert. Wächst θi über θp hinaus, so wird r || zunehmend negativ und erreicht bei 90◦ den Wert −1. Wenn Sie eine Glasscheibe (zum Beispiel einen Objektträger) auf diese Buchseite legen und senkrecht darauf schauen (θi = 0), so erscheint das unter dem Glas liegende Papier deutlich grauer als der Rest der Seite: Die Glasscheibe reflektiert an beiden Grenzflächen, sodass merklich weniger Licht auf das darunterliegende Papier fällt und, von diesem reflektiert, wieder Ihr Auge erreicht. Halten Sie den Objektträger nun direkt vor Ihre Augen und kippen Sie ihn langsam (d. h., vergrößern Sie θi ). Ein immer größerer Anteil des Lichts wird reflektiert, sodass Sie die Seite immer schwerer erkennen können. Bei θi ≈ 90◦ wirkt die Scheibe wie ein Spiegel, da sich Ungefärbtes Papier ist ein Vlies aus dünnen transparenten Fasern, deren Brechungsindex (ca. 1,56) deutlich von dem der umgebenden Luft abweicht. Deshalb streut Papier große Mengen von weißem Licht und erscheint in einem leuchtenden, undurchsichtigen Weiß [siehe Gl. (4.46)]. Wenn wir nun das Papier mit einer Substanz befeuchten, deren Brechungsindex zwischen dem der Luft und dem der Fasern liegt (z. B. Babyöl), sodass die Fasern mit dieser Substanz beschichtet sind, dann wird weniger Licht zurückgestreut, und die so behandelte Stelle wird durchsichtig.

4.6 Der elektromagnetische Ansatz

Ein Glasstab und ein Holzsstab sind in Benzol eingetaucht. Da die Brechungsindizes von Benzol und Glas fast gleich sind, scheint der linke Stab in der Flüssigkeit zu verschwinden. (Foto E. H.)

241

Bei nahezu streifendem Einfall wirken Wände und Boden wie Spiegel, ungeachtet dessen, dass sämtliche Flächen bei θi = 0◦ nur ziemlich schlecht reflektieren.

die Reflexionskoeffizienten −1 nähern (Abb. 4.49). Auch eine wesentlich weniger ebene Oberfläche, etwa der Einband dieses Buches (siehe auch das Foto oben rechts), verhält sich bei streifendem Einfall spiegelähnlich. Halten Sie das Buch waagerecht in Augenhöhe und verwenden Sie eine helle Lichtquelle: Sie werden sehen, dass der Einband die Quelle ziemlich gut reflektiert. Dies alles legt nahe, dass auch Röntgenstrahlung bei streifendem Einfall reflektiert werden kann wie an einem Spiegel – es ist tatsächlich so und man nutzt dieses Verhalten in modernen Röntgenteleskopen aus. Bei senkrechtem Einfall folgt aus den Gleichungen (4.35) und (4.41) unmittelbar [t || ]θi =0 = [t⊥ ]θi =0 =

2ni . nt + ni

(4.48)

In Aufgabe 4.63 wird gezeigt, dass der Ausdruck t⊥ + (−r⊥ ) = 1

(4.49)

für alle θi gilt, während t || + r || = 1

(4.50)

nur bei senkrechtem Einfall zutrifft. Bis jetzt haben wir unsere Diskussion im Wesentlichen auf die äußere Reflexion (das heißt nt > ni ) beschränkt. Aber auch die genau entgegengesetzte Situation, die

4 Die Ausbreitung des Lichts

242 1.0

1.0

0.5

Amplitudenkoeffizienten

Amplitudenkoeffizienten

t t⊥

r 0

θp r⊥

−0.5

−1.0 0

0.5 r⊥ 0

θp θc r

−0.5

56.3◦ 30

60

90

θi (Grad) Abb. 4.49: Die Amplitudenkoeffizienten von Reflexion und Transmission als Funktionen des Einfallswinkels bei äußerer Reflexion (nt > ni ) an einer Luft-Glas-Grenzfläche (nti = 32 ).

−1.0

33.7◦41.8◦ 0

30

60

90

θi (Grad) Abb. 4.50: Amplitudenkoeffizienten der Reflexion als Funktionen des Einfallswinkels bei innerer Reflexion (nt < ni ) an einer Luft-GlasGrenzfläche (nti = 23 ).

innere Reflexion, bei der das Einfallsmedium dichter ist (ni > nt ), ist interessant. In diesem Fall ist θt > θi und, wie aus Gleichung (4.42) folgt, r⊥ stets positiv. Abbildung 4.50 zeigt, dass r⊥ ausgehend von seinem Anfangswert [Gl. (4.47)] bei θi = 0 zunimmt und bei θc , dem so genannten Grenzwinkel, +1 wird. θc ist genau derjenige Einfallswinkel, für den θt = π/2 ist. Analog dazu ist r || bei θi = 0 zunächst negativ [Gl. (4.47)], nimmt dann zu und erreicht +1 bei θi = θc , wie aus der fresnelschen Gleichung (4.40) abzulesen ist. Auch r || läuft beim Polarisationswinkel θp durch null. In Aufgabe 4.68 sollen Sie zeigen, dass die Polarisationswinkel θp und θp der inneren bzw. äußeren Reflexion jeweils zusammengehörige Ergänzungswinkel sind. In Abschnitt 4.7 werden wir auf die innere Reflexion zurückkommen und nachweisen, dass r⊥ und r || für θi > θc komplexe Größen sind. Phasenverschiebungen Aus Gleichung (4.42) kann man ablesen, dass r⊥ bei nt > ni negativ ist, unabhängig von θi . Wie bereits angesprochen wurde, hätten wir jedoch in Abbildung 4.47 [Er ]⊥ auch in die entgegengesetzte Richtung zeigen lassen können, wodurch sich in der ersten fresnelschen Gleichung (4.42) die Vorzeichen geändert hätten und r⊥ positiv geworden wäre. Das Vorzeichen von r⊥ ist mit den relativen Richtungen von [E0i ]⊥ und [E0r ]⊥ verknüpft. Wir erinnern uns, dass eine Umkehrung von [E0r ]⊥ gleichbedeutend ist mit der Einführung einer Phasenverschiebung Δϕ⊥ von π rad in [Er ]⊥ . Folglich sind [Ei ]⊥ und [Er ]⊥ an der Grenze antiparallel, also um π rad außer Phase, wie der

4.6 Der elektromagnetische Ansatz

243

negative Wert von r⊥ andeutet. Betrachten wir Komponenten, die senkrecht auf der Einfallsebene stehen, dann ist sofort ersichtlich, ob sie phasengleich oder um 180◦ außer Phase sind: Sind sie parallel, gilt Ersteres, sind sie antiparallel, gilt Letzteres. Zusammenfassend lässt sich aussagen: Die Komponente des elektrischen Feldes, die senkrecht auf der Einfallsebene steht, wird bei der Reflexion um π rad phasenverschoben, wenn der Brechungsindex des Eintrittsmediums kleiner als der Brechungsindex des brechenden Mediums ist. t⊥ und t || sind immer positiv, und Δϕ = 0. Außerdem gilt: Wenn ni > nt ist, so tritt bei der Reflexion keine Phasenverschiebung der senkrechten Komponente auf, das heißt, für θi < θc ist Δϕ⊥ = 0. Für [Ei ] || , [Er ] || und [Et ] || ist die Situation komplizierter. Hier müssen wir den Begriff „phasengleich“ genauer definieren, weil die Feldvektoren koplanar, aber im Allgemeinen nicht kolinear sind. In den Abbildungen 4.47 und 4.48 wurden die Feldrichtungen folgendermaßen gewählt: Wenn man gegen einen Ausbreitungsvektor in der Richtung schaut, aus der das Licht kommt, so scheinen E, B und k gleich orientiert zu sein, unabhängig davon, ob es sich um einen einfallenden, gebrochenen oder reflektierten Strahl handelt. Dies können wir als notwendige Bedingung dafür verwenden, dass zwei E-Felder in Phase sind. Äquivalent, aber einfacher formuliert: Zwei Felder in der Einfallsebene sind phasengleich, wenn ihre y-Komponenten parallel sind, und außer Phase, wenn ihre y-Komponenten antiparallel sind. Dies gilt ebenso für die jeweils zugehörigen B-Felder (und umgekehrt). So müssen wir lediglich die Vektoren betrachten, die senkrecht zur Einfallsebene stehen – egal, ob es sich um E oder B handelt –, wenn wir die relative Phase der zugehörigen Felder in der Einfallsebene bestimmen wollen. In Abbildung 4.51 a sind dann Ei und Et sowie Bi und Bt phasengleich, Ei und Er sowie Bi und Br dagegen außer Phase. In Abbildung 4.51 b sind Ei , Er und Et sowie Bi , Br und Bt phasengleich. y

y

Bi Ei

Er ki

kr

Ei

kr

Bi

Br

ki

Br

Er

x

x

Et B t kt (a)

Bt

Et

kt (b)

Abb. 4.51: Feldorientierungen und Phasenverschiebungen.

Der Amplitudenkoeffizient der Reflexion für die parallele Komponente ist nun r || =

nt cos θi − ni cos θt . nt cos θi + ni cos θt

4 Die Ausbreitung des Lichts

244

Dieser Ausdruck nimmt einen positiven Wert an (Δϕ || = 0), wenn nt cos θi − ni cos θt > 0 ist, also sin θi cos θi − cos θt sin θt > 0 oder, anders formuliert, sin (θi − θt ) cos (θi + θt ) > 0

(4.51)

ist. Dies ist der Fall für ni < nt bei (θi + θt ) < π/2

(4.52)

und für ni > nt bei (θi + θt ) > π/2 .

(4.53)

Für ni < nt sind [E0r ] || und [E0i ] || also phasengleich (Δϕ || = 0) bis θi = θp , danach sind sie um π rad phasenverschoben. Der Übergang ist in Wirklichkeit nicht unstetig, da [E0r ] || bei θp gegen null geht. Im Gegensatz dazu ist bei der inneren Reflexion r || negativ bis θp , das bedeutet, Δϕ || = π. Von θp bis θc ist r || positiv und Δϕ || = 0. Über θc hinaus wird r || komplex, und Δϕ || steigt allmählich bis auf π (bei θi = 90◦ ) an. Abbildung 4.52, auf die wir immer wieder zurückkommen werden, fasst diese Resultate zusammen. Die genaue Gestalt von Δϕ || und Δϕ⊥ im Gebiet θi > θc kann der Literatur12 entnommen werden; für unsere Zwecke reichen die abgebildeten Skizzen aus. Abbildung 4.52 e zeigt die relative Phasenverschiebung zwischen der parallelen und der senkrechten Komponente, also Δϕ || − Δϕ⊥ , und wurde aufgenommen, weil wir sie später benötigen werden (etwa bei der Diskussion der Polarisationseffekte). Einige der wichtigsten Ergebnisse unserer Diskussion sind schließlich in den Abbildungen 4.53 und 4.54 dargestellt. Die Amplituden der reflektierten Vektoren stimmen mit denen in den Abbildungen 4.49 und 4.50 (für die Grenzfläche zwischen Luft und Glas) überein, die Phasenverschiebungen entsprechen denjenigen in Abbildung 4.52. Viele unserer Resultate lassen sich mit sehr einfachen experimentellen Anordnungen überprüfen. Man benötigt zwei Linearpolarisatoren, ein Stück Glas und eine kleine Lichtquelle, etwa eine Taschenlampe oder eine „lichtstarke“ Glühbirne. Wenn Sie einen Polarisator vor der Quelle aufstellen (in einem Winkel von 45◦ relativ zur Einfallsebene), dann können Sie die Geometrien in Abbildung 4.53 nachvollziehen: Ist beispielsweise θi = θp (Abb. 4.53 b, so gelangt kein Licht durch den zweiten Polarisator, wenn dessen Transmissionsachse zur Einfallsebene parallel ist. Bei nahezu streifendem Einfall verschwindet der reflektierte Strahl dagegen, wenn die Achsen der beiden Polarisatoren fast senkrecht aufeinander stehen. 12

M. Born, Optik, Berlin 1965.

4.6 Der elektromagnetische Ansatz

245

π [E0r ]⊥ Phasenverschiebung

Δϕ⊥

(a)

nt > ni nt /ni =1.5

0

30

60 θi (Grad)

90

[E0r ] Phasenverschiebung

π (b)

Δϕ nt > ni nt /ni =1.5

0

θp 60 θi (Grad)

30

90

π [E0r ] Phasenverschiebung

(c)

Δϕ

30 θp θc 60 θi (Grad)

0

Δϕ⊥

30 θc 60 θi (Grad)

0

ni > nt nt /ni =1/1.5

90

π

Relative Phasenverschiebung

(e)

90

π

[E0r ]⊥ Phasenverschiebung

(d)

ni > nt nt /ni =1/1.5

0

45◦

Δϕ − Δϕ⊥ θp θc

60 θi (Grad)

ni > nt nt /ni =1/1.5

90

Abb. 4.52: Phasenverschiebungen der parallelen und der senkrechten Komponente des elektrischen Feldes bei innerer und äußerer Reflexion.

4 Die Ausbreitung des Lichts

246

Ei

Ei

Ei⊥ ni

Ei

Ei

Ei

Ei⊥ ki

nt

Er θi Er Er⊥ θr

Ei

Ei⊥

kr

ki

θi

ki

Er⊥

θi

kr

θr

θr

Er⊥ Er

ni < nt θi < θp

(a)

ni < nt θi = θp

(b)

(c)

Er

kr

ni < nt θi > θp

Abb. 4.53: Das reflektierte E-Feld bei verschiedenen Winkeln bei äußerer Reflexion.

Ei

Ei

kr

Ei Ei⊥

Ei⊥ ni nt

Er⊥ Er ki θ i E θr r

(a)

Ei kr

ni

Er

θi Er θr Er⊥

nt

ni > nt θi < θp

(b)

ni > nt θp < θi < θc

Abb. 4.54: Das reflektierte E-Feld bei verschiedenen Winkeln bei innerer Reflexion.

Reflexion und Transmission Betrachten wir ein zylindrisches Strahlenbündel, das wie in Abbildung 4.55 gezeigt auf eine Oberfläche trifft. Die beleuchtete Fläche sei A. Wie wir bereits wissen, ist die Energie, die pro Flächeneinheit durch eine Oberfläche im Vakuum mit der Normalen parallel zum Poynting-Vektor S fällt, gegeben durch S = c2 0 E × B .

[3.40]

4.6 Der elektromagnetische Ansatz

A cos ui

247

A cos ur ui ur

ui ur ni

A

nt ⬎ ni

ni nt

A cos ut

(b)

(a)

Abb. 4.55: Reflexion und Brechung eines einfallenden Strahls.

Ferner ist die Strahlungsflussdichte, gemessen in W/m2 , oder Bestrahlungsstärke c0 2 E . [3.44] I = S T = 2 0 Dies ist die mittlere Energie, die eine Flächeneinheit senkrecht zu S pro Zeiteinheit durchquert (in isotropen Medien ist S parallel zu k). Für den in Abbildung 4.55 betrachteten Fall seien Ii , Ir und It die Flussdichten des einfallenden, des reflektierten und des gebrochenen Strahls. Die zugehörigen Strahlquerschnitte seien A cos θi , A cos θr bzw. A cos θt . Die einfallende Leistung ist dann gleich Ii A cos θi – dies ist die Energie, die pro Zeiteinheit von dem Strahl transportiert wird und daher die Leistung, die auf die Fläche A trifft. Analog ist Ir A cos θr die Leistung im reflektierten Strahl und It A cos θt die Leistung, die durch A hindurch transportiert wird. Den Reflexionsgrad R definieren wir als das Verhältnis der reflektierten zur einfallenden Leistung, R≡

Ir Ir A cos θr = . Ii A cos θi Ii

(4.54)

In gleicher Weise definieren wir den Transmissionsgrad T als Verhältnis zwischen der transmittierten und der einfallenden Leistung, T ≡

It cos θt . Ii cos θi

(4.55)

    2 /2 / v  E 2 /2 . Da sich die einfallende und Der Quotient Ir /Ii ist gleich vr r E0r i i 0i die reflektierte Welle im gleichen Medium befinden, ist vr = vi , r = i und   E0r 2 = r2 . (4.56) R= E0i

4 Die Ausbreitung des Lichts

248

Ähnlich gilt (unter der Voraussetzung, dass μi = μt = μ0 ist)     nt cos θt 2 nt cos θt E0t 2 = t . T = ni cos θi E0i ni cos θi

(4.57)

In diesen Ausdruck fließt ein, dass μ0 t = 1/vt2 und μ0 vt t = nt /c ist. In der Praxis von Bedeutung ist der senkrechte Einfall mit θt = θi = 0. Der Transmissionsgrad, Gleichung (4.55), entspricht dann ebenso wie der Reflexionsgrad, Gleichung (4.54), einfach dem Verhältnis der jeweiligen Bestrahlungsstärken. Wegen R = r 2 brauchen wir über das Vorzeichen von r nicht nachzudenken – dadurch wird die Verwendung des Reflexionsgrades besonders bequem. Beachten Sie aber, dass in Gleichung (4.57) aus zwei Gründen T nicht gleich t2 ist: Erstens muss das Verhältnis der Brechungsindizes berücksichtigt werden, denn die Geschwindigkeiten, mit denen die Energie in die Grenzfläche hinein- bzw. aus ihr heraustransportiert wird, sind unterschiedlich – mit anderen Worten, I ∝ v [siehe Gl. (3.47)]. Zweitens unterscheiden sich auch die Querschnittsflächen des einfallenden und des reflektierten Strahls. Entsprechend wird der Energiefluss pro Flächeneinheit beeinflusst, was durch den Quotienten der Kosinusterme zum Ausdruck kommt. Wir wollen nun einen Ausdruck aufschreiben, der die Energieerhaltung für die in Abbildung 4.55 gezeigte Anordnung wiedergibt. Die insgesamt pro Zeiteinheit in die Fläche A hineinfließende Energie muss gleich der pro Zeiteinheit aus A herausfließenden Energie sein: Ii A cos θi = Ir A cos θr + It A cos θt .

(4.58)

Wir multiplizieren beide Seiten mit c und erhalten 2 2 2 cos θi = ni E0r cos θi + nt E0t cos θt ni E0i

oder

 1=

E0r E0i

2

 +

nt cos θt ni cos θi



E0t E0i

2 .

(4.59)

Das entspricht jedoch schlicht R + T = 1,

(4.60)

wenn keine Absorption stattfindet. Das elektrische Feld ist ein Vektorfeld, und wie bei der Fresnel-Analyse können wir uns Licht wieder als aus zwei orthogonalen Komponenten zusammengesetzt vorstellen, deren E-Felder parallel bzw. senkrecht zur Einfallsebene sind. Tatsächlich oszilliert bei gewöhnlichem „unpolarisiertem“ Licht die eine Hälfte parallel zu dieser Ebene und die andere Hälfte senkrecht dazu. Wenn also zum Beispiel die

4.6 Der elektromagnetische Ansatz

249 1.0 Reflexionsgrad und Transmissionsgrad

Reflexionsgrad und Transmissionsgrad

1.0 T⊥ 0.5

nti = 1.5 R⊥

0

30

60 θi (Grad)

90

T

0.5

0

nti = 1.5

R 30

θp 60

90

θi (Grad)

Abb. 4.56: Reflexionsgrad und Transmissionsgrad in Abhängigkeit vom Einfallswinkel.

Netto-Bestrahlungsstärke 500 W/m2 ist, dann oszillieren 250 W/m2 senkrecht zur Einfallsebene. Aus den Gleichungen (4.56) und (4.57) folgt 2 , R⊥ = r ⊥

(4.61)

R || = r || ,   nt cos θt 2 t T⊥ = ni cos θi ⊥

(4.62)

2

und

 T || =

nt cos θt ni cos θi

(4.63)

 t2|| .

(4.64)

Dies ist in Abbildung 4.56 illustriert. Außerdem kann man zeigen (Aufgabe 4.73), dass R || + T || = 1

(4.65a)

R⊥ + T⊥ = 1

(4.65b)

und Beachten Sie, dass R⊥ der Anteil von Ii⊥ ist, der reflektiert wird, und nicht der reflektierte Anteil von Ii . Deshalb können R⊥ und R || beide gleich eins sein, sodass der Gesamt-Reflexionsgrad für natürliches Licht gegeben ist durch 1 R = (R⊥ + R || ) 2 Ein strenger Beweis für diese Gleichung wird in Abschn. 8.6.1 geführt.

(4.66)

Beispiel 4.5 Licht mit dem Polarisationswinkel θp trifft von Luft auf ein Stück Glas. Der Netto-Transmissionsgrad sei 0,86 und das ankommende Licht sei unpolarisiert. (a) Bestimmen Sie den prozentualen Anteil der einfallenden Leistung, die reflektiert wird. (b) Wenn 1000 W ankommen, wie viel Leistung wird dann bei senkrecht zur Einfallsebene gerichtetem E-Feld durchgelassen?

4 Die Ausbreitung des Lichts

250

Lösung (a) Gegeben ist T = 0,86. Da der Strahl unpolarisiert ist, wissen wir, dass die Hälfte des Lichts senkrecht zur Einfallsebene und die Hälfte parallel dazu ist. Da T || und T⊥ beide 1,0 sein können, gilt für unpolarisiertes Licht T = 12 (T || + T⊥ ) . Hier ist θi = θp und daher gemäß Abbildung 4.56 T || = 1,0; alles Licht, dessen elektrisches Feld parallel zur Einfallsebene gerichtet ist, wird durchgelassen. Folglich gilt T = 12 (1 + T⊥ ) = 0,86 und für das senkrechte Licht T⊥ = 1,72 − 1 = 0,72 . Aus R⊥ + T⊥ = 1 folgt R⊥ = 1 − T⊥ = 0,28 und der Netto-Reflexionsgrad ist R = 12 (R || + R⊥ ) = 12 R⊥ = 0,14 = 14 % . (b) Von den ankommenden 1000 W ist die Hälfte, also 500 W, senkrecht zur Einfallsebene gerichtet. Davon werden 72 % durchgelassen (wegen T || = 0,72). Folglich ist die Leistung, die bei senkrecht zur Einfallsebene gerichtetem E-Feld durchgelassen wird, 0,72 × 500 W = 360 W. Bei θi = 0 ist die Einfallsebene nicht definiert; die parallele und die senkrechte Komponente von R und T sind nicht mehr voneinander zu unterscheiden. In diesem Fall führen die Gleichungen (4.61) bis (4.64) sowie (4.47) und (4.48) zu   nt − ni 2 (4.67) R = R || = R⊥ = nt + ni und 4nt ni . (4.68) T = T || = T⊥ = (nt + ni )2 So werden 4 % des Lichts, das senkrecht auf eine Grenzfläche zwischen Luft und Glas fällt (ng = 1,5), reflektiert, gleichgültig, ob das Licht von „innen“ (ni > nt ) oder von „außen“ (ni < nt ) kommt (Aufgabe 4.70). Dies ist beispielsweise bei der Arbeit mit komplizierten Linsensystemen von Bedeutung, die zehn bis 30 solcher Grenzflächen enthalten können. Wenn Sie senkrecht auf einen Stapel aus 50 Objektträgern schauen (Deckgläschen sind dünner und in großer Zahl leichter zu handhaben), werden Sie

4.6 Der elektromagnetische Ansatz

251

tatsächlich feststellen, dass der größte Teil des Lichts reflektiert wird. Der Stapel wirkt fast wie ein Spiegel (siehe Foto S. 252 Mitte). Auch eine Rolle Plastikfolie wirkt wie glänzendes Metall: Die vielen Grenzflächen erzeugen eine große Zahl nahe beieinander liegender spiegelnder Reflexionen, die einen Großteil des Lichts in das Einfallsmedium zurücksenden – mehr oder weniger, als ob eine einzige, frequenzunabhängige Reflexion stattgefunden hätte. An der glatten Oberfläche eines silbrigen Metalls passiert im Wesentlichen dasselbe, nämlich eine intensive, frequenzunabhängige spiegelnde Reflexion; daher glänzt das Metall. Ist die Reflexion diffus, so erscheint die Oberfläche grau oder, wenn der Reflexionsgrad hinreichend groß ist, sogar weiß. Abbildung 4.57 zeigt den Reflexionsgrad an einer einzelnen Oberfläche bei senkrechtem Einfall für verschiedene Medien (das heißt, als Funktion des Brechungsindex). In Abbildung 4.58 ist die Abhängigkeit des Transmissionsgrads von der Anzahl der Grenzflächen und vom Brechungsindex des Mediums bei senkrechtem Einfall dargestellt. Nun können Sie verstehen, warum Sie nicht durch eine Rolle „durchsichtiger“ Plastikfolie schauen können und warum die vielen Linsenelemente eines Periskops mit reflexmindernden Beschichtungen überzogen sein müssen (siehe Abschn. 9.9.2). Beispiel 4.6 Betrachten Sie einen Strahl von unpolarisiertem Licht, der in Luft mit dem Polarisationswinkel θp auf eine ebene Glasoberfläche (n = 1,50) fällt. Berücksichtigen Sie Abbildung 4.49 und nehmen Sie an, dass das E-Feld parallel zur Einfallsebene schwingt. Bestimmen Sie R || und zeigen Sie dann durch direkte Berechnung, dass T || = 1,0. Warum ist t = 1, obwohl r || null ist? Lösung Gemäß Gleichung (4.62) ist R || = r 2|| , und es gilt r || = 0. Hieraus folgt R || = 0 , und es wird kein Licht reflektiert. Andererseits gilt nach Gleichung (4.64)   nt cos θt t2|| . T || = ni cos θi Nach Abbildung 4.49 und Gleichung (4.41) ist t || = 0,667 bei θi = θp = 56,3◦ , und aus θi + θt = 90,0◦ folgt θt = 33,7◦ . Folglich gilt T || =

1,5 cos 33,7◦ (0,667)2 = 1,00 . 1,0 cos 56,3◦

Das gesamte Licht wird durchgelassen. Wegen der Energieerhaltung in einem verlustfreien Medium muss R || + T || = 1 gelten; die Energieerhaltung verlangt aber nicht, dass r || + t || = 1 gilt.

4 Die Ausbreitung des Lichts

252

Blicken wir in eine Pfütze (rechts befindet sich schmelzender Schnee), so sehen wir die Spiegelbilder der umstehenden Bäume. Bei senkrechtem Einfall reflektiert die Wasseroberfläche ungefähr 2% des Lichts. Dieser Anteil nimmt zu, wenn der Blickwinkel größer wird (hier beträgt er ca. 40◦ ). (Foto E. H.)

Bei nahezu senkrechtem Einfall werden an jeder Grenzfläche zwischen Glas und Luft rund 4% des Lichts reflektiert. Auf diesem Bild können Sie den Fotografen deutlich erkennen, weil es außerhalb des Gebäudes wesentlich heller ist als innerhalb. (Foto E. H.)

Reflexionsgrad (%)

50 40 30 20 10 0 1

Transmissionsgrad (%)

Reflexion an einem Stapel Objektträger bei fast senkrechtem Einfall. Man erkennt das Spiegelbild der Kamera, mit der das Bild aufgenommen wurde. (Foto E. H.)

3 2 Brechungsindex (nt )

4

Abb. 4.57: Der Reflexionsgrad bei senkrechtem Einfall aus Luft (ni = 1,0) an einer einzelnen Grenzfläche.

100 80

nt =1.5

60

nt =2.0

40

nt =2.5

20

nt =3.0

0

2 4 6 8 10 Anzahl reflektierender Flächen

Abb. 4.58: Transmissionsgrad an verschiedenen Grenzflächen zu Luft (ni = 1,0) bei senkrechtem Einfall.

4.7 Innere Totalreflexion

4.7

253

Innere Totalreflexion

Im vorangegangenen Abschnitt sahen wir, dass etwas Besonderes passiert, wenn bei der inneren Reflexion (ni > nt ) θi gleich oder größer als der so genannte Grenzwinkel θc wird. Diese Situation wollen wir jetzt etwas genauer diskutieren. Dazu betrachten wir eine Lichtquelle in einem optisch dichten Medium, wobei wir θi allmählich größer werden lassen, wie in Abbildung 4.59 angedeutet. Aus dem letzten Abschnitt, insbesondere Abbildung 4.50, wissen wir, dass mit steigendem θi sowohl r || als auch r⊥ zunimmt und deshalb sowohl t || als auch t⊥ abnimmt. Außerdem ist θt > θi wegen nt sin θt sin θi = ni und ni > nt , daher auch nti < 1. Wenn also θi größer wird, so geht der durchgelassene Strahl immer flacher von der Grenzfläche aus, und ein immer größerer Anteil der eingestrahlten Energie erscheint im reflektierten Strahl. Ist schließlich θt = 90◦ , so wird sin θt = 1 und sin θc = nti .

(4.69)

Wie bereits vermerkt wurde, ist der Grenzwinkel jener spezielle Wert von θi , für den θt = 90◦ ist. Je größer ni ist, desto kleiner wird nti und desto kleiner damit auch θc . Bei allen Einfallswinkeln, die größer sind als θc , wird sämtliche einfallende Energie reflektiert. Man bezeichnet dieses Phänomen als Totalreflexion (siehe Foto S. 254). Es muss betont werden, dass der Übergang von den Bedingungen in Abbildung 4.59 a zu denen in Abbildung 4.59 d vollkommen stetig erfolgt. Der reflektierte Strahl wird immer intensiver, je größer θi wird, der gebrochene Strahl jedoch schwächer, bis er schließlich vollständig verschwindet. Die allmähliche Abschwächung des gebrochenen Strahls lässt sich leicht verfolgen: Legen Sie einfach eine Glasplatte (einen

ni > nt

θt θi θr

(a)

25%

6%

4% (b)

(c)

90◦

nt ni 42◦ 42◦

38% (d)

θi = θ c

100% θr = θc

(e)

100% θi > θc

θr = θi

(f)

Abb. 4.59: Innere Reflexion und Grenzwinkel. (Foto mit frdl. Erlaubnis von Educational Service, Inc.)

254

4 Die Ausbreitung des Lichts

Wie Sie beobachten können, sind die beiden Flammen entlang eines breiten waagerechten Bandes nicht durch das Wasser zu sehen. Die Ursache hierfür ist die innere Totalreflexion. Schauen Sie durch die Wand eines Wasserglases auf dessen Boden. Füllen Sie nun einige Zentimeter hoch Wasser in das Glas. Was geschieht? (Foto E. H.)

Objektträger) auf eine bedruckte Seite und schirmen Sie alles spiegelnd reflektierte Licht ab. Bei θi ≈ 0 ist auch θt etwa gleich null, und Sie sehen die Buchstaben durch das Glas hell und deutlich. Bewegen Sie nun Ihren Kopf, sodass θt (der Winkel, unter dem Sie auf die Grenzfläche schauen) wächst; das Papier erscheint dann immer dunkler, was beweist, dass T tatsächlich merklich abgenommen hat. Für die hier diskutierte Grenzfläche zwischen Luft und Glas beträgt der Grenzwinkel rund 42◦ (siehe Tab. 4.3). Bei jedem Strahl, der senkrecht auf die linke Fläche eines der beiden Prismen in Abbildung 4.60 fällt, ist θi > 42◦ , und daher kommt es in jedem Fall zur inneren Totalreflexion. Man nutzt dieses Phänomen häufig aus, um einfallendes Licht vollständig zu reflektieren, wenn man vermeiden will, dass eine spiegelnde Metalloberfläche den Strahl in irgendeiner Weise verändert (siehe Foto). Ein sehr anschauliches Bild der diskutierten Situation liefert auch Abbildung 4.61, eine vereinfachte Darstellung der Streuung an atomaren Oszillatoren. Wie wir wissen, verändert sich in homogenen, isotropen Medien die Lichtgeschwindigkeit von c zu vi bzw. vt (Abschn. 4.2.3). Die resultierende Welle entsteht durch die Überlagerung der Elementarwellen, die sich mit der entsprechenden Geschwindigkeit ausbreiten. In Abbildung 4.61 a führt eine einfallende Welle nacheinander an den Streuzentren A und B zur Emission von Elementarwellen, die einander zur durchgelassenen Welle überlagern. Die reflektierte Welle, die sich wie gewohnt mit θr = θi im Einfallsmedium ausbreitet, wurde nicht eingezeichnet. In einer Zeit t legt die einfallende Wellenfront eine Strecke vi t = CB zurück, die gebrochene Welle dagegen bewegt sich um vt t = AD > CB fort. Da sich die eine Welle innerhalb der gleichen Zeitspanne von A nach

4.7 Innere Totalreflexion (a) 45◦

255 (b) 45◦ 45◦

45◦

45◦

45◦

Abb. 4.60: Innere Totalreflexion.

Σt

Das Prisma verhält sich wie ein Spiegel: Es reflektiert ein Stück des Bleistifts, wobei die Beschriftung seitenverkehrt erscheint. Der Effekt ist eine Folge der inneren Totalreflexion.

Σt E nt θt A

θi

ni > nt vi < vt

D

B vi t C Σi

(a)

Tabelle 4.3: Grenzwinkel der Totalreflexion. vt t A

(b)

Luft

Glas

θc (Grad)

θc (rad)

nit

θc (Grad)

θc (rad)

1.30 1.31 1.32 1.33 1.34 1.35 1.36 1.37 1.38 1.39 1.40 1.41 1.42 1.43 1.44 1.45 1.46 1.47 1.48 1.49

50.2849 49.7612 49.2509 48.7535 48.2682 47.7946 47.3321 46.8803 46.4387 46.0070 45.5847 45.1715 44.7670 44.3709 43.9830 43.6028 43.2302 42.8649 42.5066 42.1552

0.8776 0.8685 0.8596 0.8509 0.8424 0.8342 0.8261 0.8182 0.8105 0.8030 0.7956 0.7884 0.7813 0.7744 0.7676 0.7610 0.7545 0.7481 0.7419 0.7357

1.50 1.51 1.52 1.53 1.54 1.55 1.56 1.57 1.58 1.59 1.60 1.61 1.62 1.63 1.64 1.65 1.66 1.67 1.68 1.69

41.8103 41.4718 41.1395 40.8132 40.4927 40.1778 39.8683 39.5642 39.2652 38.9713 38.6822 38.3978 38.1181 37.8428 37.5719 37.3052 37.0427 36.7842 36.5296 36.2789

0.7297 0.7238 0.7180 0.7123 0.7067 0.7012 0.6958 0.6905 0.6853 0.6802 0.6751 0.6702 0.6653 0.6605 0.6558 0.6511 0.6465 0.6420 0.6376 0.6332

B D C

A

nit

D B vt t θt =θc vi t C (c)

Abb. 4.61: Die gebrochene Welle bei der inneren Totalreflexion, vom Standpunkt der Streuung aus betrachtet. Wir halten hier θi und ni konstant und senken nt von (a) bis (c), wobei vt ansteigt. Die reflektierte Welle (θr = θi ) wurde nicht eingezeichnet.

256

4 Die Ausbreitung des Lichts

E bewegt wie die andere von C nach B, und da außerdem Frequenz und Periode der beiden Wellen übereinstimmen, muss auch die Phasenänderung der beiden Wellen während des beschriebenen Vorgangs gleich sein. Die Störung muss daher im Punkt E phasengleich mit derjenigen in Punkt B sein, und beide Punkte müssen sich auf derselben gebrochenen Wellenfront befinden (siehe auch Abschn. 4.4.2). Man erkennt Folgendes: Je größer vt im Vergleich zu vi wird, umso stärker ist die gebrochene Front geneigt (das heißt, umso größer ist θt ). In Abbildung 4.61 b wurde nti kleiner gewählt als Folge eines kleineren nt . Es ergibt sich eine höhere Geschwindigkeit vt , wodurch AD länger und der Brechungswinkel größer wird. In Abbildung 4.61 c ist ein Spezialfall erreicht: AD = AB = vt t, und die Elementarwellen überlagern einander nur längs der Grenzfläche (θt = 90◦ ) in Phase. Im Dreieck ABC ist sin θi = vi t/vt t = nt /ni , was Gleichung (4.69) entspricht. Im Falle der beiden gezeigten Medien (das heißt, des speziellen Wertes von nti ) überlagern die gestreuten Elementarwellen einander nur entlang der Grenzfläche konstruktiv – es entsteht eine so genannte Oberflächenwelle mit θt = 90◦ .

4.7.1 Die abklingende Welle Die Frequenz von Röntgenstrahlung ist höher als die Resonanzfrequenzen der Atome des brechenden Mediums. Aus Gleichung (3.70) folgt daher, dass der Brechungsindex von Röntgenstrahlung kleiner als 1,0 sein sollte; Experimente bestätigen dies. Die Phasengeschwindigkeit von Röntgenstrahlen ist demnach in Materie größer als im Vakuum (also größer als c), allerdings selbst in den dichtesten Medien nur um weniger als 1/10 000. Treten Röntgenstrahlen aus der Luft in ein dichteres Medium ein, so knicken sie (ein klein wenig) von der Grenzflächennormalen weg, nicht zu ihr hin. Nach der vorangegangenen Diskussion der inneren Totalreflexion sollten wir dann erwarten, dass beispielsweise beim Eintritt in Glas aus Luft eine „äußere Totalreflexion“ der Röntgenstrahlung auftritt. Dieser Begriff erscheint in der Literatur tatsächlich häufig, ist aber eigentlich falsch, denn für Röntgenstrahlung ist nLuft > nGlas und damit ni > nt (obwohl Glas physikalisch dichter ist als Luft), sodass es sich wiederum lediglich um eine innere Reflexion handelt. In jedem Fall ist nti ≈ 1 und θc ≈ 90◦ , da nt zwar kleiner als 1 ist, aber nur um einen äußerst geringen Betrag. 1923 argumentierte A. H. Compton, dass es selbst dann, wenn für Röntgenstrahlung bei gewöhnlichen Einfallswinkeln keine spiegelnde Reflexion durch ein Medium auftritt, bei streifendem Einfall zur „äußeren“ Totalreflexion kommen sollte. Compton ließ Röntgenstrahlung mit einer Wellenlänge von 0,128 nm auf eine Glasplatte fallen und maß einen Grenzwinkel von etwa 10 Bogenminuten (0,167◦ ) relativ zur Oberfläche. Daraus ergibt sich ein Brechungsindex für Glas, der um −4,2 × 10−6 von 1 abweicht. Später werden wir auf einige wichtige praktische Anwendungen sowohl der inneren als auch der „äußeren“ Totalreflexion zurückkommen (Abschn. 5.6).

4.7 Innere Totalreflexion

257

Gehen wir im Fall der inneren Totalreflexion davon aus, dass es keine gebrochene Welle gibt, dann lassen sich die Randbedingungen allein mithilfe der einfallenden und der reflektierten Welle nicht mehr erfüllen – die Zusammenhänge sind also nicht so einfach, wie es zunächst scheinen mag. Außerdem können wir die Gleichungen (4.34) und (4.40) (siehe Aufgabe 4.77) wie folgt umformen:  1/2 cos θi − n2ti − sin2 θi (4.70) r⊥ =  1/2 cos θi + n2ti − sin2 θi und  1/2 n2ti cos θi − n2ti − sin2 θi (4.71) r || =  1/2 . n2ti cos θi + n2ti − sin2 θi Wegen sin θc = nti bei θi > θc gilt sin θi > nti , und sowohl r || als auch r⊥ werden ∗ = r r ∗ = 1 und komplexe Größen. Abgesehen davon (siehe Aufgabe 4.78) gilt r⊥ r⊥ || || R = 1, also Ir = Ii und It = 0. Das heißt, es muss zwar eine gebrochene Welle geben, aber diese kann im Mittel keine Energie durch die Grenzfläche transportieren. Den vollständigen, ausführlichen Rechenweg zur Ableitung von Ausdrücken für alle reflektierten und durchgelassenen Felder wollen wir uns an dieser Stelle sparen; einen kleinen Eindruck von den Zusammenhängen sollen die folgenden Betrachtungen liefern. Die Wellenfunktion des durchgelassenen elektrischen Feldes ist Et = E0t exp i (kt · r − ωt) mit kt · r = ktx x + kty y , da k hier keine z-Komponente besitzt. Aber es ist ktx = kt sin θt

und

kty = kt cos θt ,

wie aus Abbildung 4.62 entnommen werden kann. Wir verwenden wieder das snelliussche Gesetz,  1/2 sin2 θi , (4.72) kt cos θt = ±kt 1 − n2ti oder, da wir uns hier mit dem Spezialfall sin θi > nti beschäftigen, 1/2  2 sin θi −1 ≡ ±iβ kty = ±ikt n2ti und kt sin θi . ktx = nti

4 Die Ausbreitung des Lichts

x

0

kt cos θt

y

kt θt

nt

kt sin θt

ni

θt θr

z

kr

ki

Abb. 4.62: Fortpflanzungsvektoren bei der inneren Reflexion.

Einfallsebene

Daher ist

Gr enz flä che

258



θi − ωt Et = E0t exp (±βy) exp i kt x sin nti

 .

(4.73)

Wir vernachlässigen den physikalisch sinnlosen positiven Exponenten des ersten Exponentialterms und erhalten damit eine Welle, deren Amplitude exponentiell abfällt, sobald sie mit dem weniger dichten Medium in Berührung kommt. Die Störung pflanzt sich in x-Richtung als Oberflächenwelle oder abklingende Welle fort. Die Wellenfronten (Flächen konstanter Phase) sind parallel zur yz-Ebene und stehen damit senkrecht auf den Flächen konstanter Amplitude, die parallel zur xz-Ebene verlaufen; die Welle ist demnach inhomogen (siehe Abschn. 2.7). Ihre Amplitude nimmt in yRichtung rasch ab und wird bereits vernachlässigbar gering, nachdem die Welle eine Entfernung von nur wenigen Wellenlängen im zweiten Medium zurückgelegt hat. Die Größe β in Gleichung (4.73) ist der Dämpfungskoeffizient, der durch 1/2   ni 2 2πnt sin2 θi − 1 β= λ0 nt gegeben ist. Die Stärke des abklingenden E-Feldes fällt im optisch weniger dichten Medium exponentiell von ihrem maximalen Wert an der Grenzfläche (y = 0) auf das 1/e-Fache dieses Wertes in einem Abstand von y = 1/β = δ, der als Eindringtiefe bezeichnet wird. Abbildung 4.63 a zeigt die einlaufende und die reflektierte Welle, und wie man leicht sieht, gibt es, obwohl beide mit der gleichen Geschwindigkeit (nämlich der Geschwindigkeit der abklingenden Welle) nach rechts laufen, eine nach oben gerichtete Komponente der einlaufenden Welle und eine gleich große nach unten gerichtete Komponente der total reflektierten Welle. Dort, wo sie sich überlappen, gibt es eine so genannte stehende Welle, die sich im optisch dichteren Einfallsmedium bildet. In Abschnitt 7.1 werden wir bei der mathematischen Analyse sehen, dass immer, wenn sich zwei Wellen der gleichen Frequenz in entgegengesetzte Richtungen fortpflanzen, in demselben Bereich eine stationäre Energieverteilung aufgebaut wird, die man als stehende Welle bezeichnet (obwohl es sich aus formaler Sicht nicht

4.7 Innere Totalreflexion

259 y Et

nt 0

ni ⬎ nt

Ei

(a)

(b)

Abb. 4.63: Totalreflexion; (a) zeigt die einlaufende und die auslaufende Welle, (b) das stehende E-Feld in den beiden Medien.

um eine Welle handelt). Die schwarzen Punkte in der Zeichnung entsprechen den Maxima und die Kreise in der Mitte den Minima; alle Extrema bleiben während der Wellenbewegung räumlich fest. Die Orte dieser Antiknoten und Knoten finden sich ebenso in Abbildung 4.63 b wieder, wo das stehende E-Feld im Einfallsmedium (Ei ) gezeigt ist. Die Situation erinnert an das Muster einer stehenden akustischen Welle, das eine an einem Ende offene Orgelpfeife erzeugt. Beachten Sie, dass die obere Reihe von schwarzen Punkten (Maxima) ein Stück unterhalb der Grenzfläche liegt, und zwar genau dort, wo der Kosinus in Abbildung 4.63 b sein Maximum hat. Der Grund hierfür ist, dass es eine Phasenverschiebung zwischen der einfallenden und der auslaufenden Welle gibt (Abb. 4.52 e). Die Auslenkung der stehenden Welle entspricht an der Grenze (y = 0) der Auslenkung der abklingenden Welle, die von dort exponentiell abfällt. Wenn wir den Einfallswinkel über θc hinaus erhöhen, dann wird der Winkel zwischen den überlappenden ebenen Wellenfronten kleiner, wodurch wiederum der Abstand zwischen benachbarten Knoten der stehenden Welle größer wird. Die Auslenkung der stehenden Welle an der Grenzfläche wird kleiner, ebenso die Auslenkung des E-Feldes in dem weniger dichten Medium sowie die Eindringtiefe. Noch eine Anmerkung zur Energieerhaltung. Eine ausführlichere Behandlung hätte gezeigt, dass die Energie in Wirklichkeit periodisch vor- und rückwärts durch die Grenzfläche fließt, woraus sich im Mittel ein Fluss von null in das zweite Medium hinein ergibt. Ein Rätsel ist allerdings noch zu lösen: Ein kleiner Energieanteil bewegt sich entlang der Grenzfläche als abklingende Welle in der Einfallsebene. Da diese Energie unter den hier diskutierten Bedingungen (θi ≥ θc ) nicht in das optisch dünnere Medium eingedrungen sein kann, muss sie aus einer anderen Quelle stammen. Im Experiment hat der einfallende Strahl einen endlichen Querschnitt und unterscheidet sich damit eindeutig von einer ebenen Welle. Diese Abweichung bewirkt, dass eine

4 Die Ausbreitung des Lichts

260

kleine Energiemenge infolge von Beugungseffekten durch die Grenzfläche gelangt und sich in der abklingenden Welle manifestiert. Aus den Bildern 4.52 c und d ist übrigens ersichtlich, dass der Phasenunterschied der einfallenden und der reflektierten Welle nicht π beträgt (ausgenommen bei θi = 90◦ ) – somit können die Wellen einander nicht auslöschen. Aus der Stetigkeit der Tangentialkomponente von E folgt daher, dass es in dem weniger dichten Medium ein oszillierendes Feld geben muss, das eine Komponente parallel zur Grenzfläche mit der Frequenz ω hat (das ist gerade die abklingende Welle). Der exponentielle Abfall der Oberflächen- oder Grenzflächenwelle wurde vor einiger Zeit bei optischen Frequenzen experimentell bestätigt.13 Die Goos-Hänchen-Verschiebung 1947 zeigten Fritz Goos und Hilda Lindberg-Hänchen experimentell, dass ein Lichtstrahl, der einer inneren Totalreflexion unterliegt, an der Grenzfläche eine laterale Verschiebung gegenüber seinem Auftreffpunkt erfährt. Wir zeichnen Strahlen, die auf eine Grenzfläche treffen, zwar üblicherweise so, als würden sie genau dort reflektiert, aber wir wissen, dass die Reflexion in Wirklichkeit nicht exakt an dieser Stelle stattfindet. Der Prozess ist nicht der gleiche wie bei einem Gummiball, der an einer Wand abprallt. Vielmehr tragen viele Schichten von Atomen zur reflektierten Welle bei. Im Falle einer Totalreflexion verhält sich der ankommende Strahl so, als würde er ein Stück in das optisch weniger dichte Medium eindringen und dann dort im Abstand δ – gegeben durch die Eindringtiefe – reflektiert (siehe Abb. 4.64). Die resultierende laterale Verschiebung Δx in Propagationsrichtung der abklingenden Welle wird GoosHänchen-Verschiebung genannt. Aus den fresnelschen Gleichungen folgt, dass sie in Abhängigkeit von der Polarisation des Lichts leicht unterschiedlich sein kann. Wie sich aus der Zeichnung ablesen lässt, gilt für die Verschiebung Δx ≈ 2δ tan θi , was von der Größenordnung einer Wellenlänge des einfallenden Lichtes ist. Beim Zeichnen von Strahlenverläufen spielt der Effekt also keine große Rolle, für viele Forscher dagegen ist er von großem Interesse. y nt

d

ni ⬎ nt

x ui

ui ⱖ uc

13

ur ⌬x

Abb. 4.64: Unter den Bedingungen der Totalreflexion erfährt ein Lichtstrahl scheinbar eine laterale Verschiebung Δx.

Siehe dazu beispielsweise den faszinierenden Artikel von K. H. Drexhage, „Monomolecular layers and light“, Sci. Am. 222, 108 (1970).

4.7 Innere Totalreflexion

261

Frustrierte innere Totalreflexion Wir betrachten nun ein Bündel Lichtstrahlen, das sich in einem Stück Glas ausbreitet und an einer Grenzfläche durch innere Reflexion zurückgeworfen wird. Wenn man an diese Grenzfläche ein zweites Stück Glas presste, so verschwände die LuftGlas-Grenzfläche vermutlich, und der Lichtstrahl breitete sich ungehindert weiter aus. Außerdem ist anzunehmen, dass der Übergang von der Totalreflexion zur ungestörten Ausbreitung allmählich erfolgte, in dem Maße, wie die Luftschicht dünner würde. Halten Sie beispielsweise ein Trinkglas fest in der Hand – Sie können dann die Rillen Ihrer Fingerabdrücke durch die Glaswand sehen, obwohl an dieser Fläche normalerweise eine spiegelähnliche Totalreflexion erfolgt. Allgemeiner ausgedrückt: Wenn die abklingende Welle aus einem dünneren Medium in ein dichteres Medium übergeht, das sich in unmittelbarer Nähe befindet, so kann Energie durch die Lücke zwischen beiden Medien fließen. Man nennt diesen Prozess gestörte (frustrierte) innere Totalreflexion (engl. frustrated total internal reflection, FTIR). Nachdem sie die Lücke durchquert hat, ist die abklingende Welle noch intensiv genug, um Elektronen im „störenden“ Medium anzuregen, welche ihrerseits eine Welle erzeugen, die den Zustand des Feldes beeinflusst. Dadurch kann Energie fließen. Abbildung 4.65 zeigt eine schematische Darstellung der FTIR. Die Wellenfronten sind durch Linien angedeutet, deren Breite beim Durchtritt durch die Lücke abnimmt; dies soll darauf hinweisen, dass auch die Amplitude des Feldes in dieser Weise abnimmt. Der Vorgang erinnert stark an das quantenmechanische Phänomen der Durchdringung einer Potentialschwelle, den so genannten Tunneleffekt, den man sich in der modernen Physik in vielfältiger Weise zunutze macht.

Links: Totalreflexion an einer Fläche eines Glasprismas. Rechts: Frustrierte Totalreflexion. (Fotos E. H.)

Mit einer Prismenanordnung wie in Abbildung 4.66, die fast selbsterklärend ist, kann man die FTIR veranschaulichen. Sind die Hypotenusenflächen der beiden Prismen eben und parallel zueinander, dann kann man sie so einstellen, dass sie jeden gewünschten Bruchteil der einfallenden Flussdichte reflektieren bzw. durchlassen. Derartige Anordnungen nennt man Strahlteiler. Einen so genannten Strahlteilerwürfel (Abb. 4.66 c) stellt man her, indem man zwischen die beiden Prismen einen dünnen

4 Die Ausbreitung des Lichts

262

y

kt Glas Luft

k (inhomogen)

x Glas ki kr Abb. 4.65: Gestörte innere Totalreflexion. (a)

zum Film 64%

zum Okular

16%

zum Belichtungsmesser

20% 100% (b)

vom Objekt

(c)

Abb. 4.66: (a) Ein Strahlteiler, der die gestörte innere Totalreflexion (FTIR) ausnutzt. (b) Eine typische moderne Anwendung der FTIR: Dieser Strahlteiler wird verwendet, um durch ein Mikroskop hindurch zu fotografieren. (c) Würfel als Strahlteiler. (Foto mit frdl. Genehmigung von Melles Griot.)

transparenten Film mit niedrigem Brechungsindex als Präzisionsabstand bringt. Verlustarme Reflektoren, deren Transmissionsgrad durch FTIR gesteuert werden kann, sind von großer praktischer Bedeutung. Auch in anderen Regionen des elektromagnetischen Spektrums kann man FTIR beobachten. Besonders einfach gestaltet sich die Arbeit mit Drei-Zentimeter-Mikrowellen, weil die abklingende Welle sich dann rund zehntausend Mal weiter ausbreitet als bei optischen Frequenzen. Die oben gezeigten Experimente kann man dann mit festen Prismen aus Paraffin oder Hohlprismen aus Acrylglas, gefüllt mit Kerosin oder Motorenöl, nachvollziehen. Jedes der genannten Materialien hat für Drei-Zentimeter-Wellen einen Brechungsindex von etwa 1,5. Es ist dann nicht schwierig, die Abhängigkeit der Feldamplitude von y zu messen.

4.8 Optische Eigenschaften von Metallen

4.8

263

Optische Eigenschaften von Metallen

Das charakteristische Merkmal elektrisch leitender Stoffe ist die Anwesenheit ungebundener („freier“) elektrischer Ladungen, die sich innerhalb des Materials bewegen können. Im Falle metallischer Stoffe sind diese Ladungen natürlich Elektronen, deren Bewegung sich in einem elektrischen Strom äußert. Der Strom pro Flächeneinheit, der durch Anlegen eines elektrischen Feldes E erzeugt wird, ist über Gleichung (A1.15) mit der Leitfähigkeit σ des Mediums verknüpft. In einem dielektrischen Medium gibt es keine ungebundenen Elektronen (σ = 0); bei Metallen dagegen nimmt σ einen endlichen, von null verschiedenen Wert an. Der Grenzfall ist ein „idealer“ Leiter mit einer unendlichen Leitfähigkeit. In diesem Fall würden die Schwingungen der Elektronen einfach dem anregenden harmonischen Feld folgen. Es gäbe keine Rückstellkraft, keine Eigenfrequenz und keine Absorption, nur Reemission. In realen Metallen stoßen die Leitungselektronen mit den Bestandteilen des thermisch angeregten Atomgitters zusammen, wodurch elektromagnetische Energie irreversibel in Wärme umgewandelt wird. Die Absorption von Strahlungsenergie ist eine Funktion der elektrischen Leitfähigkeit des gegebenen Stoffes. Wellen in einem Metall Wir stellen uns das Medium als ein Kontinuum vor. Die maxwellschen Gleichungen führen dann zu ∂2E ∂E ∂2E ∂2E ∂2E , + + = μ + μσ 2 2 2 2 ∂x ∂y ∂z ∂t ∂t

(4.74)

was Gleichung (A1.21) in kartesischen Koordinaten entspricht. Das letzte Glied, μσ∂E/∂t, ist eine erste Ableitung nach der Zeit, ähnlich der Dämpfung im Oszillatormodell (Abschn. 3.5.1). Durch die zeitliche Änderung von E entsteht eine Spannung, Ströme fließen, und aufgrund des Widerstands des Stoffes wird Licht in Wärme umgewandelt – mit anderen Worten, Licht wird absorbiert. Dieser Ausdruck lässt sich auf die Gleichung der ungedämpften Welle reduzieren, wenn man die Dielektrizitätskonstante als komplexe Größe behandelt. Dadurch entsteht ein komplexer Brechungsindex, der, wie in Abschnitt 3.5.1 gezeigt wurde, auf die Absorption hinausläuft. Wir müssen dann nur noch den komplexen Brechungsindex nC = nR − inI

(4.75)

in die entsprechende Lösung für ein nichtleitendes Medium einsetzen (der reelle und der imaginäre Index, nR und nI , sind beides reelle Zahlen). Eine spezielle Lösung können wir auch durch Verwendung der Wellengleichung mit geeigneten Randbedingungen finden. In beiden Fällen nimmt die Lösung (für das Innere des Leiters) die Form einer einfachen, sinusförmigen ebenen Welle an. Eine solche Welle, die sich in y-Richtung ausbreitet, schreibt man gewöhnlich in der Form E = E0 cos (ωt − ky)

4 Die Ausbreitung des Lichts

264 oder, als Funktion von n, E = E0 cos ω (t − nC y/c)

(im letzteren Falle muss der Brechungsindex als komplexe Größe angesetzt werden). Schreiben wir die Welle in Exponentialform auf, so ergibt sich unter Verwendung von Gleichung (4.75) E = E0 exp (−ωnI y/c) exp iω (t − nR y/c)

(4.76)

E = E0 exp (−ωnI y/c) cos ω (t − nR y/c) .

(4.77)

oder

Die Störung breitet sich mit einer Geschwindigkeit von c/nR in y-Richtung aus, als ob nR der gewohnte Brechungsindex wäre. Beim Eintritt in den Leiter wird die Amplitude der Welle, E0 exp (−ωnI y/c), exponentiell gedämpft. Da die Bestrahlungsstärke zum Quadrat der Amplitude proportional ist, haben wir I (y) = I0 e−αy

(4.78)

mit I0 = I (0); I0 ist also die Bestrahlungsstärke bei y = 0 (an der Grenzfläche), und α ≡ 2ωnI /c ist der Absorptions- oder (besser) der Dämpfungskoeffizient. Wenn die Welle eine Strecke von y = 1/α (die so genannte Eindringtiefe) zurückgelegt hat, hat die Flussdichte um einen Faktor von e−1 = 1/2,7 ≈ 13 abgenommen. Ein Stoff erscheint durchsichtig, wenn die Eindringtiefe der betreffenden Strahlung groß im Vergleich zur Dicke des Materials ist. Metalle haben allerdings eine sehr geringe Eindringtiefe. Für Kupfer beträgt sie bei UV-Strahlung (λ0 ≈ 100 nm) nur 0,6 nm, und auch im Infraroten (λ0 ≈ 10 000 nm) ist sie mit etwa 6 nm noch sehr klein. Daher erscheinen uns Metalle im Allgemeinen undurchsichtig; eine Ausnahme bilden teilweise durchlässige ultradünne Folien, wie sie zum Beispiel für teilverspiegelte Zweiwegespiegel verwendet werden. Der bekannte metallische Glanz elektrischer Leiter kommt durch einen hohen Reflexionsgrad zustande – er ist eine Folge davon, dass die einfallende Welle nicht merklich in das Material eindringen kann. Nur relativ wenige Elektronen des Metalls kommen deshalb mit der Welle in Berührung; jedes von ihnen absorbiert zwar stark, aber die Summe der absorbierten Energie bleibt trotzdem gering. Der größte Teil der ankommenden elektromagnetischen Energie erscheint in der reflektierten Welle. Die meisten Metalle, zum Beispiel Natrium, Kalium oder weniger alltägliche wie Cäsium, Vanadium, Niob, Gadolinium, Holmium, Yttrium, Scandium und Osmium sehen silbrig-grau aus wie Aluminium, Zinn und Stahl. Sie sind im Wesentlichen farblos, weil sie nahezu das gesamte (85 bis 95 %) einfallende Licht unabhängig von der Wellenlänge reflektieren. Gleichung (4.77) erinnert sicherlich an das Phänomen der gestörten inneren Totalreflexion und Gleichung (4.73). In beiden Fällen fällt die Amplitude exponentiell ab. Eine vollständige Analyse würde außerdem zeigen, dass die durchgelassenen Wellen

4.8 Optische Eigenschaften von Metallen

265

nicht streng transversal sind – das Feld hat in beiden Fällen eine Komponente in der Ausbreitungsrichtung. Wir haben das Metall bisher als kontinuierliches Medium betrachtet. Bei niedrigen Frequenzen und langen Wellen (im Infrarotbereich) ist dies auch zulässig. Wenn die Wellenlänge des einfallenden Strahlenbündels immer geringer wird, werden wir jedoch nicht umhinkönnen, die körnige Natur der Materie zu berücksichtigen. Bei Experimenten mit optischen Frequenzen stellt man tatsächlich beträchtliche Abweichungen vom Kontinuumsmodell fest. So kehren wir erneut zum klassischen atomistischen Bild zurück, das von Hendrik Lorentz, Paul Karl Ludwig Drude (1863– 1906) und anderen entwickelt wurde. Durch diesen einfachen Ansatz ergibt sich eine qualitative Übereinstimmung mit dem Experiment. Um das Phänomen exakt zu behandeln, bedarf es jedoch quantentheoretischer Methoden. Die Dispersionsgleichung Stellen wir uns den Leiter nun als eine Anordnung angeregter, gedämpfter Oszillatoren vor. Einige dieser Oszillatoren sind ungebundene Elektronen, deren Rückstellkraft folglich gleich null ist, andere schwingende Elektronen sind in Atomen gebunden, etwa wie jene in dielektrischen Medien (Abschn. 3.5.1). Die ungebundenen Elektronen liefern jedoch den wesentlichen Beitrag zu den optischen Eigenschaften der Metalle. Wir erinnern uns, dass die Auslenkung eines schwingenden Elektrons gegeben ist durch x (t) = 

qe /me  E (t) . ω02 − ω 2

[3.66]

Ohne Rückstellkraft, ω0 = 0, ist das Vorzeichen der Auslenkung entgegengesetzt dem der treibenden Kraft qe E (t) , und deshalb ist Erstere relativ zur Letzteren um 180◦ phasenverschoben – anders als im Falle der transparenten Dielektrika, deren Resonanzfrequenzen oberhalb des sichtbaren Spektralbereiches liegen und deren Elektronen phasengleich mit der treibenden Kraft schwingen (Abb. 4.67). Freie Elektronen, die relativ zum einfallenden Licht außer Phase schwingen, senden Elementarwellen aus, die die ankommende Störung auslöschen. Die Folge ist, wie bereits gesagt wurde, eine rasch abklingende Brechungswelle. Auf ein Elektron, welches sich in einem elektrischen Leiter bewegt, wirkt im Mittel genau das einfallende Feld E (t). Die Dispersionsgleichung (3.72) eines dünnen Mediums können wir dann wie folgt erweitern: ⎤ ⎡ 2  N q f f e j e ⎣ ⎦. (4.79) + n2 (ω) = 1 + 2 − ω 2 + iγ ω 0 me −ω 2 + iγe ω ω j 0j j Der erste Term in der Klammer entspricht dem Beitrag des ungebundenen Elektrons, wobei N die Anzahl der Atome pro Volumeneinheit ist. Zu jedem dieser Atome gehö-

4 Die Ausbreitung des Lichts

266 F (t)

t F (t) = qe E(t)

Freie Elektronen

Gebundene Elektronen

t x

ω  ω0

in Phase

90◦ außer Phase t

x

ω ≈ ω0 180◦ außer Phase t

x

ω ω0 180◦ außer Phase t alle ω

Abb. 4.67: Schwingungen gebundener und freier Elektronen.

ren fe Leitungselektronen, die keine Eigenfrequenz besitzen. Der zweite Term in der Klammer ist der Beitrag der gebundenen Elektronen und entspricht Gleichung (3.72). Metalle erscheinen farbig, wenn die gebundenen Elektronen ihrer Atome – zusätzlich zur allgemeinen Absorption der freien Elektronen – an selektiven Absorptionen beteiligt sind. Dazu erinnern wir uns, dass ein Medium, das Licht einer bestimmten Frequenz stark absorbiert, dieses Licht nicht verschluckt, sondern in Wirklichkeit hauptsächlich selektiv reflektiert. Gold und Kupfer erscheinen rötlichgelb, weil nt mit der Wellenlänge wächst und Licht mit größeren Wellenlängen stärker reflektiert wird. Gold zum Beispiel sollte daher vorrangig für die längeren Wellen aus dem sichtbaren Bereich undurchlässig sein, und tatsächlich sieht eine sehr dünne (10−6 m) Goldfolie, gegen weißes Licht gehalten, blaugrün aus. Eine ungefähre Vorstellung von der Reaktion der Metalle auf Licht können wir uns mithilfe einiger vereinfachender Annahmen verschaffen. Dazu wollen wir den Beitrag der gebundenen Elektronen vernachlässigen; ebenso verfahren wir mit γe bei sehr großen Frequenzen ω. Damit ergibt sich N qe2 . (4.80) 0 me ω 2 Die letztgenannte Annahme gründet sich darauf, dass die Elektronen bei hohen Frequenzen zwischen je zwei Zusammenstößen mit anderen Teilchen sehr viele Schwingungen ausführen. Freie Elektronen und positiv geladene Ionen innerhalb eines Metalls kann man sich als Plasma vorstellen, dessen Dichte mit einer Eigenfrequenz n2 (ω) = 1 −

4.8 Optische Eigenschaften von Metallen

267

Tabelle 4.4: Kritische Wellenlängen und Frequenzen einiger Alkalimetalle.

Metall Lithium (Li) Natrium (Na) Kalium (K) Rubidium (Rb)

λp (gemessen)

λp (berechnet)

νp = c/λp (gemessen)

155 nm 210 nm 315 nm 340 nm

155 nm 209 nm 287 nm 322 nm

1,94 × 1015 Hz 1,43 × 1015 Hz 0,95 × 1015 Hz 0,88 × 1015 Hz

ωp , der Plasmafrequenz, oszilliert. Man kann zeigen, dass diese wiederum gleich 1/2  2 ist, und so wird N qe /0 me n2 (ω) = 1 − (ωp /ω)2 .

(4.81)

Die Plasmafrequenz ist ein kritischer Wert; unterhalb wird der Brechungsindex komplex, und die eindringende Welle nimmt von der Grenzfläche ausgehend exponentiell ab [siehe Gl. (4.77)]. Bei Frequenzen oberhalb von ωp ist n reell, die Absorption ist gering, und der Leiter ist durchsichtig. In letzterem Fall ist n kleiner als 1, wie es auch für Dielektrika bei sehr hohen Frequenzen zutrifft (v kann größer sein als c, siehe Abschn. 3.5). Wir können also erwarten, dass Metalle allgemein für Frequenzen im Röntgenbereich durchlässig sind. In Tabelle 4.4 sind die Plasmafrequenzen einiger Alkalimetalle zusammengestellt, die sogar ultraviolettes Licht durchlassen. Der Brechungsindex eines Metalls ist in der Regel komplex; bis zu welchem Grade eine ankommende Welle absorbiert wird, hängt von der Frequenz ab. Die äußeren Visiere der Apollo-Raumanzüge waren beispielsweise mit einer sehr dünnen Goldschicht überzogen (siehe Foto S. 268), die etwa 70 % des einfallenden Lichts reflektierte und bei großer Helligkeit (tiefstehende Sonne von vorne) verwendet wurde. Diese Beschichtung sollte die Wärmebelastung des Kühlsystems reduzieren, da sie im Infraroten stark reflektierte, Licht aus dem sichtbaren Spektralbereich jedoch in ausreichendem Maße durchließ. Ganz ähnlich aufgebaut sind preiswerte metallbeschichtete Sonnenbrillen, die man überall kaufen kann – eine solche Brille sollte man erwerben, um damit zu experimentieren. Die ionisierte Hochatmosphäre der Erde enthält freie Elektronen, die sich sehr ähnlich verhalten wie die in einem Metall. Der Brechungsindex eines solchen Mediums ist reell und für Frequenzen oberhalb von ωp kleiner als 1. Die Raumsonde Mariner IV machte sich diesen Effekt im Juli 1965 bei der Untersuchung der Ionosphäre des Planeten Mars, 261 Millionen Kilometer von der Erde entfernt, zunutze.14 Um eine Verbindung zwischen zwei weit voneinander entfernten Punkten auf der Erdoberfläche herzustellen, könnte man niederfrequente Wellen an der Ionosphäre abprallen lassen. Will man dagegen mit jemandem auf dem Mond sprechen, sollte man hochfrequente Signale benutzen, die von der Ionosphäre durchgelassen werden. 14

R. von Eshelman, Sci. Am. 220, 78 (1969).

4 Die Ausbreitung des Lichts

268

Edwin Aldrin jr. im Mare Tranquilitatis auf dem Mond. Der Fotograf, Neil Armstrong, spiegelt sich im goldbeschichteten Visier. (Foto mit frdl. Genehmigung von der NASA.)

Reflexion an Metallen Wir betrachten eine ebene Welle, die aus der Luft auf die Oberfläche eines elektrischen Leiters trifft. Die Brechungswelle, die sich in einem bestimmten Winkel zur Normalen ausbreitet, ist inhomogen. Nimmt jedoch die Leitfähigkeit des Mediums zu, so richten ˆn sich die Wellenfronten nach den Flächen konstanter Amplitude aus, bis kt und u nahezu parallel sind. In anderen Worten pflanzt sich eine Welle in einem guten Leiter unabhängig von θi stets senkrecht zur Oberfläche fort. Wir wollen nun den Reflexionsgrad R = Ir /Ii berechnen, wenn die Welle senkrecht auf die Metalloberfläche trifft – dies ist der einfachste Fall. Wir setzen ni = 1 und nt = nC (nC ist der komplexe Brechungsindex) und erhalten aus Gleichung (4.47)    nC − 1 ∗ nC − 1 (4.82) R= nC + 1 nC + 1 und daraus wegen nC = nR − inI R=

(nR − 1)2 + n2I

(nR + 1)2 + n2I

.

(4.83)

Geht die Leitfähigkeit des Stoffes gegen null, so haben wir ein Dielektrikum mit einem prinzipiell reellen Brechungsindex (nI = 0) und einem Dämpfungskoeffizienten α von null. Der Brechungsindex nt des brechenden Mediums ist dann gleich nR ; der Reflexionsgrad aus Gleichung (4.83) ist identisch mit dem aus Gleichung (4.67). Ist aber nt groß, nR dagegen vergleichsweise klein, so wird auch R groß (Aufgabe 4.95). Im nicht erreichbaren Grenzfall eines rein imaginären Brechungsindex würde die gesamte einfallende Flussdichte reflektiert (R = 1). Der Reflexionsgrad eines Metalls kann auch dann größer sein als der eines anderen Metalls, wenn nI des ersten kleiner ist. Festes Natrium etwa hat bei einer Wellenlänge von λ0 = 589,3 nm die Parameter

4.9 Alltägliche Aspekte der Wechselwirkung zwischen Licht und Materie

Reflexionsgrad R

Reflexionsgrad

1.0

R⊥

R

0

θi

90◦

Abb. 4.68: Typischer Verlauf des Reflexionsgrades für einen linear polarisierten weißen Lichtstrahl, der auf ein absorbierendes Medium fällt.

269

Frequenz, ν (Hz)

1.0 0.9 0.8 0.7 0.6 0.5 0.4 0.3 0.2 0.1

Al Cu

Au Ag 300

500 700 Wellenlänge, λ (nm)

900

1100

Abb. 4.69: Der Reflexionsgrad in Abhängigkeit von der Wellenlänge für Silber, Gold, Kupfer und Aluminium.

nR = 0,04, nI = 2,4 und R = 0,9; für Zinn ist nR = 1,5, nI = 5,3 und R = 0,8, und für einen Gallium-Einkristall erhält man nR = 3,7, nI = 5,4 und R = 0,7. Die Abhängigkeit der Komponenten R || und R⊥ vom Einfallswinkel bei schrägem Einfall (Abb. 4.68) ist bis zu einem gewissen Grade eine Funktion des absorbierenden Mediums. So ist R bei θi = 0 für Gold in weißem Licht rund 0,5, für Silber dagegen rund 0,9; die Kurven des Reflexionsgrades sehen jedoch sehr ähnlich aus und nähern sich für θi = 90◦ in beiden Fällen R = 1,0. Ebenso wie bei Dielektrika (Abb. 4.56) erreicht R || am so genannten Haupteinfallswinkel ein Minimum, das jetzt allerdings ungleich null ist. Abbildung 4.69 zeigt den Reflexionsgrad bei verschiedenen Wellenlängen und senkrechtem Einfall für verschiedene aufgedampfte Metallfilme unter idealen Bedingungen. Man sieht, dass Gold grünes und kürzerwelliges Licht recht gut durchlässt; Silber dagegen reflektiert im gesamten sichtbaren Bereich stark, ist jedoch für ultraviolettes Licht (etwa 316 nm) transparent. Die Reflexion an einer Metalloberfläche führt bei beiden Komponenten (d. h. parallel und senkrecht zur Einfallsebene) des Feldes zu Phasenverschiebungen, die in der Regel irgendwo zwischen 0 und π liegen. Eine Ausnahme tritt bei θi = 90◦ auf – dort beträgt die Phasenverschiebung beider Komponenten wie bei der Reflexion an einem Dielektrikum 180◦ .

4.9

Alltägliche Aspekte der Wechselwirkung zwischen Licht und Materie

Wenden wir uns nun einigen Phänomenen zu, die unsere Alltagswelt durch verschiedenste Farbspiele verschönern. Wie wir bereits besprochen haben (Abschn. 3.6.4),

270

4 Die Ausbreitung des Lichts

empfinden wir Licht als weiß, wenn es ungefähr gleiche Anteile von allen Frequenzen des sichtbaren Spektralbereichs enthält. Eine großflächige Lichtquelle – egal, ob sie natürlich oder künstlich ist – kann man sich daher aus Punkten zusammengesetzt vorstellen, deren jeder ein Lichtstrahlenbündel aussendet, das alle sichtbaren Frequenzen enthält. Vorausgesetzt, dass die Menschheit tatsächlich auf der Erde entstanden ist, sollte es nicht überraschen, dass wir Licht als weiß empfinden, dessen spektrale Zusammensetzung derjenigen des Sonnenlichts ähnelt. Ebenso weiß erscheint die Oberfläche eines stark reflektierenden, frequenzunabhängig und diffus streuenden Objekts unter weißem Licht, denn sie bewirkt im Wesentlichen dasselbe wie die beschriebene „weiße“ Lichtquelle. Wasser ist im Großen und Ganzen durchsichtig. Wasserdampf dagegen erscheint, wie zum Beispiel auch gemahlenes Glas, weiß. Der Grund hierfür ist einfach zu erklären: Sind die beteiligten Partikel klein, aber wesentlich größer als die eingestrahlten Wellenlängen, so tritt das Licht in jedes einzelne Teilchen ein, wird reflektiert und gebrochen und kommt schließlich wieder zurück – als weißes Licht, denn die erwähnten Vorgänge hängen nicht von der Wellenlänge ab (siehe Abschn. 3.6.4). Dieser Mechanismus sorgt dafür, dass Stoffe wie Zucker, Salz, Papier, Gewebe, Talkumpuder, Schnee und Anstriche weiß aussehen, obwohl sie aus durchsichtigen Teilchen oder Fasern bestehen. Auch ein Stückchen zerknitterte, zusammengeknüllte transparente Plastikfolie oder ein an sich durchsichtiger Stoff, der mit kleinen Luftbläschen gefüllt ist (geschlagenes Eiweiß, Rasierschaum), sind weiß. In der Regel nimmt man an, dass Zucker, Talkumpuder und Papier aus einer undurchsichtigen weißen Substanz bestehen; dass dies nicht stimmt, lässt sich leicht beweisen. Legen Sie etwas von den genannten Materialien (ein Stück weißes Papier, ein paar Körnchen Zucker oder etwas Puder) auf diese Buchseite und beleuchten Sie die Anordnung von hinten: Sie können mühelos hindurchschauen. Weiße Farbe stellt man her, indem man farblose, transparente Partikel wie Zink-, Titan- oder Bleioxid in einem ebenso transparenten Grundstoff wie Leinöl oder Acrylkunststoffen suspendiert. Haben Partikel und Grundstoff denselben Brechungsindex, so wird das Licht an den Grenzflächen der Körnchen selbstverständlich nicht reflektiert – Letztere verschwinden einfach in der Mischung, die selbst transparent bleibt. Unterscheiden sich die Brechungsindizes dagegen deutlich, dann tritt eine recht intensive Reflexion in allen Wellenlängenbereichen auf (Aufgabe 4.72), und der Anstrich erscheint undurchsichtig weiß [sehen Sie sich dazu noch einmal Gleichung (4.67) an]. Farbige Anstriche erhält man, wenn man Teilchen suspendiert, die alle Frequenzen außer dem gewünschten Bereich absorbieren. Argumentieren wir nun in entgegengesetzter Richtung: Lassen wir den relativen Index nti an den Faser- oder Korngrenzflächen abnehmen, so wird immer weniger Licht zurückgeworfen, und das Objekt erscheint weniger weiß. Ein nasses weißes Tuch wirkt

4.9 Alltägliche Aspekte der Wechselwirkung zwischen Licht und Materie

271

durchsichtiger und gräulich. Nasser Talkumpuder verliert sein strahlendes Weiß und wird schmutziggrau. Ein farbiges Tuch, das man in eine klare Flüssigkeit (Wasser, Gin oder Benzol) taucht, wirkt dunkler, weil der weiße Schleier verschwindet; die Farben sind satter und kräftiger, wie bei einem noch nicht getrockneten Aquarell. Eine diffus reflektierende Oberfläche, die im gesamten sichtbaren Bereich einen Teil des eingestrahlten Lichts absorbiert, sieht mattgrau aus. Je geringer der reflektierte Anteil ist, desto dunkler ist der Grauton; wird nahezu sämtliches Licht absorbiert, so erscheint das Objekt schwarz. Eine Oberfläche, die 70 oder 80 % des Lichts spiegelnd reflektiert, sieht grau glänzend aus, wie wir es von Metallen kennen. Wie im vorangegangenen Abschnitt erläutert wurde, besitzen Metalle sehr viele ungebundene Elektronen, die das Licht frequenzunabhängig äußerst effektiv streuen; sie sind nicht an Atome gebunden und haben daher keine Resonanzfrequenz. Außerdem sind die Amplituden ihrer Schwingungen um eine Größenordnung größer als bei gebundenen Elektronen. Das einfallende Licht kann nur einen Bruchteil einer Wellenlänge weit in das Metall eindringen, bis es vollständig ausgelöscht ist. Wenig oder gar kein Licht wird gebeugt; der größte Teil der Energie wird reflektiert, und nur ein ganz geringer Teil wird absorbiert. Beachten Sie, dass der wesentliche Unterschied zwischen einer grauen und einer grau glänzenden, spiegelnden Oberfläche in der Art der Reflexion (diffus oder spiegelnd) besteht. Wenn ein Künstler ein „weißes“, poliertes Metallstück (Silber oder Aluminium) malt, dann stellt er auf dessen Oberfläche Spiegelbilder von Gegenständen im Raum dar. Additive Farbmischung Licht erscheint farbig, wenn es unterschiedliche Anteile einzelner Spektralbereiche enthält. Abbildung 4.70 zeigt typische Frequenzverteilungen für rotes, grünes und blaues Licht. Angegeben sind die jeweils vorherrschenden Frequenzbereiche, aber die spektrale Zusammensetzung des Lichts, das einen ähnlichen Farbeindruck hervorruft, kann recht verschieden sein. Im frühen neunzehnten Jahrhundert wies Thomas Young nach, dass man sehr viele Farben durch Mischung dreier Lichtstrahlen erhalten kann, vorausgesetzt, die Frequenzen dieser Strahlen sind möglichst weit voneinander entfernt. Drei solche Strahlenbündel, die sich zu weißem Licht mischen lassen, heißen Grundfarben. Diese müssen nicht quasimonochromatisch sein, und es existiert nicht nur ein einziger Satz solcher Farben. Am häufigsten mischt man Rot (R), Grün (G) und Blau (B), weil sich damit besonders viele Farben erzeugen lassen. Sie sind beispielsweise für die gesamte Farbskala eines Fernsehbildes verantwortlich (man benutzt dort je einen roten, grünen und blauen Leuchtstoff). In Abbildung 4.71 sehen Sie, mit welchem Ergebnis sich die drei Grundfarben mischen lassen: Rotes plus blaues Licht ergibt Magenta (M), ein rötliches Purpur; blaues plus grünes Licht ergibt Cyan (C), ein Blaugrün oder Türkis; rotes plus grünes Licht ergibt

4 Die Ausbreitung des Lichts

272

Reflexionsgrad

1.0

Blau Grün

Rot Gelb 0.5 Weiß Magenta 0.0

380

460 540 620 Wellenlänge (nm)

Reflexionsgrad

1.0

Grün

0.5

0.0

380

460 540 620 Wellenlänge (nm)

1.0

Reflexionsgrad

700

Cyan

Blau

Abb. 4.71: Drei verschiedenfarbige Lichtstrahlen, die einander überlagern. Auch auf einem Fernsehbildschirm werden alle Farben aus den Grundfarben Rot, Grün und Blau gemischt.

700

Rot

0.5

0.0

380

460 540 620 Wellenlänge (nm)

700

Abb. 4.70: Reflexionskurven von blauen, grünen und roten Farbpigmenten. Gezeigt sind typische Formen, doch es gibt eine Vielzahl möglicher Variationen.

vielleicht überraschend Gelb (Y für engl. Yellow, zur Unterscheidung von G für Grün). Die Summe der drei Grundfarben ist Weiß: R+B+G=W M + G = W wegen R + B = M C + R = W wegen B + G = C Y + B = W wegen R + G = Y .

4.9 Alltägliche Aspekte der Wechselwirkung zwischen Licht und Materie

273

Tabelle 4.5: Häufig verwendete Wellenlängen von Licht, UV- und IR-Strahlung

λ (nm)

Spektrallinie

λ (nm)

Spektrallinie

334,1478 365,0146 404,6561 435,8343 479,9914 486,1327 546,0740 587,5618 589,2938 632,8

ultraviolette Quecksilberlinie ultraviolette Quecksilberlinie violette Quecksilberlinie blaue Quecksilberlinie blaue Cadmiumlinie blaue Wasserstofflinie grüne Quecksilberlinie gelbe Heliumlinie gelbe Natriumlinie Helium-Neon-Laser

643,8469 656,2725 676,4 694,3 706,5188 768,2 852,11 1013,98 1054 1064

rote Cadmiumlinie rote Wasserstofflinie Krypton-Ionenlaser Rubinlaser rote Heliumlinie rote Kaliumlinie IR-Cäsiumlinie IR-Quecksilberlinie Nd:Glas-Laser Nd:YAG-Laser

Je zwei farbige Lichtstrahlen, die sich zu Weiß mischen lassen, heißen Komplementärfarben; die letzten drei symbolischen Beziehungen bringen dies zum Ausdruck. Es ist dann R+B+G = W R+B =W−G=M B+G = W − R = C R+ G = W − B = Y. Ein Filter, der den blauen Anteil aus weißem Licht absorbiert, lässt demzufolge das gelbe Licht durch. Da die meisten Menschen nur wenig Erfahrung mit dem Mischen von Lichtstrahlen haben, überrascht es viele, dass ein roter und ein grüner Strahl zusammen Gelb ergeben, und zwar für einen großen Bereich von Rot- und Grüntönen. Die für die Farbwahrnehmung zuständigen Zapfen auf der Netzhaut führen im Wesentlichen eine Mittelung der Photonenfrequenzen durch, und das Gehirn „sieht“ Gelb, obwohl vielleicht überhaupt kein gelbes Licht vorhanden ist. Beispielsweise wird eine bestimmte Menge Grün mit 540 nm plus etwa dreimal so viel Rot mit 640 nm genau so wahrgenommen wie Gelb mit 580 nm. Wir können den Unterschied zwischen dem reinen Licht und der Mischung nicht feststellen. Eine leuchtend gelbe Rose reflektiert stark im Bereich von etwas über 700 nm bis hinunter zu etwa 540 nm, d. h., sie liefert uns Rot, Gelb und Grün. Leider gibt es ohne Spektrometer keine Möglichkeit herauszufinden, ob das gelbe Hemd, das Sie betrachten, tatsächlich nur zwischen ungefähr 577 nm und 597 nm reflektiert. Wenn Sie gern ein paar „gelbe“ Photonen sehen möchten, dann bieten sich hierfür die heute so weit verbreiteten Natriumdampflampen an, die reich an Licht mit 589 nm sind (siehe Abb. 4.72).

4 Die Ausbreitung des Lichts

274

relative Bestrahlungsstärke

16000 14000 12000 10000 8000 6000 4000 2000 0.0 588

588.5

589 589.5 Wellenlänge (nm)

590

Abb. 4.72: Ein Ausschnitt aus dem Natriumspektrum. Aus offensichtlichen Gründen wird es auch als NatriumDublett bezeichnet.

Mischen wir zum Beispiel Magenta und Gelb: M + Y = (R + B) + (R + G) = W + R . Es ergibt sich Rosa, eine Mischung aus Rot und Weiß. Dies führt uns zu einem anderen Gesichtspunkt: Wir empfinden eine Farbe als satt oder gesättigt, also tief und intensiv, wenn sie kein weißes Licht enthält. Rosa ist, wie Abbildung 4.73 zeigt, ungesättigtes Rot, sozusagen Rot auf einem weißen Hintergrund.

Reflexionsgrad

1.0

0.5

0.0

380

460

540

620

Wellenlänge (nm)

700

Abb. 4.73: Spektrale Verteilung der Reflexion eines rosafarbenen Pigments.

Subtraktive Farbmischung Der rötlichgelbe Farbton von Gold und Kupfer entsteht durch einen Mechanismus, der (in ähnlicher Form) auch für das Blau des Himmels verantwortlich ist. Kurz gesagt: Die Gasmoleküle in der Luft haben Resonanzfrequenzen im Ultravioletten; je mehr sich die Frequenz des eingestrahlten Lichts dem UV-Bereich nähert, umso größer sind die Amplituden der Molekülschwingungen. Deshalb entnehmen die Teilchen dem Licht Energie aus dem blauen Bereich und reemittieren blaue Strahlung in alle Richtungen; das komplementäre rote Ende des sichtbaren Bereiches wird im Wesentlichen unverändert durchgelassen. Dieser Vorgang ist analog zur selektiven Reflexion oder Streuung von gelb-rotem Licht an der Oberfläche einer Goldfolie, welche, wie bereits angemerkt, blaugrünes Licht durchlässt.

4.9 Alltägliche Aspekte der Wechselwirkung zwischen Licht und Materie

275

Die charakteristischen Farben der meisten Substanzen kommen durch selektive Absorption zustande. Wasser zum Beispiel erscheint ganz schwach blaugrün, denn es absorbiert im roten Spektralbereich – genauer gesagt hat das H2 O-Molekül eine breite Resonanz im Infraroten, die bis in den sichtbaren Bereich hineinreicht. Diese Absorption ist nicht sehr intensiv, deshalb wird rotes Licht von einer Wasseroberfläche nicht verstärkt reflektiert. Erst bei einer Wassertiefe von rund 30 m ist der rote Anteil nahezu vollkommen aus dem Sonnenlicht verschwunden. Die Farbe von braunen Augen, manchen Schmetterlingsflügeln, Glasperlen und Juwelen, Geldscheinen und Spielkarten kommt auf diese Weise zustande. Sehr viele natürliche Objekte erhalten ihre charakteristische Farbe durch selektive Absorption von Pigmentmolekülen. Deren Resonanzfrequenzen müssen offensichtlich im Sichtbaren liegen, im Gegensatz zu den Resonanzen von Atomen und den meisten anderen Molekülen, die im Infraroten oder Ultravioletten absorbieren. Die Energie von Photonen aus dem sichtbaren Spektralbereich liegt allerdings zwischen etwa 1,6 und 3,2 eV – dies ist zu wenig für die Anregung „normaler“ Elektronen, aber zu viel für die Anregung von Molekülschwingungen. Allerdings gibt es Atome wie Gold, die gebundene Elektronen in unvollständigen Schalen enthalten. Variationen in der Konfiguration solcher Schalen lassen sich mit relativ wenig Energieaufwand anregen. Daneben existiert eine große Gruppe natürlicher und künstlicher organischer Farbstoffmoleküle, die natürlich ebenfalls im Sichtbaren absorbieren. Sie alle bestehen aus langen Ketten von Atomen, die abwechselnd durch Mehrfachund Einfachbindungen miteinander verknüpft sind (so genannte konjugierte Systeme). Ein typischer Vertreter ist das Carotin-Molekül C40 H56 (Abb. 4.74). Carotinoide sehen gelb bis rot aus und verleihen Möhren („Karotten“), Tomaten, Narzissen, Löwenzahn und herbstlich gefärbten Blättern ihre charakteristische Farbe; auch im menschlichen Organismus kommen sie vor. Eine andere bekannte Gruppe natürlicher Pigmente sind die Chlorophyllfarbstoffe; die lange Kette ist hier teilweise zu einem Ring verknüpft. Alle konjugierten Systeme dieser Art enthalten besonders bewegliche Elektronen, so genannte π-Elektronen. Diese sind nicht an bestimmte Atome gebunden, sondern können sich in dem relativ großen Bereich Kohlenstoff der Kette oder des Rings aufhalten. In der quanWasserstoff tenmechanischen Terminologie spricht man von langwelligen, niederfrequenten und daher niederenergetischen elektronischen Zuständen. Um ein π-Elektron in einen angeregten Zustand anzuheben, ist vergleichweise wenig Energie notwendig, die von Photonen des sichtbaren Bereichs geliefert Abb. 4.74: Das Carotin-Molekül. werden kann.

4 Die Ausbreitung des Lichts

276

vorwiegend Gelb

B

Weiß

G

Transmissionsgrad

Gelb

0.5

0.0

380

460 540 620 Wellenlänge (nm)

1.0 Transmissionsgrad

Stellen wir uns eine gefärbte Glasscheibe vor, deren Farbstoff eine Resonanz im blauen Spektralbereich besitzt und dort stark absorbiert. Schaut man durch diese Scheibe auf eine weiße Lichtquelle, deren Farbe sich aus Rot, Grün und Blau zusammensetzt, so absorbiert die Scheibe das Blau; die durchgelassenen Farben Grün und Rot summieren sich zu Gelb, daher sieht das Glas gelb aus (Abb. 4.75). Gelbe Kleidung, gelbes Papier, gelbe Wasserfarbe und gelbe Tinte: Sie alle absorbie-

1.0

700

Magenta

0.5

0.0

380

460 540 620 Wellenlänge (nm)

1.0 Transmissionsgrad

Die Energieniveaus eines einzelnen Atoms sind exakt definiert, d. h., die Resonanzen sind sehr scharf. In Festkörpern und Flüssigkeiten hingegen kommen die Atome einander so nahe, dass sich die Energieniveaus zu Bändern verbreitern, und die Resonanzen erstrecken sich über einen weiten Frequenzbereich. Folglich ist zu erwarten, dass ein Farbstoff in einem größeren Spektralbereich absorbiert – andernfalls würde er die meisten Frequenzen reflektieren und mehr oder weniger weiß erscheinen.

700 Cyan

0.5

0.0

380

460 540 620 Wellenlänge (nm)

700

Abb. 4.76: Transmissionskurven verschiedener Farbfilter.

R

G Gelb

Abb. 4.75: Gelbes Glas.

Bl au

Gr ün

Ro t

R

ren selektiv den blauen Anteil weißen Lichts. Betrachtet man durch ein solches Gelbfilter ein rein blaues Objekt, so wirkt dieses schwarz. In diesem Fall färbt das Filter das durchgelassene Licht gelb, indem es den Blauanteil entfernt, und man spricht dann von subtraktiver Farbmischung im Gegensatz zur oben erläuterten additiven Farbmischung, die durch die Überlagerung verschieden gefärbter Lichtstrahlen entsteht.

4.9 Alltägliche Aspekte der Wechselwirkung zwischen Licht und Materie

277

Auch die Fasern von weißem Papier oder Gewebe sind im Wesentlichen transparent – färbt man sie ein, so verhält sich jede einzelne Faser wie das beschriebene gefärbte Glasstück. Das einfallende Licht trifft auf das Papier und wird durch die Fasern mehrfach reflektiert und gebrochen; außerdem wird dem Licht diejenige spektrale Komponente entnommen, die der Farbstoff selektiv absorbiert. Das zurückgeworfene Licht ist dann entsprechend gefärbt. Dieser Mechanismus lässt beispielsweise Blätter grün und Bananen gelb aussehen. Gewöhnliche blaue Tinte sieht blau aus – egal, ob man das reflektierte Licht betrachtet oder die Tintenflasche gegen eine Lichtquelle hält, um das durchgelassene Licht zu sehen. Tropft man jedoch ein bisschen Tinte auf eine Glasscheibe und lässt das Lösungsmittel verdampfen, so passiert etwas Interessantes: Das konzentrierte Pigment absorbiert so effektiv, dass die Farbe bevorzugt bei der Resonanzfrequenz reflektiert. Damit kommen wir wieder auf die Tatsache zurück, dass ein starker Absorber (großes nI ) auch ein starker Reflektor ist. Konzentrierte blaugrüne Tinte reflektiert demnach rot, blaurote Tinte wirft grünes Licht zurück. Mithilfe eines Filzstifts (Folienschreiber für Overheadprojektoren sind besonders gut geeignet) können Sie dies leicht nachvollziehen. Achten Sie aber darauf, dass Sie nur das reflektierte Licht betrachten, dass die Probe also nicht von unten beleuchtet wird. Folgende Methode ist besonders einfach: Geben Sie farbige Tinte auf eine schwarze, nicht sehr stark absorbierende Fläche (fahren Sie beispielsweise mit einem roten Filzstift über schwarzes Glanzpapier in einer Illustrierten). Das reflektierte Licht ist grün. Sie können auch den Farbstoff Enzianviolett (Tinte) in einer möglichst dicken Schicht auf einen Objektträger bringen – wenn die Farbe getrocknet ist, werden Sie feststellen, dass die Farben des durchgelassenen und des reflektierten Lichts zueinander komplementär sind. Man kann das gesamte Farbenspektrum (einschließlich Rot, Grün und Blau) erzeugen, indem man Licht durch geeignete Kombinationen von Filtern in den Farben Magenta, Cyan und Gelb fallen lässt (Abb. 4.76). Diese drei sind die Primär- oder Grundfarben der subtraktiven Farbmischung und damit auch die Grundfarben des Farbkastens (im alltäglichen Sprachgebrauch bezeichnet man Magenta oft als Rot und Cyan als Blau). Sie sind auch die Farben für fotografische Farbpigmente und für die Tinten, mit denen Farbbilder gedruckt werden. Ein Bild in einer Zeitschrift ist keine Quelle von farbigem Licht, wie es für einen Fernsehbildschirm der Fall ist. Weißes Licht aus einer Lampe oder dem Himmel fällt auf die Seite, verschiedene Wellenlängen werden absorbiert und das, was nicht absorbiert wurde, wird reflektiert und erzeugt so das „farbige“ optische Feld, das dem Bild entspricht. Im Idealfall erhält man durch das Mischen aller subtraktiven Primärfarben (egal, ob durch Mischen von Farbstoffen oder durch Übereinanderstapeln von Filtern) Schwarz. Jedes Filter absorbiert eine Komponente des weißen Lichts, und gemeinsam absorbieren sie das gesamte Licht. Ein Objekt, das Licht im gesamten sichtbaren Spektralbereich absorbiert, erscheint schwarz. Das heißt aber nicht, dass es überhaupt keine Reflexion gäbe: In schwarzem Lackleder kann man sich spiegeln, und eine raue schwarze Oberfläche reflektiert

4 Die Ausbreitung des Lichts

278

ebenso, allerdings diffus. Wenn Sie noch ein wenig blaue und rote Tinte übrig behalten haben, mischen Sie ein bisschen Grün dazu – Sie erhalten eine schwarze Flüssigkeit. Farbfilter arbeiten wie Tinten und Farbstoffe; sie absorbieren bestimmte Frequenzen und lassen den Rest durch. Alle Filter streuen die Frequenzen, die sie entfernen sollen, sodass die durchgelassene Farbe umso reiner wird, je stärker die Absorption ist (wir könnten auch sagen, je „dicker“ das Filter). Abbildung 4.77 zeigt überlappende Magenta-, Cyan- und Gelbfilter sowie die resultierenden Farben, die unter Beleuchtung mit weißem Licht durchgelassen werden. Die Farben sind die gleichen wie jene, die von einem mit Tinten in Magenta, Cyan und Gelb gedruckten Foto reflektiert werden.

Magenta

Blau

Cyan

Schwarz Rot

Grün

Gelb

Abb. 4.77: Überlappende Magenta-, Cyan- und Gelbfilter, von hinten mit weißem Licht beleuchtet.

Angenommen, weißes Licht fällt auf ein Cyanfilter, hinter dem ein Gelbfilter folgt. Weißes Licht kann man sich als Kombination von Rot, Blau und Grün vorstellen. Das Cyanfilter absorbiert Rot und lässt Blau und Grün durch. Durch Änderung der Dichte (der Dicke) der Filter kann der resultierende Grünton variiert werden, ganz ähnlich wie das Hinzufügen von etwas mehr gelbem zu blauem Farbstoff das Grün heller macht. Unter weißem Licht wird die Kombination aus einem dicken Gelbfilter (welches das meiste Blau entfernt) und einem dünnen Magentafilter (das viel Rot und Blau sowie etwas Gelb durchlässt) wieder eine Mischung durchlassen, die aus viel Rot und ein wenig Gelb besteht, also orange aussieht. Die bis jetzt erläuterten farbgebenden Mechanismen beruhen auf Reflexion, Beugung und Absorption. Farben können auch auf andere Weise entstehen, wie später genauer erklärt werden soll. Der Pillendreher (Skarabäus), ein Käfer, schillert beispielsweise in allen Farben des Regenbogens, die durch Beugungsgitter auf den Flügeldecken erzeugt werden. Wellenlängenabhängige Interferenzvorgänge sind für die Farbspiele von Ölflecken auf Wasser, von Perlmutt, Seifenblasen, Pfauenfedern, Schmetterlingsflügeln und Kolibris verantwortlich.

4.10 Die stokessche Behandlung der Reflexion und Brechung

279

Beispiel 4.7 Fünf Flächen eines Würfels sind mit leuchtenden Farben bemalt: rot, blau, magenta, cyan und gelb; die sechste Fläche ist weiß. In welchen Farben erscheinen die verschiedenen Flächen, wenn sie durch ein Stück magentafarbenes Bleiglas betrachtet werden? Eräutern Sie Ihre Antwort. Lösung Das Filter lässt rotes und blaues Licht durch, während es grünes Licht schluckt. Magneta bleibt magenta. Cyan wird zu blau. Gelb erscheint rot, und die weiße Fläche erscheint magenta.

4.10 Die stokessche Behandlung der Reflexion und Brechung Ein eleganter, neuartiger Ansatz zur Behandlung von Reflexion und Brechung an einer Grenzfläche wurde von Sir George Gabriel Stokes (1819–1903), einem britischen Physiker, erarbeitet. Um dies nachzuvollziehen, betrachten wir eine Welle mit der Amplitude E0i , die auf die ebene Grenzfläche zwischen zwei Dielektrika trifft (Abb. 4.78 a). Wie in diesem Kapitel bereits besprochen wurde, gilt dann E0r = rE0i und E0t = tE0i mit r und t als reflektierter bzw. durchgelassener Teilamplitude (ni = n1 und nt = n2 ). Denken wir auch hier wieder daran, dass das fermatsche Prinzip zum Umkehrungsprinzip führte. Das bedeutet, auch eine Situation wie in Abbildung 4.78 b, wo sämtliche Strahlrichtungen umgekehrt sind, muss physikalisch erlaubt sein. Vorausgesetzt, dass es keine Absorption gibt, muss jeder Wellenverlauf reversibel sein. In der Terminologie der modernen Physik nennt man dies Invarianz gegenüber der Zeitumkehr: Wenn ein bestimmter Prozess ablaufen kann, gilt dies auch für den umgekehrten Prozess. Könnten wir einen Film drehen, der den Einfall einer Welle auf eine Grenzfläche sowie deren Brechung und Reflexion zeigt, und ließen wir diesen Film rückwärts ablaufen, so müsste die dann abgebildete Situation physikalisch ebenfalls realisierbar sein. Betrachten Sie dazu Abbildung 4.78 c: Hier gibt es zwei einfallende Wellen mit den Amplituden E0i r und E0i t. Ein Teil der Welle mit der Amplitude E0i t wird an der Grenzfläche reflektiert, ein Teil wird durchgelassen. Ohne weitere Annahmen seien r  und t der Amplitudenkoeffizient der Reflexion bzw. der Transmission für eine von unten einfallende Welle (ni = n2 , nt = n1 ). Folglich ist der reflektierte Anteil gleich E0i tr  , der durchgelassene Anteil ist E0i tt . Analog spaltet sich die einfallende Welle mit der Amplitude E0i r in Teile mit den Amplituden E0i rr

4 Die Ausbreitung des Lichts

280

(Eoi t)t Eoi

Eoi r

Eoi

θ1 θ1

θ2

Eoi r

Eoi r

(Eoi r)r

θ1 θ1

Eoi t

θ2

Eoi t

(Eoi t)r 

Eoi t

(Eoi r)t (a)

(b)

(c)

Abb. 4.78: Stokessche Behandlung der Reflexion und Brechung.

und E0i rt. Wenn die Anordnung in Abbildung 4.78 c identisch mit derjenigen in Bild 4.78 b sein soll, so muss offensichtlich gelten E0i tt + E0i rr = E0i

(4.84)

E0i rt + E0i tr  = 0 .

(4.85)

und Daher ist tt = 1 − r 2

(4.86)

r  = −r .

(4.87)

und Die beiden letzten Gleichungen bezeichnet man als stokessche Relationen. Diese Diskussion muss allerdings etwas vorsichtiger geführt werden, als es in der Regel üblich ist: Es ist hervorzuheben, dass die Amplitudenkoeffizienten von den Einfallswinkeln abhängen, sodass eine bessere Schreibweise der stokesschen Relationen lautet t (θ1 ) t (θ2 ) = 1 − r 2 (θ1 )

(4.88)

und r  (θ2 ) = −r (θ1 )

(4.89)

mit n1 sin θ1 = n2 sin θ2 . Das negative Vorzeichen in der zweiten Gleichung sagt aus, dass der Phasenunterschied zwischen der innen und der außen reflektierten Welle 180◦ beträgt. Dabei muss man unbedingt berücksichtigen, dass die Winkel θ1 und θ2 miteinander durch das snelliussche Gesetz verknüpft sind. Beachten Sie auch, dass nirgends festgelegt wurde, ob n1 größer als n2 ist oder umgekehrt. Die Beziehungen (4.88) und (4.89) müssen also für beide Fälle gelten. Wir wollen kurz auf eine der fresnelschen Gleichungen zurückkommen, r⊥ = −

sin (θi − θt ) . sin (θi + θt )

[4.42]

4.11 Photonen, Wellen und Wahrscheinlichkeit

281

Tritt ein Strahl wie in Abbildung 4.78 a von oben ein und nehmen wir n2 > n1 an, so berechnet man r⊥ , indem man θi = θ1 und θt = θ2 setzt (äußere Reflexion); θ2 ergibt sich aus dem snelliusschen Gesetz. Tritt ein Strahl dagegen im selben Winkel, aber von unten ein (jetzt handelt es sich um innere Reflexion), so ist wieder θi = θ1 , was wir in Gleichung (4.42) einsetzen können, aber θt ist nicht θ2 . Die Werte von r⊥ für innere und äußere Reflexion unterscheiden sich offensichtlich auch bei identischem Einfallswinkel. Nehmen wir nun für den Fall der inneren Reflexion an, dass θi = θ2 ist. Dann ist θt = θ1 , die Strahlrichtungen sind gerade umgekehrt im Vergleich zur ersten Situation, und Gleichung (4.42) liefert  (θ2 ) = − r⊥

sin (θ2 − θ1 ) . sin (θ2 + θ1 )

Obwohl es vielleicht nicht nötig ist, soll nochmals darauf hingeweisen werden, dass dieses Resultat genau das Negative des Ergebnisses für die äußere Reflexion und θi = θ1 ist. Es gilt demnach  (θ2 ) = −r⊥ (θ1 ) . r⊥

(4.90)

Durch den Gebrauch gestrichener und ungestrichener Symbole für die Amplitudenkoeffizienten soll verdeutlicht werden, dass die zugehörigen Winkel über das snelliussche Gesetz miteinander verknüpft sind. Das Vertauschen von θi und θt in Gleichung (4.43) liefert in ähnlicher Weise r || (θ2 ) = −r || (θ1 ) .

(4.91)

Der Phasenunterschied von 180◦ zwischen den Komponenten jedes Paares ist in Abbildung 4.52 zu sehen. Denken Sie aber daran, dass für θi = θp gilt θt = θp und umgekehrt (Aufgabe 4.100). Geht θi über θc hinaus, gibt es keine gebrochene Welle; Gleichung (4.89) kann nicht angewendet werden und der Phasenunterschied ist, wie bereits gezeigt wurde, von 180◦ verschieden. Häufig wird an dieser Stelle der Schluss gezogen, dass sich die Phasen der parallelen und der senkrechten Komponente bei der äußeren Reflexion des Strahls um π rad verschieben, während bei der inneren Reflexion gar keine Phasenverschiebung auftritt. Dies ist falsch, wie Sie an den Abbildungen 4.53 a und 4.54 a sehen können.

4.11 Photonen, Wellen und Wahrscheinlichkeit Die theoretischen Grundlagen der Optik beruhen zum großen Teil auf der Wellentheorie. Wir nehmen es als gegeben hin, dass das Phänomen „Welle“ tatsächlich existiert und dass wir es verstehen. Die Streuung zum Beispiel scheint nur mithilfe der Interferenz erklärbar zu sein – und klassische Teilchen interferieren einfach nicht. Ein Lichtstrahl pflanzt sich in einem dichten Medium in Vorwärtsrichtung fort, weil die Interferenz in allen anderen Raumrichtungen nahezu zur Auslöschung der Welle

282

4 Die Ausbreitung des Lichts

führt. Daher fließt die Energie fast nur in die Richtung, in der eine konstruktive Überlagerung stattfindet – nach vorne. Dies führt uns nun aber zu interessanten Fragen bezüglich der Natur der Interferenz und der üblichen Interpretation dieser Vorgänge. Die Interferenz ist ein nicht lokalisiertes Phänomen; sie kann niemals nur in einem einzigen Punkt des Raumes stattfinden, obwohl oft von einer Interferenz „im Punkt P “ gesprochen wird. Kommt es in einem bestimmten Punkt zur konstruktiven Interferenz (also Verstärkung), so kann diese zusätzliche Energie nach dem Energieerhaltungssatz nicht aus dem Nichts entstanden sein. Irgendwo muss es gleichzeitig zur destruktiven Interferenz (Auslöschung) von Wellen kommen. Das Phänomen der Interferenz findet in einem größeren räumlichen Gebiet statt, und zwar in koordinierter Weise, bei der die Gesamtmenge der Strahlungsenergie konstant bleibt. Betrachten wir nun einen Lichtstrahl, der ein dichtes Medium durchdringt (Abb. 4.6). Breiten sich reale Energie transportierende elektromagnetische Elementarwellen (die nie wirklich gemessen wurden) seitlich aus, um sich dann überall außerhalb des Strahls durch destruktive Interferenz auszulöschen? Wenn dies so wäre, dann müsste die nach außen transportierte Energie auf unerklärliche Art und Weise in den Strahl zurückfließen, denn die seitliche Nettostreuung ist gleich null. Dies gilt unabhängig von der Entfernung von P und betrifft außerdem alle Interferenzeffekte (Kapitel 9). Wenn zwei oder mehr elektromagnetische Wellen außer Phase an einem Punkt P ankommen, wo sie einander auslöschen, was bedeutet das dann für ihre Energie? Diese kann zwar umverteilt werden, aber Energien können sich nicht gegenseitig auslöschen. Aus der Quantenmechanik wissen wir, dass die Interferenz eines der grundlegenden Geheimnisse der Physik ist. Erinnern wir uns, dass Einstein warnte: Atome senden keine kugelförmigen Elementarwellen aus. Haben wir das klassische Wellenfeld vielleicht zu wörtlich interpretiert? Genau genommen existiert die klassische elektromagnetische Welle mit ihrer kontinuierlichen Energieverteilung nicht. Wahrscheinlich sollten wir uns die Elementarwellen und ihre Überlagerungsmuster nicht als reales Wellenfeld vorstellen, sondern als nützliches theoretisches Hilfsmittel, das uns sagt, wohin das Licht gelangt. Mithilfe der maxwellschen Gleichungen ist es jedenfalls möglich, die makroskopische Verteilung der elektromagnetischen Energie im Raum zu berechnen. Verfolgen wir den semiklassischen Weg weiter. Wir stellen uns eine Verteilung einer Strahlung vor, die als Funktion des Winkels θ mit der Ausbreitungsachse gegeben ist. Betrachten wir zum Beispiel die Bestrahlungsstärke auf einem Bildschirm, der sich in hinreichend weiter Entfernung von einer spaltförmigen Öffnung (siehe Abb. 10.14) befindet. Es ist dann I (θ) = I (0) sinc2 β (θ). Nun beobachten wir das entstehende Muster nicht mit dem Auge, sondern mit einem Detektor, der aus einer Blende mit nachgeschaltetem Photomultiplier besteht. Ein solches Gerät können wir in jedem beliebigen Punkt installieren, um die Anzahl der Photonen, N (θ), zu messen, die in einem bestimmten Zeitintervall im jeweiligen Punkt auf den Schirm treffen. Nach sehr vielen solchen Messungen erhalten wir eine räumliche Verteilung der

4.11 Photonen, Wellen und Wahrscheinlichkeit

283

Photonenzahl, deren Form der oben angegebenen Beziehung für die Bestrahlungsstärke entspricht: N (θ) = N (0) sinc2 β (θ). Die Anzahl der gemessenen Photonen ist proportional der Bestrahlungsstärke. Eine abzählbare Größe ist für eine statistische Behandlung prädestiniert. Wir können also die Wahrscheinlichkeit diskutieren, ein Photon in einem bestimmten Punkt des Schirms anzutreffen, d. h., wir können eine Wahrscheinlichkeitsverteilung ähnlich wie in Abbildung 3.23 konstruieren. Da die Ortsvariablen (θ, x, y oder z) kontinuierlich sind, müssen wir eine Wahrscheinlichkeitsdichte W (θ) einführen. W (θ) dθ ist dann die Wahrscheinlichkeit, ein Photon im infinitesimalen Bereich zwischen θ und θ + dθ zu finden. Im diskutierten Fall ist W (θ) = W (0) sinc2 β (θ). Das Quadrat der Amplitude des elektrischen Nettofeldes entspricht der Bestrahlungsstärke im zugehörigen Punkt des Raumes (welche direkt gemessen werden kann) und diese wiederum ist gleich der Wahrscheinlichkeit, Photonen in diesem Punkt zu finden. Entsprechend wollen wir vorläufig eine Wahrscheinlichkeitsamplitude definieren: Das Quadrat des Absolutwertes dieser Größe soll gleich der Wahrscheinlichkeitsdichte sein. Das Nettofeld E0 in P kann dann als proportional zu einer semiklassischen Wahrscheinlichkeitsamplitude angesehen werden: Die Wahrscheinlichkeit, in einem bestimmten Punkt des Raumes ein Photon anzutreffen, hängt von der Bestrahlungsstärke in diesem Punkt ab, und es gilt I ∝ E02 . Dies steht im Einklang mit Einsteins Begriff des Lichtfeldes, das Max Born (der Vorreiter der statistischen Interpretation der Quantenmechanik) als Gespensterfeld bezeichnete. In diesem Sinne sind die Wellen des Feldes ein Ausdruck dafür, wie sich die Photonen im Raum verteilen, denn das Quadrat des Absolutbetrages der Amplitude der Welle ist in irgendeiner Form mit der Wahrscheinlichkeitsdichte der ankommenden Photonen verknüpft. In der formalen Behandlung der Quantenmechanik wird die Wahrscheinlichkeitsamplitude generell als komplexe Größe betrachtet, deren Betragsquadrat der Wahrscheinlichkeitsdichte entspricht (die Wellenfunktion Schrödingers ist also eine Wahrscheinlichkeitsamplitude). So war es zwar vernünftig, E0 als die Entsprechung einer semiklassischen Wahrscheinlichkeitsamplitude anzusehen, aber diese Vorstellung lässt sich, so wie sie ist, nicht in die Quantentheorie übernehmen. Dennoch legen es die bisherigen Ausführungen nahe, den Streuprozess (formuliert anhand von Wahrscheinlichkeiten) als Grundlage einer mathematischen Beschreibung zu wählen. Jede gestreute Elementarwelle ist dann ein Maß der Wahrscheinlichkeitsamplitude zu einem bestimmten Weg, den das Licht zwischen zwei Punkten nimmt; das elektrische Nettofeld in P ist gleich der Summe aller gestreuten Felder, die auf sämtlichen möglichen Wegen ankommen. Eine diesem Ansatz entsprechende quantenmechanische Behandlung wurde von Feynman, Schwinger, Tomonaga und Dyson im Zuge der Entwicklung der Quantenelektrodynamik ausgearbeitet. Sie besagt kurz gesagt Folgendes: Das sichtbare Ergebnis eines Ereignisses wird bestimmt durch die Superposition (Überlagerung) aller verschiedenen Wahrscheinlichkeitsamplituden, die wiederum zu allen Wegen gehören, auf denen das Ereignis ablaufen kann. Mit anderen

4 Die Ausbreitung des Lichts

284

Worten, jedem dieser möglichen Wege wird eine komplexe Wahrscheinlichkeitsamplitude als mathematische Darstellung zugeordnet. Diese Amplituden überlagern einander – und interferieren, wie es komplexen Größen eben möglich ist – zu einer Netto-Wahrscheinlichkeitsamplitude des betreffenden Ereignisses. Im Folgenden soll diese Analyse kurz und in stark vereinfachter Form erläutert werden.

4.11.1 Quantenelektrodynamik Von der Natur des Lichts hatte Feynman eine recht klare Ansicht: Ich möchte betonen, dass Licht aus Teilchen besteht. Es ist äußerst wichtig zu wissen, dass sich Licht wie ein Partikelstrom verhält, insbesondere für diejenigen unter Ihnen, die zur Schule gegangen sind und dort wahrscheinlich irgendetwas über die Wellennatur des Lichts gehört haben werden. Ich sage Ihnen jetzt, wie sich Licht tatsächlich verhält: Wie ein Strom von Teilchen. Für Feynman besteht Licht aus Teilchen (wie ursprünglich auch Newton annahm), aus einem Strom von Photonen, deren Verhalten als Gesamtheit statistisch vorhergesagt werden kann. Treffen zum Beispiel 100 Photonen senkrecht aus der Luft auf eine Glasscheibe, so werden im Mittel vier von ihnen an der ersten Grenzfläche reflektiert. Welche vier es sind und nach welchen Gesichtspunkten diese ausgewählt werden, bleibt ein Geheimnis. Was man experimentell nachweisen kann, ist, dass vier Prozent des einfallenden Lichts reflektiert werden (Abschn. 4.6.3). Feynmans Analyse geht von einigen allgemeinen Rechenregeln aus, deren einzige Rechtfertigung darin liegt, dass sie die richtigen Ergebnisse liefern. Dies sind: (1) Die Wahrscheinlichkeitsamplitude für das Eintreten eines Ereignisses ist gleich der „Summe“ der Wahrscheinlichkeitsamplituden aller möglichen Pfade, auf denen das Ereignis eintreten kann. (2) Jede dieser einzelnen Wahrscheinlichkeitsamplituden lässt sich als komplexe Größe darstellen. Wir wollen die verschiedenen Teilamplituden nicht analytisch zusammensetzen, sondern auf die Zeigerdarstellung (Abschn. 2.6) zurückgreifen, um die Summation zu approximieren und so zu einer resultierenden Wahrscheinlichkeitsamplitude zu gelangen. (3) Die Wahrscheinlichkeit für das Eintreten eines Ereignisses ist proportional zum Betragsquadrat der zugehörigen resultierenden Wahrscheinlichkeitsamplitude. Einen Eindruck vom Gang der Berechnungen können wir uns anhand des Reflexionsbildes in Abbildung 4.79 verschaffen. Hier beleuchtet eine Punktquelle S einen Spiegel, woraufhin das Licht von jedem Punkt des Spiegels in jede Richtung aufwärts gestreut wird. Wir wollen bestimmen, mit welcher Wahrscheinlichkeit ein Photon an einem im Punkt P befindlichen Detektor ankommt. Zur besseren Orientierung bietet es sich an, das vertraute Modell der Elementarwellen zu benutzen – dies wird Ihnen das Verfolgen der Argumentation erleichtern, insbesondere, wenn Sie noch an die Existenz klassischer elektromagnetischer Wellen glauben.

4.11 Photonen, Wellen und Wahrscheinlichkeit

S

285

P

Abb. 4.79: Schematische Darstellung der Reflexion: Eine von S ausgehende Welle breitet sich über die Oberfläche des Spiegels aus. Infolgedessen streut jedes Atom der Oberfläche das Licht in alle Richtungen aufwärts. Zu der in P ankommenden Welle tragen Elementarwellen sämtlicher Streuzentren bei.

Um die Behandlung des Problems etwas zu vereinfachen, nehmen wir an, dass der Spiegel die Form eines sehr schmalen Streifens hat. Damit wird das Problem quasi eindimensional, konzeptionell ändert sich jedoch nichts. Wir teilen diesen Streifen in viele gleich lange Abschnitte (Abb. 4.80 a), von denen jeweils ein möglicher Pfad nach P ausgeht. (Natürlich wirkt jedes Atom an der Oberfläche als Streuzentrum, es gibt also ein Vielfaches der eingezeichneten Pfade.) Aus der klassischen Behandlung wissen wir, dass jede Route von S über den Spiegel zu P dem Pfad einer gestreuten Elementarwelle entspricht und dass Amplitude (E0j ) und Phase sämtlicher in P ankommenden Elementarwellen die resultierende Amplitude E0 bestimmen. Bei der Diskussion des fermatschen Prinzips haben wir gesehen, dass die Phase jeder dieser in P ankommenden Elementarwellen von der optischen Weglänge von S über den Spiegel nach P abhängt. Je größer diese Weglänge außerdem ist, umso mehr breitet sich das Licht aus (entsprechend dem quadratischen Entfernungsgesetz) und umso geringer ist die Amplitude der in P ankommenden Elementarwelle. Abbildung 4.80 b zeigt die optische Weglänge für alle möglichen Pfade. Das Minimum liegt bei demjenigen Pfad, für den θi = θr ist und den man experimentell beobachtet (S-I-P ). Eine große Änderung der optischen Weglänge wie zwischen (S-A-P ) und (S-B-P ) führt zu einer großen Phasendifferenz und einer entsprechend starken Rotation der Zeiger in Abbildung 4.80 c. Schreitet man von A zu B, C und weiter bis I, so nimmt die optische Weglänge immer langsamer ab, und die Richtung jedes Zeigers eilt derjenigen ihres Vorgängers immer weniger voraus (wie es durch den Anstieg der Kurve zum Ausdruck kommt). Die Zeiger links von I rotieren demnach von A nach I entgegengesetzt dem Uhrzeigersinn. Da die optische Weglänge in I ein Minimum erreicht, sind die Zeiger dort lang und unterscheiden sich im Phasenwinkel nur geringfügig. Geht man von I weiter zu J, K bis zu Q, so wächst die optische Weglänge immer schneller, und der Winkel jedes Zeigers bleibt immer weiter hinter

4 Die Ausbreitung des Lichts

286

S

P

A B C D E F G H I J K LM N O P Q

OWL

(a)

A B C D E F G H I J K LM N O P Q (b) K L J C M Q B D N I P E A O F H G (c)

Abb. 4.80: Die feynmansche Analyse der Reflexion mithilfe der Quantenelektrodynamik. (a) Einige mögliche Pfade von S nach P , die über den Spiegel führen. (b) Die optische Weglänge für Licht, das jeweils einen der in (a) gezeigten Pfade zurücklegt. (c) Zu jedem Pfad gehört eine Wahrscheinlichkeitsamplitude. Alle diese Amplituden überlagern einander zu einer Netto-Amplitude.

demjenigen ihres Vorgängers zurück. Die Zeiger rechts von I rotieren also von I nach Q im Uhrzeigersinn. In Abbildung 4.80 c wurde die resultierende Amplitude (als Verbindungslinie zwischen Anfangs- und Endpunkt) eingezeichnet. Im klassischen Bild entspricht sie der Amplitude des elektrischen Feldes in P . Die Bestrahlungsstärke I ist proportional zum Quadrat dieser Netto-Feldamplitude, das wiederum ein Maß für die Wahrscheinlichkeit sein sollte, mit einem Detektor im Punkt P ein Photon zu registrieren. Wir wollen nun über die klassischen Konzepte der gestreuten Elementarwellen und elektrischen Felder hinausgehen (doch werden wir uns weiterhin von diesen Ideen leiten lassen), um das Problem quantenmechanisch zu behandeln. Photonen können auf unzähligen Pfaden von S über den Spiegel nach P gelangen. Vernünftigerweise kann man davon ausgehen, dass jeder dieser Pfade einen speziellen Beitrag liefert: Der Beitrag eines sehr langen Pfades, der über den äußersten Rand des Spiegels führt, wird sich sicherlich vom Beitrag eines direkteren Pfades unterscheiden. Feynmans Argumentation folgend, ordnen wir jedem der möglichen Pfade eine (vorläufig nicht näher spezifizierte) komplexe Größe zu, eine quantenmechanische Wahr-

4.11 Photonen, Wellen und Wahrscheinlichkeit

287

scheinlichkeitsamplitude. Jede dieser Amplituden kann als Zeiger dargestellt werden, dessen Winkel durch die insgesamt von S bis P benötigte Zeit und dessen Länge durch die zurückgelegte Wegstrecke bestimmt wird. (Natürlich haben wir genau dies auch mit den in Abbildung 4.80 c eingezeichneten Zeigern erreicht. Dennoch gibt es überzeugende Argumente, warum das klassische E-Feld nicht die quantenmechanische Wahrscheinlichkeitsamplitude sein kann.) Die resultierende quantenmechanische Wahrscheinlichkeitsamplitude ist die Summe der zu allen möglichen Pfaden gehörenden Zeiger; sie stimmt mit dem resultierenden Zeiger in Abbildung 4.80 c überein. Wir benennen die Elemente von Abbildung 4.80 c nun so um, dass sich die quantenmechanische Darstellung ergibt. Es ist eindeutig zu erkennen, dass die Zeiger in unmittelbarer Nachbarschaft des Pfades S-I-P die größten Beiträge zur resultierenden quantenmechanischen Wahrscheinlichkeitsamplitude liefern, denn sie sind am längsten und nahezu phasengleich. Licht, das von S nach P reflektiert wird, nimmt also am wahrscheinlichsten den Pfad S-I-P oder einen der benachbarten Pfade. Die Bereiche an den Rändern des Spiegels tragen dagegen wenig bei, weil die zugehörigen Zeiger an beiden Enden enge Spiralen bilden (siehe Abb. 4.80 c). Es macht sich deshalb in der resultierenden Amplitude und somit auch in der Lichtmenge, die in P ankommt, praktisch nicht bemerkbar, wenn man die Ränder des Spiegels abdeckt. Man sollte dabei nicht vergessen, dass unser Diagramm nur eine grobe Darstellung ist: In Wirklichkeit gibt es nicht nur 17 Pfade von S nach P , sondern Milliarden, und die Zeiger an den beiden Enden winden sich unzählige Male. Die Quantenelektrodynamik sagt voraus, dass Licht von S ausgehend durch alle Punkte des Spiegels nach P reflektiert wird, wobei der wahrscheinlichste Pfad S-IP ist, für den gilt θi = θr . Blicken Sie von P aus in den Spiegel, so sehen Sie ein scharfes Abbild von S.

4.11.2 Photonen und die Gesetze der Reflexion und Brechung Stellen wir uns Licht als Photonenstrom vor und betrachten wir ein einzelnes Lichtquant, das unter einem Winkel θi auf die Grenzfläche zwischen zwei dielektrischen Medien (etwa Luft und Glas) trifft. Das Photon wird von einem Atom (zum Beispiel des Glases) absorbiert, anschließend wird ein identisches Photon unter einem Winkel θt durchgelassen. Bei diesem Vorgang wird, wie wir wissen, das snelliussche Gesetz von jedem einzelnen der Milliarden Quanten eines schmalen Laserstrahls erfüllt. Wir wollen untersuchen, warum dies so ist. Dazu verfolgen wir die Dynamik unseres Photons auf seiner Reise. Gemäß Gleichung (3.54) ist p = h/λ, folglich ist der Impulsvektor des Photons gegeben durch p = k

4 Die Ausbreitung des Lichts

288

mit k als Fortpflanzungsvektor und  = h/2π. Der einfallende und der durchgelassene Impuls sind demnach pi = ki bzw. pt = kt . Ohne dies hier im Einzelnen begründen zu wollen nehmen wir an, dass vom Material in der Umgebung der Fläche nur die Impulskomponente senkrecht zur Grenzfläche, nicht jedoch die Komponente parallel zu dieser beeinflusst wird. Tatsächlich wissen wir aus experimentellen Ergebnissen (siehe Abschn. 3.3.4), dass ein Lichtstrahl einen Impuls auf ein Medium senkrecht zu dessen Oberfläche übertragen kann. Die Erhaltung der Impulskomponente parallel zur Grenzfläche formulieren wir für ein einzelnes Photon wie folgt: pi sin θi = pt sin θt . Diese Überlegung bringt uns auf einen wichtigen Punkt: Im klassischen Bild hängt der Impuls eines materiellen Teilchens von dessen Geschwindigkeit ab. Bei nt > ni folgt (aus dem snelliusschen Gesetz und der obigen Gleichung) pt > pi , d. h., die Lichtteilchen müssten schneller werden. Die erste Herleitung des Brechungsgesetzes, 1637 von René Descartes vorgelegt, behandelte das Licht in der Tat fälschlicherweise als Strom von Teilchen, die beim Eintritt in das optisch dichtere Medium beschleunigt werden (siehe Aufgabe 4.12). Die Abnahme der Wellenlänge des Lichts beim Übergang in das dichtere Medium hingegen maß vermutlich als Erster Thomas Young (um 1802)15 ; wie Young richtig folgerte, nimmt die Geschwindigkeit des Lichtstrahls in Wirklichkeit ab (v < c). Inzwischen wissen wir aus der Quantenmechanik, dass die Geschwindigkeit eines Photons stets gleich c ist und dass sein Impuls nicht von dieser Geschwindigkeit, sondern von der Wellenlänge abhängt. Es gilt also h h sin θi = sin θt . λi λt Multiplizieren wir beide Seiten dieser Gleichung mit c/v, so gelangen wir zum snelliusschen Gesetz. Diese Analyse ist didaktisch sehr anschaulich; vergessen Sie aber nicht, dass wir die Zusammenhänge etwas vereinfacht haben.

Aufgaben Lösungen zu den Aufgaben ohne ∗ finden Sie am Ende des Buches. 4.1

15

Zeigen Sie mithilfe einer Dimensionsbetrachtung, dass der Anteil des durch RayleighStreuung gestreuten Lichts eine Funktion von λ−4 ist. Dabei sollen E0i und E0s die Amplituden der einfallenden bzw. der gestreuten Strahlung sein; Letztere soll für eine Entfernung r vom Streuzentrum gelten. Nehmen Sie an, dass E0s ∝ E0i und E0s ∝ 1/r gilt und dass die Streuamplitude proportional zum Volumen des Streuzentrums ist, was Der endgültige experimentelle Beweis dieses Zusammenhangs gelang 1850 Foucault.

Aufgaben

289

in gewissen Grenzen vernünftig ist. Bestimmen Sie die Einheit des Proportionalitätsfaktors. 4.2* Ein weißer Flutlichtstrahl fällt durch ein dünnes Gasgemisch, das vor allem aus Sauerstoff- und Stickstoffmolekülen besteht. Vergleichen Sie den relativen Anteil der Streustrahlung aus dem gelben Spektralbereich (580 nm) mit demjenigen aus dem violetten Bereich (400 nm). 4.3* In Abbildung A.4.3 sehen Sie eine Punktlichtquelle. Die nach außen fließende Strahlungsenergie ist auf drei verschiedene Weisen dargestellt. Beschreiben Sie jede davon und diskutieren Sie die gegenseitigen Beziehungen der Darstellungsformen.

S

r Σ

4.4

Abb. A.4.3: Ausschnitt aus einer Kugelwelle.

Die Gleichung eines getriebenen, gedämpften Oszillators lautet ¨ + me γ x˙ + me ω02 x = qe E (t) . me x (a) Erläutern Sie die Bedeutung jedes Terms. (b) Es sei E = E0 eiωt und x = x0 ei(ωt−α) , wobei E0 und x0 reelle Größen sind. Setzen Sie dies in die obige Gleichung ein und zeigen Sie, dass dann gilt: x0 =

1 qe E0

1/2 . me 2 (ω02 − ω 2 ) + γ 2 ω 2

(c) Leiten Sie einen Ausdruck für die Phasenverschiebung α her und diskutieren Sie, wie α sich ändert, wenn ω von ω  ω0 über ω = ω0 bis ω  ω0 variiert. 4.5

Stellen Sie sich eine Glasplatte der Dicke Δy mit dem Brechungsindex n vor, die sich zwischen einer Lichtquelle S und einem Beobachter P befindet und kein Licht absorbiert. (a) Wenn die Glasplatte nicht vorhanden ist, sei die ungestörte Welle Eu = E0 eiω(t−y/c) . Zeigen Sie, dass der Beobachter dann durch die Glasplatte hindurch folgende Welle sieht: Ep = E0 exp iω [t − (n − 1) Δy/c − y/c] . (b) Zeigen Sie, dass für n ≈ 1 oder für sehr kleine Werte von Δy gilt Ep = Eu +

ω (n − 1) Δy Eu e−iπ/2 . c

290

4 Die Ausbreitung des Lichts Den zweiten Term auf der rechten Seite kann man als den Beitrag zum Feld betrachten, den die Oszillatoren in der Glasplatte liefern.

4.6* Ein sehr schmales Bündel von Laserstrahlen fällt unter einem Winkel von 58◦ auf einen waagerechten Spiegel. Der reflektierte Strahl berührt eine Wand in einer Entfernung von 5 m von dem Punkt, in dem der einfallende Strahl auf den Spiegel trifft. Wie weit ist die Wand in horizontaler Richtung von diesem Punkt entfernt? 4.7* In einer Wand der dunklen Grabkammer eines Herrschers, 3 m über dem Boden, befindet sich ein kleines Loch. Einmal im Jahr – genau am Geburtstag des Herrschers – fällt ein Sonnenstrahl durch dieses Loch auf eine kleine polierte Goldplatte am Boden, die 4 m von der Wand entfernt ist; der reflektierte Lichtstrahl beleuchtet einen großen Diamanten auf der Stirn einer Statue des Herrschers, die 20 m von der Wand entfernt auf dem Boden steht. Wie hoch ist diese Statue ungefähr?

Abb. A.4.8

4.8* In Abbildung A.4.8 sehen Sie eine verspiegelte Ecke. Ermitteln Sie die Richtung des austretenden Strahls relativ zur Richtung des einfallenden Strahls. 30°

4.9* Ein Strahl trifft, wie in Abbildung A.4.9 dargestellt, zuerst auf Spiegel 1 und dann auf Spiegel 2. Bestimmen Sie die Winkel θr1 und θr2 . 4.10* Betrachten Sie noch einmal Abbildung 4.33 und die huygenssche Brechungsmethode. Beweisen Sie, dass sie auf das snelliussche Gesetz führt. 4.11 Welcher Brechungswinkel ergibt sich für einen Lichtstrahl, der aus Luft unter einem Winkel von 30◦ auf ein Stück Kronglas (ng = 1,52) fällt?

Spiegel 1 θr1 Spiegel 2

Abb. A.4.9

4.12* Abbildung A.4.12 bezieht sich auf die Herleitung des Brechungsgesetzes durch Descartes. Licht bewegt sich von S nach O in der gleichen Zeit wie von O nach P . Sein transversaler Impuls bleibt beim Durchgang durch die Grenzfläche unverändert. Verwenden Sie diese Informationen, um das snelliussche Gesetz „herzuleiten“. 4.13* Ein Laserstrahl in Luft trifft unter einem Einfallswinkel von 30,0◦ auf die ebene Oberfläche einer Glasscheibe (ng = 1,50). Anstatt in der gleichen Richtung in das Glas einzudringen, wird der Strahl um den Winkel θd zur Normale abgelenkt. Bestimmen Sie diesen Winkel.

θr2 45°

Abb. A.4.12

Aufgaben

291

4.14* Abbildung A.4.14 zeigt den Sinus des Einfallswinkels, aufgetragen gegen den Sinus des Transmissionswinkels, für einen Lichtstrahl, der aus der Luft in ein optisch dichteres Medium tritt. Diskutieren Sie den Graphen. Welche Bedeutung können Sie der Steigung zuordnen? Um welches dichtere Medium könnte es sich handeln? 4.15* Ein Strahl gelben Lichts von einer Natriumdampflampe fällt unter einem Winkel von 45◦ durch die Luft auf einen Diamanten. Berechnen Sie die Winkelabweichung infolge der Brechung, wenn bei der betreffenden Frequenz Abb. A.4.14 nd = 2,42 ist. 4.16* Gegeben sei eine Grenzfläche zwischen Wasser (nw = 43 ) und Glas (ng = 32 ). Berechnen Sie den Brechungswinkel eines Strahls, der unter einem Winkel von 45◦ auf das Wasser trifft. Zeigen Sie, dass θt = 45◦ ist, wenn die Richtung des gebrochenen Strahls umgekehrt wird, sodass dieser wieder auf die Grenzfläche fällt. 4.17 Ein Strahl ebener 12-cm-Mikrowellen trifft unter einem Winkel von 45◦ auf die Oberfläche eines Dielektrikums. Berechnen Sie für nti = 43 (a) die Wellenlänge im brechenden Medium und (b) den Winkel θt . 4.18* Licht mit einer Wellenlänge von 600 nm fällt aus dem Vakuum auf einen Glasblock mit ng = 1,5. Berechnen Sie die Wellenlänge des gebrochenen Strahls. Mit welcher Farbe erscheint das Licht einem im Glas befindlichen Betrachter (siehe Tabelle 3.4)? 4.19* Ein Laserstrahl fällt unter einem Winkel von 55◦ auf eine Grenzfläche zwischen Luft und einer Flüssigkeit. Der gebrochene Strahl breitet sich mit einem Winkel von 40◦ weiter aus. Wie groß ist der Brechungsindex der Flüssigkeit? 4.20* Ein Taucher leuchtet mit einem Strahler von unten gegen die Wasseroberfläche. Der Strahl trifft unter einem Winkel von 35◦ auf die Grenzfläche. Mit welchem Winkel pflanzt sich der Strahl in der Luft weiter fort? 4.21 Zeichnen Sie für eine Grenzfläche zwischen Luft und Glas (nLG = 1,5) den Graphen von θt als Funktion von θi . 4.22* Ein Laserstrahl mit einem Durchmesser D trifft unter dem Winkel θi auf ein Stück Glas (ng ). Wie groß ist der Durchmesser des Strahls innerhalb des Glases? 4.23* Ein besonders schmaler weißer Lichtstrahl fällt unter einem Winkel von 60,0◦ auf eine 10,0 cm dicke, in Luft befindliche Glasplatte, deren Brechungsindex 1,505 (rotes Licht) bzw. 1,545 (violettes Licht) beträgt. Wie groß ist ungefähr der Durchmesser des austretenden Lichtstrahls? 4.24* Eine Schale ist 10,0 cm hoch mit Olivenöl gefüllt. Auf dem Boden der Schale liegt eine Münze, die senkrecht von oben betrachtet wird. In welchem scheinbaren Abstand von der Oberfläche befindet sich die Münze? 4.25* Ein Glasblock mit dem Brechungsindex 3/2 hat in 3,0 cm Abstand von seiner ebenen oberen Grenzfläche einen kleinen Defekt. Über dieser Grenzfläche befindet sich in 8,0 cm Entfernung eine Kameralinse, die genau nach unten gerichtet ist. Wie weit ist der Defekt scheinbar von der Linse entfernt?

4 Die Ausbreitung des Lichts

292

4.26* Ein Laserstrahl fällt unter einem Winkel von 35◦ auf die Oberfläche einer 2 cm dicken, planparallelen Glasplatte (ng = 1,50). Wie lang ist der Weg, den der Strahl im Glas zurücklegt? 4.27* Ein Lichtstrahl fällt aus der Luft auf ein Stück Glas mit einem Brechungsindex von 1,70. Wie groß muss der Einfallswinkel θi sein, damit der Brechungswinkel gleich 12 θi ist? 4.28* Nehmen Sie an, Sie sähen durch eine Kamera, die mit einem Balgennaheinstellgerät ausgerüstet ist, einen Buchstaben auf dieser Seite scharf. Um welche Strecke müssten Sie die Kamera anheben, nachdem Sie einen gläsernen Objektträger (Dicke: 1 mm, ng = 1,55) auf den Buchstaben gelegt haben, um diesen immer noch scharf sehen zu können? 4.29* Auf dem Boden eines wassergefüllten (nW = 1,33), 1 m tiefen Tanks liegt eine Münze. Auf der Wasseroberfläche schwimmt eine 20 cm dicke Schicht Benzol (nB = 1,50). Wie weit unter der obersten Grenzfläche scheint einem senkrecht auf die Fläche blickenden Beobachter die Münze zu liegen? Skizzieren Sie den Strahlenverlauf. B 4.30 Abbildung A.4.30 zeigt die so genannte Wellenfrontkontinuität: Jede Wellenfront im Einfallsmedium ni berührt an der Grenzfläche eine Wellenfront im breA chenden Medium. Schreiben Sie einen Ausdruck für C θi θt die Anzahl der Wellen pro Längeneinheit der Grenzfläche auf, und zwar (a) in Abhängigkeit von θi und nt D λi und (b) in Abhängigkeit von θt und λt . Leiten Sie daraus das snelliussche Gesetz her. Meinen Sie, dass Abb. A.4.30 sich das snelliussche Gesetz auch auf Schallwellen anwenden lässt? Erläutern Sie Ihre Ansicht. 4.31* Schauen Sie sich, ausgehend vom Resultat der vorangegangenen Aufgabe, noch einmal Gleichung (4.19) an. Legen Sie den Ursprung des Koordinatensystems in die Einfallsebene und auf die Grenzfläche (siehe Abb. 4.47). Zeigen Sie, dass Gleichung (4.19) unter dieser Bedingung der Gleichsetzung der x-Komponenten der entsprechenden Ausbreitungsvektoren äquivalent ist und dass sie dann die Aussage der Wellenfrontkontinuität wiedergibt.

4.32 Leiten Sie das Reflexionsgesetz und das snelliussche Gesetz ab, indem Sie sich die Orthogonalität der Wellenfronten und Strahlen sowie die gleichen Laufzeiten zwischen korrespondierenden Punkten zunutze machen. Nehmen Sie dazu Abbildung A.4.32 zu Hilfe.

b1 a 2 a1 a3

b2

Abb. A.4.32

4.33 Zeigen Sie ausgehend vom snelliusschen Gesetz, dass die Brechungsgleichung in Vektorschreibweise wie folgt formuliert werden kann: ˆ t − ni k ˆi = (nt cos θt − ni cos θi ) u nt k ˆn .

[4.7]

Aufgaben

293

4.34 Leiten Sie eine Vektorschreibweise für das Brechungsgesetz her. Lassen Sie dabei die Flächennormale wieder vom Einfallsmedium zum brechenden Medium zeigen, auch wenn dies offensichtlich nicht wirklich wichtig ist. 4.35 Zeigen Sie mithilfe des fermatschen Prinzips, dass bei der Reflexion an einer ebenen Fläche der einfallende und der reflektierte Strahl in einer Ebene mit der Flächennormalen u ˆn liegen (diese gemeinsame Ebene ist die Einfallsebene). 4.36* Leiten Sie mithilfe der Differentialrechnung das Reflexionsgesetz (θi = θr ) her, indem Sie die Laufzeit minimal werden lassen, wie es das fermatsche Prinzip fordert. 4.37* Der Mathematiker Hermann Schwarz zeigte, dass man jedem spitzwinkligen Dreieck genau ein Dreieck mit minimalem Umfang einschreiben kann. Die Ecken dieses eingeschriebenen Dreiecks liegen genau in den Schnittpunkten der Höhen des Dreiecks mit den zugehörigen Grundseiten. Wie könnte man dies mithilfe zweier Planspiegel, eines Laserstrahls und unter Verwendung des fermatschen Prinzips beweisen? 4.38 Fällt ein Lichtstrahl durch eine planparallele durchsichtige Platte, so sind der eintretende und der austretende Strahl zueinander parallel, wie man in Abbildung A.4.38 sieht. Zeigen Sie dies auf analytischem Wege. Entwickeln Sie dazu einen Ausdruck für die seitliche Verschiebung des Strahls. Die Parallelität lässt sich übrigens auch beobachten, wenn man anstatt einer einzelnen Platte einen Stapel von Platten aus verschiedenen Materialien verwendet.

Abb. A.4.38

4.39* Zeigen Sie, dass die beiden Strahlen, die parallel zueinander in das in Abbildung A.4.39 gezeigte System eintreten, auch parallel zueinander wieder austreten.

na n1 na n2

Abb. A.4.39

na

4.40 Diskutieren Sie das Resultat von Aufgabe 4.38 bezüglich des fermatschen Prinzips: Welchen Einfluss hat der relative Brechungsindex n21 ? Um die seitliche Verschiebung zu beobachten, schauen Sie durch ein dickes (≈ 12 cm) Stück Glas oder einen Stapel Objektträger (vier genügen) auf eine breite Lichtquelle, indem Sie die Gläser schräg halten. Der Bereich der Lichtquelle, den Sie durch das Glas sehen, erscheint deutlich verschoben gegenüber demjenigen, den sie direkt sehen. 4.41* Betrachten Sie die drei Fotos in Abbildung A.4.41. Teil (a) zeigt einen einzelnen dicken Block aus Plexiglas. Teil (b) zeigt zwei gegeneinander gepresste, schmale Blöcke aus Plexiglas, die beide gerade halb so dick sind wie der erste. Teil (c) schließlich zeigt dieselben beiden Blöcke wie in (b), die hier jedoch durch eine dünne Schicht Rizinusöl getrennt sind. Beschreiben Sie für jeden der drei Fälle im Detail, was Sie sehen, wenn Sie in die Plexiglasblöcke blicken. Vergleichen Sie (a) und (c). Was können Sie über das Plexiglas und das Rizinusöl sagen?

294

4 Die Ausbreitung des Lichts

Abb. A.4.41: G. Calzà, T. Lopez-Arias, L. M. Gratton und S. Oss, Genehmigter Reprint aus The Physics Teacher 48, 270 (210). Copyright 2010, American Association of Physics Teachers.)

4.42 Betrachten Sie eine in der Einfallsebene linear polarisierte Lichtwelle, die unter einem Winkel von 30◦ auf ein Stück Kronglas (ng = 1,52) in Luft fällt. Berechnen Sie die Amplitudenkoeffizienten von Reflexion und Transmission an der Grenzfläche. Vergleichen Sie Ihr Ergebnis mit Abbildung 4.49. 4.43 Leiten Sie die Gleichungen (4.42) bis (4.45) für r || , r⊥ , t || und t⊥ her. 4.44* Ein Lichtstrahl fällt unter einem Winkel von 22,0◦ auf die glatte Oberfläche eines Stückchens Kunststoff mit einem Brechungsindex von 1,55. Die zur Einfallsebene parallele bzw. senkrechte Komponente der Amplitude des elektrischen Feldes beträgt 10 V/m bzw. 20 V/m. Wie groß sind die zugehörigen reflektierten Amplituden? 4.45* Ein Laserstrahl trifft auf die Grenzfläche zwischen Luft und einem dielektrischen Medium mit dem Brechungsindex n. Zeigen Sie, dass für kleine Werte von θi gilt θt = θi /n. Weisen Sie mithilfe dieser Beziehung und Gleichung (4.42) nach, dass bei fast senkrechtem Einfall [−r⊥ ]θi ≈0 = (n − 1)/(n + 1) ist. 4.46* Zeigen Sie, dass bei senkrechtem Einfall auf die Grenzfläche zwischen zwei Dielektrika gilt 2ni [t || ]θi =0 = [t⊥ ]θi =0 = . ni + nt 4.47* Ein nahezu monochromatischer Laserstrahl, der so polarisiert ist, dass sein elektrisches Feld senkrecht zur Einfallsebene liegt, trifft in Luft normal auf Glas (nt = 1,50). Bestimmen Sie den Amplitudenkoeffizienten der Transmission. Führen Sie die gleiche Berechnung für den Fall durch, dass der Strahl senkrecht von Glas in Luft geht. Siehe vorherige Aufgabe.

Aufgaben

295

4.48* Betrachten Sie noch einmal das vorherige Problem und berechnen Sie die entsprechenden Werte der Amplitudenkoeffizienten der Reflexion für den normalen Übergang von Licht von Luft in Glas bzw. von Glas in Luft. Zeigen Sie, dass in beiden Fällen Gleichung (4.49), also t⊥ + (−r⊥ ) = 1, gilt. 4.49* Licht fällt senkrecht aus der Luft auf eine Kronglasplatte mit einem Brechungsindex von 1,522. Berechnen Sie den Reflexionsgrad und den Transmissionsgrad. 4.50* Ein quasimonochromatischer Lichtstrahl mit einer Bestrahlungsstärke von 500 W/m2 fällt aus der Luft senkrecht auf eine Wasseroberfläche (nW = 1,333). Berechnen Sie die durchgelassene Bestrahlungsstärke. 4.51* Zeigen Sie mithilfe der fresnelschen Gleichungen, dass  cos θi − n2ti − sin2 θi  r⊥ = cos θi + n2ti − sin2 θi und

 n2ti − sin2 θi  r || = n2ti cos θi + n2ti − sin2 θi n2ti cos θi −

4.52* Unpolarisiertes Licht fällt in Luft auf die ebene Oberfläche einer Glasscheibe mit dem Brechungsindex 1,60, wobei der Winkel zur Flächennormale 30,0◦ beträgt. Bestimmen Sie beide Amplituden-Reflexionskoeffizienten. Welche Bedeutung haben die Vorzeichen? Überprüfen Sie die vorherige Aufgabe. 4.53* Berechnen Sie für das vorherige Problem R⊥ , R || , T⊥ , T || sowie den Netto-Transmissionsgrad T und den Netto-Reflexionsgrad R. 4.54* Wir wissen, dass unpolarisiertes Licht mit 1000 W/m2 in Luft auf eine Luft-GlasGrenzfläche trifft, wobei nti = 3/2 gilt. Wenn der Transmissionsgrad für Licht mit senkrecht zur Einfallsebene gerichtetem E-Feld 0,80 ist, wie stark wird dieses Licht dann reflektiert? 4.55* Ein unpolarisierter Lichtstrahl mit 2000 W/m2 trifft von Luft auf Kunststoff. Von dem an der Grenzfläche reflektierten Licht ist ein Anteil von 300 W/m2 so polarisiert, dass das E-Feld senkrecht zur Einfallsebene zeigt, und ein Anteil von 200 W/m2 ist so polarisiert, dass das Feld parallel zur Einfallsebene verläuft. Bestimmen Sie den NettoTransmissionsgrad durch die Grenzfläche. 4.56* Zeigen Sie, dass bei dem vorherigen Problem die Energie erhalten bleibt. 4.57* Quasimonochromatisches Licht trifft mit einer Bestrahlungsstärke von 400 W/ m2 senkrecht auf die Hornhaut eines menschlichen Auges (nH = 1,376). Nehmen Sie an, die Person schwimme unter Wasser (nW = 1,33), und berechnen Sie die in die Hornhaut durchgelassene Bestrahlungsstärke. 4.58* Vergleichen Sie mithilfe des Ergebnisses der vorangegangenen Aufgabe die Amplituden-Reflexionskoeffizienten einer Grenzfläche zwischen Luft und Wasser (nw = 43 ) und einer Grenzfläche zwischen Luft und Kronglas (ng = 32 ). Nehmen Sie in beiden Fällen

4 Die Ausbreitung des Lichts

296

fast senkrechten Einfall an. Wie groß ist jeweils das Verhältnis zwischen der Bestrahlungsstärke des einfallenden und der des reflektierten Strahls? 4.59* Leiten Sie mithilfe von Gleichung (4.42) und einer Potenzreihenentwicklung der Sinusfunktion eine bessere Näherung für fast senkrechten Einfall her als die in Aufgabe 4.45 angegebene Gleichung [−r⊥ ]θi ≈0 = (n − 1) / (n + 1), nämlich    θ2 n−1 1+ i . [−r⊥ ]θi ≈0 = n+1 n 4.60* Zeigen Sie, dass die Beziehung    θi2 n−1 1− [r || ]θi ≈0 = n+1 n eine gute Näherung bei fast senkrechtem Einfall ist. [Hinweis: Verwenden Sie die Ergebnisse aus der vorherigen Aufgabe, Gleichung (4.43) und die Potenzreihenentwicklungen der Sinus- und der Kosinusfunktion.] 4.61* Beweisen Sie, dass bei streifendem Einfall eines Lichtstrahls auf eine Grenzfläche zwischen dem Vakuum und einem Dielektrikum gilt r⊥ → −1, wie in Abbildung 4.49 gezeigt ist. 4.62* In Abbildung 4.49 nähert sich der Graph von r⊥ dem Wert −1,0, wenn der Einfallswinkel gegen 90◦ geht. Es sei α⊥ der Winkel, den die Kurve bei θi = 90◦ mit der Senkrechten einschließt. Zeigen Sie, dass dann gilt √ n2 − 1 tan α⊥ = . 2 [Hinweis: Zeigen Sie zuerst, dass dθt /dθi = 0 ist.] 4.63 Beweisen Sie t⊥ + (−r⊥ ) = 1

[4.49]

für alle θi ; gehen Sie dabei (a) von den Randbedingungen und (b) von den fresnelschen Gleichungen aus. 4.64* Prüfen Sie nach, dass t⊥ + (−r⊥ ) = 1

[4.49]

ist für θi = 30◦ an einer Grenzfläche zwischen Kronglas und Luft (nti = 1,52). 4.65* Beweisen Sie mithilfe der fresnelschen Gleichungen, dass der reflektierte Strahl tatsächlich polarisiert ist, wenn der einfallende Strahl unter einem Winkel von θp = 12 π − θt auf die spiegelnde Fläche fällt. 4.66 Zeigen Sie, dass tan θp = nt /ni ist, und berechnen Sie den Polarisationswinkel für den äußeren Einfall eines Lichtstrahl aus Luft in Kronglas (ng = 1,52). 4.67* Zeigen Sie ausgehend von Gleichung (4.38), dass für zwei Dielektrika allgemein gilt tan θp = [t (t μi − i μt ) /i (t μt − i μi )]1/2 .

Aufgaben

297

4.68 Zeigen Sie, dass die Polarisationswinkel für die innere und die äußere Reflexion an einer gegebenen Grenzfläche Ergänzungswinkel sind, dass also gilt θp +θp = 90◦ (siehe Aufgabe 4.66). 4.69 Es ist oft zweckmäßig, mit dem Azimut γ zu arbeiten; dies ist der Winkel zwischen der Schwingungsebene und der Einfallsebene. Für linear polarisiertes Licht ist dann tan γi = [E0i ]⊥ / [E0i ] || tan γt = [E0t ]⊥ / [E0t ] ||

(4.92) (4.93)

tan γr = [E0r ]⊥ / [E0r ] || .

(4.94)

Abbildung A.4.69 zeigt γr in Abhängigkeit von θi für die innere und die äußere Reflexion an einer Grenzfläche zwischen Luft und Glas (ngl = 1,51) mit γi = 45◦ . Prüfen Sie einige Punkte der Kurve nach und zeigen Sie außerdem, dass tan γr = −

cos (θi − θt ) tan γi . cos (θi + θt )

(4.95)

135◦ innere Reflexion θp

γr 90◦

θp θc äußere Reflexion

+45◦

0

10

20

30

40 50 60 θi (Grad)

70

80

90 Abb. A.4.69

4.70* Zeigen Sie unter Verwendung der Definition des Azimuts in Aufgabe 4.69, dass R = R || cos2 γi + R⊥ sin2 γi

(4.96)

T = T || cos2 γi + T⊥ sin2 γi .

(4.97)

und

4.71 Skizzieren Sie R⊥ und R || für ni = 1,5 und nt = 1 (es liegt also innere Reflexion vor). 4.72 Zeigen Sie: T || =

sin 2θi sin 2θt sin2 (θi + θt ) cos2 (θi − θt )

(4.98)

T⊥ =

sin 2θi sin 2θt . sin2 (θi + θt )

(4.99)

und

4 Die Ausbreitung des Lichts

298

4.73* Zeigen Sie unter Verwendung der Gleichungen (4.98) und (4.99): R || + T || = 1

[4.65]

R⊥ + T⊥ = 1 .

[4.66]

und

4.74 Angenommen, wir betrachten eine Lichtquelle durch einen Stapel aus N Objektträgern. Schon bei N = 12 erscheint die Quelle merklich dunkler. Zeigen Sie, dass bei vernachlässigbarer Absorption der Transmissionsgrad des gesamten Stapels gegeben ist durch 2N

Tt = (1 − R)

und berechnen Sie Tt für drei Objektträger in Luft. 4.75 Unter Verwendung der Beziehung I (y) = I0 e−αy

[4.78]

für ein absorbierendes Medium definieren wir eine Größe, die wir Einheitstransmissionsgrad T1 nennen wollen. Bei senkrechtem Einfall, siehe Gleichung (4.55), ist T = It /Ii ; bei y = 1 gilt dann T1 ≡ I (1) /I0 . Zeigen Sie, dass 2N

Tt = (1 − R)

d

(T1 )

ist, wenn die Dicke des Objektträgerstapels in Aufgabe 4.74 gleich d ist und deren Transmissionsgrad pro Längeneinheit gleich T1 . 4.76 Zeigen Sie, dass bei senkrechtem Einfall auf eine Grenzfläche zwischen zwei Dielektrika bei ni → 1 gilt R → 0 und T → 1. Beweisen Sie außerdem, dass für alle θi bei nti → 1 gilt R || → 0, R⊥ → 0, T || → 1 und T⊥ → 1. In Worten ausgedrückt bedeutet dies: Je ähnlicher die Brechungsindizes der beiden Medien einander sind, umso weniger Energie wird durch die reflektierte Welle abgeführt. Offensichtlich sollte die Grenzfläche bei nti = 1 verschwinden, es sollte also auch keine Reflexion mehr auftreten. 4.77* Leiten Sie die Ausdrücke für r⊥ und r || her, die durch die Gleichungen (4.70) und (4.71) gegeben sind. ∗ 4.78 Zeigen Sie, dass r⊥ und r || komplex sind und r⊥ r⊥ = r || r∗|| = 1 ist, wenn an einer dielektrischen Grenzfläche θi > θc ist.

4.79* Berechnen Sie den Grenzwinkel der Totalreflexion für eine Grenzfläche zwischen Luft und Glas (ng = 1,5). 4.80* Kehren wir noch einmal zu Aufgabe 4.21 zurück: Wenn θi zunimmt, wird auch θt größer. Beweisen Sie, dass θt maximal den Wert θc annehmen kann. 4.81* Wie groß ist der Grenzwinkel der Totalreflexion für Diamant? Hat dieser Winkel etwas mit dem Funkeln eines gut geschliffenen Brillanten zu tun, und wenn ja, in welcher Hinsicht?

Aufgaben

299

4.82* An einer Grenzfläche zwischen Luft und einem Stück eines unbekannten durchsichtigen Materials wird Licht totalreflektiert, wenn es (aus dem Material) unter einem Winkel von 48,0◦ auf die Fläche fällt. Wie groß ist der Brechungsindex des Materials? 4.83* In einem Prisma ABC ist der Winkel BCA = 90◦ und der Winkel CBA = 45◦ . Wie groß muss der Brechungsindex des Materials mindestens sein, wenn ein Strahl, der durch die Seite AC in das Prisma einfällt, an der Seite BC totalreflektiert werden soll? (Das Prisma soll von Luft umgeben sein.) 4.84* Ein Fisch, der nach oben gegen die glatte Oberfläche eines Weihers blickt, sieht einen Lichtkegel und einen hellen Kreis; innerhalb dieses Kreises kann er ein Abbild der Außenwelt (Himmel, Vögel, Bäume...) erkennen, außerhalb des Kreises ist es dunkel. Erklären Sie dieses Phänomen und berechnen Sie den Öffnungswinkel des Kegels. 4.85* Ein Stück Glas mit einem Brechungsindex von 1,55 ist mit einer Schicht Wasser (nW = 1,33) bedeckt. Wie groß ist der Grenzwinkel der Totalreflexion an der Grenzfläche für einen Lichtstrahl, der sich im Glas ausbreitet? 4.86 Leiten Sie einen Ausdruck für die Geschwindigkeit der abklingenden Welle bei der Totalreflexion her; schreiben Sie diesen als Funktion von c, ni und θi auf. 4.87 Licht mit einer Vakuumwellenlänge von 600 nm breitet sich in einem Stück Glas (nG = 1,50) aus und fällt unter einem Winkel von 45◦ auf eine Grenzfläche zur Luft, an der es totalreflektiert wird. In welcher Entfernung von der Grenzfläche ist die Amplitude der abklingenden Welle in der Luft auf den e-ten Teil des Maximums an der Grenzfläche abgefallen? 4.88* Ein Lichtstrahl aus einem Argonlaser (λ0 = 500 nm) pflanzt sich in einem Stück Glas (ng = 3/2) fort und wird an der ebenen Luft-Glas-Grenzfläche totalreflektiert. Wenn der Strahl in einem Winkel von 60,0◦ mit der Normalen auf die Grenzfläche trifft, wie tief dringt das Licht dann in die Luft ein, bevor seine Amplitude auf 36,8 % ihres Wertes an der Grenzfläche gefallen ist? 4.89* Ein großer Diamant ist oben mit einer Schicht Wasser bedeckt. Ein schmaler Lichtstrahl pflanzt sich nach oben in den Festkörper fort und trifft auf die Grenzfläche zwischen Festkörper und Flüssigkeit. Bestimmen Sie den minimalen Einfallswinkel, bei dem das Licht vollständig in den Diamanten zurück reflektiert wird. 4.90* Ein großer Strontiumtitanat-Kristall ist mit einer Schicht Tetrachlormethan bedeckt. Ein Lichtstrahl dringt durch den Kristall nach oben und trifft auf die Grenzfläche zwischen Festkörper und Flüssigkeit. Bei welchem minimalen Einfallswinkel wird das Licht vollständig in den Kristall zurück reflektiert? 4.91 Abbildung A.4.91 zeigt eine Anordnung, mit der man den Brechungsindex eines Glases messen kann: Man lässt einen Laserstrahl auf ein Stück nasses Filterpapier fallen, das auf dem zu untersuchenden Glasstück liegt. Das resultierende Lichtmuster sehen Sie auf dem Foto. Erklären Sie die Vorgänge und leiten Sie einen Ausdruck für ni als Funktion von R und d her.

4 Die Ausbreitung des Lichts

300

nt

ni

Laser θc Luft

Abb. A.4.91 (Abdruck des Fotos und der Zeichnung mit freundlicher Erlaubnis von S. Reich, The Weizman Institute of Science, Israel.)

R

Glas Luft d

4.92 Betrachten wir eine Luftspiegelung über einer aufgeheizten Straße, die durch die inhomogene Verteilung der über ihr befindlichen Luft entsteht. Stellen Sie sich den Strahlenverlauf analog zu dem bei einer inneren Totalreflexion vor. Wie groß ist der Brechungsindex der Luft direkt über der Straßenoberfläche, wenn ein Beobachter einen nassen Fleck unter einem Winkel von θi ≥ 88,7◦ auf der Fahrbahn „sieht“? In Augenhöhe des Beobachters sei na = 1,000 29. 4.93 Abbildung A.4.93 zeigt einen gläsernen Würfel, der von vier Glasprismen umgeben ist; die Lücken zwischen je zwei Körpern sollen sehr klein sein. Verfolgen Sie den Gang der beiden eingezeichneten Strahlen und schlagen Sie vor, wofür man eine solche Anordnung verwenden könnte.

Abb. A.4.93

4.94 Abbildung A.4.94 zeigt ein Prismenkopplungsglied, das in den Bell Telephone Laboratories entwickelt wurde. Es dient dazu, einen Laserstrahl in eine dünne (0,000 25 mm) transparente Schicht zu lenken, welche dann als eine Art Wellenleiter wirkt. Eine Anwendung ist ein Dünnschichtlaserschaltkreis (eine Art integrierte Optik). Wie funktioniert ein solcher Schaltkreis Ihrer Meinung nach? Laserstrahl

regulierbarer Kopplungsspalt ∼λ/2

Prisma dünne Schicht Glasunterlage

Abb. A.4.94

Aufgaben

301

4.95 In Abbildung A.4.95 sehen Sie Graphen von nI und nR jeweils in Abhängigkeit von λ. Um welches Metall handelt es sich? Diskutieren Sie die optischen Eigenschaften des Materials im Vergleich zu denen, die in diesem Kapitel besprochen wurden. 20.0 10.0 5.0 Brechungsindex

nI 2.0 1.0 0.5 nR 0.2 100

200 500 1000 2000 λ (nm)

Abb. A.4.95

4.96* Jemand betrachtet durch ein gelbes Filter eine Flagge. Diese hat fünf horizontale Streifen und zwar (von oben nach unten) in den Farben Blau, Cyan, Magenta, Gelb und Weiß. Welche Farben sieht der Beobachter durch das Filter? 4.97* Eine Wand ist mit roten, cyanfarbenen, weißen, gelben, grünen und magentafarbenen Streifen bemalt. Eine Person, die eine gelb getönte Sonnenbrille trägt, betrachtet die Wand durch ein cyanfarbenes Stück Bleiglas. In welchen Farben (wenn überhaupt) erscheinen die Streifen?

Reflexion (%)

4.98* Die Kurven in Abbildung A.4.98 sind Reflexionsspektren für verschiedene Rosen, die in weißem Licht betrachtet werden. Die Blumen sind weiß, gelb, hellrosa, pink, blau, orange und rot. Ordnen Sie die Kurven den einzelnen Farben zu. 100 90 80 70 60 50 40 30 20 10 0 400

1 2 4 5 6

3 7

450

500

550 600 650 Wellenlänge (nm)

700

750

Abb. A.4.98

4 Die Ausbreitung des Lichts

302

4.99 Abbildung A.4.99 zeigt einen Strahl, der beim Durchgang durch eine dielektrische transparente Platte mehrfach reflektiert wird (angegeben sind die Amplituden der Teilstrahlen). Wir benutzen wie in Abschnitt 4.10 gestrichene Koeffizienten, um anzuzeigen, dass die Winkel durch das snelliussche Gesetz miteinander verknüpft sind.

Abb. A.4.99

(a) Ergänzen Sie für die letzten vier Strahlen die Bezeichnungen der Amplituden. (b) Zeigen Sie unter Verwendung der fresnelschen Gleichungen, dass Folgendes gilt: t || t|| = T || , t⊥ t⊥ 2

= T⊥ , 2

(4.100) (4.101)

r || = r || = R ||

(4.102)

2 r⊥

(4.103)

=

2 r⊥

= R⊥ .

4.100* Eine linear in der Einfallsebene polarisierte Welle fällt auf eine Grenzfläche zwischen zwei Dielektrika. Bei ni > nt und θi = θp gibt es keine reflektierte Welle, es ist also     r|| θp = 0. Zeigen Sie mithilfe des stokesschen Verfahrens, dass t || (θp ) t|| θp = 1, r || (θp ) = 0 und θp = θt ist (siehe Aufgabe 4.68). Vergleichen Sie dies mit Gl. (4.100).   4.101 Zeigen Sie mithilfe der fresnelschen Gleichungen, dass t || (θp ) t|| θp = 1 gilt, wie es in der vorangegangenen Aufgabe angegeben ist.

5

Geometrische Optik

5.1

Einführung

Die Oberfläche eines selbst leuchtenden oder beleuchteten Körpers verhält sich wie eine sehr große Anzahl punktförmiger Lichtquellen. Jede dieser Lichtquellen erzeugt Kugelwellen; die Strahlen haben die Richtung des Energieflusses, also die Richtung des Poynting-Vektors. In diesem Falle divergieren die Strahlen jeder einzelnen Punktquelle S, wohingegen man die Strahlen einer Kugelwelle, die zu einem Punkt zusammenschrumpft, konvergierend nennt. Im Allgemeinen betrachtet man nur einen kleinen Ausschnitt einer Wellenfront. Einen Punkt, von dem ein Teil einer Kugelwelle divergierend ausgeht oder zu dem ein solches Wellensegment konvergiert, bezeichnet man als den Brennpunkt eines Strahlenbündels. Abbildung 5.1 zeigt eine Punktquelle in der Nähe einer Anordnung reflektierender und brechender Oberflächen, die ein optisches System bilden. Von den unendlich vielen Strahlen, die von S ausgehen, läuft durch jeden beliebigen Punkt im Raum nur jeweils ein einziger. Trotzdem ist es möglich, unendlich viele Strahlen, die von S ausgehen, in einem bestimmten Punkt P zusammenlaufen zu lassen, wie in Abbildung 5.1. Existiert zu einem von S ausgehenden Strahlenkegel ein korrespondierender Kegel, der durch P läuft, so wird das System als stigmatisch bezüglich dieser beiden Punkte bezeichnet. Die Energie dieses Kegels (abgesehen von Verlusten durch Reflexion, Beugung und Absorption) erreicht den Punkt P , der als ideales Bild von S bezeichnet wird. Man kann sich aber auch vorstellen, dass die Welle einen Lichtfleck endlicher Ausdehnung erzeugt, der Streufleck genannt wird. Dieser ist ebenfalls ein Bild von S, allerdings kein ideales. Oder anders formuliert: Wenn Sie eine Reihe von Strahlen von S nach P verfolgen – was bedeutet, dass eine bestimmte Menge Strahlungsenergie von S nach P fließt –, dann entspricht die bei P ankommende Energie einem Bild von S. Aus dem Reversibilitätsprinzip (Abschn. 4.5) folgt, dass sich der beschriebene Vorgang umkehren lässt: Eine Punktquelle am Punkt P würde ebenso gut in S abgebildet. Man nennt die beiden Punkte daher konjugiert. In einem idealen optischen System wird jeder Punkt eines dreidimensionalen Gebiets, des Objektraums, ideal (oder stigmatisch) in einem anderen Gebiet, dem Bildraum, abgebildet. Im Allgemeinen dient ein optisches System dazu, einen Teil der eintreffenden Wellenfront zu sammeln und umzuformen, oft mit dem Ziel, ein Bild des Objekts zu

https://doi.org/10.1515/9783111025599-005

5 Geometrische Optik

304

S

tis op

tem ys S es ch

P

S

optisches System

(a)

P

(b)

Abb. 5.1: Konjugierte Punkte. (a) Eine Punktquelle S sendet sphärische Wellen aus. Ein Strahlenkegel tritt in ein optisches System ein, das die Wellenfronten umkehrt und im Punkt P konvergieren lässt. (b) Schnittdarstellung: Strahlen divergieren vom Punkt S, und ein Teil konvergiert in P . Wenn das Licht nicht in P aufgehalten wird, breitet es sich weiter aus.

erzeugen. Reale Systeme können allerdings nicht sämtliches emittierte Licht, sondern nur ein Segment der Wellenfront einfangen. Daher kommt es selbst in homogenen Medien zu Abweichungen von der geradlinigen Ausbreitung – die Wellen werden gebeugt. Der erreichbare Perfektionsgrad eines realen optischen Abbildungssystems ist beugungsbegrenzt (es wird stets ein Streufleck erzeugt, siehe Abschn. 10.2.5). Je kleiner die Wellenlänge der Strahlung relativ zu den Abmessungen des optischen Systems ist, desto weniger fallen die Beugungseffekte ins Gewicht. Im Grenzfall λ0 → 0 erreicht man geradlinige Ausbreitung in homogenen Medien: Damit betreten wir das Gebiet der (idealisierten) geometrischen Optik.1 Effekte, die auf der Wellennatur des Lichts beruhen (beispielsweise Interferenz und Beugung), können wir hier nicht mehr 1

Die physikalische Optik behandelt Situationen, in denen die endliche Wellenlänge des Lichts berücksichtigt werden muss. Wenn wir in Analogie hierzu die De-Broglie-Wellenlänge eines Materieobjekts vernachlässigen, betreiben wir klassische Mechanik, wenn wir sie aber nicht vernachlässigen, wenden wir die Quantenmechanik an.

5.2 Linsen

305

beobachten. In vielen Situationen überwiegt der Vorteil der großen Einfachheit dieser Näherung die Nachteile ihrer Ungenauigkeiten. Die geometrische Optik behandelt, kurz gesagt, die kontrollierte Manipulation von Wellenfronten (oder Strahlen) durch Anordnungen reflektierender und/oder brechender Körper unter Vernachlässigung von Beugungseffekten.

5.2

Linsen

Die Linse ist zweifellos das meistbenutzte optische Gerät – ganz abgesehen davon, dass wir die Welt durch zwei Augenlinsen sehen. Vom Menschen gefertigte Linsen sind spätestens seit der Antike bekannt, als man Brenngläser, lange vor der Erfindung von Streichhölzern, zum Entzünden von Feuer benutzte. Allgemein formuliert ist eine Linse ein brechendes optisches Gerät (das heißt, eine Diskontinuität des optischen Mediums), das eine übertragene Energieverteilung umformt. Dies gilt unabhängig davon, ob wir ultraviolettes, sichtbares oder infrarotes Licht betrachten, Mikrowellen, Radiowellen oder sogar Schallwellen. Der Aufbau einer Linse wird von der gewünschten Weise der Umformung der Wellenfront bestimmt. Punktförmige Lichtquellen sind elementar, und oft will man die von ihnen ausgehenden, divergierenden Kugelwellen in ein Bündel ebener Wellen umformen. Blitzgeräte, Projektoren und Scheinwerfer sollen verhindern, dass sich Lichtstrahlen in alle Richtungen zerstreuen und dabei abschwächen. Im umgekehrten Fall ist es oft notwendig, eintreffende parallele Strahlen in einem Punkt zu sammeln und ihre Energie dort zu konzentrieren, wie dies in einem Brennglas oder einer Teleskoplinse geschieht. Mehr noch: Da das Licht, das von einem Objekt reflektiert wird, von einer Vielzahl von Punktquellen ausgeht, kann man mittels einer Linse, die divergierende Wellen in konvergierende umformt, ein Bild dieses Gegenstandes erzeugen (Abb. 5.2).

Abb. 5.2: Das Gesicht eines Menschen, das wir, wie alles andere normalerweise auch, in reflektiertem Licht sehen, ist mit unzähligen atomaren Streuzentren übersät.

5 Geometrische Optik

306

5.2.1 Asphärische Flächen Um zu verstehen, wie eine Linse funktioniert, stellen wir uns vor, dass wir eine durchsichtige Substanz, in der die Lichtgeschwindigkeit anders ist als in der Umgebung, in den Weg der Wellenfront bringen. Abbildung 5.3 a zeigt eine Schnittdarstellung einer divergierenden Kugelwelle, die aus einem Medium mit dem Brechungsindex ni auf eine gewölbte Oberfläche eines Mediums mit dem Brechungsindex nt trifft. Ist nt größer als ni , verlangsamt sich die Welle beim Eintritt in das zweite Material. Der innere Teil der Wellenfront breitet sich nun langsamer aus als der äußere Teil, der sich immer noch im ursprünglichen Medium bewegt. Durch den kontinuierlichen Übergang zwischen diesen beiden Extremen wird die Wellenfront gleichmäßig abgeflacht. Ist die Oberfläche des neuen Mediums in geeigneter Weise geformt, wird die Kugelwelle in eine ebene Welle umgewandelt. Die alternative Darstellung mithilfe von Strahlen ist in Abbildung 5.3 b gezeigt: Die Strahlen werden zur Normalen hin gebrochen, wenn sie in das optisch dichtere Medium eintreten, und wenn die Oberfläche entsprechend beschaffen ist, laufen sie nun parallel.

S

(a)

(b)

D

A F1 S

F2 ni =1 (c)

nt

D

Abb. 5.3: Eine hyperbolische Grenzfläche zwischen Luft und Glas. (a) Die Wellenfronten werden geglättet. (b) Die Strahlen werden parallel. (c) Durch die hyperbolische Form der Grenzflächen sind alle optischen Weglängen von S über A zu D gleich, unabhängig von der Lage von A.

Um die geeignete Form der Oberfläche zu finden, betrachten wir Abbildung 5.3 c. Die Lage des Punktes A auf der Oberfläche kann beliebig sein. Eine Wellenfront wird in eine andere transformiert, wobei die einzelnen Wege der Energieausbreitung

5.2 Linsen

307

gleichwertig sein müssen – das heißt, die Phase der Wellenfront muss erhalten bleiben. Ein kleines Stück der von S ausgehenden Kugelwelle mit konstanter Phase muss sich in eine ebene Welle mit konstanter Phase auf DD  umwandeln. Welchen Weg das Licht zwischen S und DD  auch immer nimmt, es muss immer dieselbe Anzahl von Wellenlängen haben, sodass die Schwingungen des Lichts in Phase sind. Die Strahlungsenergie, die S als einzelne Wellenfront verlässt, muss nach der gleichen Zeit auf der Ebene DD  eintreffen, unabhängig davon, welchen Weg die einzelnen Strahlen tatsächlich genommen haben. Anders ausgedrückt muss die Summe von F1 A/λi (Anzahl der Wellenlängen entlang eines beliebigen Strahls von F1 zu A) und AD/λt (Anzahl der Wellenlängen entlang des Strahls von A zu D) konstant sein, unabhängig vom Ort von A auf der Oberfläche. Die Addition dieser beiden Strecken und Multiplikation mit λ0 ergibt     (5.1) ni F1 A + nt AD = konstant . Jeder Term auf der linken Seite entspricht der Strecke, die in einem Medium zurückgelegt wurde, multipliziert mit dem Brechungsindex des Mediums, und ist damit gleich der optischen Weglänge OWL. Die optischen Weglängen von S nach DD  sind alle gleich. Dividiert man Gleichung (5.1) durch c, so wird aus dem ersten Term die Zeit, die von S bis A benötigt wird, und aus dem zweiten Term die Zeit, die von A bis D benötigt wird. Die rechte Seite der Gleichung bleibt konstant (es ergibt sich ein anderer, aber wiederum konstanter Wert). Gleichung (5.1) ist also äquivalent mit der Aussage, dass für alle Wege von S nach DD  dieselbe Zeit erforderlich ist. Wenden wir uns nun wieder der Frage nach der Gestalt der Oberfläche zu. Wir teilen Gleichung (5.1) durch ni und erhalten   nt F1 A + AD = konstant. (5.2) ni Dies ist die Gleichung einer Hyperbel, in der die Exzentrizität (e), die die Krümmung der Kurve angibt, gegeben ist durch (nt /ni ) > 1; also e = nti > 1. Je größer die Exzentrizität, desto flacher ist die Hyperbel (je größer der Unterschied der Indizes, desto weniger ist die Oberfläche gekrümmt). Wenn sich eine Punktquelle im Brennpunkt F1 befindet und die Grenzfläche zwischen den beiden Medien hyperbolisch ist, laufen ebene Wellen durch das optisch dichtere Medium. (In Aufgabe 5.3 soll gezeigt werden, dass für (nt /ni ) < 1 die Grenzfläche elliptisch sein muss.) In jedem der in Abbildung 5.4 gezeigten Fälle gehen die Strahlen entweder divergierend von einem Brennpunkt F aus oder konvergieren in einem Brennpunkt. Des Weiteren ist die Richtung der Strahlen umkehrbar: Trifft eine ebene Welle von rechts auf die Grenzfläche in Abbildung 5.4 c, so konvergiert das Strahlenbündel (nach links) in dem weiter entfernten Brennpunkt der Ellipse. Einer der ersten, der vorschlug, Kegelschnitte für die Oberflächen von Linsen und Spiegeln zu verwenden, war Johannes Kepler (1611), doch ohne Kenntnis des snelli-

5 Geometrische Optik

308 n2

n1

n1

n2

F

(a) n1

(b) n1

n2

n2 F

(c)

(d)

Abb. 5.4: Hyperbolische (a) und (b) und elliptische (c) und (d) brechende Flächen (n2 > n1 ) im Querschnitt.

usschen Gesetzes konnte er nicht sehr weit kommen. Nachdem diese Beziehung aber entdeckt war, entwickelte Descartes 1637 mithilfe seiner analytischen Geometrie die theoretischen Grundlagen der Optik asphärischer Oberflächen. Die hier angegebene Herleitung verdanken wir im Wesentlichen Descartes. Es ist nun ein Leichtes, Linsen zu konstruieren, deren Objekt- und Bildpunkte sich außerhalb des Linsenmaterials befinden. In Abbildung 5.5 a werden auftreffende divergierende Kugelwellen von der ersten Grenzfläche nach dem in Abbildung 5.4 a angegebenen Mechanismus in ebene Wellen umgewandelt, welche die Linse auf deren Rückseite unverändert verlassen: θi = 0 und θt = 0. Da der Verlauf der Strahlen umkehrbar ist, konvergieren von der rechten Seite eintreffende ebene Wellen im Punkt F1 , den man den Brennpunkt der Linse nennt. Setzt man die ebene Fläche den parallelen Strahlen der Sonne aus, wird unsere Linse zum brauchbaren Brennglas. In Abbildung 5.5 b werden die ebenen Wellen beim Durchtritt durch die zweite Grenzfläche der Linse zur Achse hin gebrochen. Beide beschriebene Linsen sind in der Mitte dicker als am Rand, man nennt sie deshalb konvex (von lateinisch convexus, „gewölbt“). Sie bewirken, dass das eintreffende Strahlenbündel sich etwas näher an der Achse sammelt, deshalb bezeichnet man sie als Sammellinsen. Im Gegensatz hierzu ist eine konkave (von lateinisch concavus, „hohl“) Linse in der Mitte dünner als am Rand (Abb. 5.5 c). Sie lässt ein paralleles Strahlenbündel beim Austritt divergieren, streut die Strahlen also von der Achse weg und heißt deshalb Zerstreuungslinse. In Abbildung 5.5 c treten parallele Strahlen von links in die Linse ein und scheinen beim Austritt vom Punkt F2 aus zu divergieren. F2 wird ebenfalls als Brennpunkt der Linse bezeichnet. Wenn ein paralleles Strahlenbündel eine Sammellinse durchquert, nennt man den Punkt, zu dem das Licht konvergiert, den Brennpunkt der Linse; Gleiches gilt bei einer Zerstreuungslinse für den Punkt, von dem aus das Licht divergiert.

5.2 Linsen

309

F1

(a)

F2

F1

(b)

F2

(c)

(d)

Abb. 5.5: (a), (b) und (c): Verschiedene hyperbolische Linsen im Querschnitt. Zur Untersuchung einer elliptischen Linse siehe Aufgabe 5.4. (d) Eine Sammlung asphärischer Linsen. (Foto mit freundlicher Genehmigung von Melles Griot.)

Wenn sich eine punktförmige Lichtquelle auf der mittleren (optischen) Achse im Punkt F1 vor der Linse in Abbildung 5.5 b befindet, konvergieren die Strahlen im konjugierten Punkt F2 . Auf einem Schirm, den man in diesem Punkt aufstellt, erscheint ein leuchtendes, reelles Bild der Quelle. Im Gegensatz dazu befindet sich die Punktquelle in Abbildung 5.5 c im Unendlichen, und die Strahlen, die das System verlassen, divergieren. Sie scheinen vom Punkt F2 auszugehen; das Bild ist auf einem Schirm in diesem Punkt nicht sichtbar, weshalb man es virtuell nennt. Ein Beispiel ist das Bild, das ein ebener Spiegel liefert. Optische Elemente (Linsen und Spiegel) mit mindestens einer weder planaren noch sphärischen Oberfläche werden als asphärisch bezeichnet. Während ihre Funktionsweise leicht zu verstehen ist und sie bestimmte Aufgaben außerordentlich gut erfüllen können, ist es immer noch sehr schwierig, sie mit großer Präzision herzustellen. Man setzt sie ein, wenn die Kosten gerechtfertigt oder die Stückzahlen groß genug sind, und ihre Bedeutung nimmt sicherlich zu. Das erste asphärische Element hoher Qualität, das in Massenfertigung produziert wurde, war das Objektiv für die Disc Camera von Kodak (1982). Heute werden asphärische Linsen oft benutzt, um Abbildungsfehler in komplizierten optischen Systemen auf elegante Art zu korrigieren. Asphärische Brillengläser sind flacher (dünner), damit leichter als die gewöhnlichen sphärischen Linsen und lassen die Augen des Trägers für sein Gegenüber weniger groß erscheinen. Sie eignen sich deshalb besonders für stärkere Korrekturen.

5 Geometrische Optik

310

Eine neue Generation computergesteuerter Maschinen, so genannte Asphärengeneratoren, können Elemente mit einer Toleranz (Abweichung von der gewünschten Oberfläche) von weniger als 0,5 µm (0,000 05 cm) herstellen. Dieser Wert ist allerdings noch immer um den Faktor 10 größer als die allgemein für Qualitätsoptiken erforderliche Toleranz von λ/4. Nach dem Schliff können die Asphären magnetorheologisch poliert werden. Richtung und Druck der Teilchen des Schleifmittels werden dabei magnetisch gesteuert. Asphären aus Plastik oder Glas findet man heute in Instrumenten aller Qualitätsstufen unter anderem von Teleskopen, Projektoren, Kameras und Geräten zur optischen Aufklärung. Beispiel 5.1 Die folgende Zeichnung zeigt eine Glaslinse in Luft. Erläutern Sie, wie sie funktioniert.

F1

F2

Lösung Die erste Grenzfläche, die von den Strahlen getroffen wird, ist ein Ausschnitt aus einer Ellipse (eigentlich eines Ellipsoids). Die Lage ihrer beiden Brennpunkte ist durch die Pluszeichen gekennzeichnet. Wie in Abbildung 5.4 c (von rechts nach links gelesen) werden die Strahlen beim Eintritt in das Glas direkt in Richtung des hinteren Brennpunkts F2 gebrochen. Die zweite Grenzfläche muss sphärisch sein, deren Mittelpunkt in F2 liegt. Die Strahlen verlaufen dann alle senkrecht zur zweiten Grenzfläche und passieren diese ohne gebrochen zu werden.

5.2.2 Brechung an Kugelflächen Wir stellen uns zwei Körper vor, einen mit einer konkaven und einen mit einer konvexen kugelförmigen Oberfläche gleichen Durchmessers. Eine einzigartige Eigenschaft der Kugel ist, dass zwei solche Körper perfekt ineinander passen, unabhängig von ihrer Orientierung. Wenn wir nun zwei nahezu sphärische Objekte mit geeigneter Krüm-

5.2 Linsen

311

mung ineinander setzen (der eine dient als Schleifkörper, der andere ist aus Glas), sie durch ein Schleifmittel miteinander in Kontakt bringen und gegeneinander bewegen, dann werden Erhöhungen der Flächen allmählich abgetragen, und diese nähern sich immer mehr der Kugelform an (siehe Foto unten). Solche Oberflächen werden stapelweise von automatischen Schleif- und Poliermaschinen erzeugt.

Polieren einer sphärischen Linse. (Foto mit freundlicher Genehmigung der Optical Society of America.)

Es überrascht deshalb nicht, dass der allergrößte Teil heutiger Qualitätslinsen Kugelflächensegmente als Oberflächen besitzt. Unser Ziel ist es nun, mithilfe solcher Flächen eine Vielzahl von Objektpunkten, die von Licht in einem weiten Wellenlängenbereich beleuchtet werden, gleichzeitig abzubilden. Abbildungsfehler, auch Aberrationen genannt, sind dabei unvermeidlich. Man kann aber hochwertige sphärische Linsensysteme konstruieren, deren Aberrationen so gering sind, dass die Abbildungsqualität quasi nur noch von Beugungseffekten begrenzt wird.

θi

θr A



h

R

V

θt 



ϕ C

S

P

a

a

n1

S P

n2

Abb. 5.6: Brechung an einer sphärischen Grenzfläche. Konjugierte Brennpunkte.

Abb. 5.7: Strahlen, die unter demselben Winkel einfallen.

Abbildung 5.6 zeigt vom Punkt S ausgehende Wellen, die auf eine Kugeloberfläche mit dem Radius R und dem Mittelpunkt C treffen. Der Punkt V wird Scheitelpunkt genannt, die Länge a = SV ist die Objektweite. Der Strahl SA wird an der Oberfläche zur Normalen hin gebrochen (n2 > n1 ), also in Richtung der Mittellinie oder

5 Geometrische Optik

312

optischen Achse. Der Strahl schneide die optische Achse in einem Punkt P , wie alle anderen Strahlen, die unter dem Winkel θi einfallen (Abb. 5.7). Die Länge a = V P nennt man die Bildweite. Nach dem fermatschen Prinzip ist die optische Weglänge OWL konstant; das heißt, ihre Ableitung nach der Ortsvariablen ist null. Für den betrachteten Strahl gilt OWL = n1  + n2  .

(5.3)

Mit cos ϕ = − cos (180◦ − ϕ) und mit dem Kosinussatz für die Dreiecke SAC und ACP ergibt sich 1/2  = R + (a + R) − 2R (a + R) cos ϕ

und

2

2

1/2  2   .  = R2 + a − R + 2R a − R cos ϕ

Die OWL kann geschrieben werden als 1/2

OWL = n1 R2 + (a + R)2 − 2R (a + R) cos ϕ 1/2

 2   + n2 R2 + a − R + 2R a − R cos ϕ . Alle Größen in der Skizze (a , a, R usw.) sind positive Zahlen, die die Grundlage einer Vorzeichenkonvention bilden, die uns noch mehrmals begegnen wird (siehe Tab. 5.1). Da sich der Punkt A am Ende eines festen Radius bewegt (R = konstant), ist ϕ die Ortsvariable, und mit d(OWL)/dϕ = 0 erhalten wir unter Verwendung des fermatschen Prinzips n1 R(a + R) sin ϕ n2 R(a − R) sin ϕ − = 0, 2 2 woraus folgt   1 n2 a n1 a n1 n2 +  = . −   R  

(5.4)

(5.5)

Diese Beziehung muss zwischen den Parametern eines Strahls gelten, der von S nach P verläuft, nachdem er an der sphärischen Grenzfläche gebrochen wurde; sie ist zwar exakt, aber ziemlich kompliziert. Wird A durch Veränderung von ϕ an eine neue Position verschoben, schneidet der Strahl die optische Achse nicht mehr in P . (Siehe hierzu auch Aufgabe 5.1, die sich mit dem kartesischen Oval beschäftigt, einer Grenzfläche, die jeden Strahl unabhängig von ϕ nach P bricht.) Die Näherungen für

5.2 Linsen

313

Tabelle 5.1: Vorzeichenkonventionen für brechende sphärische Flächen und dünne Linsen∗ . Das Licht tritt von links ein.

a, f x a , f  x R y, y 

+ links von V + links von F + rechts von V + rechts von F  + wenn C rechts von V ist + oberhalb der optischen Achse

∗ In dieser Tabelle werden einige Größen erwähnt, die erst in Kürze eingeführt werden.

 und  , mit denen wir Gleichung (5.5) vereinfachen, sind für alles Folgende sehr wichtig. Erinnern wir uns daran, dass cos ϕ = 1 −

ϕ2 ϕ4 ϕ6 + − + ... 2! 4! 6!

(5.6)

und ϕ3 ϕ5 ϕ7 + − + ... (5.7) 3! 5! 7! ist. Wenn wir kleine Werte für ϕ annehmen (was bedeutet, dass A sich nahe V befindet), wird cos ϕ ≈ 1. Folglich liefern die Ausdrücke für  und  die Näherungen  ≈ a und  ≈ a , womit sich ergibt sin ϕ = ϕ −

n2 − n1 n1 n2 +  = . (5.8) a a R Wir hätten die Ableitung auch mit dem snelliusschen Gesetz anstatt mit dem fermatschen Prinzip beginnen können (Aufgabe 5.5). Kleine Werte für ϕ hätten dann zu sin ϕ ≈ ϕ und damit wiederum zu Gleichung (5.8) geführt. Diese Näherung kennzeichnet die so genannte Theorie erster Ordnung. Im folgenden Kapitel werden wir die Theorie dritter Ordnung (sin ϕ ≈ ϕ − ϕ3 /3!) behandeln. Strahlen, die nur um kleine Winkel gegen die optische Achse geneigt sind (sodass ϕ und h hinreichend klein sind), nennt man paraxiale Strahlen. Das Wellenfrontsegment, das von diesen paraxialen Strahlen gebildet wird, ist nahezu sphärisch und erzeugt ein ideales Bild am Punkt P bei a . Gleichung (5.8) hängt nicht vom Ort des Punktes A ab, sofern dieser sich in einem kleinen Bereich rund um die Symmetrieachse befindet, im so genannten paraxialen Bereich. Gauß gab 1841 die erste systematische Darstellung der Erzeugung von Abbildungen im Rahmen der obigen Näherung. Das Ergebnis kennen wir unter der Bezeichnung Optik erster Ordnung, paraxiale Optik oder gaußsche Optik. Sie wurde rasch zum grundlegenden theoretischen Hilfsmittel beim Entwurf von Linsen. Ist das optische System gut korrigiert, so tritt eine einfallende Kugelwelle als annähernd ideale Kugelwelle wieder aus. Ein solches System nähert sich der Theorie erster Ordnung in dem Maße an, wie seine Güte zunimmt. Abweichungen von der paraxialen Näherung sind ein geeignetes Maß für die Qualität optischer Systeme.

5 Geometrische Optik

314

F

C

f Abb. 5.8: Ebene Wellen, die sich hinter einer sphärischen Grenzfläche weiterbewegen – der Objektbrennpunkt.

F

f Abb. 5.9: Die Umformung von ebenen Wellen zu Kugelwellen durch eine sphärische Grenzfläche – der Bildbrennpunkt.

Wenn Punkt F in Abbildung 5.8 im Unendlichen abgebildet wird (a = ∞), ergibt sich n2 − n1 n1 n2 + = . a ∞ R Diese spezielle Objektweite wird als erste Brennweite oder Objektbrennweite bezeichnet, a ≡ f , sodass n1 R (5.9) f= n2 − n1 ist. Der Punkt F heißt erster Brennpunkt oder Objektbrennpunkt. Entsprechend ist der zweite Brennpunkt oder Bildbrennpunkt der axiale Punkt F  , wenn das Bild bei a = ∞ entsteht, das heißt n2 − n1 n1 n2 +  = . ∞ a R Die zweite Brennweite oder Bildbrennweite f  ist dann definitionsgemäß gleich a (Abb. 5.9), und es ergibt sich n2 R. (5.10) f = n2 − n1 Wie wir wissen, ist ein Bild virtuell, wenn die Strahlen divergierend von ihm ausgehen (Abb. 5.10). Analog ist ein Objekt virtuell, wenn Strahlen zu ihm hin konvergieren (Abb. 5.11). Das virtuelle Objekt befindet sich nun auf der rechten Seite des Scheitelpunkts, demzufolge ist a eine negative Größe. Darüber hinaus ist die Oberfläche konkav und ihr Radius ebenfalls negativ, wie von Gleichung (5.9) gefordert, da f negativ ist. In gleicher Weise ist der Abstand zu dem virtuellen Bild links von V negativ.

5.2 Linsen

315

F F



C

C

V

V

a

Abb. 5.10: Ein virtueller Bildpunkt.

Abb. 5.11: Ein virtueller Objektpunkt.

Beispiel 5.2 Ein langer, horizontaler Zylinder aus Flintglas (ng = 1,800) hat einen Durchmesser von 20 cm. An seinem linken Ende hat der Zylinder einen polierten, konvexen, halbkugelförmigen Boden. Das Instrument ist in Ethanol (na = 1,361) eingetaucht, und in der Flüssigkeit befindet sich auf der zentralen Achse, 80 cm links vom Scheitel der Halbkugel, eine winzige LED. Wo erscheint das Bild der LED? Was würde sich ändern, wenn Ethanol durch Luft ersetzt würde? Lösung Der Ausgangspunkt ist Gleichung (5.8), n2 − n1 n1 n2 +  = . a a R Die Werte sind in diesem Fall n1 = 1,361, n2 = 1,800, a = 80 cm und R = +10,0 cm. Wir lassen im Folgenden die Einheit cm weg und erhalten 1,800 − 1,361 1,361 1,800 + =  80,0 a 10,0 1,800 = (0,0439 − 0,01701) a a = 66,9 cm Wenn der Zylinder in Ethanol getaucht ist, liegt das Bild innerhalb des Glases, und zwar im Abstand von 66,9 cm rechts neben dem Scheitel (a > 0). Ohne die Flüssigkeit haben wir 1,800 0,800 1 + =  80,0 a 10,0

und

a = 26,7 cm .

Die Brechung an der Grenzfläche hängt vom Verhältnis n2 /n1 der beiden Indizes ab. Je größer (n2 − n1 ), umso kleiner wird a .

316

5 Geometrische Optik

5.2.3 Dünne Linsen Linsen werden in einer großen Vielfalt von Formen gefertigt. Beispielsweise gibt es akustische und Mikrowellenlinsen; einige der Letzteren werden aus Glas oder Wachs in leicht erkennbaren Formen hergestellt, während andere weitaus schwieriger als Linsen zu erkennen sind (siehe Foto unten). Meist besitzt eine Linse zwei oder mehr brechende Grenzflächen, und mindestens eine von ihnen ist gekrümmt. Im Allgemeinen sind die nichtplanaren Oberflächen um eine gemeinsame Achse zentriert. Meist handelt es sich um Kugelflächensegmente, die oft mit einer dünnen dielektrischen Beschichtung versehen sind, um die Durchlässigkeit in geeigneter Weise zu beeinflussen (siehe Abschnitt 9.9). Eine Linse, die aus einem Element besteht (also nur zwei brechende Flächen besitzt), ist eine einfache Linse. Bei mehr als einem Element spricht man von einem Linsensystem. Je nachdem, ob die Dicke der Linse vernachlässigt werden kann, unterscheidet man dünne und dicke Elemente. Wir beschränken uns im Folgenden meist auf zentrierte Systeme sphärischer Oberflächen (alle Oberflächen sind rotationssymmetrisch bezüglich einer gemeinsamen Achse). Unter diesen Bedingungen kann eine einfache Linse die Formen annehmen, die in Abbildung 5.12 gezeigt sind. Konvexe Linsen (Sammellinsen) sind in der Mitte dicker als am Rand und verringern in der Regel den Radius einer eintreffenden Wellenfront. Anders ausgedrückt konvergiert die Wellenfront nach Durchquerung der Linse stärker, natürlich vorausgesetzt, dass der Brechungsindex der Linse größer ist als der des umgebenden Mediums. Konkave Linsen (Zerstreuungslinsen) sind dagegen in der Mitte dünner als am Rand und schieben im Allgemeinen den inneren Teil der Wellenfront nach vorn, was dazu führt, dass die Wellenfront nach Durchquerung der Linse stärker divergiert.

Eine Linse für Mikrowellen. Die Scheiben brechen die Wellen etwa so, wie Reihen von Atomen Licht brechen. (Foto mit frdl. Genehmigung der Optical Society of America.)

5.2 Linsen

KONVEX R1 > 0 R2 < 0

bikonvex

R1 = ∞ R2 < 0

plankonvex

R1 > 0 R2 > 0

meniskuskonvex

317

KONKAV R1 < 0 R2 > 0

bikonkav

R1 = ∞ R2 > 0

plankonkav

R1 > 0 R2 > 0

meniskuskonkav

Abb. 5.12: Querschnitte verschiedener sphärischer, radialsymmetrischer einfacher Linsen. (Foto mit freundlicher Genehmigung von Melles Griot.)

Gleichungen für dünne Linsen Kehren wir zurück zur Diskussion der Brechung an einer einfachen sphärischen Grenzfläche, wobei die Lage der konjugierten Punkte S und P gegeben ist durch n2 − n1 n1 n2 +  = . a a R

[5.8]

Wenn a groß ist für ein bestimmtes (n2 − n1 ) /R, so ist a relativ klein. Der Kegel der von S ausgehenden Strahlen hat einen kleinen Öffnungswinkel, d. h., die Strahlen laufen nicht sehr weit auseinander, und die Brechung an der Grenzfläche kann dafür sorgen, dass sie in P wieder zusammenlaufen. In dem Maße, wie a kleiner wird, nimmt der Öffnungswinkel des Strahlenkegels zu, die Strahlen laufen weiter auseinander und a bewegt sich vom Scheitelpunkt weg: Sowohl θi als auch θt nehmen dann zu, bis schließlich a = f und a = ∞ ist. An diesem Punkt gilt n1 /a = (n2 − n1 ) /R. Wenn a noch kleiner wird und Gleichung (5.8) gelten soll, muss a negativ oder, anders ausgedrückt, das Bild virtuell werden (Abb. 5.13). Wir wollen nun die konjugierten Punkte für eine Linse mit dem Brechungsindex nl finden, die von einem Medium mit dem Brechungsindex nm umgeben wird (Abb. 5.14); das Element aus Abbildung 5.13 c wurde hier einfach mit einer zweiten geschliffenen Oberfläche versehen. Diese Bedingungen sind zwar nicht die allgemeinsten, aber die gebräuchlichsten und nicht zuletzt auch die einfachsten.2 Aus Gleichung (5.8) kön2

Siehe auch Jenkins und White, Grundlagen der Optik, für eine Ableitung mit drei verschiedenen Indizes.

5 Geometrische Optik

318

S

P

(a)

S (b)

P

S

Abb. 5.13: Brechung an einer sphärischen Grenzfläche in Schnittdarstellung.

(c)

nen wir entnehmen, dass paraxiale, von S bei a1 ausgehende Strahlen sich in P  im Abstand a1 von V1 treffen, der gegeben ist durch nl nl − nm nm +  = . a1 a1 R1

(5.11)

Auf der zweiten Fläche treffen dann Strahlen vom Punkt P  ein, der nun als Objektpunkt in der Entfernung a2 erscheint. Sie kommen aus dem Medium mit dem Brechungsindex nl , weshalb der Objektraum für die zweite Oberfläche, der P  enthält, den Brechungsindex nl hat. Die Strahlen von P  zu dieser Oberfläche sind tatsächlich gerade Linien. Beachtet man nun, dass   |a2 | = a1  + d ist, a2 sich auf der linken Seite befindet, also positiv ist (a2 = |a2 |), und dass sich a1 ebenfalls auf der linken Seite befindet, also negativ ist (−a1 = |a1 |), so ergibt sich a2 = −a1 + d .

(5.12)

Gleichung (5.8), auf die zweite Fläche angewendet, liefert damit nm nm − nl nl +  = .  (−a1 + d) a2 R2

(5.13)

5.2 Linsen

319

P

S

(a)

nl

na

na C1

C2

(b)

P

V1 S C2 R2

C1

nl

nm

a1

a1

P

V2

nm

R1

d a2

a2

(c)

Abb. 5.14: Sphärische Linse. (a) Strahlen, die in einer vertikalen Ebene liegen, fallen durch eine Linse; die konjugierten Brennpunkte sind bezeichnet. (b) Brechung an den Grenzflächen. Der von C1 ausgehend gezeichnete Radius steht senkrecht auf der ersten Grenzfläche; der Strahl wird beim Eintritt in die Linse zur Normalen hin abgelenkt. Der von C2 ausgehende Radius steht senkrecht auf der zweiten Genzfläche; beim Austritt aus der Linse wird der Strahl wegen nl > na von der Normalen weg abgelenkt. (c) Geometrische Darstellung.

Hier ist nl > nm und R2 < 0; das bedeutet, die rechte Seite der Gleichung ist positiv. Addieren wir die Gleichungen (5.11) und (5.13), erhalten wir   1 1 nl · d nm nm +  = (nl − nm ) − . (5.14) +  a1 a2 R1 R2 (a1 − d) a1 Für hinreichend dünne Linsen (d → 0) geht der letzte Term auf der rechten Seite gegen null. Als weitere Vereinfachung nehmen wir an, dass das umgebende Medium Luft sei

5 Geometrische Optik

320

(nm ≈ 1). Dies führt uns zu der sehr nützlichen Gleichung für dünne Linsen, die auch oft als Linsenschleiferformel bezeichnet wird:   1 1 1 1 + = (nl − 1) − (5.15) a a R1 R2 (a1 = a und a2 = a ). Die Punkte V1 und V2 verschmelzen bei d → 0, sodass a und a von jedem der beiden Scheitelpunkte aus gemessen werden können. Genau wie im Fall einer einzelnen sphärischen Fläche wird aus der Bildweite die Brennweite f  , wenn a gegen unendlich geht: lim a = f 

a→∞

und analog

lim a = f .

a →∞

Aus Gleichung (5.15) folgt, dass für eine dünne Linse f  = f ist und wir daher die Indizes weglassen können. Dies ergibt   1 1 1 = (nl − 1) − (5.16) f R1 R2 und 1 1 1 + (5.17) = ; a a f Dies ist die gaußsche Linsenformel. Als Anwendungsbeispiel für diese Gleichungen berechnen wir die Brennweite einer dünnen plankonvexen Linse mit einem Krümmungsradius von 50 mm und einem Brechungsindex von 1,5 in Luft. Tritt das Licht auf der planaren Seite in die Linse ein (R1 = ∞, R2 = −50), erhalten wir   1 1 1 = (1,5 − 1) − ; f ∞ −50 tritt das Licht auf der gewölbten Oberfläche ein (R1 = +50, R2 = ∞), so ist   1 1 1 = (1,5 − 1) − . f +50 ∞ Damit ist die Brennweite in beiden Fällen f = 100 mm. Wird ein Objekt im Abstand von 600 mm, 200 mm, 150 mm, 100 mm bzw. 50 mm zur Linse auf einer beliebigen Seite positioniert, können wir die Bildpunkte mittels Gleichung (5.17) berechnen: a =

600 · 100 af −f = a 600 − 100

ergibt zum Beispiel a = 120 mm; analog erhalten wir die Bildweiten zu 200 mm, 300 mm, ∞ und −100 mm. Interessanterweise ist a = f bei a = ∞; wenn a abnimmt, wächst a bis a = f ; danach ist a negativ. In Abbildung 5.15 ist dieses Verhalten dargestellt. Die Linse ist dazu

5.2 Linsen

321

Wellenfronten divergierender Lichtwellen, die teilweise von einer Linse fokussiert werden. Die Fotografie zeigt fünf Aufnahmen eines 10 ps langen Lichtpulses, der durch eine Sammellinse wandert. Die Aufnahmen erfolgten in einem Abstand von 100 ps (100 × 10−12 s). (Mit frdl. Genehmigung von N. H. Abramson)

geeignet, die Konvergenz der Strahlen um ein bestimmtes Maß zu erhöhen. Wenn die Divergenz des einfallenden Lichts zunimmt, kann die Linse die Strahlen nicht mehr so leicht sammeln, und der Punkt P verschiebt sich weiter nach rechts. Sie können dies qualitativ mit einer einfachen Sammellinse und einer kleinen, aber kräftigen Lichtquelle nachprüfen. Stellen Sie sich mit der Linse weit entfernt von der Lichtquelle auf und projizieren Sie ein scharfes Bild der Lampe auf ein Blatt weißes Papier. Die Bildweite entspricht nun in etwa der Brennweite f . Bewegen Sie nun die Linse langsam auf die Lichtquelle zu und passen Sie a kontinuierlich an, sodass Sie ständig ein scharfes Bild erhalten. Dabei wächst die Bildweite. Nähert sich nun a der Brennweite f , so können Sie ein scharfes Bild der Lampe erzeugen, indem Sie den

2F

2F

2F

2F

2F

2F

2F

F

F

2F

F

F

2F

F

F

F

F

F

F

F

2F

2F

F

2F

F

2F

F

2F

Abb. 5.15: Konjugierte Objekt- und Bildpunkte für eine dünne konvexe Linse.

5 Geometrische Optik

322

Schirm immer weiter von der Linse wegbewegen. Für a < f ist selbst auf der am weitesten entfernten Wand nur noch ein großer unscharfer Lichtfleck zu sehen, der durch den divergierenden Strahlenkegel erzeugt wird – das Bild ist nun virtuell. Brennpunkte und Brennebenen Abbildung 5.16 skizziert einige der Situationen, die von Gleichung (5.16) analytisch beschrieben werden. Wird eine Linse mit dem Brechungsindex nl von einem Medium mit dem Brechungsindex nm umgeben, erhalten wir   1 1 1 = (nlm − 1) − . (5.18) f R1 R2 Die Brennweiten in den Teilen (a) und (b) von Abbildung 5.16 sind identisch, denn das umgebende Medium ist auf beiden Seiten der Linse gleich. Wegen nl > nm folgt nlm > 1. In beiden Fällen ist R1 > 0 und R2 < 0, sodass beide Brennweiten positiv sind. Wir haben ein reelles Objekt in (a) und ein reelles Bild in (b). In (c) ist nl < nm , folglich ist f negativ. In (d) und (e) ist nlm > 1, aber R1 < 0, während R2 > 0 ist. f ist daher wiederum negativ, und das Objekt (d) sowie das Bild (e) sind virtuell. In (f) ist nlm < 1, also ergibt sich f > 0. nm F

F

F

nl (a)

(b)

F

F

(d)

(c)

(e)

F

(f)

F (g)

(h)

Abb. 5.16: Brennweiten von Sammellinsen und Zerstreuungslinsen.

Es ist zweckmäßig, einen Strahl durch den Mittelpunkt der Linse zu zeichnen, der nicht gebrochen wird, da er senkrecht auf beide Oberflächen trifft. Stellen wir uns dagegen einen paraxialen Strahl vor, der parallel zur Einfallsrichtung wieder aus der Linse austritt (Abb. 5.17). Solche Strahlen müssen durch einen Punkt O laufen, den wir

5.2 Linsen

323

Abb. 5.17: Der optische Mittelpunkt einer Linse. (Foto E. H.)

als optischen Mittelpunkt der Linse bezeichnen. Um dies zu beweisen, zeichnen wir zwei parallele Ebenen tangential zur Linse mit den beliebigen Berührungspunkten A und B. Diese werden so gewählt, dass die Radien AC1 und BC2 parallel zueinander sind. Es ist zu zeigen, dass für den paraxialen Strahl durch AB Ein- und Austrittsrichtung übereinstimmen. Der Skizze kann man entnehmen, dass die Dreiecke AOC1 und BOC2 einander geometrisch   ähnlich sind, daher sind ihre Seiten proportional zueinander. Damit ist |R1 | OC2 = |R2 | OC1 , und weil die Radien konstant sind, ist auch der Ort von O konstant, und zwar unabhängig von A und B. Wie wir bereits gesehen haben (Aufgabe 4.38 und Abb. A.4.38), wird ein Strahl, der eine planparallele Platte durchquert, nur parallelverschoben, aber nicht abgelenkt. Die Verschiebung ist proportional zur Dicke, welche für eine dünne Linse vernachlässigbar ist. Daher kann man Strahlen, die durch O gehen, als gerade Linie zeichnen. Bei dünnen Linsen zeichnet man O üblicherweise in die Mitte zwischen beiden Scheitelpunkten. Wie wir bereits gesehen haben, sammelt sich ein Bündel paraxialer Strahlen parallel zur optischen Achse in einem Punkt auf dieser Achse (Abb. 5.10). Verschiedene solche Bündel sammeln sich daher in einem Kugelsegment σ, dessen Mittelpunkt ebenfalls in C liegt (Abb. 5.18). Die ungebrochenen Strahlen, die senkrecht auf der Oberfläche auftreffen, legen die Brennpunkte auf σ fest. Da der Strahlenkegel tatsächlich sehr schmal sein muss, kann σ mit befriedigender Genauigkeit als Ebene durch den

F C

F

O

f σ

Abb. 5.18: Fokussierung verschiedener Strahlenbündel.

σ Brennebene

Abb. 5.19: Die Brennebene einer Linse.

5 Geometrische Optik

324

Brennpunkt, senkrecht zur optischen Achse, dargestellt werden. Diese Ebene wird auch als Brennebene bezeichnet. Beschränken wir uns auf die Theorie der paraxialen Strahlen, so fokussiert eine Linse alle eintreffenden parallelen Strahlenbündel3 in einer Ebene, der zweiten oder hinteren Brennebene (Abb. 5.19). Hier wird jeder Punkt auf σ durch den nicht abgelenkten Strahl durch O festgelegt. Analog enthält die erste oder vordere Brennebene den Objektbrennpunkt F . Es gibt noch eine weitere Beobachtung im Zusammenhang mit Linsen, die von praktischer Bedeutung ist und die, bevor wir mit dem Stoff fortfahren, kurz vorgestellt werden soll. Sie hat mit der Beziehung zwischen der Form und der Brennweite zu tun. Wenden wir uns noch einmal Gleichung (5.16) zu, in der die physikalischen Charakteristika einer Linse miteinander in Beziehung gesetzt werden. Der Einfachheit halber wollen wir eine bikonvexe Linse mit R1 = −R2 = R betrachten. Die Gleichung wird dann zu f = R/2(nl − 1), und wir können unmittelbar ablesen, dass die Brennweite umso kürzer ist, je kleiner der Linsenradius ist (d. h. je stärker die Linse gekrümmt ist). Eine nahezu flache Linse hat eine große Brennweite, während eine kleine Kugel (die man kaum als „dünne Linse“ bezeichnen kann), eine winzige Brennweite hat. Offensichtlich werden die Strahlen umso stärker an der Grenzfläche abgelenkt, je größer die Krümmung ist (siehe Abb. 5.20). Bedenken Sie außerdem, dass f umgekehrt proportional zu nl ist, eine Tatsache, auf die wir apäter zurückkommen werden, wenn wir uns mit Abbildungsfehlern beschäftigen. Wenn man eine flachere Linse haben möchte, muss man nur ihren Brechungsindex und damit R erhöhen und dabei die Brennweite unverändert lassen.

f

3

Abb. 5.20: Je größer die Krümmung (1/R), umso kürzer die Brennweite.

Die vielleicht früheste Erwähnung einer Linse als Brennglas findet sich im Stück „Die Wolken“ von Aristophanes (423 v. Chr.). In ihm plant Strepsiades, ein Brennglas zu benutzen, um die Sonnenstrahlen auf eine Wachsschreibtafel zu bündeln und dadurch die Aufzeichnung der Spielschulden herauszuschmelzen.

5.2 Linsen

325

Endlich große Abbildungen Bisher haben wir uns mit der mathematischen Abstraktion einer punktförmigen Lichtquelle beschäftigt. Nun wollen wir auch berücksichtigen, dass ein endlich großes Objekt aus einer Vielzahl solcher Punktquellen zusammengesetzt ist (Abb. 5.2). Zunächst betrachten wir ein Objekt in Form eines Kugelflächenausschnittes σ mit dem Mittelpunkt C (Abb. 5.21). Wenn sich σ nahe der sphärischen Oberfläche befindet, hat der Punkt S ein virtuelles Bild P (a < 0, daher links von V ). Das Bild eines weiter entfernten Punktes S ist dagegen reell (a > 0, daher rechts der Linse). In beiden Fällen gehört zu jedem Punkt auf σ ein konjugierter Punkt auf σi , der auf einer geraden Linie durch C liegt. Innerhalb der paraxialen Näherung können diese beiden Flächen als eben betrachtet werden. Damit erzeugt ein kleines, ebenes, senkrecht auf der optischen Achse stehendes Objekt ein kleines, ebenes und ebenfalls senkrecht auf der optischen Achse stehendes Bild. Wenn wir σ ins Unendliche verschieben, sind die Strahlen, die von jeder einzelnen Punktquelle kommen, kollimiert, d. h. zu Parallelen zusammengeführt, und die Bildpunkte liegen in der Brennebene (Abb. 5.19).

(a)

(b)

Abb. 5.21: Endlich große Abbildungen.

Wenn wir die rechte Seite des Mediums in Abbildung 5.21 abschneiden und polieren, können wir eine dünne Linse herstellen. Zur Erinnerung: Das Bild (σi in Abb. 5.21), das von der ersten Fläche der Linse erzeugt wird, dient als Objekt für die zweite Fläche, die das endgültige Bild erzeugt. Nun nehmen wir an, σi in Abbildung 5.21 a sei das Objekt für die zweite Oberfläche, welche einen negativen Radius haben soll. Wir wissen schon, was nun passiert – die Situation ist fast identisch mit der in Abbildung 5.21 b, nur die Strahlrichtung ist umgekehrt. Das endgültige Bild, das eine Linse von einem kleinen, ebenen, senkrecht auf der optischen Achse stehenden Objekt erzeugt, ist ebenfalls eine kleine, ebene, senkrecht auf der optischen Achse stehende Fläche. Ort, Größe und Orientierung eines Bildes, das von einer Linse erzeugt wird, kann man mithilfe von Strahlenverlaufsdiagrammen leicht bestimmen. Um das Bild des Objekts (Abb. 5.22) zu ermitteln, müssen wir den Bildpunkt zu jedem Objektpunkt bestimmen. Da alle Strahlen einer Punktquelle innerhalb eines paraxialen Kegels in ihrem Bildpunkt wieder zusammenlaufen, genügen dafür zwei Strahlen. Wir kennen die Position der beiden Brennpunkte und können daher den Verlauf dreier spezieller Strahlen besonders leicht bestimmen. Der erste Strahl (1) ist der nicht abgelenkte Mittelpunktsstrahl. Bei den beiden anderen Strahlen nutzen wir aus, dass ein durch den Brennpunkt verlaufender Strahl parallel zur optischen Achse austritt und umgekehrt.

5 Geometrische Optik

326 1

2 F'

3 F

1

2 F'

3 F

Abb. 5.22: Der Verlauf einiger wichtiger Strahlen durch eine Sammellinse und durch eine Zerstreuungslinse.

Um einen Strahlenverlauf zu konstruieren, können Sie etwa wie folgt vorgehen: Zeichnen Sie den Durchmesser der Linse (ihre senkrechte Ausdehnung) ungefähr so groß wie deren Brennweite. Geben Sie dann Punkte auf der optischen Achse im Abstand von einer und zwei Brennweiten an, jeweils vor und hinter der Linse. Wählen Sie den obersten oder den untersten Punkt Ihres Objekts. Um die Lage des Bildes zu bestimmen genügt es meist, von diesem Punkt aus die Strahlen 1 und 2 zu verfolgen. Wie Abbildung 5.23 zeigt, reichen zwei dieser Strahlen aus, um das Bild eines Objektpunktes zu ermitteln. Die Methode geht auf eine Arbeit von Robert Smith (1738) zurück. Dieses graphische Verfahren kann weiter vereinfacht werden, indem man die Linse durch eine Ebene ersetzt, die durch ihren Mittelpunkt verläuft (Abb. 5.24). Verlängern wir jeden eintreffenden Strahl etwas nach vorn, jeden austretenden Strahl dagegen etwas nach hinten, so treffen sich alle Strahlenpaare in dieser Ebene. Nun nehmen wir an, jeder Strahl würde nur durch diese Ebene abgelenkt. Diese Sicht ist zu dem tatsächlichen Vorgang (zwei einzelne Ablenkungen an den beiden Linsenoberflächen) äquivalent. (Wie wir später sehen werden, ist dies gleichbedeutend mit der Aussage, dass die beiden Hauptebenen einer dünnen Linse zusammenfallen.)

5.2 Linsen

327

2

' 1 3 (a)

2 3

'

1 (b)

(c)

(d) Abb. 5.23: (a) Ein reelles Objekt und eine Sammellinse. (b) Ein reelles Objekt und eine Zerstreuungslinse. (c) Ein reelles Bild, das auf die Mattscheibe einer Kleinbild-Spiegelreflexkamera projiziert wird. Dies ist vergleichbar mit dem Bild, welches das Auge auf die Netzhaut wirft. Hier wurde das Prisma entfernt, sodass Sie das Bild direkt sehen können. (d) Das verkleinerte, aufrechte, virtuelle Bild, das von einer Zerstreuungslinse erzeugt wird. (Foto E. H.)

S2

2

A 1

y S1

F

F

P1 y

O

3

B x

f a

Abb. 5.24: Objekt- und Bildlage bei einer dünnen Linse.

x

f a

P2

5 Geometrische Optik

328

Gemäß Konvention nimmt man Abstände zu Punkten oberhalb der optischen Achse als positiv an. Daher ist in Abbildung 5.24 y > 0 und y  < 0. Dieses Bild bezeichnet man als umgekehrt; aufrecht heißt es bei y  > 0 und y > 0. Die Dreiecke AOF  und P2 P1 F  sind ähnlich; damit ist f y =  .  |y | (a − f ) Analog dazu sind die Dreiecke S2 S1 O und P2 P1 O ähnlich, und es ist a y = ,  |y | a

(5.19)

(5.20)

wobei alle Größen außer y  positiv sind. Somit gilt f a =   a (a − f ) und

(5.21)

1 1 1 = + , f a a

was natürlich die gaußsche Linsengleichung (5.17) ist. Weiterhin sind die Dreiecke S2 S1 F und BOF ähnlich, und es ist |y  | f = . a−f y

(5.22)

Mit den Abständen von den Brennpunkten und Gleichung (5.19) erhalten wir xx = f 2 .

(5.23)

Dies ist die newtonsche Abbildungsgleichung, die erstmals von Newton in seinen Opticks (1704) formuliert wurde. Die Vorzeichen von x und x entsprechen der Lage bezüglich der jeweiligen Brennpunkte. Gemäß Konvention ist x links von F positiv, x dagegen rechts von F  . Gleichung (5.23) kann man entnehmen, dass x und x gleiche Vorzeichen haben, was bedeutet, dass Objekt und Bild auf entgegengesetzten Seiten ihrer jeweiligen Brennpunkte liegen müssen. Dies ist eine nützliche Eselsbrücke zum schnellen Skizzieren von Strahlendiagrammen. Das Verhältnis der transversalen Ausdehnung des Bildes, das von einem optischen System erzeugt wird, zu der des Objekts wird als Abbildungsmaßstab oder transversale Vergrößerung MT ≡

y y

(5.24)

bezeichnet. Mit Gleichung (5.20) ist MT = −

a . a

(5.25)

5.2 Linsen

329

Größe a a f y y MT

Tabelle 5.2: Bedeutungen der Vorzeichen verschiedener Parameter von dünnen Linsen und optischen Instrumenten mit sphärischer Krümmung.

Vorzeichen +



reelles Objekt reelles Bild Sammellinse aufrechtes Objekt aufrechtes Bild aufrechtes Bild

virtuelles Objekt virtuelles Bild Zerstreuungslinse umgekehrtes Objekt umgekehrtes Bild umgekehrtes Bild

Ein positives MT zeigt ein aufrechtes, ein negatives MT ein umgekehrtes Bild an (siehe Tab. 5.2). Da sowohl a als auch a für reelle Objekte und Bilder positiv ist, sind alle reellen Bilder, die von einer dünnen Linse erzeugt werden, umgekehrt. Der newtonsche Ausdruck für die Vergrößerung ergibt sich aus den Gleichungen (5.19) und (5.22) sowie aus Abbildung 5.24: MT = −

f x =− . f x

(5.26)

Der Wahl des Begriffes Vergrößerung ist nicht sehr glücklich: Der Betrag von MT kann durchaus kleiner sein als 1, und in diesem Falle ist das Bild kleiner als das Objekt. Wenn die Objekt- und Bildweiten positiv und gleich sind, wird MT = −1; gemäß Gleichung (5.17) geschieht dies nur, wenn a = a = 2f ist. In dieser Konfiguration kommen sich Objekt und Bild so nahe wie irgend möglich (das heißt, ihr Abstand beträgt 4f , siehe Aufgabe 5.15). Tabelle 5.3 fasst Bildkonfigurationen zusammen, die sich aus einer Anordnung eines Objekts vor einer dünnen Linse ergeben können. Tabelle 5.3: Abbildungen reeller Objekte, die durch dünne Linsen erzeugt werden.

konvex Objekt Lage ∞ > a > 2f a = 2f f < a < 2f a=f a a > 2f ±∞ |a | > a

Ausrichtung umgekehrt umgekehrt umgekehrt

relative Größe verkleinert gleich groß vergrößert

aufrecht

vergrößert

konkav Objekt Lage überall möglich

Abbildung Art virtuell

Lage |a | < |f |, a > |a |

Ausrichtung aufrecht

relative Größe verkleinert

5 Geometrische Optik

330

Beispiel 5.3 Eine bikonvexe, dünne, sphärische Linse hat Krümmungsradien von 100 cm und 20,0 cm. Die Linse ist aus Glas mit einem Brechungsindex von 1,54 gefertigt und befindet sich in Luft. (a) Wo erscheint das Bild eines Objektes, das sich 70,0 cm vor der 100- cm-Fläche der Linse befindet? Beschreiben Sie das Bild im Detail. (b) Bestimmen Sie die transversale Vergrößerung. (c) Zeichnen Sie den Strahlenverlauf. Lösung (a) Wir haben die Brennweite nicht, doch wir kennen alle physikalischen Parameter und besinnen uns auf Gleichung (5.16):   1 1 1 = (nl − 1) − . f R1 R2 In der folgenden Rechnung lassen wir die Einheit (cm) weg:   1 1 1 = (1,54 − 1) − f 100 −20,0   1 1 1 = (0,54) + f 100 20,0 6 1 = (0,54) f 100 f = 30,86 cm ≈ 30,9 cm Nun können wir das Bild finden. Wegen a = 70,0 cm ist dies größer als 2f . Damit wissen wir sogar ohne a zu berechnen, dass das Bild reell und umgekehrt sein wird, dass es sich zwischen f und 2f befindet und dass es verkleinert ist. Um a aus f zu bestimmen, verwenden wir die gaußsche Gleichung: 1 1 1 + =  a a f 1 1 1 = +  a 70,0 30,86 1 1 1 − = 0,01812 = a 30,86 70,0 und a = 55,19 ≈ 55,2 Das Bild liegt zwischen f und 2f auf der rechten Seite der Linse. Wegen a > 0 ist das Bild reell.

5.2 Linsen

331

(b) Die Vergrößerung folgt aus MT = −

55,19 a =− = −0,788 . a 70,0

Das Bild ist umgekehrt (MT < 0) und verkleinert (MT < 1). (c) Wir skizzieren die Linse und markieren auf beiden Seiten die doppelte Brennweite:

2f 30.9

f 2f

70.0

Das Objekt wird links von der Linse hinter 2f platziert. Das Bild fällt zwischen f und 2f .

Wir sind nun in der Lage, das Verhalten einer einzelnen konvexen oder konkaven Linse zu verstehen. Betrachten wir jetzt eine weit entfernte Punktquelle, die einen Strahlenkegel auf eine Sammellinse wirft (Abb. 5.25). Ist die Entfernung der Quelle unendlich groß (das heißt so groß, dass man sie als unendlich ansehen kann), so treffen deren Strahlen praktisch parallel auf die Linse (Abb. 5.25 a) und sammeln sich im Brennpunkt F  . Ist die Entfernung kleiner (Abb. 5.25 b), aber immer noch recht groß, so wird der in die Linse eindringende Strahlenkegel relativ schmal: Die Strahlen treffen nur geringfügig geneigt auf die Oberfläche der Linse und werden im Punkt P1 gesammelt. Bewegt sich die Quelle nun näher an die Linse heran, so divergieren die eintreffenden Strahlen mehr und mehr, und der resultierende Bildpunkt verschiebt sich immer weiter nach rechts. Erreicht die Quelle den Punkt F , dann divergieren die Strahlen so stark, dass die Linse sie nicht mehr zur Konvergenz bringen kann; sie verlassen die Linse parallel zur optischen Achse. Rückt man die Quelle noch näher an die Linse, dann divergieren die Strahlen sogar hinter dieser. Der Bildpunkt ist nun virtuell – es gibt keine reellen Bilder von Objekten, die sich im Abstand f oder in noch kleinerem Abstand zur Linse befinden. Abbildung 5.26 veranschaulicht diesen Zusammenhang. Wenn das Objekt näher an die Linse heranrückt, entfernt sich das reelle Bild von ihr. Ist das Objekt sehr weit von der Linie entfernt, so entsteht das Bild (reell, umgekehrt, verkleinert mit MT < 1) unmittelbar rechts von der Brennebene. Je näher das Objekt der Linse kommt, umso

332

5 Geometrische Optik

Abb. 5.25: (a) Die Wellen eines weit entfernten Objekts flachen bei der Ausbreitung ab, und die Radien werden immer größer. Aus der Ferne gesehen, sind die Strahlen jeder Punktquelle so gut wie parallel, und eine Linse lässt sie in ihrem Brennpunkt F  konvergieren. (b) Kommt die Punktquelle näher, divergieren die Strahlen immer stärker und der Bildpunkt entfernt sich immer weiter von der Linse. Die Strahlen, die aus der Rückseite der Linse heraustreten, konvergieren nicht mehr, wenn das Objekt den Brennpunkt erreicht. Kommt das Objekt noch näher, divergieren sie.

weiter entfernt sich das Bild (noch immer reell, umgekehrt, verkleinert mit MT < 1) nach rechts von der Brennebene, wobei es immer größer wird. Befindet sich das Objekt zwischen dem Unendlichen und 2f , so entspricht dies der Bildentstehung in Kameras und im Augapfel (in beiden Fällen werden verkleinerte, reelle Bilder benötigt). Das Aufrichten des im Auge entstehenden Bildes wird übrigens vom Gehirn übernommen. Bei einer Objektweite von 2f nimmt das Bild (reell und umgekehrt) die Größe des Objekts an (MT = 1). Diese Anordnung ist bei Kopiergeräten erwünscht. Nimmt die Objektweite weiter ab (sie liegt nun zwischen 2f und f ), so rückt das Bild (reell, umgekehrt und nun vergrößert, MT > 1) schnell nach rechts und wird dabei weiterhin größer. Eine solche Anordnung begegnet uns beim einem Filmprojektor: Hier kommt es darauf an, dass ein reelles, vergrößertes Bild entsteht. Das Aufrichten des Bildes für den Betrachter erreicht man, indem man den Film einfach auf dem Kopf stehend einlegt. Befindet sich das Objekt exakt im Brennpunkt, wird das Bild ins Unendliche verschoben. (Es entsteht kein Bild; die austretenden Strahlen sind parallel.) Bei Objektweiten kleiner f entsteht ein virtuelles, aufrechtes, vergrößertes (MT >1) Bild, wie es uns von der Lupe vertraut ist. Wir erinnern uns daran, dass der Strahl, der parallel zur optischen Achse in die Linse eintritt, die Höhe des reellen Bildes festlegt (Abb. 5.27). Da dieser Strahl von der optischen Achse weg abgelenkt wird, nimmt die Größe des Bildes rasch zu, wenn sich das Objekt dem Brennpunkt F nähert.

5.2 Linsen

333

(a)

(b)

(c)

(d)

Abb. 5.26: Der Abbildungsvorgang bei einer dünnen Sammellinse.

Beispiel 5.4 Wir betrachten eine bikonvexe, dünne, sphärische Linse, die auf beiden Seiten die gleiche Krümmung hat. Auf der optischen Achse der Linse befindet sich in 100 cm Entfernung ein 2 cm großer Käfer. Das auf eine Wand geworfene Bild des Käfers ist 4 cm groß. Nehmen Sie an, dass das Glas der Linse den Brechungsindex 1,50 hat und bestimmen Sie den Krümmungsradius. Lösung Bekannt sind die Werte y = 2,0 cm, a = 100 cm, R1 = R2 , |y  | = 4,0 cm und nl = 1, 50. Wir wissen außerdem, dass das Bild reell ist – es muss

5 Geometrische Optik

334

also umgekehrt sein, sodass y  = −4,0 ist, und das ist von Bedeutung! Um den Radius zu bestimmen, benötigen wir Gleichung (5.16) und die Brennweite. Wir bestimmen zunächst a aus MT und anschließend f : a −4,0 y =− = = −2,0 y a 2,0 a = 2,0 a = 200 cm .

MT =

Unter Verwendung der gaußschen Linsenformel erhalten wir 1 1 1 1 1 = +  = + f a a 100 200 200 = 66,67 cm . f= 3 Die Linsenschleiferformel liefert uns schließlich R:   1 1 12 1 = (1,50 − 1) − = f R −R 2R und damit f = R = 67 cm . Es ist außerdem zu beachten, dass die Transformation vom Objektraum in den Bildraum nicht linear ist; der gesamte Objektraum links der Linse von 2f bis ins Unendliche wird im Bereich zwischen f und 2f des Bildraums rechts der Linse komprimiert. Abbildung 5.27 verdeutlicht, dass der Bildraum verzerrt ist: Ein Objekt, das sich gleichförmig zur Linse hinbewegt, erzeugt ein Bild, welches sich ungleichmäßig

F F

f

f

f

f

Abb. 5.27: Der Strahl, der parallel zur optischen Achse in die Linse eintritt, bestimmt die Bildhöhe.

5.2 Linsen

335

entlang der und quer zur optischen Achse verändert. Die axialen Maße wachsen viel schneller als die entsprechende Bildhöhe. Diese relative Abflachung des weit entfernten Objektraums kann man leicht mit einem Fernrohr beobachten, das im Prinzip einer Linse mit langer Brennweite entspricht. Sicherlich ist Ihnen bereits aufgefallen, dass ein sich schnell auf eine Kamera zubewegender, mit einem Teleobjektiv aufgenommener Filmdarsteller vergleichsweise langsam voranzukommen scheint, da sich seine Größe nur allmählich verändert. Wenn ein Objekt näher als eine Brennweite an einer Linse liegt (Abb. 5.26 d), dann ist das Bild virtuell, aufrecht und vergrößert. Nach Tabelle 5.3 erscheint das Bild links von der Linse und ist weiter von dieser entfernt als das Objekt. In Abbildung 5.28 sehen wir, was mit dem virtuellen Bild passiert. Hier haben wir verschiedene Objekte, alle von der gleichen Größe, die zwischen dem Brennpunkt F und dem Scheitelpunkt V positioniert sind. Ein zweiter Strahl parallel zur optischen Achse markiert die Spitzen der Objekte; er wird durch den Punkt F  gebrochen, und die Verlängerung dieses Strahls nach hinten definiert die Höhen der verschiedenen Bilder. Beachten Sie, dass die Bilder zusammenschrumpfen, wenn die Objekte näher an die Linse gebracht werden, wobei die Vergrößerung aber stets größer als 1 bleibt. Wenn ein Objekt direkt gegen die Linse gedrückt wird, dann hat das Bild die Größe des Objektes.

V

F f

F'

Abb. 5.28: Erzeugung von virtuellen Bildern durch eine Sammellinse. Je näher das Objekt der Linse ist, umso näher ist auch das Bild.

Longitudinale Vergrößerung Das Bild eines dreidimensionalen Objekts nimmt seinerseits auch einen dreidimensionalen Teil des Bildraumes ein. Das optische System kann offensichtlich sowohl die transversale als auch die longitudinale Dimension des Bildes beeinflussen. Die longitudinale Vergrößerung ML , die sich auf die axiale Richtung bezieht, ist definiert als dx . (5.27) dx Dies ist das Verhältnis zwischen einer infinitesimalen axialen Länge im Bildraum und der entsprechenden Länge im Objektraum. Die Ableitung der Gleichung (5.23) führt zu ML ≡

ML = −

f2 = −MT2 x2

(5.28)

5 Geometrische Optik

336

Abb. 5.29: Die Transversalvergrößerung unterscheidet sich von der longitudinalen Vergrößerung.

für eine dünne Linse in einem Medium (Abb. 5.29). Offensichtlich ist ML > 0, woraus folgt, dass positive dx zu negativen dx gehören und umgekehrt. Anders ausgedrückt: Ein Finger, der auf die Linse zeigt, ist im Bild von ihr weg gerichtet (Abb. 5.30).

O

Abb. 5.30: Bildorientierung bei einer dünnen Linse.

Erzeugen Sie ein Bild eines Fensters auf einem Blatt Papier mithilfe einer einfachen Sammellinse. Angenommen, der Blick durch das Fenster bietet eine schöne Aussicht auf einen Wald, und Sie bilden die Bäume auf dem Papier ab. Bewegen Sie jetzt das Papier weiter von der Linse weg, sodass es einen anderen Teil des Bildraumes schneidet. Nun verschwinden die Bäume, und das Fenster wird sichtbar. Virtuelle Objekte Wir werden in Kürze Kombinationen von Linsen untersuchen, doch zuvor wollen wir eine Situation betrachten, die sehr oft auftritt, wenn mehrere Linsen aufeinander folgen. Die Strahlen können dann, wie in Abbildung 5.31 a skizziert, auf ihrem Weg zu einer Linse konvergieren. In der Abbildung sind die Strahlen symmetrisch um die optische Achse verteilt, und alle verlaufen in Richtung des objektseitigen Brennpunkts F . Das Ergebnis ist, dass die Strahlen die Linse parallel zur optischen Achse verlassen und das Bild im Unendlichen liegt – was gleichbedeutend damit ist, dass es kein Bild gibt. Da die Strahlen in Richtung des objektseitigen Brennpunkts F zusammenlaufen, sagt man oft, dass sie einem virtuellen Punktobjekt entsprechen. Das Gleiche gilt für den objektseitigen Brennpunkt in Abbildung 5.31 b. Hier bildet Strahl 1, der durch die Mitte der Linse geht, einen kleinen Winkel mit der Achse. Die Strahlen laufen alle in die Richtung des Punktes F auf der Brennebene, und wir

5.2 Linsen

337

Strahl 1

F

(a)

Strahl 1 F

(b)

Abb. 5.31: Virtuelle Punktobjekte für eine Zerstreuungslinse (a) auf und (b) abseits der optischen Achse. Wenn Strahlen zum Objekt hin konvergieren, ist das Objekt virtuell. Dies ist in Linsensystemen häufig der Fall.

haben wieder ein virtuelles Punktobjekt. Alle Strahlen verlassen die Linse parallel zu Strahl 1. Dies ist eine wichtige Eigenschaft, die wir uns merken werden und von der wir später Gebrauch machen.

Strahl 2

Strahl 3 Strahl 1

F

O

F

a' > 0 a 0). Wenn man bei a einen Spiegel platzieren würde, dann würde auf diesem ein Bild erscheinen. Wenn Objekt

5 Geometrische Optik

338

und Bild beide auf der gleichen Seite der Linse erscheinen, dann muss eines von ihnen reell und das andere virtuell sein. Eine ähnliche Situation haben wir in Abbildung 5.33. Auch hier laufen wieder drei Strahlen auf die Spitze des „Objektes“ zu, bevor sie in die Linse eintreten, bei der es sich diesmal um eine Zerstreuungslinse handelt. Der Objekt-Käfer, der sich zur Rechten der Linse befindet, ist virtuell (a < 0). Die Strahlen gehen durch die Linse, divergieren und scheinen von dem invertierten, verkleinerten, virtuellen Bild links neben der Linse zu kommen. Das heißt, ein auf der rechten Seite befindlicher Beobachter, der nach links in die Linse schaut, würde die drei Strahlen aufnehmen, und indem er sie zurück (nach links) projiziert, würde er ein invertiertes Bild des Käfers sehen. Das Objekt ist virtuell (a < 0) und das Bild ist virtuell (a < 0).

Strahl 2 F

O

F

Strahl 1

a 0

Abb. 5.34: Ein virtuelles Objekt (direkt rechts neben der Linse) und sein reelles, vergrößertes, aufrechtes Bild (ganz rechts). Diese Situation kann in einem Linsensystem auftreten, das die Strahlen anfangs zusammenführt.

5.2 Linsen

339

Strahlverfolgung mithilfe der Brennebene Bisher sind wir gut damit zurecht gekommen, die drei Strahlen unserer Wahl zu verfolgen, doch es gibt noch ein anderes Strahlverfolgungsschema, das man kennen sollte. Es basiert auf der Tatsache, dass Punkte, die auf der Brennebene einer Linse liegen, immer mit parallelen Strahlenbündeln verbunden sind. Stellen wir uns also einen beliebigen Strahl vor, der auf eine Sammellinse fällt (Abb. 5.35 a). Der Strahl passiert die erste Brennebene (vgl. Abb. 5.19) im Punkt A, doch bisher haben wir nicht versucht, zeichnerisch festzustellen, wie er verläuft, nachdem er im Punkt B gebrochen wurde. Immerhin wissen wir, dass alle vom Punkt A ausgehenden Strahlen parallel aus der Linse austreten müssen. Außerdem wissen wir, dass ein Strahl von A zum Mittelpunkt O der Linse gerade durch die Linse hindurchgeht. Daher muss der bei B beginnende gebrochene Strahl parallel zu dem Strahl von A nach O sein und folglich die Achse bei C schneiden. B

A

F

C

O

F

(a)

B F

(b)

A O

F

Abb. 5.35: Strahlverfolgung mithilfe der Brennebene. Siehe auch Abbildung 5.31 b.

Versuchen wir nun, die Methode für die Zerstreuungslinse in Abbildung 5.35 b anzuwenden. Ein beliebiger, nach unten gerichteter Strahl trifft die Linse im Punkt B. Der Strahl verläuft in die Richtung von Punkt A, der leicht oberhalb von F in der zweiten Brennebene der Zerstreuungslinse liegt. Wir ziehen nun eine Linie von O nach A und verlängern sie ein wenig. Ein entlang dieser Linie verlaufender Strahl würde durch A und von dort in die gleiche Richtung weiter gehen. Außerdem müssen alle auf A zulaufenden Strahlen (siehe Abb. 5.31) an der Linse gebrochen werden und parallel zueinander sowie zu der Linie von O nach A austreten. Das bedeutet, dass der uns interessierende Strahl bei B so nach oben gebrochen wird, dass er anschließend parallel zu der Linie von O nach A verläuft.

340

5 Geometrische Optik

Wie wir gleich sehen werden, lassen sich mit dieser Methode beliebige Strahlen in Linsensystem auf einfache Weise verfolgen. Kombinationen dünner Linsen Unser Ziel soll es nicht sein, professionelle Konstrukteure moderner Linsensysteme zu werden. Vielmehr wollen wir lernen, handelsübliche Systeme zu nutzen und anzupassen. Bei der Konstruktion eines neuen optischen Systems beginnt man gewöhnlich damit, eine Anordnung durch einfache Näherungsrechnungen grob zu skizzieren. Das System wird dann unter Verwendung exakterer Strahlverfolgungsmethoden optimiert, heutzutage meist von Computern. Trotzdem ist das einfache Modell dünner Linsen nach wie vor in vielen Situationen eine sehr nützliche Grundlage für vorläufige Berechnungen. Keine Linse hat tatsächlich eine Dicke von annähernd null, aber viele einfache Linsen funktionieren praktisch wie eine dünne Linse (d. h. wie eine Linse, die sehr dünn im Vergleich zu ihrem Durchmesser ist). Fast alle Brillenlinsen fallen in diese Kategorie. Wenn andererseits der Krümmungsradius groß und der Linsendurchmesser klein ist, ist die Dicke normalerweise ebenfalls gering. Für eine solche Linse ist die Brennweite gewöhnlich groß im Vergleich zur Dicke, wie es auf viele ältere Fernrohrobjektive zutrifft. Wir werden nun Ausdrücke für Parameter von Kombinationen dünner Linsen ableiten. Die Herangehensweise ist ziemlich einfach, wir überlassen die aufwändigeren traditionellen Ansätze jenen Lesern, die beharrlich genug sind, die Problematik bis ins nächste Kapitel zu verfolgen. Betrachten wir zwei Linsen L1 und L2 , die in einem Abstand d voneinander angeordnet sind, der kleiner als beide Brennweiten ist (Abb. 5.36). Das resultierende Bild kann grafisch wie folgt bestimmt werden: Lassen wir L2 für den Moment außer Acht und konstruieren wir das Bild, das von L1 allein erzeugt wird, mittels der Strahlen 2 und 3. Wie üblich lassen wir diese durch jeweils den vorderen und hinteren Brennpunkt der Linse laufen, F1 und F1 . Das Objekt befinde sich in einer senkrechten Ebene, sodass zwei Strahlen die Spitze des Bildes festlegen und die Senkrechte auf der optischen Achse durch den Fußpunkt des Bildes fällt. Der Strahl 4 wird konstruiert durch die rückwärtige Verlängerung der Strecke zwischen P1 und O2 . Das Einfügen von L2 beeinflusst den Strahl 4 nicht, während Strahl 3 durch den Bildbrennpunkt F2 von L2 gebrochen wird. Der Schnittpunkt der Strahlen 4 und 3 bestimmt das Bild, welches in diesem Fall reell, verkleinert und umgekehrt ist. Befinden sich die beiden Linsen wie hier nahe beieinander, so lässt L2 im Wesentlichen das von L1 ausgehende Strahlenbündel konvergieren (f2 > 0) oder divergieren (f2 < 0) (Abb. 5.37). Ein ähnliches Linsenpaar ist in Abbildung 5.38 zu sehen. Hier wurde der Abstand vergrößert. Wiederum legen die Strahlen 2 und 3 durch F1 und F1 die Position des von L1 allein erzeugten Zwischenbildes fest. Wie im oben beschriebenen Fall wird

5.2 Linsen

341 L2

L1

S1

2 F1

4

1

F2

F1

O1

F2

O2

3 P1

f2 f1

d

a1

a1

L1

S1

a2

(a)

L2

4 F1 F1

F2

O1

F2

O2 P1

3 a2

(b)

Abb. 5.36: Zwei dünne Linsen, die durch einen Abstand getrennt sind, der kleiner als jede einzelne Brennweite ist. L1

f1

(a) L1

L2

(b) L1

L2

(c)

Abb. 5.37: (a) Die Auswirkung der Anordnung einer zweiten Linse, L2 , innerhalb der Brennweite einer Sammellinse, L1 . (b) Wenn L2 positiv ist, bedingt ihre Anwesenheit eine stärkere Konvergenz des Strahlenbündels. (c) Wenn L2 negativ ist, trägt sie Divergenz zu dem Strahlenbündel bei.

5 Geometrische Optik

342 L2

P1

L1 S1

2 3 F1 4

O1

O2

F1

F2

F2

P1

a1

f1

a1

a2 d

f2

a2

Abb. 5.38: Zwei dünne Linsen, die durch einen Abstand getrennt sind, der größer als die Summe ihrer einzelnen Brennweiten ist.

der Strahl 4 rückwärts von O2 zu P1 und S1 gezeichnet. Durch den Schnittpunkt der Strahlen 4 und 3 (Letzterer wird durch F2 gebrochen) wird wieder das Bild festgelegt, das jetzt reell und aufrecht ist. Mit zunehmender Brennweite von L2 , unter der Voraussetzung, dass alle anderen Größen konstant bleiben, vergrößert sich auch das Bild. Analytisch erhalten wir für L1 1 1 1 = −  a1 f1 a1

(5.29)

oder a1 =

a1 f1 . a1 − f1

(5.30)

Dieser Wert ist positiv. Das Zwischenbild (bei P1 ) befindet sich rechts von L1 , wenn a1 > f1 und f1 > 0 ist. Betrachten wir nun die zweite Linse, L2 , deren Objekt sich bei P1 befindet. Für diese gilt a2 = d − a1 ;

(5.31)

bei d > a1 ist das Objekt für L2 reell (Abb. 5.38), bei d < a1 (a2 < 0, Abb. 5.36) ist es dagegen virtuell. Im ersteren Fall divergieren die Strahlen, die auf L2 auftreffen, vom Punkt P1 aus, im Letzteren konvergieren sie zu diesem Punkt. Weiterhin ist 1 1 1 = −  a2 f2 a2 oder a2 =

a2 f2 . a2 − f2

5.2 Linsen

343

Mit Gleichung (5.31) erhalten wir a2 =

(d − a1 ) f2 . (d − a1 − f2 )

(5.32)

Auf die gleiche Art und Weise könnten wir die Verhältnisse an einem System aus beliebig vielen dünnen Linsen berechnen. Oft ist es zweckmäßig, mit einem einzigen Ausdruck zu rechnen; wenn wir a1 durch Gleichung (5.29) ersetzen, erhalten wir für zwei Linsen a2 =

f2 d − f2 a1 f1 / (a1 − f1 ) . d − f2 − a1 f1 / (a1 − f1 )

(5.33)

Hierbei sind a1 und a2 die Objektweite und die Bildweite der Linsengruppe. Als ein Beispiel wollen wir die Bildweite eines Objekts berechnen, das sich in 50 cm Abstand vor der ersten der beiden Sammellinsen befindet. Die Linsen seien 20 cm voneinander entfernt, ihre Brennweiten betragen 30 cm bzw. 50 cm. Durch Einsetzen der Größen in die Gleichung erhalten wir a2 =

50 × 20 − 50 × 50 × 30/ (50 − 30) = 26,2 cm ; 20 − 50 − 50 × 30/ (50 − 30)

das Bild ist reell. Da L2 das Zwischenbild von L1 vergrößert, ist die gesamte transversale Vergrößerung gleich dem Produkt der einzelnen Vergrößerungen: MT = MT 1 MT 2 . In Aufgabe 5.45 sollen Sie zeigen, dass MT =

f1 a2 d (a1 − f1 ) − a1 f1

(5.34)

ist. Im obigen Beispiel ergibt sich MT =

30 × 26,2 = −0,72 . 20 × (50 − 30) − 50 × 30

Das Bild ist verkleinert und umgekehrt (vgl. Abb. 5.36). Beispiel 5.5 Eine dünne bikonvexe Linse mit einer Brennweite von +40,0 cm befindet sich 30,0 cm vor (d. h. zur Linken) einer dünnen, bikonkaven Linse mit einer Brennweite von −40,0 cm. Nehmen Sie an, dass sich ein kleines Objekt 120 cm links neben der positiven Linse befindet. (a) Lokalisieren Sie das Objekt, indem Sie den Effekt jeder der beiden Linsen berechnen. (b) Berechnen Sie die Vergrößerung. (c) Beschreiben Sie das Bild.

5 Geometrische Optik

344

Lösung (a) Die erste Linse bildet ein Zwischenbild bei a1 , und wir finden 1 f1 1 40,0 1 a1 a1

1 1 +  a1 a1 1 1 = +  120 a1 1 2 1 − = = 40,0 120 120 = 60,0 cm =

Das ist 30,0 cm rechts von der negativen Linse. Folglich ist a2 = −30,0 cm und 1 1 1 = +  f2 a2 a2 1 1 1 = +  −40,0 −30,0 a2  a2 = +120 cm Das Bild wird 120 cm rechts von der negativen Linse gebildet. (b) Die Vergrößerung ist



   a1 a − 2 MT = MT 1 MT 2 = − a1 a2    120 60,0 − = −2,0 MT = − 120 −30

(c) Das Bild ist reell, denn es gilt a2 > 0. Es ist umgekehrt, denn es gilt MT < 0, und es ist vergrößert. Mithilfe von Gleichung (5.34) können wir MT überprüfen: 40(120) 40(120) = 30(120 − 40) − 120(40) −40(60) MT = −2,0

MT =

Und mithilfe von Gleichung (5.33) überprüfen wir a2 : a2 =

(−40,0)(30, 0) − (−40,0)(120)(40,0)/(120 − 40,0) 30,0 − (−40,0) − 120(40,0)/(120 − 40,0)

a2 =

1200 −1200 + 40,0(60,0) = = 120 cm 70,0 − 60,0 10

5.2 Linsen

345 L2

L1 P

Strahl 2 Strahl 1 F1 F1 Strahl 3

F2 A3 A1 A2

O

F2 B3 B1

B2

Abb. 5.39: Anwendung der Methode der Strahlverfolgung mithilfe der Brennebene.

Die beiden Sammellinsen L1 und L2 in Abbildung 5.39 haben eine lange und eine kurze Brennweite, und der Abstand zwischen ihnen ist größer als die Summe der beiden Brennweiten. Das reelle, umgekehrte und verkleinerte Zwischenbild befindet sich dort, wo sich die Strahlen 1, 2 und 3 schneiden. Die Strahlen gehen dann weiter und durchstoßen die erste Brennebene der zweiten Linse in den Punkten A1 , A2 und A3 und schneiden die Achse der Linse L2 in den Punkten B1 , B2 und B3 . Es stellt sich die Frage, wie diese Strahlen durch L2 gebrochen werden, oder mit anderen Worten, wo sich der Punkt P befindet. Da das Zwischenbild reell ist, könnten wir einfach zwei neue, geeignete Strahlen einführen, doch wollen wir stattdessen lieber die Methode der Strahlverfolgung mithilfe der Brennebene anwenden. Wir ziehen eine Linie von A2 nach O. Der in B2 beginnende gebrochene Strahl muss parallel zu dieser Linie sein – wir zeichnen diesen Strahl. Dann zeichnen wir eine Linie von A1 nach O. Der in B1 beginnende gebrochene Strahl muss parallel zu dieser Linie sein – wir zeichnen auch diesen Strahl. Der Schnittpunkt dieser beiden Linien definiert den Punkt P und die Position des finalen Bildes, das reell und aufrecht ist. Als weiteres Anwendungsbeispiel für die Methode betrachten wir den zur optischen Achse parallelen Strahl in Abbildung 5.40, der auf die Sammellinse L1 fällt. Wir wollen diesen Strahl durch das gesamte Linsensystem verfolgen. Der Strahl schneidet die erste Brennebene von L1 bei A1 . Er wird gebrochen und verläuft anschließend in Richtung des Brennpunkts F1 ; er ist aber auch parallel zu der Linie von A1 nach O1 . Der Strahl wird also abgelenkt und geht von B1 nach B2 . Wir verlängern diesen Strahl (gestrichelte Linie) bis er bei A2 die zweite Brennebene der Zerstreuungslinse L2 schneidet. Dann ziehen wir eine weitere gestrichelte Linie von A2 zurück nach O2 , sodass der Strahl von B2 nach B3 parallel zu dieser Linie ist. Dieser Strahl schneidet die erste Brennebene von L3 bei A3 und trifft bei B3 auf L3 . Um die finale Ablenkung zu berechnen, mit der der Strahl L3 verlässt, zeichnen wir eine Linie von O3 zurück nach A3 . Der letzte Strahl tritt parallel zu der Linie von A3 nach O3 aus der Linse L3 .

5 Geometrische Optik

346 1. BE L 1

L1

A1

L2

2. BE L 2

L3 3. BE L 3

B1 B2 O1

F1

O2

A3 F2

F1 A 2

F3

B3 O3

Abb. 5.40: Verfolgung des Strahls durch ein aus drei Linsen bestehendes Linsensystem mithilfe der Brennebenen-Methode.

Hintere und vordere Brennweite Der Abstand der letzten Linsenfläche eines optischen Systems vom zweiten Brennpunkt des Gesamtsystems wird als hintere Brennweite bezeichnet. Entsprechend nennt man den Abstand des ersten Brennpunkts vom Scheitelpunkt der ersten Linsenfläche vordere Brennweite. Folglich nähert sich a2 für a2 → ∞ der Größe f2 , was in Verbindung mit Gleichung (5.31) besagt, dass a1 gegen d − f2 geht. Dadurch ergibt sich aus Gleichung (5.29) d − (f1 + f2 ) 1 1 1 = . = −  a1 a2 =∞ f1 (d − f2 ) f1 (d − f2 ) Dieser spezielle Wert von a1 ist die vordere Brennweite: fv =

f1 (d − f2 ) . d − (f1 + f2 )

(5.35)

Ähnlich geht (a1 − f1 ) gegen a1 , wenn wir a1 in Gleichung (5.33) gegen ∞ gehen lassen. Da a2 dann die hintere Brennweite ist, erhalten wir fh =

f2 (d − f1 ) . d − (f1 + f2 )

(5.36)

Auch diese Zusammenhänge wollen wir uns an einem Zahlenbeispiel verdeutlichen. Wir berechnen sowohl die hintere als auch die vordere Brennweite des Systems dünner Linsen in Abbildung 5.41 a, wobei f1 = −30 cm und f2 = +20 cm ist. Wir haben dann fh =

20 × [10 − (−30)] = 40 cm . 10 − (−30 + 20)

Für fv erhalten wir 15 cm. Ist insbesondere d = f1 + f2 , so verlassen einfallende ebene Wellen das Linsensystem wieder als ebene Wellen (Aufgabe 5.49), wie es in Teleskopen der Fall ist.

5.2 Linsen

347

10 cm

L1

hintere Brennweite

L2 (a)

(b)

Abb. 5.41: (a) Kombination aus je einer dünnen Sammel- und Zerstreuungslinse. (b) Foto E. H.

Für d → 0, d. h., wenn die Linsen sich wie bei manchen zweilinsigen Achromaten berühren, ist offensichtlich fh = fv =

f2 f1 . f2 + f1

(5.37)

Für zwei dünne Linsen, die in Kontakt miteinander sind, hat die resultierende dünne Linse eine effektive Brennweite f , sodass 1 1 1 = + f f1 f2

(5.38)

ist. Für N dünne Linsen gilt dann 1 1 1 1 = + + ... + . f f1 f2 fN

(5.39)

Viele dieser Schlussfolgerungen können zumindest qualitativ mit einigen einfachen Linsen nachgeprüft werden. Bei Abbildung 5.36 ist das nicht schwierig; Abbildung 5.38 macht ein wenig mehr Mühe. Zuerst bestimmen wir die Brennweite der beiden Linsen, indem wir ein weit entferntes Objekt abbilden. Dann halten wir die Linse L2 in einem festem Abstand, der ein wenig größer als ihre Brennweite ist, zur Bildebene (einem Blatt weißes Papier). Das folgende Vorgehen ist etwas mühsam, wenn keine optische Bank zur Verfügung steht: Bewegen Sie die zweite Linse (L1 ) auf das Objekt zu, wobei die Linse einigermaßen zentriert bleiben muss. Wenn Sie L2 nicht abschatten, sehen Sie wahrscheinlich ein unscharfes Bild der Hand, die L1 hält. Positionieren Sie die Linsen so, dass der Bereich auf dem Schirm, der L1 entspricht, so hell wie möglich ist. Das Bild zu diesem Gebiet von L1 ist dann deutlich und aufrecht wie in Abbildung 5.38. QED und Linsen Warum haben wir die grundlegenden Gleichungen dieses Kapitels aus dem fermatschen Prinzip abgeleitet? Die Begründung ist einfach: Dieses Prinzip lässt uns in optischen Weglängen denken und führt uns in natürlicher Weise zur feynmanschen Be-

348

5 Geometrische Optik

handlung der Quantenelektrodynamik. Physiker betrachten ihre Theorien oft lediglich als Ansatz zur Berechnung oder Bestätigung experimenteller Ergebnisse. Wie kompliziert eine Theorie auch ist – immer sollte sie in Einklang mit selbst den alltäglichsten Beobachtungen stehen. Um zu sehen, wie die Funktion einer Linse in die Weltsicht der QED passt, werden wir Abbildung 4.80 und das Prinzip des Spiegels noch einmal aufgreifen. Licht gelangt auf einer Vielzahl von Pfaden vom Punkt S über den Spiegel zum Punkt P . Klassisch postulieren wir, dass sich die optischen Weglängen, ebenso wie die Laufzeiten, unterscheiden. Die QED ordnet jedem Pfad eine Wahrscheinlichkeitsamplitude zu, deren Phasenwinkel proportional zur Laufzeit ist. Werden die Amplituden addiert, so zeigt sich, dass die entscheidenden Beiträge zur gesamten Wahrscheinlichkeit, mit der Licht am Punkt P ankommt, von den Pfaden stammen, die dem Weg mit der kürzesten optischen Weglänge unmittelbar benachbart sind. Etwas anders verhält es sich im Fall einer Linse (Abb. 5.42). Deren Verhalten können wir annähern, indem wir sie in eine beherrschbare Anzahl von Segmenten mit je einem möglichen Lichtpfad und einer entsprechenden Wahrscheinlichkeitsamplitude unterteilen. Natürlich gibt es wesentlich mehr als die gezeigten 17 Pfade, aber wir stellen uns jeden dieser Pfade als Bündel aus einer riesigen Anzahl einander eng benachbarter Trajektorien vor – das ändert nichts Prinzipielles. Zu jedem Pfad gehört eine kleine Wahrscheinlichkeitsamplitude und -phase. Da eine Linse speziell mit dem Ziel gleicher OWL konstruiert ist, ergibt sich eine gerade Linie, wenn man die OWL (oder analog die Laufzeit) über die Strecke quer zur Linse aufträgt. Jeder beliebige Pfad wird von einem Photon in ein und derselben Zeit durchlaufen. Deshalb haben alle (komplexen) Wahrscheinlichkeiten nicht nur denselben Betrag, sondern auch die gleiche Phase und tragen demzufolge gleichermaßen zur Gesamtwahrscheinlichkeit bei, ein Photon am Punkt P nachzuweisen. So entsteht eine sehr große Wahrscheinlichkeitsamplitude am Punkt P ; wenn man sie quadriert, ergibt sich eine sehr hohe Wahrscheinlichkeit dafür, dass das Licht, das die Linse durchquert hat, P erreicht. In der Sprache der Quantenelektrodynamik formuliert, fokussiert eine Linse Licht dadurch, dass sie allen beitragenden Wahrscheinlichkeitsamplituden denselben Phasenwinkel verleiht. In allen anderen achsennahen Punkten der P enthaltenden Ebene unterscheiden sich die Phasenwinkel proportional. Die Phasen der einzelnen addierten Wahrscheinlichkeiten zeigen daher in alle Richtungen, und die Wahrscheinlichkeitsamplitude nimmt mit der Entfernung von P stark ab, fällt jedoch nicht abrupt auf null. Die Wahrscheinlichkeitsverteilung hat kein unendlich schmales Maximum – Licht lässt sich deshalb nicht in einem einzigen Punkt fokussieren. Die Wahrscheinlichkeiten für nicht auf der optischen Achse liegende Punkte können sich nicht plötzlich zu null addieren; die Übergänge sind stets kontinuierlich. Die sich ergebende radialsymmetrische Wahrscheinlichkeitsverteilung, I (r), nennt man Airy-Verteilung (siehe Abb. 10.36).

5.3 Blenden

349 A B C D E F G H I J K L M N O P Q

S

P

OW L

(a)

A B C DE F G H I J K L MN O P Q

(b)

A B C D E F GH I J K LMN O P Q

(c) Abb. 5.42: Feynmans Analyse einer dünnen Linse mittels der Quantenelektrodynamik. (a) Einige mögliche Pfade von S nach P . (b) Die OWL für Licht entlang jedes Pfades. (c) Die korrespondierenden Wahrscheinlichkeitsvektoren addieren sich phasengleich.

5.3

Blenden

5.3.1 Apertur- und Feldblenden Jede reale Linse hat endliche Abmessungen und kann deswegen nur einen Teil der Energie einer Punktquelle auffangen. Die physikalische Begrenzung durch die Außenkante der Linse bestimmt, welche Strahlen in das System eindringen und ein

5 Geometrische Optik

350

Bild erzeugen können. In dieser Hinsicht bildet der so genannte freie Durchmesser der Linse eine Blende, durch die die Energie eintreten kann. Jedes Element, das die Menge des Lichts reguliert, die das Bild erreicht, sei es der Rand einer Linse oder eine separate Blende, nennt man Aperturblende. Die Aperturblende eines optischen Systems ist die spezielle physikalische Einheit, die die Breite des von einem axialen Objektpunkt kommenden Lichtstrahls limitiert, während er das System durchquert. Die regelbare Lamellenblende, die sich gewöhnlich hinter den ersten optischen Elementen eines fotografischen Objektivs befindet, ist beispielsweise eine solche Aperturblende. In diesem Fall bestimmt sie die Lichtmenge, die das Objektiv als Ganzes auffangen kann. Wie in Abbildung 5.43 zu sehen ist, können stark geneigte Strahlen zwar in das System eintreten, werden aber von der Blende am Durchdringen des Systems gehindert. So lässt sich die Bildqualität steuern.

Aperturblende

Feldblende

Abb. 5.43: Aperturblende und Feldblende.

Das optische Element des Systems, das die Größe oder den Winkel eines abzubildenden Objekts begrenzt, nennt man die Feldblende – sie schränkt das Gesichtsfeld des optischen Instruments ein. In einer Kamera begrenzen die Kanten des Films die Bildfläche und wirken daher ihrerseits als Feldblende. Während die Aperturblende (siehe Abb. 5.43) die Anzahl der Strahlen eines Objektpunktes beschränkt, die den konjugierten Bildpunkt erreichen können, blockiert eine Feldblende die Strahlen eines Objektpunktes entweder komplett oder gar nicht. Weder die Strahlen des Bereichs über der Spitze noch die des Bereichs unter dem unteren Rand des Objekts in Abbildung 5.43 können die Feldblende passieren. Öffnen wir die kreisförmige Aperturblende, kann das System einen größeren Strahlenkegel aufnehmen, womit sich die Bestrahlungsstärke an jedem Bildpunkt erhöht. Das Vergrößern der Feldblende ermöglicht es hingegen, auch die vorher verdeckten Bereiche jenseits der Begrenzungen des Objekts abzubilden.

5.3.2 Eintritts- und Austrittspupillen Ein weiteres nützliches Konzept um zu festzustellen, ob ein gegebener Strahl das gesamte optische System durchlaufen wird, ist die Pupille. Diese ist einfach ein Bild

5.3 Blenden

351 Austrittspupille

Hauptstrahl

Eintrittspupille

Exp Enp

Σ

L Aperturblende

Abb. 5.44: Eintrittspupille und Austrittspupille.

der Aperturblende. Die Eintrittspupille eines Systems ist das Bild der Aperturblende, wie es von einem axialen Punkt auf dem Objekt durch die der Blende vorangehenden Elemente gesehen würde. Gibt es keine Linsen zwischen dem Objekt und der Aperturblende, stellt diese selbst die Eintrittspupille dar. Um dies zu veranschaulichen, betrachten wir Abbildung 5.44, auf der eine Linse mit einer hinteren Aperturblende zu sehen ist. Stellen Sie sich vor, dass sich Ihr Auge im Objektraum auf der Achse links neben der Linse befindet und nach rechts an der Aperturblende durch die Linse sieht. Das Bild, das Sie sehen, ob reell oder virtuell, ist die Eintrittspupille. Weil es näher als eine Brennweite an der Linse ist, ist das Bild der Aperturblende in L virtuell (siehe Tab. 5.3) und vergrößert. Wir können es lokalisieren, indem wir einige Strahlen, die von den Rändern der Aperturblende ausgehen, auf die übliche Weise verfolgen. Dagegen ist die Austrittspupille das Bild der Aperturblende, wie es von einem axialen Punkt der Bildebene durch die dazwischen liegenden Linsen gesehen wird. In Abbildung 5.44 gibt es keine solchen Linsen, daher stellt die Aperturblende selbst die Austrittspupille dar. Betrachten Sie Abbildung 5.45 und stellen Sie sich vor, dass sich Ihr Auge im Bildraum auf der Achse befindet und Sie an der Aperturblende nach links durch die Linse schauen. Das Bild, das Sie sehen, ist die Austrittspupille. Austrittspupille

Eintrittspupille

Exp Enp Hauptstrahl

Σ Aperturblende

Abb. 5.45: Eine vordere Aperturblende.

352

5 Geometrische Optik

Dies alles bedeutet, dass der Lichtkegel, der in das optische System eintritt, durch die Eintrittspupille begrenzt wird, während der austretende Lichtkegel von der Austrittspupille begrenzt wird. Kein Strahl, der außerhalb eines dieser beiden Kegel liegt, gelangt zur Bildebene. Die Pupillen und die Aperturblende sind Konjugierte; wenn es keine Vignettierung (siehe unten) gibt, wird jeder divergierende Strahlenkegel, der in die Eintritsspupille eintritt, die Aperturblende passieren und als konvergierender Kegel die Austrittspupille verlassen. Denken Sie daran, dass verschiedene Objekte, die auf der Achse platziert sind, unterschiedlichen Aperturblenden und Pupillen entsprechen können. Man muss hier sehr genau aufpassen. Um ein Teleskop oder einen Fernrohrvorsatz als Kameraobjektiv zu benutzen, könnte man eine externe vordere Aperturblende anbringen und so die Menge des eintretenden Lichts zur Steuerung der Belichtung regeln. Abbildung 5.45 zeigt eine ähnliche Anordnung, wobei Sie die Lage der Eintritts- und Austrittspupille leicht selbst erkennen sollten. Wenn die Linse kürzer wäre und das Objekt näher heran gebracht würde, dann könnten Strahlen unter dem oberen Rand der Blende passieren. Der obere Rand der Blende würde dann den Strahlenkegel limitieren und die Linse selbst wäre die Aperturblende. Würden wir dagegen das Objekt nach links verschieben, blieben Aperturblende und Pupillen unverändert. In die beiden letzten Bilder ist der so genannte Hauptstrahl eingezeichnet. Dieser ist definiert als beliebiger Strahl, der von einem nicht auf der Achse liegenden Punkt ausgeht und durch den Mittelpunkt der Aperturblende verläuft. Der Hauptstrahl tritt in das optische System entlang einer Linie ein, die auf den Mittelpunkt der Eintrittspupille Enp zeigt, und verlässt das System entlang einer Linie, die durch den Mittelpunkt der Austrittspupille Exp verläuft. Der Hauptstrahl verhält sich wie der mittlere Strahl eines kegelförmigen, von einem Objektpunkt ausgehenden Strahlenbündels und repräsentiert dieses. Hauptstrahlen sind für die Korrektur von Abbildungsfehlern beim Entwurf optischer Systeme von besonderer Bedeutung. Abbildung 5.46 skizziert eine etwas kompliziertere Konfiguration. Gewöhnlich verfolgt man den Weg der beiden abgebildeten Strahlen durch das optische System. Der eine ist der Hauptstrahl eines Punktes am Rand des abzubildenden Objekts. Der andere Strahl wird als Randstrahl bezeichnet, da er von einem axialen Objektpunkt zum Rand der Eintrittspupille verläuft. Wenn nicht klar ist, welches Element die tatsächliche Aperturblende darstellt, bildet man jede Komponente des Systems mittels der restlichen Elemente nach links ab. Das Bild, das am axialen Objektpunkt den kleinsten Winkel aufspannt, ist die Eintrittspupille. Das Element, dessen Bild die Eintrittspupille bildet, ist die Aperturblende des Systems für diesen Objektpunkt. Aufgabe 5.46 befasst sich mit derartigen Berechnungen.

5.3 Blenden

353 Austrittspupille

Eintrittspupille

σ Randstrahl Hauptstrahl Enp

Exp

Aperturblende

Abb. 5.46: Pupillen und Blenden für ein System mit drei Linsen.

Beispiel 5.6 Eine positive Linse mit einem Durchmesser von 140 mm und einer Brennweite von 0,10 m befindet sich 8,0 cm vor einem lichtundurchlässigen Schirm, der in der Mitte ein Loch von 40 mm Durchmesser hat. 20 cm vor der Linse befindet sich ein axiales Objekt. Bilden Sie jedes Element durch die Elemente zu seiner Linken ab und ermitteln Sie, welches Element dem kleinsten Winkel bei S gegenüberliegt. Dies wird die Eintrittspupille sein – bestimmen Sie ihre Position und ihre Größe. Das zur Eintrittspupille konjugierte Objekt ist die Aperturblende. Identifizieren Sie diese. Lösung Es gibt keine Elemente links von der Linse, daher ist es im Wesentlichen ein Bild von der Linse selbst. Um das Bild des 40-mm-Lochs zu finden, wie man es sieht, wenn man vom Bildraum aus in L schaut, müssen wir uns eine Punktquelle auf der Achse durch die Mitte des Lochs vorstellen, die Licht von links in Richtung der Linse aussendet. Das bedeutet, dass wir die Vorzeichen in 1/f = 1/a + 1/a entsprechend ändern müssen. Hier ist f = +10 cm, und mit a = +8,0 cm haben wir 1/10 = 1/8,0 + 1/a und somit a = −40 cm. Das Bild liegt somit auf der gleichen Seite von L wie das Objekt, also rechts davon. Das Bild der Öffnung ist wegen a < f virtuell.

5 Geometrische Optik

354 Aperturblende

L

S

a

b

P

F

20 cm

200 mm

F

8.0

40.0 cm

Eintrittspupille

Die Bildgröße des Lochs erhalten wir aus MT = −a /a = −(−40)/8,0 = 5 und 5×40 mm = 200 mm. Schließlich wollen wir das Bild P von S lokalisieren. 1/10 = 1/20 + 1/a

und somit

a = +20 cm

P liegt 20 cm rechts von L. Das Element, das den bei P ankommenden Strahlenkegel limitiert, ist das Loch im Schirm, nicht die Linse. Der Winkel β ist kleiner als α – folglich ist das Loch die Aperturblende und sein Bild ist die Eintrittspupille.

Der Strahlenkegel, der die Bildebene erreichen kann, wird schmaler, wenn sich der Objektpunkt von der Achse entfernt (Abb. 5.47). Die effektive Aperturblende, die für ein axiales Strahlenbündel der Rand von L1 war, ist für das nicht axiale Strahlenbündel wesentlich kleiner. Die Folge ist eine allmähliche Abschwächung des Bildes in seinen Randpunkten, eine Erscheinung, die man Vignettierung nennt.

L1

effektive Aperturblende

L2

Abb. 5.47: Vignettierung.

Die Orte und Größen der Pupillen eines optischen Systems sind von beträchtlicher praktischer Bedeutung. In optischen Geräten für die direkte Beobachtung wird das Auge des Beobachters in den Mittelpunkt der Austrittspupille gebracht. Die Größe

5.3 Blenden

355

der Pupille des Auges selbst schwankt je nach Beleuchtungsstärke zwischen 2 mm und etwa 8 mm. Deshalb sollte ein Fernrohr oder Fernglas, das hauptsächlich für die Benutzung in der Dämmerung konstruiert ist, eine Austrittspupille von mindestens 8 mm haben. (Sie haben vielleicht schon die Bezeichnung Nachtglas gehört – solche Ferngläser waren während des Zweiten Weltkrieges verbreitet in Gebrauch.) Dagegen reichen 3 − 4 mm für eine Tageslichtversion aus. Je größer die Austrittspupille ist, desto leichter fällt es, durch das Gerät zu schauen. Bei den meisten optischen Geräten, in die das menschliche Auge schaut, ist die Austrittspupille real und etwa 12 mm hinter der letzten Grenzfläche lokalisiert. Aus naheliegenden Gründen sollte das Zielfernrohr eines schweren Gewehrs eine große Austrittspupille haben, die weit genug vom Gesicht entfernt sein kann, um Verletzungen durch den Rückstoß zu vermeiden. Beispiel 5.7 Betrachten Sie das in der folgenden Abbildung gezeigte System aus dünnen Linsen, in dem sich das Objekt im Brennpunkt F1 befindet. Zwischen den beiden Linsen befindet sich eine Membranblende. Lokalisieren Sie die Aperturblende sowie die Eintritts- und die Austrittspupille. Identifizieren Sie den Randstrahl. L1

L2

F2

F1

F1

F2

Wir zeichnen einen Strahlenkegel, der bei F1 beginnt und durch das System hindurch geht. L1 L2 Randstrahl

F1

F2

F1

F2

Randstrahl Aperturblende

5 Geometrische Optik

356

Die Membranblende ist die Aperturblende, da sie den Strahl limitiert. Um die Eintrittspupille zu lokalisieren, wollen wir nun das Bild der Aperturblende finden, das ein vom Objekt aus nach rechts schauender Beobachter sieht. L1

L2 Eintrittspupille F2

F1

F1

F2

Die Eintrittspupille befindet sich rechts und ist virtuell. Die Austrittspupille ist das Bild der Aperturblende, das ein Beobachter im Bildraum sieht. Die Austrittspupille liegt links der Aperturblende und ist ebenfalls virtuell. L1

F1

L2

F2

F1

F2

Austrittspupille

5.3.3 Das Öffnungsverhältnis und die Blendenzahl Betrachten wir eine Lichtquelle endlicher Ausdehnung, die wir unter Verwendung einer Linse (oder eines Spiegels) abbilden möchten. Die Energiemenge, die durch die Linse (oder den Spiegel) von einem kleinem Bereich der Quelle gesammelt wird, ist direkt proportional zur Linsenfläche oder allgemeiner zur Fläche der Eintrittspupille. Eine große freie Öffnung schneidet einen breiten Strahlenkegel. (Wäre die Quelle ein Laser, der einen sehr schmalen Strahl erzeugt, träfe dies nicht notwendigerweise zu.) Vernachlässigen wir die Verluste infolge von Reflexion, Absorption usw., so wird die ankommende Energie über einen entsprechenden Bereich des Bildes verteilt (Abb. 5.48). Deshalb ist die Energie pro Flächen- und Zeiteinheit (die Flussdichte oder Bestrahlungsstärke) umgekehrt proportional zur Bildfläche. Die Fläche einer kreisförmigen Eintrittspupille ist proportional zum Quadrat ihres Radius und deshalb auch zum Quadrat ihres Durchmessers D. Dies gilt auch für die

5.3 Blenden

357 Verschluss Linse

Film Blende

Abb. 5.48: Eine Großformatkamera besteht normalerweise aus einem Objektiv mit regelbarer Blende, einem Verschluss, der sich sehr schnell öffnen und schließen kann, und einem Film, auf dem das Bild entsteht.

Bildfläche, deren Durchmesser wiederum [Gln. (5.24) und (5.26)] proportional zu f 2 ist. (Wir behalten im Auge, dass wir über ein ausgedehntes Objekt und nicht über eine Punktquelle sprechen. In letzterem Fall wäre das Bild unabhängig von f auf eine sehr kleine Fläche beschränkt.) Die Flussdichte in der Bildebene hängt daher von (D/f )2 ab. Den Quotienten D/f nennt man Öffnungsverhältnis. Dessen Kehrwert ist die Blendenzahl, welche man oft als f /# schreibt, f , (5.40) D wobei f /# als ein einziges Symbol verstanden werden sollte. Beispielsweise hat eine Linse mit einer Öffnung von 25 mm und einer Brennweite von 50 mm eine Blendenzahl von 2 und wird daher mit f /2 bzw. dem Öffnungsverhältnis 1:2 gekennzeichnet. Abbildung 5.49 veranschaulicht dies: Gezeigt ist eine dünne Linse hinter einer regelbaren Lamellenblende, die auf 1:2 oder 1:4 eingestellt werden kann. Eine kleinere Blendenzahl bewirkt, dass mehr Licht die Bildebene erreicht. f /# ≡

Ein Kameraobjektiv wird üblicherweise durch seine Brennweite und seine größtmögliche Öffnung spezifiziert. Auf der Fassung eines Objektivs könnten Sie beispielsweise lesen „50 mm, 1:1.4“ 4 . Da die Belichtungszeit proportional zum Quadrat der Blendenzahl ist, nennt man f /D auch die Lichtstärke des Objektivs. Ein 1:1.4-Objektiv ist dabei doppelt so lichtstark wie ein 1:2-Objektiv. Gewöhnlich haben die Objektive Blendenzahlmarkierungen, zum Beispiel 1, 1.4, 2, 2.8, 4, 5.6, 8, 11, 16, 22 usw. Das größte Öffnungsverhältnis ist im genannten Fall 1:1 – das ist ein sehr lichtstarkes Objektiv, 1:2 ist √ typischer. Jede nächstfolgende Blendeneinstellung vergrößert f /D um den Faktor 2 (gerundet). Dies √ entspricht einer Verkleinerung des Öffnungsverhältnisses um einen Faktor von 1/ 2 und deshalb einer Abnahme der Bildbeleuchtungsstärke um einen Faktor 1/2. Aus diesem Grund erreicht bei folgenden Einstellungen der Ka4

Bei den Bezeichnungen der Blendenzahlen wurden Dezimalpunkte verwendet, da dies der üblichen Kennzeichnung von Objektiven entspricht. (A.d.Ü.)

5 Geometrische Optik

358

f /2 (a)

Blendenwerte Entfernungsskala

1.4

Blendenzahl

4

2.8

2

2.8

f /4

4

2

5.6 3

5.6

8 6

11 16 10

8

∞m

11

16

(b)

Abb. 5.49: (a) Abblenden eines Objektivs, um die Blendenzahl zu verändern. (b) Ein Objektiv, das verschiedene Einstellungen der regelbaren Blende zeigt, welche normalerweise innerhalb des Objektivs liegt.

mera stets die gleiche Lichtmenge den Film: 1:1.4 bei 1/500 Sekunde Belichtungszeit, 1:2 bei 1/250 Sekunde oder 1:2.8 bei 1/125 Sekunde. Das größte Linsenfernrohr (Refraktor) der Welt am Yerkes-Observatorium der University of Chicago besitzt eine Linse mit einem Durchmesser von 1,016 m und einer Brennweite von 19,202 m. Die Blendenzahl beträgt daher 18.9. Die Eintrittspupille und die Brennweite eines Spiegels legen in genau derselben Weise die Blendenzahl des Spiegels fest. Dementsprechend ist die Blendenzahl des Spiegels des Mount-PalomarTeleskops mit einem Durchmesser von 5,08 m und einer primären Brennweite von 16,92 m gleich 3.33. Beispiel 5.8 Eine dünne Sammellinse mit einem Durchmesser von 5,0 cm hat eine Brennweite von 50,0 mm. Im Abstand von 5,0 mm rechts neben der Linse befindet sich, zentriert auf der optischen Achse, ein lichtundurchlässiger Schirm mit einem Loch von 4,0 mm Durchmesser, das als Aperturblende fungiert. Bestimmen Sie die Blendenzahl der Anordnung.

5.4 Spiegel

359

Lösung Zuerst brauchen wir den Durchmesser D der Eintrittspupille. Das ist die Größe des Bildes der Aperturblende. Mit Licht, das von rechts in die Linse eintritt, gilt 1 1 1 = + , f a a wobei f = +50,0 mm, a = +5,0 mm und a < f : 1 1 1 − =  50,0 5,0 a und somit a = −5,56 mm. Daher ist MT = −

−5,56 = 1,11 5,0

und

D = MT (4,0 mm) = 4,44 mm .

Damit erhalten wir f /# = f /D = 50,0/4,44 = 11,3.

5.4

Spiegel

Spiegeloptiken finden besonders im Röntgen-, Ultraviolett- und Infrarotbereich des Spektrums zunehmend Verwendung. Eine reflektierende Vorrichtung zu konstruieren, die über ein weites Band von Frequenzen befriedigend funktioniert, ist nicht schwierig – im Gegensatz zu einem strahlenbrechenden System. Beispielsweise ist eine Linse aus Silicium oder Germanium für den Infrarotbereich im Sichtbaren vollkommen lichtundurchlässig. Wir werden später sehen (Abschn. 6.3), dass Spiegel noch andere nützliche Eigenschaften haben. Als Spiegel kann ein Stück schwarzes Glas oder eine polierte Metalloberfläche wirken. Früher stellte man Spiegel gewöhnlich durch Beschichtung von Glas mit Silber her; Letzteres wurde wegen seines hohen Reflexionsvermögens auch im infraroten

Eine Auswahl unterschiedlicher Arten von Spiegeln. (Perkins Precision Developments of Longmont, Colorado)

5 Geometrische Optik

360

und ultravioletten Bereich geschätzt (siehe Abb. 4.69). Der heute anerkannte Standard für Qualitätsspiegel sind sehr glatt polierte Rohlinge, die im Vakuum mit Aluminium bedampft werden. Oft werden Schutzbeschichtungen aus Siliciummonoxid oder Magnesiumfluorid auf das Aluminium aufgetragen. In speziellen Einsatzgebieten (zum Beispiel in Lasern), in denen selbst die kleinen Verluste aufgrund der Metalloberflächen nicht toleriert werden können, erweisen sich Spiegel aus dielektrischen Mehrfachschichten (siehe Abschn. 9.9) als unentbehrlich. Eine neue Generation von leichten Präzisionsspiegeln, die in großen weltraumgestützten Teleskopen angewendet werden sollen, ist derzeit im Entstehen.

5.4.1 Ebene Spiegel Ebene Spiegel können, wie alle Spiegelformen, entweder vorder- oder rückseitig mit einem Belag versehen sein. Den zweiten Typ findet man im täglichen Gebrauch am häufigsten, da die metallische Spiegelschicht dann gut geschützt hinter Glas liegt. Im Gegensatz dazu ist die Mehrzahl der Spiegel für anspruchsvollere technische Verwendungen vorderseitig beschichtet (Abb. 5.50).

S

P

V θi θr

A

a

a (a)

(b)

Abb. 5.50: Ein ebener Spiegel. (a) Die Reflexion von Wellen. (b) Die Reflexion von Strahlen.

Mithilfe der in Abschnitt 4.3.1 erarbeiteten Zusammenhänge kann man die Abbildungseigenschaften eines ebenen Spiegels einfach bestimmen. Bei Betrachtung der Punktquelle und der Spiegelanordnung in Abbildung 5.50 erweist sich schnell, dass |a| = |a | ist: Das Bild P und das Objekt S haben den gleichen Abstand von der Oberfläche. Nach dem Reflexionsgesetz ist θi = θr . Die Summe θi + θr ist der Außenwinkel des Dreiecks SPA und deshalb gleich der Summe der inneren Wechselwinkel, VSA+VPA. Da aber VSA = θi , ist VSA = VPA. So sind die Dreiecke VAS und VPA kongruent, und in diesem Fall ist |a| = |a |.

5.4 Spiegel

361

(a)

(b)

Abb. 5.51: (a) Das Bild eines ausgedehnten Objekts in einem ebenen Spiegel. (b) Bilder in einem ebenen Spiegel.

Wir wollen nun versuchen, eine Vorzeichenkonvention für Spiegel zu finden. Wie wir uns auch entscheiden – und Sie sollten sich klar machen, dass wir tatsächlich die Wahl haben –, wir halten uns nur an sie, damit wir gut arbeiten können. Ein offensichtliches Problem, das die Verwendung der Konvention für Linsen mit sich bringt, besteht darin, dass nun das virtuelle Bild rechts von der Grenzfläche liegt. Der Beobachter sieht P an einer Stelle hinter dem Spiegel, da sein Auge (oder eine Kamera) die eigentliche Reflexion nicht wahrnehmen kann; es extrapoliert lediglich die Strahlen nach hinten, also divergieren die Strahlen von P in Abbildung 5.51. Von einem Schirm in P kann kein Licht aufgefangen werden – das Bild ist mit Sicherheit virtuell. Zweifellos ist es eine Geschmacksfrage, ob a in diesem Fall als positiv oder negativ definiert werden sollte. Da wir uns an die Vorstellung von negativen virtuellen Objekt- und Bildweiten gewöhnt haben, werden wir a und a als negativ definieren, wenn sie rechts vom Scheitelpunkt V liegen. Dies hat den zusätzlichen Vorteil, dass wir eine Spiegelformel erhalten, die identisch mit der gaußschen Linsenformel (5.17) ist. Offensichtlich gilt dieselbe Definition der Transversalvergrößerung (5.24), in der nun wieder MT = +1 auf ein natürlich großes, virtuelles, aufrechtes Bild hinweist. Jeder Punkt des ausgedehnten Objekts in Abbildung 5.51, der einen senkrechten Abstand a vom Spiegel hat, wird in demselben Abstand hinter dem Spiegel abgebildet. Auf diese Weise wird das gesamte Bild Punkt für Punkt aufgebaut. Dies unterscheidet sich vollkommen von der Art und Weise, in der eine Linse ein Bild erzeugt. Das Objekt in Abbildung 5.30 ist eine linke Hand, und das durch die Linse erzeugte Bild ist wieder eine linke Hand, die höchstens deformiert sein könnte (ML = MT ). Die einzige wirkliche Veränderung ist die 180◦ -Drehung um die optische Achse – ein Effekt, den man als Seitenumkehrung bezeichnet. Im Gegensatz dazu ist das Spiegelbild der linken Hand eine rechte Hand (Abb. 5.52). Man kann dieses Bild konstruieren, indem man von jedem Punkt aus eine Senkrechte durch den Spiegel zeichnet. Ein solches Bild heißt seitenverkehrt, und den Vorgang,

5 Geometrische Optik

362

Bild linkshändig

rechtshändig Objekt

Abb. 5.52: Spiegelbilder – Umkehrung.

linkshändig (a)

rechtshändig

linkshändig

rechtshändig Bild

rechtshändig Objekt linkshändig (b)

Abb. 5.53: Umkehrungen durch Reflexion.

der ein rechtshändiges Koordinatensystem im Objektraum in ein linkshändiges im Bildraum verwandelt, nennt man Inversion. Systeme mit mindestens zwei ebenen Spiegeln können benutzt werden, um entweder eine ungerade oder eine gerade Anzahl von Umkehrungen zu erreichen. Im letzteren Fall erzeugt ein rechtshändiges Objekt ein rechtshändiges Bild (Abb. 5.53), wohingegen im ersteren Fall das Bild linkshändig ist.

5.4 Spiegel

363

Beispiel 5.9 Über dem Kopf eines Patienten wird eine 40 cm hohe und 20 cm breite Sehtafel platziert. Wie groß muss der Spiegel mindestens sein, damit die Sehtafel für den Patienten vollständig sichtbar ist? Sehtafel C 40 cm

Spiegel

Bild E

A D

F B

G

Lösung Der Abstand DB ist gleich GB = BF , und daher ist GF = 2GB. Die Dreiecke GBA und GF E sind ähnlich, und folglich gilt 40 cm = 2AB. Der Spiegel muss mindestens 20 cm hoch und 10 cm breit sein.

Bewegliche Spiegel In etlichen Geräten verwendet man rotierende ebene Spiegel, beispielsweise in Zerhackern (auch Chopper oder Lichtmodulatoren genannt), Strahlablenkelementen und Bildumkehrern. Oft werden Spiegel benutzt, um kleine Drehungen bestimmter Laborgeräte, z. B. Galvanometer, Torsionspendel, Stromwaagen usw., optisch zu verstärken und zu messen. Das reflektierte Strahlenbündel bzw. das Bild des Winkels durchläuft 2α, wenn sich der Spiegel um einen Winkel α dreht (Abb. 5.54). Die Fähigkeit von Spiegeln, Lichtstrahlen unmittelbar umzulenken, macht sich die Menschheit schon seit Jahrhunderten zunutze. Nur eines von vielen Beispielen, das Ihnen vielleicht sofort einfällt, ist die einäugige Spiegelreflexkamera (siehe Foto S. 364). Heutzutage werden Mikrospiegel (siehe Foto S. 365), klein genug, um durch ein Nadelöhr zu passen, in der modernen Technologie mikro-optoelektromechanischer Systeme (MOEMS) eingesetzt. Im weltweiten Telekommunikationsnetz vollzieht sich in der Stille der Abschied von den elektronischen Bauteilen und der Umstieg auf vollständig optische Geräte. Elektronische Schalter sind teuer, relativ voluminös und – gemessen an optischen Vergleichswerten – unerträglich langsam. Das wichtigste Element der „optischen Revolution“ ist entsprechend der optische Schalter. Mikrospiegel, die innerhalb von Millisekunden umgedreht oder gekippt werden können, gehören zu den vielversprechendsten Ansätzen (siehe auch Abschn. 5.6.1). Es wird oft behauptet, dass ebene Spiegel nur virtuelle Bilder erzeugen können, doch das ist nicht ganz richtig. Angenommen, wir schneiden aus einem solchen Spiegel ein

5 Geometrische Optik

364

2θi θi

θi

2θi + 2α α

α

Abb. 5.54: Drehung eines Spiegels und die begleitende Winkelverschiebung eines Strahlenbündels.

Einäugige Spiegelreflexkamera. Licht fällt durch das Objektiv auf den Spiegel, wird nach oben zum Prisma und von dort zum Auge umgelenkt. Wird der Verschluss ausgelöst, so klappt der Spiegel nach oben und das Licht trifft direkt auf den Film; anschließend klappt der Spiegel wieder nach unten. (Foto E. H.)

kleines Stück heraus, sodass der Spiegel anschließend ein Loch hat. Dieses Loch wird wie das Loch einer Lochkamera auf einem entfernten Schirm hinter der Anordnung „reelle Bilder“ erzeugen. Nun betrachten wir das winzige herausgeschnittene Spiegelstück. Es muss vor seiner reflektierenden Oberfläche „reelle“ Bilder erzeugen. Wegen θi = θr ist die vor dem kleinen Spiegel erzeugte Strahlenkonfiguration die gleiche wie jene, die hinter dem Loch entsteht. Der Spiegel erzeugt „reelle“ Bilder in dem Sinne,

5.4 Spiegel

365

Ein winziger, kippbarer Spiegel, so klein, dass er durch ein Nadelöhr passt, wird zur Umlenkung von Lichtstrahlen in einem der wichtigsten Bauelemente der modernen Telekommunikationstechnik verwendet. (Foto mit frdl. Genehmigung der Bell Laboratories, Lucent Technologies.)

dass sie projiziert werden können; sie sind aber nicht wirklich reell, weil die schmalen Strahlenbündel nicht konvergieren. Es ist also eine Frage der Semantik.

5.4.2 Asphärische Spiegel Gekrümmte Spiegel, die Bilder erzeugen, die denen von Linsen oder gekrümmten brechenden Flächen ähnlich sind, kennt man seit der griechischen Antike. In dem Euklid zugeschriebenen Werk Katoptrik werden sowohl konkave als auch konvexe Spiegel diskutiert.5 Glücklicherweise kennen wir die konzeptionelle Basis für den Entwurf solcher Spiegel bereits: Weiter vorne haben wir die Anwendung des fermatschen Prinzips auf die Bildentstehung in brechenden Systemen behandelt. Welche Form muss nun ein Spiegel haben, der eine einfallende ebene Welle durch Reflexion in eine konvergierende Kugelwelle umwandelt (Abb. 5.55)? Soll die ebene Welle nach der Reflexion im Punkt F konvergieren, müssen die optischen Weglängen für alle Strahlen gleich sein; demgemäß gilt für beliebige Punkte A1 und A2 OWL = W1 A1 + A1 F = W2 A2 + A2 F .

(5.41)

A1 W1

D1 F

n=1

W2

A 2 D2 Σ

(a)

(b)

(c)

Abb. 5.55: Ein Parabolspiegel.

5

Dioptrik ist die Optik brechender Systeme, Katoptrik dagegen die Optik reflektierender Systeme.

5 Geometrische Optik

366 Da die Ebene Σ parallel zur einfallenden Wellenfront ist, gilt W1 A1 + A1 D1 = W2 A2 + A2 D2 .

(5.42)

Gleichung (5.41) ist deshalb auch für eine Fläche erfüllt, für die A1 F = A1 D1 und A2 F = A2 D2 ist, oder, allgemeiner, für eine Fläche,  für die AF = AD für jeden Punkt auf dem Spiegel ist. Allgemein gilt Af = e AD mit e als Exzentrizität eines Kegelschnittes. In Abschnitt 5.2.1 war dieser Kegelschnitt eine Hyperbel, für die e = nti > 1 ist. In Aufgabe 5.3 ist die Abbildung eine Ellipse mit e = nti < 1. Hier sind nun beide Medien identisch, also nt = ni und e = nti = 1; anders ausgedrückt, die Fläche ist ein Paraboloid mit dem Brennpunkt F und der Leitlinie Σ. Die Strahlen könnten ebenso gut umgekehrt verlaufen (eine Punktquelle im Brennpunkt eines Paraboloids erzeugt ebene Wellen).

Große Parabolantenne bei Goldstone Deep Space Communications Complex. (Mit freundlicher Genehmigung der NASA)

Anwendungen von Parabolspiegeln reichen heute von Blitzlicht- und Scheinwerferreflektoren bis zu riesigen Radioteleskopen (siehe Foto), von Hornstrahlern für Mikrowellen und akustischen Hohlspiegeln bis zu optischen Teleskopspiegeln und auf dem Mond stationierten Kommunikationsantennen. Konvexe Parabolspiegel sind weit weniger verbreitet. Wenn wir anwenden, was wir bereits wissen, können wir Abbildung 5.56 entnehmen, dass ein auf einen konvexen Spiegel auftreffendes paralleles Strahlenbündel ein virtuelles Bild in F erzeugt. Ein reelles Bild entsteht hingegen, wenn der Spiegel konkav ist.

F

Abb. 5.56: Reelle und virtuelle Abbildungen für einen Parabolspiegel.

5.4 Spiegel

367

Es gibt noch andere interessante asphärische Spiegel, nämlich den Ellipsoidspiegel (e < 1) und den Hyperboloidspiegel (e > 1). Beide erzeugen ideale Abbildungen konjugierter Punkte, die sich mit ihren beiden Brennpunkten decken (Abb. 5.57). Wie wir sehen werden, verwendet man in den Teleskopkonfigurationen nach Cassegrain und Gregory konvexe Sekundärspiegel, die hyperbolisch bzw. elliptisch sind. Der Primärspiegel des Hubble-Weltraumteleskops ist hyperbolisch (siehe Foto unten), was auf die meisten neueren Geräte zutrifft.

(a) konvex-hyperbolisch

(b) konvex-elliptisch

(c) konkav-hyperbolisch

(d) konkav-elliptisch

Abb. 5.57: Hyperboloidspiegel und Ellipsoidspiegel.

Der hyperbolische Primärspiegel des Hubble-Weltraumteleskops hat einen Durchmesser von 2,4 m. (Mit freundlicher Genehmigung der NASA.)

5 Geometrische Optik

368

Eine Vielfalt von asphärischen Spiegeln ist im Handel erhältlich. Man kann außer den weit verbreiteten zentrischen Systemen sogar nichtaxiale optische Elemente erwerben. So kann der gebündelte Strahl in Abbildung 5.58 weiterverarbeitet werden, ohne dass der Spiegel verdeckt wird. Diese Geometrie wird auch bei großen MikrowellenHornstrahlern verwendet.

Abb. 5.58: Ein ment.

nichtaxiales

Parabolspiegelele-

5.4.3 Sphärische Spiegel Präzise asphärische Flächen sind weit schwieriger herzustellen als sphärische Flächen und deshalb wesentlich teurer. Wir wollen noch einmal auf die sphärische Konfiguration zurückkommen und uns ansehen, unter welchen Umständen sie die adäquate ist. Der paraxiale Bereich Die Gleichung für den kreisförmigen Querschnitt einer Kugel (Abb. 5.59 a) ist y 2 + (x − R)2 = R2 ,

(5.43)

wobei der Mittelpunkt C einen Radius R vom Ursprung O entfernt liegt. Wir formen um zu y 2 − 2Rx + x2 = 0 und lösen nach x auf: x = R ± R2 − y 2 .

(5.44)

Wir wollen uns mit Werten von x beschäftigen, die kleiner als R sind – das heißt, wir wollen eine Halbkugel untersuchen, die, entsprechend dem Minuszeichen in

5.4 Spiegel

369

y

y

y Paraboloid

R O

C

x

F

O

x

O

F f

f

(a)

C

x

f Kugel

(b)

(c)

Abb. 5.59: Vergleich eines Kugelspiegels mit einem Parabolspiegel.

Gleichung (5.44), rechts offen ist. Bei der folgenden Entwicklung in eine binomische Reihe nimmt x die Form y4 3y 6 y2 + 2 + + ··· (5.45) 2R 2 2!R3 23 3!R5 an. Um diesen Ausdruck zu interpretieren, müssen wir berücksichtigen, dass die Standardgleichung für eine Parabel mit dem Scheitelpunkt im Nullpunkt und dem Brennpunkt in einem Abstand f auf der rechten Seite (Abb. 5.59 b) einfach x=

y 2 = 4f x

(5.46)

ist. So sehen wir beim Vergleich der beiden Formeln, dass man den ersten Beitrag der Reihe als parabelförmig betrachten kann, wenn 4f = 2R (f = R/2) ist, während die übrigen Terme die Abweichung von der Parabel angeben. Wenn diese Abweichung Δx ist, gilt y6 y4 + + ··· . 8R3 16R5 Offensichtlich ist diese Differenz nur signifikant, wenn y relativ groß im Vergleich zu R ist (Abb. 5.59 c). Im paraxialen Bereich kann man die beiden Spiegelformen als gleich betrachten. Δx =

Wir können ein Gefühl für Δx bekommen, wenn wir den Spiegel eines Amateurteleskops als das betrachten, was in Abbildung 5.122 b als Newton-Reflektor eingezeichnet ist. Eine geeignete Tubuslänge bekommen wir, wenn die Brennweite bei ungefähr 140 cm liegt. Geeignet wäre ein Spiegel von 20 cm Durchmesser, was einer Blendenzahl von f /D = 7 entspricht. Am Rand eines solchen Spiegels (y = 10 cm) würde die horizontale Differenz (Δx) zwischen dem Paraboloid und der Kugel (Abb. 5.59) etwas weniger als 60 Millionstel Zentimeter betragen. Näher am Mittelpunkt (y = 5 cm) wäre Δx nur noch wenige Millionstel Zentimeter groß.

5 Geometrische Optik

370

Wenn wir uns auf die Theorie paraxialer Strahlen als eine erste Näherung für sphärische Spiegel beschränken, können wir die Zusammenhänge anwenden, die wir bei der Betrachtung stigmatischer Abbildungen an Paraboloiden erarbeitet haben. In der Praxis ist y jedoch nicht in dieser Weise begrenzt, und Aberrationen treten in Erscheinung. Zudem erzeugen asphärische Flächen nur scharfe Abbildungen für Paare axialer Punkte, sie sind also auch nicht frei von Aberrationen. Die Spiegelformel Die Paraxialgleichung, die konjugierte Objektpunkt-Bildpunkt-Paare mit den physikalischen Parametern eines sphärischen Spiegels verknüpft, kann mithilfe von Abbildung 5.60 hergeleitet werden. Wir beachten, dass SAP durch CA halbiert wird, da θi = θr ist; die Seite SP des Dreiecks SAP wird in Abschnitte aufgeteilt, die proportional zu den übrigen beiden Seiten sind: SC CP = . SA PA Des Weiteren ist

(5.47)

SC = a − |R|

S

und

CP = |R| − a ,

P

A θi θr S

P C

V

F

a

R a

f

Abb. 5.60: Ein sphärischer Hohlspiegel. Konjugierte Punkte.

5.4 Spiegel

371

wobei a und a links liegen und deshalb positiv sind. Benutzen wir die gleiche Vorzeichenkonvention für R wie bei der Brechung, ist hier R negativ, weil C links von V liegt, d. h., die Fläche ist konkav. Deshalb ist |R| = −R und   SC = a + R und CP = − a + R . Im paraxialen Bereich ist SA ≈ a und P A ≈ a . So wird Gleichung (5.47) zu a + R a+R =− a a oder 1 2 1 +  =− , (5.48) a a R die oft als Spiegelformel bezeichnet wird. Sie ist gleichermaßen für Konkav- bzw. Sammelspiegel (R < 0) wie für Konvex- bzw. Zerstreuungsspiegel (R > 0) anwendbar. Der Primärbrennpunkt bzw. Objektbrennpunkt ist wieder durch lim a = f

a →∞

definiert, während der Sekundärbrennpunkt bzw. Bildbrennpunkt lim a = f 

a→∞

entspricht. Folglich erhalten wir aus Gleichung (5.48) 1 1 1 2 1 + = + =− f ∞ ∞ f R und damit R 2 (siehe Abb. 5.59 c). Das Weglassen der Brennweitenindizes liefert f = f = −

(5.49)

1 1 1 +  = . a a f

(5.50)

Für Konkavspiegel (R < 0) ist f also positiv und für Konvexspiegel (R > 0) negativ. Im letzteren Fall wird das Bild hinter dem Spiegel erzeugt und ist virtuell (Abb. 5.61). Endlich große Abbildungen Da die übrigen Spiegeleigenschaften denjenigen der Linsen und brechenden Kugelflächen sehr ähnlich sind, brauchen wir sie nur kurz zu erwähnen, ohne die gesamte logische Entwicklung jedes einzelnen Aspektes zu wiederholen. Innerhalb der Einschränkungen der Theorie der paraxialen Strahlen wird jedes parallele, außerhalb der Achse verlaufende Strahlenbündel in einem Punkt auf der Brennebene gebündelt, die

5 Geometrische Optik

372

F

C

C

F

Abb. 5.61: Strahlenfokussierung durch einen Kugelspiegel. (Foto E. H.)

Ein konvexer Kugelspiegel erzeugt ein virtuelles, aufrechtes, verkleinertes Bild. Versuchen Sie, den Autor zu entdecken, der die Kamera hält, um dieses Bild aufzunehmen. (Foto E. H.)

durch F senkrecht zur optischen Achse verläuft. Weiterhin wird ein endlich großes ebenes Objekt, das senkrecht auf der optischen Achse steht, in einer Ebene (in erster Näherung) abgebildet, die ebenso ausgerichtet ist. In dieser Ebene hat prinzipiell jeder Objektpunkt einen korrespondierenden Bildpunkt. Dies gilt exakt für einen ebenen Spiegel, aber nur näherungsweise für andere Formen. Die von jedem Objektpunkt herrührenden reflektierten Wellen sind in guter Näherung Kugelwellen, wenn ein sphärischer Spiegel entsprechend begrenzt wird. Unter solchen Umständen können gute, endlich große Bilder von ausgedehnten Objekten erzeugt werden. Genau wie jeder Bildpunkt einer dünnen optischen Linse längs einer geraden Linie liegt, die durch den optischen Mittelpunkt O verläuft, liegt jeder Bildpunkt eines

5.4 Spiegel

373

Strahl 2 Strahl 1

Strahl 2 Strahl 4

Strahl 4 Strahl 3

Strahl 3

Strahl 1

Abb. 5.62: Vier leicht zu zeichnende Strahlen. Strahl 1 läuft in Richtung von C und wird in sich selbst reflektiert. Strahl 2 fällt parallel zur optischen Achse ein und wird in Richtung F reflektiert. Strahl 3 läuft durch F und trifft auf den Spiegel, der ihn parallel zur Achse reflektiert. Strahl 4 trifft Punkt V und wird so reflektiert, dass θi = θr ist.

2

2 3

1

3 1

Abb. 5.63: Endlich große Abbildungen mit Kugelspiegeln.

F C F

C

(a)

(b)

Abb. 5.64: (a) Reflexion an einem Konkavspiegel. (b) Reflexion an einem Konvexspiegel.

Kugelspiegels auf einem Strahl, der sowohl durch den Mittelpunkt C der Spiegelkrümmung als auch durch den Objektpunkt läuft (Abb. 5.62). Wie bei einer dünnen Linse (Abb. 5.23) ist die grafische Konstruktion des Bildes recht einfach (Abb. 5.63). Wieder wird die Spitze des Bildes im Schnittpunkt zweier Strahlen ermittelt, beispielsweise eines Strahls, der ursprünglich parallel zur Achse verlief und nach der Reflexion durch F geht, und eines zweiten, der durch C verläuft (Abb. 5.64). Ein Strahl von einem nichtaxialen Objektpunkt zum Scheitelpunkt bildet bei der Reflexion gleiche Winkel mit der optischen Achse und ist daher ebenfalls zur Konstruktion geeignet. Das gilt auch für den Strahl, der zuerst durch den Brennpunkt und nach der Reflexion parallel zur Achse läuft.

5 Geometrische Optik

374 Tabelle 5.4: Vorzeichenvereinbarung für Kugelspiegel.

Größe a a f R y y

Vorzeichen +



links von V , reelles Objekt links von V , reelles Bild Konkavspiegel C rechts von V , konvex über der Achse, aufrechtes Objekt über der Achse, aufrechtes Bild

rechts von V , virtuelles Objekt rechts von V , virtuelles Bild Konvexspiegel C links von V , konkav unter der Achse, umgekehrtes Objekt unter der Achse, umgekehrtes Bild

Die Dreiecke S1 S2 V und P1 P2 V in Abbildung 5.63 a sind ähnlich und daher sind ihre Seiten proportional. Nehmen wir y  wieder als negativ an, da sich P2 unterhalb der optischen Achse befindet, so wird y  /y = −a /a. Dies ist, wie auch im Fall der Linse, die transversale Vergrößerung MT , siehe Gleichung (5.25). Die einzige Gleichung, die Informationen über die Struktur (n, R, usw.) des optischen Elements enthält, ist die für f ; verständlicherweise unterscheidet sie sich von der für dünne Linsen, Gleichung (5.16), und der für Kugelspiegel, Gleichung (5.49). Die anderen funktionalen Zusammenhänge zwischen a , a und f bzw. y  , y und MT sind jedoch identisch. Der einzige Unterschied zur bisherigen Vorzeichenkonvention ist aus Tabelle 5.4 ersichtlich: a links von V wird nun als positiv angenommen. Die auffällige Ähnlichkeit zwischen den Eigenschaften eines Konkavspiegels und einer Konvexlinse einerseits und eines Konvexspiegels und einer Konkavlinse andererseits ist verständlich, wenn man die Tabellen 5.3 und 5.5 vergleicht. Die Eigenschaften, die in Tabelle 5.5 zusammengefasst und in Abbildung 5.65 dargestellt werden, kann man leicht empirisch überprüfen. Hat man keinen Kugelspiegel zur Hand, kann man sich ein relativ einfaches, aber funktionsfähiges Modell herstellen, indem man Aluminiumfolie über eine Kugelfläche (den Kolben einer Glühlampe) zieht (in diesem speziellen Fall ist R und deshalb f klein). Ein schönes qualitatives Experiment ist die Untersuchung des Bildes eines kleinen Objekts, das mit einem Konkavspiegel kurzer Brennweite erzeugt wird. Wenn man das Objekt aus einem Abstand größer als 2f = R auf den Spiegel zubewegt, wird das Bild allmählich größer, bis es bei a = 2f umgekehrt und in natürlicher Größe erscheint. Bringt man es noch näher an den Spiegel heran, so wird das Bild noch größer und füllt schließlich den gesamten Spiegel in bis zur Unkenntlichkeit verschwommener Weise aus. Während a kleiner wird, verkleinert sich das nun aufrechte, vergrößerte Bild weiter, bis das Objekt am Spiegel angekommen ist und das Bild die Größe des Objekts angenommen hat. Wenn Sie die bisherigen Beschreibungen noch nicht dazu animiert haben, einen Spiegel herzustellen, können Sie vielleicht das Bild untersuchen, das von einem blanken Löffel erzeugt wird – beide Seiten sind interessant.

5.4 Spiegel

375

f 2f

C

F

Abb. 5.65: Der Abbildungsvorgang bei einem sphärischen Hohlspiegel. Tabelle 5.5: Abbildungen reeller Objekte, die durch Kugelspiegel erzeugt werden.

konkav Objekt Lage ∞ > a > 2f a = 2f f < a < 2f a=f a a > 2f ±∞ |a | > a

Ausrichtung umgekehrt umgekehrt umgekehrt

relative Größe verkleinert gleich groß vergrößert

aufrecht

vergrößert

konvex Objekt Lage überall möglich

Abbildung Art virtuell

Lage |a | < |f |, a > |a |

Ausrichtung aufrecht

relative Größe verkleinert

5 Geometrische Optik

376

Das riesige virtuelle Bild eines Fotografen, der weniger als eine Brennweite entfernt von einem Multielement-Teleskopspiegel in Tucson, Arizona, steht. Er trägt einen Hut und hat die rechte Hand gehoben.

Beispiel 5.10 Ein kleiner Frosch sitzt 35,0 cm vor einem konkaven Kugelspiegel mit einer Brennweite von 20,0 cm. Wo befindet sich das Bild? Geben Sie eine vollständige Beschreibung an. Wie groß ist die transversale Vergrößerung des Bildes? Lösung Nach Gleichung (5.50) ist 1 1 +  a a 1 1 +  35,0 a 1 a a

=

1 f

1 20,0 1 1 − = 0,02143 = 20,0 35,0 = 46,67 cm ≈ 46,7 cm =

Das Bild ist reell, umgekehrt und vergrößert. Beachten Sie, dass a positiv ist – deshalb ist das Bild reell. MT =

46,67 cm a =− = −1,3 a 35,0 cm

Das Minuszeichen bedeutet, dass das Bild invertiert ist. Ein alternativer Rechenweg ist MT =

4 f 20 = − = − = −1,3 xo 15 3

5.5 Prismen

5.5

377

Prismen

Optische Prismen werden zu unterschiedlichen Zwecken verwendet. Prismenkombinationen dienen zum Beispiel als Strahlteiler (Abschn. 4.7), als Polarisatoren (siehe Abschn. 8.4.3) und als Interferometer. Ungeachtet dieser Vielfalt nutzt die große Mehrzahl der Anwendungen nur eine der beiden Hauptfunktionen eines Prismas. Ein Prisma kann erstens als dispersives Element dienen, beispielsweise in einem Spektralapparat, denn es trennt einen polychromatischen Lichtstrahl bis zu einem gewissen Grade räumlich in seine Frequenzbestandteile. Sie werden sich erinnern, dass wir den Ausdruck Dispersion schon mit der Frequenzabhängigkeit des Brechungsindex n (ω) für Dielektrika eingeführt haben (Abschn. 3.5.1). In der Tat ist ein Prisma ein sehr nützliches Hilfsmittel, um n (ω) in einem großen Frequenzbereich und für verschiedenste Stoffe, einschließlich Flüssigkeiten und Gasen, zu bestimmen.

Eine Auswahl verschiedener Prismen. (Perkins Precision Developments)

Die zweite, weiter verbreitete Anwendung besteht in der Änderung der Orientierung eines Bildes oder der Fortpflanzungsrichtung von Strahlen. Prismen werden in sehr viele optische Instrumente eingebaut, oftmals, um das System bis auf akzeptable Abmessungen „zusammenzufalten“. Es gibt Umkehrprismen und Prismen, die einen Strahl ohne Umkehr umlenken, und dies alles ohne Dispersion.

5.5.1 Dispersionsprismen Prismen gibt es in vielen Größen und Formen, und ebenso zahlreich sind die Aufgaben, die sie erfüllen (siehe Foto). Betrachten wir zuerst die Gruppe der Dispersionsprismen. Ein Strahl, der wie in Abbildung 5.66 in ein Dispersionsprisma eintritt, hat beim Verlassen desselben einen Ablenkungswinkel δ gegenüber seiner ursprüngli-

5 Geometrische Optik

378 A α

δ θi1 B

θi2

θt1 α

θt2

C

D

(θi1 −θt1 ) (θt2 −θi2 )

α n

Abb. 5.66: Geometrie eines Dispersionsprismas.

chen Richtung. Bei der ersten Brechung ändert sich die Richtung um (θi1 − θt1 ), bei der zweiten Brechung um (θt2 − θi2 ). Die gesamte Ablenkung ist dann δ = (θi1 − θt1 ) + (θt2 − θi2 ) . Da das Polygon ABCD zwei rechte Winkel hat, muss der Winkel BCD der Ergänzungswinkel des Scheitelwinkels α sein. Der Winkel α ist als Außenwinkel des Dreiecks BCD gleich der Summe der inneren Wechselwinkel, also α = θt1 + θi2 .

(5.51)

Somit ist δ = θi1 + θt2 − α .

(5.52)

Wir wollen nun δ als Funktion sowohl des Einfallswinkels θi1 des Strahls als auch des Prismenwinkels α aufschreiben; beide nehmen wir als bekannt an. Der Brechungsindex des Prismas sei n und das umgebende Medium Luft (na ≈ 1). Dann folgt aus dem snelliusschen Gesetz θt2 = sin−1 (n sin θi2 ) = sin−1 [n sin (α − θt1 )] . Wir erhalten durch Reihenentwicklung dieses Ausdrucks, Ersetzen von cos θt1 durch 1/2  und Anwendung des snelliusschen Gesetzes 1 − sin2 θt1

1/2  − sin θi1 cos α . θt2 = sin−1 (sin α) n2 − sin2 θi1 Die Ablenkung des Strahls ist dann

1/2  − sin θi1 cos α − α . δ = θi1 + sin−1 (sin α) n2 − sin2 θi1

(5.53)

Offensichtlich wächst δ mit n, das seinerseits eine Funktion der Frequenz ist, und so könnten wir die Ablenkung als δ (ν) oder δ (λ) auffassen. Für die meisten durchsichtigen Dielektrika von praktischem Interesse nimmt n (λ) ab, wenn die Wellenlänge im sichtbaren Bereich zunimmt (siehe Abbildung 3.41 mit dem Verlauf von n (λ) als

5.5 Prismen

379

Funktion von λ für verschiedene Gläser). Es ist klar, dass dann δ (λ) für rotes Licht kleiner ist als für blaues. Missionare berichteten im frühen 17. Jahrhundert, dass Prismen wegen ihrer Fähigkeit, Farben zu erzeugen, in China bekannt und hoch geschätzt waren. Forscher jener Zeit, insbesondere Marci, Grimaldi und Boyle, beschäftigten sich ebenfalls mit Prismen; die ersten exakten Untersuchungen der Dispersion stammen von Sir Isaac Newton. Am 6. Februar 1672 überreichte dieser der Royal Society die berühmte Abhandlung „A New Theory about Light and Colours“ (Eine neue Theorie des Lichts und der Farben). Er schlussfolgerte darin, dass weißes Licht eine Mischung aus verschiedenen Farben ist und dass der Brechungsvorgang von der Farbe abhängt. Aus Gleichung (5.53) folgt, dass die Ablenkung eines monochromatischen Strahlenbündels beim Durchgang durch ein gegebenes Prisma (n und α sind feste Größen) lediglich eine Funktion des Einfallswinkels θi1 an der ersten Fläche ist. Abbildung 5.67 zeigt den durch Gleichung (5.53) definierten Kurvenverlauf für ein typisches Glasprisma. Den kleinsten Wert von δ, dem eine besondere praktische Bedeutung zukommt, nennt man minimale Ablenkung δm . Diese kann man analytisch bestimmen, indem man Gleichung (5.53) differenziert und dann dδ/dθi1 = 0 setzt, doch es bietet sich ein einfacherer, indirekter Weg an. Ableiten und Nullsetzen von Gleichung (5.52) ergibt dθt2 dδ =1+ =0 dθi1 dθi1 oder dθt2 /dθi1 = −1. Die Ableitung des snelliusschen Gesetzes an den Grenzflächen liefert cos θi1 dθi1 = n cos θt1 dθt1 und cos θt2 dθt2 = n cos θi2 dθi2 .

δ (Grad)

50

45

40

n = 1.5 α = 60◦

δm 35 30

40

50 60 θi1 (Grad)

70

80

90

Abb. 5.67: Ablenkungswinkel als Funktion des Einfallswinkels.

5 Geometrische Optik

380

Beachten Sie bei der Differentiation von Gleichung (5.51), dass dθt1 = −dθi2 ist, da dα = 0 ist. Wir teilen die vorletzte Gleichung durch die letzte, substituieren die Differentialquotienten und erhalten cos θt1 cos θi1 = . cos θt2 cos θi2 Wir wenden noch einmal das snelliussche Gesetz an und erhalten n2 − sin2 θi1 1 − sin2 θi1 = . 1 − sin2 θt2 n2 − sin2 θt2 Dies trifft gerade für den Wert von θi1 zu, für den dδ/dθi1 = 0 gilt. Wegen n = 1 folgt θi1 = θt2 und deshalb θt1 = θi2 . Dies bedeutet, dass der Strahl mit minimaler Ablenkung das Prisma symmetrisch, also parallel zur Grundfläche, durchläuft. Übrigens gibt es einen eleganten Beweis für die Gleichheit von θi1 und θt2 , der weder so mathematisch noch so mühsam ist wie unsere Beweisführung. Dazu nehmen wir an, ein Strahl wird minimal abgelenkt und θi1 = θt2 . Kehren wir den Strahl nun um, so läuft er auf demselben Weg zurück; δ muss deshalb unverändert sein, also δ = δm . Dies würde jedoch bedeuten, dass es zwei verschiedene Einfallswinkel gäbe, für die die Ablenkung minimal wird – dies ist offensichtlich falsch. Demnach ist θi1 = θt2 . Für den Fall δ = δm folgt aus den Gleichungen (5.51) und (5.52) θi1 = (δm + α) /2 und θt1 = α/2, womit das snelliussche Gesetz an der ersten Grenzfläche zu n=

sin [(δm + α) /2] sin α/2

(5.54)

führt. Auf dieser Gleichung basiert eine der genauesten Methoden zur Bestimmung der Brechungsindizes von durchsichtigen Substanzen. Dazu fertigt man ein Prisma aus dem fraglichen Stoff an, bestimmt α und δm (λ) und berechnet n (λ) unter Verwendung von Gleichung (5.54) für jede Wellenlänge. Hohle Prismen, deren Seiten aus planparallelem Glas hergestellt sind, kann man mit Flüssigkeiten oder Gasen unter hohem Druck füllen. Die Glasplatten selbst beeinflussen die Richtung des Strahls nicht. Die Abbildungen 5.68 und 5.69 zeigen zwei Beispiele für Dispersionsprismen mit konstanter Ablenkung, die eine wichtige Rolle in der Spektroskopie spielen. Das Pellin-Broca-Prisma ist wahrscheinlich das am weitesten verbreitete dieser Gruppe. Es ist zwar ein einziger Glaskörper, aber man kann es sich aus zwei 30◦ –60◦ –90◦ Prismen und einem 45◦ –45◦ –90◦ -Prisma zusammengesetzt vorstellen. Wir nehmen

5.5 Prismen

381 A 30◦ 45◦ 30◦60◦

D 60◦ 30◦

60◦

E 45◦ B

δ=90◦

60◦◦ 30

60◦ 120◦ δ=60◦ 30◦

60◦ C

Abb. 5.68: Das Pellin-Broca-Prisma.

Abb. 5.69: Das Abbe-Prisma.

an, dass in der dargestellten Position ein einzelner monochromatischer Strahl der Wellenlänge λ das Teilprisma DAE symmetrisch durchläuft, wonach er unter einem Winkel von 45◦ an der Fläche AB reflektiert wird. Der Strahl durchquert das Prisma CDB dann symmetrisch, wobei er eine Gesamtablenkung von 90◦ erfährt. Man kann sich vorstellen, dass der Strahl stattdessen durch ein gewöhnliches 60◦ -Prisma (DAE in Verbindung mit CDB) bei minimaler Ablenkung läuft. Alle anderen Wellenlängen, die im Strahlenbündel vorkommen, treten unter anderen Winkeln aus dem Prisma aus. Wird das Prisma nun leicht um eine Achse senkrecht zur Bildebene gedreht, so ändert sich der Einfallswinkel des eintretenden Strahls. Eine Komponente mit einer anderen Wellenlänge, zum Beispiel λ2 , erfährt nun eine minimale Ablenkung, die wieder 90◦ ist – daher der Begriff konstante Ablenkung. Mit einem derartigen Prisma kann man in bequemer Weise die Lichtquelle und das Betrachtungssystem in einem festen Winkel (hier 90◦ ) anordnen und dann das Prisma einfach drehen, um eine bestimmte Wellenlänge zu beobachten. Die Vorrichtung kann so geeicht werden, dass die Drehskala des Prismas die Wellenlänge direkt angibt.

5.5.2 Reflexionsprismen Wir untersuchen nun Reflexionsprismen, bei denen die Dispersion nicht erwünscht ist. In diesem Fall fällt der Strahl so ein, dass mindestens eine innere Totalreflexion stattfindet, um die Ausbreitungsrichtung, die Orientierung des Bildes oder beides zu ändern. Wir wollen zuerst nachweisen, dass es wirklich möglich ist, solch eine innere Reflexion ohne begleitende Dispersion zu erhalten, dass also δ unabhängig von λ gehalten werden kann. Das Prisma in Abbildung 5.70 nehmen wir als gleichschenklig an – diese Form kommt ziemlich häufig vor. Den Strahl, der an der ersten Grenzfläche gebrochen wird, reflektiert später die Fläche F G. Wie wir bereits gesehen haben (Abschn. 4.7),

5 Geometrische Optik

382 A α

α θi1 θt2 B

D θt1

θi2

C

F

E

G δ (a)

(b)

Abb. 5.70: Geometrie eines Reflexionsprismas.

ist dies der Fall, wenn der innere Einfallswinkel größer als der Grenzwinkel θc ist, der definiert ist durch sin θc = nti .

[4.69]

Dies erfordert für eine Glas-Luft-Grenzfläche, dass θi größer als rund 42◦ ist. Um Schwierigkeiten bei kleineren Winkeln zu umgehen, setzen wir außerdem voraus, dass die Grundfläche unseres hypothetischen Prismas ebenfalls verspiegelt ist – bestimmte Prismen erfordern tatsächlich verspiegelte Flächen. Der Ablenkungswinkel zwischen eintretendem und austretendem Strahl ist δ = 180◦ − BED .

(5.55)

Von dem Polygon ABED wissen wir α + ADE + BED + ABE = 360◦ . Überdies gilt an den beiden brechenden Flächen ABE = 90◦ + θi1 und ADE = 90◦ + θt2 . Durch Einsetzen von BED in Gleichung (5.55) erhalten wir δ = θi1 + θt2 + α .

(5.56)

Weil Einfalls- und Reflexionswinkel des Strahls im Punkt C gleich sind, ist BCF = DCG. Daher ist BF C = DGC, denn das Prisma ist gleichschenklig, und die

5.5 Prismen

383

Dreiecke F BC und DGC sind ähnlich. Es folgt, dass F BC = CDG ist, und deshalb schließlich, dass θt1 = θi2 ist. Laut snelliusschem Gesetz ist dies gleichbedeutend mit θi1 = θt2 . Für die Ablenkung ergibt sich dann δ = 2θi1 + α ,

(5.57)

was offensichtlich weder von λ noch von n abhängt. Die Reflexion erfolgt völlig farbunabhängig, deshalb nennt man das Prisma achromatisch. Klappen wir das Prisma auf, das heißt, zeichnen wir sein Spiegelbild in der reflektierenden Fläche F G (Abb. 5.70 b, so sehen wir, dass das Prisma äquivalent zu einem Parallelepiped oder einer dicken ebenen Platte ist. Das Spiegelbild des einfallenden Strahls tritt unabhängig von der Wellenlänge parallel zu diesem aus. Aus der Vielzahl der verbreiteten Reflexionsprismen werden einige in den folgenden Abbildungen gezeigt. Man fertigt sie häufig aus den Gläsern BSC-2 oder C-1 an (siehe Tab. 6.2). Zum größten Teil sind die Abbildungen unmittelbar verständlich, deshalb werden wir die Erläuterungen kurz halten. Das rechtwinklige Prisma (Abb. 5.71) lenkt Strahlen, die senkrecht zur Eintrittsfläche einfallen, um 90◦ ab. Beachten Sie, dass die Spitze und das untere Ende des Bildes vertauscht werden – der Pfeil ist umgedreht, während die linke und die rechte Seite erhalten bleiben. Das Prisma wirkt deshalb als umkehrendes System, bei dem sich die obere Fläche wie ein ebener Spiegel verhält. (Um dies zu verstehen, stellen wir uns vor, dass der Pfeil und der „Lolli“ Vektoren sind und bilden das Kreuzprodukt. Der resultierende Vektor Pfeil × Lolli zeigt vor dem Prisma in Ausbreitungsrichtung, hinter dem Prisma aber in die entgegengesetzte Richtung.)

rechtsh.

rechtsh.

linksh.

Abb. 5.71: Das rechtwinklige Prisma.

rechtsh.

Abb. 5.72: Das Porro-Prisma.

Vom Aufbau her gleich ist das Porro-Prisma (Abb. 5.72), das jedoch in einer anderen Orientierung verwendet wird. Nach zwei Reflexionen ist der Strahl um 180◦ abgelenkt.

5 Geometrische Optik

384

Wenn der Strahl rechtshändig in das Prisma eintritt, verlässt er es deshalb auch wieder rechtshändig. Das Dove-Prisma (Abb. 5.73) ist eine abgeschnittene Variante des rechtwinkligen Prismas (um Größe und Gewicht zu verkleinern), das fast ausschließlich in kollimiertem Licht verwendet wird. Es hat die interessante Eigenschaft, das Bild doppelt so schnell zu drehen, wie es selbst um die Längsachse gedreht wird.

rechtsh.

rechtsh. linksh. rechtsh.

Abb. 5.73: Das Dove-Prisma.

Abb. 5.74: Das Amici-Prisma.

Das Amici-Prisma (Abb. 5.74) ist im Wesentlichen ein abgeschnittenes rechtwinkliges Prisma mit einem dachförmigen Teil, der auf die Hypotenusenfläche aufgesetzt wurde. In seiner häufigsten Verwendung hat es den Effekt, das Bild in der Mitte zu spalten und den rechten und linken Teil zu vertauschen.6 Diese Prismen sind sehr teuer, weil der 90◦ -Dachwinkel bis auf drei bis vier Bogensekunden genau sein muss. Anderenfalls ergibt sich ein störendes Doppelbild. Man verwendet diese Prismen oft in einfachen Teleskopsystemen, um die Ablenkung zu korrigieren, die durch die Linsen verursacht wird. Das Rhomboid-Prisma (Abb. 5.75) verschiebt den Sehstrahl, ohne seine Richtung oder die Ausrichtung des Bildes zu verändern.

6

Sie können die Funktionsweise erkennen, indem Sie zwei ebene Spiegel rechtwinklig zueinander aufstellen und direkt in diese Kombination hineinschauen. Zwinkern Sie mit Ihrem rechten Auge, so zwinkert das Spiegelbild ebenfalls mit seinem rechten Auge. Sind Ihre Augen übrigens gleich stark, so sehen Sie zwei Trennlinien (Bilder von der Linie, in der sich die Spiegel treffen), wobei jeweils eine durch die Mitte jedes Auges läuft, mit Ihrer Nase dazwischen. Wenn ein Auge stärker ist, gibt es nur eine Trennlinie durch dieses Auge. Schließen Sie es, so springt die Trennlinie zu dem anderen Auge über. Dies muss man ausprobieren, um es richtig zu verstehen.

5.5 Prismen

385

45◦

rechtsh.

rechtsh. (a)

(b)

Abb. 5.75: Das Rhomboidprisma und sein Spiegeläquivalent.

(a)

(b)

Abb. 5.76: Das Pentaprisma und sein Spiegeläquivalent.

Das Pentaprisma (Abb. 5.76) lenkt den Strahl um 90◦ ab, ohne die Ausrichtung des Bildes zu beeinflussen. Zwei Oberflächen müssen verspiegelt sein. Diese Prismen werden oft als reflektierende Endflächen in kleinen Entfernungsmessern verwendet. Das Leman- oder Sprenger-Prisma (Abb. 5.77) hat auch ein 90◦ -Dach. Hier wird der Sehstrahl verschoben, aber nicht umgelenkt. Das Bild ist jedoch seitenrichtig und um 180◦ gedreht. Das Prisma kann deshalb dafür verwendet werden, Bilder aufzurichten (zum Beispiel in Zielfernrohren). 30◦ rechtsh. rechtsh.

60◦ rechtsh.

Abb. 5.77: Das Leman- oder Sprenger-Prisma.

rechtsh.

Abb. 5.78: Das doppelte Porro-Prisma.

Es gibt sehr viel mehr Reflexionsprismen, die bestimmten Zwecken dienen. Schneidet man beispielsweise einen Würfel so durch, dass das abgeschnittene Stück drei aufeinander senkrecht stehende Flächen besitzt, so entsteht ein Corner-Cube-Prisma. Es hat die Eigenschaft eines Rückstrahlers, d. h., es reflektiert alle ankommenden Strahlen in ihre Ursprungsrichtung zurück. Einhundert dieser Prismen befinden sich 384 000 km von der Erde entfernt in einer 46 cm großen quadratischen Anordnung, die durch die Apollo-11-Mission auf dem Mond aufgestellt wurde.7 7

J. E. Foller und E. J. Wampler, „The Lunar Laser Reflector“, Sci. Am., März 1970, S. 38

5 Geometrische Optik

386

Das häufigste System zur Aufrichtung besteht aus zwei Porro-Prismen (siehe Abb. 5.78). Diese sind relativ einfach herzustellen; die abgerundeten Ecken reduzieren Gewicht und Größe. Da es vier Reflexionen gibt, ist das resultierende Bild seitenrichtig. Oft ist in die Hypotenusenfläche eine schmale Furche eingeschnitten, um Strahlen zu sperren, die bei Glanzwinkeln innen reflektiert werden. Dies löst ein Rätsel, auf das so mancher beim Zerlegen des eigenen Fernglases bereits gestoßen sein wird.

5.6

Faseroptik

Die Technik, Licht in einem langen, schmalen Dielektrikum mittels Totalreflexion zu kanalisieren, ist schon seit einiger Zeit bekannt. John Tyndall zeigte 1870, dass man Licht in einen dünnen Wasserstrahl einschließen und darin entlangführen kann. Bald darauf wurden Glasröhren und später Fäden aus Quarzglas benutzt, um diesen Effekt noch eindrucksvoller zu demonstrieren. Doch erst in den frühen 1950er-Jahren begann man ernsthaft zu versuchen, Bilder mithilfe von Glasfaserbündeln zu übertragen. Nach der Erfindung des Lasers im Jahre 1960 erkannte man, welche Vorteile es haben könnte, Informationen mithilfe von Licht anstatt elektrischem Strom oder Mikrowellen zu transportieren. Mit solchen hohen optischen Frequenzen (in der Größenordnung von 1015 Hz) kann man hunderttausend Mal mehr Informationen übermitteln als mit Mikrowellen. Theoretisch lassen sich so einige zehn Millionen Fernsehprogramme auf einmal mit einem Lichtstrahl übertragen. 1966 konnte man Laser mit Glasfasern koppeln und zur Kommunikation über weite Entfernungen nutzen. Ein beeindruckender technologischer Umbruch, der bis heute anhält, hatte begonnen. Im Jahre 1970 stellten Forscher der Corning-Glaswerke eine Quarzglas-Faser her, in der die Signalintensität nach einem Kilometer durchlaufener Wegstrecke immerhin noch mehr als ein Prozent betrug. Das entspricht einer Abschwächung von 20 dB/km, was mit den Parametern elektrischer Systeme aus Kupferdraht vergleichbar ist. In den nächsten beiden Jahrzehnten wuchs die Transparenz so weit an, dass die Verluste pro Kilometer lediglich noch vier Prozent betrugen, was einer Abschwächung von 0,16 dB/km entspricht. Inzwischen sind Glasfasern zum wichtigsten Kommunikationsmedium geworden: Ihre Übertragungskapazität ist hoch bei kleinen Verlusten, Größe und Gewicht sind gering, sie sind unempfindlich gegenüber elektromagnetischen Störungen, ihre Abhörsicherheit ist unerreicht, und der Rohstoff (gewöhnlicher Sand) ist überall verfügbar. Wenn der Durchmesser solcher Fasern groß gegen die Wellenlänge der Strahlung ist, spielt die Wellennatur der Ausbreitung nur eine untergeordnete Rolle, und die Vorgänge laufen nach den bekannten Gesetzen der geometrischen Optik ab. Liegt dagegen der Durchmesser in der Größenordnung von λ, erinnert die Übertragungsweise an diejenige von Mikrowellen in Wellenleitern. Einige der Ausbreitungsmoden sind in der in Abbildung 5.79 gezeigten fotografischen Mikroskopaufnahme erkennbar, welche

5.6 Faseroptik

387

θi

ni = na

θt nf

±θi L

Abb. 5.79: Muster optischer Wellenleitermoden, die man in den Endflächen von Fasern mit kleinem Durchmesser sieht.

Abb. 5.80: Strahlen, die innerhalb eines dielektrischen Zylinders reflektiert werden.

die Enden von Glasfasern zeigt. Hier muss man die Wellennatur des Lichts berücksichtigen und das Verhalten mit den Methoden der Wellenoptik beschreiben. Obwohl besonders die Dünnschicht-Varianten optischer Wellenleiter von zunehmendem Interesse sind, beschränken wir uns auf die Diskussion von Fasern mit relativ großen Durchmessern in der Größenordnung menschlicher Haare. Wir betrachten den geraden Glaszylinder in Abbildung 5.80, der von einem Medium mit dem Brechungsindex ni umgeben ist, etwa von Luft mit ni = na . Licht, das seine Oberfläche von innen trifft, wird totalreflektiert, vorausgesetzt, der Einfallswinkel ist größer als θc = sin−1 na /nf , wobei nf der Brechungsindex des Zylinders oder der Glasfaser ist. Wie wir noch zeigen werden, könnte ein Meridionalstrahl (ein Strahl, der in einer Ebene mit der optischen Achse liegt) einige tausend Mal pro Meter hin und her reflektiert werden, bis er aus dem Ende der Faser austritt (siehe Foto S. 388). Hat die Faser einen Durchmesser D und eine Länge L, so ist die Weglänge, die der Strahl durchläuft, gleich =

L cos θt

oder mit dem snelliusschen Gesetz  −1/2 .  = nf L n2f − sin2 θi Die Anzahl N der Reflexionen ist dann gegeben durch N=

 ±1 D/ sin θt

5 Geometrische Optik

388

Licht, das aus den Enden eines losen Glasfaserbündels austritt. (Foto E. H.)

oder N=

L sin θi

1/2 ± 1 , D n2f − sin2 θi

(5.58)

aufgerundet auf die nächste ganze Zahl. Das Vorzeichen der 1 hängt davon ab, wo der Strahl die Endfläche trifft und ist vernachlässigbar, wenn N wie in der Praxis groß ist. Wenn daher D = 50 µm (was ungefähr der Dicke eines menschlichen Haares entspricht), nf = 1,6 und θi = 30◦ ist, so beträgt N rund 7000 Reflexionen pro Meter. Glasfasern sind in Durchmessern von ca. 2 µm bis zu etwa 6 mm erhältlich, werden aber selten in Dicken deutlich unter 10 µm verwendet. Äußerst dünne Glas- oder Kunststoffäden sind sehr biegsam und können sogar zu Geweben verarbeitet werden. Die glatte Oberfläche einer einzelnen Faser muss frei von Feuchtigkeit, Staub, Öl usw. gehalten werden, wenn man Lichtverluste durch gestörte Totalreflexion vermeiden will. Wird eine große Anzahl von Fasern dicht zusammengepackt, so kann Licht von einer Faser in eine andere übertreten. Diesen Vorgang nennt man Übersprechen; um ihn zu verhindern, umhüllt man Fasern üblicherweise mit einer transparenten Ummantelung mit einem niedrigeren Brechungsindex. Diese Beschichtung müsste lediglich dick genug sein, um die gewünschte Isolation zu gewährleisten – aus anderen Gründen nimmt sie jedoch ungefähr 1/10 der Querschnittsfläche ein. Obwohl Lichtleiter schon vor hundert Jahren in der Literatur erwähnt wurden, begann das moderne Zeitalter der Faseroptik erst mit der Einführung derartiger ummantelter Fasern im Jahre 1953.

θc

θt nf θi =θmax

nc

ni

Abb. 5.81: Strahlen in einer ummantelten optischen Faser.

5.6 Faseroptik

389

Normalerweise haben die Faserkerne einen Brechungsindex (nc ) von 1,52; verschiedene andere Materialien sind ebenfalls erhältlich. Eine ummantelte Faser ist in Abbildung 5.81 zu sehen. Beachten Sie, dass es einen Maximalwert θmax des Winkels θi gibt, unter dem der innere Strahl im Grenzwinkel θc auf die innere Wand trifft. Strahlen, die unter einem größeren Winkel als θmax in die Faser eintreten, treffen die Innenwand unter einem größeren Winkel als θc und werden deshalb nur teilweise von ihr reflektiert, weshalb sie schnell aus der Faser verschwinden. Dementsprechend definiert θmax , der so genannte Akzeptanzwinkel, den Halbwinkel des Eintrittskegels der Faser. Um ihn zu bestimmen, beginnen wir mit nc = sin (90◦ − θt ) . sin θc = nf Damit ist nc = cos θt nf oder

 1/2 nc = 1 − sin2 θt . nf

Durch Anwendung des snelliusschen Gesetzes und Umformen erhalten wir sin θmax =

1/2 1  2 . nf − n2c ni

(5.59)

Die Größe (ni sin θmax ) ist als numerische Apertur (NA) definiert. Ihr Quadrat ist ein Maß für das Vermögen des Systems, Licht aufzufangen. Der Ausdruck NA kommt aus der Mikroskopie, wo der korrespondierende Term die entsprechenden Fähigkeiten des Objektivs beschreibt. Er sollte fest mit der Lichtstärke des Systems verknüpft sein, und tatsächlich ist 1 . (5.60) f /# = 2 (NA) Deshalb ist für eine Faser 1/2  . NA = n2f − n2c

(5.61)

Die linke Seite von Gleichung (5.59) kann 1 nicht überschreiten. In Luft gilt na = 1,00028 ≈ 1, und folglich ist der Maximalwert von NA gleich 1. In diesem Fall ist der Halbwinkel θmax gleich 90◦ , und die Faser reflektiert das gesamte Licht, das in ihre Vorderseite eintritt, total (Aufgabe 5.93). Im Handel ist eine große Auswahl an Fasern mit numerischen Aperturen von ca. 0,2 bis 1,0 erhältlich.

5 Geometrische Optik

390

Beispiel 5.11 Eine Faser hat einen Kernindex von 1,499 und einen Mantelindex von 1,479. Wenn die Faser von Luft umgeben ist, wie groß ist dann (a) ihr Akzeptanzwinkel, (b) ihre numerische Apertur und (c) der kritische Winkel an der Kern-MantelGrenzfläche? Lösung (b) Gemäß Gleichung (5.61) ist 1/2  1/2  = 1,4992 − 1,4792 = 0,244 . NA = n2f − n2c Dies ist ein typischer Wert. (c) Aus sin θmax = 1/ni ·NA = NA folgt θmax = sin−1 (0,244) = 14,1◦ . Folglich ist 2θmax = 28,2◦ . (a) Der kritische Winkel folgt aus sin θc =

nt nc 1,479 . = = ni nf 1,499

Beachten Sie, dass sin θc gleich oder kleiner 1 sein muss. θc = sin−1 0,9866 = 80,61◦ . Bündel aus freien Fasern, deren Enden zusammengeklebt (beispielsweise mit Epoxid), geschliffen und poliert sind, bilden flexible Lichtleiter. Sind die Fasern nicht regelmäßig angeordnet, erhält man ein Lichtleitkabel. In diesem Kabel könnte beispielsweise die erste Faser in der obersten Reihe der Eintrittsfläche ihren Endpunkt irgendwo im Bündel der Austrittsfläche haben. Diese flexiblen Lichtleitkabel sind aus diesem Grund relativ leicht herzustellen und billig. Sie werden hauptsächlich verwendet, um Licht von einem Ort zum anderen zu leiten. Sind die Fasern im Gegensatz dazu definiert angeordnet, sodass ihre Enden dieselben Positionen in beiden Enden des Bündels einnehmen, so nennt man das Bündel geordnet. Eine solche Anordnung kann Bilder übertragen; man bezeichnet sie deshalb als flexibles Bildleitkabel. Geordnete Bündel stellt man gewöhnlich her, indem man Fasern auf eine Rolle wickelt, wodurch sich Bänder ergeben, die man danach sorgfältig aufeinander schichtet. Legt man das eine Ende eines derartigen Bündels flach auf eine leuchtende Fläche, so erscheint am anderen Ende ein Bild, das Punkt für Punkt wiedergibt, was unter dem erstem Ende liegt (Foto S. 391). Man kann ein solches Bündel mit einer kleinen Linse versehen, sodass das Ende das zu untersuchende Objekt nicht berühren muss. Heute verwendet man faseroptische Geräte, um alle Arten von schwer zugänglichen Stellen untersuchen zu können, von Reaktorkernen und Strahltriebwerken bis hin zu Mägen und Fortpflanzungsorganen. Geräte zur Untersuchung innerer Körperhöhlen

5.6 Faseroptik

391

Ein Bildleitkabel von 10 µm-Glasfasern, das ein Bild überträgt, obwohl es geknotet und scharf geknickt ist. (Foto mit freundlicher Genehmigung der American ACMI Div., American Hospital Supply Corp.)

nennt man Endoskope. Dazu gehören zum Beispiel Bronchoskope, Darmspiegel und Magenspiegel, die in der Regel kürzer als 200 cm sind. Ähnliche Instrumente für industrielle Zwecke sind gewöhnlich zwei- bis dreimal so lang und enthalten oft 5000 bis 50 000 Fasern. Die genaue Zahl hängt von der erforderlichen Bildauflösung und dem zulässigen Außendurchmesser ab. Ein zusätzlich in das Instrument eingebautes Lichtleitkabel sorgt für die Ausleuchtung. Nicht alle faseroptischen Anordnungen sind flexibel. Beispielsweise verwendet man verschmolzene, unbiegsame, geordnete Faserböden oder Mosaiken, um homogenes Flachglas mit geringem Auflösungsvermögen auf Kathodenstrahlröhren, Vidikonen (Bildaufnahmeröhren), Bildverstärkern usw. zu ersetzen. Mosaiken, die aus buchstäblich Millionen von Fasern mit ihren zusammengeschmolzenen Ummantelungen bestehen, haben mechanische Eigenschaften, die denen des homogenen Glases fast gleich sind. Eine Platte verschmolzener konischer Fasern kann ein Bild entweder vergrößern oder verkleinern, abhängig davon, ob das Licht in das kleinere oder das größere Ende der Faser eintritt. Das Komplexauge eines Insekts, etwa einer Stubenfliege, ist im Wesentlichen ein Bündel konischer faseroptischer Fäden. Die Stäbchen und Zapfen der menschlichen Netzhaut können das Licht ebenfalls über die innere Totalreflexion leiten. Eine andere weit verbreitete Anwendung von Mosaiken zur Bildleitung ist die Bildfeldglättungslinse. Liegt das Bild, das durch ein Linsensystem erzeugt wird, auf einer gekrümmten Fläche, will man es oft in eine Ebene transformieren, um es beispielsweise einer Fotoplatte anzupassen. Eine der beiden Flächen des Mosaiks kann so geschliffen und poliert werden, dass sie der Kontur des Bildes folgt, und die andere so, dass sie der des Detektors entspricht. Übrigens gibt es einen natürlich vorkommenden faserigen Kristall, den Ulexit; in polierter Form reagiert er wie ein faseroptisches Mosaik. (Bastelläden verkaufen ihn oft zur Schmuckherstellung.) Falls Sie die Art von Lichtleitung, die wir gerade besprochen haben, noch nie gesehen haben, sollten Sie auf die Kanten eines Stapels Objektträger aus der Mikroskopie

392

5 Geometrische Optik

schauen. Noch besser geeignet sind die viel dünneren (0,18 mm) Deckgläser (siehe Foto).

Ein Stapel mikroskopischer Deckgläser, der durch ein Gummiband zusammengehalten wird, dient als Bildleiter. (Foto E. H.)

Die Faseroptik kennt heute drei Anwendungsgebiete: die direkte Übertragung von Bildern und die Beleuchtung, Wellenleiter für die Kommunikationstechnik sowie neuartige Sensoren. Bilder über eine Entfernung von einigen Metern zu übertragen ist, wie wunderbar und nützlich auch immer, eine relativ einfache Anwendung, die die Möglichkeiten der Faseroptik nicht im Entferntesten ausnutzt. Lichtleiter ersetzen in der Fernmeldetechnik zunehmend Kupferdrähte und Elektrizität. Nach 1970 wurden innerhalb weniger Jahrzehnte weltweit über 100 Millionen Kilometer Glasfaserkabel verlegt. Es wird geschätzt, dass heute täglich Lichtleiter installiert werden, mit denen man die Erde mehrfach umwickeln könnte. Faseroptische Sensoren – Geräte zur Messung von Druck, Schall, Temperatur, Spannung, Strom, Flüssigkeitsständen, elektrischen und magnetischen Feldern, Drehbewegungen usw. – sind modernste Manifestationen der Vielseitigkeit von Glasfasern.

Röntgenaufnahme während einer Inspektion des Darms eines Patienten zur Feststellung von Dickdarmkrebs; man erkennt das Endoskop.

Bemerkenswert detailreiches Bild, wie man es beim Blick durch ein Kolonoskop (Endoskop zur Darmspiegelung) sieht.

5.6 Faseroptik

393

5.6.1 Technologie der Glasfaserübertragung Die hohen Frequenzen des Lichts ermöglichen enorm hohe Datenübertragungskapazitäten. Mit hochentwickelter Technologie kann man erreichen, dass ein Kupfertelefonkabel etwa 25 Telefongespräche gleichzeitig weiterleitet. Dies vergleiche man mit einer Fernsehübertragung, die äquivalent zu etwa 1300 simultanen Telefongesprächen ist, wobei diese wiederum je ca. 2500 Schreibmaschinenseiten pro Sekunde entsprechen. Sicherlich hat es nicht viel Sinn, eine Fernsehübertragung über Telefonleitungen zu versuchen. In der Mitte der 1980er-Jahre war es bereits möglich, mehr als 12 000 Gespräche gleichzeitig über ein einziges Paar Glasfasern zu übertragen – das entspricht mehr als neun Fernsehkanälen. Jede solche Faser hat eine Übertragungsrate von etwa 400 Millionen Bits pro Sekunde (Mbit/s). Dies entspricht 6000 gleichzeitigen Gesprächen. Mit Fasern dieser Art wurden die neuen Langstreckennetze für die Telekommunikation aufgebaut, wobei etwa alle 40 km ein Zwischenverstärker integriert werden musste. In den frühen 1990er-Jahren benutzten Forscher Solitonen – sorgfältig geformte Einzelimpulse – um Übertragungsraten bis etwa 4 Gbit/s zu erreichen. Dies entspricht 70 simultanen Farbfernsehkanälen. Was auf diesem Gebiet in den letzten Jahren erreicht wurde, ist beeindruckend. Das erste transatlantische Glasfaserkabel TAT-8 beispielsweise wurde unter Nutzung ausgefeilter Techniken für die Übertragung von 40 000 Gesprächen über nicht mehr als zwei Glasfaserpaare konstruiert. TAT-1, ein 1956 verlegtes Kupferkabel, konnte nur 51 Gespräche übermitteln, und die letzte der massigen Kupferversionen, TAT-7 (1983), etwa 8000. TAT-8, welches 1988 in Betrieb genommen wurde, arbeitet mit 296 Mbit/s (unter Verwendung von 1300-nm-Singlemode-Fasern, siehe Abb. 5.82 c. Alle 50 oder mehr Kilometer wird das Signal mithilfe von Repeatern oder Regeneratoren aufgefrischt. Dies vergleiche man mit TAT-7, das rund alle 10 Kilometer einen Zwischenverstärker benötigt! Gewöhnliche Kabelsysteme brauchen nach rund einem Kilometer einen Repeater, elektrische Koaxialkabelnetzwerke erweitern die Reichweite auf zwei bis sechs Kilometer, und selbst Richtfunkstrecken benötigen alle 30 bis 50 Kilometer einen Verstärker. Bis zur Mitte der 1990er-Jahre verwendete man als Zwischenverstärker elektrooptische Hybridbauteile. Sie wandelten das abgeschwächte optische Signal in ein elektrisches um, verstärkten es und leiteten es mithilfe von Halbleiterlasern zurück in die Faser. Ein entscheidender Faktor für die Dimensionierung des Abstandes der Zwischenverstärker ist der Energieverlust (Signalabschwächung) bei der Fortpflanzung im Leiter. Das Dezibel (dB) ist die Einheit, die üblicherweise verwendet wird, um das Verhältnis zweier Leistungen anzugeben, etwa der Ausgangsleistung P0 zur Eingangsleistung Pi . Es ist definiert als dB = −10 log (P0 /Pi ), d. h., ein Verhältnis von 1:10 entspricht 10 dB, 1:100 entspricht 20 dB, 1:1000 entspricht 30 dB usw. Die Dämpfung α gibt man gewöhnlich in Dezibel pro Kilometer (dB/km) an. Es ist dann −αL/10 = log (P0 /Pi ),

5 Geometrische Optik

394

wobei L die Faserlänge ist. Bilden wir auf beiden Seiten dieser Gleichung die zehnte Potenz, erhalten wir P0 /Pi = 10−αL/10 .

(5.62)

In der Regel ist eine Verstärkung des Signals notwendig, wenn die Leistung auf einen Faktor von 10−5 gefallen ist. Das optische Glas, das in den 1960er-Jahren für die im Handel erhältlichen Fasern zur Verfügung stand, hat eine Dämpfung von etwa 1000 dB/km: Nachdem das Licht im Material einen Kilometer zurückgelegt hat, ist seine Leistung auf einen Bruchteil von 10−100 zurückgegangen. Man benötigt dann alle 50 m einen Verstärker (was kaum besser ist als die Kommunikation mittels zweier Blechdosen, die mit einem Strick verbunden sind). Bis 1970 hatte man α für Quarzglas (SiO2 ) auf 20 dB/km gesenkt, und 1982 war man bei dem sehr kleinen Wert von 0,16 dB/km angelangt. Diese gewaltige Reduktion der Dämpfung wurde hauptsächlich dadurch erreicht, dass man Verunreinigungen (besonders die Ionen von Eisen, Nickel und Kupfer) weitgehend entfernte und den Anteil der OH-Gruppen verringerte, was größtenteils durch eine sorgfältige Beseitigung aller Spuren von Wasser im Glas bewerkstelligt wurde. Mit den reinsten Fasern kann man heute Signale bis zu 80 km weit übertragen, bevor eine Verstärkung notwendig wird. Um die Jahrtausendwende zeichneten sich zwei wichtige Entwicklungen ab, mit deren Hilfe sich die Datenkapazität optischer Langstreckenkabel drastisch steigern lässt. Bei der ersten handelt es sich um erbiumdotierte Faserverstärker (EDFA), Singlemode-Fasern, deren Kerne in Konzentrationen von 100 bis 1000 ppm mit Ionen des Seltenerdmetalls Erbium dotiert sind. Sie zeichnen sich durch gute Umwandlungseffizienz aus und werden typischerweise mit Diodenlasern mit Ausgangsleistungen um 200 mW gepumpt, entweder bei 980 nm (maximaler Inversionsgrad) oder bei 1480 nm (beste Quanteneffizienz). Die dabei entstehenden angeregten Erbiumatome strahlen ihre Energie in Form induzierter Emission wieder ab (induzierend wirken die Photonen des abgeschwächten Signals), wodurch der Datenstrom an Energie gewinnt. Dieser Vorgang erfolgt auf der gesamten Länge des Verstärkers und kann die Leistung (normalerweise im Milliwattbereich) in einem großen Frequenzband gleichzeitig steigern. Faseroptische Verstärker beseitigten den von den elektronischen Hybridverstärkern verursachten Flaschenhals in der Datenübertragung. Die zweite Entwicklung war ein neues Datenübertragungsverfahren, DWDM (optisches Wellenlängenmultiplex mit hoher Dichte). Mit „Multiplex“ ist gemeint, dass ein einziger Übertragungsweg zur simultanen Übertragung mehrerer Signale (die dabei ihre Individualität behalten) genutzt wird. Heute ist es nicht mehr schwierig, über 160 optische Kanäle mit verschiedenen Signalen gleichzeitig bei unterschiedlichen Frequenzen über eine Faser weiterzuleiten, und in nicht allzu ferner Zukunft werden 1000 Kanäle pro Faser nichts Besonderes mehr sein. Die Daten werden typischerweise mit Geschwindigkeiten von 10 Gb/s oder mehr übertragen, der Frequenzabstand

5.6 Faseroptik

395

der einzelnen Kanäle beträgt 50 bis 100 GHz. Die Hauptübertragungswege der Telekommunikation sind bereits mit DWDM ausgestattet; neueste transatlantische Kabel enthalten vier Faserpaare, die jeweils 48 DWDM-Kanäle übertragen können, in denen die Daten mit einer Geschwindigkeit von 10 Gb/s fließen. Dies entspricht einer Nettokapazität von 4 × 48 × 10 Gb/s = 1,9 Tb/s. Es existieren auch schon kommerzielle Links mit Übertragungsgeschwindigkeiten von 40 Gb/s. Abbildung 5.82 zeigt die drei wichtigsten faseroptischen Strukturen, die man heute für die Telekommunikation nutzt. In (a) ist der Kern relativ dick, und die Brechungsindizes von Kern und Mantel sind jeweils konstant. Dies ist die so genannte Stufenindexfaser, die einen homogenen Kern von 50 bis 150 µm Durchmesser oder größer und eine Ummantelung mit einem äußeren Durchmesser von etwa 100 bis 250 µm besitzt. Dieser älteste Typ wurde in den Systemen der ersten Generation (1975 bis 1980) benutzt. Durch den verhältnismäßig dicken inneren Kern wird die Faser robust und die Lichteinspeisung vereinfacht. Die Faser lässt sich leicht verbinden und trennen, und sie ist am billigsten, allerdings auch – wie wir noch sehen werden – die am wenigsten effiziente, und für lange Reichweiten hat sie einige schwerwiegende Nachteile. Je nach Größe des Eintrittswinkels können Hunderte, sogar Tausende verschiedene Strahlengänge oder Moden existieren, über die sich das Licht den Kern entlang ausbreiten kann (siehe Abb. 5.83). Man hat dann eine Multimode-Faser, in der jede Mode einer etwas anderen Durchlaufzeit entspricht. Eine Faser ist ein optischer Wellenleiter, und die Details, wie „Licht“ durch einen solchen Kanal propagiert, können sehr kompliziert sein (Abb. 5.79). Die verschiedenen Propagationsmuster oder Moden können theoretisch mithilfe der Maxwell-Gleichungen untersucht werden. Ein äußerst nützlicher Parameter, der sich aus einer solchen Analyse ergibt, ist die V-Zahl, definiert durch V-Zahl =

πD NA , λ0

(5.63)

n

(a) n

(b) n

(c)

Abb. 5.82: Die drei wichtigsten faseroptischen Strukturen und die zugehörigen Brechungsindexprofile: (a) Multimode-Stufenindexfaser, (b) Multimode-Gradientenprofilfaser, (c) Singlemode-Stufenindexfaser.

5 Geometrische Optik

396

r Ordnun niedere g Mode axiale Mode M od eh ng öh nu Kern er e rd r O

Mantel

intermodale Dispersion (ns/km)

Abb. 5.83: Intermodale Dispersion in einer Multimode-Stufenindexfaser.

wobei D der Durchmesser des Kerns und λ0 die Vakuumwellenlänge der durchgelassenen Strahlungsenergie ist. Für eine Stufenindexfaser zeigt die genaue theoretische Analyse, dass bei einem Anstieg der V-Zahl über den Wert 2,405 die Anzahl der Moden (Nm ) schnell anwächst, und es gilt dann näherungsweise 1 (5.64) Nm ≈ (V-Zahl)2 . 2 Wenn der Kerndurchmesser der Faser oder der Brechungsindex wächst, dann wächst auch die Anzahl der Moden. Wenn dagegen der Mantelindex oder die Wellenlänge wächst, dann nimmt die Zahl der von der Faser unterstützten Moden ab. In einer Stufenindexfaser konzentriert sich der größte Teil der Energie im Kern, doch ein gewisser Teil dringt in den Mantel ein, wo sich die abklingenden Wellen fortpflanzen. Ein weiterer, häufig verwendeter Parameter ist die fraktionale Brechungsindexdifferenz (nf − nc )/nf . Diese Größe, deren Quadratwurzel proportional zur numerischen Apertur ist, ist klein gegen 1, wenn der Kernindex (oder der Faserindex) nahe am Mantelindex liegt. Diese Bedingung wird Näherung der schwachen Führung genannt; in diesem Fall vereinfacht sich die Analyse erheblich. In der Näherung der schwachen Führung kann es in der Faser einen Satz linear polarisierter (LP) Moden geben, die symmetrisch um die optische Achse verteilt sind. Die einfachste Mode ist LP01 , wobei sich der Index auf die Anzahl der Knoten (Stellen, an denen die Bestrahlungsstärke null ist) bezieht. Der Index 0 bedeutet, dass es keine azimutalen Moden im Strahlquerschnitt gibt. Die 1 besagt, dass es einen einzigen radialen Knoten gibt, der die äußere Grenze des Strahls markiert. Die einfachste Verteilung der Bestrahlungsstärke ist eine Glockenkurve, deren Maximum auf der optischen Achse liegt. Wenn die V-Zahl den Wert 2,405 überschreitet – dies ist die erste Nullstelle der BesselFunktion nullter Ordnung, die Lösung für einen zylindrischen Wellenleiter ist –, dann kann in der Faser neben der LP01 -Mode die nächste Mode, LP11 , existieren. Wenn die V-Zahl den Wert 3,832 überschreitet – die erste Nullstelle der Bessel-Funktion erster Ordnung –, dann können zwei weitere Moden, LP02 und LP21 , aufgenommen werden usw. Für ein Kurzstrecken-Multimode-Telekommunikationskabel kann D = µm und NA = 0,30 sein, und wenn dieses bei 633 nm arbeitet, ist die V-Zahl 148 und die Anzahl der unterstützten Moden ist Nm = 11 × 103 .

5.6 Faseroptik

397

Die Menge der in einer bestimmten Mode transportierten Energie hängt von den Anfangsbedingungen ab. Die Winkelvergrößerung (oder NA) des Eingangsstrahls kann größer sein als die Verbreiterung, die von der Faser akzeptiert wird (d. h. größer als das NA der Faser). Außerdem kann der Durchmesser des Eingangsstrahls größer sein als der Durchmesser des Kerns. In diesem Fall kann ein Teil des Signals nicht in die Faser eintreten, und man spricht dann von Überfüllung. Wenn das Gegenteil der Fall ist und die Faser mehr Licht akzeptieren kann als sie empfängt, liegt Unterfüllung vor. Dies bedeutet in der Regel, dass ein schmaler Kegel von Strahlen in die Faser eintritt und nur Moden von niedriger Ordnung aufgenommen werden. Überfüllung führt dagegen zu stärkerer Dämpfung, da die in steileren Winkeln eintretenden Strahlen häufiger an der Kern-Mantel-Grenze reflektiert werden. Dabei breiten sich abklingende Wellen in den Mantel aus, wodurch es zu Verlusten kommt. In einer Multimode-Faser legen Strahlen mit größerem Eintrittswinkeln längere Wege zurück: Durch die Reflexion von einer Seite zur anderen benötigen sie mehr Zeit, um von einem Ende zum anderen zu gelangen, als Strahlen, die entlang der Achse wandern. Diesen Effekt bezeichnet man etwas salopp als intermodale Dispersion (oft einfach modale Dispersion), obwohl er nichts mit einem frequenzabhängigen Brechungsindex zu tun hat. Die zu übermittelnde Information wird üblicherweise verschlüsselt digitalisiert, bevor sie als Strom von Millionen Impulsen oder Bits pro Sekunde durch die Faser geschickt wird. Die unterschiedlichen Laufzeiten haben den unerwünschten Effekt, dass sie die Form der Lichtimpulse verändern, die das Signal repräsentieren: Ein anfangs scharf begrenzter rechteckiger Impuls kann nach einem Weg von wenigen Kilometern durch die Faser in eine nicht wiederzuerkennende, verschwommene Form „zerlaufen“ sein (Abb. 5.84).

Abb. 5.84: Rechteckige Lichtimpulse, die infolge zunehmender Dispersionsbeiträge ineinander laufen. Man beachte, dass die dicht aneinander liegenden Impulse stärker verwischt werden.

Die gesamte zeitliche Verzögerung zwischen der Ankunft des Axialstrahls und des langsamsten Strahls, welcher den weitesten Weg zurücklegt, beträgt Δt = tmax −tmin . Mit Blick auf Abbildung 5.81 ist die minimale Laufzeit genau die Länge der Faser geteilt durch die Geschwindigkeit des Lichts in der Faser: tmin =

Lnf L L . = = vf c/nf c

(5.65)

5 Geometrische Optik

398

Der außeraxiale Weg , gegeben durch Gleichung (5.58), wird maximal, wenn der Strahl im kritischen Winkel einfällt; dann gilt nc /nf = cos θt . Durch Zusammenfassung der beiden Ausdrücke ergibt sich  = Lnf /nc und damit tmax =

Ln2f Lnf /nc  = = . vf c/nf cnc

(5.66)

Durch Subtraktion der Gleichung (5.65) von Gleichung (5.66) erhalten wir   Lnf nf −1 . Δt = c nc

(5.67)

Nehmen wir zum Beispiel nf = 1,500 und nc = 1,489 an. Die Verzögerung Δt/L beträgt dann 37 ns/km. Anders ausgedrückt wird ein scharf begrenzter Lichtimpuls, der in die Faser eintritt, für jeden in der Faser durchlaufenen Kilometer zeitlich etwa über 37 ns verteilt. Ferner wird das Signal, das sich mit einer Geschwindigkeit vf = c/nf = 2,0 × 108 m/s bewegt, räumlich über eine Länge von 7,4 m/km verstreut. Damit man das zu übertragende Signal noch lesen kann, müssen wir einen räumlichen Abstand zwischen zwei Impulsen fordern, der mindestens zweimal so groß ist wie das auseinandergelaufene Signal (Abb. 5.85). Denken wir an einen Lichtleiter mit einer Länge von 1 km: In diesem Fall sind die Ausgangsimpulse 7,4 m lang. Dies bedeutet, dass die Eingangsimpulse mindestens 14,8 m auseinander liegen müssen und damit um 74 ns getrennt sind. Sie dürfen deshalb nicht öfter als alle 74 ns erfolgen, was eine Rate von 13,5 Millionen Impulsen pro Sekunde ergibt. Auf diese Weise begrenzt die intermodale Dispersion (die in der Regel 15 bis 30 ns/km beträgt) die Frequenz des Eingangssignals – sie schreibt vor, in welcher Geschwindigkeit Informationen durch das System geleitet werden können. Multimode-Stufenindexfasern haben einen großen Kernbereich und werden für Übertragungen mit niedriger Geschwindigkeit über kurze Entfernungen verwendet, insbesondere zur Bild- und Lichtbündelleitung. Als nützlich erweisen sie sich auch bei der Übertragung von Hochleistungs-Laserstrahlen, da hier die Energie über ein relativ großes Volumen verteilt wird und damit Beschädigungen der Faser vermieden werden.

14.8 m

7.4 m (37 ns)

1.0 km

7.4 m 14.8 m

Abb. 5.85: Die Verbreiterung eines Eingangssignals infolge intermodaler Dispersion.

5.6 Faseroptik

399

Beispiel 5.12 Eine Multimode-Stufenindexfaser hat einen Kernradius von 40 µm und eine numerische Apertur von 0,19. Nehmen Sie an, dass die Faser bei einer Vakuumwellenlänge von 1300 nm arbeitet und bestimmen Sie die Anzahl der unterstützten Moden. Lösung Laut Definition ist V-Zahl =

πD NA λ0

und die Anzahl der Moden ist 1 Nm = (V-Zahl)2 . 2 Damit ist V-Zahl =

π2(40 × 10−6 m)0,19 = 36,73 1300 × 10−9 m

und folglich 1 Nm ≈ 36,732 ≈ 674,6 . 2 Man kann die Laufzeitdifferenzen bis auf ein Hundertstel reduzieren, indem man den Brechungsindex des Kerns allmählich nach außen in Richtung des Mantels verringert (siehe Abb. 5.82 b). Die Strahlen wandern dann nicht auf zickzack-, sondern auf spiralförmigen Wegen um die Zentralachse. Da der Brechungsindex in Achsennähe größer ist, werden die Strahlen mit kürzeren Wegen verlangsamt. Strahlen, die sich in der Nähe des Mantels spiralförmig ausbreiten, bewegen sich schneller auf längeren Wegen. Die Folge ist, dass die Strahlen in diesen Multimode-Gradientenprofilfasern beieinander bleiben. Normalerweise hat eine Gradientenprofilfaser einen Kerndurchmesser von etwa 20 bis 90 µm und eine intermodale Dispersion von nur etwa 2 ns/km. Diese Fasern liegen preislich in der Mitte und werden häufig für mittlere Übertragungsentfernungen (zwischen Städten) eingesetzt. Multimode-Fasern mit Kerndurchmessern von 50 µm oder größer sind vergleichsweise billig und werden gewöhnlich für relativ kurze Entfernungen bei kleinen Übertragungsraten verwendet. Häufig speist man sie mit Leuchtdioden (LEDs), welche allerdings in einem ziemlich breiten Frequenzband emittieren. Als Folge davon begrenzt die Materialdispersion oder spektrale Zerlegung (die Abhängigkeit des Brechungsindex der Faser von der Frequenz) die Möglichkeiten dieser Technik. Diese Schwierigkeiten vermeidet man durch die Verwendung monochromatischer Laser-

5 Geometrische Optik

400

strahlen. Alternativ kann man die Fasern mit Wellenlängen um 1,3 µm betreiben, bei denen Quarzglas nur eine geringe Dispersion verursacht (siehe Abb. 3.40 und 3.41). Die letzte und beste Lösung für das Problem der intermodalen Dispersion besteht darin, den Kern so dünn zu halten (Durchmesser unter 10 µm), dass er nur Platz für eine einzige Mode bietet, bei der die Strahlen parallel zur Zentralachse wandern (Abb. 5.82 c). Mit derartigen Singlemode-Fasern aus hochreinem Glas (sowohl Stufenindex- als auch neueren Gradientenprofilfasern) lassen sich die höchsten Leistungen erzielen. Eine Singlemode-Faser ist so ausgelegt, dass nur die Grundmode bei einer bestimmten Wellenlänge durch ihren Kern propagieren kann. Bei einer Stufenindexfaser lässt sich dies erreichen, indem die V-Zahl auf einen kleineren Wert als 2,405 eingestellt wird. (Die entsprechende V-Zahl für eine parabolische Gradientenprofilfaser ist 3,40 und für eine Faser mit näherungsweise triangularem Profil ist sie 4,17.) Bewerkstelligt wird dies, indem man den Faserdurchmesser sehr klein macht (typischerweise 9 µm) und die Differenz zwischen Kern- und Mantelindex reduziert, wodurch die numerische Apertur ebenfalls klein wird. Es gibt dann eine Grenzwellenlänge, die die kleinstmögliche ist, bei der sich nur die Grundmode ausbreiten kann. Die Verwendung einer kleineren Wellenlänge erhöht die V-Zahl und führt zu einer Multimode-Propagation. Die Grenzwellenlänge λc folgt aus Gleichung (5.63) und ist für eine Stufenindexfaser λc =

πD NA . 2,405

(5.68)

Wie wir gesehen haben, ist Bestrahlungsstärke in einer Singlemode-Faser glockenförmig verteilt, wobei das Maximum auf der optischen Achse liegt und die Ausläufer der Kurve deutlich in den Mantel hineinreichen. Mit anderen Worten, der Durchmesser des Modenfeldes (das Doppelte der Entfernung von der optischen Achse bis zu dem Punkt, wo die Bestrahlungsstärke um den Faktor 1/e2 = 0,135 gefallen ist) ist zwischen 10 % und 15 % größer als der Kerndurchmesser. Da der Mantel einen Teil der Strahlungsenergie trägt, geht alles Licht, das die Grenzen des Mantels überschreitet, verloren. Aus diesem Grund ist der Mantel einer Stufenindexfaser gewöhnlich 10-mal so dick wie der Kerndurchmesser. Eine solche Faser kann etwa bei einer Wellenlänge von 1310 nm einen Kerndurchmesser von 8,2 µm und einen Modenfeld-Durchmesser von 9,2 µm haben; bei 1550 nm würde sich der Wert auf vielleicht 10,4 µm erhöhen. Bei Singlemode-Fasern, die typischerweise Kerndurchmesser von nur 2 bis 9 µm (ungefähr 10 Wellenlängen) haben, wird die intermodale Dispersion weitgehend eliminiert. Singlemode-Fasern sind zwar nicht billig und erfordern Laserquellen, aber gespeist mit 1,55 µm sind sie heute die führenden Lichtwellenleiter auf Langstrecken (die Dämpfung beträgt dann etwa 0,2 dB/km, nicht viel mehr als der ideale QuarzglasWert von 0,1 dB/km). Zwei solche Fasern dürften eines Tages unsere Wohnungen mit einem großen Kommunikationsnetz und mit Computeranlagen verbinden, die das Zeitalter des Kupferdrahtes bezaubernd primitiv erscheinen lassen.

5.6 Faseroptik

401

Beispiel 5.13 Eine Singlemode-Stufenindexfaser hat die Brechungsindizes 1,446 und 1,467. Sie soll bei einer Wellenlänge von 1,300 µm verwendet werden. Bestimmen Sie den maximalen Kerndurchmesser. Vergleichen Sie den Durchmesser mit der Wellenlänge. Lösung Die Bedingung für eine Singlemode-Propagation ist 1/2 πD  2 ≤ 2,405 nf − n2c λ0  1/2 1,4672 − 1,4462 ≤ 2,405

V-Zahl =

πD 1300 nm πD(0,06117)1/2 ≤ 3,1265 × 10−6 πD ≤ 1,264 und D ≤ 4,02 µm .

Der Durchmesser beträgt 4,0 µm und die Wellenlänge ist 1,3 µm – die beiden Werte sind also von der gleichen Größenordnung.

Reines geschmolzenes Silicium (Siliciumdioxid, SiO2 ) ist die Grundlage qualitativ hochwertiger, extrem verlustarmer Telekommunikationskabel. Heute werden zu dem Silicium Dotierungen hinzugefügt, um die Charakteristika je nach Bedarf zu ändern. Winzige Mengen von Germaniumdioxid (GeO2 ) oder auch von Phosphorpentoxid (P2 O5 ) erhöhen den Brechungsindex. Fluor (F) dagegen verringert den Brechungsindex, ebenso Bortrioxid (B2 O3 ). Für die in Abbildung 5.82 c gezeigte Faser mit angepasstem Mantel würde man wahrscheinlich einen Mantel aus reinem Silicium verwenden und das Silicium des Kerns mit Germaniumdioxid dotieren, um den Brechungsindex um einen Bruchteil von einem Prozent (gewöhnlich < 0,5 %) zu erhöhen. Abbildung 5.86 zeigt ein ähnliches Design, das als Faser mit abgesenktem Mantel n

8–10 mm

n1 6°

n2 n3 ∼70 mm

Abb. 5.86: Faser mit abgesenktem Mantel.

402

5 Geometrische Optik

bezeichnet wird. Der Kern besteht aus Silicium, das schwach mit Germaniumdioxid dotiert ist, und das Silicium des Mantels ist mit Fluor dotiert, wodurch der Brechungsindex geringer ist. Dieser Bereich mit abgesenktem Brechungsindex ist von einer Hülle aus reinem Silicium umgeben, sodass es eine zweite Grenzfläche gibt. Mikrostrukurierte Fasern In den 1990er-Jahren wurde ein sehr vielversprechender Fasertyp entwickelt, der schnell unter der Bezeichnung löchrige Faser bekannt wurde und allgemeiner auch mikrostrukturierte Faser genannt wird. Heute gibt es diese Materialien in zwei verschiedenen Konfigurationen, die sich hinsichtlich ihrer Funktionsweise und ihrer Verwendung unterscheiden: photonische Kristallfasern mit Hohlkern und photonische Kristallfasern mit Festkern. Diese beiden Typen unterscheiden sich hauptsächlich darin, ob die lichtführende Faser hohl oder massiv ist. Ein Kristall ist eine regelmäßige Anordnung von Atomen, die aufgrund ihrer Periodizität Wellen streuen kann – seien es quantenmechanische Elektronenwellen oder klassische elektromagnetische Wellen –, womit interessante Effekte mit großem Anwendungspotential verbunden sind. Wenn wir die Mechanismen dahinter verstehen, sollten wir in der Lage sein, die Sache zu skalieren und auch makroskopische periodische Anordnungen aus verschiedenen Dielektrika zu konstruieren, die analog dazu in kontrollierbarer Weise langwellige elektromagnetische Wellen streuen. Dies wurde tatsächlich bereits erreicht, und heute arbeiten die Forscher daran, synthetische Strukturen herzustellen, „Kristalle“, die im sichtbaren Bereich des Spektrums arbeiten (und die überhaupt nicht wie natürliche Kristalle aussehen). All diese inhomogenen, mehr oder weniger periodischen dielektrischen Gebilde werden photonische Kristalle genannt. Lord Rayleigh veröffentlichte 1887 einen Artikel mit dem Titel The Propagation of Waves Through a Medium Endowed with a Periodic Structure (dt. Die Propagation von Wellen durch ein mit periodischen Strukturen ausgestattetes Medium), in dem er zeigte, dass in einem mehrschichtigen Medium Wellen mit der richtigen Wellenlänge vollständig in die Richtung zurück reflektiert werden, aus der sie kamen. Es wäre so, als würden sie an eine Art verbotenes Band stoßen, das sie nicht passieren können. Wir wissen heute, dass Elektronenwellen, die sich durch die periodische Struktur eines Halbleiterkristalls bewegen, an jeder atomaren Schicht, auf die sie treffen, partiell gestreut werden. Falls die de-Broglie-Wellenlänge der Elektronen mit dem Gitterabstand der atomaren Anordnung zusammenpasst, kommt es zu konstruktiver Interferenz der reflektierten Elementarwellen, was zur vollständigen Reflexion der Elektronenwellen und zur Auslöschung des durchgelassenen Strahls führt. Diese Art von „Hindernis“ wird Energielücke oder Bandlücke genannt. Mit anderen Worten, man kann die Elektronenwellen in einem Kristall verschiedenen Energiebändern zuordnen, die jeweils durch verbotene Bereiche (Lücken) separiert sind, in denen keine Propagation möglich ist. In einem Festkörper bei niedriger Temperatur haben die Elektronen kleine

5.6 Faseroptik

403

Energien und besetzen das so genannte Valenzband. In Halbleitern und Isolatoren separiert die Bandlücke das Valenzband vom Leitungsband, das energetisch höher liegt. Nur Elektronen, die genug Energie gewinnen, um die Bandlücke zu durchqueren, gelangen in das Leitungsband, wo sie sich frei bewegen können. Entsprechende Bandlücken können auch für elektromagnetische Wellen existieren, die in makroskopischen periodischen dielektrischen Materialien (d. h. in photonischen Kristallen) propagieren. Es ist möglich, dielektrische Strukturen herzustellen, in denen die Transmission von elektromagnetischen Wellen innerhalb eines bestimmten Frequenzbereichs, der photonischen Bandlücke, unterdrückt ist. In diesem Kapitel befassen wir uns hauptsächlich mit Fasern und der Propagation von Licht in deren Längsrichtung. Wir betrachten daher eine Siliciumfaser (siehe Foto) mit einer regelmäßigen Anordnung von zylindrischen Löchern mit winzigem Durchmesser, die in Längsrichtung der Faser verlaufen und eine ausgedehnte zweidimensionale Bandlückenstruktur bilden. Die winzigen Löcher clustern sich um ein zentrales Loch, das gewöhnlich etwas größer ist als die anderen. Diese Anordnung ist eine photonische Hohlkernfaser.

Eine Hohlkernfaser mit photonischer Bandlücke. (Tim Berks, University of Bath)

Der Fasermantel, bei dem es sich um ein dielektrisches Glas-Luft-Glas-Luft-Array handelt, streut Strahlungsenergie und erzeugt so eine Bandlücke, die die Vorwärtspropagation eines bestimmten Frequenzbereichs blockiert. Die Idee besteht nun darin, den Mantel so zu konstruieren, dass er eine Bandlücke im interessierenden Frequenzbereich hat, und auf diese Weise das Licht in der Faser „einzufangen“. Der Mantel blockiert alle Wellenlängen bis auf ein schmales Band und zwängt den Strahl in den hohlen (luftgefüllten) Kern, der einen Durchmesser von nur 15 µm haben kann. Der Kern ist eine Art „Defekt“ in dem photonischen Kristallgitter, und es können beachtliche 99,5 % des Lichts in ihm eingeschlossen sein. Mit anderen Worten, wenn eine photonische Bandlücke im sichtbaren Bereich des Spektrums erzeugt würde, wäre der Kristall offensichtlich nicht geeignet für das Leiten von Licht. Durch das Einführen eines „Defekts“ bricht der Kern (ob gefüllt oder hohl) die Symmetrie. Der Kern fungiert dann als Wellenleiter für diejenigen Frequenzen, die vom Mantel abgestoßen

404

5 Geometrische Optik

werden. Alle anderen Wellenlängen, die in den Hohlkern eintreten können, werden schnell abgeleitet, weil der Mantel, obwohl er voller Löcher ist, einen höheren mittleren Brechungsindex hat als Luft. Eine solche Faser kann so konstruiert werden, dass sie einen Strahl mit einer Bandbreite von vielleicht 200 nm bei etwa 1550 nm entlang des Kerns leitet. Da sie einen hohlen, luftgefüllten, zentralen Kanal hat, trägt eine photonische Kristallfaser mehr Energie als eine konventionelle Glasfaser. Das bedeutet natürlich, dass solche Fasern ein wesentlich größeres Potential haben, was die Datenkapazität betrifft, die vielleicht mehr als hundertmal so groß sein könnte. In einer konventionellen, hochreinen Stufenindex-Glasfaser gibt es ein gewisses Maß an Absorption und Streuung von Licht, wodurch sich Signale abschwächen, während sie über große Entfernungen übertragen werden. Außerdem werden die Signalpulse aufgrund der Dispersion im Glas im Verlaufe ihrer Propagation immer breiter, laufen ineinander und verschmieren. Dies limitiert den Bereich, über den sich dicht gepackte Daten erfolgreich übertragen lassen. Im Gegensatz dazu kann bei einer photonischen Kristallfaser mit Luftkern sowohl die Absorption als auch die Dispersion im Wesentlichen vernachlässigt werden. Ein anderer problematischer Effekt tritt auf, wenn sich „Licht“ sehr weit durch ein Medium wie Glas fortpflanzt, das eine gewisse Nichtlinearität aufweist. Diese Effekte treten nicht auf, wenn „Licht“ in der Luft des Hohlkerns propagiert. Stellen wir uns nun eine photonische Kristallfaser mit einem kleinen Kern vor, einem Kern also, der wieder aus einem schmalen Glaszylinder besteht, in dem sich eine reguläre Anordnung von dicht benachbarten, winzigen, parallel zur Faserachse verlaufenden Löchern befindet, die sich über die gesamte Länge der Faser erstrecken. Diesmal ist der zentrale Kern jedoch aus Glas (siehe Foto). Die erste erfolgreiche Faser dieser Art wurde 1996 vorgestellt, und sie hatte die bemerkenswerte Eigenschaft, dass sie für alle Wellenlängen nur die Grundmode unterstützte. Der bienenkorbartige Mantel gestattete es, alle Moden höherer Ordnung nach außen abzuleiten. Mit anderen Worten, photonische Kristallfasern mit Festkern können so konstruiert werden, dass sie „endlos“ im Singlemode arbeiten, insofern als sie keine Grenzwellenlänge λc ha-

Eine photonische Singlemode-Kristallfaser mit Festkern. (Tim Berks, University of Bath)

5.6 Faseroptik

405

ben [Gl. (5.68)]. Das heißt, es gibt keine minimale Wellenlänge, unterhalb der es zur Transmission einer zweiten oder höheren Mode kommt. Das liegt daran, dass der mittlere Brechungsindex des Mantels mit der Frequenz des „Lichtes“ zunimmt. Endloser Singlemode-Betrieb tritt auf, weil die Stufe im Brechungsindex zwischen Kern und Mantel mit der Wellenlänge abnimmt. Dies führt zur Verringerung der numerischen Apertur und folglich zu einer proportionalen Abnahme der Grenzwellenlänge. Obwohl die periodische mikrostrukturelle Variation der Dielektrizitätskonstante einer photonischen Kristallfaser mit Festkern das Licht im Inneren auf komplexe Weise streut, kann ihr Funktionsprinzip vereinfacht als eine modifizierte Form der Totalreflexion betrachtet werden. Hier hat der Mantel einen mittleren Brechungsindex, der aufgrund des vorhandenen Gitters aus Löchern effektiv gegenüber dem des Siliciummediums, und damit dem des Kerns, verringert ist. Eine der wichtigsten Eigenschaften von mikrostrukturierten Festkernfasern resultiert aus ihrer Fähigkeit, nützliche Dispersionscharakteristika zu konstruieren, die sich stark von denen des transparenten Festkörpers unterscheiden, aus denen sie gemacht sind. Heute werden komplexe Strukturen mit Löchern unterschiedlicher Größen und Formen in einer Vielzahl von Mustern (symmetrische wie asymmetrische) in speziellen Designs photonischer Kristallfasern ausgenutzt. In Anbetracht ihrer Fähigkeit zum endlosen Singlemode-Betrieb, ihres großen Modenfeld-Durchmessers und ihrer geringen Ablenkungsverluste sind mikrostrukturierte Festkernfasern äußerst vielversprechend für die Breitbandübertragung. Mikrostrukurierte Fasern werden konstruiert, indem man zunächst einen Stapel aus mehreren hundert Siliciumstäben und dünnwandige Röhren zusammenfügt. Ein solches Bündel, das vielleicht einen Meter lang und 2 bis 4 cm dick ist, wird Preform genannt. Die Preform wird auf etwa 180◦ C erwärmt und gezogen, bis sie einen Durchmesser von 2 bis 4 mm hat. Der so entstandene Glasschaft wird in einem Schlauch (der Siliciumröhre) platziert, und dann wird dieser Verbund noch einmal erwärmt und auf einen Durchmesser von 125 µm gezogen. Optische Schalter Die Übertragung im Internet erfordert die schnelle Umleitung großer Datenmengen von einem faseroptischen Übertragungsweg zu einem anderen. Gegen Ende des 20. Jahrhunderts verwendete man hierzu so genannte Hubs, die Lichtpulse in elektrische Signale umwandelten, welche sich dann mit elektronischen Schaltern steuern ließen. Anschließend mussten die elektrischen Signale zurück in Lichtpulse konvertiert und wieder auf die Reise geschickt werden. Elektronische Schalter sind jedoch verhältnismäßig voluminös, teuer und außerdem langsam – ungeeignet also für die Anforderungen der Zukunft. Bis vor kurzem bestand wenig Hoffnung, diesen elektronischen Flaschenhals in absehbarer Zeit erweitern zu können. Dramatisch änderte sich die Situation um den Jahrtausendwechsel mit der Einführung photonischer Schaltelemente.

5 Geometrische Optik

406

Abbildung 5.87 zeigt einen Schalter auf der Basis von MOEMS (mikrooptoelektromechanischen Systemen), die Sie aus Abschnitt 5.4.1 bereits kennen. Auf den Stirnseiten Hunderter ankommender und auslaufender Glasfasern werden winzige Linsen angebracht (oben im Bild). Ein Lichtpuls tritt, von oben kommend, aus einer solchen Linse aus, trifft auf einen elektronisch verstellbaren Mikrospiegel (mit einem Durchmesser von nur 0,5 mm), prallt an einem großen Reflektor ab, trifft auf einen zweiten steuerbaren Spiegel und wird von diesem in die gewünschte Ausgangsfaser reflektiert. Alle Einstellungen lassen sich innerhalb von Millisekunden verändern. MOEMSSchalter werden bereits zur Steuerung des Datenverkehrs in Netzwerken eingesetzt. Wahrscheinlich dauert es nicht mehr lange, bis sich mithilfe solcher optischen Elemente Petabit-pro-Sekunde-Telekommunikationssysteme (Pb/s, peta: 1015 ) verwirklichen lassen. Dann ist der Weg frei für das weltweite volloptische Telefon-Fernseh-InternetNetz, das mit Geschwindigkeiten arbeiten wird, die heute noch unvorstellbar sind. EinmodenGlasfaser Reflector

Linsen

Mikrospiegel

Abb. 5.87: (a) Optischer Schalter. Winzige, verstellbare Spiegel lenken die Lichtpulse von Glasfaser zu Glasfaser um. (b) Eine Anordnung schwenkbarer Mikrospiegel. (Foto mit frdl. Genehmigung der Bell Laboratories, Lucent Technologies.)

Kapillaroptik Das Prinzip der Faseroptik besteht darin, dass Strahlungsenergie einer relativ niedrigen Frequenz wie sichtbares Licht oder IR-Strahlung an einem Übergang zwischen Materialien mit hohem und niedrigem Brechungsindex in einem schmalen festen Wellenleiter totalreflektiert wird. Analog dazu kann hochfrequente elektromagnetische Strahlung (insbesondere Röntgenstrahlen) an einem Luft/Glas-Übergang (statt eines Glas/Luft-Übergangs) totalreflektiert werden. Der kritische Winkel, der von der Oberfläche aus gemessen wird, beträgt typischerweise nur etwa 0,2◦ für Röntgenstrahlen einer Energie von 10 keV (λ ≈ 0, 12 nm). Abbildung 5.88 zeigt, wie ein Strahl der Biegung einer hohlen Kapillare mittels streifender Reflexion an der inneren Luft/Glas-Grenzfläche folgt. Die Richtung von Röntgenstrahlen zu ändern ist sonst eine schwierige Aufgabe.

5.7 Optische Systeme

407

Abb. 5.88: Vielfache streifende Reflexion von Röntgenstrahlen innerhalb einer hohlen Glasfaser.

Es lassen sich Glasfäden mit einem Durchmesser von 300 bis 600 µm herstellen, die Tausende feine Kapillarkanäle von 3 bis 50 µm Durchmesser enthalten. Tausende solcher Fäden (Abb. 5.89) wiederum werden in gebündelter Form dazu benutzt, Röntgenstrahlen auf bequeme Weise zu fokussieren oder zu kollimieren, was ansonsten unmöglich ist.

(a)

(b)

Rasterelektronenmikroskopische Aufnahme eines Bündels aus Hunderten Kapillaren. (Mit frdl. Genehmigung von X-Ray Optical Systems, Inc. Albany, NY, USA.)

5.7

Abb. 5.89: Ein Bündel multikapillarer Fäden dient dazu, Röntgenstrahlen (a) zu fokussieren oder (b) zu kollimieren.

Optische Systeme

Wir haben jetzt die Theorie der paraxialen Strahlen so weit entwickelt, dass wir die meisten optischen Systeme im Prinzip verstehen können. Selbstverständlich sind die Feinheiten, die die Beherrschung der Aberrationen erfordert, extrem wichtig und noch jenseits unserer Diskussion. Trotzdem könnte man beispielsweise ein Fernrohr (zugegebenermaßen kein besonders gutes) unter Anwendung der Ergebnisse der Theorie erster Ordnung bauen. Gibt es einen besseren Ausgangspunkt für die Behandlung optischer Geräte als das verbreitetste „Instrument“, das Auge?

5 Geometrische Optik

408

5.7.1 Das Auge Wir können für unsere Zwecke drei Gruppen von Augen unterscheiden: jene, die Strahlungsenergie sammeln und Bilder mittels eines einzigen zentrierten Linsensystems erzeugen; jene, die eine Facettenanordnung aus vielen winzigen Linsen benutzen (die optischen Fasern ähnliche Kanäle speisen), und die elementarsten Augen, die einfach mit einem kleinen Loch ohne Linse funktionieren (siehe Abb. 5.112). Neben den lichtempfindlichen Augen gibt es „Augen“ wie die der Klapperschlange, die auf Temperaturreize reagieren (Infrarot-Detektoren). Diese so genannten Gruben kann man der letztgenannten Gruppe zuordnen. Linsensysteme zum Sehen haben sich in mindestens drei verschiedenen Arten von Organismen unabhängig voneinander entwickelt. Einige höherentwickelte Weichtiere (zum Beispiel der Oktopus), bestimmte Spinnen (zum Beispiel die Vogelspinne) und selbstverständlich die Wirbeltiere (darunter der Mensch) besitzen Augen, die jeweils ein einziges zusammenhängendes reelles Bild auf einem lichtempfindlichen Schirm oder einer Netzhaut erzeugen. Gliederfüßer, deren Körperteile und Gliedmaßen durch Gelenke miteinander verbunden sind (Insekten, Krebse), haben Facettenaugen (Abb. 5.90). Sie erzeugen ein mosaikförmiges Bild, das aus vielen kleinen Bildfeldern zusammengesetzt ist, wobei jedes Bildfeld von jeweils einem winzigen Abschnitt des Auges stammt (als sähe man die Welt durch ein dicht gepacktes Bündel äußerst feiner Röhren). Wie sich ein Fernsehbild aus Punkten unterschiedlicher Intensität zusammensetzt, so teilt das Facettenauge die betrachtete Umgebung in kleine Ausschnitte auf und digitalisiert sie gewissermaßen. Es gibt hier kein reelles Bild, das auf einer Netzhaut erzeugt wird; die Synthese des Bildes findet elektrisch im Nervensystem statt. Linse

vom Facettenauge gesehen

Kristallzapfen Pigmentzellen der Regenbogenhaut Rhabdom Netzhautzellen

Linse

Netzhaut

Pigmentzellen

Nervenbahnen zum Gehirn (a)

Nervenfasern (b)

vom menschlichen Auge gesehen (c)

Abb. 5.90: (a) Das Facettenauge, das sich aus vielen Ommatidien zusammensetzt. (b) Ein Ommatidium (Einzelelement des Facettenauges der Insekten), das kleine einzelne Auge, das jeweils einen kleinen Bereich in einer bestimmten Richtung „sieht“. Die Hornhautlinse und der Kristallzapfen leiten das Licht in das Sinnesorgan, das durchsichtige, stäbchenförmige Rhabdom. Jedes Rhabdom ist von Netzhautzellen umgeben, die über Nervenfasern zum Gehirn führen. (c) Eine Blume, wie sie von einem menschlichen Auge und einem Facettenauge gesehen wird. (Ackerman and Ellis, Biophysical Science, 2nd Ed., 1979, p. 31, Pearson Education)

5.7 Optische Systeme

409

Das Auge der Pferdebremse hat über 7000 derartige Einzelelemente, und die räuberische Libelle, ein besonders geschickter Flieger, hat mit 30 000 Elementen ein noch besseres Sehvermögen. Im Vergleich dazu müssen einige Ameisenarten mit nur etwa 50 Elementen auskommen. Je mehr Einzelelemente vorhanden sind und je besser die Auflösung ist, desto schärfer ist das zusammengesetzte Bild. Die ältesten Arten mit Augen von diesem Typ dürften die Trilobiten sein, kleine Seetiere, die vor 500 Millionen Jahren lebten und gut entwickelte Facettenaugen hatten. Bemerkenswerterweise ist die Chemie des Mechanismus der Bildwahrnehmung, wie verschieden auch immer die Optik arbeitet, bei allen Tieren der Erde ziemlich ähnlich. Die Struktur des menschlichen Auges Man kann sich das menschliche Auge als ein System mit einer Bikonvexlinse vorstellen, das ein reelles Bild auf eine lichtempfindliche Fläche wirft. Dieses Prinzip wurde 1604 von Kepler vorgeschlagen, der schrieb: „Ich behaupte, dass der Sehvorgang dann stattfindet, wenn das Bild der ... äußeren Welt ... auf die konkave Netzhaut ... projiziert wird.“ Diese Ansicht wurde aber erst allgemein akzeptiert, nachdem 1625 der deutsche Jesuit Christopher Scheiner (und unabhängig davon etwa fünf Jahre später Descartes) ein interessantes Experiment durchführte. Scheiner entfernte den Überzug auf der Rückseite des Augapfels eines Tiers und konnte durch die fast transparente Netzhaut hindurch ein verkleinertes Bild der Umgebung des Auges erkennen. Zwar ähnelt das Auge einer einfachen Kamera (Abschn. 5.3.3), das Sehen (zu dessen System das Auge, der Sehnerv und ein sensorisches Feld gehören) funktioniert jedoch eher wie eine computergesteuerte Fernsehkamera.

Hornhaut

Kammerwasser Pupille Regenbogenhaut (Iris)

Bindehäute

Linse

Lederhaut Glaskörper Aderhaut

blinder Fleck

Netzhaut Zentralgrube

Ziliarmuskel

Linse

Aderhaut Sehnerv

Augenachse optische Achse

Abb. 5.91: Das menschliche Auge.

Lederhaut RegenbogenHornhaut haut (Iris)

410

5 Geometrische Optik

Das Auge (Abb. 5.91) ist eine fast kugelförmige (24 mm tiefe und etwa 22 mm breite) gallertartige Masse, die in eine widerstandsfähige Hülle, die Lederhaut, eingebettet ist. Bis auf den vorderen Teil, die transparente Hornhaut, ist die Lederhaut weiß und lichtundurchlässig. Etwas aus dem Kugelkörper heraustretend, bildet die gekrümmte Fläche der Hornhaut (die leicht abgeflacht ist, wodurch die sphärische Aberration verringert wird) das erste und stärkste Konvexelement des Linsensystems. Der größte Teil der Ablenkung findet an der Grenzfläche zwischen Luft und Hornhaut statt. Dass man unter Wasser nicht sehr gut sehen kann, liegt übrigens unter anderem daran, dass dessen Brechungsindex zu nah an demjenigen der Hornhaut (nc ≈ 1,376) liegt und deshalb die Brechung zu gering ist. Das Licht, das die Hornhaut durchquert hat, läuft durch eine mit einer klaren wässrigen Flüssigkeit gefüllte Kammer, das Kammerwasser (nah ≈ 1,336). Ein Strahl, der an der Luft/Hornhaut-Grenzfläche stark zur optischen Achse hin gebrochen wurde, erfährt an der Hornhaut/Kammerwasser-Grenzfläche nur eine leichte Ablenkung, da beide Brechungsindizes ähnlich sind. Im Kammerwasser befindet sich eine Blende, die Regenbogenhaut (griechisch Iris = Regenbogen). Sie dient als Aperturblende zur Steuerung der Lichtmenge, die durch das Loch oder die Pupille in das Auge eintritt, und verleiht dem Auge seine charakteristische blaue, braune, graue, grüne oder schwarzbraune Farbe. Die Regenbogenhaut, die aus ringförmigen und radialen Muskeln zusammengesetzt ist, kann sich erweitern oder zusammenziehen, sodass sich der Pupillendurchmesser in einem Bereich zwischen etwa 2 mm bei hellem Licht und etwa 8 mm bei Dunkelheit verändert. Zusätzlich zu dieser Funktion spielt die Regenbogenhaut eine Rolle bei der Scharfeinstellung: Wird ein sehr nahes Objekt fokussiert, zieht sie sich zusammen, um die Bildschärfe zu verbessern. Direkt hinter der Regenbogenhaut befindet sich die Linse. Die ältere Bezeichnung Kristalllinse geht auf die Arbeit von Abû-Alî al-Hasan ibn al-Haitham, genannt Alhazen von Kairo (ca. 1000 n. Chr.), zurück, der das Auge als in drei Bereiche aufgeteilt beschrieb, die wässrig, kristallin bzw. glasig seien. Die Linse, die etwa die Größe und die Form einer kleinen Bohne hat (9 mm lang und 4 mm dick), besteht aus einer kompliziert geschichteten faserigen Masse, die von einem elastischen Häutchen umgeben ist. Ihre Struktur gleicht ein wenig einer durchsichtigen Zwiebel, die sich aus 22 000 sehr dünnen Schichten zusammensetzt. Sie hat zusätzlich zu der Tatsache, dass sie ununterbrochen wächst, einige bemerkenswerte Eigenschaften, die sie von den heute verwendeten künstlichen Linsen unterscheidet. Ihre Laminarstruktur bewirkt, dass die Strahlen aus winzigen diskontinuierlichen Abschnitten zusammengesetzte Wege durchlaufen. Die Linse ist als Ganzes verformbar, diese Eigenschaft lässt aber im Alter nach. Ihr Brechungsindex variiert außerdem von etwa 1,406 im Kern bis näherungsweise 1,386 an der weniger dichten Rinde, sodass sie ein GRINSystem darstellt (siehe Abschnitt 6.4). Die Kristalllinse nimmt die notwendigen Feineinstellungen durch Veränderungen ihrer Form vor, d. h., sie hat eine variable Brennweite – ein Merkmal, auf das wir bald zurückkommen werden.

5.7 Optische Systeme

411

Man kann die brechenden Teile des Auges, die Hornhaut und die Linse, als ein aus zwei Elementen bestehendes Linsensystem betrachten, das etwa 15,6 mm vor der Hornhaut einen Objektbrennpunkt und etwa 24,3 mm dahinter einen Bildbrennpunkt auf der Netzhaut besitzt. Um die Dinge ein wenig zu vereinfachen, nehmen wir an, dass das zusammengesetzte Linsensystem seinen optischen Mittelpunkt 17,1 mm vor der Netzhaut, also genau auf dem hinteren Rand der Kristalllinse hat. Hinter der Linse befindet sich eine weitere Kammer, gefüllt mit einer durchsichtigen, gallertartigen Substanz – der Glaskörper (nvh ≈ 1,337). Der Glaskörper enthält frei umherschwimmende mikroskopisch kleine Zell- oder Gewebebestandteile. Deren Schatten, von Beugungsringen umgeben, kann man leicht innerhalb der eigenen Augen sehen, wenn man gegen eine Lichtquelle blinzelt oder durch ein winziges Loch gegen den Himmel blickt – seltsame kleine amöbenähnliche Objekte (muscae volitantes) schwimmen dann durch das Blickfeld. Eine merkliche Zunahme in der Wahrnehmung dieser schwimmenden Objekte deutet auf eine mögliche Netzhautablösung hin. Wenn Sie gerade Ihre Augen untersuchen, sollten Sie nochmals gegen das Licht blinzeln (z. B. gegen das diffuse Licht einer großen Leuchtstoffröhre). Schließen Sie Ihre Augenlider fast vollständig, so können Sie tatsächlich den nahen kreisförmigen Rand Ihrer eigenen Pupille erkennen, jenseits dessen der grelle Schein des Lichts nicht zu sehen ist. Wenn Sie es nicht glauben, verdecken Sie das Licht teilweise und decken es wieder auf – der leuchtende Kreis weitet sich sichtlich bzw. zieht sich zusammen. Sie sehen den Schatten, den die Regenbogenhaut wirft, von innen! Das Sehen innerer Objekte, wie beispielsweise in diesem Fall, nennt man entoptische Wahrnehmung. In der widerstandsfähigen, verhärteten Wand befindet sich eine innere Hülle, die Aderhaut. Sie ist eine dunkle Schicht, gut versorgt mit Blutgefäßen und reich pigmentiert mit Melanin. Die Aderhaut absorbiert Streulicht wie die schwarze Beschichtung im Inneren einer Kamera. Eine etwa 0,1 mm bis 0,5 mm starke Schicht aus Lichtrezeptoren bedeckt einen großen Teil der inneren Aderhautoberfläche – dies ist die Netzhaut oder Retina. Der fokussierte Lichtstrahl wird über elektrochemische Reaktionen in dieser rötlichen mehrschichtigen Struktur absorbiert. Das menschliche Auge enthält zwei Arten von Lichtrezeptoren, die Stäbchen und die Zapfen. Etwa 125 Millionen dieser Sinneszellen sind ungleichmäßig über die Netzhaut verteilt. Das Ensemble der Stäbchen hat in mancher Beziehung die Eigenschaften eines hochempfindlichen grobkörnigen Schwarzweißfilms. Es ist äußerst lichtempfindlich und kann Licht wahrnehmen, das für die Zapfen zu schwach ist. Farben kann es jedoch nicht unterscheiden, und die Bilder, die es überträgt, sind nicht besonders gut aufgelöst. Im Unterschied dazu kann man sich das Ensemble von 6 oder 7 Millionen Zapfen als darübergelegten, niedrig empfindlichen, feinkörnigen Farbfilm vorstellen. In hellem Licht liefert es detaillierte farbige Bilder, geringen Lichtmengen gegenüber ist es aber unempfindlich. Der normale Empfindlichkeitsbereich des menschlichen Auges liegt ungefähr zwischen 390 und 780 nm (Tabelle 3.4). Jedoch haben Studien diese Grenzen nach unten

5 Geometrische Optik

412

Eine elektronenmikroskopische Aufnahme der Netzhaut eines Salamanders (Necturus maculosus). Zwei Zapfen erscheinen im Vordergrund und einige Stäbchen hinter ihnen. Foto von E. R. Lewis, Y. Y. Zeevi und F. S. Werblin, Brain Research 15, 559 (1969).

bis etwa 310 nm im Ultravioletten und nach oben bis etwa 1050 nm im Infraroten erweitert – tatsächlich haben Menschen berichtet, dass sie Röntgenstrahlen „sehen“. Die begrenzte Durchlässigkeit des Auges für ultraviolettes Licht ist durch die Kristalllinse bedingt, die im UV-Bereich absorbiert. Menschen, denen eine Linse chirurgisch entfernt worden ist, haben eine stark erhöhte UV-Empfindlichkeit.

Hochauflösende Aufnahme einer lebenden menschlichen Netzhaut. Die hellen Flecken sind die Zapfen, die jeweils einen Durchmesser von 4,9 µm haben. (Austin Roorda und David R. Williams, University of Rochester, New York)

Die Stelle, an der der Sehnerv aus dem Auge austritt, enthält keine Lichtrezeptoren und wird deshalb als blinder Fleck bezeichnet (siehe Abb. 5.92). Der Sehnerv breitet sich über die Rückseite des Augeninneren in Form der Netzhaut aus. Etwa im Mittelpunkt der Netzhaut befindet sich eine kleine Vertiefung mit einem Durchmesser von 2,5 bis 3 mm, die man den gelben Fleck (macula lutea) nennt. In seinem Mittelpunkt ist eine winzige stäbchenfreie Zone, die Zentralgrube mit

X

1

2

Abb. 5.92: Um die Existenz des blinden Flecks nachzuweisen, schließe man das linke Auge und schaue direkt auf das X, das sich in etwa 25 cm Entfernung befindet – die 2 verschwindet. Geht man näher heran, so erscheint die 2 wieder, während die 1 verschwindet.

5.7 Optische Systeme

413

einem Durchmesser von 0,3 mm. (Zum Vergleich: Der Durchmesser des Bildes des Vollmonds auf der Netzhaut beträgt etwa 0,2 mm – siehe Aufgabe 5.101.) Hier sind die Zapfen dünner (mit Durchmessern zwischen 0,003 und 0,0015 mm) und dichter zusammengedrängt als an den anderen Stellen der Netzhaut. Dieser Bereich liefert die schärfsten und detailreichsten Informationen. Damit das Licht, das von der Objektfläche des primären Interesses kommt, auf die Zentralgrube fällt, bewegt sich der Augapfel ständig. Das Bild wird durch diese normalen Augenbewegungen fortwährend über verschiedene Lichtrezeptoren bewegt. Werden diese Bewegungen eingestellt, sodass das Bild dauernd auf der Netzhaut ruht, verschwindet die Wahrnehmung allmählich. Ohne die Zentralgrube würde das Auge 90 bis 95 % seiner Sehfähigkeit einbüßen. Die Komplexität des Wahrnehmungssystems zeigt sich auch in der Tatsache, dass rund 100 Stäbchen mit jeder Nervenfaser verbunden sind und jedes einzelne dieser Stäbchen die Faser aktivieren kann. Im Gegensatz dazu sind die Zapfen in der Zentralgrube einzeln mit den Nervenfasern verknüpft. Die eigentliche Wahrnehmung der Umgebung wird durch das Auge-Hirn-System in einer ununterbrochenen Analyse des zeitlich veränderlichen Netzhautbildes konstruiert. Man bedenke nur, wie wenig Schwierigkeiten der blinde Fleck selbst dann bereitet, wenn ein Auge geschlossen ist. Zwischen der Nervenfaserschicht der Netzhaut und dem Glaskörper befindet sich ein Netz aus großen Blutgefäßen, das entoptisch beobachtet werden kann: Schließen Sie die Augen, und halten Sie eine kleine helle Lichtquelle vor das Lid. Sie sehen ein Schattenmuster (Purkinjesche Aderfiguren), das von den Blutgefäßen auf die lichtempfindliche Netzhautschicht fällt. Akkommodation Die Feineinstellung oder Akkommodation des menschlichen Auges wird von der Kristalllinse ausgeführt. Diese wird durch Ligamente, die mit den Ziliarmuskeln verbunden sind, hinter der Regenbogenhaut in der richtigen Position gehalten. Normalerweise sind diese Muskeln entspannt, und in dieser Stellung ziehen sie das Netz von feinen Fasern, das den Rand der Linse hält, nach außen. Dadurch wird die Linse ziemlich flach, und ihr Radius sowie ihre Brennweite vergrößern sich (Gl. 5.16). Sind die Muskeln vollkommen entspannt, so wird das Licht, das von einem unendlich weit entfernten Objekt kommt, auf der Netzhaut fokussiert (Abb. 5.93). Während sich das Objekt dem Auge nähert, ziehen sich die Ziliarmuskeln zusammen und lockern so die äußere Spannung, die auf den Rand der Linse wirkt, welche sich dann unter ihren eigenen elastischen Kräften leicht wölbt. Dabei nimmt die Brennweite ab, sodass a konstant bleibt. Kommt das Objekt noch näher, werden die Ziliarmuskeln straffer zusammengezogen und die Linsenoberflächen noch kleiner. Den nächstliegenden Punkt, bei dem sich das Auge noch scharf einstellen kann, nennt man den Nahpunkt. Bei einem normalen Auge ist er für einen Jugendlichen etwa 7 cm, für einen jungen Erwachsenen etwa 12 cm, für einen Erwachsenen mittleren Alters etwa

5 Geometrische Optik

414 entspannter Muskel

(a) kontrahierter Muskel

Akkommodation (b)

Abb. 5.93: Akkommodation – Veränderung der Linsenform.

28 bis 40 cm und für einen 60jährigen etwa 100 cm weit entfernt. Optische Beobachtungsinstrumente werden so entwickelt, dass sich das Auge nicht unnötig anstrengen muss. Verständlicherweise kann sich das Auge nicht gleichzeitig auf zwei verschiedene Objekte scharf einstellen. Dies wird deutlich, wenn man versucht, die Augen gleichzeitig auf ein Glasstück, durch das man hindurchsieht, und die dahinterliegende Umgebung zu fokussieren. Säugetiere akkommodieren ihre Augen im Allgemeinen wie Menschen durch Veränderung der Linsenkrümmung. Es gibt aber noch andere Möglichkeiten: Fische bewegen im Unterschied dazu nur die Linse zur Netzhaut hin oder von ihr weg, genauso, wie ein Kameraobjektiv zur Scharfeinstellung bewegt wird. Einige Mollusken erreichen das Gleiche, indem sie das ganze Auge zusammenziehen oder ausdehnen und so den relativen Abstand zwischen der Linse und der Netzhaut verändern. Bei Raubvögeln wird die Beibehaltung einer konstanten Scharfeinstellung für ein sich schnell bewegendes Objekt zur Überlebensfrage. Der Mechanismus der Akkommodation verläuft bei ihnen ganz anders: Sie verändern die Hornhautkrümmung.

5.7.2 Die Brille Brillen wurden wahrscheinlich irgendwann im späten 13. Jahrhundert, möglicherweise in Italien, erfunden. Ein verschollenes florentinisches Manuskript jener Zeit (1299) sprach von „Brillen, die kürzlich für ältere Männer erfunden wurden, deren Sehvermögen nachzulassen begonnen hat“. Bikonvexlinsen, kaum mehr als eine Art Lupen, dienten als Lesehilfe. Lange davor verwendete man polierte Edelsteine als Lorgnetten (Stielbrillen). Roger Bacon berichtete schon früh (ca. 1267) von Zerstreuungslinsen, doch erst fast 200 Jahre später diskutierte Nikolaus von Kues (lat. Nicolas Cusanus) deren Verwendung für Brillen. Im späten 16. Jahrhundert galt die Brille nicht mehr als Neuheit. Amüsanterweise betrachtete man das Tragen einer Brille in der Öffentlichkeit selbst noch im 18. Jahrhundert als unschicklich, und wir sehen bis zu jener

5.7 Optische Systeme

415

Das älteste bekannte Gemälde (ca. 1352), das eine Person mit Brille zeigt. Es handelt sich um ein Porträt von Kardinal Ugo di Provenza, der 1262 starb; gemalt von Tomasso da Modena. (Cardinal Ugo of Provenza (1351), Tomaso da Modena, Fresko in der Kirche San Nicolò,Treviso. Foto E. H.)

Zeit auf Gemälden wenige Brillenträger. 1804 erkannte Wollaston, dass traditionelle (ziemlich flache, bikonvexe und konkave) Brillengläser nur beim Blick durch die Mitte gute Sicht verschaffen, woraufhin er sich eine neue, stark gekrümmte Linse patentieren ließ. Sie war der Vorläufer des heutigen Meniskus (von griech. meniskos, Halbmöndchen), der es dem sich drehenden Augapfel gestattet, von der Mitte bis zum Rand ohne wesentliche Verzerrungen durch die Linse zu schauen. In der physiologischen Optik spricht man zweckmäßigerweise von der Brechkraft D, dem Kehrwert der Brennweite einer Linse. Wenn f in Metern angegeben ist, dann ist die Einheit der Brechkraft der Kehrwert des Meters bzw. die Dioptrie (Abkürzung dpt, 1 Dioptrie = 1 m−1 ). Hat beispielsweise eine Sammellinse eine Brennweite von +1 m, dann ist ihre Brechkraft +1 Dioptrie; mit einer Brennweite von −2 m (Zerstreuungslinse) ist D = − 12 Dioptrien; für f = +10 cm ist D = 10 Dioptrien. Die Brennweite einer dünnen Linse mit dem Brechungsindex nl in Luft ist gegeben durch   1 1 1 = (nl − 1) − ; [5.16] f R1 R2 ihre Brechkraft beträgt somit   1 1 − . D = (nl − 1) R1 R2

(5.69)

5 Geometrische Optik

416

Man kann sich die Terminologie veranschaulichen, wenn man daran denkt, dass jede Oberfläche einer Linse die ankommenden Strahlen ablenkt – je stärker die Ablenkung ist, desto stärker bricht die Oberfläche. Eine Konvexlinse, die die Strahlen auf beiden Oberflächen stark ablenkt, hat eine kurze Brennweite und eine große Brechkraft. Wir wissen bereits, dass die Brennweite für zwei einander berührende dünne Linsen durch 1 1 1 = + f f1 f2

[5.38]

gegeben ist. Die gemeinsame Brechkraft ist demnach die Summe der einzelnen Beiträge, D = D1 + D2 . Eine Konvexlinse mit D1 = 10 Dioptrien in Berührung mit einer Zerstreuungslinse von D2 = −10 Dioptrien führt daher zu D = 0: Die Kombination verhält sich wie eine planparallele Glasplatte. Überdies können wir uns zum Beispiel eine Bikonvexlinse aus zwei Plankonvexlinsen in engem Kontakt, Rückseite an Rückseite, zusammengesetzt vorstellen. Die einzelnen Brechkräfte folgen aus Gleichung (5.69). Für die erste Plankonvexlinse (R2 = ∞) ist D1 =

(nl − 1) , R1

(5.70)

für die zweite ist D2 =

(nl − 1) . −R2

(5.71)

Diese Ausdrücke können gleichermaßen als Definition der Brechkraft der jeweiligen Oberfläche der ursprünglichen Bikonvexlinse dienen. Anders ausgedrückt, die Brechkraft einer beliebigen dünnen Linse ist gleich der Summe der Brechkräfte ihrer Oberflächen. Da R2 für eine Konvexlinse eine negative Zahl ist, sind dann sowohl D1 als auch D2 positiv. Die so definierte Brechkraft einer Oberfläche ist im Allgemeinen nicht gleich dem reziproken Wert der Brennweite. Befindet sich die Linse jedoch in Luft, so sind beide Werte gleich. Beziehen wir diese Terminologie auf das Modell des menschlichen Auges, so stellen wir fest, dass die Brechkraft der von Luft umgebenen Linse ungefähr +19 Dioptrien beträgt. Die Hornhaut trägt etwa +43 zu den gesamten +58,6 Dioptrien eines gesunden Auges bei. Ein „normales“ Auge ist jedoch gar nicht so häufig anzutreffen. Unter einem emmetropen (normalsichtigen) Auge versteht man ein Sinnesorgan, das parallele Strahlen im entspannten Zustand auf die Netzhaut fokussieren kann – das bedeutet, der zweite Brennpunkt muss auf der Netzhaut liegen. Der entfernteste Punkt, der scharf ein-

5.7 Optische Systeme

417

gestellt werden kann, der Fernpunkt, liegt deshalb im Unendlichen. Befindet sich der zweite Brennpunkt jedoch nicht auf der Netzhaut, so ist das Auge fehlsichtig – es leidet beispielsweise an Weitsichtigkeit (Hyperopie), an Kurzsichtigkeit (Myopie) oder an Astigmatismus. Dies kann entweder durch abnorme Veränderungen im Brechungsmechanismus (Hornhaut, Linse usw.) oder durch Veränderungen der Länge des Augapfels eintreten, wobei sich der Abstand zwischen der Linse und der Netzhaut verändert. Der letztere Fall ist viel häufiger. Etwa 25 % der jungen Erwachsenen benötigen eine Augenkorrektur von bis zu ±0,5 Dioptrien, ungefähr weitere 65 % bis zu ±1,0 Dioptrie.

Als Katarakt (grauen Star) bezeichnet man die Eintrübung der normalerweise durchsichtigen Augenlinse. Das Sehvermögen wird hierdurch oft drastisch beeinträchtigt. In Extremfällen entfernt man die Kristalllinse in einem chirurgischen Eingriff und ersetzt sie durch eine kleine konvexe Kunststofflinse (ein intraokulares Linsenimplantat). Auf dem Foto sehen Sie eine solche Linse vergrößert dargestellt; ihr Durchmesser beträgt in Wirklichkeit nur rund 6 mm. Die Implantate haben die früher nach der chirurgischen Entfernung der Linse oft erforderlichen dicken „Starbrillen“ überflüssig gemacht.

Kurzsichtigkeit – Negativlinse (Zerstreuungslinse) Myopie (Kurzsichtigkeit) liegt vor, wenn die parallelen Strahlen vor der Netzhaut gebündelt werden; die Brechkraft des Linsensystems ist in diesem Fall zu stark für die Axiallänge vom vorderen bis zum hinteren Punkt des Auges. Bilder weit entfernter Objekte entstehen vor der Netzhaut, der Fernpunkt ist näher als unendlich, und alle Punkte jenseits des Fernpunktes erscheinen unscharf, während nahe Objekte scharf abgebildet werden (Abb. 5.94). Um diesen Zustand zu korrigieren oder wenigstens die Symptome abzuschwächen, setzen wir eine zusätzliche Linse vor das Auge. Der Brennpunkt des so zusammengesetzten Systems aus Brillenglas und Auge liegt dann auf der Netzhaut. Da das kurzsichtige Auge Objekte scharf sehen kann, die näher als der Fernpunkt liegen, muss das Brillenglas Bilder von fernen Objekten erzeugen, die relativ nah sind. Deshalb benutzen wir eine Negativlinse, die die Strahlen etwas mehr divergieren lässt. Allerdings verringern wir damit nicht nur die Brechkraft des Systems! In Wirklichkeit wird das Vergrößerungsvermögen von Linse und Auge meistens so gestaltet, dass sie der des bloßen Auges gleicht. Falls Sie eine Brille tragen, um die Kurzsichtigkeit zu korrigieren, dann nehmen Sie sie ab: Die Umgebung wird unscharf, doch die Größe verändert sich nicht. Versuchen Sie, auf einem Stück Papier ein reelles Bild mithilfe Ihrer Brille zu erzeugen – es ist nicht möglich.

5 Geometrische Optik

418

kurzsichtiges Auge

entferntes Objekt

keine Akkommodation

Objekt im Unendlichen

Fernpunkt

Objekt im Unendlichen

nahegelegenes Objekt

Akkommodation

Abb. 5.94: Korrektur des kurzsichtigen Auges.

Beispiel 5.14 Angenommen, ein Auge habe den Fernpunkt in 2 m Entfernung. Es wäre wohl alles in Ordnung, wenn die Brillenlinse ferne Objekte scheinbar näher als 2 m heranbrächte. Wird das virtuelle Bild eines im Unendlichen befindlichen Objekts durch eine Zerstreuungslinse in 2 m Entfernung erzeugt, so sieht das Auge das Objekt mit einer nicht akkommodierten Linse scharf. Bestimmen Sie die erforderliche Brennweite. Lösung Wir verwenden die Näherung für dünne Linsen (Brillengläser sind im Allgemeinen dünn, um das Gewicht und die Größe zu minimieren) und erhalten 1 1 1 1 1 = +  = + . f a a ∞ −2 Demnach ist f = −2 m und D = − 12 Dioptrien.

[5.17]

5.7 Optische Systeme

419

Man beachte, dass der Abstand zwischen Korrekturlinse und Fernpunkt gleich der Brennweite der Linse ist (Abb. 5.95). Das Auge sieht aufrechte virtuelle Bilder, die von der Korrekturlinse erzeugt werden und zwischen dem Fern- und dem Nahpunkt liegen. Übrigens verschiebt sich der Nahpunkt auch ein wenig. Deshalb nehmen Kurzsichtige oft ihre Brille ab, wenn sie eine Nadel einfädeln oder Kleingedrucktes lesen; sie können dann das Material näher an das Auge halten, wodurch die Vergrößerung zunimmt.

Fernpunkt fl Abb. 5.95: Der Abstand zum Fernpunkt ist gleich der Brennweite der Korrekturlinse.

Die soeben durchgeführte Berechnung vernachlässigt den Abstand zwischen der Korrekturlinse und dem Auge und trifft daher eher für Kontaktlinsen als für Brillen zu. Der Abstand wird gewöhnlich gleich der Entfernung zwischen dem ersten Brennpunkt des Auges (≈ 16 mm) und der Hornhaut gewählt, damit keine Vergrößerung des Bildes über das des bloßen Auges hinaus eintritt. Viele Menschen haben ungleiche Augen, jedoch liefern beide dieselbe Vergrößerung. Eine Änderung von MT für ein Auge allein wäre eine Katastrophe. Setzen wir die Korrekturlinse in den ersten Brennpunkt des Auges, so wird das Problem unabhängig von der Brechkraft jener Linse vollständig vermieden, vgl. Gleichung (6.8). Um dies zu verstehen, zeichne man nur einen Strahl von der Spitze eines beliebigen Objekts durch den ersten Brennpunkt. Der Strahl tritt ins Auge ein, durchläuft es parallel zur optischen Achse und legt so die Höhe des Bildes fest. Da dieser Strahl jedoch von der Brillenlinse unbeeinflusst bleibt, deren Mittelpunkt sich im Brennpunkt befindet, könnte die Linse zwar den Bildort ändern, nicht aber die Höhe und deshalb auch nicht MT (siehe Gl. 5.24). Wie groß muss nun die Brechkraft eines Brillenglases im Abstand d vom Auge sein, die der Brechkraft einer Kontaktlinse mit einer Brennweite fc (gleich dem Abstand zum Fernpunkt) entspricht? Für unsere Zwecke reicht es aus, wenn wir uns das Auge näherungsweise als Einzellinse vorstellen und den Abstand d von dieser Linse bis zur Brille mit dem Abstand zwischen Hornhaut und Brillenglas (etwa 16 mm) gleichsetzen. Wir bezeichnen die Brennweite der Korrekturlinse mit fl und die Brennweite des Auges mit fe . Die Brennweite der Kombination ist durch Gleichung (5.36) bestimmt: fh =

fe (d − fl ) . d − (fl + fe )

(5.72)

5 Geometrische Optik

420

Dies ist der Abstand von der Augenlinse bis zur Netzhaut. Ebenso ist die Brennweite der entsprechenden Kontaktlinse in Verbindung mit der Augenlinse durch Gleichung (5.38) gegeben: 1 1 1 = + f fc fe

(5.73)

mit f = fh . Kehren wir Gleichung (5.72) um, setzen sie mit Gleichung (5.73) gleich und vereinfachen die Ausdrücke, so erhalten wir 1/fc = 1/ (fl − d) unabhängig vom Auge. Für die Brechkraft ergibt sich Dc =

Dl . 1 − Dl d

(5.74)

Eine Brillenlinse mit der Brechkraft Dl , die sich in einem Abstand d von der Augenlinse befindet, hat die gleiche optische Wirkung wie eine Kontaktlinse mit der Brechkraft Dc . d wird in Metern gemessen, ist also ziemlich klein, und wenn Dl nicht groß ist, gilt Dc ≈ Dl . Normalerweise spielt die genaue Position der Brille auf der Nase keine große Rolle – ein falscher d-Wert kann aber durchaus zu Kopfschmerzen führen. Es ist üblich, einen Kurzsichtigen, dessen Sehschärfe durch eine Kontaktlinse mit einer Brechkraft von −6 Dioptrien korrigiert wird, als Kurzichtigen mit 6 Dioptrien zu bezeichnen. Beispiel 5.15 Beschreiben Sie die Brillengläser, die die Sehschärfe eines Kurzsichtigen mit 6 Dioptrien korrigieren. Die Person trägt die Gläser 12 mm vor den Augen. Lösung Ein kurzsichtiges Auge hat eine zu hohe Brechkraft (in diesem Fall 6 Dioptrien), die entsprechend korrigiert werden muss. Würde die Person Kontaktlinsen tragen, müssten diese −6 Dioptrien haben. Zur Berechnung der Brillengläser verwenden wir Gleichung (5.74), Dc =

Dl , 1 − Dl d

was wir nach Dl umstellen müssen: Dc − Dc Dl d = Dl Dc = Dl (1 + Dc d) −6 Dc = Dl = 1 + Dc d 1 + (−6)(0,012) und Dl = −6,47 Dioptrien.

5.7 Optische Systeme

421

Weitsichtigkeit – Positivlinse (Sammellinse) Hyperopie (Weitsichtigkeit) ist eine andere Fehlsichtigkeit, deren Ursache darin liegt, dass der zweite Brennpunkt des nicht akkommodierten Auges hinter der Netzhaut liegt (Abb. 5.96). Sie ist oft die Folge einer Verkürzung der Axiallänge des Auges – die Linse befindet sich zu nahe an der Netzhaut. Um die Ablenkung der Strahlen zu verstärken, wird eine positive Brillenlinse vor das Auge gesetzt. Das weitsichtige Auge kann und muss sich akkommodieren, um ferne Gegenstände deutlich zu sehen. Seine Fähigkeit, sich auf einen nahen Punkt zu akkommodieren, ist aber stark dadurch begrenzt, dass der Nahpunkt viel weiter weg liegt als bei einem normalen Auge (ungefähr 25 cm). Nahe Gegenstände kann es deshalb nicht scharf sehen. Eine korrigierende Sammellinse mit positiver Brechkraft bringt ein nahes Objekt hinter den Nahpunkt, wo das Auge genügend Sehschärfe hat: Die Linse erzeugt ein entferntes virtuelles Bild, das das Auge scharf sehen kann. weitsichtiges Auge

Objekt im Unendlichen

Nahpunkt

25 cm

entferntes Objekt

nahe gelegenes Objekt

Abb. 5.96: Korrektur des weitsichtigen Auges.

Beispiel 5.16 Angenommen, ein weitsichtiges Auge habe einen Nahpunkt bei 125 cm. Bestimmen Sie die Stärke der erforderlichen Korrekturlinse.

5 Geometrische Optik

422

Lösung Damit das Bild eines Objekts in +25 cm Entfernung bei a = −125 cm erscheint, muss die Brennweite 1 1 1 1 = + = f −1,25 0,25 0,31 oder f = 0,31 m und D = +3,2 Dioptrien sein. Dies befindet sich in Übereinstimmung mit Tabelle 5.3, wobei a < f ist. Ein solches Brillenglas erzeugt reelle Bilder – probieren Sie es aus, falls Sie weitsichtig sind.

Wie in Abbildung 5.97 gezeigt, kann das entspannte Auge mithilfe der Korrekturlinse Objekte im Unendlichen scharf sehen. Die Linse erzeugt dabei eine Abbildung auf ihrer „Brennebene“, die dann dem Auge als virtuelles Objekt dient. Der Brennpunkt (dessen Bild auf der Netzhaut liegt) ist wieder der Fernpunkt und liegt im Abstand fl hinter der Linse. Der Weitsichtige kann bequem den Fernpunkt „sehen“.

Fernpunkt F

F fl

Abb. 5.97: Wieder ist der Abstand zum Fernpunkt gleich der Brennweite der Korrekturlinse.

Ein sehr sanfter Fingerdruck auf die Augenlider über und unter der Hornhaut verformt vorübergehend das Auge und verändert Ihr Sehvermögen von der Unschärfe zur Klarsicht und umgekehrt. Astigmatismus – Anamorphot (Zerrlinse) Ein anderer und vielleicht der verbreitetste Augenfehler ist der Astigmatismus. Seine Ursache ist eine ungleich gekrümmte, also asymmetrische Hornhaut. Angenommen, wir lassen zwei meridionale Ebenen (Ebenen, die die optische Achse enthalten) so durch das Auge laufen, dass die Brechkraft (oder Krümmung) auf der einen Ebene maximal, auf der anderen minimal ist. Stehen diese Ebenen senkrecht aufeinander, so ist der Astigmatismus regelmäßig und korrigierbar; falls nicht, so ist er unregelmäßig und nicht leicht zu korrigieren. Regelmäßiger Astigmatismus tritt in zwei Formen auf, wobei das Auge auf den beiden meridionalen Ebenen in verschiedenen Kombinationen und Graden normal-, kurz- oder weitsichtig ist. Als einfaches Beispiel könnten dann etwa die Spalten eines Schachbrettmusters deutlich abgebildet werden, während die Zeilen infolge von Kurz- oder Weitsichtigkeit unscharf wären. Natürlich brauchen die meridionalen Ebenen nicht exakt horizontal und vertikal zu sein (Abb. 5.98).

5.7 Optische Systeme

423

Abb. 5.98: Ein Test auf Astigmatismus. Betrachten Sie dieses Bild mit einem bloßen Auge (ohne Brille). Erscheint Ihnen eine Gruppe von Linien dicker als die anderen, leiden Sie unter Astigmatismus. Halten Sie die Abbildung dicht vor Ihr Auge und bewegen Sie sie dann langsam weg. Passen Sie dabei auf, welche Liniengruppe Sie als Erste scharf sehen. Wenn zwei Gruppen gleich scharf erscheinen, drehen Sie die Abbildung, bis nur noch eine Gruppe scharf erscheint. Sehen Sie alle Gruppen scharf, leiden Sie nicht unter Astigmatismus.

Der berühmte Astronom Sir George B. Airy benutzte 1825 wahrscheinlich als Erster eine sphärozylindrische Konkavlinse, um seinen eigenen kurzsichtigen Astigmatismus zu korrigieren. Erst nachdem der Holländer Franciscus Cornelius Donders (1818 – 1898) im Jahre 1862 eine Abhandlung über zylindrische Linsen und Astigmatismus veröffentlicht hatte, waren Ophthalmologen jedoch dazu zu bewegen, die Methode in größerem Umfang zu übernehmen. Jedes optische System, das verschiedene Werte von MT oder D in den beiden Hauptschnitten hat, bezeichnet man als anamorphotisch. Bauen wir daher beispielsweise das System aus Abbildung 5.41 diesmal mit zylindrischen Linsen (Abb. 5.99) auf, so ergibt sich ein verzerrtes, nur in einer Ebene vergrößertes Bild. Genau diese Verzerrung benötigt man, um den Astigmatismus zu korrigieren, wenn ein Fehler nur in einem Meridian existiert. Eine geeignete planzylindrische Brillenlinse, entweder positiv oder negativ, könnte im Prinzip die Normalsichtigkeit wiederherstellen. Erfordern beide aufeinander senkrecht stehende Meridiane Korrekturen, so müsste die Linse zum Beispiel sphärozylindrisch oder sogar torisch (Abb. 5.100) sein.

Abb. 5.99: (a) Ein Anamorphot. (b) Zylinderlinsen. (Foto mit frdl. Genehmigung von Melles Griot.)

5 Geometrische Optik

424

Abb. 5.100: Torische Flächen.

Nebenbei sei erwähnt, dass Anamorphote auch in anderen Bereichen Verwendung finden, beispielsweise bei der Herstellung von Breitwandfilmen: Dort wird ein extra großes horizontales Bildfeld auf ein normales Filmformat zusammengedrängt. Wird der Film durch eine Speziallinse gezeigt, so breitet sich das verzerrte Bild wieder aus. Gelegentlich sieht man im Fernsehen kurze Szenen ohne Speziallinse – das eigenartig langgestreckte Ergebnis haben Sie vielleicht schon gesehen.

5.7.3 Die Lupe Um ein Objekt genau zu betrachten, kann man es möglichst nah an das Auge heranführen. Während das Objekt immer näher kommt, vergrößert sich das Netzhautbild und bleibt scharf, bis sich die Linse nicht mehr weiter akkommodieren kann. Kommt das Objekt näher als der Nahpunkt, wird das Bild unscharf (Abb. 5.101). Man kann eine Sammellinse verwenden, um die Brechkraft des Auges zu erhöhen, damit Objekte auch diesseits des Nahpunktes scharf abgebildet bleiben. Eine solche Linse bezeichnet man als Lupe, Vergrößerungsglas oder einfaches Mikroskop. Sie soll ein Bild eines nahen Objekts liefern, das größer ist als das, was man mit bloßem Auge sieht (siehe Abb. 5.102). Geräte dieser Art kennt man schon seit langem. Tatsächlich wurde eine Konvexlinse aus Quarz (f ≈ 10 cm), die vielleicht als Lupe gedient hat, 1885 in den Ruinen des Palastes des Königs Sennacherib von Assyrien (705–681 v. Chr.) gefunden.

Nahpunkt

Abb. 5.101: Abbildungen von Objekten, die sich hinter, in und vor dem Nahpunkt befinden.

Eine Sammellinse, die als Lupe benutzt wird. (Foto E. H.)

5.7 Optische Systeme

y

425

αu

d Nahpunkt

(a)

Eintrittspupille

Blende Austrittspupille y

αa F y

a f

a



(b)

L

(c)

Abb. 5.102: (a) Ein Objekt wird mit bloßem Auge betrachtet. (b) Der Blick durch eine Lupe. (c) Eine Sammellinse wird als Lupe verwendet. Die Objektweite ist kleiner als die Brennweite.

Von einer Lupe erwartet man ein vergrößertes, aufrechtes Bild. Die Strahlen, die in das normalsichtige Auge eintreten, sollten außerdem nicht konvergieren. Nach Tabelle 5.3 sollte sich das Objekt innerhalb der Brennweite befinden (a < f ). Das Resultat ist in Abbildung 5.102 dargestellt. Wegen der relativ geringen Größe der Augenpupille ist diese fast sicher immer die Aperturblende und auch die Austrittspupille (vgl. Abb. 5.44). Die Vergrößerung M (gleichbedeutend mit der Winkelvergrößerung MA ) eines optischen Instruments ist definiert als der Quotient aus der Netzhautbildgröße mit Instrument und der Netzhautbildgröße mit bloßem Auge bei normalem Betrachtungsabstand. Letzteren setzt man meist als den Abstand d zum Nahpunkt an. Der Quotient

5 Geometrische Optik

426

aus den Winkeln αa und αu (die durch die Hauptstrahlen von der Spitze des Objekts im Falle des bloßen Auges gebildet werden) ist äquivalent zu M , also ist αa . (5.75) M= αu Da wir uns auf das paraxiale Gebiet beschränken wollen, ist tan αa = y  /L ≈ αa , tan αu = y/d ≈ αu und M=

yd , yL

wobei sich y  und y über den Achsen befinden und positiv sind. Nimmt man d und L als positive Größen an, dann muss M positiv sein, was sinnvoll ist. Verwendet man die Gleichungen (5.24) und (5.25) für MT zusammen mit der Gleichung für dünne Linsen, so erhält man   a d a d = 1− . M =− aL f L Da die Bildweite negativ ist, wird a = − (L − ) und folglich M=

d [1 + D (L − )] , L

(5.76)

wobei D natürlich die Brechkraft (1/f ) der Lupe ist. Es gibt drei Situationen, die von besonderem Interesse sind. (1) Wenn  = f ist, dann ist die Vergrößerung dD. (2) Wenn  effektiv gleich null ist, gilt   1 +D . [M ]=0 = d L In diesem Fall entspricht der größte Wert der Vergrößerung M dem kleinsten Wert von L, der gleich d sein muss, wenn man das Bild scharf sehen möchte. Deshalb ist [M ] =0 = dD + 1 .

(5.77)

L=d

Nehmen wir für den Normalbeobachter d = 0,25 m, so erhalten wir [M ] =0 = 0,25D + 1 .

(5.78)

L=d

Wenn L wächst, nimmt die Vergrößerung M ab; ebenso nimmt M ab, wenn  wächst. Ist das Auge sehr weit von der Linse entfernt, ist das Netzhautbild klein.

5.7 Optische Systeme

427

(3) Diese letzte Situation ist vielleicht die häufigste. Hier stellen wir das Objekt in den Brennpunkt (a = f ), sodass das virtuelle Bild im Unendlichen (L = ∞) liegt. So folgt aus Gleichung (5.76) [M ]L=∞ = dD

(5.79)

für alle möglichen Werte von . Wegen der Parallelität der Strahlen sieht das Auge die Umgebung in einem entspannten, nicht akkommodierten Zustand, was sehr wünschenswert ist. Man beachte, dass MT = −a /a bei a → f gegen unendlich geht, wohingegen MA unter den gleichen Bedingungen nur um 1 abnimmt! Eine Lupe mit einer Brechkraft von 10 Dioptrien hat bei L = ∞ eine Brennweite (1/D) von 0,1 m und eine Vergrößerung von 2,5. Dies ist gewöhnlich als „2,5ד gekennzeichnet, was bedeutet, dass das Netzhautbild mit dem Objekt im Brennweitenabstand von der Linse zweieinhalbmal größer ist, als wenn das Objekt im Nahpunkt des bloßen Auges läge (wo das größte scharfe Bild entstehen kann). Die einfachsten einlinsigen Vergrößerungsgläser sind aufgrund von Aberrationen auf etwa 2× bis 3× begrenzt. Ein großes Bildfeld erfordert eine große Linse, die aus praktischen Gründen an den Oberflächen meist ziemlich schwach gekrümmt ist. Die Radien sind ebenso groß wie f , und deshalb ist die Vergrößerung M klein. Das Leseglas, das Sherlock Holmes berühmt machte, ist ein typisches Beispiel. Die Uhrmacherlupe ist ebenfalls oft eine Einzellinse, die etwa zwei- bis dreifach vergrößert. Abbildung 5.103 zeigt kompliziertere Lupen, die für zehn- bis zwanzigfache Vergrößerungen konstruiert wurden. In etlichen Konfigurationen kommen Doppellinsen vor, deren Abbildungsqualität zwar nicht besonders gut ist, für beispielsweise stark vergrößernde Lupen aber ausreicht. Das Coddington-Vergrößerungsglas ist im Prinzip eine

zweiteilig (Doublet)

zweiteilig (Doublet) Abb. 5.103: Lupen.

Coddington-Typ

dreiteilig (Triplet; Hastings-Typ)

dreiteilig (Triplet)

428

5 Geometrische Optik

Kugel mit einer eingeschnittenen Kerbe, die eine kleinere Apertur als die Augenpupille ermöglicht. Eine Glasmurmel vergrößert auch stark – aber mit kräftigen Verzerrungen. Der relative Brechungsindex nlm einer Linse und des umgebenden Mediums ist wellenlängenabhängig. Da sich aber die Brennweite einer einfachen Linse mit nlm (λ) verändert, bedeutet dies, dass f eine Funktion der Wellenlänge ist. Die Farbkomponenten des weißen Lichts werden deshalb in verschiedenen Punkten im Raum fokussiert. Dadurch entsteht ein so genannter Farbfehler (chromatische Aberration). Damit das Bild frei von Farbrändern ist, werden Positiv- und Negativlinsen, die aus verschiedenen Glasarten gefertigt sind, zu Achromaten zusammengesetzt (siehe Abschn. 6.3.2). Achromatische, verkittete, zweiteilige und dreiteilige Objektive sind vergleichsweise teuer, und man findet sie häufig in kleinen, sehr genau justierten, starken Vergrößerungsgläsern.

5.7.4 Okulare Eine Augenlinse oder ein Okular ist ein optisches Gerät für die direkte Beobachtung, im Grunde genommen also ein Vergrößerungsglas. Es soll nicht ein konkretes Objekt, sondern das Zwischenbild eines vorgeschalteten Linsensystems (eines Objektivs) vergrößern. Dabei sieht das Auge in das Okular und das Okular sieht in das optische System (ein Fernrohr, Mikroskop oder Fernglas). Eine Einzellinse könnte diesen Zweck nur schwerlich erfüllen. Soll das Netzhautbild zufriedenstellend sein, so darf das Okular keine allzu großen Aberrationen zulassen. Das Okular eines speziellen Instruments könnte als Teil des vollständigen Systems so konstruiert sein, dass seine Linsen in einem Gesamtschema ausgenutzt werden können, um Aberrationen zu korrigieren. Standardokulare werden jedoch meist austauschbar an Teleskopen und Mikroskopen benutzt. Sie sind außerdem generell schwierig zu konstruieren, und die übliche und vielleicht erfolgreichste Methode besteht darin, ein existierendes Design zu verwenden oder leicht zu variieren. Das Okular muss ein virtuelles Bild (des Zwischenbildes) erzeugen, das meistens im oder nahe dem Unendlichen liegt, sodass es bequem mit einem normalen, entspannten Auge gesehen werden kann. Daneben muss es den Mittelpunkt der Austrittspupille oder den Augenkreis festlegen, in dem sich das Auge des Beobachters an einer günstig gelegenen Stelle befindet, vorzugsweise wenigstens etwa 10 mm von der letzten Linsenoberfläche entfernt. Wie oben ist die Okularvergrößerung gleich dem Produkt dD oder, wie man häufig schreibt, M = (250 mm) /f . Das Huygens-Okular, das vor über 250 Jahren erfunden wurde, wird heute noch häufig in der Mikroskopie verwendet (Abb. 5.104). Die unmittelbar am Auge liegende Linse bezeichnet man als Augenlinse, die erste Linse im Okular ist die Feldlinse. Den Abstand zwischen Augenlinse und Augenpunkt nennt man den Augenabstand, der für das Huygens-Okular nur etwa unbequeme 3 mm beträgt. Die ankommenden Strahlen, die auf dieses Okular treffen, müssen konvergieren, um ein virtuelles Objekt für die Augenlinse zu erzeugen. Damit kann das Huygens-Okular natürlich nicht

5.7 Optische Systeme

429 Augenabstand Augenlinse

Feldlinse

Feldlinse

Augenlinse

virtuelles Objekt Feldblende

Austrittspupille

Abb. 5.104: Das Huygens-Okular.

Feldblende

Austrittspupille

Abb. 5.106: Das Kellner-Okular.

Feldblende

Austrittspupille

Abb. 5.105: Das Ramsden-Okular.

Feldblende

Austrittspupille

Abb. 5.107: Das orthoskopische Okular.

als gewöhnliches Vergrößerungsglas verwendet werden. Seine derzeitige Attraktivität beruht auf seinem geringen Kaufpreis (siehe Abschn. 6.3.2). Ein anderes traditionelles Zubehör ist das Ramsden-Okular (Abb. 5.105). Diesmal liegt der Brennpunkt vor der Feldlinse, und so erscheint dort das Zwischenbild in leicht zugänglicher Weise. An dieser Stelle kann man Fadenkreuzplatten (oder Strichkreuzplatten) einsetzen, die eine Schar Fadenkreuze, Präzisionsskalen oder Polarnetze enthalten. (Auf durchsichtige Platten gedruckt, nennt man sie oft Strichmarkenplatten.) Da die Fadenkreuzplatte und das Zwischenbild in derselben Ebene liegen, können beide gleichzeitig scharf abgebildet werden. Das Ramsden-Okular hat einen bequemeren Augenabstand (12 mm) als das Huygens-Okular, ist relativ populär und recht günstig (siehe Aufgabe 6.2). Das Kellner-Okular liefert eine deutlich verbesserte Bildqualität, obwohl der Augenabstand zwischen denen der beiden vorhergehenden Geräte liegt. Im Prinzip ist es ein achromatisches Ramsden-Okular (Abb. 5.106). Es wird am häufigsten in gemäßigt weitwinkligen Teleskopinstrumenten benutzt. Das orthoskopische Okular (Abb. 5.107) hat einen weiten Winkel, eine starke Vergrößerung und einen großen Augenabstand (≈ 20 mm). Das symmetrische Okular (Plössl-Okular) (Abb. 5.108) hat ähnliche Eigenschaften wie das orthoskopische Okular, ist ihm im Allgemeinen aber etwas überlegen. Das Erfle-Okular (Abb. 5.109) ist wahrscheinlich das am häufigsten eingesetzte Weitwinkelokular (etwa ±30 ◦ ). Es ist für alle Aberrationen gut korrigiert und relativ teuer.8 8

Detaillierte Konstruktionen für diese und andere Okulare sind im Military Standardization Handbook – Optical Design, MIL-HDBK-141, zu finden.

5 Geometrische Optik

430

Feldblende

Austrittspupille

Abb. 5.108: Das Plössl-Okular.

Feldblende

Austrittspupille

Abb. 5.109: Das Erfle-Okular.

Obwohl es viele andere Okulare gibt, einschließlich solcher mit veränderlicher Vergrößerung und mit asphärischen Flächen, ist die angegebene Auswahl einigermaßen repräsentativ. Diese Okulare findet man gewöhnlich in Teleskopen und Mikroskopen und daher in umfangreichen Katalogen des Fachhandels.

5.7.5 Das Mikroskop Das Mikroskop geht einen Schritt über das einfache Vergrößerungsglas hinaus, da es ein größeres Winkelverhältnis (größer als ungefähr 30×) von nahe gelegenen Objekten liefert. Seine Erfindung wird allgemein dem holländischen Brillenmacher Zacharias Janssen aus Middelburg (um 1590) zugeschrieben. Galilei, der seine Erfindung des Mikroskops 1610 bekanntgab, folgt dicht auf dem zweiten Platz. Eine einfache Variante, die diesen frühesten Geräten näher steht als dem modernen Labormikroskop, ist in Abbildung 5.110 dargestellt. Das Linsensystem (hier eine Einzellinse), das dem Objekt zugewandt ist, heißt Objektiv. Es erzeugt ein reelles, umgekehrtes und in der Regel vergrößertes Bild des Objekts. Dieses Bild liegt auf der Ebene der Feldblende des Okulars. Strahlen, die von einem beliebigen Punkt dieses Bildes divergierend ausgehen, treten wie im vorhergehenden Abschnitt parallel zueinander aus der Augenlinse aus (die in diesem einfachen Falle das ganze Okular ist). Das Okular vergrößert dieses Zwischenbild noch mehr. Deshalb ist die Vergrößerung des Gesamtsystems das Produkt aus der Transversalvergrößerung MTo des Objektivs und der Winkelvergrößerung MAe des Okulars, also M = MTo MAe .

(5.80)

Aus Gleichung (5.26) wissen wir, dass MT = −x /f ist; die meisten Mikroskope sind daher so konstruiert, dass der Abstand vom zweiten Brennpunkt des Objektivs bis zum ersten Brennpunkt des Okulars (der x entspricht) auf 160 mm genormt ist. Diese so genannte Tubuslänge ist in dieser Abbildung mit L gekennzeichnet. (Einige Autoren definieren die Tubuslänge als Bildweite des Objektivs.) Deshalb gilt mit dem Endbild im Unendlichen [Gl. (5.79)] und einem Abstand zum Standardnahpunkt von 254 mm    254 160 , (5.81) M= − fo fe

5.7 Optische Systeme

431

Hau ptstr ahl

Austrittspupille

fe Okular fe Feldblende L

fo Aperturblende Bild im Unendlichen

Objektiv Objekt

Eintrittspupille

Abb. 5.110: Ein rudimentäres Mikroskop. Das Objektiv erzeugt ein reelles Bild eines nahe gelegenen Objekts. Das Okular, das wie eine Lupe funktioniert, vergrößert dieses Zwischenbild. Das endgültige virtuelle Bild kann einen größeren Durchmesser als der Tubus haben, weil es nicht in diesen hineinpassen muss.

und das Bild ist umgekehrt (M < 0). Entsprechend ist in die Fassung eines Objektivs mit einer Brennweite fo von beispielsweise 32 mm die Angabe 5× (oder ×5) eingraviert, die anzeigt, dass das Objektiv fünffach vergrößert. Kombiniert mit einem 10×-Okular (fe = 2,54 cm) ergibt dies eine Gesamtvergrößerung von 50×. Um die Abstandsverhältnisse zwischen dem Objektiv, der Feldblende und dem Okular beizubehalten, werden bei der Fokussierung eines Zwischenbildes in der ersten Brennpunktebene des Okulars alle drei Elemente als eine einzige Einheit bewegt. Das Objektiv dient als Aperturblende und Eintrittspupille. Sein Bild, das durch das Okular erzeugt wird, ist die Austrittspupille, in der sich das Auge befindet. Die Feldblende, die die Abmessungen des größten betrachtbaren Objekts begrenzt, ist als Teil des Okulars ausgeführt. Das Bild der Feldblende, das durch die ihr folgenden optischen Elemente erzeugt wird, nennt man Austrittsluke, und das Bild, das durch die ihr vorangehenden Elemente erzeugt wird, heißt Eintrittsluke. Der Kegelwinkel, der im Mittelpunkt der Austrittspupille den Rand der Austrittsluke einschließt, wird als Bildfeldwinkel im Bildraum bezeichnet.

5 Geometrische Optik

432

θmax

(a)

(b)

(c)

(d)

Abb. 5.111: Mikroskopobjektive. (a) Das Lister-Objektiv, 10×, NA = 0,25, f = 16 mm (zwei verkittete Achromaten. (b) Amici-Objektiv, 20×, NA = 0,5, f = 8 mm bis 40×, NA = 0,8, f = 4 mm. (c) Ölimmersionsobjektiv, 100×, NA = 1,3, f = 1,6 mm (siehe Abb. 6.18). (d) Apochromatisches Objektiv, 55×, NA = 0,95, f = 3,2 mm (enthält zwei Fluoritlinsen).

Ein modernes Mikroskopobjektiv kann man grob einem von drei Typen zuordnen. Es kann sich für Objekte mit oder ohne Deckglas eignen (Letzteres gilt für Metallmikroskope), oder das Objektiv kann sich in einer Flüssigkeit befinden, die mit dem Objekt in Kontakt ist. Vier repräsentative Objektive sind in Abbildung 5.111 dargestellt (siehe Abschn. 6.3.1). Ebenfalls weit verbreitet ist das schwach (etwa 5×) vergrößernde, verkittete, zweiteilige Mikroskopobjektiv. (Relativ preiswerte mittlere Achromate – 10× oder 20× – können aufgrund ihrer kurzen Brennweite auch sinnvoll zur Aufweitung und räumlichen Filterung von Laserstrahlen benutzt werden.) Die Helligkeit des Bildes hängt zum Teil von der Lichtmenge ab, die von dem Objektiv aufgefangen wird. Zur Beschreibung dieser Größe eignet sich die Blendenzahl, insbesondere dann, wenn das Objekt weit entfernt ist (Abschn. 5.3.3). Für ein Instrument, das mit endlich weit entfernten konjugierten Punkten (a und a sind endlich groß) arbeitet (Abschnitt 5.6), ist die numerische Apertur NA jedoch besser geeignet. In unserem Beispiel ist NA = ni sin θmax ,

(5.82)

wobei ni der Brechungsindex des Immersionsmediums (Luft, Öl, Wasser usw.) ist, das an die Objektivlinse angrenzt; θmax ist der halbe Maximalwinkel des kegelförmigen Lichtbündels, das durch diese Linse aufgenommen wird (Abb. 5.111 b). Anders ausgedrückt ist θmax der Winkel zwischen Randstrahl und Achse. Die numerische Apertur reicht von ungefähr 0,07 für schwach vergrößernde bis zu etwa 1,4 für stark vergrößernde (100×) Objektive. Befindet sich das Objektiv in Luft, so kann die NA natürlich nicht größer als 1,0 sein. Die NA ist gewöhnlich die zweite Zahl, die in die Objektivfassung eingraviert ist. Den Begriff der numerischen Apertur führte übrigens Ernst Abbe (1840–1905) ein, als er in der Carl-Zeiss-Mikroskopwerkstatt arbeitete. Er erkannte, dass der minimale Transversalabstand zwischen zwei Objektpunkten, die in

5.7 Optische Systeme

433

der Abbildung aufgelöst werden können (das Auflösungsvermögen), proportional zu λ und umgekehrt proportional zu NA ist.

5.7.6 Die Kamera Die Urform des modernen Fotoapparates9 ist die Lochkamera. In ihrer ältesten Bauart war diese einfach ein dunkler Raum mit einem kleinen Loch in der Wand. Licht, das in das Loch einfällt, wirft ein umgekehrtes Bild der von der Sonne beschienenen Umgebung auf einen Schirm auf der Innenseite. Das Prinzip war schon Aristoteles bekannt, dessen Beobachtungen durch Aufzeichnungen arabischer Gelehrter über das lange europäische Mittelalter hinweg erhalten blieben. Alhazen wendete es vor mehr als achthundert Jahren an, um auf indirekte Weise Sonnenfinsternisse zu beobachten. Die Notizbücher von Leonardo da Vinci enthalten einige Beschreibungen der Lochkamera, doch die erste detaillierte Abhandlung erschien in der Magica Naturalis (Haus-, Kunst- und Wunderbuch) von Giovanni della Porta. Er empfahl die Kamera als Hilfsmittel beim Zeichnen, eine Funktion, wegen der sie sich bald großer Beliebtheit erfreute. Der Astronom Johannes Kepler besaß eine tragbare Zeltversion, die er bei der Landvermessung in Österreich benutzte. Am Ende des 17. Jahrhunderts waren kleine Lochkameras, die man in der Hand halten konnte, alltäglich. Nebenbei sei erwähnt, dass das Auge des Nautilus, eines kleinen Tintenfisches, eine offene Lochkamera ist, die sich beim Untertauchen mit Seewasser füllt. Durch den Austausch des Betrachtungsschirms gegen eine lichtempfindliche Oberfläche, z. B. eine Fotoplatte, wird die Lochkamera zu einer Kamera im modernen Sinne des Wortes. Die allererste dauerhafte Fotografie wurde 1826 von Joseph Nicéphore Niépce (1765-1833) angefertigt. Er verwendete eine Boxkamera mit einer kleinen Sammellinse und einer lichtempfindlichen Zinnplatte, die eine etwa achtstündige Belichtungszeit benötigte. Die linsenlose Lochkamera (Abb. 5.112) ist bei weitem das unkomplizierteste Gerät dieser Art und hat trotzdem einige in der Tat bemerkenswerte Vorteile. Sie kann ein sehr gut aufgelöstes, praktisch unverzerrtes Bild von Objekten über einen großen Bildfeldwinkel und einen großen Entfernungsbereich (große Tiefenschärfe) erzeugen. Wenn die Eintrittspupille sehr groß ist, ergibt sich kein Bild. Verkleinert man ihren Durchmesser, so entsteht ein immer schärfer werdendes Bild. Eine weitere Verkleinerung der Lochblende über einen bestimmten Punkt hinaus lässt das Bild wieder unscharf werden. Man erkennt sehr schnell, dass die Öffnungsgröße für die maximale Schärfe proportional zu ihrem Abstand von der Bildebene ist. (Ein Lochdurchmesser von 0,5 mm in 0,25 m Entfernung von der Filmplatte funktioniert gut.) Die Strahlen werden nicht fokussiert, weshalb es nicht Fehler im Mechanismus sind, die für den Abfall der Schärfe verantwortlich sind. Wie wir noch sehen werden (Abschnitt 10.2.5), handelt es sich in Wirklichkeit um ein Beugungsproblem. In den meisten Situationen 9

Siehe W. H. Price, „The Photographic Lens“, Sci. Am. 72 (August 1976).

434

5 Geometrische Optik

Abb. 5.112: Die Lochkamera. Man beachte die Veränderung der Bildschärfe, wenn der Lochdurchmesser abnimmt. (Fotos mit frdl. Genehmigung von Dr. N. Joel, UNESCO.)

ist die geringe Lichtstärke der Lochkamera (etwa 1:500) ihr größter Nachteil, denn sie hat zur Folge, dass die Belichtungszeiten selbst mit den empfindlichsten Filmen im Allgemeinen viel zu lang sind. Ein ruhender Gegenstand, beispielsweise ein Gebäude (siehe Foto), ist eine Ausnahme: Hier brilliert die Lochkamera. Abbildung 5.113 zeigt die wesentlichen Bestandteile einer beliebten, repräsentativen modernen Kamera, der einäugigen Spiegelreflexkamera. Das Licht, das die ersten Elemente der Kamera durchläuft, durchquert eine Irisblende, die teilweise dazu benutzt wird, die Belichtungszeit oder äquivalent die Blendenzahl zu regeln – sie ist effektiv eine verstellbare Aperturblende. Beim Austritt aus der Linse trifft das Licht auf einen beweglichen, um 45◦ geneigten Spiegel. Dieser reflektiert es durch die Mattscheibe zum Pentaprisma, von wo aus es durch den Sucher austritt. Der Druck auf den Auslöser bewirkt, dass sich die Blende auf einen vorher eingestellten Wert schließt, der Spiegel

Ein mit einer Lochkamera aufgenommenes Foto (Science Building, Adelphi University). Lochdurchmesser 0,5 mm, Abstand zur Filmebene 25 cm, A.S.A. 3000, Verschlusszeit 0,25 s. Man beachte die Tiefenschärfe. (Foto E. H.)

5.7 Optische Systeme

435

Verschlusszeitenwähler Filmtransporthebel Auslöser

Pentaprisma Sucherokular

Mattscheibe beweglicher Spiegel Verschluss

Irisblende

Film

Abb. 5.113: Die einäugige Spiegelreflexkamera.

aus dem Weg geschwenkt wird, der Schlitzverschluss sich öffnet und der Film belichtet wird. Der Verschluss schließt sich wieder, die Blende öffnet sich maximal, und der Spiegel fällt auf seinen Platz zurück. Heute besitzen die meisten Spiegelreflexkameras eine von verschiedenen möglichen Belichtungsmessvorrichtungen, die automatisch mit der Blende und dem Verschluss verbunden sind. Diese Bauteile wurden in Abbildung 5.113 der Einfachheit halber weggelassen. Um die Kamera scharf einzustellen, wird das gesamte Objektiv gegen die Filmebene oder von ihr weg bewegt. Da die Brennweite unveränderlich ist, muss sich auch a verändern, wenn sich a ändert. Man kann sich ungefähr vorstellen, dass der Bildfeldwinkel mit dem Teil der Umgebung zusammenhängt, der auf dem Foto erscheint. Außerdem muss die Bildqualität auf dem gesamten Foto befriedigend sein. Der Bildfeldwinkel ϕ (Abb. 5.114) ist der Winkel, der in der Linse die Filmfläche umschreibt. Als eine grobe, aber einigermaßen gute Näherung setzen wir  den diagonalen Abstand des Films gleich der Brennweite. So wird ϕ/2 ≈ tan−1 12 , das heißt ϕ ≈ 53◦ . Kommt das Objekt aus dem Unendlichen heran, muss a wachsen. Das Objektiv wird dann von der Filmplatte weg bewegt, damit das Bild scharf eingestellt bleibt, und das Bildfeld, das auf dem Film aufgenommen wird und dessen Rand die Feldblende ist, verkleinert sich. Bei einem Normalobjektiv einer Spiegelreflexkamera liegt die Brennweite zwischen 50 und 58 mm und der Bildfeldwinkel zwischen 40◦ und 50◦ . Bleibt die Filmgröße konstant, während man f verkleinert, so ergibt sich ein größerer Bildfeldwinkel. Dementsprechend reichen Weitwinkelobjektive für Spiegelreflexka-

5 Geometrische Optik

436

meras von f ≈ 40 mm bis zu ungefähr 6 mm, und ϕ bewegt sich zwischen etwa 50◦ und bemerkenswerten 220◦ (Letzteres trifft für spezielle Objektive zu, in denen Verzerrungen unvermeidbar sind). Das Teleobjektiv hat eine lange Brennweite von 80 mm und darüber. Folglich wird sein Bildfeldwinkel sehr schnell kleiner, bis er bei f ≈ 1000 mm nur noch wenige Grad beträgt.

Film

ϕ

f Abb. 5.114: Bildfeldwinkel bei einem auf unendlich eingestellten Objektiv.

Das Normalobjektiv muss ein großes Öffnungsverhältnis haben, um die Belichtungszeiten kurz zu halten. Überdies soll das Bild eben und unverzerrt sein, und das Objektiv sollte außerdem einen großen Bildfeldwinkel besitzen. Die Entwicklung eines neuen Objektivs beginnt mit einer Idee, die zu einer vielversprechenden neuen Form führt. In der Vergangenheit wurde diese dann mühsam, rein intuitiv und mithilfe von Erfahrungswerten perfektioniert, wobei immer neue Versuchskonfigurationen im Trial-and-error-Verfahren entstanden. Heute übernimmt der Computer diese Aufgabe, ohne dass zahlreiche Prototypen gebaut werden müssen. Viele heutige Objektive sind Varianten von altbekannten erfolgreichen Formen. Abbildung 5.115 veranschaulicht die allgemeine Konfiguration verschiedener wichtiger Objektive, die vom Weitwinkel- bis in den Telebereich reichen. Spezielle Beschreibungen werden nicht angegeben, da abweichende Varianten sehr zahlreich sind. Das Aviogon und das Zeiss-Orthometer sind Weitwinkelobjektive, während das Tessar und das Biotar oft Normalobjektive sind. Das Cooke-Triplet, das H. Dennis Taylor von Cooke and Sons 1895 vorstellte, wird immer noch hergestellt (man beachte die Ähnlichkeit zum Tessar). Sogar noch früher, um 1840, konstruierte Josef Max Petzval ein damals lichtstarkes Objektiv (Porträtobjektiv) für Voigtländer. Eine Vielzahl heutiger Objektive beruht auf diesem Typ.

5.7 Optische Systeme

437

Wild Aviogon

Zeiss-Orthometer

Tessar

(a)

Biotar-Doppelobjektiv vom Gauß-Typ (d)

Cooke-(Taylor-)-Triplet

(e)

Petzval-Objektiv

(f)

Magnar-Teleobjektiv

(g)

(b)

(c)

Abb. 5.115: Kameraobjektive.

5.7.7 Das Fernrohr Wer das Fernrohr erfand, ist keineswegs klar. Wahrscheinlich wurde es mehrmals erfunden. Sie erinnern sich, dass im 17. Jahrhundert Brillenlinsen bereits dreihundert Jahre lang bekannt waren. In dieser langen Zeitspanne scheint die zufällige Aneinanderreihung zweier geeigneter Linsen, die ein Fernrohr bilden, fast unvermeidlich. Jedenfalls ist es am wahrscheinlichsten, dass ein holländischer Optiker, möglicherweise sogar der bekannte Zacharias Janssen, der seinen Ruhm mit der Erfindung des Mikroskops erwarb, das erste Fernrohr konstruierte. Janssen hatte außerdem eine gewisse Ahnung vom Wert des Gerätes, durch das er spähte. Der früheste unstrittige Beweis der Entdeckung stammt vom 2. Oktober 1608, als Hans Lippershey beim holländischen Parlament ein Patent über ein Gerät für das Sehen in die Ferne (griech. teleskopos) beantragte. Übrigens wurden, wie Sie vielleicht vermuten, die militäri-

5 Geometrische Optik

438

schen Möglichkeiten des Fernrohrs sofort erkannt. Das Patent wurde deshalb nicht erteilt. Stattdessen kaufte die Regierung die Rechte an diesem Instrument, und Lippershey erhielt den Auftrag, seine Forschung fortzusetzen. Galilei hörte von dieser Arbeit und fertigte um 1609 ein eigenes Fernrohr unter Verwendung zweier Linsen und einer als Tubus dienenden Orgelpfeife an. Es dauerte nicht lange, bis er eine Anzahl von stark verbesserten Instrumenten konstruiert hatte und die Welt mit den astronomischen Entdeckungen in Staunen versetzte, für die er berühmt ist. Das Linsenfernrohr (Refraktor) Ein einfaches astronomisches Fernrohr, auch bekannt als Kepler-Fernrohr ist in Abbildung 5.116 gezeigt. Seine Hauptaufgabe besteht im Unterschied zum sehr ähnlichen Mikroskop darin, das Netzhautbild eines weit entfernten Objekts zu vergrößern. In der Darstellung ist das Objekt unendlich weit vom Objektiv entfernt, sodass das reelle Zwischenbild unmittelbar hinter seinem zweiten Brennpunkt entsteht. Dieses Bild ist das Objekt für das nächste Linsensystem, das Okular. Es folgt aus Tabelle 5.3, dass die Objektbrennweite fo maximal so groß wie die Brennweite fe sein darf, wenn das Okular ein virtuelles vergrößertes Endbild (innerhalb des Bereichs der normalen Akkomodation) erzeugen soll. In der Praxis steht die Lage des Zwischenbildes fest, und nur das Okular wird bewegt, um das Instrument scharf einzustellen. Man beachte, dass das Endbild umgekehrt ist; wenn wir das Teleskop für astronomische Beobachtungen verwenden, ist dies von geringer Bedeutung, zumal das Bild meist fotografiert wird. Bei sehr großen Objektweiten sind die einfallenden Strahlen praktisch parallel – das Zwischenbild liegt im zweiten Brennpunkt des Objektivs. Gewöhnlich ist das Okular so eingebaut, dass sein erster Brennpunkt mit dem zweiten Brennpunkt des Objektivs zusammenfällt, sodass die Strahlen, die von einem Punkt auf dem Zwischenbild diver-

Objektiv Objekt

Endbild

fe

Zwischenbild

fo

Okular

Abb. 5.116: Das astronomische Fernrohr (mit akkommodierendem Auge).

5.7 Optische Systeme

439 Ebene der Austrittspupille A

Hauptstra hl

D C

B

E

fo

fe d

Abb. 5.117: Das astronomische Fernrohr – konjugierte Punkte im Unendlichen.

gieren, das Okular parallel zueinander verlassen. Ein normalsichtiges Auge kann die Strahlen dann in entspanntem Zustand fokussieren. Wenn das Auge kurz- oder weitsichtig ist, kann man das Okular hinein- oder herausbewegen, sodass die Strahlen zum Ausgleich ein wenig divergieren oder konvergieren. (Liegt bei Ihnen Astigmatismus vor, so müssen Sie Ihre Brille aufbehalten, falls Sie gebräuchliche optische Geräte für direkte Beobachtungen benutzen.) Wir haben schon festgestellt (Abschn. 5.2.3), dass sowohl die hintere als auch die vordere Brennweite einer Kombination dünner Linsen gegen Unendlich geht, wenn der Abstand d der beiden Linsen voneinander gleich der Summe ihrer Brennweiten ist (Abb. 5.117). Das astronomische Fernrohr in dieser Konfiguration mit unendlich weit entfernten konjugierten Punkten nennt man afokal (ohne Brennweite). Nebenbei sei erwähnt, dass ein schmaler (paralleler) Laserstrahl, der in das hintere Ende eines auf Unendlich eingestellten Teleskops hineinleuchtet, am anderen Ende auch parallel, aber mit einem größeren Querschnitt austritt. Oft benötigt man eine breite, quasimonochromatische, ebene Welle; im Handel sind spezielle Geräte erhältlich, die genau solche Wellen erzeugen. Der Rand des Objektivs ist die Aperturblende, die die Eintrittspupille einschließt, da sich keine Linsen links davon befinden. Wird das Teleskop auf eine weit entfernte Galaxie eingestellt, so ist die optische Achse des Auges parallel zur optischen Achse des Teleskops. Die Eintrittspupille des Auges sollte dann mit der Austrittspupille des Teleskops zusammenfallen. Jedoch ist das Auge nicht unbeweglich. Der Blick überstreicht das gesamte Blickfeld, das gewöhnlich viele interessante Details enthält. Das Auge untersucht unterschiedliche Regionen des Feldes, indem es sich so dreht, dass die Strahlen des gewünschten Bildfeldpunktes auf den gelben Fleck treffen. Die Richtung, die der Hauptstrahl durch den Mittelpunkt der Eintrittspupille zum gelben Fleck einnimmt, heißt Hauptziellinie. Den Achspunkt, der bezüglich des Kopfes fest ist und durch den die Hauptziellinie unabhängig von der Ausrichtung des Augapfels geht, nennt man Zielschnittpunkt. Soll das Auge das Blickfeld durchwandern, so sollte der Zielschnittpunkt im Mittelpunkt der Austrittspupille des Fernrohrs liegen. In jenem Fall entspricht die Hauptziellinie stets einem Hauptstrahl, der durch den Mittelpunkt der Austrittspupille läuft, wie auch immer das Auge sich bewegt.

5 Geometrische Optik

440 Feldblende

α

Ebene der Austrittspupille

B

D Fe2 αa

C

E

Fo1

fo

fo

fe

fe

Abb. 5.118: Strahlwinkel eines Teleskops.

Angenommen, der Rand des sichtbaren Objekts im Objektiv schließt einen Halbwinkel α ein (Abb. 5.118). Dieser Winkel ist im Wesentlichen gleich dem Winkel αu , der mit dem bloßen Auge eingeschlossen würde. Wie in den vorhergehenden Abschnitten ist die Winkelvergrößerung αa . [5.75] M= αu Die Winkel αu und αa sind Maße für das Blickfeld im Objekt- bzw. Bildraum: Der erste Parameter ist der Halbwinkel des tatsächlich aufgefangenen Strahlenkegels, während der zweite dem scheinbaren Strahlenkegel entspricht. Tritt ein Strahl mit einer negativen Neigung in das Objektiv ein, so verlässt er das Okular mit einer positiven Neigung und umgekehrt. Um daher eine Winkelvergrößerung mit positivem Vorzeichen zu erhalten, wie es mit unserem bisherigen Gebrauch in Einklang steht (Abb. 5.102), müssen wir entweder αu oder αa negativ wählen – wir entscheiden uns für den erstgenannten Winkel, da der Strahl eine negative Neigung hat. Man beachte, dass der Strahl, der durch den ersten Brennpunkt des Objektivs geht, auch durch den zweiten Brennpunkt des Okulars läuft, d. h., Fo1 und Fe2 sind konjugierte Punkte. In der paraxialen Näherung ist α ≈ αu ≈ tan αu und αa ≈ tan αa . Das Bild füllt den Bereich der Feldblende aus, und die Hälfte von deren Ausdehnung ist gleich dem Abstand BC = DE. Daher ergibt der Quotient der Tangenswerte aus den Dreiecken Fo1 BC und Fe2 DE M =−

fo . fe

(5.83)

Es ist daher nicht überraschend, dass frühe brechende Teleskope recht flache Objektive (große Brennweiten) und somit sehr große Tubuslängen hatten. Das berühmte Teleskop von Johannes Hevelius (1611–1687) war 50 Meter lang. Objektive mit großen Brennweiten haben noch einen weiteren Vorteil: Je flacher die Linse, umso geringer wird die sphärische und die chromatische Aberration ausfallen.

5.7 Optische Systeme

441

Ein anderer zweckmäßiger Ausdruck für die Winkelvergrößerung M ergibt sich aus der Betrachtung der Transversalvergrößerung des Okulars. Da die Austrittspupille das Bild des Objektivs ist (Abb. 5.118), erhalten wir MT e = −

fe fe =− . x fo

Wenn außerdem Do der Durchmesser des Objektivs und Dep der Durchmesser seines Bildes, der Austrittspupille, ist, so gilt MT e = Dep /Do . Diese beiden Ausdrücke führen durch Vergleich mit Gleichung (5.83) zu M=

Do . Dep

(5.84)

Der Durchmesser des Lichtzylinders, der in das Teleskop eintritt, ist gegenüber dem Durchmesser des Lichtzylinders, der das Okular verlässt, um einen Faktor größer, der gleich der Vergrößerung des Instruments ist – dies ist direkt aus der Geometrie des Bereichs zwischen den Linsen in Abbildung 5.117 ersichtlich. Hier ist Dep tatsächlich eine negative Größe, da das Bild umgekehrt ist. Es ist relativ leicht, ein einfaches Linsenteleskop zu bauen: Man braucht nur eine Linse mit langer Brennweite vor eine mit kurzer Brennweite zu halten, wobei man darauf achten muss, dass d = fo + fe ist. Sehr gut korrigierte teleskopische Elemente haben aber im Allgemeinen mehrteilige (zwei- oder dreiteilige) Objektive. Beispiel 5.17 Ein kleines Kepler-Fernrohr, das bei unendlich entfernten konjugierten Punkten arbeitet, besteht aus zwei dünnen Sammellinsen, die 105 cm voneinander entfernt sind. In dieser Konfiguration liefert das Fernrohr eine Winkelvergrößerung von 20. Der Beobachter zieht dann das Okular 5,0 cm heraus, um ein nahegelegenes Objekt mit entspanntem Auge betrachten zu können. Wie weit ist dieses Objekt entfernt? Lösung (a) Für unendlich entfernte konjugierte Punkte gilt d = fo + fe = 1,05 m , und da das Bild invertiert ist, gilt −20 = −

fo . fe

5 Geometrische Optik

442

Daraus folgt 20fe + fe = 1,05 fe = 0,05 m und fo = 1,00 m . Für das entspannte Auge ist a = ∞, und das Zwischenbild wird im Brennpunkt des Okulars gebildet. Dieser Punkt liegt nun 105 cm hinter dem Objektiv. Für das Objektiv ist a = 1,05 m, fo = 1,00 m und 1 1 1 +  = a a f 1 1 1 + = a 1,05 1,00 Das Objekt befindet sich a = 21 m vor dem Objektiv.

Wenn die Orientierung des Objekts von Bedeutung ist, muss ein Teleskop ein Aufrichtesystem haben. Ein derartiges Teleskop nennt man ein Erdfernrohr. Meist ist dabei eine einzelne Umkehrlinse oder ein Linsenaufrichtesystem zwischen Okular und Objektiv eingebaut. Abbildung 5.119 zeigt ein Erdfernrohr mit einem verkitteten zweiteiligen Objektiv und einem Kellner-Okular. Es benötigt offensichtlich einen langen Auszug (Tubus) und gehört jener schönen Art an, die man mit Segelschiffen und Kanonenkugeln in Verbindung bringt. Austrittspupille

Objektiv

aufrichtendes system

Okular

Abb. 5.119: Ein Erdfernrohr.

Ferngläser (Doppelfernrohre) enthalten im Allgemeinen Aufrichteprismen, die dieselbe Aufgabe auf kleinerem Raum erfüllen und außerdem den gegenseitigen Abstand der Objektive vergrößern, wodurch das räumliche Sehen verbessert wird. Meist handelt es sich um doppelte Porro-Prismen wie in Abbildung 5.120. (Man beachte das komplizierte modifizierte Erfle-Okular, die große Feldblende und das zweiteilige

5.7 Optische Systeme

443

Abb. 5.120: Ein Fernglas.

achromatische Objektiv.) Im Allgemeinen sieht man auf Ferngläsern Zahlenmarkierungen, beispielsweise 6×30, 7×50 oder 20×50 usw. Die erste Zahl gibt die Vergrößerung an, hier 6×, 7× oder 20×. Die zweite Zahl ist der Durchmesser der Eintrittspupille oder, gleichbedeutend, die freie Öffnung des Objektivs, die in Millimetern angegeben wird. Aus Gleichung (5.84) folgt, dass der Durchmesser der Austrittspupillen gleich dem Quotienten aus der zweiten und der ersten Zahl ist, in diesem Fall 5, 7,1 und 2,5 (jeweils in Millimetern). Hält man das Instrument etwas weiter vom Auge weg, so sieht man die helle kreisförmige Austrittspupille von Schwärze umgeben. Um sie zu messen, stellt man das Gerät auf Unendlich ein, richtet es gegen den Himmel und beobachtet die genau abgegrenzte scharfe Lichtscheibe auf einem Blatt Papier, das man als Schirm benutzt. Man kann auf diese Art auch den Augenabstand messen. Das Teleskop ist afokal, wenn d = fo + fe ist; dies gilt selbst bei negativer Okularbrennweite. Das von Galilei gebaute Teleskop (Abb. 5.121) hatte eine solche Zerstreuungslinse als Okular und erzeugte deshalb ein aufrechtes Bild [in Gl. (5.83) ist fe < 0 und M > 0]. Ein von einem entfernten Objekt ausgehendes paralleles Strahlenbündel tritt in die Objektivlinse (L1 ) ein, und nachdem es diese verlassen hat, konvergiert es zu einem Punkt P in deren Brennebene, der die Entfernung fo hat. Dieser Punkt ist durch den Strahl 1 lokalisiert, der parallel zum Strahlenbündel durch den Mittelpunkt von L1 gezogen wird. Da die beiden Linsen einen gemeinsamen Brennpunkt haben (ganz rechts), liegt P auch in der Brennebene von L2 . Wir konstruieren nun Strahl 2, der durch den Mittelpunkt von L2 weiter zu P geht. Strahl 1, Strahl 2, Strahl 3 und Strahl 4 laufen in L2 alle in die Richtung von P , der ein virtueller Objektpunkt für diese Linse ist. Wie wir bereits in Abbildung 5.31 b gesehen haben, bestimmt Strahl 2, der durch den Mittelpunkt der Linse geht, die Richtung, welche die restlichen Strahlen beim Austritt aus der Linse nehmen werden; sie verlaufen alle parallel zueinander. Die Strahlen, die in das Teleskop eintreten, sind wie diese nach unten geneigt. Eine Person, die das austretende Licht beobachtet, sieht ein vergrößertes, aufrechtes, virtuelles Bild, das im Prinzip im Unendlichen lokalisiert ist. Mit den gleichen Brennweiten erreicht das Galilei-Fernrohr die gleiche Vergrößerung (MP = −fo /fe ) wie das

5 Geometrische Optik

444 L1

L2 Strahl 3 Strahl 2

Strahl 1

O1

O2

F2

F2

Strahl 5

F1 P

Strahl 4 fe

fo

(a)

finales Bild

L1 Objektiv

d (b)

fo

fe

L2 Okular

Strahl 2 F1

(c)

Strahl 5

F2 F 1

F2

P fe fo

fe

Zwischenbild

(d)

Abb. 5.121: Das Galilei-Fernrohr. Galileis erstes Fernrohr hatte ein plankonvexes Objektiv (5,6 cm Durchmesser, f = 1,7 m, R = 93,5 cm) und ein plankonvexes Okular. Beide Linsen schliff der Forscher selbst. Das Gerät vergrößerte dreifach, im Unterschied zu Galileis letztem Teleskop, das eine Vergrößerung von 32× besaß. (Foto E. H.)

astronomische Fernrohr, wobei sie wegen fe < 0 nun positiv ist (das Bild ist aufrecht). Die in Abbildung 5.121 a gezeigte Linsenanordnung kann auch virtuelle, aufrechte Bilder und reelle, umgekehrte Bilder erzeugen. Um dies zu sehen, untersuchen wir Strahl 5, der durch den vorderen Brennpunkt von L1 geht und diese Linse parallel zur optischen Achse verlässt. Er tritt aus L2 parallel zu den übrigen austretenden Strahlen aus, wobei es so scheint, als würde er vom vorderen Brennpunkt von L2 kommen. Beachten Sie, dass das von L1 erzeugte umgekehrte Zwischenbild sich nicht ändern wird, wenn wir L2 entlang der Achse verschieben. Wenn die Zerstreuungslinse ein wenig nach links verschoben wird (Abbildung 5.121 c), entsteht links von L2 im Schnittpunkt der nach hinten verlängerten Strahlen 2 und 5 ein vergrößertes, aufrechtes, virtuelles Bild; das finale Bild des umgekehrten Zwischenbildes ist nochmals umgekehrt, sodass sich am Ende ein aufrechtes Bild ergibt. Wenn das Okular eines Galilei-Teleskops solchermaßen positioniert ist, muss das Auge des Betrachters akkommodieren. Wenn L2 dagegen ein wenig nach rechts, also näher an das stationäre Zwischenbild, verschoben wird, ändert Strahl 5 seine Austrittsrichtung aus L2 nicht, doch Strahl 2, der durch P geht, kommt steiler heraus, und die beiden Strahlen konvergieren zu einem reellen, umgekehrten Zwischenbild rechts von L2 . Als Teleskop ist das System heute eher von historischem und didaktischem Interesse. Im Handel sind allerdings noch galileische Ferngläser erhältlich, zwei nebeneinander montierte Teleskope des beschriebenen Typs. Man kann sie zur Aufweitung eines Laserstrahls benutzen, da sie keine inneren Brennpunkte besitzen, in denen ein Hochleistungsstrahl sonst die umgebende Luft ionisieren würde.

5.7 Optische Systeme

445

Spiegelteleskope (Reflektoren) Mithilfe eines Teleskops wollen wir Dinge scharf sehen, die weit entfernt und oft sehr schwach sichtbar sind. Wir müssen in der Lage sein, feine Details aufzulösen, d. h., sehr kleine, eng benachbarte Strukturen wie etwa die Sterne eines Doppelsternsystems einzeln zu erkennen. Ein Spionagesatellit, der sich bewegende Menschen auflösen kann, ist schon sehr nützlich; aber einer, der auch noch ihre Staatszugehörigkeit aus den militärischen Rangabzeichen ermitteln kann, ist noch besser. Das eben beschriebene Merkmal ist das Auflösungsvermögen, das mit dem Durchmesser D der Öffnung steigt. Bei ansonsten gleichen Parametern (und bei idealer Sicht) weist ein Teleskop mit großer Öffnung ein besseres Auflösungsvermögen auf als eines mit einer kleineren Öffnung. Es gibt allerdings noch einen wichtigeren Grund, die Öffnung möglichst groß zu halten: die Lichtstärke. Ein Teleskop mit einer großen Öffnung kann mehr Licht auffangen und schwächere Objekte darstellen als ein sonst identisches kleineres. Große Linsen zu fertigen ist relativ kompliziert: Das weltgrößte Linsenteleskop in Yerkes, Williams Bay (Wisconsin), hat einen Linsendurchmesser von 40 Zoll (reichlich 1 m), während der Spiegel des Teleskops auf dem Mount Palomar in Kalifornien 200 Zoll (reichlich 5 m) im Durchmesser misst. Die Sowjetunion errichtete in Selentschukskaja ein Spiegelteleskop mit 6,1 m Durchmesser. Die Probleme sind verständlich: Eine Linse muss transparent und blasenfrei sein, ein Oberflächenspiegel nicht. Eine Linse kann nur an ihrem Rand gehalten werden und hängt unter dem Eigengewicht durch; ein Spiegel kann am Rand und auf der Rückseite befestigt werden. Außerdem treten bei Spiegeln keine chromatischen Aberrationen auf, da es keine Brechung und damit keine wellenlängenabhängige Lichtablenkung gibt. Aus diesem und anderen Gründen (unter anderem der gute Kontrast) überwiegen die Reflektoren in der Klasse der großen Teleskope. Der Schotte James Gregory (1638–1675) erfand 1661 das Spiegelteleskop. Die erste erfolgreiche Konstruktion stammt von Newton (1668). Erst ein Jahrhundert später machte William Herschel das Gerät zum wichtigen Forschungsinstrument. Abbildung 5.122 stellt einige Reflektoranordnungen mit konkavem parabolischem Primärspiegel vor. Das Hale-Teleskop ist mit einem Durchmesser von 5,08 m so gewaltig, dass eine kleine Einfassung, in der ein Beobachter sitzen kann, im primären Brennpunkt angeordnet ist (Abb. 5.122 a). In der Version von Newton (Abb. 5.122 b) lenkt ein ebener Spiegel oder ein Prisma das Strahlenbündel rechtwinklig zur Teleskopachse heraus, wo es fotografiert, beobachtet, spektral analysiert oder fotoelektrisch bearbeitet werden kann. In der klassischen Anordnung von Gregory (Abb. 5.122 c), die nicht besonders verbreitet ist, invertiert ein konkaver sekundärer Ellipsoidspiegel das Bild wieder, indem er das Strahlenbündel durch ein Loch im Primärspiegel in die alte Richtung reflektiert. Das Cassegrain-System (Abb. 5.122 d verwendet einen konvexhyperbolischen Sekundärspiegel, um die Äquivalentbrennweite zu vergrößern (siehe Abb. 5.57). Es arbeitet so, als hätte der Primärspiegel dieselbe Öffnung, aber eine größere Brennweite bzw. einen größeren Krümmungsradius.

5 Geometrische Optik

446 (a)

(c)

Gregory-Spiegelteleskop

Primärer Brennpunkt eines Spiegelteleskops mit parabolischen Hauptspiegel

(b)

Newtonsches Spiegelteleskop

(d)

Cassegrain-Spiegelteleskop

Abb. 5.122: Spiegelteleskope.

Das einfache Teleskop mit einem einzigen Parabolspiegel (Abb. 5.122 a) wurde für die Benutzung mit Strahlen konstruiert, die parallel zur optischen Achse einfallen. Doch es gibt immer Beobachtungsobjekte, die sich nicht im Mittelpunkt des Bildfeldes befinden. Wenn ein paralleles nichtaxiales Strahlenbündel an einem Paraboloid reflektiert wird, treffen sich nicht alle Strahlen in einem Punkt. Das Bild eines weit entfernten Punktes (etwa eines Sterns), der sich nicht auf der optischen Achse befindet, ist ein nichtaxialer asymmetrischer Streufleck, der durch die Kombination der Abbildungsfehler Koma und Astigmatismus (siehe Abschn. 6.3.1) entsteht. Diese Unschärfe kann schnell unakzeptabel werden, wenn sich das Objekt weiter von der Achse weg befindet; dies ist vor allem durch die Koma bedingt. Dadurch ist das nutzbare Bildfeld ziemlich klein. Selbst ein lichtschwaches 1:10-System hat ein akzeptables Bildfeld von nur 9 Bogenminuten von der Achse aus gemessen, das sich für ein 1:4-System auf 1,4 Bogenminuten verkleinert. Das Bildfeld der klassischen Zwei-Spiegel-Teleskope (Abb. 5.122 b–d) ist durch die Koma ähnlich stark eingeschränkt. Übrigens: Stellen Sie sich vor, wir geben eine Flüssigkeit, etwa Quecksilber, in ein flaches, waagerecht stehendes Becken und lassen dieses Becken mit einer konstanten Geschwindigkeit ω um seine senkrechte Achse rotieren. Die Gleichgewichtsform der Oberfläche der Flüssigkeit ist dann eine Parabel, deren Erhebung z über den niedrigsten Punkt des Flüssigkeitsspiegels in jedem Punkt der Fläche gegeben ist durch z=

ω2r2 . 2g

(5.85)

Nach diesem Prinzip wurden große (Durchmesser bis zu 3 m), robuste, beugungsbegrenzte Flüssigkeitsspiegel hergestellt. Beim Einsatz in Teleskopen (siehe Foto S. 447) bieten sie im Vergleich zum Glasspiegel vor allem einen Vorteil: Sie sind weitaus billiger. Ihr wichtigster Nachteil ist, dass sie nicht geneigt angeordnet werden können.

5.7 Optische Systeme

447

Dieses Teleskop in New Mexico ist mit einem rotierenden Flüssigkeitsspiegel (3 m Durchmesser) ausgerüstet. Die NASA verwendet es, um Bruchstücke bis hinunter zu Größen von 5 cm aufzuspüren, die sich im All auf erdnahen Umlaufbahnen bewegen.

Aplanatische Reflektoren Ein optisches System, dessen sphärische Aberration und Koma (siehe Abschn. 6.3.1) vernachlässigbar sind, nennt man einen Aplanaten. Es gibt aplanatische Varianten sowohl des Cassegrain- als auch des Gregory-Teleskops. Das Ritchey-Chrétien-Teleskop ist ein aplanatisches Cassegrain-Teleskop mit hyperbolischen Primär- und Sekundärspiegeln. Diese Konfiguration hat sich in letzter Zeit als System der Wahl für Instrumente mit Öffnungen über 2 m etabliert. Das vielleicht bekannteste Beispiel dieser Bauart ist das 2,4 m-Hubble-Weltraumteleskop, das in Abbildung 5.123 zu sehen ist. Nur weltraumgestützte (über der absorbierenden Atmosphäre befindliche) Teleskope arbeiten effektiv im ultravioletten Bereich, in dem man beispielsweise heiße, junge Sterne untersuchen kann. Mit seinem 1993 neu installierten CCD-Arrays kann das Hubble-Teleskop von etwa 1 µm im IR bis 121,6 nm im UV „sehen“ und bildet damit eine Ergänzung zu den erdgestützten Teleskopen, die beugungsbegrenzte Abbildungen im Wellenlängenbereich über 10 µm erzeugen können. (Übrigens sind CCD-Sensoren etwa 50-mal empfindlicher als vergleichbare optische Filme; das Zeitalter, in dem man noch Filmrollen aus Spionagesatelliten herausholen musste, ist vorbei!) Das Bildfeld des Ritchey-Chrétien-Teleskops, das wenig oder keine Koma aufweist, wird durch Astigmatismus begrenzt. Damit besitzt ein 1:10-Instrument ein akzeptables Bildfeld von etwa 18 Bogenminuten, doppelt so groß wie das eines parabolischen Teleskops. Im Vergleich zur aplanatischen Variante des Gregory-Teleskops hat das Ritchey-Chrétien-Teleskop einen kleineren Sekundärspiegel, was die Lichtdurchlässigkeit vergrößert, und es ist wesentlich kürzer. Aufgrund dieser beiden Merkmale ist es wesentlich gefragter. Da ein Instrument nur einen Teil der eintreffenden Wellenfront zu einem Bild verarbeiten kann, sind Beugungseffekte unvermeidlich: Das Licht weicht von der geradlinigen Ausbreitung ab und verteilt sich etwas über die Bildebene. Wenn ein optisches System mit einer kreisförmigen Aperturblende ebene Wellen aufnimmt, entsteht kein Bildpunkt, sondern das Licht verteilt sich über einen kleinen kreisförmigen Fleck, das so genannte Airy-Scheibchen, das etwa 84 % der Energie enthält und von sehr schwachen

5 Geometrische Optik

448

Licht von einem entfernten Objekt Objektivabdeckung

Streulichtdämpfer

0.3 mSekundärspiegel Radioantenne

2.4 mPrimärspiegel optische Leitsensoren

Drei Spiegel leiten Licht zu den Leitsensoren um.

wissenschaftliche Instrumente

Sonnensegel

Abb. 5.123: Das Hubble-Weltraumteleskop. Der Flugkörper ist 13 m lang (etwa 4,80 m Abstand zwischen Primär- und Sekundärspiegel) und hat eine Masse von 11 600 kg. Die Umlaufhöhe beträgt zwischen 591 und 599 km, die Umlaufzeit 96 Minuten. Den Primärspiegel des Teleskops sehen Sie auf dem Foto S. 367.

5.7 Optische Systeme

449

Ringen umgeben ist. Der Radius des Airy-Scheibchens bestimmt die Überlappung benachbarter Bilder und damit die Auflösung. Deshalb nennt man ein Abbildungssystem, das so perfekt wie möglich konstruiert wurde, beugungsbegrenzt. Für ein ideales Instrument ergibt Gleichung (10.59) eine ideale Auflösung, nämlich den Radius des Airy-Scheibchens, von 1,22λ/D (im Bogenmaß). Hierbei ist D der Durchmesser des Instruments in Einheiten der Wellenlänge. Ausgedrückt in Bogensekunden ist die Winkelauflösung 2,52 × 105 λ/D. Bedingt durch atmosphärische Verzerrungen haben terrestrische Teleskope unabhängig von ihrer Größe selten eine bessere Winkelauflösung als eine Bogensekunde. Dies bedeutet, dass zwei Sterne, die weniger als eine Bogensekunde voneinander entfernt sind, als nicht mehr auflösbarer Streufleck dargestellt werden. Im Vergleich dazu hat das Hubble-Weltraumteleskop, das sich weit oberhalb der Atmosphäre befindet, bei λ = 500×10−9 m eine beugungsbegrenzte Winkelauflösung von etwa 0,05 Bogensekunden. Zu den größten Teleskopen der Welt gehören die Keck-aplanatischen Zwillings-Cassegrains. 85 m voneinander entfernt, stehen diese beiden gigantischen Teleskope auf dem Gipfel des erloschen Vulkans Mauna Kea auf Hawaii in einer Höhe von 4145 m. Jedes besitzt einen hyperbolischen 10-m-Primärspiegel, der aus 36 hexagonalen Elementen aufgebaut ist. Diese sind relativ stark gekrümmt, sodass das 1:1,75-System eine Brennweite von nur 17,5 m besitzt. Dies ist bezeichnend für die neue Generation großer Teleskope, in denen lichtstarke Spiegel (besser als 1:2) mit recht kurzer Brennweite zur Anwendung kommen. Kurze Teleskope sind wesentlich kostengünstiger zu fertigen und einzubauen, zudem sind sie stabiler und genauer steuerbar. Eines der größten optischen Einzelteleskope der Welt ist das Gran Telescopio Canarias (GTC) auf der Kanareninsel La Palma. Ähnlich einem Keck-Teleskop, aber etwas größer, hat es einen Primärspiegel aus 36 hexogonalen Segmenten, die unabhängig voneinander bewegt werden können. Seine Gesamtfläche von 75,7 m2 entspricht der eines kreisförmigen Spiegels von 10,4 m Durchmesser. Das erste Licht erreichte das GTC im Jahr 2007, doch das Teleskop behielt den Titel „größtes“ nicht allzu lange. Eine neue Generation von gigantischen terrestrischen Teleskopen befindet sich derzeit im Aufbau. Zu den größten gehören das Giant Magellan Telescope (GMT), das Thirty Meter Telescope (TMT) und das Extremely Large Telescope (ELT). Neben diesen terrestrischen Giganten muss auch das im Bau befindliche James Webb Space Telescope (JWST) der NASA genannt werden, ein 6,5-m-Instrument, das hauptsächlich im Infrarotbereich arbeitet und das voraussichtlich ab 2018 etwa eine Million Meilen von der Erde entfernt seine Bahnen ziehen wird. Als repräsentativen Vertreter dieser mächtigen, neuen Augen ins Universum wollen wir das GMT betrachten. Das Giant Magellan Telescope, dessen Fertigstellung für das Jahr 2017 geplant ist, besteht aus sieben monolithischen Spiegeln aus Borsilikatglas, die jeweils einen Durchmesser von 8,4 m haben und hexagonal angeodnet sind (siehe Abb. 5.124). Alle sieben Spiegel (einer in der Mitte, die anderen um diesen herum) sind so geschliffen, dass sie eine durchgängige, leicht ellipsoidale optische Fläche bil-

450

5 Geometrische Optik

den. Die Sammelfläche der gesamten Anordnung entspricht einem Durchmesser von 21,9 m. Da die Hauptspiegel eine glatte Oberfläche bilden, ist das Auflösungsvermögen so groß wie bei einem 24,5 m-Spiegel, dessen Aufnahmen zehnmal so scharf sind wie die Bilder des Hubble-Teleskops. Mit einer Brennweite von 18 m hat der Primärspiegel ein Öffnungsverhältnis von f /0,7. Das aplanatische Gregory-Design verlangt nach einem sekundären Spiegelsystem, das aus sieben einzelnen, dünnen adaptiven, konkaven Segmenten besteht. Die Kombination des Primärsystems mit dem Sekundärsystem ergibt eine effektive Brennweite von 203 m bei f /8,0.

Abb. 5.124: Schematische Darstellung des Giant Magellan Telescope. Unten links ist eine Person eingezeichnet, um eine Vorstellung von der Größe des Teleskops zu vermitteln. (National Academy of the Sciences)

Inzwischen wurden Technologien entwickelt, um die Bilder einer Anzahl getrennter optischer Teleskope interferometrisch zu kombinieren und dadurch die effektive Gesamtöffnung deutlich zu vergrößern. So wird eine neue Generation bodengestützter optischer Teleskope wesentlich zu unserem Bild des Universums beitragen. Katadioptrische Teleskope Eine Kombination aus reflektierenden (katoptrischen) und brechenden (dioptrischen) Elementen nennt man ein katadioptrisches System. Das bekannteste System dieser Art, wenn auch nicht das erste, ist das klassische Schmidtsche Spiegelteleskop. Wir wollen es hier zumindest kurz behandeln, da es einen wichtigen Ansatz zur Konstruktion von Reflektorsystemen mit hoher Lichtstärke und großem Bildfeld darstellt. Wie in Abbildung 5.125 zu sehen, erzeugen Bündel von parallelen Strahlen, die von einem sphärischen Spiegel reflektiert werden, Bilder (z. B. eines Sternenfeldes) in einer kugelförmigen Fläche, in welche man eine gekrümmte Fotoplatte legen kann. Diese Anordnung ist zwar frei von anderen Bildfehlern (siehe Abschn. 6.3.1) wie Astigmatismus und Koma, aber Strahlen, die von einem äußeren Teil des Spiegels stammen, sammeln sich nicht in demselben Brennpunkt wie Strahlen, die vom paraxialen Be-

5.7 Optische Systeme

C

451

C

F

(b) (a)

Fotoplatte C

(c) Korrekturplatte

Abb. 5.125: Ein optisches System nach Schmidt.

reich des Spiegels reflektiert werden. Anders ausgedrückt, der Spiegel ist kugelförmig und nicht parabelförmig und weist deshalb sphärische Aberrationen auf (Abb. 5.125 b). Wenn diese korrigiert würden, wäre das System (zumindest theoretisch) als ideales Abbildungssystem mit einem großen Bildfeld verwendbar. Da es nicht nur eine optische Achse gibt, existieren keine nichtaxialen Punkte. Wir erinnern uns, dass Paraboloide nur scharfe Abbildungen von Punkten auf der optischen Achse erzeugen, wobei sich das Bild außerhalb der Achse schnell verschlechtert. Eines Abends im Jahre 1929 zeigte Bernhard Waldemar Schmidt (1879–1935) bei der Rückkehr von einer Expedition zu einer Sonnenfinsternis auf den Philippinen einem Kollegen die Skizze eines Systems, das er zur Korrektur von sphärischen Aberrationen eines Kugelspiegels entworfen hatte. Es enthielt eine dünne Korrekturplatte aus Glas (Schmidt-Platte), in deren Oberfläche eine sehr flache Krümmung geschliffen war (Abb. 5.125 c). Lichtstrahlen, die die äußeren Bereiche durchliefen, würden um genau den Betrag abgelenkt, der nötig ist, damit sie auf der Bildkugelfläche scharf fokussiert werden. Die Korrekturplatte musste einen Fehler beseitigen, ohne in nennenswertem Umfang andere Aberrationen einzuführen. Das erste System wurde 1930 gebaut, und das berühmte 1,22-m-Schmidt-Spiegelteleskop des Palomar-Observatoriums wurde 1949 vollendet. Es ist ein lichtstarkes (1:2,5) Weitwinkelsystem, ideal zur Betrachtung des Nachthimmels. Eine einzige fotografische Abbildung könnte einen Bereich von

5 Geometrische Optik

452

der Ausdehnung des Großen Wagens umfassen (ohne Deichsel; der Große Wagen ist eine populäre Teilmenge des Sternbilds des Großen Bären). Man vergleiche dies mit den etwa 400 Fotografien eines 5,08-m-Reflektors, die die gleiche Fläche abdecken! Seit der Einführung des ursprünglichen Schmidt-Systems wurden große Fortschritte in der Konstruktion katadioptrischer Instrumente erzielt. Es gibt heute katadioptrische Verfolgungssysteme für Satelliten und Raketen, katadioptrische Kameras für die Beobachtung von Meteoren, kompakte Teleskope für den Amateurbereich, Teleobjektive und Raketenzielgeräte. In einigen der zahlreichen Varianten ist die Korrekturplatte durch Anordnungen konzentrischer Meniskuslinsen (Bouwers-Maksutov-System) ersetzt, in anderen werden massive, dicke Spiegel verwendet. Eine äußerst erfolgreiche Technik benutzt eine asphärische Tripletanordnung (Baker).

5.8

Wellenfrontumformung

Kapitel 5 beschäftigt sich damit, wie man Wellenfronten in der einen oder anderen Weise umformen kann. Konventionelle Linsen und Spiegel wirken jedoch auf die ganze verarbeitete Wellenfront in mehr oder weniger derselben Weise. Dagegen ist es seit neuestem möglich, einzelne Teile einer Wellenfront in spezieller Weise zu verarbeiten, sodass sie besonderen Anforderungen genügen. Betrachten wir eine Front aus ebenen Wellen, die entweder durch ein inhomogenes Medium mit dem Brechungsindex n (r) oder durch ein Medium ungleichmäßiger Dicke hindurchtritt – ein Stück einer Duschkabinenscheibe zum Beispiel (Abb. 5.126 a).

na einfallende Welle

(a)

verzerrte Welle

Gewöhnlicher Planspiegel

n(r) > na

verzerrendes Medium verzerrte Welle wird reflektiert (b)

Abb. 5.126: (a) Eine ebene Welle wird beim Durchgang durch ein inhomogenes Medium verzerrt. (b) Wenn so eine verzerrte Welle von einem gewöhnlichen ebenen Spiegel reflektiert wird, kehrt sie ihre Richtung um. Bereiche, die ursprünglich voraus- oder hinterherliefen, behalten diese Eigenschaft bei, wenn die Welle nun in ihrer neuen Richtung weiterläuft. Durchläuft die Welle das inhomogene Medium ein weiteres Mal, wird die Verzerrung noch verstärkt.

5.8 Wellenfrontumformung

453

Die Wellenfronten werden proportional zur optischen Weglänge zurückgehalten und dadurch entsprechend verzerrt. Wird eine solche verzerrte Welle anschließend von einem ebenen Spiegel reflektiert, so läuft sie in umgekehrter Richtung und ansonsten unverändert wieder zurück (Abb. 5.126 b). Die führenden und abschließenden Teile der Wellenfront bleiben auch nach der Reflexion führend bzw. abschließend, nur die Ausbreitungsrichtung hat sich umgekehrt; die Wellenfront bleibt verzerrt. Das Bild hinter der Scheibe einer Duschkabine bleibt verschwommen, gleichgültig, ob Sie es direkt oder durch einen Spiegel betrachten. Wenn man einen hoch entwickelten Spiegel bauen könnte, der die reflektierten Wellenfronten umformt, hätte man die Chance, die in vielen Situationen unerwünschten Verzerrungen wieder loszuwerden. Dieser Abschnitt untersucht zwei moderne Technologien, die genau dieses Ziel verfolgen.

5.8.1 Adaptive Optik Ein bedeutender Durchbruch in der Technologie der Teleskope, der sich momentan abzeichnet, wird adaptive Optik genannt. Die adaptive Optik bietet die Möglichkeit, dem lästigen Problem der atmosphärischen Verzerrungen zu begegnen. Newton drückte es so aus: „Wenn die Theorie des Teleskopbaus perfekt in die Praxis umgesetzt werden könnte, gäbe es doch immer bestimmte Grenzen, die die Leistung der Teleskope nicht zu überschreiten in der Lage wäre. Der Grund ist, dass die Luft, durch die hindurch wir zu den Sternen blicken, in ständiger Bewegung ist, wie wir am Zittern der Schatten hoher Gebäude und am Funkeln der Sterne sehen können.“ Adaptive Optik ist eine Methode, diese ständige Bewegung unter Kontrolle zu bekommen, indem man zuerst die Verzerrungen, die durch die Turbulenzen verursacht werden, misst; mithilfe dieser Informationen werden die Lichtwellen rekonfiguriert, d. h. in einen Zustand gebracht, als ob sie nie die wirbelnde Atmosphäre durchquert hätten (Abb. 5.127). Angeregt durch die Wärmeenergie der Sonne ist die Atmosphäre der Erde ein wogendes Meer turbulenter Luft. Dichteschwankungen haben Änderungen des Brechungsindex und damit der optischen Weglänge zur Folge. Wellenfronten, die von einem Punkt eines weit entfernten Sterns eintreffen, erreichen die Atmosphäre als fast ideale ebene Wellen (mit einer Wellenlänge in der Mitte des sichtbaren Bereiches bei etwa 500 nm). Wenn sie die etwa 150 km wogender Luftmassen durchquert haben, sind Weglängendifferenzen von wenigen Mikrometern entstanden, und die Wellenfronten werden zu welligen Flächen verformt. Am Boden kommen die Wellenfronten dann stark „zerknittert“ an. Um sich dies vorzustellen, denken Sie an einen festen Boden, der zunächst mit vielen winzigen harten, beweglichen Käfern bestreut und anschließend mit Fliesen von 10 cm Kantenlänge bedeckt wird. Die Fliesen neigen sich dann natürlich völlig zufällig in verschiedene Richtungen. Die atmosphärischen Turbulenzen ändern sich innerhalb von Millisekunden, und die Wellenfronten werden ständig neu geknickt und verformt – analog zu den Fliesen, die ihre Neigung unablässig ändern, wenn die Käfer unter ihnen hin- und herlaufen.

5 Geometrische Optik

454

Teleskop Σ1 einfallende verzerrte Wellenfront

schnell steuerbarer Planspiegel

Primärspiegel Neigungskorrektursignal Σ1 Σ2 Σ1

Strahlteiler

Σ2

verformbarer Spiegel

wissenschaftl. Instrumente Σ2

Antrieb Korrektursignale höherer Ordnung

Neigungskorrekturdaten

Hochspannungsantrieb Korrekturwerte höherer Ordnung Daten der ComWellenfront puter

Σ1

Σ1 Wellenfrontsensor

Abb. 5.127: Ein adaptives optisches System. Die verzerrte Wellenfront Σ1 wird analysiert und umgeformt. Die korrigierte ebene Wellenfront wird zu den wissenschaftlichen Instrumenten gelenkt.

Das Fliesenmodell ist sehr nützlich, wenn auch etwas seltsam. 1966 zeigte David L. Fried, dass die optischen Resultate atmosphärischer Turbulenzen in einer recht einfachen Weise modelliert werden können. Da die Lichtgeschwindigkeit so hoch ist, kann man annehmen, dass sich die Atmosphäre zu jedem Zeitpunkt verhält wie ein horizontales Netz kleiner, zusammenhängender, keilförmiger, brechender und stabiler Zellen (jede entspricht einer Fliese). Vor unserer Haustür haben diese Zellen eine Kantenlänge von etwa 10 cm, und unter günstigsten Bedingungen (bei einem Observatorium auf einem Hochgebirgsgipfel) können sie auch eine Größe von 20 cm, bei guter Sicht sogar von 30 cm erreichen. Innerhalb eines solchen isoplanatischen

5.8 Wellenfrontumformung

455

Gebiets ist die Wellenfront relativ glatt; der Unterschied zwischen den führenden Beulen und den abschließenden Einbuchtungen beträgt etwa λ/17. Eine Faustregel besagt, dass die Bildqualität sehr gut ist, wenn die Verzerrungen weniger als λ/10 betragen. Je intensiver die Turbulenzen sind, desto kleiner sind die stabilen Zellen und damit die isoplanatischen Gebiete der Wellenfront. Die Einwirkung der Turbulenzen auf das Bild, das ein Teleskop von einem Stern erzeugt, hängt stark von der Größe der Teleskopöffnung ab. Wenn das Instrument eine Öffnung von nur wenigen Zentimetern besitzt, ist das durchgelassene Segment der Wellenfront (das nur einen Teil einer stabilen Zelle durchquert hat) ziemlich flach. Die Turbulenz ändert dann in erster Linie die Neigung der flachen Wellenfront. In jedem Moment wird ein scharfes Airy-Scheibchen abgebildet, das aber auf der Bildebene umherwandert, je nachdem, wie sich die Atmosphäre ändert und nachfolgende Wellenfronten unter einem anderen Winkel eintreffen (unsere imaginären Käfer werden niemals müde!). Im Gegensatz dazu ist die Wellenfront, die von einem Teleskop mit großer Öffnung von mehreren Metern aufgefangen wird, ein Mosaik aus vielen flachen, aber geneigten Bereichen. Das Bild ist dann eine Überlagerung zahlreicher wandernder Airy-Scheibchen, was in einem schimmernden verschwommenen Fleck resultiert. Es ist klar, dass durch eine weitere Vergrößerung der Öffnung mehr Licht aufgefangen werden kann, was aber nicht zu einer proportionalen Erhöhung der Auflösung führt. Die kritische Öffnung, bei der die Verzerrungen merklich werden, ist ein Maß für die Turbulenz. Sie wird Fried-Parameter genannt und mit dem Symbol r0 bezeichnet (eine etwas unglückliche Wahl, weil es sich nicht um einen Radius handelt). Der Fried-Parameter ist gleich der Größe des Bereiches, über den die eintreffende Wellenfront als im Wesentlichen planar angenommen werden kann. In den seltenen Fällen, in denen er 30 cm überschreitet, wird ein weit entfernter Stern als Airy-Scheibchen dargestellt. Wenn die Turbulenz stärker wird, nimmt r0 ab; nimmt die Wellenlänge zu, steigt r0 : r0 ∝ λ1,2 . Daraus folgt, dass die Winkelauflösung eines großen bodengestützten Teleskops tatsächlich 1,22λ/r0 ist, und da r0 selten besser als 20 cm ist, hat das leistungsfähigste erdgebundene Instrument kaum eine bessere Auflösung als ein bescheidenes 15-cm-Fernrohr! Wenn Wind über dem Teleskop weht, werden die isoplanatischen Gebiete an der Öffnung vorbeigeblasen. Eine Brise von etwa 5 m/s trägt ein isoplanatisches Gebiet von 10 cm Durchmesser innerhalb von 20 ms hinweg. Um solche atmosphärischen Veränderungen zu erfassen und darauf zu reagieren, sollte ein elektro-optomechanisches Steuerungssystem 10- bis 20-mal schneller arbeiten, die Daten also häufiger als 1000mal pro Sekunde messen. Abbildung 5.127 zeigt ein Schema eines typischen astronomischen adaptiv-optischen Systems. Bei dieser einfachen Anordnung weist das Teleskop auf einen Stern, der gleichzeitig als Beobachtungsobjekt und als Messpunkt für die Korrektur der Verzerrungen dient. Bevor sich etwas Interessantes ereignet, wird der vom Primärspiegel

5 Geometrische Optik

456

Schaut man mit einem Fernrohr durch die Atmosphäre, so nimmt die Wahrscheinlichkeit, einen Augenblick lang scharf sehen zu können, mit dem Durchmesser der Blendenöffnung ab. Bei einem mäßig großen Objektiv (reichlich 20 cm Durchmesser) liegen die Chancen unter normalen Sichtbedingungen ungefähr bei 1:100. Diese im Abstand von 1/60 s aufgenommenen Ansichten eines Sterns zeigen, wie das Bild „funkelt“. Die Aufnahme ganz rechts entstand in einem Moment mit sehr guter Sicht. Bei einem beugungsbegrenzten Instrument sollte das Bild einem Airy-Scheibchen (siehe Abschn. 10.2.5) ähneln mit einem hellen mittleren Fleck, umgeben von schwachen konzentrischen Ringen. (Foto mit frdl. Genehmigung von Ron Dantowitz, Museum of Science, Boston.)

kommende große Strahl auf einen Durchmesser von wenigen Zentimetern gebracht, um ihn besser handhabbar zu machen. Dadurch wird jedes isoplanatische Gebiet zu einem entsprechend kleinen Gebiet in diesem komprimierten Strahl fokussiert. Im ersten Schritt wird die verzerrte Wellenfront Σ1 , die nun in miniaturisierter Form vorliegt, analysiert. Dies geschieht mit einem Wellenfrontsensor, wovon mehrere Typen existieren. Der hier beschriebene Typ ist ein Hartmann-Sensor (Abb. 5.128), der aus einem kompakten Feld tausender dicht gepackter unabhängiger Detektoren besteht. Das auf dem Sensor eintreffende Licht läuft zuerst durch eine Anordnung winziger, eng benachbarter, identischer Linsen, in deren Brennebene sich ein CCD-Sensor befindet (Abb. 5.128 a). Das Gerät wird derart im Strahl angeordnet, dass eine dieser Linsen ungefähr der Größe einer isoplanatischen Region entspricht. Jede Linse wirft nun ein kleines Bild des Sterns auf eine Gruppierung von vier CCD-Detektoren, durch deren gemeinsamen Schnittpunkt die optische Achse der Linse verläuft. Wäre die Wellenfront überall glatt, d. h., hätten die isoplanatischen Gebiete eine Neigung von null und wären sie parallel zueinander, würde jede dieser Linsen ein Airy-Scheibchen auf verzerrte Wellenfronten

kleine Linsen

CCD-Array (a)

CCD-Array

CCD-Array

(b)

(c)

Abb. 5.128: Der hartmannsche Wellenfrontsensor. (a) Winzige Linsen fokussieren Licht auf einen CCD-Chip. Jede quadratische Gruppe von jeweils vier Sensoren bildet einen Detektor. (b) Wenn die eintreffende Welle planar ist, werden Airy-Bilder auf den Schnittpunkten der jeweils vier Sensoren abgebildet. (c) Ist die Wellenfront verzerrt, wandern die Airy-Bilder aus diesen Schnittpunkten heraus.

5.8 Wellenfrontumformung

457

die optische Achse werfen, also genau auf den Schnittpunkt der vier CCD-Detektoren (Abb. 5.128 b). Wird aber nun ein isoplanatisches Gebiet geneigt, verschiebt sich der korrespondierende Bildpunkt, und die vier CCD-Detektoren melden ein ungleichmäßiges Signal, das die exakte Verschiebung wiedergibt (Abb. 5.128 c. Die Informationen aller dieser Sensoren werden durch einen Computer analysiert, Σ1 wird theoretisch rekonstruiert, und die zur Glättung der Wellenfront nötigen Korrekturen werden berechnet. Registriert man eine Neigung der Wellenfront, wird ein Signal zu dem schnell steuerbaren Planspiegel geleitet, der das Licht vom Primärspiegel erhält, und die Neigung wird kompensiert. Die nun ungeneigte, aber immer noch verzerrte Wellenfront trifft anschließend auf einen flexiblen Spiegel, der schnell und präzise verformt werden kann. Er könnte beispielsweise aus einer dünnen Spiegelplatte bestehen, die auf Hunderten von Spannvorrichtungen montiert ist, welche den Spiegel schnell in die gewünschte Form ziehen und drücken können. Gesteuert durch die Signale des Computers, wird der Spiegel in eine zur Wellenfront inverse Form gebracht. Dadurch treffen die Buckel der Wellenfront auf geeignete Vertiefungen des Spiegels und umgekehrt. Dies führt dazu, dass die reflektierte Wellenfront Σ2 von Verzerrungen befreit ist und sich in dem gleichen Zustand wie vor dem Eintritt in die Atmosphäre befindet. Ein kleiner Teil der Strahlungsenergie läuft zurück in den Sensor-Computer-SpiegelRegelkreis, um den Korrekturprozess kontinuierlich fortzuführen, während der Rest zu den wissenschaftlichen Instrumenten weitergeleitet wird. Die Ausdehung der Bilder vieler Beobachtungsobjekte wie Planeten, Galaxien, Nebel usw. schließt deren Verwendung als Messpunkt für die adaptive Optik aus. Zwar könnte man einen nahe gelegenen Stern als Messpunkt benutzen, doch häufig befinden sich keine ausreichend lichtstarken Sterne in der Nähe des Beobachtungsobjekts. Dieses Problem kann man beispielsweise dadurch lösen, dass man einen Laserstrahl einen künstlichen Leitstern erzeugen lässt (siehe Foto S. 458 links). Dies wurde bis jetzt auf zwei unterschiedliche Arten realisiert. Zum einen kann man einen in 10 bis 40 km Höhe fokussierten Laserstrahl durch das Teleskop projizieren. Ein Teil dieses Lichts wird von den Molekülen der Luft durch Rayleigh-Streuung zurückgestreut. Alternativ kann man auch eine atmosphärische Schicht von Natrium-Atomen (die vermutlich von Meteoren stammt) in einer Höhe von 92 km, also weit über den Turbulenzen, ausnutzen. Ein Laser mit der Wellenlänge von 589 nm kann diese Atome anregen und dadurch einen kleinen, hellen, gelben Messpunkt an einem beliebigen Ort des Himmels erzeugen. Die Resultate (Foto S. 458 rechts) sind so vielversprechend10 , dass die meisten der weltgrößten Teleskope adaptive Optiken entweder schon verwenden oder in naher Zukunft verwenden werden. 10

Siehe L. A. Thompson, „Adaptive Optics in Astronomy“, Phys. Today 47, 24 (1994); J. W. Hardy, „Adaptive Optics“, Sci. Am. 60 (Juni 1994); R. Q. Fugate und W. J. Wild, „Untwinkling the Stars – Part I“, Sky & Telescope 24 (Mai 1994); W. J. Wild und R. Q. Fugate, „Untwinkling the Stars – Part II“, Sky & Telescope 20 (Juni 1994).

458

Erzeugung eines Laserstrahl-Leitsterns am Phillips Laboratory, Kirtland Air Force Base, New Mexico. (Mit freundlicher Genehmigung des Phillips Laboratory, Department of the US Air Force)

5 Geometrische Optik

1 s-Belichtung von 53ξ Ursa Major mit einem 1,5m-Teleskop am Phillips Laboratory. Das gewöhnliche unkompensierte Bild (links) ist unbrauchbar, mit adaptiver Optik (rechts) verbessert es sich dramatisch. (Mit freundlicher Genehmigung des Phillips Laboratory, Department of the US Air Force)

5.8.2 Phasenkonjugation Ein weiteres wichtiges modernes Verfahren der Umformung von Wellenfronten ist die Phasenkonjugation. Dabei wird die betreffende Welle durch eine spezielle Art der Reflexion invertiert oder „umgekrempelt“. Betrachten wir dazu einen Zug ebener Wellen, der sich nach rechts in positiver zRichtung ausbreitet und senkrecht auf einen gewöhnlichen Planspiegel trifft. Die einfallende Welle kann man als Ei = E0 cos(kz − ωt) schreiben oder, in komple−iωt (bei Separation von orts! !i = E0 ei(kz−ωt) = E0 eikz e−iωt = E(z)e xer Form, als E und zeitabhängigem Anteil). Im Falle dieser einfachen geometrischen Anordnung verläuft die reflektierte Wellenfront deckungsgleich über die einfallende Front; beide Fronten sind bis auf die Ausbreitungsrichtung identisch. Die reflektierte Welle !r = E0 e−ikz e−iωt = E ∗ (z)e−iωt . Die Änist dann Er = E0 cos(−kz − wt) oder E derung des Vorzeichens des ortsabhängigen Teils der Phase kehrt die Richtung der Welle um; dasselbe erreicht man in der Exponentialform durch die Verwendung des konjugiert komplexen Terms. Aus diesem Grund nennt man die reflektierte Welle auch phasenkonjugiert oder kurz konjugiert. Würde man einen von einer derartigen Situation aufgenommenen Film sehen, so könnte man nicht unterscheiden, ob er vorwärts oder rückwärts abläuft. Die phasenkonjugierte Welle ist zeitlich invertiert. Bei monochromatischen Wellen ist die Umkehrung des Vorzeichens des zeitabhängigen Terms (d. h. die Zeitumkehr) äquivalent der Umkehrung der Ausbreitungsrichtung: cos[kz − ω(−t)] = cos(kz + ωt) = cos(−kz − ωt). Ein sehr einfacher Fall der phasenkonjugierten Reflexion liegt vor, wenn Wellen aus einer punktförmigen Quelle im Krümmungsmittelpunkt eines sphärisch konkaven Spiegels auf die Spiegelfläche fallen: Nach der Reflexion sammeln sich die Wellen

5.8 Wellenfrontumformung

459

wieder im Punkt ihres Ursprungs. Für jede beliebig geformte einfallende Wellenfront ließe sich prinzipiell eine gewöhnliche reflektierende Fläche konstruieren, die genau die Phasenkonjugierte der betreffenden Welle zurückwirft (siehe Abb. 5.129). In der Praxis wird sich ein solches Vorgehen jedoch kaum bewähren, insbesondere wenn man nicht vorhersagen kann, wie die einfallende Wellenfront geformt ist, oder wenn sich deren Gestalt laufend ändert. Glücklicherweise fand eine russische Forschergruppe 1972 eine Methode auf der Grundlage der Brillouin-Streuung, mit deren Hilfe man Phasenkonjugierte beliebig geformter Wellenfronten erzeugen kann. Dazu wurde ein intensiver Laserstrahl durch eine Röhre geleitet, die unter hohem Druck stehendes Methangas enthielt. Bei Leistungen von etwa einer Million Watt kommt es in der Röhre zu Druck-Dichte-Variationen, und das enthaltene Medium wird zu einem Spiegel mit außergewöhnlichen Eigenschaften, der das einfallende Licht nahezu vollständig reflektiert. Überraschenderweise wird der Strahl vom Gas phasenkonjugiert zurückgeworfen. Das Medium, in diesem Fall Methan, passt sich an das elektromagnetische Feld in einer Weise an, dass die einfallende Welle gerade ivertiert wird, sodass Regionen, die ursprünglich führten, jetzt hinterherlaufen. Inzwischen sind mehrere Medien mit nichtlinear-optischen Eigenschaften bekannt, mit deren Hilfe sich die beschriebenen Effekte erzielen lassen.

phasenkonjugierender gewöhnlicher Spiegel (a) Einfallende Wellenfronten

(b) Reflektierte Wellenfronten

Abb. 5.129: Die Funktion eines recht beschränkten phasenkonjugierenden Spiegels. Er funktioniert nur für die in (a) gezeigten einfallenden Wellenfronten.

5 Geometrische Optik

460

Es gibt eine Vielzahl potentieller Anwendungen, von der Satellitenverfolgung bis zur Verbesserung der Qualität von Laserstrahlen.11

verzerrendes Medium korrigierte Welle

phasenkonjugierte reflektierte Welle

(a)

(b)

Abb. 5.130: Wenn die verzerrte Welle aus Abbildung 5.126 von einem phasenkonjugierenden Spiegel reflektiert wird, wird sie „umgekrempelt“ oder konjugiert. Vergleichen Sie mit Abbildung 5.126 b. Beim zweiten Durchlaufen des inhomogenen Mediums werden vorauslaufende Teile der Wellenfront zurückgehalten und umgekehrt. Die austretenden Wellen sind nun identisch zu den einfallenden.

(c)

Abb. 5.131: Verwendung der Phasenkonjugation zur Entzerren von Bildern. (a) Bild einer Katze, das von einem Spiegel reflektiert wurde; es enthält keine Verzerrungen. (b) Dieselbe Welle der Katze nach zweimaligem Durchlaufen eines inhomogenen Mediums. (c) Hier wurde die Welle nach dem Durchqueren des inhomogenen Mediums phasenkonjugiert, bevor sie ein zweites Mal durch das inhomogene Medium lief. Die Verzerrungen sind fast vollständig verschwunden. (Foto mit freundlicher Genehmigung von Jack Feinberg, University of Southern California.)

Hier ein Beispiel, was alles damit möglich ist: Wenn ein Strahl, der durch ein inhomogenes Medium verzerrt wurde (Abb. 5.126), von einem ebenen Spiegel reflektiert wird und dieses Medium ein weiteres Mal durchläuft, wird der Strahl noch stärker verzerrt. Wird er dagegen von einem phasenkonjugierenden Spiegel reflektiert, erhält der Strahl nach dem nochmaligen Durchlaufen desselben Mediums seine ursprüngliche Gestalt zurück. Abbildung 5.130 illustriert dieses Verfahren und Abbildung 5.131 zeigt die Resultate eines tatsächlichen Experiments. Das Bild einer Katze wurde einem kollimierten Argonlaser-Strahl (λ = 514,5 nm) aufgeprägt, indem man diesen durch ein Diapositiv treten ließ, das dieses Bild enthielt. Um einen Referenzstandard zu haben, wurde dieser Strahl mittels eines Strahlteilers zu einem ebenen Spiegel geleitet, der es 11

Siehe D. M. Pepper, „Applications of Optical Phase Conjugation“, Sci. Am. 74 (Januar 1986) und V. V. Shkunov und B. Ya. Zel´dovich, „Optical Phase Conjugation“, Sci. Am. 54 (Dezember 1985).

5.9 Gravitationslinsen

461

zurück durch den Strahlteiler und auf eine Mattscheibe warf, wo es fotografiert werden konnte (Abb. 5.131 a). Als Nächstes wurde ein Phasenverzerrer (ein Stück Duschkabinenglas) zwischen Strahlteiler und Spiegel gebracht, den die Welle zweimal durchlief. Das Bild, das vom Spiegel reflektiert wurde, war nicht zu erkennen (Abb. 5.131 b). Schließlich wurde der Planspiegel durch einen phasenkonjugierenden Spiegel ersetzt. Obwohl der Strahl den Verzerrer nach wie vor zweimal durchlief, war das Bild auf der Mattscheibe nun wieder scharf wie ohne den Verzerrer (Abb. 5.131 c).

5.9

Gravitationslinsen

Zu den bemerkenswertesten Entdeckungen des 20. Jahrhunderts gehört eine Erkenntnis, die direkt aus Einsteins allgemeiner Relativitätstheorie (1915) folgte: Materie erzeugt – oder, vielleicht besser ausgedrückt, ist selbst – eine Krümmung der Raumzeit. Welche Sichtweise man auch bevorzugt, eine hohe lokale Massekonzentration entspricht stets einer deutlichen lokalen Krümmung der Raumzeit. Die Relativitätstheorie verknüpft die Konzepte von Raum und Zeit, und die Gravitation beeinflusst beide. Das heißt: Ein Lichtstrahl, der die Umgebung einer solchen Krümmung durchläuft, ist selbst gekrümmt, und zwar nach innen in Richtung der Massekonzentration. Die Gravitation verändert sowohl den Betrag als auch die Richtung der Lichtgeschwindigkeit. Wenn man bedenkt, dass die Gravitation den Ablauf der Zeit selbst verlangsamt, sollte diese Beobachtung nicht allzu sehr überraschen. Bis jetzt hatten wir angenommen, dass Licht sich stets geradlinig mit der festen Geschwindigkeit c im Raum ausbreitet. Dies steht im Einklang mit der speziellen Relativitätstheorie und trifft überdies für sämtliche Experimente zu, die wir auf der Erde unternehmen können. Anders verhält es sich in den Weiten des Universums mit seinen unzähligen Sternen, Galaxien und Schwarzen Löchern. Das Gravitationspotential (ΦG ) in der unmittelbaren Umgebung einer riesengroßen Masse kann enorme Ausmaße annehmen. Licht, das sich in einem solchen Bereich ausbreitet, verhält sich wie beim Durchgang durch ein inhomogenes Medium mit ortsabhängigem Brechungsindex nG (r) > 1. Der Effekt ist ähnlich, als wenn Licht durch eine gewöhnliche asphärische Linse fällt. Aus diesem Grund spricht man von Gravitationslinsen. Abweichungen von der geradlinigen Ausbreitung des Lichts ordnen wir intuitiv dem Phänomen der Beugung zu; man sollte also besser von Gravitationsbeugung sprechen. Die Geometrie der Situation ist nicht kompliziert. Wir benötigen einen Beobachter (eine mit einem Fernrohr ausgerüstete Person auf der Erde), eine weit von ihm entfernte Quelle elektromagnetischer Strahlung (etwa einen Quasar oder eine Galaxie) als Beobachtungsobjekt und – örtlich zwischen beiden auf der verbindenden Achse positioniert – eine Masse, die den Linseneffekt hervorruft (einen Quasar, eine Galaxie oder einen Galaxienhaufen, ein Schwarzes Loch). Eine Region mit gekrümmter Raumzeit wirkt im Wesentlichen wie eine grobe GRINLinse (Abb. 6.42) mit einem Brechungsindex, der mit zunehmender Entfernung von

5 Geometrische Optik

462

(a) Abb. 5.132: Eine asphärische Linse simuliert die Wirkung eines großen massereichen Objekts, etwa einer Galaxie, als Gravitationslinse.

(b)

(c)

(d)

Abb. 5.133: Simulation einer Gravitationslinse mit einem Asphären wie in Abbildung 5.132.

der mittleren Achse abnimmt, so wie hier ΦG abnimmt. Ein noch weiter vereinfachtes Modell bildet das Profil des Brechungsindex einfach mit dem Dickeprofil einer asphärischen Linse nach. Die in Abb. 5.132 gezeigte Linse könnte einer schön symmetrischen Galaxie entsprechen, eine Variante mit stärker ausgeprägter Spitze käme einem Schwarzen Loch näher. Betrachtet man durch die „Linse“ einer neben der Achse liegenden Galaxie ein weit dahinter liegendes Objekt, so kann sich das Bild in mehrere Bögen aufspalten (Abb. 5.133). Genauer lässt sich das Phänomen durch Wellen beschreiben, die ein störendes Medium durchlaufen (wie in Abb. 5.126 a), wobei das huygenssche Prinzip (Abschn. 4.4.2) verwendet wird. Wie wir bei der Diskussion der Beugung (Abb. 10.7 d noch sehen werden, folgt aus diesem Ansatz, dass es stets eine ungerade Anzahl scheinbarer Bilder gibt, darunter ein ungebeugtes Bild in der Mitte. In Abbildung 5.134 sehen Sie, wie ein Galaxienhaufen eine einzelne, viel weiter entfernte Galaxie als Reihe von Bögen abbildet, die mehr oder weniger konzentrisch um den Schwerpunkt des Haufens angeordnet sind. Einstein, der bereits 1912 über Gravitationslinsen nachzudenken begann, folgerte: Wenn der unwahrscheinliche Fall einträte, dass sich alle drei Teilnehmer des Phänomens exakt ausgerichtet auf einer Linie (der Achse) befänden (Abb. 5.133 c), so wäre das Bild über einen Ring verschmiert. 1998 gelang mit dem Hubble-Weltraumteleskop die erste Aufnahme eines vollständigen Einstein-Rings (Foto S. 463).

5.9 Gravitationslinsen

463

Abb. 5.134: Ein Galaxienhaufen wirkt als Gravitationslinse.

Die erste Aufnahme eines vollständigen Einstein-Rings gelang 1998 mit dem Hubble-Weltraumteleskop. Dabei waren die Erde und zwei Galaxien nahezu exakt auf einer Linie hintereinander angeordnet (siehe die Skizze in Abb. 5.121 c).

Der Galaxienhaufen Abell 2218 ist so kompakt und massereich, das sein enormes Gravitationsfeld hindurchdringendes Licht ablenkt. Weit dahinter liegende Galaxien erscheinen vergrößert, aufgehellt oder verzerrt. Die zahlreichen sichtbaren Bögen entsprechen verzerrten Bildern von Galaxien, die fünf bis zehn Mal weiter vom Beobachter entfernt sind als der den Linseneffekt hervorrufende Haufen.

5 Geometrische Optik

464

Aufgaben Lösungen zu den Aufgaben ohne ∗ finden Sie am Ende des Buches. 5.1

Die Gestalt der Grenzfläche, die in Abbildung A.5.1 dargestellt ist, heißt kartesisches Oval nach René Descartes, der es zu Anfang des 19. Jahrhunderts untersuchte. Es ist eine ideale Konfiguration, um beliebige Strahlen von S durch die Grenzfläche zum Punkt P abzulenken. Zeigen Sie, dass die Gleichung dieser Fläche n1 +  n2 = konstant ist. Zeigen Sie, dass dies gleichbedeutend ist mit  1/2  1/2  n1 x2 + y 2 + n2 y 2 + a + a − x2 = konstant , wobei x und y die Koordinaten des Punktes A sind. y A S

 V

 n2 a

n1 a

P

x

Abb. A.5.1

5.2

Konstruieren Sie ein kartesisches Oval, in dem die konjugierten Punkte 11 cm voneinander getrennt sind, wenn sich das Objekt 5 cm vom Scheitelpunkt entfernt befindet. Zeichnen Sie mehrere Punkte auf die gesuchte Fläche, wenn n1 = 1 und n2 = 32 ist.

5.3*

Zeigen Sie mithilfe der Abbildung A.5.3, dass eine Punktquelle, die sich im Brennpunkt F1 eines Ellipsoids befindet, ebene Wellen aussendet, die das Ellipsoid nach der anderen Seite verlassen. Beachten Sie dabei, dass die Summe der Entfernungen von einem Brennpunkt zum Rand und vom Rand zum anderen Brennpunkt konstant ist.

A

F1

D

F2 n2 n1 Σ

Abb. A.5.3

Aufgaben

465

5.4

Konstruieren Sie grafisch eine elliptisch-sphärische Zerstreuungslinse, wobei der Verlauf der Strahlen und der Wellenfronten durch die Linse deutlich werden soll. Führen Sie das Gleiche für eine oval-sphärische Sammellinse aus.

5.5*

Verwenden Sie Abbildung A.5.5, das snelliussche Gesetz und die Tatsache, dass im paraxialen Gebiet α = h/a, ϕ ≈ h/R und β ≈ h/a ist, um Gleichung (5.8) herzuleiten.

a

a a

Abb. A.5.5

5.6*

a

Abb. A.5.6

Zeigen Sie, dass in der paraxialen Näherung die Vergrößerung, die durch eine einzige sphärische Grenzfläche zwischen zwei kontinuierlichen Medien (Abb. A.5.6) erzeugt wird, gegeben ist durch MT = −

n1 a . n2 a

[Hinweis: Verwenden Sie im snelliusschen Gesetz die Näherung für kleine Winkel und approximieren Sie diese durch ihre Tangenswerte.] 5.7*

Stellen Sie sich eine halbkugelförmige Grenzfläche mit einer Krümmungsradius von 5 cm vor, die zwei Medien trennt: Luft auf der linken Seite und Wasser auf der rechten. Eine 3 cm große Kröte sitzt auf der optischen Achse in Luft, in 30 cm Abstand vom Scheitelpunkt der aus ihrer Sicht konvexen Grenzfläche. Wo wird die Kröte im Wasser abgebildet? Wie groß erscheint sie einem Fisch im Wasser? Benutzen Sie die Ergebnisse der vorherigen Aufgabe, auch wenn die paraxiale Näherung für die Kröte fragwürdig ist.

5.8

Lokalisieren Sie das Bild eines Objekts, das sich 1,2 m vom Scheitelpunkt einer Glaskugel (n = 1,5) entfernt befindet, deren Durchmesser 20 cm ist. Fertigen Sie eine Skizze an.

5.9*

Greifen wir Aufgabe 5.7 wieder auf und nehmen wir an, dass wir das Medium auf der rechten Seite begrenzen und auf diese Art eine dicke bikonvexe Linse aus Wasser bilden, wobei jede Grenzfläche einen Radius von 5 cm besitzt. Bestimmen Sie die Gesamtvergrößerung und die Eigenschaften des Bildes der Kröte, wenn die Linse 10 cm dick ist.

5.10* Eine bikonvexe dünne Glaslinse (nG = 1,5) habe eine Brennweite von +10,0 cm. Der Krümmungsradius beider Seiten sei gleich. Wie groß ist er? Zeigen Sie, dass das Bild einer Spinne, die 1,0 cm vor der Linse steht, bei −1,0 cm erscheint. Beschreiben Sie das Bild und zeichnen Sie den Strahlenverlauf.

466

5 Geometrische Optik

5.11* Wir kehren zurück zu Abschnitt 5.2.3. Beweisen Sie, dass für eine dünne, in einem Medium mit dem Brechungsindex nM befindliche Linse gilt   (nL − nM ) 1 1 1 = . − f nM R1 R2 Stellen Sie sich anschließend eine bikonkave Linse aus Luft in Wasser vor. Handelt es sich um eine Sammel- oder eine Zerstreuungslinse? 5.12* Eine meniskuskonkave (siehe Abb. 5.12), dünne Glaslinse (nL = 1,5) habe Krümmungsradien von +20,0 cm und +10,0 cm. Ein Objekt befinde sich im Abstand von 20,0 cm vor der Linse. Zeigen Sie, dass die Bildweite −13,3 cm beträgt. Beschreiben Sie das Bild und zeichnen Sie den Strahlenverlauf. 5.13

Eine bikonkave Linse (nL = 1,5) habe Krümmungsradien von 20 cm und 10 cm und eine Dicke auf der Achse von 5 cm. Beschreiben Sie das Bild eines 2 cm großen Objekts, das sich 8 cm vom ersten Krümmungsmittelpunkt entfernt befindet. Berechnen Sie die Position des Endbildes mithilfe der Gleichung für dünne Linsen.

5.14* Eine analoge 35-mm-Kamera habe eine einzelne dünne Linse mit einer Brennweite von 50,0 mm. Eine 1,70 m große Frau steht 10,0 m von der Kamera entfernt. (a) Zeigen Sie, dass der Abstand zwischen Linse und Film 50,3 mm betragen muss. (b) Wie groß ist das Bild der Frau auf dem Film? 5.15

Zeigen Sie, dass der Minimalabstand zwischen konjugierten reellen Objekt- und Bildpunkten für eine dünne Sammellinse 4f ist.

5.16

Ein 2 cm hohes Objekt befindet sich 5 cm rechts von einer dünnen Sammellinse mit 10 cm Brennweite. Beschreiben Sie das erzeugte Bild vollständig, indem Sie sowohl die gaußsche Linsenformel als auch die newtonsche Abbildungsgleichung anwenden.

5.17

Skizzieren Sie ein Diagramm der gaußschen Linsenformel; tragen Sie also unter Verwendung von Einheitsintervallen von f die Werte von a gegen a längs beider Achsen auf. (Zeichnen Sie beide Kurvensegmente.)

5.18* Ein von einer weit entfernten Punktquelle ausgehendes paralleles Strahlenbündel trifft auf eine dünne Zerstreuungslinse mit einer Brennweite von −50 cm. Die Strahlen fallen unter einem Winkel von 6◦ zur optischen Achse ein. Bestimmen Sie den Ort des Bildes. 5.19* Eine LED befindet sich im Abstand von 30 cm (entlang der Hauptachse) vor einer dünnen Linse. Das resultierende Bild ist virtuell und befindet sich 10 cm von der Linse entfernt. Bestimmen Sie die Brennweite der Linse. Erläutern Sie unter Verwendung der Informationen aus Tabelle 5.3, warum die Linse negativ sein muss, obwohl auch positive Linsen virtuelle Bilder erzeugen können. 5.20

Wie groß muss die Brennweite einer dünnen Zerstreuungslinse sein, damit sie in 50 cm Entfernung ein virtuelles Bild von einer Ameise erzeugt, die 100 cm weit weg ist? Die Ameise soll sich rechts der Linse befinden. Bestimmen Sie die Lage des Bildes und beschreiben Sie es.

Aufgaben

467

5.21* Eine Kerzenflamme befindet sich 18,0 cm vor einer dünnen, positiven Linse. Ihr Bild erscheint dreimal so weit von der Linse entfernt, als es der Fall wäre, wenn sich die gleiche Kerze auf einem sehr hohen Berg befände. Bestimmen Sie die Brennweite der Kerze. 5.22* Berechnen Sie die Brennweite einer dünnen Bikonvexlinse (nl = 1,5) in Luft mit Radien von 20 cm und 40 cm. Bestimmen Sie die Lage des Bildes eines Objekts in 40 cm Entfernung von der Linse und beschreiben Sie das Bild. 5.23

Wie groß ist die Brennweite einer plankonkaven Linse (nl = 1,5) mit einem Krümmungsradius von 10 cm? Wie groß ist ihre Brechkraft (in Dioptrien)?

5.24* Die Brennweite einer plankonvexen Linse in Luft sei 250,0 cm. Das Glas, aus dem die Linse hergestellt ist, hat einen Brechungsindex von 1,530. Bestimmen Sie die Krümmungsradien ihrer Oberflächen. Wie würden sich die Radien ändern, wenn n auf 1,500 reduziert würde? 5.25* Ein Objekt, das man näherungsweise als unendlich weit entfernt betrachten kann, wird in einen Abstand von 90,0 cm vor eine Linse gebracht. Dabei verdreifacht sich seine Bildweite. Bestimmen Sie die Brennweite der Linse. 5.26* Bestimmen Sie die Brennweite, die eine dünne, plankonvexe Linse mit einem Krümmungsradius von 50,0 mm und einem Brechungsindex von 1,50 in Luft hat. Was würde mit der Brennweite passieren, wenn die Linse in einem Wassertank platziert würde? 5.27* Auf der Hauptachse einer dünnen, positiven Linse befindet sich eine punktförmige Lichtquelle S. Der Abstand von der Front der Linse ist l1 , und im Abstand l2 von der Linse erscheint ein relles Bild P von S. Ist es möglich, die Linse entlang der Achse an eine andere Position zu verschieben und am Ende wieder die gleichen Positionen von S und P zu erhalten? Wenn ja, wo muss die Linse positioniert werden? Fertigen Sie eine Skizze an. 5.28* Ein Objekt auf der Hauptachse einer dünnen, positiven Linse ist 40 cm von der Front der Linse entfernt. Sein Bild erscheint auf einem Schirm 80 cm hinter der Linse. Nun wird die Linse an eine neue Position auf der Achse verschoben, und danach erscheint das Bild wieder auf dem Schirm. Beschreiben Sie, wie sich die Verschiebung auf Größe und Orientierung des Bildes auswirkt. 5.29* Stellen Sie sich, nachdem Sie sich mit den beiden letzten Aufgaben beschäftigt haben, ein selbstleuchtendes Objekt auf der Hauptachse einer dünnen, positiven Linse vor. Das Objekt befindet sich im Abstand d von dem Schirm, auf dem das Bild erscheint. Dann wird die Linse in Richtung des Objektes an eine neue Position gebracht, mit dem Ergebnis, dass das Bild auf dem Schirm nun N -mal so groß ist wie zuvor. Zeigen Sie, dass die Brennweite der Linse durch √ Nd √ f= (1 + N )2 gegeben ist. 5.30* Angenommen, wir stellen 45 mm vor einer Linse einen Gegenstand auf, dessen Bild 90 cm hinter der Linse auf einem Schirm erscheint. Wie groß ist die Brennweite der verwendeten Sammellinse?

468

5 Geometrische Optik

5.31

Das Pferd in Abbildung 5.29 ist 2,25 m hoch und mit dem Kopf 15 m weit von der Ebene der dünnen Linse entfernt, deren Brennweite 3 m beträgt. a) Bestimmen Sie den Ort der Abbildung der Nase des Pferdes. b) Beschreiben Sie detailliert die Abbildung (Art, Ausrichtung und relative Größe des Bildes). c) Wie groß ist das Bild? d) Der Schwanz des Pferdes befindet sich 17,5 m weit von der Linse entfernt. Wie groß ist der Abstand zwischen Nase und Schwanz in der Abbildung?

5.32* Eine 6 cm lange Kerze steht 10 cm vor einer dünnen Zerstreuungslinse mit einer Brennweite von −30 cm. Bestimmen Sie die Lage des Bildes und beschreiben Sie dieses im Detail. Zeichnen Sie den zugehörigen Strahlenverlauf. 5.33* Eine gleichkonvexe Linse (n = 1,5) erzeugt ein 25 cm hohes Bild von einem Frosch, der 5 cm groß und 0,6 m vom Schirm entfernt ist. Berechnen Sie die erforderlichen Radien der Linse. 5.34* Eine bikonvexe Linse, die in 127 cm Abstand von einem Schirm platziert ist, wirft auf diesen das 5,80-fach vergrößerte Bild eines leuchtenden Objektes. Bestimmen Sie die Brennweite der Linse. 5.35* Wir wollen das Bild eines Frosches auf einen Schirm projizieren. Das Bild soll doppelte Lebensgröße haben, und wir verwenden eine dünne, plankonvexe Glaslinse (Brechungsindex ng = 1,50) mit einem Krümmungsradius von 100 cm. In welcher Entfernung vom Schirm müssen wir den Frosch platzieren? Skizzieren Sie den Strahlenverlauf. 5.36* Betrachten Sie eine bikonvexe Linse aus Glas (n = 1,50) in Luft. Ein zuvor weit entferntes, leuchtendes Objekt wird in 180 cm Entfernung vor der Linse platziert. Die resultierende Bildweite wächst dadurch auf etwa das Dreifache ihres ursprünglichen Wertes. Bestimmen Sie die Krümmungsradien der Linse. 5.37* Ein dünnes, gerades, 4 mm langes Stück Draht befindet sich in einer Ebene senkrecht zur optischen Achse, 60 cm vor einer dünnen Linse. Das scharfe Bild des Drahts auf einem Bildschirm ist 2 mm lang. Wie groß ist die Brennweite der Linse? Wird der Schirm 10 mm weiter von der Linse weg bewegt, verschwimmt das Bild zu einer Breite von 0,8 mm. Wie groß ist der Durchmesser der Linse? [Hinweis: Betrachten Sie eine Punktquelle auf der Achse.] 5.38

Eine dünne Bikonvexlinse aus Glas (n = 1,56), die von Luft umgeben ist, hat eine Brennweite von 10 cm. Sie wird im Wasser (n = 1,33) 100 cm hinter einem kleinen Fisch angebracht. Wo entsteht das Bild des Fisches?

5.39

Ein selbst hergestelltes Fernsehprojektionssystem verwendet eine große Sammellinse, um das Bild des Schirms auf eine Wand zu werfen. Das Endbild ist dreifach vergrößert, und, obgleich ziemlich lichtschwach, recht gut und scharf zu erkennen. Die Linse soll eine Brennweite von 60 cm haben. Wie groß sollte der Abstand zwischen dem Bildschirm und der Wand sein? Warum verwendet man eine große Linse? Wie sollte man das Fernsehgerät bezüglich der Linse aufstellen?

Aufgaben 5.40

469

Schreiben Sie einen Ausdruck für die Brennweite (fw ) einer in Wasser (nw = 43 ) getauchten dünnen Linse in Abhängigkeit von ihrer Brennweite in Luft (fl ) auf.

B A

C

5.41* Schauen Sie sich die drei Vektoren A, B und C in Abbildung A.5.41 an; sie alle sind 0,1f lang, wobei f die Brennweite der dünnen Sammellinse ist. Die Ebene, die A und B aufspannen, ist 1,1f von der Linse entfernt. Beschreiben Sie das Bild Abb. A.5.41 jedes dieser Vektoren.

z

x

y

5.42* Eine bequeme Methode zur Messung der Brennweite einer Sammellinse (das so genannte Besselverfahren) nutzt die folgende Tatsache aus: Wenn ein Paar konjugierter Punkte, ein Objektpunkt und der zugehörige (reelle) Bildpunkt (S und P ), den Abstand L > 4f voneinander haben, dann gibt es zwei Positionen der Linse im Abstand d, für welche sich dieses konjugierte Paar ergibt. Zeigen Sie, dass f=

L2 − d2 4L

ist. (Damit kann man Messungen direkt vom Scheitelpunkt der Linse umgehen, die im Allgemeinen nicht leicht auszuführen sind.) 5.43* Zwei Sammellinsen mit Brennweiten von 0,30 m und 0,50 m sind 0,20 m voneinander entfernt. Ein kleiner Schmetterling sitzt auf der optischen Achse 0,50 m vor der ersten Linse. Wo, relativ zur zweiten Linse, entsteht das Bild? 5.44

Bei der Konstruktion eines Doublets wird eine gleichkonvexe dünne Linse L1 in engen Kontakt mit einer Zerstreuungslinse L2 gebracht. Die so entstandene Kombination hat eine Brennweite von 50 cm in Luft. Berechnen Sie die Krümmungsradien, wenn die Brechungsindizes 1,50 und 1,55 sind und L2 eine Brennweite von −50 cm hat.

5.45

Verifizieren Sie Gleichung (5.34), die MT für eine Kombination dünner Linsen angibt.

5.46* Ein 10,0 mm hoher Grashalm stehe in einem Abstand von 150 mm vor einer dünnen Sammellinse mit einer Brennweite von 100,0 mm; 250 mm hinter dieser ersten Linse befinde sich eine dünne Zerstreuungslinse mit einer Brennweite von −75,0 mm. (a) Zeigen Sie, dass an der ersten Linse 300 mm hinter dieser ein Bild entsteht. (b) Beschreiben Sie das Bild. (c) Wie ist die Vergrößerung? (d) Zeigen Sie, dass das Endbild der Linsenkombination 150 mm hinter der Zerstreuungslinse entsteht. (e) Ermitteln Sie die Gesamtvergrößerung der Kombination. 5.47

10 cm Berechnen Sie die Lage des Bildes und die Vergrößerung eines Objekts, das sich 30 cm vor dem vorderen Dublet einer Kombination dünner Linsen in Abbildung A.5.47 befindet. Untersuchen Sie dazu die Wirkung jeder einzelnen Linse. Fertigen Sie eine Skizze mit geeigneten Strahlen an. Vergleichen Sie Ihren Wert von MT mit demjenigen, der sich aus Gleichung (5.34) ergibt. f1 =+30 cm f2 =−20 cm

Abb. A.5.47

5 Geometrische Optik

470

5.48* Zwei dünne Linsen haben Brennweiten von +15 cm und −15 cm und sind 60 cm voneinander entfernt. Eine Buchseite wird 25 cm vor die Sammellinse gehalten. Beschreiben Sie detailliert das Bild des Textes (im paraxialen Bereich). 5.49* Zeichnen Sie den Strahlenverlauf für die Kombination zweier Sammellinsen, deren gegenseitiger Abstand gleich der Summe ihrer Brennweiten ist. Was passiert, wenn eine der Linsen eine negative Brennweite hat? 5.50* Zwei Sammellinsen werden zur Verbreiterung eines Laserstrahls verwendet. Ein Strahl von 1,0 mm Durchmesser tritt axial durch die erste Linse (mit kurzer Brennweite) und dann durch die zweite Linse (mit etwas längerer Brennweite). Sein Durchmesser beträgt nun 8,0 mm. Gegeben sei die Brennweite der ersten Linse (50,0 mm); berechnen Sie die Brennweite der zweiten Linse sowie den Abstand zwischen beiden Linsen. 5.51

Zeichnen Sie den Strahlenverlauf für ein Mikroskop (Abb. 5.110) neu, wobei Sie diesmal das Zwischenbild so behandeln, als wäre es ein reelles Objekt – diese Methode sollte etwas einfacher sein.

5.52* Betrachten Sie eine dünne Sammellinse L1 und zeigen Sie mithilfe eines Strahlendiagramms, dass sich die Vergrößerung nicht ändert, wenn man eine zweite Linse L2 im Brennpunkt von L1 anordnet. Dies ist ein guter Grund, Brillengläser mit verschiedenen Brennweiten in korrektem Abstand vom Auge zu tragen. 5.53* Die Abbildungen A.5.53 a und A.5.53 b sind einem Einführungsbuch in die Physik entnommen worden. Wo liegen die Fehler? H L1

L2

F1

F (a)

f L1

L2

4 0

F1

F2

F1

F2

I1

2 (b)

Abb. A.5.53

5.54* Das beste Fernrohr von Galilei hatte ein Okular mit einer Brennweite von −40 mm und ein bikonvexes Objektiv von etwa 30 mm Durchmesser. Dieses Objektiv erzeugte 120 cm tief im Tubus reelle Zwischenbilder von Sternen. Bestimmen Sie die Vergrößerung des Instrumentes sowie die Blendenzahl (f /#) des Objektivs. 5.55

Betrachten Sie zwei dünne, 5 cm voneinander entfernte Sammellinsen L1 und L2 . Ihre Durchmesser sind 6 cm bzw. 4 cm, ihre Brennweiten f1 = 9 cm und f2 = 3 cm. Eine Blende mit einem Loch, das einen Durchmesser von 1 cm hat, soll 2 cm von L2 entfernt zwischen ihnen eingesetzt werden. Ermitteln Sie (a) die Aperturblende und (b) die Lagen und Größen der Pupillen für einen Achspunkt S, der 12 cm vor L1 liegt.

Aufgaben

471

5.56* Eine dünne Linse L ist in der Mitte zwischen zwei Blenden platziert: B1 befindet sich 4,0 cm links von der Linse und B2 4,0 cm rechts davon. Die Linse hat einen Durchmesser von 12 cm und eine Brennweite von 12 cm. Die Löcher in den Blenden haben die Durchmesser 12 cm und 8 cm. 20 cm links von B1 befindet sich ein axialer Objektpunkt. (a) Was ist das Bild von B1 im Objektraum (d. h. das Bild, das eine Linse links von der Blende mit dem sich nach links fortpflanzenden Licht erzeugt)? (b) Was ist das Bild von L im Objektraum? (c) Was ist das Bild von B2 im Objektraum? Geben Sie die Größe und die Position des Bildes dieser Blende an. (d) Lokalisieren Sie die Eintrittspupille und die Aperturblende. 5.57

Skizzieren Sie grob die Aperturblende sowie die Eintritts- und die Austrittspupille für das Objektiv in Abbildung A.5.57.

F1

F1

F2

F2 Abb. A.5.57

5.58

Skizzieren Sie grob die Aperturblende sowie die Eintritts- und die Austrittspupille für das Objektiv in Abbildung A.5.58 unter der Annahme, dass der Objektpunkt vor (links von) F1 liegt.

F1

F2 Abb. A.5.58

5.59* Ein brechendes astronomisches Teleskop habe eine Objektivlinse von 50 mm Durchmesser und eine 10-fache Vergrößerung. Bestimmen Sie den Durchmesser des Augenstrahls (den Zylinder des Lichts, das auf das Auge fällt). Das dunkeladaptierte Auge hat einen Pupillendurchmesser von etwa 8 mm. 5.60

Abbildung A.5.60 zeigt ein Linsensystem, ein Objekt und die entsprechenden Pupillen. Bestimmen Sie grafisch die Lage des Bildes.

Aperturblende

S F1

O

F2

O F1 F2 L2

L1 Austrittspupille

Eintrittspupille

Abb. A.5.60

472

5 Geometrische Optik

5.61

Zeichnen Sie ein Strahlendiagramm, um die Bilder einer Punktquelle zu lokalisieren, die zwei rechtwinklig zueinander stehende Spiegel erzeugen (Abb. A.5.61 a). Fertigen Sie ein weiteres Strahlendiagramm an, um die Bilder des Pfeils in Abbildung A.5.61 b zu lokalisieren.

S

(a) 5.62

(b)

Abb. A.5.61

Betrachtet sich die Venus in Velásquez’ Gemälde Venus und Amor (Abb. A.5.62) selbst im Spiegel? Erklären Sie Ihre Antwort.

Abb. A.5.62: Venus und Amor von Diego Rodriguez da Silva y Velásquez. (Mit frdl. Genehmigung der National Gallery, London.)

5.63

Das Mädchen in Manets Gemälde Der Ausschank in den Folies Bergères (Abb. A.5.63) steht vor einem großen ebenen Spiegel. Man sieht darin das Bild ihres Rückens und eines Mannes in Abendgarderobe (mit Zylinder, ganz rechts), mit dem sie scheinbar redet. Es erweckt den Eindruck, dass Manet beabsichtigte, das unheimliche Gefühl zu vermitteln, dass der Betrachter dort steht, wo jener Herr sein müsste. Was ist von den Gesetzen der geometrischen Optik her falsch?

Abb. A.5.63: Der Ausschank in den Folies Bergères von Edouard Manet. Courtauld-Sammlung in den Courtauld Institute Galleries, London.

Aufgaben 5.64

473

Zeigen Sie, dass Gleichung (5.48) für eine Kugeloberfläche in gleicher Weise auch für einen ebenen Spiegel anwendbar ist.

5.65* Eine Frau steht in 600 cm Entfernung vor einem großen, ebenen Spiegel. In 1200 cm Entfernung von ihrem Gesicht sieht sie das Bild eines Baumes. Wo befindet sich der Baum tatsächlich? Beschreiben Sie das Bild im Detail. 5.66* Abbildung A.5.66 wurde einem 1884 veröffentlichten Optiklehrbuch von S. Parkinson entnommen. Dargestellt sind zwei „parallele ebene Spiegel“, zwischen denen sich am Punkt Q ein „leuchtender Punkt“ befindet. Erläutern Sie, was im Detail passiert. Welche Beziehung besteht zwischen Q1 und Q2 sowie zwischen Q2 und Q3 ?

Abb. A.5.66

5.67* Betrachten Sie noch einmal die beiden Spiegel A und B aus der vorherigen Aufgabe. Nehmen Sie an, dass sie 20,0 cm voneinander entfernt sind und im Punkt Q, der 8,0 cm von A entfernt ist, eine kleine Kerze steht. Lokalisieren Sie die Bilder bei Q1 , Q2 und Q3 relativ zu A. 5.68* Eine Münze mit dem Durchmesser dM ist 300 cm von einer Wand entfernt, an der ein runder, ebener Spiegel mit dem Durchmesser dS aufgehängt ist. Eine Person steht 900 cm von der Wand entfernt. Zeigen Sie, dass dS = 34 dM der kleinstmögliche Spiegeldurchmesser ist, für den der Beobachter das vollständige Spiegelbild der Münze gerade noch sehen kann. 5.69* Betrachten Sie Beispiel 5.9 auf Seite 363, in dem das Auge einer Person 2,0 m vom Spiegel entfernt ist. Nehmen Sie an, dass sich die Unterkante des Spiegels 1,45 m über dem Boden und die Achse vom Auge 1,25 m über dem Boden befindet. In welcher Höhe über dem Boden befindet sich die Unterkante der Sehtafel? 5.70* Ein kleiner, ebener Spiegel hängt an einem dünnen Faden parallel vor einer 1,0 m entfernten Wand. An der Wand ist eine horizontale Skala angebracht, und zwar so, dass die Mitte des Spiegels genau gegenüber der Nullmarkierung der Skala liegt. Ein horizontaler Laserstrahl wird am Spiegel reflektiert und trifft die Skala 5,0 cm links von der Nullmarkierung. Nachdem der Spiegel um dem Winkel α gedreht wurde, erscheint der Fleck auf der Skala um weitere 15,0 cm nach links verschoben. Bestimmen Sie α. 5.71

Bestimmen Sie die Lage des Bildes einer Büroklammer, die 100 cm weit von einem konvexen Kugelspiegel mit einem Krümmungsradius von 80 cm entfernt ist.

5.72* Beschreiben Sie das Bild, das Sie beim Blick auf eine 1,5 m entfernte Messingkugel mit einem Durchmesser von 30 cm sehen würden.

474

5 Geometrische Optik

Abb. A.5.75 Die Hochzeit des Giovanni Arnolfini von van Eyck. (Mit frdl. Genehmigung der National Gallery, London.)

5.73* Eine dünne Linse mit einer Brennweite von +50,0 cm wird im Abstand von 250 cm vor (also links von) einem ebenen Spiegel aufgestellt. Eine Ameise sitze auf der optischen Achse 250 cm vor (links von) der Linse. Wo entstehen die drei Bilder der Ameise? 5.74

Das Bild einer roten Rose wird von einem konkaven Kugelspiegel auf einem Schirm in 100 cm Entfernung abgebildet. Wie groß ist der Krümmungsradius, wenn die Rose 25 cm vom Spiegel entfernt ist?

5.75

Bestimmen Sie aus der Bildkonfiguration die Form des Spiegels, der an der hinteren Wand in van Eycks Gemälde Die Hochzeit des Giovanni Arnolfini hängt.

5.76* Ein 1,0 cm langer Reißnagel befindet sich 35,0 cm vor einem konkaven Kugelspiegel, der eine Brennweite von 30,0 cm hat. (a) Lokalisieren Sie das Bild. (b) Handelt es sich um ein reelles Bild oder um ein virtuelles? (c) Bestimmen Sie die Vergrößerung. (d) Ist das Bild aufrecht? (e) Wie groß ist das Bild? (f) Bestimmen Sie den Kümmungsradius R des Spiegels. 5.77* Im Handel sind verschiedene Formen von Rückstrahlern erhältlich. Ein Typ ist aus durchsichtigen Kugeln zusammengesetzt, deren rückwärtige Seiten verspiegelt sind. Das Licht, das von der Frontfläche gebrochen wird, sammelt sich auf der Rückfläche und wird in genau die Richtung zurückgeworfen, aus der es kam. Bestimmen Sie den notwendigen Brechungsindex des Materials dieser Kugeln. Nehmen Sie an, das einfallende Licht sei parallel. 5.78* Wir wollen für einen Roboter ein Auge konstruieren, wobei wir einen sphärischen Hohlspiegel so verwenden, dass das Bild eines 1 m großen Objekts, das 10 m entfernt ist, den 1 cm2 großen lichtempfindlichen Detektor (der zum Zweck der Fokussierung beweglich ist) ausfüllt. Wo sollte der Detektor relativ zum Spiegel angebracht sein? Wie groß muss die Brennweite des Spiegels sein? Zeichnen Sie den Strahlenverlauf.

Aufgaben

475

5.79* Eine 0,60 cm große LED befindet sich in 30,0 cm Entfernung auf der Hauptachse eines konvexen Kugelspiegels. Nehmen Sie an, dass der Krümmungsradius 12,0 cm beträgt und bestimmen Sie die Position des Bildes. Beschreiben Sie das Bild und skizzieren Sie den Strahlenverlauf. Wie groß ist das Bild? 5.80

Entwerfen Sie einen Zahnarztspiegel, der an das Ende eines Griffes angebracht werden soll, sodass man ihm im Mund des Patienten verwenden kann. Die Anforderungen sind (1), dass der Zahnarzt das Bild aufrecht sieht, und (2), dass der Spiegel beim Zahnabstand von 1,5 cm ein Bild erzeugt, das um den Faktor 2 vergrößert ist.

5.81

Zeigen Sie, dass ein Kugelspiegel mit dem Radius R von einem Objekt im Abstand a ein Bild mit der Transversalvergrößerung MT =

R 2a + R

erzeugt. 5.82* Ein Keratometer ist ein Gerät zur Messung des Krümmungsradius der Hornhaut, den man zur Anpassung von Kontaktlinsen benötigt. Dabei wird ein beleuchtetes Objekt in einem bekannten Abstand aufgestellt und man beobachtet das von der Hornhaut reflektierte Bild. Mit dem Instrument kann die Größe des virtuellen Bildes gemessen werden. Angenommen, man erhält bei einer Objektweite von 100 mm eine Transversalvergrößerung von 0,0037. Wie groß ist der Krümmungsradius? 5.83* Beweisen Sie für einen Kugelspiegel, dass die Orte des Objekts und des Bildes gegeben sind durch a = f (MT − 1) /MT 5.84

und

a = −f (MT − 1) .

Ein Mann schaut aus 25 cm Entfernung in einen Suppenlöffel und sieht sein eigenes Bild mit einer Transversalvergrößerung von −0,064. Bestimmen Sie den Krümmungsradius des Löffels.

5.85* In einem Vergnügungspark steht ein großer, aufrechter, gewölbter Spiegel einem 10 m weit entfernten Planspiegel gegenüber. Ein 1 m großes Mädchen steht in der Mitte zwischen den beiden Spiegeln und sieht sich im Planspiegel doppelt so groß wie in dem gewölbten Spiegel. Anders ausgedrückt, das im Planspiegel erscheinende Bild schließt beim Beobachter einen Winkel ein, der doppelt so groß ist wie der Winkel, der durch das Bild des gewölbten Spiegels entsteht. Wie groß ist die Brennweite des gewölbten Spiegels? 5.86* Ein selbst gebautes Teleobjektiv (Abb. A.5.86) besteht aus zwei Kugelspiegeln. Der Krümmungsradius des größeren Spiegels mit dem Loch in der Mitte beträgt 2 m, der des kleineren 60 cm. Wie weit entfernt vom kleineren Spiegel sollte die Filmebene sein, falls das Objekt ein Stern ist? Wie groß ist die effektive Brennweite des Systems? 5.87* Eine Punktquelle S befinde sich auf der optischen Achse einer dünnen Sammellinse links von dieser zwischen f und 2f . Ein konkaver Kugelspiegel wird rechts von der Linse so aufgestellt, dass das reelle Endbild ebenfalls in S liegt. Wo muss der Spiegel stehen? Wo müsste ein konvexer Kugelspiegel stehen, um die gleiche Aufgabe zu erfüllen?

5 Geometrische Optik

476

3 4

m

Abb. A.5.86

5.88* Ein Kugelspiegel habe eine Brennweite von 10 cm. In welchem Abstand muss ein Objekt aufgestellt sein, damit sein Bild aufrecht und anderthalbfach vergrößert ist? Wie groß ist der Krümmungsradius des Spiegels? Überprüfen Sie die Ergebnisse anhand von Tabelle 5.5. 5.89

Ein 7,6 cm großes Objekt befinde sich 20 cm vor einem Rasierspiegel mit einem Krümmungsradius von −60 cm. Beschreiben Sie das entstehende Bild!

5.90* Eine dünne, positive Linse mit der Brennweite fL wird sehr nahe vor einen silberbeschichteten, konkaven Kugelspiegel mit dem Radius RS gebracht. Drücken Sie die Brennweite des Systems durch eine Näherungsformel in Abhängigkeit von fL und RS aus. 5.91* Parallele Strahlen entlang der optischen Achse treffen auf eine bikonkave Linse mit zwei gleichen Krümmungsradien. Ein Teil des Lichts wird an der ersten Oberfläche reflektiert, der Rest durchläuft die Linse. Der Brechungsindex der (in Luft befindlichen) Linse betrage 2,00. Zeigen Sie, dass das reflektierte Bild dann an derselben Stelle entsteht wie das von der Linse erzeugte Bild. 5.92

Betrachten Sie das Dove-Prisma auf Abbildung 5.73. Drehen Sie das Prisma um 90◦ um eine Achse längs der Strahlrichtung. Skizzieren Sie die neue Anordnung. Um welchen Winkel wird das Bild gedreht?

5.93

Bestimmen Sie die numerische Apertur einer ummantelten optischen Faser. Der Brechungsindex des Kerns sei 1,62, derjenige der Ummantelung 1,52. Wie groß ist der maximale Eintrittswinkel, wenn sich die Faser in Luft befindet? Was passiert mit einem Strahl, der unter einem Winkel von 45◦ einfällt?

5.94* Eine Glasfaser mit Multimode-Stufenindex hat die Brechungsindizes 1,481 und 1,461. Ihr Kerndurchmesser beträgt 100 µm. Bestimmen Sie den Akzeptanzwinkel der Faser, wenn diese von Luft umgeben ist. 5.95

Gegeben ist eine moderne Faser aus Quarzglas mit einer Dämpfung von 0,2 dB/km. Wie weit kann sich ein Signal in ihr fortpflanzen, bis die Leistung auf die Hälfte gefallen ist?

5.96* Eine Stufenindexfaser hat die Brechungsindizes 1,451 und 1,457. Nehmen Sie an, dass der Kernradius 3,5 µm ist, und bestimmen Sie die Grenzwellenlänge, oberhalb der die Faser nur die Grundmode aufnimmt. 5.97* Eine Stufenindexfaser hat einen Durchmesser von 8,0 µm und eine numerische Apertur von 0,13. Bestimmen Sie die Grenzfrequenz, unterhalb der die Faser im Singlemode arbeitet.

Aufgaben

477

5.98* Gegeben ist eine Faser mit einem Durchmesser von 50 µm und den Indizes nc = 1,482 und nc = 1,500. Bestimmen Sie die Anzahl der Moden, die die Faser aufnimmt, wenn sie von einer LED beleuchtet wird, die mit einer mittleren Wellenlänge von 0,85 µm emittiert. 5.99* Eine Multimode-Stufenindexfaser hat einen Kernindex von 1,50 und einen Mantelindex von 1,48. Nehmen Sie an, dass der Kern einen Radius von 50,0 µm hat und bei einer Vakuumwellenlänge von 1300 nm arbeitet. Ermitteln Sie aus diesen Angaben die Anzahl der aufgenommenen Moden. 5.100* Bestimmen Sie die intermodale Dispersion (in ns/km) für eine Stufenindexfaser, deren Mantel einen Brechungsindex von 1,485 und deren Kern einen Brechungsindex von 1,5 besitzt. 5.101 Berechnen Sie mithilfe der Informationen über das Auge (Abschnitt 5.7.1) die ungefähre Größe des Mondbildes in Millimetern, das auf die Netzhaut projiziert wird. Der Mond hat einen Durchmesser von 3744 km und ist etwa 384 000 km von der Erde entfernt. (Der letztere Wert schwankt natürlich.) 5.102* In Abbildung A.5.102 wird ein Strahl unabhängig vom Einfallswinkel um einen konstanten Winkel σ abgelenkt, der gleich dem Doppelten des Winkels β zwischen den ebenen Spiegeln ist. Beweisen Sie dies. 5.103 Ein Objekt, das 20 m weit vom Objektiv (f = 4 m) eines astronomischen Fernrohrs entfernt ist, wird 30 cm vom Okular (f = 60 cm) entfernt abgebildet. Bestimmen Sie die lineare Gesamtvergrößerung des Teleskops.

β

σ Abb. A.5.102

5.104* Abbildung A.5.104, die aus einem alten, nicht mehr erhältlichen Optiklehrbuch entnommen wurde, zeigt angeblich ein aufrichtendes Linsensystem. Was ist falsch?

Abb. A.5.104

5.105* Abbildung A.5.105 zeigt ein kleines Loch in einem undurchsichtigen Schirm, das einem bestimmten Zweck dient. Erklären Sie, was passiert und warum es funktioniert. 5.106* Eine Fotografie eines Karussells sei bei einer Belichtungszeit von 1/30 s und einer Blendenzahl von 11 exakt belichtet, aber durch die schnelle Bewegung unscharf. Wie muss man die Blende einstellen, wenn die Belichtungszeit auf 1/120 s herabgesetzt wird, um die Bewegung „einzufrieren“? 5.107 Das Bildfeld eines einfachen zweilinsigen astronomischen Fernrohrs ist durch die Größe der Augenlinse begrenzt. Zeichnen Sie ein Strahlendiagramm, das die entstehende Vignettierung (Abschattung) zeigt. 5.108 Eine Feldlinse ist in der Regel eine Sammellinse, die in (oder nahe an) der Zwischenbildebene liegt, um diejenigen Strahlen zu sammeln, die sonst die nächste Linse

5 Geometrische Optik

478

Loch

Loch

Abb. A.5.105

im System verfehlen würden. In Wirklichkeit vergrößert sie das Bildfeld, ohne die Vergrößerung des Systems zu verändern. Zeichnen Sie den Strahlenverlauf der vorhergehenden Aufgabe unter Einbeziehung einer Feldlinse neu. Zeigen Sie, dass der Augenabstand dadurch etwas kleiner wird. 5.109* Beschreiben Sie das Bild eines Käfers, der auf dem Scheitelpunkt einer dünnen Sammellinse sitzt. Welchen Zusammenhang gibt es mit der Arbeitsweise einer Feldlinse (siehe vorhergehende Aufgabe)? 5.110* Bei einem Patienten wurde der Nahpunkt in 50 cm Entfernung festgestellt. Das Auge sei annähernd 2 cm lang. a) Wie groß ist die Brechkraft des brechenden Systems, wenn es auf ein im Unendlichen liegendes Objekt fokussiert ist? Wie groß ist sie für eine Fokussierung auf 50 cm? b) Wie weit muss der Patient das Auge akkommodieren, um ein Objekt im Abstand von 50 cm zu erkennen? c) Wie groß muss die Brechkraft des Auges sein, damit der Patient ein Objekt im normalen Abstand von 25 cm zum Nahpunkt scharf sehen kann? d) Welche Brechkraft sollte eine Korrekturlinse für das Auge des Patienten haben? 5.111* Ein Augenoptiker stellt fest, dass der Nahpunkt einer weitsichtigen Person bei 125 cm liegt. Welche Brechkraft ist für Kontaktlinsen erforderlich, wenn der Nahpunkt auf einen angenehmeren Abstand von 25 cm herangeführt werden soll, sodass ein Buch bequem gelesen werden kann? Machen Sie Gebrauch von der Tatsache, dass das Objekt bei der Abbildung im Nahpunkt scharf zu sehen ist. 5.112* Eine kurzsichtige Person (mit dem gleichen Sehvermögen auf beiden Augen) hat einen Fernpunkt bei 100 cm und einen Nahpunkt bei 18 cm, jeweils von der Hornhaut gemessen. (a) Bestimmen Sie die Brennweite, die Korrekturlinsen für diese Person haben müssen. (b) Bestimmen Sie den neuen Nahpunkt der Person. Dazu müssen Sie die Position eines Objektes vor der Linse finden, das nun 18 cm vor der Linse abgebildet wird.

Aufgaben

479

5.113* Ein Kurzsichtiger mit 7 Dioptrien auf beiden Augen benötigt eine Brille, wobei die Korrekturgläser 15 mm vor den Augen getragen werden. Bestimmen Sie die geeignete Brillenstärke. 5.114* Ein Weitsichtiger trägt Korrekturgläser von +9 Dioptrien in 12 mm Entfernung von der Hornhaut. Nun möchte er die Brille durch Kontaktlinsen ersetzen. Bestimmen Sie für diese die passende Stärke. 5.115* Ein Kurzsichtiger mit 6 Dioptrien hat einen Fernpunkt von 16,67 cm. Wie stark müssen seine Korrekturgläser sein, wenn er diese 12 mm vor den Augen trägt? 5.116* Ein Weitsichtiger hat einen Nahpunkt von 100 cm, und der Fernpunkt liegt dort, wo er normalerweise sein sollte. Wie stark müssen Kontaktlinsen sein, die seine Fehlsichtigkeit korrigieren? Bestimmen Sie den neuen Fernpunkt. 5.117 Ein Weitsichtiger kann mit Kontaktlinsen von +3,2 Dioptrien weit entfernte Berge mit entspanntem Auge sehen. Ermitteln Sie die Stärke von Brillengläsern, die 17 mm vor der Hornhaut die gleiche optische Wirkung haben. Wo liegt der Fernpunkt in beiden Fällen? 5.118* Ein Juwelier untersucht mit einer Lupe, die eine Brennweite von 25,4 mm hat, einen Diamanten mit einem Durchmesser von 5,0 mm. a) Bestimmen Sie das maximale Winkelverhältnis der Lupe. b) Wie groß erscheint der Stein durch das Vergrößerungsglas? c) Wie groß ist der durch den Diamanten eingeschlossene Winkel am bloßen Auge, wenn man ihn in den Nahpunkt legt? d) Welcher Winkel entsteht am Auge, wenn man die Lupe einsetzt? 5.119 Wir möchten ein Mikroskop, das man mit entspanntem Auge verwenden kann, aus zwei Sammellinsen konstruieren. Beide Linsen sollen eine Brennweite von 25 mm haben. Angenommen, das Objekt wird in 27 mm Entfernung vom Objektiv positioniert. a) Wie weit sollten die Linsen voneinander entfernt sein? b) Welche Transversalvergrößerung können wir erwarten? 5.120* Abbildung A.5.120 zeigt ein Fokussierungssystem für Röntgenstrahlen im streifenden Einfall, das 1952 von Hans Wolter konstruiert wurde. Wie arbeitet es? Mikroskope mit diesem System werden verwendet, um mit Röntgenstrahlen die Kompression eines Deuteriumkügelchens durch einen Laser für die Kernfusionsforschung zu fotografieren. Ähnliche optische Anordnungen für Röntgenstrahlen werden in astronomischen Fernrohren eingesetzt.

Hyperboloid F2

F1 Paraboloid (a)

(b)

Abb. A.5.120

5 Geometrische Optik

480

F1

(a)

F2

F1

F2

(b)

Abb. A.5.121

5.121* Zwei asphärische Spiegelsysteme für streifenden Einfall, dargestellt in Abbildung A.5.121, werden zur Fokussierung von Röntgenstrahlen verwendet. Erklären Sie, wie sie funktionieren: Identifizieren Sie dazu die Spiegelformen, diskutieren Sie die Lage der einzelnen Brennpunkte usw. 5.122* Das Hubble-Weltraumteleskop besitzt einen 2,4-m-Primärspiegel, den wir als beugungsbegrenzt annehmen wollen. Angenommen, wir wollen damit die Beschriftung eines weit entfernten Satelliten lesen. Bestimmen Sie die maximale Entfernung des Satelliten vom Teleskop, bei der dies möglich ist, unter der Annahme, dass eine Auflösung von 1 cm am Ort des Satelliten ausreicht.

6

Geometrische Optik: Weiterführende Themen

Das vorangegangene Kapitel befasste sich zum überwiegenden Teil mit der Anwendung der Theorie der paraxialen Strahlen auf Systeme dünner, sphärischer Linsen. Dabei gingen wir von zwei wesentlichen Näherungen aus: Wir betrachteten dünne Linsen und setzten die Theorie erster Ordnung als ausreichend für deren Analyse voraus. Keine dieser beiden Annahmen ist bei der Konstruktion eines optischen Präzisionssystems wirklich gerechtfertigt, doch sie bilden die Grundlage für eine erste, ungefähre Beschreibung. Im Folgenden wollen wir einige weiterführende Themen betrachten, vor allem dicke Linsen und Abbildungsfehler (Aberrationen), aber auch dies ist nur ein Anfang. Die heute übliche computergestützte Konstruktion von Linsen bedingt eine gewisse Verschiebung des Schwerpunktes – was der Computer besser kann, überlassen wir ihm auch.

6.1

Dicke Linsen und Linsensysteme

Abbildung 6.1 zeigt eine dicke Linse; darunter versteht man eine Linse, deren Dicke keinesfalls vernachlässigt werden kann. Wie wir sehen werden, könnte man sich ebenso gut ein allgemeines optisches System vorstellen, das sich aus mehreren Linsen zusammensetzt. Der vordere bzw. hintere Brennpunkt oder, wenn Sie wollen, der Objekt- und der Bildbrennpunkt, F und F  , werden zweckmäßigerweise von den beiden (äußeren) Scheitelpunkten aus gemessen. Wir erhalten so die uns schon bekannte vordere bzw. hintere Brennweite, fv bzw. fh . Verlängern wir die einfallenden und austretenden Strahlen, so bilden ihre Schnittpunkte eine gekrümmte Fläche, die innerhalb oder außerhalb der Linse liegen kann. Diese Fläche, die sich im gaußschen (paraxialen) Gebiet durch eine Ebene nähern lässt, nennt man die Hauptebene (siehe Abschn. 6.3.1). Die Punkte, in denen die vordere und die hintere Hauptebene die optische Achse schneidet (Abb. 6.1), heißen vorderer bzw. hinterer Hauptpunkt H1 und H2 . Sie bilden nützliche Bezugspunkte, mit deren Hilfe man einige Systemparameter bestimmen kann. Wir haben bereits besprochen (Abb. 5.17), dass ein Strahl, der den optischen Mittelpunkt der Linse durchläuft, parallel zur Einfallsrichtung austritt. Verlängert man sowohl die ankommenden als auch die austretenden Strahlen, bis sie die optische Achse schneiden, so erhält man (Abb. 6.2) die Knotenpunkte N1 und N2 .

https://doi.org/10.1515/9783111025599-006

6 Geometrische Optik: Weiterführende Themen

482 vordere Hauptebene

N1

vorderer Brennpunkt

O N2 V1 H1

F

H2

V2

vordere Brennweite

Abb. 6.2: Knotenpunkte.

hinterer Brennpunkt V1

H1 H2

F

V2 hintere Brennweite

hintere Hauptebene

Abb. 6.1: Eine dicke Linse.

Wenn die Linse auf beiden Seiten von demselben Medium, im Allgemeinen Luft, umgeben ist, so fallen die Knoten- und Hauptpunkte zusammen. Diese insgesamt sechs Punkte – je zwei Brennpunkte, Hauptpunkte und Knotenpunkte – bilden die Kardinalpunkte des Systems. Wenn die Position des Objekts durch diese sechs Kardinalpunkte gegeben ist, kann das finale Bild für jedes beliebige System von koaxialen brechenden, sphärischen Oberflächen bestimmt werden, d. h. unabhängig von den konkreten Krümmungen, Abständen und Brechungsindizes. Es ist daher üblich, am Anfang jeder Analyse zunächst die Kardinalpunkte zu berechnen. Wie man in Abbildung 6.3 sieht, können die Hauptebenen vollständig außerhalb des Linsensystems liegen. Die abgebildeten Linsen beider Gruppen haben hier jeweils dieselbe Brechkraft, obwohl sie unterschiedlich geformt sind. Man beachte, dass die Hauptebenen der symmetrischen Linse verständlicherweise ebenfalls symmetrisch angeordnet sind. Bei der Plankonkav- oder Plankonvexlinse liegt eine Hauptebene tangential zur gekrümmten Fläche, wie man aus der Definition (angewendet auf den paraxialen Bereich) auch erwarten sollte; die Hauptpunkte eines Meniskus können dagegen außerhalb liegen. Man bezeichnet diese Formenfolge gleicher Brechkraft oft

6.1 Dicke Linsen und Linsensysteme

483

Abb. 6.3: Durchbiegung von Linsen.

als Durchbiegung von Linsen. Eine Faustregel für gewöhnliche Glaslinsen in Luft besagt, dass der Abstand H1 H2 etwa gleich einem Drittel der Linsendicke V1 V2 ist. Eine schnelle Methode zur Verfolgung des Strahlenverlaufs besteht bei dünnen Linsen darin, eine senkrecht zur optischen Achse verlaufende Ebene durch die Mitte der Linse zu zeichnen und alle ankommenden Strahlen an dieser Ebene zu brechen, anstatt an den beiden Grenzflächen, an denen sie tatsächlich abgelenkt werden. Denn für eine dünne Linse können wir annehmen, dass die beiden Hauptebenen (Abb. 6.1) in der Mitte zu einer einzigen Ebene verschmelzen. Auch für dicke Linsen können wir ein ähnliches Schema anwenden, wenn wir ein paar Regeln beachten. Zunächst halten wir fest, dass wir mit der Methode aus dem tatsächlich an der Linse ankommenden Strahl den tatsächlich aus der Linse austretenden Strahl konstruieren können. Die im Inneren der Linse konstruierten Wege entsprechen jedoch im Allgemeinen nicht dem tatsächlichen Strahlenverlauf, was aber auch für dünne Linsen gilt. Jeder Strahl, der auf die erste Grenzfläche der Linse trifft, muss bis zum Schnittpunkt mit der ersten Hauptebene (bei H1 ) verlängert werden. Dieser „Geisterstrahl“ durchquert parallel zur optischen Achse die Lücke zwischen H1 und H2 . Er wird an der zweiten Hauptebene bei H2 gebrochen, wobei die Austrittsrichtung aus der Linse noch zu bestimmen ist. Wie bei der dünnen Linse gibt es drei spezielle Strahlen, deren Verlauf vor, in und hinter der dicken Linse wir ohne Berechnungen vorhersagen können. In Abbildung 6.4 zeigt Strahl 1 in Richtung des Punkts H1 , was dem Weg eines Strahls zum Mittelpunkt einer dünnen Linse wie in Abbildung 5.22 entspricht. Nach dem Durchqueren von H1 verläuft der Strahl parallel zur optischen Achse in Richtung H2 . Dort wird er wieder gebrochen und tritt parallel zu seiner ursprünglichen Richtung aus der Linse aus, also so wie bei einer dünnen Linse. Betrachten wir nun Strahl 2 in Abbildung 6.4, der parallel zur optischen Achse verläuft. Er trifft auf die erste Hauptebene und geht dann in die gleiche Richtung weiter zur zweiten Hauptebene, wo er gebrochen wird. Bei einer Sammellinse wird Strahl 2 zum Brennpunkt F2 hin gebrochen. Bei einer Zerstreuungslinse wird er von der Achse weg gebrochen und verläuft nun so, als käme er vom Brennpunkt F1 (wie bei der dünnen Sammellinse in Abb. 5.22). Strahl 3 ist für die Sammellinse derjenige, der durch den Brennpunkt F1 geht; er trifft auf die erste Hauptebene, wird parallel zur optischen Achse gebrochen und tritt ohne weitere Ablenkung aus der Linse aus. Bei der Zerstreuungslinse verläuft Strahl 3 zunächst in Richtung des hinteren Brennpunkts F2 , wird an der ersten Grenzfläche gebrochen und tritt ebenfalls parallel zur optischen Achse aus der Linse aus.

6 Geometrische Optik: Weiterführende Themen

484

Strahl 1 Strahl 1 Strahl 2 H2 F1

H1

H2 F2

F1

H1

F2

Strahl 3 Strahl 2 Strahl 3

Abb. 6.4: Strahlenverlauf durch eine dicke Linse.

Die dicke Linse kann man als aus zwei sphärischen brechenden Grenzflächen bestehend betrachten, deren Scheitelpunkte durch eine Strecke dl getrennt sind, analog zur Ableitung der Linsengleichung in Abschnitt 5.2.3. Nach etlichen algebraischen Manipulationen1 , während derer dl nicht vernachlässigt werden darf, kommt man für eine in Luft befindliche Linse zu einem sehr interessanten Ergebnis. Der Ausdruck für die konjugierten Punkte kann wieder in der gaußschen Form 1 1 1 + = a a f

(6.1)

geschrieben werden, vorausgesetzt, dass sowohl die Objekt- als auch die Bildweite von der vorderen bzw. hinteren Hauptebene gemessen wird. Die Äquivalentbrennweite oder einfach die Brennweite f , ebenso bezüglich der Hauptebenen berechnet, ist gegeben durch  1 (nl − 1) d 1 1 = (nl − 1) − + . (6.2) f R1 R2 nl R1 R2 Die Hauptebenen befinden sich in Abständen von V1 H1 = h1 und V2 H2 = h2 , die positiv sind, wenn die Ebenen rechts von ihren jeweiligen Scheitelpunkten liegen. Abbildung 6.5 zeigt die Anordnung der verschiedenen Größen. Die Werte von h1 und h2 (Aufgabe 6.22) sind durch h1 = −

f (nl − 1) d R2 nl

(6.3)

h2 = −

f (nl − 1) d R1 nl

(6.4)

und

1

Eine vollständige Herleitung findet sich in Morgan, Introduction to Geometrical and Physical Optics, S. 57. Im Abschnitt 6.2.1 werden wir auf dieses Thema zurückkommen.

6.1 Dicke Linsen und Linsensysteme

y

V1 H1

485

F

H2 V

2

F

y

vordere Brennweite

h2

h1 dl

f

x

hintere Brennweite f

a

a

x

Abb. 6.5: Geometrie der dicken Linse.

gegeben. In derselben Weise gilt die newtonsche Abbildungsgleichung, wie aus den ähnlichen Dreiecken in Abbildung 6.5 ersichtlich ist. Daher ist x x = f 2 ,

(6.5)

wenn f wie angegeben interpretiert wird. Aus den Dreiecken ergibt sich MT =

x f y =− =− . y f x

(6.6)

Offensichtlich liefern die Gleichungen (6.1), (6.2) und (6.5) die Formeln (5.17), (5.16) und (5.23) für dünne Linsen, wenn d → 0 geht. Beispiel 6.1 Bestimmen Sie die Bildweite für ein Objekt, das 30 cm weit vom Scheitelpunkt einer bikonvexen Linse mit den Radien 20 cm und 40 cm, der Dicke 1 cm und dem Brechungsindex 1,5 entfernt ist. Lösung Aus Gleichung (6.2) ergibt sich für die Brennweite (in cm)  1 (1,5 − 1) × 1 1 1 = (1,5 − 1) − + , f 20 −40 1,5 × 20 × (−40) also ist f = 26,8 cm. Außerdem ist h1 = −

26,8 × 0,5 × 1 = +0,22 cm −40 × 1,5

h2 = −

26,8 × 0,5 × 1 = −0,44 cm , 20 × 1,5

und

6 Geometrische Optik: Weiterführende Themen

486

was bedeutet, dass H1 rechts von V1 und H2 links von V2 liegt. Schließlich ist a = 30 + 0,22, womit 1 1 1 +  = 30,2 a 26,8 und a = 238 cm folgt (gemessen von H2 aus). Die Hauptpunkte sind zueinander wechselseitig konjugiert. Mit anderen Worten: Da f = aa /(a + a ) ist, muss a gleich null sein, wenn a = 0 ist, denn f ist endlich und deshalb wird der Punkt H1 im Punkt H2 abgebildet. Außerdem wird ein in der vorderen Hauptebene (x = −f ) befindliches Objekt in der hinteren Hauptebene (x = −f ) in Originalgröße (MT = 1) abgebildet. Aus diesem Grund bezeichnet man die Hauptebenen manchmal als Einheitsebenen. Jeder Strahl, der in Richtung eines Punktes auf der vorderen Hauptebene zeigt, tritt so aus der Linse aus, als käme er vom korrespondierenden Punkt (mit gleichem Achsenabstand nach oben bzw. unten) der hinteren Hauptebene. f L1

L1

L2

F F1 H11 H12 Fi F2 H21 H22 F2 F 

H1

f

f1

f1

d

f2

f2

H2

f

L2

H11 H12 H2 H21 H22

a1

d

(a)

a2

a1 =f1

Abb. 6.6: Zwei verschiedene, aus zwei dicken Linsen zusammengesetzte Systeme.

F

a2 (b)

Betrachten wir nun ein System aus zwei dicken Linsen L1 und L2 (Abb. 6.6). Es seien a1 , a1 , f1 bzw. a2 , a2 , f2 die Objekt-, Bild- und Brennweiten der beiden Linsen, die jeweils bezüglich zu deren eigenen Hauptebenen gemessen wurden. Wie wir wissen, ist die Transversalvergrößerung das Produkt der Vergrößerungen der Einzellinsen, also      a a a (6.7) − 2 =− , MT = − 1 a1 a2 a wobei a und a die Objekt- bzw. Bildweite für die gesamte Kombination sind. Wenn a unendlich ist, wird a = a1 , a1 = f1 , a2 = − (a1 − d) und a = f . Wegen 1 1 1 + = a2 a2 f2 folgt (Aufgabe 6.1) durch Einsetzen in Gleichung (6.7)   f1 a2 f2 f1 f2 f1 a2 =f oder f =− . =  − a2 a2 a2 − f2 a1 − d + f2

6.1 Dicke Linsen und Linsensysteme

487

Also gilt 1 1 d 1 = + − . f f1 f2 f1 f2

(6.8)

Dies ist die Äquivalentbrennweite der Kombination zweier dicker Linsen, wobei alle Abstände von den Hauptebenen aus gemessen werden. Die Hauptebenen für das Gesamtsystem findet man unter Verwendung der Ausdrücke H11 H1 = f d/f2

(6.9)

H22 H2 = f d/f1 ,

(6.10)

und die hier nicht hergeleitet werden (siehe Abschn. 6.2.1). Die angegebenen Gleichungen für dicke Linsen entsprechen jeweils ihren Analoga für dünne Linsen, die wir bereits entwickelt haben. Die Punktepaare H11 , H12 bzw. H21 , H22 kommen für dünne Linsen zur Deckung, wodurch d zum Mittelpunktsabstand wird (siehe Abschn. 5.2.3). Beispiel 6.2 Betrachten Sie noch einmal die dünnen Linsen in Abbildung 5.41 und bestimmen Sie die Lage der Hauptebenen für f1 = −30 cm, f2 = 20 cm und d = 10 cm. Lösung Wir gehen vor wie in Abbildung 6.7 skizziert und bestimmen mithilfe von Gleichung (6.8) die Brennweite des Systems: 1 1 10 1 = + − f −30 20 −30 × 20 und somit f = 30 cm. Die hintere Brennweite, fh = 40 cm, und die vordere Brennweite, fv = 15 cm, haben wir bereits ermittelt (Abschn. 5.2). Da es sich um dünne Linsen handelt, können wir die Gleichungen (6.9) und (6.10) folgendermaßen schreiben: 30 × 10 = +15 cm O1 H1 = 20 und 30 × 10 = +10 cm . O2 H2 = − −30 Beide Werte sind positiv (deshalb liegen die Ebenen rechts von O1 bzw. O2 ) und stimmen mit den in der Abbildung eingezeichneten Ergebnissen überein. Tritt das Licht von rechts ein, so gleicht das System einem Teleobjektiv, das 15 cm weit von der Filmebene entfernt positioniert werden muss, aber eine effektive Brennweite von 30 cm besitzt.

6 Geometrische Optik: Weiterführende Themen

488

Abb. 6.7: Ein Linsensystem.

Dasselbe Verfahren kann man auf drei, vier oder mehr Linsen erweitern. Daher ist      a a − 3 . . . . (6.11) f = f1 − 2 a2 a3 Entsprechend kann man die ersten beiden Linsen als eine einzelne dicke Linse auffassen, deren Hauptpunkte und Brennweite berechnet werden. Diese wiederum wird mit der dritten Linse kombiniert, und das Verfahren wird für jedes der verbleibenden Elemente wiederholt.

6.2

Strahlenverlaufsberechnung

Die Strahlenverlaufsberechnung (analytische Strahlenverfolgung oder Raytracing) ist zweifellos eines der wichtigsten Hilfsmittel des Konstrukteurs. Hat dieser ein optisches System auf dem Papier entworfen, kann er mathematisch Strahlen durch das System laufen lassen, um dessen Leistung zu beurteilen. Jeder Strahl, ob paraxial oder nicht, kann exakt verfolgt werden. Dazu muss lediglich die Brechungsgleichung



 ˆi × u ˆt × u ˆ n = nt k ˆn [4.6] ni k auf die erste Fläche angewendet werden; sie bestimmt, wo der gebrochene Strahl danach auf die zweite Fläche trifft; die Gleichung wird wieder angewendet usw., bis der Strahl das gesamte System durchlaufen hat. Früher wurden fast ausschließlich Meridionalstrahlen (die in der Ebene der optischen Achse liegen) durchgerechnet, da

099C DOUBLE GAUSS

SCALE 7.0

ORA

8-APR-84

Computergestützte Strahlenverlaufsberechnung. (Foto mit frdl. Genehmigung der Optical Research Associates, Pasadena, California.)

6.2 Strahlenverlaufsberechnung

489

nichtmeridionale oder windschiefe Strahlen (welche die Achse nicht schneiden) mathematisch beträchtlich komplizierter zu behandeln sind. Für einen Computer ist diese Unterscheidung allerdings kaum von Bedeutung: Während eine Fachkraft mit einem Taschenrechner wahrscheinlich 10 bis 15 Minuten für die Berechnung des Weges eines einzigen windschiefen Strahls durch eine einzelne Fläche benötigte, erledigt ein Computer die gleiche Arbeit in einem Sekundenbruchteil und geht außerdem mit unverminderter Begeisterung an die nächste Berechnung. d21

d32 P2

αt2

αi2 P1

α1 θi1

αt1 α1

αi1

y1 V1

ni1

y2

θt1 R1 α1

P3

C

nt1 = ni2

y3 V2

V3

nt2 = ni3

nt3

Abb. 6.8: Strahlengeometrie.

Der einfachste Fall der Strahlenverlaufsberechnung erfolgt anhand eines paraxialen Meridionalstrahls, der eine dicke sphärische Linse durchläuft. Die Anwendung des snelliusschen Gesetzes am Punkt P1 der Abbildung 6.8 liefert ni1 θi1 = nt1 θt1 oder ni1 (αi1 + α1 ) = nt1 (αt1 + α1 ) . Denken Sie daran, dass die Winkel alle im Bogenmaß gegeben sind. Da α = y1 /R1 ist, wird die letzte Gleichung zu ni1 (αi1 + y1 /R1 ) = nt1 (αt1 + y1 /R1 ) . Durch Umstellen erhalten wir   nt1 − ni1 y1 . nt1 αt1 = ni1 αi1 − R1 Wie wir in Abschnitt 5.7.2 gelernt haben, ist die Brechkraft einer brechenden Fläche aber D1 =

(nt1 − ni1 ) . R1

6 Geometrische Optik: Weiterführende Themen

490 Also folgt nt1 αt1 = ni1 αi1 − D1 y1 .

(6.12)

Dies ist die so genannte Refraktionsgleichung für die erste Grenzfläche. Nachdem der Strahl im Punkt P1 gebrochen wurde, passiert er das homogene Medium der Linse bis zum Punkt P2 , der auf der zweiten Grenzfläche liegt. Die Höhe von P2 kann als y2 = y1 + d21 αt1

(6.13)

geschrieben werden, wobei wir ausnutzen, dass tan αt1 ≈ αt1 ist. Mit dieser so genannten Transferformel können wir den Strahl von P1 nach P2 verfolgen. Wir erinnern uns, dass die Winkel positiv sind, wenn der Strahl eine positive Steigung hat. Da wir uns mit dem paraxialen Gebiet befassen, ist d21 ≈ V2 V1 und y2 kann leicht berechnet werden. Die Gleichungen (6.12) und (6.13) werden dann nacheinander angewendet, um den Strahlengang durch das ganze System rechnerisch zu bestimmen. Natürlich handelt es sich durchgängig um Meridionalstrahlen; wegen der Linsensymmetrie bleibt ein derartiger Strahl stets in derselben meridionalen Ebene. Der Vorgang ist zweidimensional, denn es gibt zwei Gleichungen und zwei Unbekannte, αt1 und y2 . Ein windschiefer Strahl müsste dagegen dreidimensional behandelt werden.

6.2.1 Matrizenmethoden Zu Beginn der 1930er-Jahre formulierte T. Smith eine hochinteressante Möglichkeit für die Behandlung der Gleichungen zur Strahlungsverfolgung: Die einfache lineare Form der Ausdrücke und die sich wiederholende Art und Weise der Anwendung legte die Verwendung von Matrizen nahe. Die Refraktions- und Transferprozesse konnten nun mathematisch mit Matrixoperatoren nachvollzogen werden. Diese ersten Überlegungen fanden fast 30 Jahre lang nur wenig Beachtung, bis das Verfahren in den frühen 1960er-Jahren auf neues Interesse stieß.2 Wir werden nur die wichtigsten Merkmale des Verfahrens umreißen und verweisen für ein ausführliches Studium auf die angegebene Literatur. Matrizenanalyse von Linsen Wir wollen die Formeln nt1 αt1 = ni1 αi1 − D1 yi1

(6.14)

und yt1 = 0 + yi1

(6.15)

aufschreiben, die uns zunächst nicht sehr voranbringen, da wir damit nur y1 in Gleichung (6.12) durch das Symbol yi1 ausgetauscht und yt1 = yi1 gesetzt haben. Der 2

Siehe auch K. Hallbach, „Matrix Representation of Gaussian Optics“, Am. J. Phys. 32 (1964) 90; W. Brouwer, Matrix Methods in Optical Instrument Design; E. L. O’Neill, Introduction to Statistical Optics; A. Nussbaum, Geometric Optics.

6.2 Strahlenverlaufsberechnung

491

letzte Schritt hat rein kosmetischen Zweck, wie wir gleich sehen werden. Tatsächlich besagt die Gleichsetzung, dass die Höhe des Bezugspunktes P1 über der Achse im Eintrittsmedium (yi1 ) gleich seiner Höhe im brechenden Medium (yt1 ) ist. Aber nun kann das Gleichungspaar in die Matrixform    1 −D1 ni1 αi1 nt1 αt1 = (6.16) yt1 0 1 yi1 gebracht werden. Dies kann man ebenso gut als    ni1 /nt1 −D1 /nt1 αi1 αt1 = yt1 0 1 yi1

(6.17)

schreiben, sodass die genaue Form der 2×1-Spaltenmatrix eigentlich eine Frage des Geschmacks ist. Jedenfalls kann man sich die Matrizen als Strahlen auf beiden Seiten von P1 (vor bzw. nach der Brechung) vorstellen. Dementsprechend können wir, wenn wir rt1 und ri1 für die beiden Strahlen verwenden,   nt1 αt1 ni1 αi1 und ri1 ≡ (6.18) rt1 ≡ yt1 yi1 schreiben. Die 2×2-Matrix ist die Brechungsmatrix  1 −D1 , R1 ≡ 0 1

(6.19)

und so kann Gleichung (6.16) kompakt in der Form rt1 = R1 ri1

(6.20)

geschrieben werden. Dieser Ausdruck besagt, dass R1 während der Brechung an der ersten Grenzfläche den Strahl ri1 in den Strahl rt1 transformiert. Beachten Sie, dass die Anordnung der Terme in den Gleichungen (6.14) und (6.15) die Form der Brechungsmatrix bestimmt. In der Literatur findet man verschiedene, einander äquivalente Schreibweisen der Matrix. Aus Abbildung 6.8 erhalten wir ni2 αi2 = nt1 αt1 , also ni2 αi2 = nt1 αt1 + 0

(6.21)

und yi2 = d21 αt1 + yt1 ,

(6.22)

wobei ni2 = nt1 und αi2 = αt1 ist; hier wurde Gleichung (6.13) berücksichtigt, mit y2 = yi2 , um etwas Ordnung in die Notation zu bringen. Damit ist    1 0 nt1 αt1 ni2 αi2 = . (6.23) yi2 yt1 d21 /nt1 1

6 Geometrische Optik: Weiterführende Themen

492 Die Transfermatrix ist dann  1 0 T21 ≡ d21 /nt1 1

(6.24)

Hier gilt für die Linse d21 = dl und nt1 = nl , sodass  1 0 . T21 = dl /nl 1 Diese Matrix transformiert den gebrochenen Strahl in P1 (rt1 ) in den einfallenden Strahl in P2 :  n α rt2 ≡ i2 i2 . yi2 Folglich werden die Gleichungen (6.21) und (6.22) einfach zu ri2 = T21 rt1 .

(6.25)

Beispiel 6.3 Betrachten Sie eine von Luft umgebene konkav-plane Linse, die einen Brechungsindex von 1,50 hat. Die auf der optischen Achse gemessene Dicke der Linse beträgt 1,00 cm. (a) Bestimmen Sie die Transfermatrix. (b) Spielt das umgebende Medium hier eine Rolle? Lösung (a) Die Transfermatrix ist durch Gleichung (6.24) gegeben:  1 0 . T21 ≡ d21 /nt1 1 Hierbei ist nt1 der Brechungsindex der Linse und d21 die axiale Dicke. Für die gegebenen Werte folgt   1 0 1 0 = . T21 ≡ 1/1,50 1 1/0,667 1 (b) Die Transfermatrix hängt nur von dem Medium ab, das der Strahl durchdringt.

Setzen wir Gleichung (6.20) ein, so wird daraus ri2 = T21 R1 ri1 .

(6.26)

Die 2×2-Matrix, die durch das Produkt der Transfer- und der Brechungsmatrix T21 R1 gebildet wird, formt den bei P1 einfallenden Strahl in den bei P2 einfallenden Strahl

6.2 Strahlenverlaufsberechnung

493

um. |T21 |, die Determinante von T21 , ist gleich 1, d. h. (1) (1) − (0) (d21 /nt1 ) = 1. Ebenso ist |R1 | = 1, und da die Determinante eines Matrizenprodukts gleich dem Produkt der einzelnen Determinanten ist, gilt |T21 R1 | = 1. Dies erlaubt eine schnelle Verifizierung der Rechnung. Führen wir das Verfahren an einer zweiten Grenzfläche (Abb. 6.8) der Linse mit der Brechungsmatrix R2 aus, so folgt  1 −D2 , (6.27) mit R2 ≡ rt2 = R2 ri2 0 1 und die Brechkraft der zweiten Oberfläche ist D2 =

(nt2 − ni2 ) . R2

Beispiel 6.4 Die gekrümmte Seite einer konkav-planaren Linse habe einen Krümmungsradius von 20,0 cm. Die Linse ist von Luft umgeben und hat einen Brechungsindex von 1,50. Bestimmen Sie die Brechungsmatrix für jede der beiden Grenzflächen. Lösung Für die konkave Seite ist der Krümmungsradius negativ, und mit Gleichung (5.70) haben wir D1 =

nl − 1 1,5 − 1 = −0, 025 cm−1 . = R1 −20,0

Die Brechkraft ist also negativ. Die Brechungsmatrix für die gekrümmte Fläche ist damit   1 0,025 1 −D1 = . R1 = 0 1 0 1 Für die flache Seite ist R2 = ∞, und aus Gleichung (5.71) folgt D2 = Damit ist R2 =

nl − 1 = 0. −R2 

 10 1 −D2 = . 0 1 01

Aus Gleichung (6.26) folgt rt2 = R2 T21 R1 ri1 .

(6.28)

6 Geometrische Optik: Weiterführende Themen

494

Die Systemmatrix A ist dann definiert als A ≡ R2 T21 R1 .

(6.29)

Sie überführt den bei P1 einfallenden Strahl in den Strahl, der an der zweiten Grenzfläche bei P2 austritt. Die Systemmatrix hat die Form  a11 a12 . (6.30) A= a21 a22 Wegen 

1 −D2 A= 0 1



 1 0 1 −D1 d21 /nt1 1 0 1

oder

⎤⎡ ⎡ 1 1 −D2 ⎦ ⎣ ⎣ A= d21 0 1 nt1

folgt

⎡ D2 d21 1− ⎢ nt1 A=⎣ d 21

nt1

⎤ −D1 D1 d21 ⎦ 1− nt1 ⎤ D2 D1 d21 nt1 ⎥ ⎦, D1 d21 1− nt1

−D1 − D2 +

und wieder ist |A| = 1 (Aufgabe 6.21). Da wir nur eine einzelne Linse betrachten, können wir die Notation wieder ein wenig vereinfachen und setzen d21 = dl , nt1 = nl . Damit ergibt sich ⎡ ⎤ D1 D2 dl D2 dl  −D1 − D2 + 1− a a ⎢ nl nl ⎥ . (6.31) A = 11 12 = ⎣ ⎦ D1 dl dl a21 a22 1− nl nl Der Wert jedes einzelnen Elements von A ergibt sich aus den physikalischen Linsenparametern wie Dicke, Brechungsindex und Radien (über D). Daher sollten die Kardinalpunkte der Linse, die nur durch deren Form bestimmt sind, aus A ableitbar sein. Die Systemmatrix, in diesem Fall aus Gleichung (6.31), transformiert einen einfallenden Strahl an der ersten Fläche in einen austretenden Strahl an der zweiten Fläche; als Gedächtnisstütze bezeichnen wir sie mit A21 . Beispiel 6.5 Eine konkav-plane Linse, die von Luft umgeben ist, hat einen Brechungsindex von 1,50, eine axiale Dicke von 1,00 cm und einen vorderen Krümmungsradius

6.2 Strahlenverlaufsberechnung

495

von 20,0 cm. Auf die Vorderseite der Linse trifft 2,00 cm oberhalb der optischen Achse ein Strahl, der einen Winkel von 5,73◦ mit der Achse bildet. Bestimmen Sie die Höhe und den Winkel beim Austritt des Strahls aus der Linse. Zeigen Sie, dass die Systemmatrix die gleiche ist wie in den beiden vorherigen Beispielen. Lösung Rufen wir uns Gleichung (6.28) in Erinnerung. Das, was wir brauchen, ist rt2 , die Matrix für den austretenden Strahl. Äquivalent ist rt2 = Ari1 . Da die Linse von Luft umgeben ist, ist der an der zweiten Grenzfläche austretende Strahl gegeben durch 

  a11 a12 α αt2 = = i1 . yt2 a21 a22 yi1

Da hier D2 = 0 gilt, folgt aus Gleichung (6.31)  A=

1

−D1



dl /nl 1 − D1 dl /nl

.

Da der Krümmungsradius R1 negativ ist, gilt D1 =

(nl − 1) 0,50 = −0,025 cm−1 . = R1 −20,0

Dementsprechend ist  A=

1

0,025

0,667 1 − (−0,025)0,667



 =

1

0,667 1,0167

Mit 11,46◦ = 0,100 rad erhalten wir 

0,025

  1 0,025 0,100 αt2 = yt2 2,00 0,667 1,0167   1 0,025 · 2,00 = . 0,667 · 0,100 1,0167 · 2,00

 .

6 Geometrische Optik: Weiterführende Themen

496

Der Strahl tritt also unter dem Winkel αt2 = 0,150 rad aus und die Austrittsstelle liegt yt2 = 2,10 cm oberhalb der optischen Achse. Wegen A = R2 T21 R1 folgt aus den letzten beiden Beispielen     1 0 1 0 1 0,025 A= 0 1 0,667 1 0 1    1 0 1 0,025 = 0 1 0,667 1,0167   1 0,025 = . 0,667 1,0167 Die Ergebnisse stehen also im Einklang miteinander.

Abb. 6.9: Abbildungsgeometrie. Man beachte, dass dO hier negativ ist, dI dagegen positiv.

Das Entstehen einer Abbildung lässt sich nach Einführung entsprechender Objektund Bildebenen nun recht leicht beschreiben (Abb. 6.9). Der erste Operator, T1O , transferiert den Referenzpunkt vom Objekt zur Linse (PO nach P1 ). Der nächste Operator, A21 , transferiert den Strahl durch die Linse, und eine letzte Transfermatrix, TI2 , bringt ihn zur Bildebene (nach PI ). Daher wird der Strahl im Bildpunkt (rI ) durch rI = TI2 A21 T1O rO

(6.32)

bestimmt, wobei rO der Strahl in PO ist. In Komponentenschreibweise ist das      1 0 a11 a12 1 0 nO αO nI αI = . (6.33) yI yO dI /nI 1 a21 a22 −dO /nO 1 Vor dem Abstand zwischen dem Scheitel V1 und dem Objekt steht ein Minuszeichen, da die Distanz dO hier als eine negative Größe angesehen wird.

6.2 Strahlenverlaufsberechnung

497

Es ist T1O rO = ri1 und A21 ri1 = rt2 , und folglich ist TI2 rt2 = rI . Dabei beziehen sich die Indizes O, 1, 2, . . . , I auf die Punkte PO , P1 , P2 usw., während die Indizes i und t angeben, ob wir uns auf der Einfalls- oder der gebrochenen Seite des Bezugspunktes befinden. Die Multiplikation mit einer Brechungsmatrix konvertiert i in t, lässt aber die Kennzeichnung des Bezugspunktes unverändert, im Gegensatz zur Multiplikation mit einer Transfermatrix. Wir wollen Gleichung (6.33) vereinfachen, indem wir annehmen, dass die Linse von Luft umgeben ist. Es gilt dann nI = nO = 1. In Aufgabe 6.18 sollen Sie zeigen, dass yI = αO [a21 − a22 dO + (a11 − a12 dO )] + yO (a22 + a12 dI ) .

(6.34)

Dies muss unabhängig von dem Winkel αO gelten, unter dem ein Strahl von einem Objekt ausgeht. Paraxiale Strahlen, die einen Punkt bei yO verlassen, müssen, egal wie der Winkel αO ist, bei yI in einem Punkt zusammenlaufen. Folglich gilt a21 − a22 dO + (a11 − a12 dO )dI = 0 .

(6.35)

Die Beziehung zwischen der Bildweite dI – gemessen vom zweiten Scheitel (rechts) – und der Objektweite dO – gemessen vom ersten Scheitel (links) – lautet daher dI =

−a21 + a22 dO . a11 − a12 dO

(6.36)

Beispiel 6.6 Ein von Luft umgebenes Objekt befindet sich 20,0 cm vor dem ersten Scheitel eines Tessars, dessen Systemmatrix durch  0,848 −0,198 1,338 0,867 gegeben ist. Bestimmen Sie die Position des Bildes relativ zur hinteren Grenzfläche der Linse. Lösung Aus Gleichung (6.35) erhalten wird dI =

−18,678 −a21 + a22 dO −1,338 + 0,867(−20,0) = . = a11 − a12 dO 0,848 − (−0,198)(−20,0) 3,112

Das Bild befindet sich also etwa 6 cm rechts vom zweiten Scheitel. Aus Gleichung (6.34) können wir einen Ausdruck für die Vergrößerung MT ableiten. Der erste Term ist null, und es bleibt yI = yO (a22 + a12 dI ) .

6 Geometrische Optik: Weiterführende Themen

498 Somit ist MT = a22 + a12 dI .

(6.37)

In Aufgabe 6.26 sollen Sie zeigen, dass man die rechte Seite umschreiben und durch die Objektweite ausdrücken kann: MT =

1 . a11 − a12 dO

(6.38)

Beispiel 6.7 Die Tessar-Linse aus dem vorherigen Beispiel hat ein 20 cm vor ihrer Vorderseite platziertes Objekt 6 cm von ihrer Rückseite entfernt abgebildet. Benutzen Sie die Gleichungen (6.37) und (6.38), um die Vergrößerung zu bestimmen und zu verifizieren. Lösung Aus Gleichung (6.37) erhalten wir MT = a22 + a12 dI = 0,867 + (−0,198) 6,00 = −0,321 . Das Bild ist umgekehrt und vergrößert. Um dieses Ergebnis zu überprüfen, verwenden wir 1 MT = a11 − a12 dO und erinnern uns, dass dO in diesem Fall nach links gemessen wird und daher negativ ist, sodass MT = [0,848 − (−0,198)(−20,0)]−1 = −0,321 . Die auf den beiden Rechenwegen erhaltenen Ergebnisse stimmen somit überein.

Wenden wir uns nun wieder Gleichung (6.31) zu und untersuchen wir einige der Terme, beispielsweise −a12 = D1 + D2 − D1 D2 dl /nl . Nehmen wir der Einfachheit halber an, dass sich die Linse in Luft befindet, so wird D1 =

nl − 1 R1

und

D2 =

nl − 1 −R2

wie in den Gleichungen (5.70) und (5.71). Also ist  1 1 (nl − 1) dl − + . −a12 = (nl − 1) R1 R2 R1 R2 nl

6.2 Strahlenverlaufsberechnung

V1 H1

F

499

F

H2 V 2 nt1

ni1

nt2

nt

vordere Brennweite f

hintere Brennweite f

Abb. 6.10: Hauptebenen und Brennweiten.

Dies ist aber gerade der Ausdruck für die Brennweite einer dicken Linse in Luft, Gleichung (6.2); es ist also −a12 = −1/f = +1/f  .

(6.39)

Dabei ist f negativ, und f  ist positiv. Damit ist die Brechkraft der Linse als Ganzes gegeben durch −a12 = Dl = D1 + D2 −

D1 D2 dl . nl

Umgibt die Linse auf der linken Seite ein Medium mit anderem Brechungsindex als auf der rechten Seite (Abb. 6.10), was etwa im menschlichen Auge der Fall ist, so haben wir nt2 ni1 =+  . (6.40) −a12 = − f f Entsprechend gilt allgemein (was Sie in einer Aufgabe zeigen sollen) V1 H1 =

ni1 (1 − a11 ) −a12

(6.41a)

oder, wenn die Linse von Luft umgeben ist, V1 H1 =

(1 − a11 ) , −a12

(6.41b)

wobei im Allgemeinen gilt V2 H2 =

nt2 (a22 − 1) , −a12

(6.42a)

bzw., wenn die Linse von Luft umgeben ist, V2 H2 =

(a22 − 1) , −a12

(6.42b)

6 Geometrische Optik: Weiterführende Themen

500

womit die Hauptpunkte festgelegt sind. Entsprechend sind die vordere und die hintere Brennebene festgelegt durch die Abstände V1 F und V2 F  . Unter Beachtung von Gleichung (6.31) erhalten wir V1 F = a11 f

(6.43a)

V1 F  = a22 f  .

(6.43b)

und

Beispiel 6.8 Eine kleine, bikonvexe, sphärische Linse hat eine Dicke von 0,500 cm und einen Brechungsindex von 1,50. Die Linse ist von Luft umgeben. Die erste Grenzfläche hat einen Krümmungsradius von 2,00 cm und die zweite von 1,00 cm. (a) Bestimmen Sie für beide Seiten die Brechkraft. (b) Wo befinden sich die Hauptebenen? (c) Berechnen die Brennweite der Linse. (d) Bestimmen Sie die vordere und die hintere Brennweite. Lösung (a) Die Brechkräfte der vorderen und der hinteren Seite sind durch D1 =

nl − 1 R1

und

D2 =

nl − 1 −R2

gegeben. Damit erhalten wir die Werte D1 = (1,50 − 1)/2,00 cm = 0,250 cm−1 und D2 = (1,50 − 1)/1,00 cm = 0,500 cm−1 . Beide Werte sind positiv, wie es sein sollte. (b) Die Hauptebenen befinden sich bei V1 H1 =

1 − a11 −a12

und

V2 H 2 =

a22 − 1 . −a12

Es scheint daher eine gute Idee, zunächst a11 , a12 und a22 mithilfe von Gleichung (6.31) zu berechnen. Wir erhalten a11 = 1 −

D2 dl 0,50 · 0,50 = 0,833 =1− nl 1,50

und D1 D2 dl dl 0,25 · 0,50 · 0,50 = −0,708 = −0,25 − 0,50 + 1,50

a12 = −D1 − D2 +

und

6.2 Strahlenverlaufsberechnung

501

D1 dl 0,25(0,50) =1− nl 1,50 = 0,917 .

a22 = 1 −

Die Lage der Hauptebenen ist dann gegeben durch V1 H1 =

1 − 0,833 = +0,236 cm +0,708

V2 H2 =

0,917 − 1 = −0,117 cm . +0,708

und

(c) Die Brennweite F der Linse ist gegeben durch Gleichung (6.39): −a12 = +

1 = +0,708 . f

Wir erhalten also f  = +1,41 cm und f = −1,41 cm, jeweils gemessen von den Hauptpunkten (nach rechts positiv, nach links negativ). (d) Für die vordere und die hintere Brennweite ergibt sich dann vordere Brennweite = a11 f = 0,833(−1,412) = −1,18 cm und hintere Brennweite = a22 f  = 0,917(+1,412) = +1,29 cm . Um die Methode noch etwas mehr zu veranschaulichen, betrachten wir das in Abbildung 6.11 gezeigte Tessar-Objektiv3 . Die Systemmatrix hat die Form A71 = R7 T76 R6 T65 R5 T54 R4 T43 R3 T32 R2 T21 R1 , wobei



T21

1 ⎣ = 0,357 1,6116

0 1

⎤ ⎦ , T32



1 ⎣ = 0,189 1

0 1

⎤ ⎦ , T43



1 ⎣ = 0,081 1,6053

⎤ 0 ⎦ 1

usw. ist. Außerdem gilt ⎡ ⎡ ⎡ ⎤ ⎤ ⎤ 1,6116−1 1−1,6116 1,6053−1 1 − 1 − 1 − 1,628 ⎦ , R2 = ⎣ −27,57 ⎦ , R3 = ⎣ −3,457 ⎦ R1 = ⎣ 0 1 0 1 0 1 3

Dieses Beispiel wurde vor allem deshalb gewählt, weil Nussbaums Buch Geometric Optics ein einfaches Fortran-Computerprogramm speziell für dieses Objektiv enthält, denn niemand würde sich mehr die Arbeit machen, die Systemmatrix von Hand zu berechnen.

6 Geometrische Optik: Weiterführende Themen

502 nt2 =1

nt4 =1

nt1 =1.6116 nt3 =1.6053

V1

V2

d21 0.357 R1 R2 R3 R4

= = = =

V3 V4

d43 0.081

d32 0.189

1.628 −27.57 −3.457 1.582

nt5 =1.5123 nt6 =1.6116

V5

d54 0.325

V6

d65 0.217

V7

d76 0.396

R5 = ∞ R6 = 1.920 R7 = −2.400

Abb. 6.11: Ein Tessar.

usw. Man erhält beim Ausmultiplizieren der Matrizen in einer ziemlich langen, im Prinzip aber einfachen Rechnung  0,848 −0,198 A71 = 1,338 0,867 und daraus f = 5,06 , V1 H1 = 0,77 und V7 H2 = −0,67. Dünne Linsen Oft ist es zweckmäßig, ein System dünner Linsen unter Anwendung der Matrixdarstellung zu betrachten, und zu diesem Zweck wollen wir zur Gleichung (6.31) zurückkehren. Sie beschreibt die Systemmatrix für eine Einzellinse, und wenn wir dl → 0 gehen lassen, entspricht sie einer dünnen Linse. Dies ist äquivalent dazu, T21 in eine Einheitsmatrix umzuformen; deshalb ist  1 − (D1 + D2 ) . A = R2 R1 = 0 1 Wie wir in Abschnitt 5.7.2 gelernt haben, ist die Brechkraft D einer dünnen Linse gleich der Summe der Brechkräfte ihrer Oberflächen. Also ist   1 −D 1 −1/f A= = . 0 1 0 1

6.2 Strahlenverlaufsberechnung

503

Außerdem ist die Systemmatrix zweier dünner Linsen (Abb. 5.36) in Luft mit einem gegenseitigen Abstand d gegeben als    1 −1/f2 1 0 1 −1/f1 A= 0 1 d 1 0 1 oder  1 − d/f2 −1/f1 + d/f1 f2 − 1/f2 . A= d −d/f1 + 1 Damit ist −a12 =

1 1 1 d = + − , f f1 f2 f1 f2

und aus den Gleichungen (6.36) und (6.37) folgt O1 H1 = f d/f2 , O2 H2 = −f d/f1 , was uns schon vertraut ist. Wie Sie sehen, ist es nun nicht mehr schwierig, die Brennweite und die Hauptpunkte für ein Linsensystem aus drei, vier oder mehr dünnen Linsen zu berechnen. Matrixanalyse von Spiegeln Um die entsprechende Matrix für einen Spiegel abzuleiten, betrachten wir einen konkaven sphärischen Spiegel (Abb. 6.12) und schreiben zwei Gleichungen für den einfallenden und den reflektierten Strahl auf. Wieder hängt die endgültige Form der Matrix davon ab, wie wir diese beiden Gleichungen ordnen und welche Vorzeichen wir den einzelnen Größen geben. Gesucht sind Gleichungen für die Strahlwinkel und für die Höhe, bei der die Strahlen mit dem Spiegel wechselwirken. Zuerst betrachten wir die Strahlwinkel. Das Reflexionsgesetz besagt θi = θr ; außerdem ist hier tan (αi − θi ) = y  /R, und deshalb gilt (αi − θi ) ≈ y  /R .

(6.44)

Werden die Winkel als positiv angenommen, ist y positiv, aber nicht R; setzen wir einen negativen Wert für den Radius ein, so wird die Gleichung fehlerhaft. Deshalb schreiben wir (αi − θi ) = −y  /R. Um nun zur Analyse von αr zu kommen, beachten wir, dass αi = αr + 2θi und θi = (αi − αr ) /2. Einsetzen in Gleichung (6.44) liefert αr = −αi − 2y  /R, und Multiplizieren mit n, dem Brechungsindex des umgebenden Mediums (der gewöhnlich gleich 1 ist), führt zu nαr = −nαi − 2ny  /R . Die zweite benötigte Gleichung ist einfach yr = y  und damit ist    −1 −2n/R nαi nαr = . yr y 0 1

6 Geometrische Optik: Weiterführende Themen

504

αi αr

αi

θr θi

αi −θi

αi

C

y

R

n

Abb. 6.12: Die Geometrie der Reflexion an einem Spiegel. Die Strahlwinkel αi und αr sind bezüglich der optischen Achse gemessen.

Damit ist die Spiegelmatrix M für einen sphärischen Spiegel gegeben durch  −1 −2n/R , M = 0 1

(6.45)

wobei wir uns an Gleichung (5.49) erinnern, die besagt, dass f = −2/R ist. Planspiegel und optische Resonatoren Für einen in Luft (n = 1) befindlichen Planspiegel (R → ∞) ist die Matrix  −1 0 , M| = 0 1 wobei das Minuszeichen im ersten Element den Strahl bei der Reflexion umkehrt. Abbildung 6.13 zeigt zwei Planspiegel, die einander gegenüberstehen und einen optischen Resonator bilden (siehe Abschn. 13.1.3). Licht, das Punkt O verlässt, durchläuft den Zwischenraum in positiver Richtung, wird von Spiegel 1 reflektiert, durchläuft den Zwischenraum in negativer Richtung und wird von Spiegel 2 reflektiert. Die Systemmatrix ist A = M|2 T21 M|1 T12 . Es ist



−1 0 A= 0 1



  1 0 −1 0 1 0 −d 1 0 1 d 1

6.3 Aberrationen

505

M1

T12 O M2

T21

M2

M1

und damit A=



Abb. 6.13: Schematische Darstellung eines optischen Resonators, der durch die Spiegel M1 und M2 gebildet wird.

1 0 , 2d 1

wobei die Determinante der Systemmatrix wieder gleich 1 ist: |A| = 1. Ist der einfallende Strahl axial (α = 0), bringt ihn die Systemmatrix zurück an seinen Ausgangspunkt, sodass der resultierende Strahl rf gleich dem ursprünglichen Strahl ri ist. Somit gilt also Ari = rf = ri . Diese spezielle mathematische Beziehung nennt man Eigenwertgleichung; etwas allgemeiner geschrieben lautet sie Ari = ari (a ist eine Konstante). Anders ausgedrückt ist    α 1 0 αi = a i . y 2d 1 y  Ist αi = 0 und verläuft der einfallende Strahl axial, so ist y  = ay  , woraus a = 1 folgt. Die Systemmatrix wirkt wie eine Einheitsmatrix, die ri nach zwei Reflexionen wieder in ri überführt. Axiale Lichtstrahlen laufen in dem so genannten Hohlraumresonator hin und her ohne zu entweichen. Hohlraumresonatoren können auf vielfältige Weise mit den verschiedensten Spiegeln konstruiert werden (Abb. 13.16). Wenn Licht nach mehrmaligem Durchqueren eines Hohlraums wieder zu seinem Ursprungsort und seiner ursprünglichen Orientierung zurückkehrt, so ist es „eingefangen“, und der Hohlraum heißt stabil. Den konfokalen Hohlraum, der von zwei einander gegenüberstehenden konkaven Hohlspiegeln gebildet wird, werden wir in Aufgabe 6.28 analysieren.

6.3

Aberrationen

Wie wir bereits wissen, ist die Theorie erster Ordnung nicht mehr als eine gute Näherung – eine genaue Strahlenberechnung oder gar Messungen an einem Pro-

506

6 Geometrische Optik: Weiterführende Themen

totypen würden die Abweichungen der paraxialen Beschreibung aufdecken. Solche Abweichungen von den idealisierten Bedingungen der gaußschen Optik nennt man Aberrationen. Diese kann man in zwei Hauptgruppen einordnen, die chromatischen Aberrationen (die aus der Frequenzabhängigkeit von n resultieren) und die monochromatischen Aberrationen. Letztere treten sogar bei quasimonochromatischem Licht auf und lassen sich ihrerseits in zwei Untergruppen unterteilen. Es gibt monochromatische Aberrationen, die das Bild verschlechtern, indem sie es unscharf machen, wie beispielsweise sphärische Aberrationen, Koma und Astigmatismus. Außerdem gibt es Aberrationen, die das Bild verformen, wie beispielsweise die petzvalsche Bildfeldwölbung und die Verzeichnung. Wir wissen bereits, dass sphärische Flächen im Allgemeinen nur im gaußschen Gebiet ideale Abbildungen liefern. Nun müssen wir die Art und den Umfang der Abweichungen bestimmen, die aus der Verwendung solcher Flächen mit endlich großen Öffnungen resultieren. Durch geschickte Wahl der physikalischen Parameter des Systems (der Brechkräfte, Formen, Dicken, Glassorten und der Abstände der Linsen sowie die Lage der Blenden) können diese Aberrationen minimiert werden. Man korrigiert hier die meisten Fehler durch eine leichte Änderung der Form einer Linse oder eine Verschiebung der Lage einer Blende (sehr ähnlich der Abstimmung eines Stromkreises mithilfe kleiner regelbarer Kondensatoren, Spulen und Potenziometer). Am Ende werden die unerwünschten Verformungen der Wellenfront während des Durchgangs durch eine bestimmte Fläche beim Durchqueren anderer Flächen im weiteren Verlauf des Strahlengangs weitgehend ausgeglichen. Bereits 1950 wurden Programme zur rechnerischen Bestimmung des Verlaufs von Lichtstrahlen für die damals neuen digitalen Computer entwickelt, und um 1954 ging man schon daran, Software zur Konstruktion optischer Systeme zu entwickeln. Anfang der 1960er-Jahre gehörte die computergestützte Berechnung von Linsensystemen weltweit zum Handwerkzeug der Hersteller. Heute gibt es ausgefeilte Computerprogramme für den automatisierten Entwurf und die Analyse aller Arten komplizierter optischer Systeme.

6.3.1 Monochromatische Aberrationen Die paraxiale Behandlung setzte voraus, dass sin ϕ wie in Abbildung 5.6 befriedigend durch ϕ genähert werden kann; d. h., das System war auf den Einsatz in einem extrem schmalen Bereich um die optische Achse beschränkt. Sollen Strahlen vom Rand der Linse bei der Bilderzeugung berücksichtigt werden, so ist die Annahme sin ϕ ≈ ϕ offensichtlich unbefriedigend. Wir erinnern uns, dass wir das snelliussche Gesetz auch gelegentlich einfach als ni θi = nt θt geschrieben haben, was ebenfalls nicht exakt

6.3 Aberrationen

507

zutrifft. Wir erhalten als verbesserte Näherung die so genannte Fehlertheorie dritter Ordnung, wenn wir die ersten beiden Glieder in der Reihenentwicklung ϕ3 ϕ5 ϕ7 + − + ... [5.7] 3! 5! 7! berücksichtigen. Abweichungen, die sich dann von der Theorie erster Ordnung ergeben, sind in den fünf Abbildungsfehlern dritter Ordnung (sphärische Aberration, Koma, Astigmatismus, Bildfeldwölbung und Verzeichnung) enthalten. Sie wurden erstmals von Ludwig von Seidel (1821–1896) in den fünfziger Jahren des 19. Jahrhunderts im Detail untersucht. Dementsprechend bezeichnet man sie oft als die seidelschen Aberrationen. Außer den ersten beiden Beiträgen enthält die Reihe noch viele andere Terme, die zwar kleiner, aber noch immer nicht zu unterschätzen sind. Daher gibt es mit größter Sicherheit Abbildungsfehler höherer Ordnung. Den Unterschied zwischen den Ergebnissen einer genauen Strahlberechnung und den berechneten Abbildungsfehlern dritter Ordnung kann man sich deshalb als die Summe aller Abbildungsfehler höherer Ordnung vorstellen. Wir werden die Diskussion ausschließlich auf die Abbildungsfehler dritter Ordnung beschränken. sin ϕ = ϕ −

Sphärische Aberration Wir wollen zunächst zu Abschnitt 5.2.2 zurückkehren. Dort berechneten wir die konjugierten Punkte einer brechenden sphärischen Grenzfläche und fanden für das gaußsche Gebiet n2 − n1 n1 n2 +  = . a a R

[5.8]

Werden die Näherungen für  und  ein wenig verbessert (Aufgabe 6.31), so erhalten wir für den Ausdruck dritter Ordnung       1 1 2 1 2 n2 − n1 n2 1 n1 n2 2 n1 +  = +h + − +  . (6.46) a a R 2a a R 2a R a Das zusätzliche, näherungsweise zu h2 proportionale Glied ist eindeutig ein Maß für die Abweichung von der Theorie erster Ordnung. Wie in Abbildung 6.14 gezeigt ist, werden die Strahlen, die die Fläche in größeren Abständen (h) über der Achse treffen, stärker zum Scheitelpunkt hin gebrochen. Kurz gesagt entspricht die sphärische Aberration für nichtparaxiale Strahlen einer Abhängigkeit der Brennweite von der Blendenöffnung. In gleicher Weise werden die Randstrahlen von einer Sammellinse (Abb. 6.15) zu stark abgelenkt und daher vor den paraxialen Strahlen fokussiert. Behalten Sie dabei im Auge, dass die sphärische Aberration sich nur auf Objektpunkte bezieht, die auf der optischen Achse liegen. Den Abstand zwischen dem axialen Schnittpunkt eines Strahls und dem paraxialen Brennpunkt F  nennt man die sphärische Longitudinal- oder Längsaberration des betreffenden Strahls. In diesem Fall ist die sphärische Aberration positiv. Im Gegensatz dazu schneiden die Randstrahlen

6 Geometrische Optik: Weiterführende Themen

508

h

F

V C

n1

paraxialer Brennpunkt

Abb. 6.14: Sphärische Aberration, die sich aus der Brechung an einer einzelnen Grenzfläche ergibt.

n2

einer Zerstreuungslinse die Achse im Allgemeinen hinter dem paraxialen Brennpunkt, und ihre sphärische Aberration ist negativ. Um Aberrationen hinsichtlich ihres Einflusses auf eine Wellenfront besser beurteilen zu können, betrachten wir von einer Punktquelle ausgehendes Licht, das ein optisches System durchläuft. Ist die resultierende Wellenfront am Ort der Austrittspupille eine Kugelfläche, die den gaußschen Bildpunkt als Mittelpunkt hat, so ist die Abbildung ideal, andernfalls ist sie fehlerbehaftet. Unter Wellen- (oder Wellenfront-)Aberrationen versteht man die Abweichung der optischen Weglänge der tatsächlichen im Vergleich zur idealen Wellenfront, oft angegeben in Form des Maximalwerts (in Mikrometern, Nanometern oder Wellenlängen). Betrachten wir dazu Abbildung 6.15: Die Abweichung der Wellenfront von einer idealen, auf P zulaufenden Kugelfläche, gemessen vom Wellenberg bis zum Wellental, entspricht einem bestimmten Bruchteil einer Wellenlänge, also λ/N . Auf diesem Zusammenhang aufbauend schlug J. W. Strutt, besser bekannt als Lord Rayleigh, ein praktikables Kriterium zur Beurteilung der Qualität eines optischen Instruments vor: Dieses erzeugt ein merklich verzerrtes Bild, wenn die Wellenfrontaberration bei 550 nm (gelbgrün) λ/4 übersteigt. Ein optisches System, das punktförmige Abbildungen erzeugt, ist physikalisch natürlich unrealistisch (allein schon deshalb, weil die Bestrahlungsstärke dann unendlich werden müsste – und die Natur verabscheut das Unendliche). Im besten Fall bildet eine h ΣLC F

Kaustik

(a)

sphär. Längsaberration

Queraberration

sphärische Längsaberration

(b)

Abb. 6.15: Sphärische Aberrationen einer Linse. Die Einhüllende der gebrochenen Strahlen nennt man eine Kaustik. Die Schnittpunkte der Randstrahlen mit der Kaustik legen ΣLC fest.

6.3 Aberrationen

509

Linse eine Punktquelle (etwa einen Stern) als winzige helle, kreisförmige Scheibe ab, umgeben von äußerst schwachen, kaum wahrnehmbaren Ringen (siehe Abb. 10.36). Es handelt sich um ein Airy-Muster; in Abbildung 6.16 ist der Querschnitt dieses Musters in P durch ein hohes mittleres Maximum der Bestrahlungsstärke mit seitlich anschließenden winzigen Nebenmaxima dargestellt.

λ

λ/N

P

Abb. 6.16: Die Form dieser Wellenfront weicht von einem (auf den gaußschen Bildpunkt zulaufenden) Kugelsegment ab. Man nennt dies Aberration. Das Ausmaß dieser Abweichung, gemessen zwischen zwei Peaks, ist ein Indikator dafür, wie stark das tatsächliche Bild von einem perfekten abweicht.

Die sphärische Aberration verschiebt im Wesentlichen Licht von der mittleren Scheibe weg zu den Ringen, die dann an Bedeutung gewinnen. Rayleigh stellte beispielsweise fest, dass eine sphärische Aberration von einer Viertelwelle die Bestrahlungsstärke im Bildscheibchen um 20 % herabsetzt. Das Prinzip dieses Vorgangs ist in Abbildung 6.16 dargestellt: Strahlen, die senkrecht von der verzerrten Wellenfront ausgehen, sind nicht mehr zum mittleren Fleck, sondern zu den Ringen hin gerichtet. Beachten Sie dabei, dass für eine verzerrte Wellenfront, die sich in sehr vielen, engen Kurven schlängelt, ein großer Teil des Lichts in den Ringen ankommt, selbst wenn die Gesamtabweichung nur λ/4 beträgt – das Bild ist verschwommen. Dieser Effekt ist zu erwarten, wenn die Oberflächen der optischen Bauteile Ihres Instruments nicht glatt sind. Wird ein Schirm in Abbildung 6.15 in F  platziert, so erscheint das Bild eines Sterns als ein heller zentraler Fleck auf der Achse, umgeben von einem symmetrischen Halo, der durch den Randstrahlenkegel festgelegt wird. Im Falle einer flächenhaften Abbildung würde die sphärische Aberration den Kontrast verringern und die Bilddetails verwischen. Die Höhe über der Achse, in der ein bestimmter Strahl diesen Schirm trifft, nennt man Transversal- oder Queraberration. Offensichtlich kann die sphärische Aberration durch Abblenden verkleinert werden, doch verringert dies gleichzeitig die Lichtmenge, die in das System eintritt. Das unscharfe Bildscheibchen hat seinen kleinsten Durchmesser, wenn der Schirm zum Ort ΣLC bewegt wird. Man nennt diesen Ort den Unschärfekreis, und in ΣLC sieht man das Bild in der Regel am besten. Weist die

510

6 Geometrische Optik: Weiterführende Themen

Abb. 6.17: Sphärische Aberration für eine plankonvexe Linse.

Linse eine beträchtliche sphärische Aberration auf, so muss das System, nachdem die Linse abgeblendet wurde, neu fokussiert werden, weil sich die Position von ΣLC bei einer Verkleinerung der Blendenöffnung dem Punkt F  nähert. Das Ausmaß der sphärischen Aberration verändert sich bei gleicher Blendenöffnung und Brennweite sowohl mit der Objektbrennweite als auch mit der Linsenform. Eine Sammellinse bricht die achsenfernen Strahlen zu stark. Wenn wir uns die Linse jedoch grob als Kombination zweier Prismen vorstellen, deren Grundflächen miteinander verbunden sind, so wird offensichtlich der einfallende Strahl minimal abgelenkt, wenn sein Winkel ungefähr so groß wie derjenige des austretenden Strahls ist (Abschn. 5.5.1). Ein Beispiel sieht man in Abbildung 6.17: Hier wird durch einfaches Umdrehen der Linse die sphärische Aberration merklich verringert. Befindet sich das Objekt im Unendlichen, so weist eine einfache Zerstreuungs- oder Sammellinse mit einer fast flachen Rückseite eine minimale Aberration auf. Sind Objekt- und Bildweite gleich (a = a = 2f ), so sollte die Linse gleichkonvex sein, um die sphärische Aberration zu verringern. Eine Kombination aus einer Sammellinse und einer Zerstreuungslinse (wie in einem achromatischen Doublet) kann ebenfalls verwendet werden, um diesen Abbildungsfehler zu vermindern. Wir erinnern uns, dass die asphärischen Linsen aus Abschnitt 5.2.1 für ein bestimmtes Paar konjugierter Punkte vollständig frei von sphärischen Aberrationen sind. Überdies existieren, wie wohl Huygens als Erster entdeckt hat, auch für sphärische Flächen zwei derartige Achspunkte. Diese sind in Abbildung 6.18 a dargestellt; die gezeigten Strahlen gehen von P aus und verlassen die Fläche, als kämen sie von P  . (In einer Aufgabe soll nachgewiesen werden, dass die entsprechenden Orte P und P  in der Abbildung zu sehen sind.) Man kann Linsen herstellen, die (wie die asphärischen Linsen) für das Punktepaar P und P  eine sphärische Aberration von null haben. Man schleift einfach noch eine Fläche mit dem Radius P A und dem Mittelpunkt in P , sodass ein sammelnder oder streuender Meniskus entsteht. Das Öl-Immersionsobjektiv eines Mikroskops macht sich dieses Prinzip zunutze. Das Objekt liegt in P und ist von Öl mit dem Brechungsindex n2 umgeben (Abb. 6.19). P und P  sind die richtigen konjugierten Punkte, damit die erste Linse eine sphärische Aberration von null hat, P  und P  sind diejenigen für den Meniskus.

6.3 Aberrationen

511

A

P

P

n1

C

R

n2 n1

n1 n2

n2 Öl n2 Objektträger P

n1

n2

R

C

P

R (a)

P 

Abb. 6.19: Ein Öl-Immersionsobjektiv für ein Mikroskop.

A

P

P

C

R

(b)

A

P

P

C

R

(c)

Abb. 6.18: Korrespondierende axiale Punkte, für die die sphärische Aberration null ist.

Bald nachdem das Hubble-Weltraumteleskop im April 1990 auf seine Umlaufbahn gebracht worden war, zeigten sich Probleme. Die gesendeten Bilder waren unscharf, ungeachtet aller Versuche, Orientierung und Position des Sekundärspiegels zu justieren. Für einen weit entfernten Stern, im Wesentlichen eine Punktquelle, war die Größe des Bildscheibchens ähnlich dem theoretischen beugungsbegrenzten Wert (etwa 0,1 Bogensekunden im Durchmesser), aber nur etwa 12 % der Strahlungsenergie kamen dort an, anstelle der erwarteten 70 % (rund 84 % ist der ideale Grenzwert). Das

512

6 Geometrische Optik: Weiterführende Themen

Scheibchen war von einem Halo von etwa 1,5 Bogensekunden umgeben, in dem sich etwa 70 % des Lichts wiederfanden. Die restliche Strahlungsenergie bildete außerhalb des Halos ein radialsymmetrisches Rankenmuster, das durch winzige Unebenheiten des Spiegels in Verbindung mit Beugungseffekten an den Halterungen des Sekundärspiegels entstand (Abb. 6.20 b. Diese Situation ist ein klassisches Beispiel sphärischer Aberration.

38 mm

vor COSTAR

(b)

(a)

Abb. 6.20: (a) Weil der Primärspiegel zu flach ist, laufen Strahlen vom äußeren Rand 38 mm hinter dem Punkt zusammen, in dem die inneren Strahlen konvergieren. (b) Das Bild eines weit entfernten Sterns, das vom Hubble-Weltraumteleskop erzeugt wurde. (Foto mit frdl. Genehmigung der NASA.)

nach COSTAR

Später stellte man fest, dass der Primärspiegel falsch poliert worden war: An der Peripherie war er um nahezu eine halbe Wellenlänge zu flach. Strahlen aus der Mitte des Spiegels wurden auf der optischen Achse vor Strahlen von den Rändern fokussiert. Die Firma Perkin-Elmer, die das 2,4-m-Hyperboloid hergestellt hatte, hatte dieses zwar hervorragend geschliffen, aber leider auf die falsche Form bzw. Krümmung. Eine Reihe von Fehlern, beginnend mit einer Abweichung eines Bauteils des Formentestgeräts um 1,3 mm, summierte sich schließlich zu einer Längsaberration von 38 mm, die die Brauchbarkeit des 1,6 Milliarden Dollar teuren Geräts ernsthafte beeinträchtigte (Abb. 6.20 a). Im Jahre 1993 führten die Astronauten der Weltraumfähre Endeavour eine dramatische Reparaturmission erfolgreich aus. Sie installierten eine Planetenkamera mit weitem Bildfeld (und eigener korrigierender Optik, die dem Rand etwa eine halbe Wellenlänge hinzufügte) sowie das Modul Corrective Optics Space Telescope Axial Replacement (COSTAR). Die Aufgabe von COSTAR ist es, die fehlerbehafteten Wellenfronten, die in die drei anderen Instrumente eintreten, umzuformen. Das Modul fügt zwei kleine Spiegel (10 mm und 30 mm) in den Strahl ein, die auf je eine Blendenöffnung des Instruments zeigen. Der eine Spiegel lenkt das Licht einfach zu dem anderen, bei

6.3 Aberrationen

513

Bilder des Hubble-Weltraumteleskops von der Galaxie M-100 mit (vor der Reparatur) und ohne (nach der Reparatur) sphärische Aberration. (Fotos mit frdl. Genehmigung der NASA.)

dem es sich um eine komplizierte asymmetrische Asphäre handelt. Dieser nichtaxiale Korrekturspiegel ist auf das Inverse der sphärischen Aberration des Primärspiegels abgeglichen, sodass die Wellenfront durch die Reflexion in eine ideale Welle transformiert wird, die dann in das Gerät eintritt. Nach dieser Korrektur konzentrierten sich mehr als 70 % der Strahlungsenergie im zentralen Bildscheibchen, und die Himmelskörper erschienen etwa 6,5-mal heller als vorher. NASA-Mitarbeiter betonen gerne, dass das Teleskop mit seiner verbesserten Abbildungsqualität (siehe Foto) und Lichtstärke ein Glühwürmchen in einer Entfernung aufzeichnen kann, die einem halben Erdumfang entspricht. (Natürlich müsste der Käfer 90 min lang mit maximaler Leuchtkraft am selben Ort verharren.) Mehr noch, das Teleskop kann zwei solche Leuchtkäfer getrennt abbilden (auflösen), wenn sie mindestens 3 m voneinander entfernt sind. Das größte einzelne Radioteleskop der Welt steht im Arecibo-Observatorium (Puerto Rico). Sein Objektiv ist eine stationäre Antenne mit einem sphärischen Reflektor von reichlich 300 m Durchmesser, die mit Wellenlängen von 3 cm bis 6 m arbeitet. Lenkbare Radioteleskope (siehe Abschn. 5.4.2) haben hingegen gewöhnlich parabolische Reflektoren, weil sich damit die Strahlung einer in Vorwärtsrichtung liegenden Quelle auf einen kleinen axialen Bildpunkt fokussieren lässt. Der 300-Meter-Reflektor musste jedoch unbeweglich montiert werden, weshalb sich die Konstrukteure für einen Kompromiss entschieden: Der Primärspiegel ist sphärisch, er kann Strahlung aus vielen verschiedenen Richtungen einfangen und jeweils auf einen „Punkt“ fokussieren, der auf der Verbindungsachse zwischen Reflektor und Quelle liegt. Hoch über dem Spiegel befindet sich ein beweglicher Radioempfänger, dessen Position bestimmt, in welchen Teil des Himmels das Teleskop gerichtet ist. Nun hat ein sphärischer Spiegel keine Vorzugsrichtung, seine Bildfehler aber sind ebenfalls in allen Richtungen gleich; die sphärische Aberration betrifft ihn ebenso wie die konvexe Linse (Abb. 6.15). Anstelle einer einzelnen Brennpunkts hat er eine axiale „Brennlinie“. Diesen Fehler versuchte man auszugleichen, indem man die Signale in verschiedenen Punkten auf der Achse maß und nach einem bestimmten Schema kombiniert auswertete, doch dies erwies sich als so ineffizient, dass die Leistungsfähigkeit des Teleskops nur selten ausgeschöpft wurde. 1997 wurde das Teleskop von Arecibo durch die Installation eines Satzes außerhalb der Achse befindlicher asphärischer Spiegel aufgerüstet (Abb. 6.21). Diese Spiegel kompensieren die sphärische Aberration in ähnlicher Weise wie die Korrekturspiegel, die

6 Geometrische Optik: Weiterführende Themen

514

nachträglich ins Hubble-Weltraumteleskop eingebaut wurden. Die 90 Tonnen schwere Empfängerkuppel – benannt nach James Gregory, der 1661 den Reflektor mit konkavem Sekundärspiegel erfunden hatte (siehe Abschn. 5.7.7) – ist rund 140 m oberhalb des Hauptspiegels angeordnet. Ihr Aluminiumgehäuse enthält einen Sekundärspiegel mit einem Durchmesser von reichlich 20 m, welcher die vom Primärspiegel aufwärts reflektierte elektromagnetische Strahlung auffängt und nach unten auf einen Tertiärspiegel (Durchmesser ca. 8 m) umlenkt. Dieser fokussiert den Strahl in einem Punkt auf dem Empfänger. Die Spiegelflächen sind so ausgelegt, dass alle Strahlen gleich lange optische Wege durchlaufen, weshalb sie alle phasengleich im Brennpunkt (innerhalb eines Flecks mit einem Durchmesser von Millimetern) ankommen. Das Instrument kann man umgekehrt auch als 1-Megawatt-Radarsender für planetologische Untersuchungen verwenden. Durch Aussenden von Radarsignalen und Wiederauffangen von reflektierten Signalen kann das Teleskop Oberflächendetails auf der Venus mit Ausdehnungen von wenigen Hundert Metern auflösen. Auf dem Mond könnte man damit einen elektrischen Leiter von der Größe eines Golfballs aufspüren.

(a)

(c) Sekundärspiegel Empfänger Tertiärspiegel

(b)

Sekundärspiegel ∅=20 m

Empfänger Brennpunkt Tertiärspiegel ∅=8 m

Aluminumkuppel ∅=29 m

Öffnung

Primärspiegel

Abb. 6.21: (a) Das 1997 nachgerüstete Radioteleskop von Arecibo. (b) Gregory-Kuppel mit zwei neuen Korrekturspiegeln und Empfänger. (b) Dieses Strahlendiagramm zeigt, wie man erreicht, dass sämtliche Strahlen vom 300-Meter-Kugelspiegel bis zum Empfänger gleiche optische Wege durchlaufen.

6.3 Aberrationen

515

Koma Die Koma oder der Asymmetriefehler ist ein bildverschlechternder, monochromatischer Abbildungsfehler dritter Ordnung. Er tritt bei Objektpunkten auf, die sich nicht auf der optischen Achse befinden, selbst wenn der Abstand zur Achse gering ist. Die Ursache der Koma liegt darin, dass die Haupt-„Ebenen“ eigentlich nur im paraxialen Gebiet als Ebenen betrachtet werden können. Sie sind in Wirklichkeit gekrümmte Hauptflächen (Abb. 6.1). Beim Fehlen sphärischer Aberration sammelt sich ein paralleles Strahlenbündel im Achspunkt F  , der sich im Abstand fh vom hinteren Scheitelpunkt befindet. Die Äquivalentbrennweiten und deshalb auch die Transversalvergrößerungen für Strahlen, die außeraxiale Bereiche der Linse durchlaufen, unterscheiden sich jedoch von denen axialer Strahlen. Liegt der Bildpunkt auf der optischen Achse, so hat dies praktisch keine Konsequenzen. Fällt das Strahlenbündel jedoch schräg ein und liegt der Bildpunkt außeraxial, so tritt eine Koma auf. Die Abhängigkeit der Transversalvergrößerung MT von h, der Strahlenhöhe der Linse, ist aus Abbildung 6.22 a ersichtlich. Die Meridionalstrahlen, welche die Randbereiche der Linse durchlaufen, treffen hier näher an der Achse auf der Bildebene ein als Strahlen in unmittelbarer Nachbarschaft des Hauptpunktstrahls (des Strahls, der durch die Hauptpunkte verläuft). In diesem Fall ist die geringste Vergrößerung mit den Randstrahlen verknüpft, die das kleinste Bild erzeugen würden – man sagt, die Koma ist negativ. Im Gegensatz dazu ist die Koma in den Abbildungen 6.22 b und c positiv, weil sich die Randstrahlen weiter entfernt von der Achse bündeln.

(a)

(c)

(b)

Abb. 6.22: (a) Negative Koma. (b) und (c) Positive Koma. (Foto E. H.)

Mehrere windschiefe Strahlen, die von einem außeraxialen Objektpunkt S ausgehen, sind in Abbildung 6.23 dargestellt, um die von einem Punkt entstehende geometrische Abbildung mit Asymmetriefehler zu veranschaulichen. Man beachte, dass jeder kreisförmige Strahlenkegel, dessen Endpunkte (1–2–3–4–1–2–3–4) einen Ring auf der Linse bilden, in einer von H. Dennis Taylor so benannten Komafigur auf Σi abgebildet wird. Dieser Fall entspricht der positiven Koma; je größer der Ring auf der Linse ist, desto größer ist der Abstand seines Komakreises von der Achse. Wenn der äußere Ring

6 Geometrische Optik: Weiterführende Themen

516

der Schnittlinie der Randstrahlen entspricht, so ist im Bild der Abstand 0–1 die meridionale Koma, während die Länge 0–3 als sagittale Koma (Rinnenfehler) bezeichnet wird. Etwas mehr als die Hälfte der Energie erscheint im Bild in dem näherungsweise dreieckigen Bereich zwischen 0 und 3. Ihren Namen verdankt die Koma ihrem kometenähnlichen Erscheinungsbild. Vor allem auf Grund ihrer Asymmetrie wird diese Form als die lästigste aller Aberrationen angesehen. Normalerweise beschäftigt sich die geometrische Optik nicht mit der Interferenz, aber auf dem Schirm in Abbildung 6.23 sollte man Interferenzerscheinungen sehen können. Der Kegel der Koma ist ebenso wie der gaußsche Bildpunkt eine starke Vereinfachung. Der Bildpunkt ist in Wirklichkeit ein System aus einem Bildscheibchen und Ringen, und der Komakegel ist ein kompliziertes asymmetrisches Beugungsmuster. Je mehr Koma vorhanden ist, desto deutlicher unterscheidet sich der Kegel von der Gestalt eines Airy-Musters und verwandelt sich in eine ausgedehnte Struktur aus Flecken und Bögen, die nur noch vage an die Scheibchen-Ring-Struktur erinnert, aus der sie hervorgegangen ist (Abb. 6.24). Die Koma hängt wie die sphärische Aberration von der Form der Linse ab. Deshalb hat ein starker hohlgekrümmter, sammelnder Meniskus mit dem Objekt im Unendlichen eine große negative Koma. Verbiegen wir die Linse, sodass sie zunächst plankonvex, dann gleichkonvex, wieder plankonvex und schließlich zum erhaben gekrümmten sammelnden Meniskus wird, so variiert die Koma vom Negativen über null zum Positiven. Bedeutsam ist, dass die Koma für eine Einzellinse mit einer bestimmten Objektweite genau auf null gebracht werden kann. Ihre spezielle Form wäre dann

1

1

1

1

2

4 3

0

3

2

4

1 2

4

3

1 0

Abb. 6.23: Das geometrische Bild der Koma einer monochromatischen Punktquelle. Der zentrale Bereich der Linse erzeugt ein punktförmiges Bild an der Spitze des Kegels.

6.3 Aberrationen

517

(a)

(b)

Abb. 6.24: Koma dritter Ordnung. (a) Ein computersimuliertes Bild einer Punktquelle, das von einem stark astigmatischen System erzeugt wird. (b) Die Intensitätsverteilung des Bildes. (Bilder mit freundlicher Genehmigung der OPAL Group, St. Petersburg, Russland.)

(a = ∞) fast plankonvex (links erhaben) und somit beinahe die Form, für welche auch die sphärische Aberration minimal wird. Eine Linse, die für im Unendlichen liegende Punkte korrigiert ist, funktioniert bei nahen Objekten nicht unbedingt zufriedenstellend. Man sollte daher bei der Verwendung von Standardlinsen für ein System, das mit im Endlichen liegenden konjugierten Punkten arbeitet (wie in Abb. 6.25), zwei Linsen kombinieren, die in Bezug auf im Unendlichen liegende Punkte korrigiert sind. Mit anderen Worten: Es dürfte schwierig sein, eine Linse mit der gewünschten Brennweite zu bekommen, die auch in Bezug auf die jeweiligen im Endlichen liegenden konjugierten Punkten korrigiert ist. Daher wird die Kombination Rücken an Rücken liegender Linsen zur attraktiven Alternative. L1

f1

L2

f2

Abb. 6.25: Eine Kombination zweier Linsen, die für konjugierte Punkte im Unendlichen korrigiert sind. Zusammen bilden sie ein System, das auf in endlicher Entfernung liegende konjugierte Punkte korrigiert ist.

Die Koma kann man mithilfe einer an geeigneter Stelle angebrachten Blende aufheben. Dies entdeckte William Hyde Wollaston (1766–1828) im Jahre 1812. Die Reihenfolge der Abbildungsfehler dritter Ordnung (sphärische Aberration, Koma, Astigmatismus, Bildfeldwölbung, Verzeichnung) ist von Bedeutung, weil jeder Fehler (ausgenommen die sphärische Aberration und die Verzeichnung) durch die Lage einer Blende beein-

6 Geometrische Optik: Weiterführende Themen

518

P P

1 2 3

4 5 Σ3 Σ1 Σ2

Abb. 6.26: Verschiedene Positionen der Blende und ihre Auswirkung auf die Koma.

flusst werden kann, aber nur, wenn eine der vorangehenden Aberrationen ebenfalls im System auftritt. Während also die sphärische Aberration unabhängig von der Lage entlang einer Blendenachse ist, ist dies für die Koma nicht der Fall, solange sphärische Aberrationen auftreten. Dies kann man sich anhand von Abbildung 6.26 klarmachen: Mit der Blende in Σ1 ist Strahl 3 der Hauptstrahl, sphärische Aberration ist vorhanden, aber keine Koma; d. h., die Strahlenpaare treffen sich auf Strahl 3. Wird die Blende nach Σ2 versetzt, so ist die Symmetrie gestört, Strahl 4 wird zum Hauptstrahl, und die Strahlen beiderseits von ihm, zum Beispiel 3 und 5, treffen sich oberhalb von ihm und nicht auf ihm; es tritt nun eine positive Koma auf. Befindet sich die Blende in Σ3 , so schneiden sich die Strahlen 1 und 3 unterhalb des Hauptstrahls 2, und es ergibt sich eine negative Koma. Auf diese Weise können bestimmte Beträge der Aberration in ein Linsensystem eingeführt werden, um die Koma im Gesamtsystem auszulöschen. Der optische Sinussatz ist eine wichtige Beziehung, die wir hier ohne Beweis einführen. 1873 entdeckten ihn unabhängig voneinander Abbe und Helmholtz. (Eine andere Form des Satzes hatte allerdings bereits zehn Jahre früher R. Clausius, berühmt wegen seiner Arbeiten zur Thermodynamik, gefunden.) Der Satz besagt, dass ny sin α = n y  sin α

(6.47)

unabhängig von der Blendengröße gilt4 (Abb. 6.9), wobei n, y, α und n , y  , α der Brechungsindex, die Höhe und der Neigungswinkel eines Strahls im Objekt- bzw. Bildraum sind. Soll die Koma null werden, so muss MT =

y y

[5.24]

für alle Strahlen konstant sein. Nun schicken wir einen Rand- und einen Paraxialstrahl durch das System. Ersterer verhält sich gemäß Gleichung (6.47), Letzterer gemäß deren paraxialer Version (mit sin α = αp , sin α = αp ). Da MT über die ganze Linse 4

Genau genommen gilt der optische Sinussatz für alle Werte von α nur in der Sagittalebene (von lat. sagitta = Pfeil), die im nächsten Abschnitt diskutiert wird.

6.3 Aberrationen

519

hinweg konstant sein soll, setzen wir die Vergrößerungen für den Rand- und den Paraxialstrahl gleich und erhalten die Sinusbedingung αp sin α =  = konstant.  sin α αp

(6.48)

Dass ein System die Sinusbedingung erfüllt, ist eine notwendige Bedingung für das Fehlen der Koma. Ohne sphärische Aberration ist die Übereinstimmung mit der Sinusbedingung notwendig und hinreichend für die Abwesenheit einer Koma. Man kann die Koma leicht beobachten, etwa indem man Sonnenlicht mit einer einfachen Sammellinse fokussiert. Eine leichte Neigung der Linse, sodass die fast parallelen Sonnenstrahlen einen kleinen Winkel mit der optischen Achse bilden, lässt den Lichtpunkt eines Strahlenbündels in der charakteristischen Kometengestalt aufleuchten. Astigmatismus Befindet sich ein Objektpunkt nicht unmittelbar an der optischen Achse, so trifft der einfallende Strahlenkegel die Linse asymmetrisch und verursacht einen Abbildungsfehler dritter Ordnung, den Astigmatismus. Das Wort ist dem Griechischen entlehnt: a- bedeutet nicht-, stigma bedeutet Punkt. Um die Beschreibung dieses Fehlers zu erleichtern, stellen wir uns vor, die Meridionalebene (auch Tangentialebene genannt) enthalte sowohl den Hauptstrahl (der durch den Mittelpunkt der Aperturblende geht) als auch die optische Achse. Die Sagittalebene ist dann als die Ebene definiert, die den Hauptstrahl enthält und außerdem senkrecht auf der Meridionalebene steht (Abb. 6.27). Die Meridionalebene ist von einem Ende eines komplizierten Linsensystems bis zum anderen ungebrochen; die Sagittalebene ändert hingegen im Allgemeinen ihre Neigung, wenn der Hauptstrahl an den verschiedenen Linsen gebrochen wird. Genau genommen gibt es mehrere Sagittalebenen, und zwar je eine zu jedem Bereich des Systems. Alle windschiefen Strahlen, die vom Objektpunkt ausgehen und in einer Sagittalebene liegen, werden als Sagittalstrahlen bezeichnet. Im Falle eines axialen Objektpunktes ist der Strahlenkegel symmetrisch bezüglich der Kugelflächen einer Linse. Es besteht keine Notwendigkeit, Meridional- und Sagittalebenen zu unterscheiden. Die Strahlenanordnungen sind in allen Ebenen, die die optische Achse enthalten, identisch. Beim Fehlen sphärischer Aberration sind alle Brennweiten gleich, folglich laufen alle Strahlen in einem einzigen Brennpunkt zusammen. Im Gegensatz dazu ist die Anordnung eines schrägen, parallelen Strahlenbündels in den Meridional- und Sagittalebenen unterschiedlich, demnach sind die Brennweiten in diesen Ebenen ebenfalls verschieden. In Wirklichkeit sind hier die Meridionalstrahlen bezüglich der Linse stärker als die Sagittalstrahlen geneigt, und sie haben eine kürzere Brennweite. Es kann unter Anwendung des fermatschen Prinzips gezeigt werden5 , dass der Brennweitenunterschied von der Brechkraft der Linse und vom Neigungswinkel der Strahlen abhängt. Diese so genannte astigmatische Differenz 5

Siehe A. W. Barton, A Text Book on Light, S. 124.

6 Geometrische Optik: Weiterführende Themen

Sa gi tta le be ne

520

Me rid ion als tra hl H au pt str ah l

he optiscse Ach

S

l ah str l a itt ag

Linse

ebene ional Merid

Objektpunkt

Strahlen in Meridionalebene

Strahlen in Sagittalebene

Abb. 6.27: Sagittal- und Meridionalebene.

nimmt mit größerer Entfernung des Objektpunktes von der Achse schnell zu und ist auf der Achse natürlich gleich null. Bei zwei verschiedenen Brennweiten nimmt der einfallende Strahlenkegel nach der Brechung eine stark veränderte Form an (Abb. 6.28). Der Querschnitt des Strahlenbündels ist beim Verlassen der Linse kreisförmig, wird jedoch allmählich elliptisch, wobei die große Ellipsenachse in der Sagittalebene liegt, bis die Ellipse im Tangential- oder Meridionalschnitt FT scheinbar zu einer Linie entartet (zumindest in der Fehlertheorie dritter Ordnung). In Wirklichkeit entsteht ein kompliziertes Beugungsmuster, das umso mehr einer Linie ähnelt, je mehr Astigmatismus vorhanden ist. Alle Strahlen, die vom Objektpunkt kommen, durchlaufen diese so genannte primäre Linienabbildung. Jenseits dieses Punktes verbreitert sich der Querschnitt des Strahlenbündels schnell bis zu einem kreisförmigen, unscharfen Fleck, dem Unschärfekreis. Bewegt sich das Strahlenbündel noch weiter von der Linse weg, so verformt sich sein Querschnitt wieder zu einer Linie, der sekundären Linienabbildung. Jetzt befindet diese sich in der Meridionalebene im Sagittalschnitt FS . Das Bild einer Punktquelle, das von einem leicht astigmatischen System (< ∼ 0,2λ) erzeugt wird, ähnelt in der Nähe des Unschärfekreises einem Airy-Ringmuster, ist aber leicht asymmetrisch. Wenn sich der Astigmatismus verstärkt (oberhalb etwa

6.3 Aberrationen

521 Unsch¨arfekreis

Meridionalebene Hauptstrahl

primäre Linienabbildung

sekundäre Linienabbildung

Objektpunkt Sagittalebene

optisches System

(a)

(b)

Abb. 6.28: Astigmatismus. (a) Ein Strahlkegel von einer monochromatischen Punktquelle wird durch eine astigmatische Linse als länglicher Fleck abgebildet. (b) Computergeneriertes Diagramm der Lichtverteilung, also des Beugungsmusters, das in der Nähe des Unschärfekreises entsteht (Astigmatismus bei 0,8λ). (Foto mit frdl. Genehmigung der OPAL-Gruppe, St. Petersburg, Russland.)

0,5λ), tritt die zweiachsige Symmetrie deutlicher hervor. Das Bild verwandelt sich in ein kompliziertes Muster heller und dunkler Bereiche, das an das fresnelsche Beugungsmuster rechteckiger Öffnungen erinnert (siehe Abschn. 10.3.6). Die von der kreisförmigen Blende herrührende Krümmung tritt nur noch sehr schwach zutage. Wir behalten dabei im Auge, dass dies alles das Fehlen von sphärischer Aberration und Koma voraussetzt. Da der Durchmesser des Unschärfekreises mit der astigmatischen Differenz wächst, verschlechtert sich das Bild, wenn sich das Objekt weiter von der Achse entfernt: Das Bild verliert seine Randschärfe. Die sekundäre Linienabbildung ändert ihre Orientierung mit Veränderungen der Objektlage, sie ist jedoch immer zur optischen Achse gerichtet, d. h., sie besitzt radialen Charakter. Entsprechend ändert sich die Aus-

6 Geometrische Optik: Weiterführende Themen

522

Objekt Linse

Tangentialschnittebene

Sagittalschnittebene

Abb. 6.29: Abbildungen in der Tangential- und Sagittalschnittebene.

richtung der primären Linienabbildung, doch steht die primäre stets senkrecht zur sekundären Linie. Wenn sich das Bild aus radialen und tangentialen Elementen zusammensetzt, entsteht ein interessanter Effekt (Abb. 6.29): Die primäre und die sekundäre Linienabbildung sind aus transversalen und radialen Strichen zusammengesetzt, die mit zunehmendem Abstand von der Achse länger werden. Im letzteren Fall zeigen die Striche wie Pfeile gegen das Bildzentrum – daher die Bezeichnung Sagittalebene (von lat. sagitta, „Pfeil“). Die Existenz der Sagittal- und Tangentialschnitte kann man mit einer einfachen Anordnung leicht verifizieren. Wir stellen eine Sammellinse mit kurzer Brennweite (etwa 10 bis 20 mm) in den Strahl eines He-Ne-Lasers und positionieren eine andere positive Testlinse mit einer etwas längeren Brennweite so weit davon entfernt, dass der nun divergierende Strahl letztere Linse ausfüllt. Ein geeignetes Objekt, etwa ein Stückchen Fliegengitter (oder ein Dia), bringen wir nun zwischen die beiden Linsen. Wir richten das Gitter so aus, dass die Drähte horizontal (x) und vertikal (y) verlaufen. Drehen wir die Testlinse um etwa 45◦ um die vertikale Achse (die Achsen x, y und z sind in der Linse fixiert), so sollte der Astigmatismus beobachtbar sein. Die Meridionalebene ist die x-z-Ebene (wobei z die Linsenachse ist, welche nun einen Winkel von etwa 45◦ mit der Laserachse bildet), während die Sagittalebene von y und der Laserachse aufgespannt wird. Bewegen wir das Drahtnetz gegen die Testlinse, so erreichen wir einen Punkt, in dem die horizontalen Drähte auf einem Schirm hinter der Linse scharf, die vertikalen Drähte aber unscharf sind. Dies ist der Ort des Sagittalschnitts. Jeder Objektpunkt wird als kurze Linie in der meridionalen (horizontalen) Ebene abgebildet – daher sehen wir die horizontalen Drähte scharf. Bewegen wir das Netz nun etwas näher an die Linse heran, so werden die vertikalen Linien scharf und die horizontalen unscharf: Dies ist der Tangentialschnitt. Was beobachten Sie, wenn Sie das Netz in beiden Schärfepunkten um die mittlere Achse drehen? Beachten Sie, dass sich der hier beschriebene Abbildungsfehler dritter Ordnung auf sphärische, symmetrische Linsen bezieht, im Gegensatz zu dem visuellen Astigmatismus (Abschn. 5.7.2), der durch eine tatsächliche Asymmetrie der Oberflächen des optischen Systems entsteht.

6.3 Aberrationen

523

Spiegel (mit Ausnahme des Planspiegels) sind mit den gleichen monochromatischen Aberrationen behaftet wie Linsen. Daher ist die außeraxiale Abbildung eines Parabolspiegels infolge des Astigmatismus und der Koma ziemlich schlecht, während für einen unendlich weit entfernten axialen Objektpunkt die sphärische Aberration verschwindet. Dies beschränkt die Verwendung des Parabolspiegels auf Geräte mit schmalen Abbildungsbereichen wie beispielsweise Suchscheinwerfer und astronomische Fernrohre. Ein sphärischer Hohlspiegel zeigt sphärische Aberration, Koma und Astigmatismus. Tatsächlich könnte man in Abbildung 6.28 die Linse durch einen schräg beleuchteten Kugelspiegel ersetzen. Übrigens ist die sphärische Aberration eines solchen Spiegels bedeutend geringer als die einer einfachen Konvexlinse gleicher Brennweite. Bildfeldwölbung Wir wollen nun ein optisches System betrachten, das frei von allen bisher behandelten Aberrationen ist. Es liegt dann eine eineindeutige Korrespondenz zwischen den Objekt- und Bildpunkten (also eine stigmatische Abbildung) vor. Wir erwähnten bereits (Abschn. 5.2.3), dass ein ebenes, senkrecht zur optischen Achse stehendes Objekt nur im paraxialen Gebiet annähernd eben abgebildet wird. Bei endlich großen Blendenöffnungen entsteht eine gekrümmte, stigmatische Bildfläche, was auf einen weiteren Abbildungsfehler dritter Ordnung hindeutet – die nach dem ungarischen Mathematiker Josef Max Petzval (1807–1891) benannte petzvalsche Bildfeldwölbung. Diesen Effekt kann man bei Betrachtung der Abbildungen 5.21 und 6.30 unmittelbar verstehen. Ein kugelförmiger Objektausschnitt σ wird durch die Linse als Kugelsegment σ  abgebildet; der Mittelpunkt beider Ausschnitte liegt in O. Ebnet man σ zu σe ein, so bewegt sich jeder Objektpunkt längs des zugehörigen Hauptstrahls auf die Linse zu und erzeugt eine parabolische Petzval-Fläche ΣP . Während sich die Petzval-Fläche für eine Sammellinse nach innen gegen die Objektebene wölbt, biegt sie sich für eine Zerstreuungslinse nach außen von der Objektebene weg. Eine geeignete Kombination

Abb. 6.30: Bildfeldwölbung. (a) Entspricht das Objekt σe , dann entsteht das Bild auf der Fläche Σp . (b) Das Bild, das auf einem flachen Schirm in unmittelbarer Umgebung der paraxialen Bildebene entsteht, ist nur in der Mitte scharf. (c) Bringt man den Schirm näher an die Linse heran, so werden die Bildränder scharf, die Bildmitte dagegen unscharf.

6 Geometrische Optik: Weiterführende Themen

524

von Sammel- und Zerstreuungslinsen hebt die Bildfeldwölbung auf. Ein Bildpunkt in der Höhe y  auf der Petzval-Fläche befindet sich in einem Abstand m y 2  1 Δx = 2 nj fj

(6.49)

j=1

von der paraxialen Bildebene, wobei nj und fj die Brechungsindizes bzw. die Brennweiten der m dünnen Linsen des Systems sind. Dies bedeutet, dass die PetzvalFläche bei Veränderungen der Positionen und Formen der Linsen oder der Lage der Blende so lange unverändert bleibt, wie die Werte von nj und fj gleich bleiben. Im einfachen Fall zweier dünner Linsen (m = 2) mit beliebigem gegenseitigen Abstand wird Δx unter der Voraussetzung null, dass 1 1 + =0 n1 f1 n2 f2 ist oder, äquivalent, n1 f1 + n2 f2 = 0 .

(6.50)

Dies ist die so genannte Petzval-Bedingung. Für eine Anwendung dieser Bedingung betrachten wir eine Kombination zweier dünner Linsen, einer Sammel- und einer Zerstreuungslinse, mit f1 = −f2 und n1 = n2 . Da 1 1 d 1 = + − [6.8] f f1 f2 f1 f2 f2 f= 1 d ist, kann das System die Petzval-Bedingung erfüllen, ein ebenes Bildfeld besitzen und trotzdem eine endlich große Brennweite haben. In optischen Geräten für die direkte Beobachtung kann die Bildfeldwölbung bis zu einem gewissen Grad toleriert werden, da sich das Auge entsprechend akkommodieren kann. Zweifellos ist in fotografischen Objektiven eine Bildfeldwölbung höchst unerwünscht, da sie das Bild in der Filmebene, die bei F  liegt, außerhalb der Achse schnell unscharf macht. Man kann die nach innen gerichtete Bildfeldwölbung einer Sammellinse aufheben, indem man eine negative Bildfeldebnungslinse in die Nähe der Brennebene bringt. Dies geschieht häufig in Projektions- und Fotoobjektiven, wenn man die Petzval-Bedingung nicht anders erfüllen kann (Abb. 6.31). In dieser Position hat die Bildfeldebnungslinse geringe Auswirkungen auf andere Aberrationen. Der Astigmatismus ist mit der Bildfeldwölbung eng verwandt. Im Falle des Astigmatismus gibt es zwei parabolische Bildflächen, die tangentiale ΣT und die sagittale ΣS (siehe Abb. 6.32). Dies sind die geometrischen Orte aller primären bzw. sekundären Linienabbildungen beim Durchlauf des Objektpunktes über die Objektebene. Bei einer bestimmten Höhe (y  ) liegt ein Punkt auf ΣT immer dreimal so weit von ΣP entfernt

6.3 Aberrationen

525

(a) Petzval-Objektiv mit Bildfeldebnungslinse

(b) 16-mm-Projektionsobjektiv

Abb. 6.31: Die Bildfeldebnungslinse. paraxiale Brennebene

ΣP ΣS

ΣT

y

S F

F ΣLC (b)

ΣT

ΣS ΣP (a)

Abb. 6.32: Die tangentialen, sagittalen und Petzval-Bildflächen.

wie der korrespondierende Punkt auf ΣS , und beide Punkte befinden sich auf derselben Seite der Petzval-Fläche (Abb. 6.32). Ohne Astigmatismus fallen ΣS und ΣT auf ΣP zusammen. Die Formen von ΣS und ΣT kann man durch Biegen oder Verlagern der Linsen oder durch eine Bewegung der Blende verändern. Die Konfiguration in Abbildung 6.32 b nennt man ein künstlich geebnetes Bildfeld. Oft wird eine Blende vor den Meniskus einer billigen Boxkamera gesetzt, um genau diesen Effekt zu erzielen. Die Fläche ΣLC mit der geringsten Unschärfe ist eben, das Bild ist dort akzeptabel und verliert seine Schärfe an den Rändern infolge des Astigmatismus. Das heißt, die Unschärfekreise wachsen mit zunehmendem Abstand von der Bildmitte, obwohl ihre geometrischen Orte ΣLC aufspannen. Moderne fotografische Objektive guter Qualität sind im Allgemeinen Anastigmate: Sie sind so konstruiert, dass ΣS und ΣT einander schneiden und zusätzlich ein astigmatismusfreier Bildwinkel verfügbar ist. Das Cooke-Triplet, das Tessar, das Orthometer und das Biotar (Abb. 5.115) sind sämtlich Anastigmate, wie auch das relativ lichtstarke Zeiss-Sonnar, dessen verbleibender Astigmatismus in Abbildung 6.33 grafisch dargestellt ist. Man beachte das relativ geebnete Bildfeld und den geringen Astigmatismus im größten Teil der Filmebene. Kehren wir kurz zur Schmidt-Kamera in Abbildung 5.125 zurück, da wir ihre Funktionsweise nun besser verstehen können. Mit einer Blende im Mittelpunkt der Kugelspiegelkrümmung fallen alle Hauptstrahlen, die definitionsgemäß durch C laufen, senkrecht auf den Spiegel. Außerdem ist jedes von einem entfernten Objektpunkt kommende Strahlenbündel symmetrisch bezüglich seines Hauptstrahls. Dabei dient

ΣT

ΣLC

ΣS 25

C S

20 15

E

10 5 −0.6 −0.2 0 0.2 0.40.6 (mm) Brennebene

Neigung des Hauptstrahls (Grad)

6 Geometrische Optik: Weiterführende Themen

526

Abb. 6.33: Ein typisches Sonnar. Die Markierungen C, S und E kennzeichnen die Grenzen des Kleinbildformats (Feldblende), d. h., die beiden Ränderpaare und die Ecken. Die Sonnar-Familie liegt zwischen dem Doppelobjektiv vom Gauß-Typ und dem Triplet.

jeder Hauptstrahl als optische Achse: Es gibt also keine außeraxialen Punkte und im Prinzip weder eine Koma noch einen Astigmatismus. Anstatt die Bildfläche zu ebnen, haben die Konstrukteure das Problem der Bildfeldkrümmung beseitigt, indem sie die Form der Filmplatte an die Krümmung angepasst haben. Verzeichnung Der letzte der fünf monochromatischen Abbildungsfehler dritter Ordnung ist die Verzeichnung. Ihre Ursache liegt darin, dass die Transversalvergrößerung MT eine Funktion des außeraxialen Abstandes y  des Bildes sein kann. Daher kann sich y  von dem durch die Theorie paraxialer Strahlen (in der MT konstant ist) vorausgesagten Abstand unterscheiden. Mit anderen Worten, Verzeichnung entsteht dadurch, dass unterschiedliche Gebiete der Linse unterschiedliche Brennweiten und Vergrößerungen haben. Beim Fehlen aller anderen Abbildungsfehler äußert sich diese Aberration in einer Deformierung des ganzen Bildes, wobei jeder einzelne Punkt scharf abgebildet wird. Eine quadratische Anordnung verformt sich wie in Abbildung 6.34 b, wenn sie durch ein optisches System mit positiver oder kissenförmiger Verzeichnung verarbeitet wird. In diesem Fall wird jeder Bildpunkt radial nach außen verschoben, wobei sich die entferntesten Punkte um den größten Betrag verschieben (MT wächst mit y  ). In gleicher Weise kommt es zur negativen oder tonnenförmigen Verzeichnung, wenn MT mit dem axialen Abstand abnimmt und sich jeder Punkt auf dem Bild radial nach innen (Abb. 6.34 c) verschiebt. Die Verzeichnung kann man leicht feststellen: Man braucht nur durch eine bildfehlerbehaftete Linse auf ein Stück kariertes Papier oder Millimeterpapier zu sehen. Dünne Linsen sind im Wesentlichen frei von Verzeichnung, wohingegen gewöhnliche dicke Sammel- oder Zerstreuungslinsen im Allgemeinen positive bzw. negative Verzeichnungen aufweisen. Die Einführung einer Blende in ein System dünner Linsen bringt unweigerlich eine Verzeichnung mit sich (Abb. 6.35). Eine Ausnahme ergibt sich, wenn sich die Aperturblende an der Linse befindet, sodass der Hauptstrahl in Wirklichkeit der Hauptpunktstrahl ist (also durch die Hauptpunkte läuft, die sich hier in

6.3 Aberrationen

527

(a)

(c)

(b)

(d)

(e)

Abb. 6.34: (a) Unverzerrtes Objekt. (b) Wenn die Vergrößerung auf der optischen Achse kleiner als außerhalb der optischen Achse ist, ergibt sich eine kissenförmige Verzeichnung. (c) Wenn sie auf der Achse größer als außerhalb ist, ergibt sich eine tonnenförmige Verzeichnung. (d) Kissenverzeichnung an einer einzelnen dünnen Linse. (e) Tonnenverzeichnung an einer einzelnen dünnen Linse. (Fotos E. H.)

O vereinigen). Befindet sich die Aperturblende vor einer Positivlinse wie in Abbildung 6.35 b, so ist die längs des Hauptstrahls gemessene Objektweite größer, als wenn sich die Blende unmittelbar an der Linse befände (S2 A > S2 O). Daher ist x größer und MT gemäß Gleichung (5.26) kleiner – folglich kommt es zur tonnenförmigen Verzeichnung. Mit anderen Worten: MT ist für einen außeraxialen Punkt mit einer vorderen Blende kleiner als ohne Blende. Der Unterschied ist ein Maß für die Aberration, die übrigens nicht von der Größe der Aperturblende abhängt. In gleicher Weise verkleinert eine hintere Blende (Abb. 6.35 c) x längs des Hauptstrahls (S2 O > S2 B), wodurch sich MT vergrößert und eine kissenförmige Verzeichnung entsteht. Der Austausch von Objekt und Bild hat daher den Effekt des Vorzeichenwechsels der Verzerrung für eine gegebene Linse und Blende. Die erwähnten Blendenlagen erzeugen den gegenteiligen Effekt, wenn die Linse negativ ist. Aus dem Gesagten folgt, dass man eine Blende am besten in die Mitte zwischen identischen Linsen einbauen sollte. Die von der ersten Linse verursachte Verzeichnung hebt

(b)

(a)

Haup

'

tstrah

l

Hauptstrahl Tonnenverzeichnung

orthoskopisch (unverzeichnet) (c)

Ha

upt

(d)

stra

hl Hauptstrahl

Kissenverzeichnung

Abb. 6.35: Die Auswirkung der Blendenlage auf die Verzeichnung.

6 Geometrische Optik: Weiterführende Themen

528

dann jene der zweiten Linse gerade auf. Diese Methode wird bei der Konstruktion verschiedener fotografischer Objektive (Abb. 5.115) erfolgreich angewendet. Natürlich sind Objekt- und Bildweite gleich, und folglich ist MT = 1, wenn das Linsensystem vollkommen symmetrisch ist und wie in Abbildung 6.35 d funktioniert. (Übrigens sind Koma und Farbfehler dann ebenfalls gleich null.) Dies trifft für Reproobjektive zu, die für endlich weit entfernte konjugierte Punkte konstruiert sind und zum Beispiel zur Aufzeichnung von Daten benutzt werden. Selbst wenn MT ungleich eins ist, baut man das System gern annähernd symmetrisch um eine Blende, da so die verschiedenen Aberrationen merklich verringert werden. Auch in Linsensystemen, beispielsweise dem Teleskop in Abbildung 6.36, können Verzeichnungen auftreten. Für einen weit entfernten Objektpunkt dient der Rand des positiven Achromaten als Aperturblende. Die Anordnung ähnelt einer Zerstreuungslinse mit einer vorderen Blende, was zu einer kissenförmigen Verzeichnung führt.

Hauptstr ahl

Aperturblende

Abb. 6.36: Verzeichnung in einem Linsensystem.

Betrachten wir einen Hauptstrahl mit gleicher Ein- und Austrittsrichtung (Abb. 6.35 d). Der Schnittpunkt des Strahls mit der Achse ist der optische Mittelpunkt des Systems und gleichzeitig der Mittelpunkt der Aperturblende, da es sich um einen Hauptstrahl handelt. Diese Situation ist in Abbildung 6.35 a dargestellt – die Blende liegt direkt an der dünnen Linse. In beiden Fällen sind die hinein- und herauslaufenden Abschnitte des Hauptstrahls parallel, es gibt keine Verzeichnung. Ein solches System heißt orthoskopisch. Dies bedeutet auch, dass die Ein- und Austrittspupillen den Hauptebenen entsprechen (vorausgesetzt, das System befindet sich in einem einzigen Medium, siehe Abb. 6.2). Der Hauptstrahl ist nun ein Hauptpunktstrahl. Ein System dünner Linsen ist frei von Verzeichnung, wenn sein optischer Mittelpunkt mit dem Mittelpunkt der Aperturblende zusammenfällt. Übrigens sind in einer Lochkamera die Strahlen, die konjugierte Objekt- und Bildpunkte verbinden, gerade, und sie verlaufen durch den Mittelpunkt der Aperturblende. Die ein- und austretenden Strahlen sind offensichtlich parallel (sie sind deckungsgleich), und es gibt keine Verzeichnung.

6.3.2 Chromatische Aberrationen Die fünf Abbildungsfehler dritter Ordnung, die seidelschen Aberrationen, wurden unter der Bedingung monochromatischen Lichts betrachtet. Sendet die Lichtquelle ein breites Wellenlängenspektrum aus, so werden diese Aberrationen zwar beeinflusst,

6.3 Aberrationen

529

doch die Auswirkungen sind geringfügig – es sei denn, das System ist sehr gut korrigiert. Es gibt jedoch chromatische Aberrationen, die speziell in polychromatischem Licht sichtbar werden und im Vergleich weit bedeutender sind. Die Gleichung für die Berechnung eines Strahls (6.12) ist eine Funktion der Brechungsindizes, die ihrerseits von der Wellenlänge abhängen. Strahlen verschiedener Farbe durchlaufen ein System entlang verschiedener Wege; dies ist das charakteristische Merkmal der chromatischen Aberration. Da die Linsengleichung für dünne Linsen   1 1 1 = (nl − 1) − f R1 R2

[5.16]

über nl (λ) wellenlängenabhängig ist, muss sich die Brennweite ebenso mit λ verändern. Im Allgemeinen (Abb. 3.40) nimmt nl (λ) im sichtbaren Bereich mit der Wellenlänge ab, daher nimmt f (λ) mit λ zu. Das Ergebnis ist in Abbildung 6.37 gezeigt. Dort werden die Farbkomponenten eines kollimierten weißen Lichtstrahlenbündels in verschiedenen Punkten auf der Achse fokussiert. Den axialen Abstand zwischen zwei derartigen Brennpunkten, die einen bestimmten Frequenzbereich (zum Beispiel von Blau bis Rot) überstreichen, bezeichnet man als Farbortsfehler (oder Farblängsfehler). Farblängsfehler

u bla

rot FB

FR

rot

bla u ΣLC

Abb. 6.37: Farblängsfehler.

Chromatische Aberrationen kann man leicht mit einer dicken einfachen Sammellinse beobachten. Beleuchtet man diese mit einer polychromatischen Lichtquelle (etwa einer Kerzenflamme), dann sieht man ein reelles Bild, das von einem Halo umgeben ist. Schiebt man die Beobachtungsebene an die Linse heran, so färbt sich der Rand des unscharfen Bildes orangerot. Bewegt man die Ebene von der Linse weg und hinter das schärfste Bild, so wird der Umriß blauviolett getönt. Der Unschärfenkreis (also die Ebene ΣLC ) liegt dort, wo das beste Bild erscheint. Schaut man direkt durch die Linse gegen eine Quelle, so ist die Färbung weit eindrucksvoller. Das Bild eines außeraxialen Punktes wird von den einzelnen Frequenzkomponenten gebildet, deren jede in einer anderen Höhe über oder unter der Achse eintrifft (Abb. 6.38). Die Frequenzabhängigkeit von f bewirkt auch eine Frequenzabhängigkeit der Transversalvergrößerung. Der vertikale Abstand zwischen zwei derartigen Bild-

6 Geometrische Optik: Weiterführende Themen

530

FB FR blau

rot

Farbquerfehler

Abb. 6.38: Farbquerfehler.

punkten (meistens wird Blau und Rot verwendet) ist ein Maß für den Farbquerfehler. Folglich füllt eine mit Farbfehlern behaftete Linse, die mit weißem Licht bestrahlt wird, ein Raumvolumen mit einem Kontinuum einander mehr oder weniger überlagernder Bilder aus, die sich in Größe und Farbe unterscheiden. Da das Auge für den gelbgrünen Anteil des Spektrums am empfindlichsten ist, stellt man die Linse bevorzugt für diesen Bereich scharf ein. Mit einer derartigen Anordnung sieht man alle andersfarbigen Bilder überlagert und leicht unscharf, wodurch ein milchig-weißer Schleier entsteht. Liegt der blaue Brennpunkt FB links vom roten Brennpunkt FR , so bezeichnet man wie in Abbildung 6.37 den Farbortsfehler als positiv. Dagegen erzeugt eine Zerstreuungslinse einen negativen Farbortsfehler, wobei die stärker abgelenkten blauen Strahlen anscheinend von einem Ort rechts des roten Brennpunkts ausgehen. Der physikalische Grund ist, dass die Linse, ob konvex oder konkav, prismenförmig ist, denn sie wird mit zunehmendem radialen Abstand von der Achse entweder dünner oder dicker. Wie wir wissen, werden die Strahlen deshalb zur Achse hin oder von ihr weg abgelenkt. In beiden Fällen werden die Strahlen gegen die dickere Basis des prismatischen Querschnittes abgeknickt. Der Ablenkungswinkel wächst jedoch mit n und nimmt deshalb mit λ ab. Folglich wird das blaue Licht am stärksten abgelenkt und am nächsten zur Linse fokussiert. Mit anderen Worten: Für eine Sammellinse liegt der rote Brennpunkt am weitesten rechts, für eine Zerstreuungslinse am weitesten links. Das menschliche Auge weist eine beträchtliche chromatische Aberration auf, die durch verschiedene psychophysische Mechanismen kompensiert wird. Dennoch ist es möglich, den Effekt an einem kleinen purpurfarbenen Punkt zu sehen: Hält man ihn dicht vor das Auge, erscheint er in der Mitte blau und hat einen roten Rand; weiter weg erscheint er rot mit einer blauen Umrandung. Zweiteilige Achromate aus dünnen Linsen Man kann also erwarten, dass für eine Kombination aus einer dünnen Zerstreuungsund einer dünnen Sammellinse FR und FB exakt zusammenfallen (Abb. 6.39). Eine derartige Anordnung bezeichnet man für die beiden betreffenden Wellenlängen als achromatisiert. Wir möchten nun die Gesamtdispersion (die farbabhängige Strahl-

6.3 Aberrationen

531

rot blau H1

gelb

H2

Abb. 6.39: Ein zweiteiliger Achromat. Der Strahlenverlauf wurde übertrieben gezeichnet.

ablenkung) wirksam eliminieren, nicht aber die Gesamtablenkung. Sind zwei Linsen durch einen Abstand d voneinander getrennt, so erhalten wir 1 1 d 1 = + − . f f1 f2 f1 f2

[6.8]

Anstatt den zweiten Term der Linsengleichung für dünne Linsen [Gl. (5.15)] auszuschreiben, führen wir eine Kurzschreibweise ein und setzen 1/f1 = (n1 − 1) ρ1 bzw. 1/f2 = (n2 − 1) ρ2 für beide Linsen: 1 = (n1 − 1) ρ1 + (n2 − 1) ρ2 − d (n1 − 1) ρ1 (n2 − 1) ρ2 . f

(6.51)

Dieser Ausdruck liefert die Brennweiten fR und fB des Doublets für rotes und blaues Licht, wenn die entsprechenden Brechungsindizes eingeführt sind, nämlich n1R , n2R , n1B und n2B . Soll jedoch fR gleich fB sein, dann ist 1 1 = , fR fB und unter Verwendung von Gleichung (6.51) wird (n1R − 1) ρ1 + (n2R − 1) ρ2 − d (n1R − 1) ρ1 (n2R − 1) ρ2 = (n1B − 1) ρ1 + (n2B − 1) ρ2 − d (n1B − 1) ρ1 (n2B − 1) ρ2 .

(6.52)

Ein besonders wichtiger Fall liegt vor, wenn die Linsen einander berühren (d = 0). Umformen von Gleichung (6.52) führt dann zu n2B − n2R ρ1 =− . ρ2 n1B − n1R

(6.53)

Zweckmäßigerweise arbeitet man nun mit der Brennweite fG des Linsensystems für gelbes Licht, dessen Frequenz etwa in der Mitte zwischen den Extremen Blau und Rot liegt. Für die einzelnen Linsen ist in gelbem Licht 1/f1G = (n1G − 1) ρ1 und 1/f2G = (n2G − 1) ρ2 . Folglich ist (n2G − 1) f2G ρ1 = . ρ2 (n1G − 1) f1G

(6.54)

6 Geometrische Optik: Weiterführende Themen

532

Zusammen führen die Gleichungen (6.53) und (6.54) auf (n2B − n2R ) / (n2G − 1) f2G . =− f1G (n1B − n1R ) / (n1G − 1) Die Größen n2B − n2R n2G − 1

und

(6.55)

n1B − n1R n1G − 1

bezeichnet man als die Zerstreuungsvermögen der beiden Linsenmaterialien. Ihre reziproken Werte V2 und V1 nennt man abbesche Zahlen. Je kleiner die abbesche Zahl, desto größer ist das Zerstreuungsvermögen. Daher gilt V1 f2G =− f1G V2 bzw. f1G V1 + f2G V2 = 0 .

(6.56)

Da die Zerstreuungsvermögen positiv sind, sind auch die abbeschen Zahlen positiv. Daher muss, wie erwartet, eine der beiden Einzellinsen negativ und die andere positiv sein, wenn Gleichung (6.56) gelten, also fR gleich fB sein soll. Mit unserem jetzigen Wissen könnten wir bereits einen zweiteiligen Achromaten konstruieren. Zuvor sollen jedoch noch einige Details erwähnt werden. Die Bezeichnung der Wellenlänge als rot, gelb und blau ist viel zu ungenau für die praktische Anwendung. Stattdessen bezieht man sich gewöhnlich auf spezielle Spektrallinien, deren Wellenlängen exakt bekannt sind. Die fraunhoferschen Linien dienen als die notwendigen Bezugspunkte entlang des Spektrums. Einige davon (für den sichtbaren Bereich) sind in Tabelle 6.1 aufgeführt. Die Linien F , C und d (D3 ) werden am häufigsten (für blau, rot und gelb) verwendet, und man rechnet paraxiale Strahlen im Allgemeinen mit d-Licht durch. Glashersteller geben für ihre Waren oft die abbeschen Zahlen an, wie in Abbildung 6.40; dort wurde der Brechungsindex als Funktion von Vd =

nd − 1 nF − nC

(6.57)

aufgezeichnet (siehe auch Tab. 6.2). Daher kann man Gleichung (6.56) besser als f1d V1d + f2d V2d = 0

(6.58)

schreiben, wobei die Zahlenindizes zu den beiden Gläsern gehören, aus denen der zweiteilige Achromat besteht, während der Buchstabe auf die d-Linie hinweist. Fälschlicherweise schloss übrigens Newton aus seinen Experimenten mit dem damals zur Verfügung stehenden, sehr begrenzten Materialsortiment, dass das Zerstreuungsvermögen für alle Gläser gleich ist. Dies entspricht der Aussage, dass in (6.52) f1d = −f2d ist, was bedeuten würde, dass das Doublet eine Brechkraft von null hat.

1,45

7 6

9 8

1,50

2 1

4 3

1,55

7 6

9 8

1,60

2 1

4 3

1,65

95

ZK

90

85

51

52 50

80

PENNSYLVANIA 18 642

75

SCHOTT OPTICAL GLASS Inc., DURYEA,

The shown with the symbols, together Die number einem Feld entsprechende Glassorte ist with group designation of aus the den abbreviated angegebenen Nummern und dem the abgekürzten respectiveGruppensymbol field give the glas zu type. entnehmen.

wns Barium-Leichtkrongläser BalK KzF Shor Kurzflinte Special short flints Kurzflintsondergläser KzFS All other glasses Alle übrigen Sorten

Zink-Krongläser

Symbole

Katalog Nr. 3050e und 3060e

Übersichtsplan Diagram of für Optical optische Glasses Gläser

70

5

50

PSK

7 6

9 8

1,70

1

1,75

7 6

9 8

1,80

2 1

4 3

1,85

7 6

9 8

1,90

2 1

4 3

1,95

7 6

9 8

2,00

51

6

1

10

1

50

3

4

2

3 50

52

65

6 8 13 71

3

2

53

11 1

3

5

4

1

TiK

1 +5

2

12

11

23

10

2

5

3

3

4

55

N18 52 1 8

15 10

SK13 11

50 3 N7 7

20

5

4 16 7 3 14

51

60

2

4

51

5

3

1

1

2

7 2

3 N8

26 69

1 2 50

M5

2

5

50

6

4

6

6

M11

2

3

8

3

52

M 10

4 7 2

1

7

13

8 6

4

1 N4

50

45

1

5

3

7

34

6

5

2

3

13 7

50

8

35

5 19 51 50

54

15

6

11

6

25

57

58

59

20

Fluor-Krongläser Phosphat-Krongläser Phosphat-Schwerkrongläser Borosilicat-Krongläser Hartkrongläser Barium-Krongläser Barium-Schwerkrongläser Lanthan-Schwerflintgläser Lanthan-Krongläser

1

1

56

55 14 61 54 13

4

9

53 3 18 10

30

8 52

Fk Pk Psk Bk K Bak Sk LaSF Lak

17 2 2 716 6 60 1 10 1 13 4 9 3 2 117 5 15 8 5 14 4

5 10

40

1,45

7 6

9 8

1,50

2 1

4 3

1,55

7 6

9 8

1,60

2 1

4 3

1,65

6.3 Aberrationen 533

Abb. 6.40: Brechungsindex als Funktion der abbeschen Zahl für verschiedene Glassorten. Die Gläser im oberen Bereich mit hohen Brechungsindizes und niedrigen Dispersionen enthalten Seltenerdmetalle.

6 Geometrische Optik: Weiterführende Themen

534

Tabelle 6.1: Einige intensive fraunhofersche Linien.

Bezeichnung

Wellenlänge (Å)∗

Quelle

C D1 D D2 D3 oder d b1 b2 c F f g K

6562,816 (rot) 5895,923 (gelb) 5892,9 (Mitte des Dubletts) 5889,953 (gelb) 5875,618 (gelb) 5183,618 (grün) 5172,699 (grün) 4957,609 (grün) 4861,327 (blau) 4340,465 (violett) 4226,728 (violett) 3933,666 (violett)

H Na Na Na He Mg Mg Fe H H Ca Ca



1 Å = 0,1 nm

Newton verlagerte seine Bemühungen dementsprechend vom Linsenfernrohr zum Spiegelfernrohr, und dies erwies sich langfristig als sehr erfolgreich. Etwa 1733 erfand Chester Moor Hall den Achromaten, der dann aber unbeachtet blieb, bis ihn 1758 der Londoner Optiker John Dollond noch einmal erfand und patentieren ließ. Verschiedene zweiteilige Achromate sind in Abbildung 6.41 gezeigt. Die Formen hängen von den ausgewählten Glassorten sowie von der Wahl der anderen zu korrigierenden Aberrationen ab. Nebenbei bemerkt: Wenn man ein Seriendoublet unbekannter Herkunft kauft, sollte man beachten, dass es keine absichtlich hervorgerufenen Aberrationen enthält, die zum Fehlerausgleich im ursprünglichen System gedacht waren.

gekitteter Fraunhofer-Achromat

Achromat mit Randberührung

Achromat mit Mittelpunktsber¨uhrung

Flintglas

Kronglas

Gaußscher Achromat

Achromat mit Randber¨uhrung

Achromat mit Mittelpunktsber¨uhrung

(a)

(b)

Abb. 6.41: (a) Zweiteilige Achromate. (b) Doublets und Triplets. (Foto Melles Griot.)

6.3 Aberrationen

535

Tabelle 6.2: Optische Gläser.

Typenbezeichnung

Name

nD

VD

511:635 517:645 513:605 518:596 523:586 529:516 541:599 573:574 574:577 611:588 617:550 611:572 562:510 588:534 584:460 605:436 559:452 573:425 580:410 605:380 617:366 621:362 649:338 666:324 673:322 689:309 720:293

Borosilicat-Kronglas (BSC1) Borosilicat-Kronglas (BSC2) Kronglas (C) Kronglas Kronglas (C1) Kronflintglas (CF1) Baryt-Leichtkronglas (LBC1) Baryt-Kronglas (LBC2) Baryt-Kronglas Baryt-Schwerkronglas (DBC1) Baryt-Schwerkronglas (DBC2) Baryt-Schwerkronglas (DBC3) Baryt-Leichtflintglas (LBF2) Baryt-Leichtflintglas (LBF1) Baryt-Flintglas (BF1) Baryt-Flintglas (BF2) Doppelleichtflintglas (ELF1) Leichtflintglas (LF1) Leichtflintglas (LF2) Schwerflintglas (DF1) Schwerflintglas (DF2) Schwerflintglas (DF3) Schwerflintglas (EDF1) Schwerflintglas (EDF5) Schwerflintglas (EDF2) Schwerflintglas (EDF) Schwerflintglas (EDF3)

1,5110 1,5170 1,5125 1,5180 1,5230 1,5286 1,5411 1,5725 1,5744 1,6110 1,6170 1,6109 1,5616 1,5880 1,5838 1,6053 1,5585 1,5725 1,5795 1,6050 1,6170 1,6210 1,6490 1,6660 1,6725 1,6890 1,7200

63,5 64,5 60,5 59,6 58,6 51,6 59,9 57,4 57,7 58,8 55,0 57,2 51,0 53,4 46,0 43,6 45,2 42,5 41,0 38,0 36,6 36,2 33,8 32,4 32,2 30,9 29,3

Aus T. Calvert, „Optical Components“, Electromechanical Design (Mai 1971). Die Typenbezeichnung ist gegeben als (nD − 1) : (10VD ), wobei nD auf drei Dezimalstellen gerundet ist. Weitere Angaben unter anderem in Smith, Modern Optical Engineering, Abb. 7.5 und Optisches Glas, Schott, Mainz.

Das verbreitetste Doublet ist wohl der gekittete fraunhofersche Achromat. Er wird aus einer bikonvexen Kronglaslinse6 hergestellt, die eine plankonkave (oder fast ebene) Flintglaslinse berührt. Die Verwendung eines vorderen Elementes aus Kronglas ist beliebt, denn dieses Material ist sehr widerstandfähig. Da die äußere Form in etwa plankonvex ist, können durch Auswahl der richtigen Gläser sowohl die sphärische Aberration als auch die Koma korrigiert werden. Angenommen, wir möchten einen fraunhoferschen Achromaten mit einer Brennweite von 50 cm konstruieren. Eine gewisse Vorstellung von der Auswahl der Gläser können wir uns verschaffen, indem wir Gleichung (6.58) zusammen mit der Gleichung des Linsensystems 1 1 1 + = f1d f2d fd 6

Traditionell nennt man Gläser mit nd > 1,60, Vd > 50 und nd < 1,60, Vd > 55 Krongläser, alle anderen heißen Flintgläser. Man beachte die Bezeichnungen in Abbildung 6.40.

6 Geometrische Optik: Weiterführende Themen

536 lösen, wodurch wir

und

V1d 1 = f1d fd (V1d − V2d )

(6.59)

V2d 1 = f2d fd (V2d − V1d )

(6.60)

erhalten. Um kleine Werte von f1d und f2d zu vermeiden, was stark gekrümmte Oberflächen der einzelnen Linsen erfordern würde, sollte die Differenz V1d − V2d möglichst groß sein (etwa 20 oder mehr ist zweckmäßig). Aus Abbildung 6.40 (oder einer ähnlichen Darstellung) wählen wir beispielsweise die Sorten BK1 und F2. Die katalogisierten Indizes dieser Gläser sind nC = 1,507 63, nd = 1,510 09, nF = 1,515 66 bzw. nC = 1,615 03, nd = 1,620 04, nF = 1,632 08. Auch die abbeschen Zahlen werden im Allgemeinen recht genau angegeben, sodass wir sie nicht berechnen müssen. In diesem Fall sind sie V1d = 63,46 bzw. V2d = 36,37. Die Brennweiten und Brechkräfte der beiden Linsen sind durch die Gleichungen (6.59) bzw. (6.60) gegeben: D1d =

1 63,46 = f1d 0,5 × 27,09

und

D2d =

1 36,37 . = f2d 0,5 × (−27,09)

Folglich ist D1d = 4,685 dpt und D2d = −2,685 dpt; die Summe ist gleich 2 dpt, also, wie erwartet, 1/0,5. Zur Erleichterung der Herstellung sei die erste Linse, eine Sammellinse, gleichkonvex. Folglich sind ihre Radien R11 und R12 gleich. Also ist ρ1 =

1 1 2 − = R11 R12 R11

oder äquivalent 4,685 D1d 2 = = 9,185 . = R11 n1d − 1 0,510 09 Somit ist R11 = −R12 = 0,2177 m. Da wir außerdem angenommen haben, dass die Linsen eng nebeneinander stehen, erhalten wir R12 = R21 – die zweite Oberfläche der ersten Linse passt genau in die erste Oberfläche der zweiten. Für die zweite Linse gilt ρ2 = oder

1 1 D2d − = R21 R22 n2d − 1

1 −2,685 1 − = −0,2177 R22 0,620 04

und R22 = −3,819 m. Zusammengefasst sind die Radien des Kronglaselements R11 = 21,8 cm und R12 = −21,8 cm, die Radien des Flintglaselement R21 = −21,8 cm und R22 = −381,9 cm.

6.3 Aberrationen

537

Man beachte, dass für eine Kombination dünner Linsen die Hauptebenen zusammenfallen. Mit der Achromatisierung der Brennweite sind daher sowohl der Farbortsfehler als auch der Farbquerfehler korrigiert. In einem dicken Doublet können die verschiedenen Wellenlängen jedoch verschiedene Hauptebenen besitzen, ungeachtet dessen, dass die Brennweiten für Rot und Blau angeglichen wurden. Folglich fallen die Brennpunkte nicht zusammen, obwohl die Vergrößerung für alle Wellenlängen gleich ist: Der Farbquerfehler ist korrigiert, aber der Farblängsfehler nicht. In der obigen Analyse wurde nur der Brennpunkt der C- und F -Strahlen vereinigt. Die d-Linie wurde eingeführt, um für das Doublet als Ganzes eine Brennweite zu finden. Nicht alle Wellenlängen, die einen zweiteiligen Achromaten durchlaufen, können sich in einem gemeinsamen Brennpunkt treffen. Den resultierenden Farbrestfehler nennt man sekundäres Spektrum. Die Eliminierung des sekundären Spektrums ist besonders schwierig, wenn die Konstruktion auf heutzutage verfügbare Gläser beschränkt ist. Ein Fluoritelement (CaF2 ), kombiniert mit einem geeigneten Glaselement, kann jedoch für drei Wellenlängen achromatisiert werden und ein sehr kleines sekundäres Spektrum haben. Öfter verwendet man für Farbkorrekturen bei drei oder sogar vier Wellenlängen Triplets. Man kann das sekundäre Spektrum eines Fernglases mühelos beobachten, wenn man auf ein entferntes weißes Objekt blickt. Um dessen Ränder sieht man einen schwachen tiefroten und grünen Saum – probieren Sie aus, was passiert, wenn man die Scharfeinstellung vor- und zurückbewegt. Zweiteilige Achromate aus getrennten Linsen Es ist ebenso möglich, die Brennweite eines Doublets zu achromatisieren, das sich aus zwei weit voneinander entfernten Einzellinsen desselben Glases zusammensetzt. Wir kehren zu Gleichung (6.52) zurück und setzen n1R = n2R = nR und n1B = n2B = nB . Nach einigen Umformungen erhalten wir (nR − nB ) [(ρ1 + ρ2 ) − ρ1 ρ2 d (nB + nR − 2)] = 0 oder

1 d= (nB + nR − 2)



1 1 + ρ1 ρ2

 .

Führen wir wieder die gelbe Bezugsfrequenz ein, nämlich 1/f1G = (n1G − 1) ρ1 und 1/f2G = (n2G − 1) ρ2 , so können wir ρ1 und ρ2 eliminieren. Also ist d=

(f1G + f2G ) (nG − 1) nB + nR − 2

mit n1G = n2G = nG . Für nG = (nB + nR ) /2 erhalten wir d=

f1G + f2G 2

6 Geometrische Optik: Weiterführende Themen

538

oder im d-Licht f1d + f2d . (6.61) d= 2 Dies ist genau die Form für das Huygens-Okular (siehe Abschn. 5.7.4). Da die Brennweiten für Rot und Blau gleich sind, die entsprechenden Hauptebenen des Doublets aber nicht identisch sein müssen, treffen sich die beiden Strahlen im Allgemeinen nicht in einem Brennpunkt. Der Farbquerfehler des Okulars ist gut korrigiert, der Farbortsfehler hingegen nicht. Damit ein System von beiden chromatischen Aberrationen frei ist, müssen die roten und blauen Strahlen parallel zueinander austreten (kein Farbquerfehler) und die Achse in demselben Punkt schneiden (kein Farbortsfehler): Sie müssen sich also überdecken. Da dies bei einem dünnen Achromaten effektiv der Fall ist, sollten mehrlinsige Systeme in der Regel aus achromatischen Komponenten bestehen, damit sich die roten und blauen Strahlen nicht trennen (Abb. 6.42). Natürlich gibt es Ausnahmen, beispielsweise das Taylor-Triplet (Abschn. 5.7.7). Die beiden Farbstrahlen, für die es achromatisiert ist, trennen sich innerhalb des Objektivs, werden aber wieder zusammengeführt und treten zusammen aus.

(a)

blau rot

6.4

(b)

Abb. 6.42: Achromatisierte Linsensysteme.

GRIN-Systeme

Zwei Eigenschaften einer gewöhnlichen homogenen Linse tragen zur Art und Weise der Wellenfrontumformung bei: erstens die Differenz zwischen den Brechungsindizes des Linsenmaterials und des umgebenden Mediums, zweitens die Krümmung der Linsenflächen. Wie wir jedoch bereits gesehen haben, verlangsamen sich Wellenfronten, wenn sie dichtere Bereiche eines inhomogenen Mediums durchqueren, während sich die Fortpflanzungsgeschwindigkeit wieder erhöht, wenn die Fronten optisch dünnere Regionen erreichen. Dies führt ebenfalls zur Ablenkung von Strahlen. Deshalb sollte es prinzipiell möglich sein, eine Linse aus einem inhomogenen Material herzustellen,

6.4 GRIN-Systeme

539

bei dem es einen Gradienten des Brechungsindex gibt. Ein solches Element nennt man GRIN-Linse (Abkürzung für GRadient INdex) oder Gradientenlinse. Ein wirksamer Anreiz, solche Linsen zu entwickeln, besteht in den zusätzlichen Parametern, die dem Konstrukteur optischer Systeme damit zur Korrektur von Aberrationen zur Verfügung stehen. Um eine ungefähre Vorstellung davon zu erhalten, wie eine GRIN-Linse funktioniert, betrachten wir die Anordnung in Abbildung 6.43. Der Einfachheit halber wurde f > r angenommen. Es handelt sich um eine flache Scheibe aus Glas, deren Brechungsindex n (r) durch eine spezielle Behandlung radial in einer zunächst noch unbestimmten Weise abnimmt und am Mittelpunkt ein Maximum nmax besitzt. Dementsprechend nennt man diese Scheibe ein radiales GRIN-Element. Eine Strahl, der die Scheibe entlang der optischen Achse durchquert, läuft entlang der optischen Weglänge (OWL)o = nmax d, während die optische Weglänge für einen Strahl, der in der Höhe r eintrifft (von der Ablenkung einmal abgesehen), (OWL)r ≈ n (r) d beträgt. Da eine ebene Wellenfront in eine sphärische Wellenfront umgeformt werden soll, müssen alle OWL gleich sein (Abschn. 5.2): (OWL)r + AB = (OWL)o und n (r) d + AB = nmax d . Es ist jedoch AF ≈ r 2 + f 2 und außerdem AB = AF − f ; somit wird r2 + f 2 − f . n (r) = nmax − d

max

(a)

(b)

Abb. 6.43: Eine Glasscheibe, deren Brechungsindex radial vom Mittelpunkt aus abnimmt. (b) Fokussierung paralleler Strahlen durch eine GRIN-Linse.

6 Geometrische Optik: Weiterführende Themen

540

Schreiben wir die Quadratwurzel mithilfe des binomischen Satzes um, so wird daraus n (r) = nmax − r 2 /2f d . Wenn der Brechungsindex parabolisch von der Mitte aus abnimmt, so fokussiert die GRIN-Platte demnach einen kollimierten Strahl im Punkt F und wirkt als Sammellinse. Dies ist zwar eine stark vereinfachte Betrachtungsweise, aber eines wird klar: Ein parabolisches Brechungsindex-Profil fokussiert paralleles Licht. Heute ist eine Vielzahl von GRIN-Linsen im Handel erhältlich, und sie verrichten in Millionen Laserdruckern, Kopierern und Faxgeräten ihren Dienst. Das am weitesten verbreitete Gerät dieser Art ist ein GRIN-Zylinder von wenigen Millimetern Durchmesser, ähnlich einer optischen Faser (Abb. 5.82 b). Solche Zylinder haben in monochromatischem Licht eine nahezu beugungsbegrenzte Leistung, und in polychromatischem Licht bieten sie beträchtliche Vorteile gegenüber asphärischen Elementen. Dünne GRIN-Stäbe stellt man in der Regel mittels Ionendiffusion her. Ein homogenes Rohglas wird viele Stunden lang in ein Bad aus geschmolzenem Salz getaucht. Während dieser Zeit erfolgt eine langsame Ionendiffusion und ein Ionenaustausch: Eine Ionensorte wandert aus dem Glas heraus und eine andere Sorte aus dem Bad nimmt die freigewordenen Plätze ein, wodurch sich der Brechungsindex ändert. Der Prozess schreitet von außen nach innen in Richtung der optischen Achse voran, und die benötigte Zeit ist ungefähr proportional zum Quadrat des Stabdurchmessers. Für ein parabolisches Profil begrenzt dies die Größe der Apertur. Die Brennweite wird durch die Veränderung des Brechungsindex Δn bestimmt. Je stärker die Linse ist, desto größer muss Δn sein. Jedoch ist Δn gewöhnlich aus fertigungstechnischen Gründen auf weniger als 0,1 beschränkt. Die meisten GRIN-Zylinder besitzen ein parabolisches Indexprofil, das häufig als   n (r) = nmax 1 − ar 2 /2 ausgedrückt wird. Abbildung 6.44 zeigt einen solchen radialen GRIN-Stab der Länge L unter monochromatischer Beleuchtung. Meridionalstrahlen laufen auf sinusförmigen Bahnen innerhalb der Einfallsebene, die senkrecht auf √ der Peripherie des Stabes a; die Gradientenkonsteht. Diese Sinusfunktionen haben eine Periode von 2π/ √ stante a ist eine Funktion von λ und hängt von der Art des Materials ab. Die Schnittdarstellung in Abbildung 6.44 a zeigt, wie eine radiale GRIN-Linse ein aufrechtes, reelles, vergrößertes Bild erzeugt. Durch Veränderung der Objektweite oder der Länge L der Linse erhält man verschiedenartige Bilder. Es ist sogar möglich, sowohl die Objektebene als auch die Bildebene auf die Stirnflächen des Stabes zu legen (Abb. 6.44 b und c). Radiale GRIN-Linsen (Abb. 6.45) werden oft anhand ihrer Länge oder, gleichbedeutend, ihrer Periodenzahl spezifiziert. Ein radialer GRIN-Stab mit einer Periodenzahl √ von 1,0 ist eine Sinuswelle lang: L = 2π/ √a. Ein Stab mit einer Periodenzahl von 0,25 hat die Länge einer Viertelperiode (π/2 a).

6.4 GRIN-Systeme

s (a)

541

s

L √ 2π a

(b)

(c)

Abb. 6.44: (a) Ein radialer GRIN-Stab, der ein reelles, vergrößertes, aufrechtes Bild erzeugt. (b) Hier wird das Bild auf der Oberfläche des Stabes erzeugt. (c) Eine zweckmäßige Anordnung für ein Kopiergerät.

Eine Alternative zu flachen radialen GRIN-Stäben sind axiale GRIN-Linsen, deren Oberflächen im Allgemeinen sphärisch geschliffen sind. Somit verhalten sich diese Linsen analog zu zweiseitig asphärischen Elementen, wobei die Schwierigkeiten der Herstellung derartiger Oberflächen umgangen werden. Gewöhnlich wird ein Stapel Glasplatten mit geeigneten Indizes aufeinander geschmolzen. Bei hohen Temperaturen vermischen sich die Gläser durch Diffusion. Es entsteht ein Glasblock mit einem kontinuierlichem Indexprofil, das einen linearen, quadratischen oder auch kubischen Verlauf haben kann (Abb. 6.46 a). Wenn eine Linse aus einem solchen Glasblock geschliffen wird, legt man Material mit verschiedenen Indizes frei. In jedem konzentrischen Ringbereich der Linsenoberfläche ändert sich der Brechungsindex kontinuierlich. Strahlen, die in verschiedenen Höhen oberhalb der optischen Achse eintreffen, gelangen in Glasbereiche mit unterschiedlichen Brechungsindizes und werden entsprechend abgelenkt. Die sphärische Aberration, die in Abbildung 6.46 c zu sehen ist, entsteht, weil die Ränder der sphärischen Linse die Strahlen zu stark brechen. Senkt man den Brechungsindex zu den Rändern hin ab, ergibt sich eine GRIN-Linse, deren sphärische Aberration korrigiert ist.

6 Geometrische Optik: Weiterführende Themen

542

Periodenzahl 0.125

Periodenzahl 0.25

Abb. 6.45: Radiale GRIN-Linsen mit verschiedenen Periodenzahlen und typischen Verwendungsweisen.

Periodenzahl 0.50

(b)

(c)

(a) (d)

Abb. 6.46: (a) Eine Scheibe aus axialem GRIN-Material mit dem Brechungsindex n (z). (b) Eine axiale GRIN-Linse ohne sphärische Aberration. (c) Eine herkömmliche Linse mit sphärischer Aberration. (d) Das Profil des Brechungsindex.

Im Allgemeinen lässt sich der Entwurf eines optischen Systems stark vereinfachen, indem man eine GRIN-Linse in das System einbringt. Nur noch etwa ein Drittel der Elemente wird bei gleichbleibender Qualität benötigt.

6.5 Abschließende Bemerkungen

543

(a) New Orleans und der Mississippi, fotografiert aus 12 500 m Höhe mit der Metritek-21-Kamera von Itek (f = 21 cm). Das Auflösungsvermögen beträgt am Boden 1 m; Maßstab 1:59 492. (b) Maßstab: 1:10 000. (c) Maßstab: 1:2500. (Mit frdl. Genehmigung von Litton/Itek Optical Systems.)

6.5

Abschließende Bemerkungen

Wegen der Einfachheit der Herstellung findet man bei den meisten optischen Systemen nur Linsen mit Kugelflächen, obwohl es natürlich auch torische Gläser, Zylinderlinsen

6 Geometrische Optik: Weiterführende Themen

544

und viele andere asphärische Linsen gibt. In der Tat werden in hochwertige, in der Regel sehr teure Geräte wie Messkammern für große Aufklärungsflughöhen und Zielverfolgungsgeräte mehrere asphärische Linsen eingebaut. Wie auch immer: Die sphärischen Linsen mit ihren inhärenten Aberrationen, die man zufriedenstellend korrigieren muss, spielen die dominierende Rolle. Wie wir gesehen haben, muss der Konstrukteur (mithilfe seines Computers) die Systemvariablen (Brechungsindizes, Formen, Abstände, Blenden usw.) manipulieren, um Aberrationen auszugleichen. Dies geschieht bis zu dem Grad und in der Reihenfolge, die für das jeweilige optische System angemessen sind. In einem normalen Fernrohr ist unter Umständen eine viel stärkere Verzerrung und Bildfeldwölbung akzeptabel als in einem guten Fotoobjektiv. Ebenso braucht man sich wenig um die chromatische Aberration zu kümmern, wenn ein Gerät ausschließlich für Laserlicht konzipiert ist, welches nahezu monochromatisch ist. In diesem Kapitel haben wir die mit modernen Linsensystemen verbundenen Herausforderungen kurz angerissenen, um die Probleme deutlich zu machen, nicht um sie zu lösen. Dass sie aber gelöst werden können, zeigen beispielsweise die Luftaufnahmen (Fotos S. 543), die recht eindrucksvoll für sich selbst sprechen – insbesondere wenn man bedenkt, dass Spionagesatelliten Bilder mit zehn- oder mehrfach besserer Auflösung liefern.

Aufgaben Lösungen zu den Aufgaben ohne ∗ finden Sie am Ende des Buches. 6.1* Arbeiten Sie die Details aus, die zu Gleichung (6.8) führen. 6.2

Nach dem militärischen Handbuch MIL-HDBK-141(23.3.5.3) ist das Ramsden-Okular (Abb. 5.105) aus zwei plankonvexen Linsen gleicher Brennweite f  zusammengesetzt, die durch einen Abstand 2f  /3 voneinander getrennt sind. Bestimmen Sie die Gesamtbrennweite f der Kombination dünner Linsen, die Hauptebenen und die Lage der Feldblende.

6.3

Schreiben Sie einen Ausdruck auf für die Dicke dl einer Bikonvexlinse mit unendlich großer Brennweite.

6.4* Die Krümmungsradien einer dicken Linse seien +10,0 cm und +9,0 cm. Die Dicke der Linse auf der optischen Achse sei 1,0 cm, der Brechungsindex sei 1,50 und die Linse sei von Luft umgeben. Bestimmen Sie die Brennweite der Linse und erläutern Sie, was deren Vorzeichen bedeutet. 6.5 Wir betrachten einen sammelnden Meniskus mit den Radien 6 und 10, einer Dicke von 3 (beliebige Einheiten) und einem Brechungsindex von 1,5. Bestimmen Sie seine Brennweite und die Lage seiner Hauptpunkte (vergleichen Sie mit der Abbildung 6.3). 6.6* Zeigen Sie, dass eine bikonvexe Linse der Dicke dl sphärisch ist, wenn ihre Hauptpunkte in der Mitte zwischen den Scheitelpunkten übereinander liegen. Die Linse soll sich in Luft befinden.

Aufgaben 6.7

545

Verwenden Sie Gleichung (6.2), um einen Ausdruck für die Brennweite einer homogenen transparenten Kugel mit dem Radius R herzuleiten. Wo liegen die Hauptpunkte?

6.8* Eine kugelförmige Glasflasche mit einem Durchmesser von 20 cm soll vernachlässigbar dünne Wände haben und mit Wasser gefüllt sein. Die Flasche liege an einem sonnigen Tag auf dem Rücksitz eines Autos. Wie groß ist ihre Brennweite? 6.9* Berechnen Sie unter Beachtung der vorangegangenen beiden Aufgaben die Transversalvergrößerung, die sich ergibt, wenn das Bild einer Blume, die 4 m weit entfernt vom Mittelpunkt einer festen und durchsichtigen Kunststoffkugel von 0,2 m Durchmesser und einem Brechungsindex von 1,4 steht, auf eine nah gelegene Wand geworfen wird. Beschreiben Sie das Bild im Detail. 6.10* Eine dicke Linse aus Glas mit einem Brechungsindex von 1,5 hat Radien von +23 cm und +20 cm, sodass beide Scheitelpunkte links von den entsprechenden Krümmungsmittelpunkten liegen. Gegeben sei eine Dicke von 9 cm. Bestimmen Sie die Brennweite der Linse. Zeigen Sie, dass für derartige afokale Linsen ohne brechende Wirkung allgemein R1 − R2 = d/3 gilt. Untersuchen Sie anhand einer Zeichnung, was mit dem axial einfallenden parallelen Strahlenbündel beim Durchgang durch das System geschieht. 6.11 Von einer dicken Linse ist bekannt, dass sie Sonnenlicht 29,6 cm hinter ihrer Rückseite in einem Punkt fokussieren kann. Die Hauptpunkte der Linse liegen bei H1 = +0,2 cm und H2 = −0,4 cm. Wo entsteht das Bild einer Kerze, die 49,8 cm vor der Linse steht? 6.12* Zeigen Sie, dass bei einer dicken Linse aus Glas der Abstand zwischen den Hauptebenen etwa ein Drittel der Dicke der Linse beträgt. Die einfachste Geometrie ergibt sich für eine plankonvexe Linse, bei der man einen Strahl vom Objektbrennpunkt ausgehend verfolgt. Was können Sie über die Beziehung zwischen der Brennweite und der Dicke für diesen Linsentyp sagen? 6.13 Eine 4 cm dicke Bikonvexlinse aus Kronglas, die bei einer Wellenlänge von 900 nm eingesetzt wird, hat einen Brechungsindex von 3/2. Ihre Radien seien 4 cm und 15 cm. Bestimmen Sie die Lage der Hauptpunkte und berechnen Sie die Brennweite. Angenommen, wir stellen 1 m vor der Vorderseite der Linse einen Fernsehschirm auf. Wo erscheint das reelle Bild des Fernsehschirms? 6.14* Stellen Sie sich zwei identische, dicke Bikonvexlinsen vor, die durch einen Abstand von 20 cm zwischen den benachbarten Scheitelpunkten getrennt sind. Berechnen Sie die Äquivalentbrennweite für den Fall, dass alle Krümmungsradien 50 cm, die Brechungsindizes 1,5 und die Dicken der Linsen 5 cm sind. 6.15* Ein Linsensystem sei aus zwei dünnen Linsen im gegenseitigen Abstand von 10 cm zusammengesetzt. Die Brennweiten der Linsen betragen +20 cm und −20 cm. Bestimmen Sie die Brennweite des Systems und die Lage der entsprechenden Hauptpunkte. Zeichnen Sie ein Bild des Systems. 6.16* Eine plankonvexe Linse mit einem Brechungsindex von 3/2 hat eine Dicke von 1,2 cm und eine Krümmungsradius von 2,5 cm. Wie lautet die Systemmatrix, wenn Licht auf die gekrümmte Fläche fällt?

6 Geometrische Optik: Weiterführende Themen

546

6.17* Eine dicke, bikonvexe Linse in Luft hat einen Brechungsindex von 1,810 und eine Dicke von 3,00 cm. Der eine Krümmungsradius der Linse ist 11,0 cm und der andere 120 cm. Bestimmen Sie die Systemmatrix A. 6.18* Gehen Sie von Gleichung (6.33) aus und leiten Sie für den Fall, dass sowohl das Objekt als auch das Bild von Luft umgeben sind, Gleichung (6.34) ab. 6.19* Zeigen Sie, dass Gleichung (6.36), durch die die Objektweite mit der Bildweite (jeweils gemessen von den Scheitelpunkten der Linse) in Beziehung gesetzt wird, sich für dünne Linsen auf die gaußsche Linsenformel (5.17) reduziert. 6.20* Ein positiver Meniskus mit einem Brechungsindex von 2,4 ist von einem Medium mit dem Index 1,9 umgeben. Die Linse hat eine Dicke von 9,6 mm und Krümmungsradien von 50 mm und 100 mm. Berechnen Sie die Systemmatrix, wenn Licht auf die konvexe Fläche fällt, und zeigen Sie, dass die Determinante gleich 1 ist. 6.21* Zeigen Sie, dass die Determinante der Systemmatrix in Gleichung (6.31) gleich 1 ist. 6.22 Zeigen Sie, dass die Gleichungen (6.41) und (6.42) äquivalent zu den Gleichungen (6.3) und (6.4) sind. 6.23 Zeigen Sie, dass die ebene Oberfläche einer plankonkaven oder plankonvexen Linse (rechte Fläche jeweils eben) nichts zur Systemmatrix beiträgt. 6.24 Berechnen Sie die Systemmatrix für eine dicke Bikonvexlinse mit dem Brechungsindex 1,5, die Radien von 0,5 und 0,25 und eine Dicke von 0,3 hat (in beliebigen Einheiten). Prüfen Sie nach, dass |A| = 1 ist. 6.25* Die Systemmatrix für eine dicke Bikonvexlinse in Luft sei durch  0,6 −2,6 0,2 0,8 gegeben. Außerdem gegeben seien der erste Radius (0,5 cm), die Dicke (0,3 cm) und der Brechungsindex (1,5). Bestimmen Sie den anderen Radius. 6.26* Zeigen Sie, ausgehend von den Gleichungen (6.35) und (6.37), dass die 2 × 2-Matrix, die sich als Produkt der drei 2 × 2-Matrizen in Gleichung (6.33) ergibt, die Form  (a11 − a12 dO ) a12 0 MT hat. Da diese Matrix das Produkt von Matrizen ist, von denen jede die Determinante 1 hat, hat sie ebenfalls die Determinante 1. Zeigen Sie, dass dann gilt MT =

1 . a11 − a12 dO

6.27* Eine plankonkave, 1 cm dicke Linse aus Glas (n = 1,5) mit einem Radius von 10 cm befinde sich in Luft. Bestimmen Sie die Systemmatrix und überzeugen Sie sich davon, dass ihre Determinante gleich 1 ist. Bei welchem positiven Winkel (gemessen in Radianten über der Achse) muss ein Strahl in einer Höhe von 2 cm auf die Linse treffen, wenn er in der gleichen Höhe, aber parallel zur optischen Achse austreten soll?

Aufgaben

547

6.28* Bestimmen Sie für die Linse in Aufgabe 6.27 die Brennweite und die Lage der Brennpunkte relativ zu ihren Scheitelpunkten V1 und V2 . 6.29* Abbildung A.6.29 zeigt zwei identische, konkave, sphärische Spiegel, die einen so genannten konfokalen Hohlraum bilden. Zeigen Sie, ohne dass Sie zuerst d berechnen, dass nach zweimaliger Durchquerung des Systems die Systemmatrix ⎡ 2  ⎤ 2d 4 d 2d −1 ⎥ ⎢ r −1 − r r r ⎢ ⎥   ⎣ d ⎦ d 1−2 2d 1 − r r

d 1 2 3

4 M2

M1 |R1 |=|R2 |=r

Abb. A.6.29

ist. Zeigen Sie außerdem für den Fall d = r, dass das System nach vier Reflexionen wieder in seinen Ausgangszustand ist und das Licht den gleichen Weg erneut durchläuft. 6.30 Betrachten Sie noch einmal Abbildung 6.18 a und zeigen Sie, dass alle Strahlen, die in P entstehen, scheinbar von P  ausgehen, wenn P P  = Rn2 /n1 und P C = Rn1 /n2 ist. 6.31 Zeigen Sie ausgehend von dem exakten Ausdruck, der durch Gleichung (5.5) gegeben ist, dass man Gleichung (6.46) statt Gleichung (5.8) erhält, wenn die Näherungen für  und  ein wenig verbessert werden. 6.32 Abbildung A.6.32 soll durch ein Linsensystem abgebildet werden, das nur sphärische Aberration als Abbildungsfehler besitzt. Fertigen Sie eine Skizze des Bildes an.

Abb. A.6.32

6.33* Abbildung A.6.33 zeigt die Intensitätsverteilungen von Bildern, die sich ergeben, wenn eine monochromatische Punktquelle drei verschiedene optische Systeme beleuchtet, die jeweils nur Abbildungsfehler eines Typs aufweisen. Identifizieren Sie den jeweiligen Typ anhand der Diagramme und begründen Sie Ihre Antwort.

Abb. A.6.33

(a)

(b)

(c)

6 Geometrische Optik: Weiterführende Themen

548

6.34* Abbildung A.6.34 zeigt die Verteilung des Lichts in Bildern, die sich ergeben, wenn eine monochromatische Punktquelle zwei unterschiedliche optische Systeme beleuchtet, die jeweils nur Abbildungsfehler eines Typs aufweisen. Identifizieren Sie den jeweiligen Typ und begründen Sie ihre Antwort.

(a)

(b)

Abb. A.6.34

7

Superposition von Wellen

In den folgenden Kapiteln werden wir Polarisation, Interferenz und Beugung untersuchen. Alle diese Phänomene beruhen auf verschiedenen Aspekten desselben Prozesses, daher sind die konzeptuellen Grundlagen im Wesentlichen identisch. Sehr einfach ausgedrückt, wollen wir herausfinden, was geschieht, wenn sich zwei oder mehrere Lichtwellen in einem bestimmten Raumbereich überlagern. Die genauen Umstände dieser Überlagerung bestimmen natürlich die resultierende Wellenform. Unter anderem interessiert uns, in welcher Weise die Parameter (Amplitude, Phase, Frequenz usw.) jeder einzelnen Welle die endgültige Form der zusammengesetzten Störung beeinflussen. Wie wir bereits wissen, erfüllt jede Feldkomponente einer elektromagnetischen Welle (Ex , Ey , Ez , Bx , By und Bz ) die skalare dreidimensionale Wellengleichung 1 ∂2ψ ∂2ψ ∂2ψ ∂2ψ + + = . ∂x2 ∂y 2 ∂z 2 v 2 ∂t2

[2.60]

Eine wichtige Eigenschaft dieser Gleichung ist die Linearität: ψ (r, t) und ihre Ableitungen erscheinen nur in der ersten Potenz. Sind alle ψ1 (r, t) , ψ2 (r, t) , . . . , ψn (r, t) jeweils Lösungen der Gleichung (2.60), so ist jede ihrer Linearkombinationen ebenfalls eine Lösung. Daher erfüllt ψ (r, t) =

n 

Ci ψi (r, t)

(7.1)

i=1

die Wellengleichung, wobei die Koeffizienten Ci beliebige Konstanten sind. Man bezeichnet dies als Superpositionsprinzip: Die resultierende Welle entspricht in jedem Punkt eines Mediums der algebraischen Summe der einzelnen Komponenten (Abb. 7.1). Momentan interessieren uns nur lineare Systeme, auf die das Superpositionsprinzip anwendbar ist. Allerdings können Wellen mit großen Amplituden, ob Schallwellen oder Seilwellen, eine nichtlineare Antwort erzeugen. So kann der fokussierte Strahl eines Hochleistungslasers (in dem das Feld 1010 V/cm stark sein kann) nichtlineare Effekte hervorrufen (siehe Kap. 13). Zum Vergleich: Das elektrische Feld des Sonnenlichts auf der Erde hat eine Amplitude von nur etwa 10 V/cm. In vielen Situationen spielt die Vektornatur des Lichts keine Rolle. Zunächst werden wir uns auf solche Beispiele beschränken. Wenn sich beispielsweise alle Lichtwellen

https://doi.org/10.1515/9783111025599-007

7 Superposition von Wellen

550

Abb. 7.1: Die Superposition zweier Wellen.

längs derselben Linie ausbreiten und eine gemeinsame, konstante Schwingungsebene haben, kann jede Welle durch eine einzige elektrische Feldkomponente beschrieben werden. Diese Komponenten wären zu jedem Zeitpunkt parallel oder antiparallel und könnten daher als Skalare behandelt werden. Mehr wird darüber später noch zu sagen sein; im Moment wollen wir die optische Störung als eine Skalarfunktion E (r, t) darstellen, die eine Lösung der Wellengleichung (2.60) ist. Dieser Ansatz führt zu einer einfachen skalaren Theorie, die, mit Bedacht angewendet, sehr nützlich ist.

7.1

Die Addition von Wellen gleicher Frequenz

Es gibt mehrere äquivalente Wege, zwei oder mehr einander überlagernde Wellen gleicher Frequenz mathematisch zu addieren. Wir werden diese verschiedenen Herangehensweisen analysieren, sodass wir in jeder speziellen Situation die am besten geeignete wählen können.

7.1.1 Die algebraische Methode Wir wollen nun die Superposition zweier harmonischer Wellen untersuchen, die beide die gleiche Frequenz ω haben und sich in die gleiche Richtung fortpflanzen. Eine Lösung der Wellengleichung kann in der Form E (x, t) = E0 sin [ωt − (kx + ε)]

(7.2)

7.1 Die Addition von Wellen gleicher Frequenz

551

geschrieben werden, wobei E0 die Amplitude der harmonischen Welle ist, die sich entlang der positiven x-Achse ausbreitet. Wir trennen den räumlichen vom zeitlichen Anteil der Phase, α (x, ε) = − (kx + ε) ,

(7.3)

und damit wird E (x, t) = E0 sin [ωt + α (x, ε)] .

(7.4)

Betrachten wir zwei derartige Wellen: E1 = E01 sin (ωt + α1 ) E2 = E02 sin (ωt + α2 ) .

(7.5a) (7.5b)

Beide haben dieselbe Frequenz und Geschwindigkeit, und sie koexistieren im Raum. Die resultierende Welle ist die lineare Überlagerung (Superposition) dieser Wellen. Daher gilt E = E1 + E2 . Hier ist es hilfreich zu überlegen, wonach wir suchen. Die Summe sollte Gleichung (7.4) ähneln – die Addition zweier Signale gleicher Frequenz muss natürlich wieder ein Signal mit dieser Frequenz ergeben. Um sich dies klar zu machen, denken Sie daran, dass die Frequenz eines Photons von dessen Energie abhängt, welche sich hier nicht ändert. In jedem Fall erwarten wir eine sinusförmige Funktion mit der Frequenz ω, deren Amplitude E0 und Phase α zu bestimmen sind. E = E01 (sin ωt cos α1 + cos ωt sin α1 )+E02 (sin ωt cos α2 + cos ωt sin α2 ). Nach Ausklammern der zeitabhängigen Terme folgt E = (E01 cos α1 + E02 cos α2 ) sin ωt + (E01 sin α1 + E02 sin α2 ) cos ωt . (7.6) Da die Ausdrücke in den Klammern zeitlich konstant sind, setzen wir E0 cos α = E01 cos α1 + E02 cos α2

(7.7)

E0 sin α = E01 sin α1 + E02 sin α2 .

(7.8)

und Dies ist keine offensichtliche Substitution, doch ist sie legitim, solange wir nach E0 und α auflösen können. Unter Beachtung der Beziehung cos2 α + sin2 α = 1 quadrieren und addieren wir die Gleichungen (7.7) und (7.8). Wir erhalten den gesuchten Ausdruck für die Amplitude E0 der resultierenden Welle: 2 2 + E02 + 2E01 E02 cos (α2 − α1 ) . E02 = E01

(7.9)

7 Superposition von Wellen

552

Um die Phase zu erhalten, dividieren wir Gleichung (7.8) durch (7.7) und erhalten tan α =

E01 sin α1 + E02 sin α2 . E01 cos α1 + E02 cos α2

(7.10)

Erfüllen E0 und α die letzten beiden Gleichungen, so sind die Gleichungen (7.7) und (7.8) gültig. Die durch den Ausdruck (7.6) gegebene Gesamtwelle wird dann zu E = E0 cos α sin ωt + E0 sin α cos ωt oder E = E0 sin (ωt + α) .

(7.11)

E0 kann man nun mit Gleichung (7.9) und α mit Gleichung (7.10) berechnen. Eine Einzelwelle ergibt sich aus der Überlagerung der sinusförmigen Wellen E1 und E2 . Die zusammengesetzte Welle (7.11) ist harmonisch und hat dieselbe Frequenz wie die Einzelwellen, jedoch eine andere Amplitude und Phase. Beachten Sie, dass α ≈ α1 für E01  E02 und α ≈ α2 für E02  E01 ; die Resultierende ist phasengleich mit der dominierenden Komponente (siehe Abb. 4.11). Die Flussdichte einer Lichtwelle ist nach Gleichung (3.44) proportional zum Quadrat ihrer Amplitude. Daher folgt aus Gleichung (7.9), dass die resultierende Flussdichte nicht einfach die Summe der Teilflussdichten ist, sondern es gibt einen zusätzlichen Beitrag 2E01 E02 cos (α2 − α1 ), den so genannten Interferenzterm. Der entscheidende Faktor ist der Phasenunterschied δ ≡ (α2 − α1 ) zwischen den beiden interferierenden Wellen E1 und E2 . Für δ = 0, ±2π, ±4π, . . . ist die resultierende Amplitude jeweils maximal, während δ = ±π, ±3π, . . . in jedem Punkt des Raumes Minima ergibt (Aufgabe 7.3). Im ersteren Fall, wenn die Wellenberge zur Deckung kommen, nennt man die Wellen phasengleich oder in Phase. Im letzteren Fall, wenn Wellenberge auf Wellentäler treffen, sind die Wellen (um 180◦ ) phasenverschoben (Abb. 7.2). Der Phasenunterschied (Gangunterschied) kann sich sowohl aus der Differenz der optischen Weglängen ergeben, die von den beiden Wellen durchlaufen werden, als auch aus dem Unterschied der Phasenkonstanten: δ = (kx1 + ε1 ) − (kx2 + ε2 )

(7.12)

oder

2π (x1 − x2 ) + (ε1 − ε2 ) . (7.13) λ Hier sind x1 und x2 die Abstände der Quellen beider Wellen vom Beobachtungspunkt, λ ist die Wellenlänge im durchlaufenen Medium. Waren die Wellen am Ort ihrer Erzeugung phasengleich, so ist ε1 = ε2 und δ=

δ=

2π (x1 − x2 ) . λ

(7.14)

7.1 Die Addition von Wellen gleicher Frequenz

553

x E1 E2 E E = E1 + E2 E2

E E1

x

Abb. 7.2: Die Superposition zweier harmonischer Wellen, oben phasengleich, unten phasenverschoben.

Dies trifft auch zu, wenn zwei Wellen aus derselben Quelle verschiedene Wege durchlaufen, bevor sie im Beobachtungspunkt eintreffen. Da n = c/v = λ0 /λ ist, gilt δ=

2π n (x1 − x2 ) . λ0

(7.15)

Die Größe n (x1 − x2 ), eine Differenz zweier optischer Weglängen [siehe Gl. (4.9)], nennt man den optischen Wegunterschied Λ. In komplizierteren Situationen kann jede Welle durch eine Vielzahl von Medien verschiedener Dicke laufen (siehe Aufgabe 7.6). Beachten Sie auch, dass Λ/λ0 = (x1 − x2 ) /λ die Anzahl der Wellen im Medium ist, die dem Wegunterschied entspricht. Da jede Wellenlänge mit einer Phasenänderung von 2π verknüpft ist, gilt δ = 2π (x1 − x2 ) /λ oder kürzer δ = k0 Λ ,

(7.16)

wobei k0 die Wellenzahl im Vakuum ist: k = 2π/λ0 . Ein Weg ist also δ Radianten länger als der andere. Wellen, für die ε1 − ε2 unabhängig vom Wert der beiden Größen konstant ist, bezeichnet man als kohärent; diese Situation wollen wir der folgenden Diskussion größtenteils zugrunde legen.

7 Superposition von Wellen

554

Ein interessanter Spezialfall ist die Überlagerung zweier Wellen, die geringfügig verschiedene Wege in gleicher Richtung zurücklegen, E1 = E01 sin [ωt − k (x + Δx)] und E2 = E02 sin (ωt − kx) , wobei insbesondere E02 = E01 und α2 − α1 = kΔx ist. In Aufgabe 7.7 soll gezeigt werden, dass in diesem Fall die Gleichungen (7.9), (7.10) und (7.11) zu einer resultierenden Welle      Δx kΔx sin ωt − k x + (7.17) E = 2E01 cos 2 2 führen. Man erkennt deutlich, dass der Wegunterschied Δx eine dominierende Rolle spielt – insbesondere, wenn die Wellen phasengleich (ε1 = ε2 ) abgestrahlt werden. Wie wir später sehen werden, versucht man in der Praxis häufig, diese Bedingung zu erfüllen. Ist Δx  λ, so liegt die Amplitude der Resultierenden sehr nahe bei 2E01 ; für Δx = λ/2 wird die Amplitude hingegen null (wegen k = 2π/λ ist der Kosinusterm null). Die erste Situation bezeichnet man als konstruktive Interferenz (Verstärkung), die zweite als destruktive Interferenz (Auslöschung, siehe Abb. 7.3). Das Potential dieser Ideen für praktische Anwendungen soll durch Abbildung 7.4 verdeutlicht werden. Sie sehen ein Jagdflugzeug, das von Mikrowellen eines feindlichen bodengestützen Radarsenders getroffen wird. Zur (verständlichen) Bestürzung des Piloten reflektiert das Flugzeug (im Unterschied zu dem in Abschn. 4.3 gezeigten Stealth Fighter) einen beträchtlichen Anteil der Strahlungsenergie nach unten zur Radarantenne. Noch aber ist nicht alles verloren: Nachdem der Pilot den feindlichen Radarstrahl entdeckt sowie Frequenz und Amplitude ermittelt hat, kann er selbst einen um λ/2 phasenverschobenen Strahl aussenden. Bei der gleichzeitigen Fortpflanzung in Richtung des feindlichen Empfängers überlagern sich die reflektierte und die gesendete Welle gemäß Gleichung (7.17) destruktiv, wodurch das Radarecho genau in dieser Richtung ausgelöscht wird. Sind am Boden mehrere Empfänger stationiert, hat der Pilot natürlich ein Problem. Δx E2 E E1

E = E1 + E2

x

E2 eilt E1 um k Δx voraus

Δx E2

E

E1

x

Abb. 7.3: Wellen, die um k Δx phasenverschoben sind.

7.1 Die Addition von Wellen gleicher Frequenz reflektierte Welle

emittierte Welle

555

Abb. 7.4: Das französische Jagdflugzeug Rafale kann die Radarortung durch aktives Aussenden von Wellen stören. Gesendet wird ein bezüglich der feindlichen Radarstrahlung um λ/2 phasenverschobenes Signal. In der Richtung des Empfängers löschen emittierte und reflektierte Wellen einander dann aus.

Die Superposition vieler Wellen Durch wiederholte Anwendung des Verfahrens zur Herleitung von Gleichung (7.11) können wir zeigen, dass die Superposition einer beliebigen Anzahl kohärenter, harmonischer Wellen mit gegebener Frequenz, die sich in gleicher Richtung ausbreiten, zu einer harmonischen Welle mit derselben Frequenz führt (Abb. 7.5). Die beiden oberen Wellen wurden willkürlich als Sinusfunktionen dargestellt; mit Kosinusfunktionen hätten wir das gleiche Resultat erhalten. Allgemein ist dann die Summe von N solchen Wellen E=

N 

E0i cos (αi ± ωt)

i=1

gegeben durch E = E0 cos (α ± ωt) ,

(7.18)

wobei E02

=

N  i=1

und

N 

tan α =

i=1 N  i=1

2 E0i

+2

N N  

E0i E0j cos (αi − αj )

(7.19)

j>i i=1

E0i sin αi (7.20) E0i cos αi

ist. Überzeugen Sie sich selbst von der Richtigkeit dieser Beziehungen. Wir betrachten N atomare Strahlungsquellen einer gewöhnlichen Lichtquelle (einer Glühlampe, Kerzenflamme oder Entladungslampe). Jedes Atom ist eine unabhängige Quelle von Photonenwellenzügen, welche sich zusammengenommen als elektromagnetische Welle manifestieren. Wenn wir im Wellenbild bleiben wollen, ist es nützlich,

7 Superposition von Wellen

556

Abb. 7.5: Die Superposition dreier harmonischer Wellen ergibt eine harmonische Welle derselben Frequenz.

das Photon gedanklich mit einem Wellenimpuls kurzer Dauer (1 bis 10 ns) zu verknüpfen (Abschn. 3.3.4). Mit anderen Worten, die Atome emittieren Wellenzüge, die ihre Phase im Allgemeinen nur etwa 10 ns lang beibehalten. Danach wird ein neuer Wellenzug emittiert, der eine völlig andere Phase haben kann, welche wiederum nur höchstens 10 ns lang konstant bleibt usw. Jedes Atom ist daher als Ausgangspunkt einer Welle zu betrachten, die durch einen Photonenstrom mit schnell und zufällig veränderliche Phase erzeugt wird. In jedem Fall bleibt die Phase αi (t) des Lichts eines Atoms nur höchstens 10 ns lang bezüglich der Phase αj (t) des Lichts eines anderen Atoms konstant: Die Atome strahlen nur 10−8 s lang kohärent. Die Flussdichte ist proportional zum zeitlichen Mittelwert von E02 , und im Allgemeinen wird über ein vergleichsweise langes Zeitintervall gemittelt. Daher liefert die zweite Summe in Gleichung (7.19) Terme, die proportional zu cos [αi (t) − αj (t)] sind, und alle diese Terme mitteln sich infolge der zufälligen, schnellen Phasenänderungen zeitlich zu null. Nur die erste Summe bleibt dabei erhalten, und ihre Glieder sind Konstanten. Emittiert jedes Atom Wellenzüge mit derselben Amplitude E01 , dann ist 2 . E02 = N E01

(7.21)

Die resultierende Flussdichte von N Quellen mit zufälligen, schnell variierenden Phasen ist durch die Multiplikation von N mit der Flussdichte einer beliebigen Quelle gegeben. Anders ausgedrückt, sie ist durch die Summe der einzelnen Flussdichten bestimmt. Eine Glühlampe, deren sämtliche Atome in zufälliger Weise emittieren, sendet Licht aus, das als Superposition dieser im Wesentlichen „inkohärenten“ Wellenzüge selbst schnell und willkürlich in der Phase variiert. Daher ist das von zwei oder mehr solchen Lampen emittierte Licht im Wesentlichen inkohärent, wenn man Zeitintervalle betrachtet, die länger als etwa 10 ns sind, und die gesamte Bestrahlungsstärke des Systems ist einfach gleich der Summe der Bestrahlungsstärken der einzelnen Lampen. Dies gilt ebenso für Kerzenflammen, Blitzröhren und alle Wärmestrahler (im Unterschied zu Laserstrahlquellen). Bei der Superposition der Lichtwellen zweier Leselampen sind keine Interferenzerscheinungen zu erwarten.

7.1 Die Addition von Wellen gleicher Frequenz

557

Sind die Quellen dagegen im Beobachtungspunkt kohärent und in Phase (αi = αj ), so wird Gleichung (7.19) zu E02 =

N 

2 E0i +2

i=1

N N  

E0i E0j

j>i i=1

oder, äquivalent, N 2  E0i . E02 =

(7.22)

i=1

Setzen wir wieder jede Amplitude gleich E01 , so erhalten wir 2 . E02 = (N E01 )2 = N 2 E01

(7.23)

Im Falle dieser phasengleichen, kohärenten Quellen werden die Amplituden zur Bestimmung der resultierenden Flussdichte zuerst addiert und dann quadriert. Die Superposition kohärenter Wellen bewirkt im Allgemeinen eine Änderung der räumlichen Verteilung, nicht aber des Gesamtbetrags der Energie: Gibt es Bereiche, in denen die Flussdichte größer als die Summe der einzelnen Flussdichten ist, dann existieren auch Bereiche, in denen sie kleiner als die Summe ist.

7.1.2 Die komplexe Methode Bei der Beschreibung der Superposition harmonischer Wellen ist es mathematisch oft zweckmäßig, die komplexe Darstellung mithilfe trigonometrischer Funktionen zu verwenden. Deshalb wollen wir die Berechnung aus Abschnitt 7.1.1, die Addition zweier harmonischer Wellen, noch einmal ausführen. Die Wellenfunktion E1 = E01 cos (kx ± ωt + ε1 ) oder E1 = E01 cos (α1 ∓ ωt) kann dann als !1 = E01 ei(α1 ∓ωt) E

(7.24)

geschrieben werden (wir interessieren uns nur für den reellen Teil – siehe Abschn. 2.5). Wir betrachten N derartige einander überlagernde Wellen gleicher Frequenz, die in die positive x-Richtung wandern. Die resultierende Welle ist, äquivalent zu Gleichung (7.18), gegeben durch ! = E0 ei(α+ωt) E

7 Superposition von Wellen

558 oder, bei Summation der Einzelwellen, durch ⎤ ⎡ N  !=⎣ E0j eiαj ⎦ e+iωt . E

(7.25)

j=1

Die Größe E0 eiα =

N 

E0j eiαj

(7.26)

j=1

nennt man die komplexe Amplitude der zusammengesetzten Welle. Sie ist einfach die Summe der komplexen Amplituden der Einzelwellen. Da   ∗ (7.27) E02 = E0 eiα E0 eiα ist, können wir die resultierende Bestrahlungsstärke stets aus den Gleichungen (7.26) und (7.27) berechnen. Für N = 2 ist zum Beispiel    E02 = E01 eiα1 + E02 eiα2 E01 e−iα1 + E02 e−iα2 , woraus E02

=

2 E01

+

2 E02



i(α1 −α2 )

+ E01 E02 e

−i(α1 −α2 )

+e



oder 2 2 + E02 + 2E01 E02 cos (α1 − α2 ) E02 = E01

wird, was identisch mit Gleichung (7.9) ist.

7.1.3 Zeigeraddition Die Summe in Gleichung (7.26) kann grafisch als Vektoraddition in der komplexen Ebene dargestellt werden (siehe Abschn. 2.5–2.6) Im Sprachgebrauch der Elektrotechnik nennt man die komplexe Amplitude einen Zeiger und gibt diesen durch Betrag und Phase, aufgeschrieben in Vektorform oder einfach als E0 (α) (in der englischsprachigen Literatur auch E0 ∠α) an. Betrachten wir eine Schwingung, die durch E1 = E01 sin (ωt + α1 ) beschrieben ist. In Abbildung 7.6 a stellen wir sie durch einen Zeiger der Länge E01 dar, der sich mit einer Geschwindigkeit ω gegen den Uhrzeigersinn dreht, sodass seine Projektion auf die vertikale Achse gleich E01 sin (ωt + α1 ) ist. Bei Kosinuswellen erfolgt die Projektion auf die horizontale Achse. Übrigens handelt es sich bei diesem rotierenden Vektor um einen Zeiger E0 (α), und die Buchstaben R und I kennzeichnen

7.1 Die Addition von Wellen gleicher Frequenz

559

Bezugsachse

(a)

(b)

(c)

Abb. 7.6: Zeigeraddition.

die reelle bzw. die imaginäre Achse. In Abbildung 7.6 b ist gemeinsam mit E1 eine zweite Schwingung E2 = E02 sin (ωt + α2 ) dargestellt. Die algebraische Summe E = E1 + E2 entspricht der Projektion des resultierenden Zeigers, der durch die Vektoraddition der Einzelzeiger bestimmt ist, auf die I-Achse (Abb. 7.6 c). Der Kosinussatz, angewendet auf das Dreieck mit den Seiten E01 , E02 und E0 , liefert 2 2 + E02 + 2E01 E02 cos (α2 − α1 ) , E02 = E01

wobei die Beziehung cos [π − (α2 − α1 )] = − cos (α2 − α1 ) verwendet wurde. Dies ist erwartungsgemäß mit Gleichung (7.9) identisch. Aus der Abbildung geht außerdem hervor, dass tan α durch Gleichung (7.10) gegeben ist. Normalerweise interessieren wir uns nicht für E (t), sondern für E0 , das von der gleichmäßigen Drehung aller Zeiger nicht beeinflusst wird. So ist es oft zweckmäßig, t = 0 zu setzen und diese Drehung zu eliminieren. Einige elegante grafische Darstellungen wie die Schwingungskurve und die CornuSpirale (Kap. 10) beruhen auf der Zeigeraddition. Als ein Beispiel wollen wir die Schwingung untersuchen, die aus der Addition von E1 E2 E3 E4 E5

= 5 sin ωt = 10 sin (ωt + 45◦ ) = sin (ωt − 15◦ ) = 10 sin (ωt + 120◦ ) = 8 sin (ωt + 180◦ )

entsteht, wobei ω in Grad pro Sekunde angegeben wird. Die entsprechenden Zeiger 5 (0◦ ), 10 (45◦ ), 1 (−15◦ ), 10 (120◦ ) und 8 (180◦ ) sind in Abbildung 7.7 eingezeichnet. Jeder Phasenwinkel, ob positiv oder negativ, ist auf die Horizontale bezogen. Um E = E0 sin (ωt + α) zu erhalten, braucht man nur E0 (α) mit Lineal und Winkelmesser abzulesen. Diese Methode ist sehr schnell und einfach, aber nicht besonders genau.

7 Superposition von Wellen

560

180

120 15

45 Abb. 7.7: Die Summe der Zeiger zu E1 , E2 , E3 , E4 und E5 .

E

E0

E1 E02

kx

ϕ E2

α E ϕ

E

E01

E2

ϕ α

E01 E03

E4 E3 E2 E1 kx

E02 E04

α

E1

Abb. 7.8: Addition zweier Sinusfunktionen gleicher Frequenz in Zeigerdarstellung. E1 wird als Bezugszeiger verwendet; E2 eilt E1 voraus (das Maximum erscheint eher), deshalb ist der Winkel α positiv. Also ist auch ϕ positiv und E, die Resultierende, eilt ebenfalls E1 voraus.

E0

ϕ α E 1 α E2 E = E0 ∠ϕ

α E3 α

E4

Abb. 7.9: Addition von vier Sinuswellen gleicher Frequenz. Um die Zeigermethode genauer zu erläutern, nehmen wir den Ursprung als Nullpunkt der Phase und beziehen alle anderen Phasen darauf. Die Welle E1 eilt bezüglich des Ursprungs um α nach; anders gesagt, der Nulldurchgang erfolgt bei einem Wert von kx größer als 0. Jede Welle eilt außerdem ihrem Vorgänger um den gleichen kleinen Winkel α nach. Wir zeichnen den Zeiger E1 mit dem Winkel α bezüglich der Waagerechten nach unten weisend ein und verfahren mit den nachfolgenden Zeigern der Reihe nach ebenso. Die Länge des resultierenden Zeigers entspricht der Amplitude der resultierenden Welle.

7.1 Die Addition von Wellen gleicher Frequenz

561

In Abbildung 7.7 haben wir zum Beispiel für den Phasenwinkel ωt + 45◦ den Zeiger um 45◦ gegenüber der horizontalen Achse nach oben gedreht. Das ist jedoch nur eine Konvention, und wir hätten ihn ebenso gut um 45◦ nach unten drehen können, solange alles konsistent bleibt. Eine ähnliche Konvention ist, dass wir den Sinus verwendet haben – die gleiche Prozedur würde auch für den Kosinus funktionieren (siehe Aufgabe 7.10). Betrachten wir nun ein Beispiel für die Anwendung dieser Methode. In Abbildung 7.8 sehen Sie die Superposition zweier Wellen mit gleicher Frequenz, unterschiedlicher Amplitude und der Phasendifferenz α. Der Amplitude der Wellen (E01 bzw. E02 ) entspricht jeweils die Amplitude des zugehörigen Zeigers. Die Länge des resultierenden Zeigers (E0 ) ist gleich der Amplitude der resultierenden Welle, und der Phasenwinkel ist etwas kleiner als α. Nun sollen vier Wellen gleiche Frequenzen und Amplituden haben, ihre Phasen aber gegeneinander jeweils um den denselben kleinen Betrag α verschoben sein (Abb. 7.9, vergleichen Sie mit der Situation in Abb. 7.5). Der resultierende Zeiger E = E0 (ϕ) hat die Amplitude und die Phase der resultierenden Welle. Diese Amplitude ist ziemlich groß; hätten wir aber noch mehr Wellen, so bildeten deren Zeiger, Spitze an Ende gezeichnet, allmählich eine Spirale und E0 nähme interessanterweise wieder ab. Im Zeigerdiagramm ist dieser Effekt viel besser sichtbar als in der Wellendarstellung.

7.1.4 Stehende Wellen In Kapitel 2 haben wir gelernt, dass die Summe zweier Lösungen der Wellengleichung selbst wieder eine Lösung ist. Allgemein erfüllt also ψ (x, t) = C1 f (x − vt) + C2 g (x + vt) die Wellengleichung. Wir wollen nun den Spezialfall zweier harmonischer Wellen derselben Frequenz, die sich in entgegengesetzten Richtungen ausbreiten, untersuchen. Dieser Fall ist von praktischer Bedeutung, wenn eine einfallende Welle an einer Art „Spiegel“ reflektiert wird: Eine Wand erfüllt diesen Zweck für Schallwellen, eine leitende Platte für elektromagnetische Wellen. Eine ankommende Welle EI = E0I sin (kx + ωt + εI ) ,

(7.28)

die nach links wandert, soll einen Spiegel bei x = 0 treffen und in der Form ER = E0R sin (kx − ωt + εR )

(7.29)

nach rechts reflektiert werden. Die zusammengesetzte Welle ist im Bereich rechts vom Spiegel E = EI + ER . Anders ausgedrückt, die beiden Wellen (die eine nach rechts wandernd, die andere nach links) existieren im Bereich zwischen Quelle und Spiegel gleichzeitig.

7 Superposition von Wellen

562

Wir könnten die angegebene Summation ausführen und zu einer allgemeinen Lösung1 wie in Abschn. 7.1 gelangen. Wir wählen jedoch eine eingeschränktere Methode, die zu einigen wertvollen physikalischen Erkenntnissen führt. Die Anfangsphase εI kann auf null gesetzt werden, wenn wir unsere Uhr zu einer Zeit mit EI = E0I sin kx starten. Einige Beschränkungen sind durch den physikalischen Aufbau bestimmt und müssen von der mathematischen Lösung erfüllt werden; man nennt sie formal die Randbedingungen. Im Falle eines Seils, dessen eines Ende an einer Wand bei x = 0 festgebunden ist, müsste jener Endpunkt stets eine Auslenkung von null haben: Die einfallende und die reflektierte Welle müssten einander in einer Weise überlagern, dass die resultierende Welle in x = 0 immer null ist. Analog müsste die resultierende elektromagnetische Welle an der Grenzfläche einer ideal leitenden Platte eine elektrische Feldkomponente parallel zur Oberfläche von null haben. Es sei nun E0I = E0R . Die Randbedingungen fordern, dass bei x = 0 für alle Werte von t E = 0 ist, und da εI = 0 ist, folgt aus den Gleichungen (7.28) und (7.29) εR = 0. Mit anderen Worten: Bei x = 0 ist EI = E0I sin(+ωt) und ER = E0I sin(−ωt); die Wellen sind um 180◦ phasenverschoben und löschen einander zu jeder Zeit t aus. Die zusammengesetzte Schwingung lautet dann E = E0I [sin (kx + ωt) + sin (kx − ωt)] . Wenden wir die Gleichung sin α + sin β = 2 sin

1 1 (α + β) cos (α − β) 2 2

an, so erhalten wir E (x, t) = 2E0I sin kx cos ωt .

(7.30)

Dies ist die Gleichung einer stehenden oder stationären Welle. Ihr Profil bewegt sich nicht durch den Raum (siehe Abb. 7.10), es hat offensichtlich nicht die Form f (x ± vt). In jedem Punkt x = x ist die Amplitude konstant und gleich 2E0I sin kx , und E (x , t) ändert sich harmonisch wie cos ωt. In bestimmten Punkten, nämlich x = 0, λ/2, λ, 3λ/2, . . . ist die Elongation zu allen Zeiten null. Diese Punkte nennt man Wellenknoten (siehe Abb. 7.11). In der Mitte zwischen zwei benachbarten Knoten, also an den Stellen x = λ/4, 3λ/4, 5λ/4, . . . hat die Amplitude einen Maximalwert von ±2E0I ; diese Punkte nennt man Wellenbäuche. Die Schwingung E (x, t) ist immer dann für alle Werte von x gleich null, wenn cos ωt = 0 ist, also für die Werte t = (2m + 1) τ /4 mit m = 0, 1, 2, 3, . . . ; dabei ist τ die Periode der Einzelwellen. 1

Siehe beispielsweise J. M. Pearson, A Theory of Waves.

7.1 Die Addition von Wellen gleicher Frequenz

563

Abb. 7.10: Die Erzeugung stehender Wellen. Zwei Wellen derselben Amplitude und Wellenlänge verlaufen in entgegengesetzter Richtung und bilden eine stationäre Schwingung.

(a)

Bauch Knoten

(b)

(c) Abb. 7.11: Eine stehende Welle zu verschiedenen Zeitpunkten.

7 Superposition von Wellen

564

Beispiel 7.1 Schreiben Sie eine Gleichung für eine stehende Welle auf, die bei x = 0 einen Wellenbauch hat. Beginnen Sie mit zwei Wellen, die die gleiche Amplitude E0 haben, also EI = E0 sin(ωt − kx) und ER = E0 sin(ωt + kx) . Hier haben wir die räumlichen und zeitlichen Beiträge in den Phasen gegenüber den Gleichungen (7.28) und (7.29) vertauscht, was sich entsprechend in Gleichung (7.30) niederschlägt. Lösung Wir verwenden die Identität sin α+sin β = 2 sin 12 (α+β) cos 12 (α−β) und erhalten EI + ER = 2E0 sin 12 (2ωt) cos 12 (−2kx) . Aus cos(−kx) = cos(kx) folgt EI + ER = 2E0 sin ωt cos kx oder E(x, t) = 2E0 cos kx sin ωt . Bei x = 0 ist E(0, t) = 2E0 sin ωt, was zeitlich zwischen +2E0 und −2E0 oszilliert. Abbildung 7.12 zeigt die Entstehung der stehenden Welle im Zeigerbild. Wir haben zwei harmonische Wellen; die Zeiger nennen wir E1 und E2 . Im (Rand-)Punkt x = 0 sind die Wellen vollständig außer Phase, die Anfangswerte der Zeiger sind deshalb E01 (0) und E02 (π). Wie bereits erläutert wurde (Abschn. 2.6), entspricht ein mit der Geschwindigkeit ω gegen den Uhrzeigersinn rotierender Zeiger einer Welle, die sich nach links ausbreitet (x nimmt ab), ein gleicher, aber im Uhrzeigersinn rotierender Zeiger hingegen einer Welle, die nach rechts läuft (x nimmt zu). E1 soll nun zu einer nach links laufenden, E2 zu einer nach rechts laufenden Welle gehören. Der resultierende Zeiger ist E1 + E2 = E = E0 (ϕ) mit E0 als Amplitude der Kurve (resultierender Störung) zu einem beliebigen Zeitpunkt. Das Ergebnis erhalten wir, indem wir E1 und E2 Spitze an Ende zeichnen. Um Abbildung 7.11 nachzuvollziehen, nehmen wir jetzt an, die Amplituden der beiden Wellen seien gleich (E01 = E02 ). Die Zeiger bleiben Spitze an Ende, und wir lassen gleichzeitig und mit gleicher Geschwindigkeit E1 entgegen dem Uhrzeigersinn und E2 im Uhrzeigersinn rotieren.

7.1 Die Addition von Wellen gleicher Frequenz

565

E2

E2 E

E1 E2 E1

E1

E01 + E02 λ 4

0 E2 E1

E E1 E2 λ

λ 2

E01 + E02 E1 E2

E1 E

E1

E

x E1

E2

E2

E2

Abb. 7.12: Entstehung einer stehenden Welle im Zeigerbild. Die beiden Zeiger rotieren gleich schnell, aber in entgegengesetzten Richtungen. In diesem Fall sind die Amplituden gleich, was zur vollständigen Auslöschung der Störung in den Knoten führt.

So ergibt sich E als Funktion von t. Beachten Sie dabei, dass die drei Zeiger stets ein gleichschenkliges Dreieck bilden, wobei E senkrecht steht: E rotiert überhaupt nicht, und die zugehörige resultierende Welle bewegt sich nicht durch den Raum – es ist eine stehende Welle.

Stehende Wellen auf einer schwingenden Saite. (Foto mit frdl. Genehmigung von PASCO.)

Kommen wir noch einmal zu Abbildung 7.10 zurück. Findet, wie in den meisten Fällen, keine ideale Reflexion statt, so ist die Amplitude der resultierenden Störung in den Knoten verschieden von null (siehe Abb. 7.13). Deutlich sieht man das in der Zeigerdarstellung von E1 und E2 , wobei jetzt E01 > E02 ist. E rotiert nun in der gleichen Richtung (entgegen dem Uhrzeigersinn) wie der längere der beiden Komponentenzeiger (hier E1 ). Die zusammengesetzte Welle enthält dann neben dem stationären Teil eine bewegte Komponente, die sich mit der Amplitude (E01 − E02 ) nach links fortpflanzt (siehe Abb. 7.13 c und Aufgabe 7.17). Unter diesen Bedingungen wird – im Gegensatz zur reinen stehenden Welle – Energie transportiert. Für den stationären Anteil können wir einen Ausdruck der Form E = E0 (x) cos [ωt − ϕ(x)] aufschreiben; die Amplitude ändert sich von Punkt zu Punkt, und in jedem festen Punkt x schwingt die Welle kosinusförmig. Durch Anwendung des Kosinussatzes ergibt sich aus dem Zeigerdiagramm in Abbildung 7.13 b eine ortsabhängige Amplitude 2 + E 2 + 2E E cos 2kx)1/2 . E0 (x)(E01 01 02 02

7 Superposition von Wellen

566 (a)

(b)

E2

E1

E1

kx

E

E

E01 – E02

E E1

E01 + E02

(c) E01 + E02

x

kx

E2

E1

E2

E01

2kx E02

l 2

l

3l 2

2l

l 2

l

3l 2

2l

l 2

l

3l 2

2l

l 2

l

3l 2

2l

l 2

l

3l 2

2l

E E01 + E02

E2

E01 – E02

E

E01 – E02

0

l兾4

l兾2

3l兾4

x

E01 + E02 E01 – E02

E

E2

x

E1

Abb. 7.13: (a) Entstehung einer Welle mit stationärem Anteil im Zeigerbild. Jetzt sind die Amplituden der beiden Wellen verschieden und die Amplitude in den Knoten ist ungleich null. Die Störung enthält eine nichtstationäre Komponente, die sich in Richtung der Teilwelle mit der größeren Amplitude ausbreitet. (b) Die Welle können wir in der Form E = E0 (x) cos [ωt − ϕ (x)] aufschreiben; mithilfe des Kosinussatzes 2 2 +E02 + erhalten wir die ortsabhängige Amplitude E0 (x) = (E01 2E01 E02 cos 2kx)1/2 . (c) Die nichtstationäre Komponente für den alternativen Fall, in dem E1 gegen den Uhrzeigersinn und E2 im Uhrzeigersinn rotiert. Wegen E1 > E2 rotiert E somit im Uhrzeigersinn und die Störung pflanzt sich nach rechts fort. (Die Kurven in (c) hat Justin Dove zur Verfügung gestellt.) Die Spitze des Zeigers markiert eine Ellipse.

x

E E01 + E02 E01 – E02

x

E E01 + E02 E01 – E02

x

E E01 + E02 E01 – E02

x

Bisher haben wir nur eine Dimension berücksichtigt, doch stehende Wellen gibt es auch in zwei oder drei Dimensionen. Das Phänomen ist weit verbreitet: Eindimensionale stehende Wellen kommen z. B. bei Gitarrensaiten und Sprungbrettern vor, zweidimensionale auf einem Trommelfell oder auf der Wasseroberfläche eines gefüllten Eimers (siehe Foto), und dreidimensionale stehende Wellen können wir erzeugen, indem wir in der Duschkabine singen. Tatsächlich werden beim Singen ständig stehende Wellen in den Hohlräumen unseres Kopfes erzeugt, unabhängig von unserem Standort. Wird ein System mit stehenden Wellen durch eine Schwingungsquelle angeregt, so absorbiert es Energie, vorausgesetzt, die Schwingungen des Erregers stimmen mit einer Mode des Systems überein. Diesen Vorgang nennt man Resonanz. Im alltäglichen Leben begegnet uns Resonanz beispielsweise, wenn Fensterscheiben summen, weil

7.1 Die Addition von Wellen gleicher Frequenz

567

Wischwasser, mit dem ein Fußboden gesäubert wurde, ist eine Aufschlämmung feiner Schmutzpartikel. Auf der gekrümmten Oberfläche eines Waschbeckens abgestellt, kippelt der Eimer um eine bestimmte Achse, wodurch stehende Wellen erzeugt werden. Die Partikel ordnen sich daher beim Absinken rippenförmig an. (Foto E. H.)

ein Flugzeug in geringer Höhe über das Haus fliegt oder ein schwerer Lastkraftwagen vorbeifährt. Die stehende Welle baut sich so lange auf, bis ein Gleichgewicht erreicht ist – d. h., bis der Energieverlust des Systems gleich der Energiezufuhr durch die Schwingungsquelle ist. Die Fähigkeit, eine Anregung aufrechtzuerhalten und zu verstärken, ist eine wichtige Eigenschaft von Systemen stehender Wellen. Ein resonanter Hohlraum ist der Gehörkanal unserer Ohren, der Klänge zwischen ≈ 3 kHz und ≈ 4 kHz um etwa 100% verstärkt. Auch die intensive Emission eines Lasers baut sich als stehende Welle in einem Hohlraum auf (siehe Abschn. 13.1.3).

Das Muster auf der Seitenfläche des Autos entsteht durch stehende Wellen infolge der Schwingungen der Karosserie bei laufendem Motor. Die Amplitudenskala ist in Mikrometern (1 µm = 10−6 m) angegeben, das Foto wurde mit einem holografischen Verfahren aufgenommen. (Foto mit frdl. Genehmigung von HOLO3/FTPO.)

Durch die Messung der Abstände zwischen den Knoten stehender Wellen konnte Hertz in seinen historischen Experimenten die Wellenlänge der Strahlung bestimmen (Abschn. 3.6.1). Einige Jahre später, 1890, wies Otto Wiener erstmals stehende Lichtwellen nach. Seine Versuchsanordnung ist in Abbildung 7.14 b gezeigt. Man erkennt ein senkrecht einfallendes, paralleles, quasimonochromatisches Lichtstrahlenbündel, das von einem vorderseitig versilberten Spiegel reflektiert wird. Die Verwendung eines Spiegels stellt sicher, dass die beiden überlagerten Wellen nahezu gleiche Amplituden haben, sodass das enstehende Muster eher wie in den Abbildungen 7.12 und 7.13 aussieht. Ein lichtdurchlässiger fotografischer Film, weniger als λ/20 dick, war auf

7 Superposition von Wellen

568

Ein zweidimensionales Muster stehender Wellen, das sich zwischen einer Quelle und einem Reflektor gebildet hat. Elektromagnetische Wellen werden von einer 3,9-GHz-Antenne (rechts im Bild) ausgesendet und von einem Metallstab zurück zur Antenne reflektiert. Das Muster wurde sichtbar gemacht, indem die Mikrowellenstrahlung absorbiert und die resultierende Wärmestrahlung mit einer IR-Kamera aufgezeichnet wurde. (Foto mit freundlicher Genehmigung von H. H. Pohle, Philips Laboratory, Kirtland Air Force Base.) (b)

Ebenen der Wellenbäuche (a)

λ/2 λ/2 λ/4

Spiegel Abb. 7.14: Wieners Experiment. (a) Die einlaufende Welle hat eine nach unten gerichtete Komponente und die reflektierte Welle hat eine nach oben gerichtete Komponente. Beide überlagern sich und bilden eine stehende Welle in zwei Dimensionen. Die schwarzen Punkte markieren die Maxima und die weißen Kreise die Minima. (b) Hier trifft der einfallende Strahl senkrecht von oben auf einen Spiegel und bildet mit der nach oben reflektierten Welle ein Muster stehender Wellen.

eine Glasplatte aufgetragen, die zum Spiegel in einem Winkel von etwa 10−3 rad geneigt war. Auf diese Weise schnitt die Filmplatte das Bild der stehenden ebenen Welle. Nach Entwicklung der Emulsion fand man Schwärzungen in Form einer Reihe äquidistanter paralleler Bänder. Diese entsprechen den Bereichen, in denen die fotografische Schicht die Ebenen der Schwingungsbäuche geschnitten hatte. Bemerkenswerterweise wurde die Emulsion auf der Spiegeloberfläche hingegen nicht geschwärzt. Man kann zeigen, dass sich die Knoten und Bäuche der magnetischen Feldkomponenten einer stehenden elektromagnetischen Welle mit denen des elektrischen Feldes abwechseln (Aufgabe 7.13). Wegen der Energieerhaltung sollte B = 0 sein, wenn E für alle Werte von x zum Zeitpunkt t = (2m + 1) τ /4 gleich null ist. Bereits vorher (1888) hatte Hertz die Existenz eines Knotenpunktes des elektrischen Feldes an der Oberfläche seines Reflektors erkannt, was mit der Theorie in Einklang steht. So konnte Wiener

7.1 Die Addition von Wellen gleicher Frequenz

569

schließen, dass die geschwärzten Gebiete mit den Wellenbäuchen des E-Feldes verknüpft sind. Das elektrische Feld löst den fotochemischen Prozess aus.

Akustische Levitation. Zwei Ultraschallwellen, eine abwärts und die andere aufwärts verlaufend, bilden eine stehende Welle. In einem Druckknoten wird hier ein Wassertropfen in der Schwebe gehalten. (Foto mit frdl. Genehmigung der NASA.)

In sehr ähnlicher Weise zeigten Drude und Nernst, dass das E-Feld für die Fluoreszenz verantwortlich ist. Diese Beobachtungen sind nicht verwunderlich, wenn man bedenkt, dass die Komponenten des B-Feldes einer elektromagnetischen Welle eine viel geringere Kraft auf die Elektronen ausüben als die Komponenten des E-Feldes. Daher bezeichnet man das elektrische Feld auch als optische Schwingung oder Lichtfeld. Stehende Wellen, erzeugt von zwei sich in entgegengesetzter Richtung ausbreitenden Wellen, sind ein Spezialfall der Zweistrahl-Interferenz. Betrachten wir die beiden Punktquellen in Abbildung 7.15. Ist der Beobachtungspunkt P weit von den Quellen entfernt, dann ist der Winkel φ klein, die beiden Wellen überlagern einander, und es entsteht ein kompliziertes Beugungsmuster (siehe auch Kap. 9). Es sei hier nur kurz erwähnt, dass der Raum um die Quellen herum von einem System heller und dunkler Streifen erfüllt ist, die abwechselnd konstruktive und destruktive Interferenz zeigen. Kommt P näher und wird der Winkel φ größer, so werden die Streifen schmaler, bis P die Verbindungslinie der Quellen erreicht und φ = 180◦ ist. Dort finden wir eine stehende Welle, und die Streifen haben ihre kleinste Breite, nämlich eine halbe Wellenlänge.

7 Superposition von Wellen

570

Schnitte durch ein dreidimensionales Muster stehender elektromagnetischer Wellen in verschiedenen Höhen innerhalb eines Mikrowellenherdes. (Foto mit frdl. Genehmigung von Alistair Steyn-Ross, University of Waikato.) P

S

7.2

S

Abb. 7.15: Zwei monochromatische Punktquellen. In einem Punkt P ist die resultierende Welle maximal, wenn sich entweder Wellenberge oder Wellentäler überlagern. Sie ist minimal, wenn Wellenberge und Wellentäler zur Deckung kommen. Die Maxima entlang der Linie S1 S2 entsprechen stehenden Wellen.

Die Addition von Wellen verschiedener Frequenz

Bis hierher haben wir die Superposition von Wellen gleicher Frequenz analysiert. In der Praxis ist jedoch keine Welle streng monochromatisch. Weit realistischer ist es, wie wir noch sehen werden, von quasimonochromatischem Licht auszugehen, das Komponenten aus einem schmalen Frequenzband enthält. Auf diese Weise gelangen wir zu den Begriffen der Bandbreite und der Kohärenzzeit. Durch die Lichtmodulation (Abschn. 8.11.3) kann man elektronische und optische Systeme koppeln, was weitreichende technologische Auswirkungen hatte und noch haben wird. Überdies spielt das Licht seit dem Aufkommen elektrooptischer Techniken eine bedeutende Rolle als Informationsträger. Dieser Abschnitt ist der Entwicklung einiger mathematischer Begriffe gewidmet, die wir benötigen, um diesen Themenkreis richtig zu verstehen.

7.2 Die Addition von Wellen verschiedener Frequenz

571

7.2.1 Schwebungen Beginnen wir mit dem besonders einfachen Fall zweier Wellen verschiedener Frequenz, die sich in gleicher Richtung ausbreiten. Wir betrachten die zusammengesetzte Welle, die aus der Superposition der Wellen E1 = E01 cos (k1 x − ω1 t) und E2 = E01 cos (k2 x − ω2 t) mit k1 > k2 und ω1 > ω2 entsteht. Diese beiden Wellen haben gleiche Amplituden und beide die Anfangsphase null. Die resultierende Welle E = E01 [cos (k1 x − ω1 t) + cos (k2 x − ω2 t)] kann durch Verwendung der Gleichung cos α + cos β = 2 cos 12 (α + β) cos 12 (α − β) zu E = 2E01 cos 12 [(k1 +k2 ) x − (ω1 +ω2 ) t] × cos 12 [(k1 −k2 ) x − (ω1 −ω2 ) t] umgeschrieben werden. Wir definieren ω und k als die mittlere Kreisfrequenz (Winkelfrequenz) bzw. die mittlere Wellenzahl. Die Größen ωm und km bezeichnen wir als Modulationsfrequenz und Modulationswellenzahl. Entsprechend legen wir fest ω≡

1 (ω1 + ω2 ) 2

ωm ≡

k≡

1 (k1 + k2 ) 2

km ≡

und

1 (ω1 − ω2 ) 2

(7.31)

1 (k1 − k2 ) ; 2

(7.32)

damit ist

  E = 2E01 cos (km x − ωm t) cos kx − ωt .

(7.33)

Man kann die Gesamtwelle als eine propagierende Welle der Frequenz ω mit zeitveränderlicher oder modulierter Amplitude E0 (x, t) betrachten. Es ist dann E(x, t) = E0 (x, t) cos(kx − ωt)

(7.34)

E0 (x, t) = 2E01 cos(km x − ωm t) .

(7.35)

mit

Entsprechend werden k und ω oft als räumliche bzw. zeitliche Trägerfrequenz bezeichnet. In den uns hier interessierenden Anwendungen sind ω1 und ω2 vergleichsweise groß. Sind sie außerdem ungefähr gleich, ω1 ≈ ω2 , so ist ω  ωm . E0 (x, t) verändert

7 Superposition von Wellen

572 λ2

λ1

E1

x

E2 (a) E(x)

x (b) λm =

¯ 2π λ= k

2π km

E0 (x)

x

(c) 2 4E01 2 2E01

λ1 λ2 /(λ2 −λ1 )

E02 (x)

eine Schwebung

x

(d)

Abb. 7.16: Superposition zweier harmonischer Wellen gleicher Amplitude und verschiedener Frequenz: Ein Schwebungsmuster entsteht.

sich dann langsam, E (x, t) dagegen oszilliert schnell (Abb. 7.16). Die Bestrahlungsstärke ist proportional zu 2 cos2 (km x − ωm t) E02 (x, t) = 4E01

oder 2 [1 + cos (2km x − 2ωm t)] . E02 (x, t) = 2E01

E02 (x, t) oszilliert mit einer Frequenz von 2ωm oder (ω1 − ω2 ), der Schwebungsfre2 . Das heißt, E variiert mit der Modulationsfrequenz und quenz, um einen Wert 2E01 0 2 E0 mit der Schwebungsfrequenz, also doppelt so schnell. Auch wenn zwei harmonische Wellen mit unterschiedlicher Amplitude einander überlagern, entstehen Schwebungen. Die Auslöschung ist nun aber nicht mehr vollständig, d. h., der Kontrast ist geringer. Ein entsprechendes Muster und seine Entstehung aus den Zeigern E1 und E2 sehen Sie in Abbildung 7.17. Wie Sie sich erinnern, liefert der resultierende Zeiger E = E0 (x, t) (ϕ) die Amplitude und die relative Phase der zusammengesetzten Störung. In der Abbildung ist E0 (x, t), der Wert der langsam schwingenden Einhüllenden an der Stelle x, über der Zeit aufgetragen. Die momentane Auslenkung der oszillierenden Trägerwelle folgt aus dem resultierenden Zeiger jedoch nicht. Beide Wellen breiten sich in gleicher Richtung aus, und folglich rotieren die zugehörigen Zeiger gleichsinnig – einer mit der Geschwindigkeit ω1 , der andere mit ω2 . Wir könnten nun beide Zeiger mit ihrer jeweiligen Frequenz rotieren lassen, wollen uns die Sache aber ein wenig vereinfachen. Es sei ω1 > ω2 , und wir zeichnen den Zeiger mit der höheren Frequenz (E1 ) an die Spitze des Zeigers mit der niedrigeren Frequenz

7.2 Die Addition von Wellen verschiedener Frequenz

573 (b)

(a) E2 E1 E

E E2 (c)

E E2 E2 E1 E

E1

E2 E

E1

ϕ E1

α

(ω1 − ω2 )t E E2 1 ω1 t ω2 t

E2 E1 E

Abb. 7.17: (a) Schwebung bei der Superposition zweier harmonischer Wellen verschiedener Amplitude und Frequenz. (b) Der Zeiger mit höherer Frequenz, E1 , wird an das Ende von E2 angefügt. (c) Er rotiert mit der Differenzfrequenz.

(E2 ; siehe Abb. 7.17 b. Nun zeichnen wir E2 neu, festgehalten auf der waagerechten Bezugslinie (Nulllinie der Phase). E1 schließt mit der Waagerechten (also E2 ) dann den Winkel α ein (Abb. 7.17 c). Dieser gibt die Phase von E1 bezüglich E2 in jedem Moment an, und E1 rotiert mit der Geschwindigkeit (ω1 − ω2 ) und α = (ω1 − ω2 ) t. Die Amplitude E0 (x, t) der Resultierenden (die Einhüllende des Trägers) oszilliert dann zwischen den Werten (E02 + E01 ) und (E02 − E01 ). Der Winkel ϕ zwischen E und der Waagerechten ist gleich der Phase der Resultierenden bezüglich E2 , er oszilliert allmählich, während sich E1 einmal im Kreis dreht. In Abbildung 7.16 ist E01 = E02 , hier schwingt E0 zwischen 0 und 2E01 . Außerdem ist ϕ = α, und der resultierende Zeiger E, der zur Amplitude der Störung gehört, rotiert mit der Geschwindigkeit ωm = 12 (ω1 − ω2 ). All dies steht im Einklang mit Gleichung (7.33). Schwebungen von Schallwellen beobachtet man häufig; Klavierstimmer gleichen die Tonhöhe schwingender Saiten mithilfe von Schwebungen gegen die Töne von Stimmgabeln ab. Erst 1955 wurde der Effekt (von Forrester, Gudmundsen und Johnson) auch für Lichtwellen beobachtet.2 Mithilfe des Zeeman-Effekts erzeugten die Forscher zwei Wellen mit geringfügig unterschiedlichen Frequenzen. Setzt man die Atome einer Entladungslampe (in diesem Fall handelte es sich um Quecksilber) einem magnetischem Feld aus, so spalten ihre Energieniveaus auf. Dadurch enthält das emittierte Licht zwei Frequenzkomponenten ν1 und ν2 , die sich entsprechend der angelegten Feldstärke mehr oder weniger voneinander unterscheiden. Werden diese Komponenten auf der Oberfläche einer photoelektrischen Röhre wieder zusammengeführt, so entsteht die Schwebungsfrequenz ν1 − ν2 , die im konkreten Fall 1010 Hz betrug. Dies entspricht einem 3-cm-Mikrowellensignal. Der resultierende photoelektrische Strom hatte dieselbe Form wie der Graph von E02 (x) in Abbildung 7.16 d. 2

A. T. Forrester, R. A. Gudmundsen und P. O. Johnson, „Photoelectric Mixing of Incoherent Light“, Phys. Rev. 99 (1955) 1691.

7 Superposition von Wellen

574

Die Erfindung des Lasers hat die Beobachtung von Lichtschwebungen mittlerweile erheblich erleichtert. Selbst eine Schwebungsfrequenz von einigen wenigen Hertz bei einer Grundfrequenz von 1014 Hz wird in einer Photozelle sichbar. Die Beobachtung von Schwebungen ist ein besonders empfindliches und gleichzeitig recht einfaches Mittel zum Nachweis kleiner Frequenzunterschiede. Der Ringlaser (Abschn. 9.8.3), der als Gyroskop arbeitet, misst anhand von Schwebungen Frequenzunterschiede, die durch die Rotation des Systems zustande kommen. Wird Licht an einer bewegten Oberfläche reflektiert, so tritt infolge des Dopplereffekts eine Frequenzverschiebung auf, die man anhand von Schwebungen registrieren kann. Streut man Licht an einem sich bewegenden Testobjekt, das fest, flüssig oder sogar gasförmig sein kann, und bildet die Schwebung der ursprünglichen und reflektierten Wellen, so erhält man ein genaues Maß für die Objektgeschwindigkeit. Im atomaren Maßstab tritt bei Laserlicht durch Wechselwirkung mit Schallwellen, die sich in einem Stoff bewegen, ebenfalls eine Phasenverschiebung auf; dieses Phänomen wird als Brillouin-Streuung bezeichnet. 2ωm ist also ein Maß für die Schallgeschwindigkeit im Medium.

7.2.2 Gruppengeschwindigkeit Die Beziehung zwischen ω und k bestimmt v, die Phasengeschwindigkeit einer Welle. In einem dispersionsfreien Medium – strenggenommen ist das Vakuum die einzige dispersionsfreie Umgebung – ist entsprechend Gleichung (2.33) v = ω/k, und ω, aufgetragen über k, ist eine gerade Linie. Frequenz und Wellenlänge ändern sich so, dass v konstant bleibt. Alle Wellen eines bestimmten Typs (z. B. alle elektromagnetischen Wellen) breiten sich in einem dispersionsfreien Medium mit derselben Phasengeschwindigkeit aus. Die Ausbreitungsgeschwindigkeit in einem dispergierenden Medium hängt dagegen von der Frequenz der Welle ab. Wenn mehrere Wellen einander überlagern, so bewegt sich die einhüllende Modulationskurve der Gesamtwelle mit einer anderen Geschwindigkeit als die einzelnen Wellen. Dies führt uns zum Begriff der Gruppengeschwindigkeit und deren Zusammenhang mit der Phasengeschwindigkeit. Das zugrundeliegende Konzept wurde bereits 1839 von dem bedeutenden irischen Physiker und Mathematiker Sir William Rowan Hamilton vorgelegt, fand aber wenig Beachtung. Stokes griff es 1876 im Zusammenhang mit der Thermodynamik wieder auf. Wenn wir in der Gestalt eines Pulses ein wiederkehrendes Merkmal identifizieren können – etwa die Form der vorderen Kante –, so setzen wir die Geschwindigkeit, mit der sich dieses Merkmal bewegt, der Geschwindigkeit der Wellengruppe insgesamt gleich. Die Welle

  E (x, t) = E0 (x, t) cos kx − ωt ,

[7.34]

die im vorangegangenen Abschnitt untersucht wurde, besteht aus einer hochfrequenten (ω) Trägerwelle, die durch eine Kosinusfunktion amplitudenmoduliert ist. Wir

7.2 Die Addition von Wellen verschiedener Frequenz

575

nehmen zunächst an, dass die Welle in Abbildung 7.16 b nicht moduliert, also E0 konstant ist. Jede kleine Spitze in der Trägerwelle wandert dann mit der gewohnten Phasengeschwindigkeit nach rechts. Es gilt also v=−

(∂ϕ/∂t)x . (∂ϕ/∂x)t

[2.32]

  Laut Gleichung (7.34) ist die Phase durch ϕ = kx − ωt gegeben, und folglich ist v = ω/k .

(7.36)

Diese Phasengeschwindigkeit hängt offenbar nicht davon ab, ob die Trägerwelle moduliert ist; ist sie es, dann verändern die Spitzen ihre Amplituden periodisch, während sie weiterwandern. Daneben interessiert uns auch die Ausbreitung der Modulationseinhüllenden. Wir nehmen an, dass die Wellen E1 (x, t) und E2 (x, t) in Abbildung 7.16 a mit derselben Geschwindigkeit v1 = v2 fortschreiten. Wir stellen uns vor, die beiden harmonischen Funktionen, die verschiedene Wellenlängen und Frequenzen haben, seien auf separate Transparentfolien gezeichnet. Legt man die Folien übereinander, so entsteht ein stehendes Schwebungsbild. Bewegt man beide Folien mit derselben Geschwindigkeit nach rechts, sodass der Eindruck von sich fortpflanzenden Wellen entsteht, dann bewegen sich die Schwebungen offensichtlich mit derselben Geschwindigkeit. Die Geschwindigkeit, mit der die Modulationseinhüllende fortschreitet, nennt man die Gruppengeschwindigkeit vg . Im beschriebenen Fall ist die Gruppengeschwindigkeit gleich der Phasengeschwindigkeit der Trägerwelle (der mittleren Geschwindigkeit ω/k), also vg = v = v1 = v2 . Dies trifft speziell für dispersionsfreie Medien zu, in denen die Phasengeschwindigkeit nicht von der Wellenlänge abhängt, sodass die beiden Wellen dieselbe Geschwindigkeit haben können. Um eine allgemeiner anwendbare Lösung zu finden, wollen wir den Ausdruck für die Modulationseinhüllende untersuchen: E0 (x, t) = 2E01 cos (km x − ωm t) .

[7.35]

Die Geschwindigkeit dieser Welle ist wieder durch Gleichung (2.32) gegeben, wobei wir nun die Trägerwelle vernachlässigen können. Die Modulation schreitet mit einer Geschwindigkeit fort, die von der Phase der Einhüllenden (km − ωm t) abhängt, und so ist ωm vg = km oder ω1 − ω2 Δω . = vg = k1 − k2 Δk Wie Sie sich erinnern, hängt ω in gewöhnlichen Medien von λ oder äquivalent von k ab. Die spezielle Funktion ω = ω (k) nennt man Dispersionsrelation. Ist der

7 Superposition von Wellen

576

Frequenzbereich Δω, dessen Mittelpunkt bei ω liegt, klein, so entspricht Δω/Δk ungefähr der Ableitung der Dispersionsgleichung in ω:   dω (7.37) vg = dk ω (Details siehe Aufgabe 7.37). Die Modulation oder das Signal breitet sich mit der Geschwindigkeit vg aus, die größer, gleich oder kleiner als die Phasengeschwindigkeit v der Trägerwelle sein kann. Die Gruppengeschwindigkeit für Oberflächenwellen in Tiefwasser (siehe Aufgabe 7.29) ist halb so groß wie die Phasengeschwindigkeit, während für Wellen auf einer Saite v = vg gilt. Beispiel 7.2 In der Quantenmechanik repräsentiert die Größe ω = k2 /2m für ein Wellenpaket (wie in Abbildung 7.18) ein freies Teilchen der Masse m. Hierbei ist  das plancksche Wirkungsquantum geteilt durch 2π. Zeigen Sie, dass für die Wellenfunktion eines freien Teilchens die Gruppengeschwindigkeit (die der klassischen Teilchengeschwindigkeit entspricht) doppelt so groß ist wie die Phasengeschwindigkeit. Lösung Mit ω = k 2 /2m erhalten wir für die Phasengeschwindigkeit k2 k ω = = . k k2m 2m Im Gegensatz dazu ist die Gruppengeschwindigkeit des Wellenpakets v=

vg =

2k k dω = = dk 2m m

und somit vg = 2v . Im Übrigen ist k = 2π/λ, p = h/λ und k = 2πp/h = p/. Mit E = p2 /2m erhalten wir für die Phasengeschwindigkeit v des Pakets  E k = . v= 2m 2m Dagegen folgt die klassische Geschwindigkeit, vc , aus der Tatsache, dass alle Energie des Teilchens kinetische Energie ist; es gilt also E = 12 mvc2 und  E = 2v . vc = 2m Somit ist vc = vg .

7.2 Die Addition von Wellen verschiedener Frequenz

577

vg (¯ ω)

v(¯ ω)

Abb. 7.18: Wellenpuls in einem dispergierenden Medium. Hier gilt v > vg , und neue Elementarwellen treten an der Rückseite (links) in den sich bewegenden Puls ein. Wenn v kleiner wäre als vg , würden neue Elementarwellen auf die Front des Pulses treffen (rechts).

Streng genommen ist jede reale Welle räumlich begrenzt: Sie wird zu einer bestimmten Zeit angeschaltet (oder empfangen) und höchstwahrscheinlich zu einem bestimmten späteren Zeitpunkt wieder abgeschaltet. Reale Wellen sind deshalb Pulse, die allerdings ziemlich lang sein können. Wie wir weiter hinten in diesem Kapitel noch besprechen werden, entspricht jeder derartige Puls einer Superposition sehr vieler Sinuswellen (so genannter Fourier-Komponenten) verschiedener Frequenz, jeweils mit spezifischer Amplitude und Phase. Anstelle der beiden beitragenden Wellen in Abbildung 7.16 müssen Sie sich also mehr als tausend Wellen vorstellen. Wenn die Sinusfunktionen einander überall auslöschen, außer in einem begrenzten Gebiet, wo sie (zumindest fast) phasengleich schwingen – was durchaus möglich ist –, so ähnelt die resultierende Störung einem lokalisierten Puls, der oft auch treffend als Wellenpaket bezeichnet wird (Abb. 7.18). An dieser Stelle bietet es sich an, noch einmal über die Gruppengeschwindigkeit nachzudenken. Gleichung (7.37) ist für jede Gruppe sinusförmiger Wellen mehr oder weniger erfüllt, vorausgesetzt der Bereich Δk ihrer k-Werte ist hinreichend klein. Wie wir sehen werden, bedeutet ein schmaler Bereich von k (oder äquivalent von λ), dass der Puls räumlich weit ausgedehnt ist. Umgekehrt setzt sich ein räumlich scharfer Puls aus sehr vielen Sinuskomponenten zusammen, deren Wertebereich von k entsprechend groß ist. Da in einem dispergierenden Medium

7 Superposition von Wellen

578

die Phasengeschwindigkeit jeder Komponente von deren Wellenlänge abhängt, ändert ein solcher Puls während der Fortpflanzung seine Gestalt, weshalb die experimentelle Arbeit mit vg in diesem Fall wenig präzise Ergebnisse liefert.

Absorptionsbande n(v) v v0

Abb. 7.19: Typische Darstellung der Frequenzabhängigkeit des Brechungsindex in der Umgebung einer Atomresonanz. Eingezeichnet ist auch die Absorptionskurve, deren Mitte bei der Resonanzfrequenz liegt.

Wie Sie sich erinnern werden, sieht die Kurve für n (ν), aufgetragen über ν, für ein typisches Medium in unmittelbarer Umgebung einer Resonanz (ν0 ) ähnlich aus wie Abbildung 7.19. Strahlungsenergie, deren Frequenz im mittleren Bereich der Kurve (bei negativer Steigung) liegt, wird intensiv absorbiert; dies ist die Absorptionsbande. Auf beiden Seiten der Kurve nimmt n (ν) mit ν zu, dort findet die normale Dispersion statt. Innerhalb der Absorptionsbande, wo n (ν) mit steigendem ν abnimmt, spricht man von anomaler Dispersion. (a)

(b) ω

ω

ω ¯

vg (¯ ω) ¯ (¯ ω , k)

ω) vg (¯ v(¯ ω)

v(¯ ω)

0

¯ (¯ ω , k)

ω ¯

¯ k

k

0

¯ k

k

Abb. 7.20: Diagramm der Dispersionsrelation. (a) Bei normaler Dispersion ist v (ω) > vg (ω), (b) bei anomaler Dispersion ist vg (ω) > v (ω). Die Phasengeschwindigkeit v einer Welle beliebiger Frequenz ω ist gleich der Steigung der Linie, die den Ursprung mit diesem Punkt verbindet. Die Gruppengeschwindigkeit entspricht der Steigung der Tangente im Punkt (ω, k), wobei ω die mittlere Frequenz der Wellen dieser Gruppe ist.

Ein Diagramm der Dispersionsgleichung (Abb. 7.20) zeigt eine durch den Ursprung verlaufende Kurve, die bei normaler Dispersion nach oben konvex, bei anormaler Dis-

7.2 Die Addition von Wellen verschiedener Frequenz

579

persion konkav gekrümmt ist. In beiden Fällen ist die Steigung einer Geraden vom Ursprung aus durch einen beliebigen Punkt (ω, k) der Kurve gleich der Phasengeschwindigkeit bei dieser Frequenz. Analog entspricht die Steigung im Punkt (ω, k) der Gruppengeschwindigkeit für einen Frequenzbereich um ω, (dω/dk)ω . Bei normaler Dispersion haben Sinuswellen hoher Frequenz (zum Beispiel blaues Licht) größere Brechungsindizes und breiten sich langsamer aus als Wellen niedrigerer Frequenz (zum Beispiel rotes Licht). Außerdem ist die Steigung der Dispersionskurve (vg ) immer kleiner als die Steigung der Geraden (v); es ist also vg < v. Dagegen ist bei anormaler Dispersion stets vg > v.

Eine Sequenz von Aufnahmen (Reihenfolge von links nach rechts) eines Wellenpakets, das sich nach oben fortpflanzt. Die Pfeile markieren die Positionen des Scheitels, der sich schneller bewegt als das Paket und schließlich an seiner vorderen Flanke verschwindet (oben rechts). Diese Art von normaler Dispersion entspricht v > vg . (B. Ströbel, „Demonstration and study of the dispersion of water waves with a computer-controlled ripple tank“, Am. J. Phys. 79 (6), 581–590, 2011, American Association of Physics Teachers)

Wegen ω = kv führt Gleichung (7.37) zu vg = v + k

dv . dk

(7.38)

Es folgt, dass in dispersionsfreien Medien, in denen v nicht von λ abhängt, dv/dk = 0 und vg = v ist. Speziell im Vakuum ist ω = kc, v = c und vg = c. Alle realen Medien sind mehr oder weniger dispergierend (v1 = v2 , wie in Abb. 7.21). Bei bekanntem n (k) ist ω = kc/n, und es ist zweckmäßig, vg wie folgt umzuformen: kc dn c − 2 n n dk oder   k dn . vg = v 1 − n dk vg =

(7.39)

7 Superposition von Wellen

580

Für optische Medien nimmt der Brechungsindex in Bereichen normaler Dispersion mit der Frequenz zu (dn/dk > 0), und folglich ist vg < v. Es ist nun sinnvoll, einen Gruppenbrechungsindex ng ≡ c/vg

(7.40)

einzuführen, der sorgfältig von n unterschieden werden muss. A. A. Michelson maß 1885 den Wert von ng in Schwefelkohlenstoff (CS2 ) unter Verwendung von weißen Lichtimpulsen. Er kam auf einen Wert von 1,758 im Vergleich zu n = 1,635.

(a)

(b) t = t1 v1 (t2 −t1 ) v2 (t2 −t1 ) vg (t2 −t1 )

(c)

(d) t = t2

Abb. 7.21: Gruppen- und Phasengeschwindigkeit. In (a) treffen die Wellen am Punkt ⊗ zusammen. In (b) liegt in diesem Punkt das Maximum der modulierten Welle. In (c) unterscheiden sich die Ausbreitungsgeschwindigkeiten der Wellen, und die beiden ursprünglichen Maxima (markiert durch  und ×) laufen auseinander. Ein anderes Paar trifft nun in (d) zusammen und bildet das Maximum der modulierten Welle, welches sich demzufolge mit einer anderen Geschwindigkeit fortbewegt. Hier ist v1 > v2 > vg , und wegen λ1 > λ2 handelt es sich um normale Dispersion.

7.2 Die Addition von Wellen verschiedener Frequenz

581

Beispiel 7.3 Betrachten Sie das 1885 von Michelson durchgeführte Experiment, bei dem die Standardwellenlängen λF = 486,1 nm und λD = 589,2 nm verwendet wurden. Die zugehörigen Brechungsindizes sind nF = 1,652 und nD = 1,628. Bestimmen Sie unter Verwendung der Ergebnisse aus Aufgabe 7.36 die Gruppengeschwindigkeit im Medium (CS2 ) und vergleichen Sie diese mit dem Mittelwert der Phasengeschwindigkeit. Lösung Gemäß Aufgabe 7.36 ist λc dn c + 2 , n n dλ was wir etwas komfortabler in der Form   λ dn c 1+ vg = n n dλ vg =

schreiben wollen. Die Definition von vg verlangt, dass dies bei ω ausgewertet werden muss; also schreiben wir diesen Ausdruck um in   c λ Δn 1+ . vg = n n Δλ Die Mittelwerte sind dabei nF + nD λF + λD und . n= λ= 2 2 Einsetzen der Werte ergibt   537,65 × 10−9 Δn 2,998 × 108 1+ . vg = 1,640 1,640 Δλ Geben Sie hier besonders Acht! Wir haben es mit einer Situation zu tun, in der normale Dispersion vorliegt, d. h., es gilt Δn/Δλ < 0, der Brechungsindex nimmt ab, wenn λ größer wird. Es folgt vg = 1,8280 × 108 [1 + (3,2784 × 10−7 )(−2,3278 × 105 )] = 1,8280 × 108 (0,92369) = 1,688 × 108 m/s . Die mittlere Phasengeschwindigkeit ist v=

2,998 × 108 c = = 1,828 × 108 m/s . n 1,640

Es gilt also v > vg , wie es sein sollte.

7 Superposition von Wellen

582

Kehren wir noch einmal zurück zu Abbildung 7.18. Hier ist das Medium normal dispergierend, und die Phasengeschwindigkeit entspricht der Geschwindigkeit der Trägerwelle, also der nahezu sinusförmigen Welle mit der Frequenz ω. Weil die Berge der Trägerwelle schneller laufen als der Impuls insgesamt, scheinen die Maxima am linken Rand zu entstehen, durch den Impuls hindurchzulaufen und am rechten Rand wieder zu verschwinden. Obwohl sich die Höhe jedes Wellenbergs des Trägers beim Durchlaufen des Impulses verändert, bewegen sich alle Wellenberge mit der Geschwindigkeit v (ω), welche deshalb auch die Geschwindigkeit der konstanten Phase ist. Im Gegensatz dazu breitet sich die Modulationskurve mit der Geschwindigkeit vg (ω) = (dω/dk)ω aus, was in diesem speziellen Beispiel v (ω) /4 ist. Jeder Punkt der Modulationskurve (zum Beispiel das Maximum in der Mitte des Impulses) bewegt sich mit vg (ω), der Geschwindigkeit der konstanten Amplitude. Beispiel 7.4 Die Geschwindigkeit, mit der die kurzwelligen Rippel sich auf einer Wasseroberfläche fortpflanzen, ist   2πγ 1/2 . v= λρ Dabei ist γ die Oberflächenspannung und ρ die Dichte von Wasser. Bestimmen Sie die zugehörige Gruppengeschwindigkeit. Lösung Laut Definition ist vg =

d(2πν) dν dω = = . dk d(2π/λ) d(1/λ)

Dabei ist v = νλ = (2πγ/λρ)1/2 und         2πγ 1/2 1 3/2 2πγ 1/2 1 = ν= λρ λ ρ λ      1/2 2πγ 1/2 3 1 dν = d(1/λ) ρ 2 λ   3 2πγ 1/2 3 vg = = v. 2 λρ 2

7.2 Die Addition von Wellen verschiedener Frequenz

583

Alternativ folgt aus Gleichung (7.38)   dv d kγ 1/2 =v+k vg = v + k dk dk ρ  1/2  1/2 kγ γ d 1/2 k = +k ρ ρ dk  1/2  1/2 kγ γ 1 −1/2 k = +k ρ ρ 2    1/2 kγ 1 kγ 1/2 = + ρ 2 ρ  1/2 3 kγ = . 2 ρ Alternativ ist:  1/2 ω kγ = v= ρ k  1/2  1/2 kγ 3/2 γ =k ω=k ρ ρ  1/2 3 dω 3 γ = k1/2 vg = = v. dk 2 ρ 2

Wie in Aufgabe 7.33 gezeigt wird, gilt ng = n − λ

dn . dλ

In einem dispersiven Medium ist n eine Funktion von λ, und somit ist auch ng eine Funktion von λ. Außerdem gilt, wie in Abbildung 3.42 gezeigt ist, in Gebieten mit normaler Dispersion dn/dλ < 1 und wir können erwarten, dass für gewöhnliche optische Medien ng > n gilt. In Abbildung 7.22 ist beispielsweise die Wellenlängenabhängigkeit von n und ng für geschmolzenes Silikatglas (reines SiO2 ) gezeigt, wobei der Wellenlängenbereich von 500 nm (Mitte des sichtbaren Bereichs) bis 1900 nm (Infrarot) reicht. Die Tatsache, dass ng in einem breiten Bereich um 1300 nm nahezu horizontal verläuft, ist für die moderne Kommunikationstechnik von großer Bedeutung, denn dieser Verlauf bedeutet, dass es nur eine geringe Dispersion gibt, die Signale stören kann, wenn 1300 nm als Trägerfrequenz für das Versenden von Datenpulsen durch lange Glasfaserkabel verwendet wird.

7 Superposition von Wellen

584 1.49

Brechungsindex

1.48 1.47 ng 1.46 1.45

n

1.44 500 700 900 1100 1300 1500 1700 1900 Nah-Infrarot Wellenlänge (nm)

7.3

Abb. 7.22: Die Kurven zeigen den Phasenbrechungsindex (n) und den Gruppenbrechungsindex (ng ) für geschmolzenes Silikatglas (SiO2 ). Der Wendepunkt von n liegt bei 1312 nm, während ng dort sein Minimum hat.

Anharmonische periodische Wellen

Wie wir bereits – ohne Beweis – erwähnt haben, kann jede reale Welle im Raum aus geeignet gewählten harmonischen Wellen – d. h. Wellen mit den richtigen räumlichen Frequenzen, Amplituden und relativen Phasen – zusammengesetzt werden. Die Methode, die dabei angewendet wird, ist die Fourier-Analyse, die eines der wichtigsten Hilfsmittel überhaupt in der theoretischen Physik ist. Dieser Abschnitt zeigt, wie die Analyse praktisch durchgeführt wird. Wir werden dabei allerdings etwas unkonventionell vorgehen und zwei komplementäre Ansätze verfolgen. Da der übliche mathematische Zugang etwas undurchsichtig ist, beginnen wir mit einem intuitiveren, grafischen Ansatz, bei dem deutlich wird, was hinter all der Mathematik steckt. Anwendbar sind die hier dargelegten Methoden sowohl für räumliche Phänomene (d. h. solche, die in einem räumlich ausgedehnten Gebiet die ganze Zeit über existieren, wie beispielsweise Wellen auf einem Seil) als auch für zeitliche Vorgänge (bei denen an einem bestimmten Punkt im Raum eine Größe zeitlich variiert, etwa ein Wechselstrom). Im Folgenden wird angenommen, dass wir es mit realen Phänomen zu tun haben, die sich durch gutartige mathematische Funktionen beschreiben lassen.

7.3.1 Fourierreihen Die Form einer Welle im Raum (ihr Profil) oder der zeitliche Verlauf eines Signals wird oft als Wellenform bezeichnet. Weiter vorn in diesem Kapitel haben wir gesehen, dass die Addition verschiedener harmonischer Wellenformen der gleichen Frequenz eine weitere Wellenform ergibt, die wiederum die gleiche Frequenz hat. Diese Beobachtung lässt sich verallgemeinern: Ungeachtet der Amplituden und relativen Phasen ergibt die Superposition einer beliebigen Anzahl von harmonischen Wellenformen der gleichen Frequenz eine harmonische Wellenform von eben dieser Frequenz. Dagegen führt die Addition von Wellenformen mit unterschiedlichen Frequenzen (Abb. 7.23) zu einer anharmonischen Wellenform (d. h. einer, die nicht sinusförmig ist).

7.3 Anharmonische periodische Wellen

585

Abbildung 7.23 vermittelt den Eindruck, durch die geeignete Superposition sinusförmiger Funktionen mit passenden Amplituden, Wellenlängen und relativen Phasen könne man jede Wellenform erhalten. Die Wellenlängen λ1 und λ2 der Sinuskomponenten in dieser Abbildung sind verschieden; nach einem Zyklus sind die Wellen außer Phase. Sind jedoch N1 Zyklen für die eine Welle vergangen und N2 für die andere, sodass λ1 N1 = λ2 N2 ist, so schwingen die Wellen wieder phasengleich. Die Resultierende wiederholt sich nun ständig, das bedeutet, die zusammengesetzte Funktion ist periodisch mit einer räumlichen Periode λ. l E2 E E1

l1 l2

E = E1 + E2

Abb. 7.23: Superposition zweier harmonischer Wellen mit verschiedenen Frequenzen. Die resultierende Welle ist periodisch, aber nicht harmonisch.

Wenn verschiedene harmonische Wellenformen addiert werden, ohne weiter auf die Wellenlänge zu achten (Abb. 7.24), kann es sein, dass sich die Periodizität der Resultierenden erst nach einer großen Zahl von Perioden ihrer Bestandteile einstellt. Wenn wir dagegen mit der längsten Wellenform beginnen, die die Wellenlänge λ hat, und dann Wellenformen mit den Wellenlängen λ/2, λ/3, λ/4 usw. addieren, dann wird die Resultierende ebenfalls eine Wellenlänge oder räumliche Periode von λ haben. Das liegt daran, dass jede der beitragenden Wellenformen mit kürzeren Wellenlängen gerade so lang ist, das ein ganzzahliges Vielfaches von ihr exakt in die fundamentale Wellenlänge λ hineinpasst. Das ist es, was in Abbildung 7.25 a im zeitlichen Bereich passiert. Beachten Sie, dass die Wellenformen hier der Anschaulichkeit wegen an unterschiedlichen Punkten ihrer jeweiligen Zyklen starten; mit anderen Worten, sie haben unterschiedliche Phasen. Die Amplitude jeder einzelnen Wellenform ist durch einen vertikalen Strich dargestellt (links), und in Abbildung 7.25 c sind all diese Striche (Amplituden) über den zugehörigen Frequenzen aufgetragen. Diese Strichanordnung ist nur ein erster Schritt, und wir werden in Kürze einen informativere Form der Darstellung einführen. Jedenfalls sagt uns ein solcher Graph, der Frequenzspektrum genannt wird, wie viel von jeder Sinusform (einer gegebenen Frequenz) addiert werden muss, um die in Abbildung 7.25 b gezeigte resultierende Welle zu erzeugen. Angenommen, wir wollen eine periodische Wellenform f (x), die die räumliche Periode λ hat, aus harmonischen Bestandteilen zusammensetzen. Die obige Diskussion

7 Superposition von Wellen

586 (a) 10 5

c1

0 –5

c2 c3

–10 –10

–5

0 x

5

10

–5

0 x

5

10

(b) 10 5 0 –5 –10 –10

(c) 10

f(x)

5 0 –5 –10 –10

–5

0 x

5

10

Abb. 7.24: Summe aus drei Sinuskurven gleicher Amplitude: ψ1 (x) = 3 sin πx, ψ2 (x) = 3 sin πx/4 und ψ3 (x) = 3 sin πx/3. Hier ist λ1 = 2, λ2 = 8 λ3 = 6.

legt nahe, dass es eine gute Idee ist, mit einer Sinus- oder Kosinusfunktion zu beginnen, die ebenfalls die Wellenlänge λ hat, und dann harmonische Terme zu addieren, deren Argumente ganzzahlige Brüche von λ enthalten. Die in Abbildung 7.24 gezeigte Wellenform, die eine Summe von lauter Sinus- und Kosinusfunktionen ist, schwankt um die x-Achse und liegt dabei anscheinend genauso oft darüber wie darunter. Natürlich könnte die resultierende Funktion ein Stück angehoben oder gesenkt werden, indem man einfach eine positive oder negative Konstante addiert, wie es in Abbildung 7.26 getan wurde. Dort entspricht die horizontale Linie

7.3 Anharmonische periodische Wellen

587

(a) Harmonische Wellen v1

v2

v3 v4 v5 v6 λ

(c)

Amplitude

(b)

v1

v2

v3

v4 v5 Frequenz

Abb. 7.25: (a) Superposition von sechs harmonischen Wellen mit verschiedenen Amplituden und Frequenzen. (b) Resultierende periodische Funktion. (c) Frequenzspektrum.

v6

in der Höhe A0 /2 über der x-Achse einer solchen Konstante, die in diesem Fall gleich 1,0 ist. Warum diese Konstante als A0 /2 geschrieben ist, werden wir gleich erklären. Da dieser Beitrag nicht mit irgendeiner Frequenz assoziiert ist, wird er oft als Gleichstromterm bezeichnet. Wir werden seine physikalische Bedeutung in der Optik später erklären. (a)

f (x)

l x l

(b)

2 A02 = 1 0 –1 –2

l

l2

l

3l2

2l

x

Abb. 7.26: Zerlegung einer periodischen Funktion f (x) in ihre harmonischen FourierKomponenten. Hier ist f (x) = 1 + sin kx − 13 cos 2kx − 14 sin 2kx − 15 sin 3kx.

Ein außerordentlich schöner mathematischer Formalismus für die Analyse periodischer Funktionen wurde von dem französischen Physiker Jean Baptiste Joseph Baron

7 Superposition von Wellen

588

de Fourier (1768–1830) entwickelt. Das Herzstück dieser Theorie ist das FourierTheorem: Eine Funktion f (x) mit einer räumlichen Periode λ lässt sich aus harmonischen Funktionen zusammensetzen, deren Wellenlängen ganzzahlige Bruchteile von λ sind (λ, λ/2, λ/3 usw.). In dieser Form lautet die Fourier-Reihe     2π 2π x + ε1 + C2 cos x + ε2 + . . . (7.41) f (x) = C0 + C1 cos λ λ/2 mit den Konstanten Cn , wobei f (x) natürlich auch einer wandernden Welle der Form f (x − vt) entsprechen könnte. Um ein Gefühl für diese Methode zu bekommen, führe man sich vor Augen, dass C0 allein die Originalfunktion offensichtlich nur sehr unvollkommen repräsentiert, aber mit f (x) zumindest an den wenigen Schnittpunkten beider Kurven übereinstimmt. Nun verbessert man die Funktion durch Addition des nächsten Terms ein wenig, da [C0 + C1 cos (2πx/λ + ε1 )] so gewählt wird, dass sich mehr Schnittpunkte mit f (x) ergeben. Besteht die zusammengesetzte Funktion auf der rechten Seite von Gl. (7.41) aus unendlich vielen Termen, die so ausgewählt wurden, dass sie die anharmonische Funktion in einer unendlichen Anzahl von Punkten schneiden, dann wird die Reihe offenbar identisch mit f (x). Es ist gewöhnlich zweckmäßiger, Gleichung (7.41) unter Benutzung der trigonometrischen Gleichung Cm cos (mkx + εm ) = Am cos mkx + Bm sin mkx umzuformulieren, wobei k = 2π/λ, λ die Wellenlänge von f (x), Am = Cm cos εm und Bm = −Cm sin εm ist. Es ergibt sich f (x) =

∞ ∞   A0 + Am cos mkx + Bm sin mkx . 2 m=1 m=1

(7.42)

Der erste Term wurde als A0 /2 geschrieben, denn daraus ergibt sich, wie wir noch sehen werden, eine mathematische Vereinfachung. Diese Gleichung besagt, dass eine periodische Wellenform f (x) aus einer unendlichen Anzahl von Termen gemäß f (x) =

A0 + A1 cos 1kx + A2 cos 2kx + A3 cos 3kx + . . . 2 + B1 sin 1kx + B2 sin 2kx + B3 sin 3kx

zusammengesetzt werden kann. Nun gilt es nur noch herauszufinden, wie man die Koeffizienten Am und Bm berechnet. Klar ist, dass die rechte Seite der obigen Gleichung als Ganzes gleich der linken Seite sein muss. Das bedeutet, dass die Fläche unter dem Graph der Funktion f (x) (in einem bestimmten Intervall der Länge λ) gleich der Summe der verschiedenen Flächen unter den einzelnen Termen (wieder

7.3 Anharmonische periodische Wellen

589

im gleichen Intervall berechnet) sein muss. Sobald wir ein paar Details geklärt haben, werden wir aus dieser Beobachtung eine Methode ableiten, mit der wir den Wert von A0 bestimmen könenn. Wenn wir von der „Fläche unter einer Kurve“ sprechen, dann meinen wir damit die Fläche, die innerhalb eines vorgegbenen Intervalls zwischen der Kurve und der horizontalen Achse, hier also der x-Achse, eingeschlossen ist. Die Flächensegmente oberhalb der x-Achse sind positiv, die darunter liegenden Flächen sind negativ, und die Gesamtfläche ist die Differenz (der Absolutwerte). Für den Moment wollen wir den Gleichstromterm weglassen und die Flächen unter den einzelnen harmonischen Termen auf der rechten Seite der obigen Gleichung herausfinden. In einem Intervall λ liegt für jeden dieser Beiträge eine ganze Zahl von Perioden, sodass jeder Beitrag symmetrisch hinsichtlich der Flächenanteile über und unter der x-Achse ist. Der Nettobeitrag zur Gesamtfläche ist daher für jeden der Beiträge A1 cos 1kx, A2 cos 2kx usw. null, und das Gleiche gilt für die Beiträge B1 sin 1kx, B2 sin 2kx usw. Der einzige Beitrag auf der rechten Seite, der etwas zur Fläche über ein Intervall λ beiträgt, ist daher A0 /2. Mit anderen Worten, die Fläche unter f (x) ist halb so groß wie die Fläche unter der Konstante A0 . Der Flächeninhalt des Rechtecks mit der Höhe A0 und der Länge λ ist gleich A0 × λ. Somit ist 12 A0 λ gleich der Fläche unter f (x), d. h., es gilt 2 × Fläche unterf (x) . λ Später werden wir einen ordentlichen Integralausdruck anstelle von „Fläche unter f (x)“ aufschreiben, doch für den Moment soll diese informelle Schreibweise genügen. A0 =

Einen ähnlichen Ansatz können wir verwenden, um die anderen Koeffizienten Am und Bm zu bestimmen. Stellen wir uns also eine periodische Funktion f (x) und ihre verschiedenen Fourier-Komponenten vor, wie sie in Abbildung 7.27 schematisch dargestellt sind. Um A1 zu finden, benutzen wir einen Ansatz, bei dem für jeden Term auf der rechten Seite das Produkt mit cos kx gebildet wird. Dann bestimmen wir die Fläche unter diesem Produkt, und zwar berechnet über eine Periode von f (x), welche die Länge λ hat. Das Produkt von 12 A0 und cos kx ist offensichtlich 12 A0 cos kx, und die Fläche unter dieser Kurve ist null, d. h., dieser Term trägt nichts bei. Der zweite Term, A1 cos 1kx, ist von besonderem Interesse, und wir werden ihn noch genauer betrachten, nachdem wir mit dem Überblick über die Methode fertig sind. Um cos kx und beispielsweise sin 2kx numerisch zu multiplizieren, unterteilen wir die Graphen der beiden Funktionen durch vertikale Linien in gleich große Intervalle (siehe Abb. 7.28). Dann multiplizieren wir die zusammengehörigen Paare von Werten, bei denen diese Linien die beiden Kurven schneiden: 1,00 × 0, 0,966 × 0,500, 0,866×0,866, 0,707×1,00 usw. Eine Zeichung der resultierenden Zahlen (Abb. 7.28 c) offenbart den Zweck dieser Übung. Stellen Sie sich das gesamte Diagramm eingeteilt in vier Segmente mit einer Breite von jeweils 14 λ vor (gekennzeichnet durch

7 Superposition von Wellen

590 f (x)

x l

A02 0 A1 0 B1 0 A2 0 B2 0

A3 0 B3 0

x A1 cos kx x B1 sin kx x A2 cos 2kx x B2 sin 2kx x A3 cos 3kx x B3 sin 3kx x

Abb. 7.27: Fourier-Zerlegung der periodischen, anharmonischen Funktion f (x). Die räumliche Periode oder Wellenlänge von f (x) ist λ.

gestrichelte Linien). Die Produktkurve hat zwei positive und zwei identische negative Peaks, sodass die Fläche unter der gesamten Kurve null ist. Die Symmetrie ist so, dass für jedes 14 λ-Segment, für das die Multiplikation von cos kx mit dem entsprechenden Segment von sin 2kx eine positive Fläche ergibt, ein anderes, passendes Segment eine gleich große negative Fläche liefert. Und dies gilt unabhängig von der räumlichen Frequenz der Funktionen, solange sie nicht gleich sind. Somit ist die Fläche unter (cos kx)(A2 cos 2kx) null, ebenso wie die Flächen unter (cos kx)(A3 cos 3kx), (cos kx)(B1 sin 1kx), (cos kx)(B2 sin 2kx), (cos kx)(B3 sin 3kx) usw. alle null sind. Kommen wir nun wie angekündigt zu dem Term A1 cos kx, der anders ist als die anderen, denn wenn wir ihn mit (cos kx) multiplizieren, erhalten wir A1 cos2 kx. Abbildung 7.29 a zeigt den Graph von A1 cos2 kx über eine Periode der Länge λ. Um die Fläche unter dieser Kurve zu bestimmen, analysieren wir Abbildung 7.29 b: Hier wurde die zweite Hälfte in zwei Teile geschnitten, die anschließend um 180◦ gedreht

1

0.966

7.3 Anharmonische periodische Wellen 0.866

591

cos kx

0.707 0.5

x

0 –0.5

0.866

1

(a)

–0.866

0.866

sin 2kx

0.50

0

x 0.866

0.75

0.866

(b)

0.43

(cos kx)(sin 2kx)

0.48

0

l

x (c)

Abb. 7.28: Das Produkt zweier harmonischer Funktionen, cos kx und sin 2kx.

wurden, und dann wurde das Ganze nach links verschoben, sodass die Teile genau in das Tal der ersten Hälfte passen. Die Fläche des resultierenden Rechtecks der Höhe A1 und der Länge 12 λ ist einfach 12 A1 λ. Die Fläche unter f (x) cos kx ist also 12 A1 λ und wir erhalten 2 A1 = × Fläche unterf (x) cos kx , λ berechnet über eine räumliche Periode von f (x). (a)

A1 cos2 kx

A1

x

0 l (b) A1

1

2

2

x

1 0

l2

Abb. 7.29: Die Fläche unter der Kurve A1 cos2 kx über ein Intervall der Länge λ ist gleich A1 λ/2.

7 Superposition von Wellen

592

Für eine gegebene Wellenform f (x), die wir in Fourier-Komponenten zerlegen wollen, finden wir den Koeffizienten A1 , indem wir die Fläche unter f (x) cos kx über eine räumliche Periode λ berechnen und das Ergebnis durch 12 λ teilen. Auf die gleiche Weise erhalten wir A2 =

2 × Fläche unterf (x) cos 2kx , λ

berechnet über eine räumliche Periode von f (x). Allgemein gilt für m = 0, 1, 2, 3, . . . Am =

2 × Fläche unterf (x) cos mkx . λ

Dieser Ausdruck gilt auch für A0 , was der Grund dafür war, die durch (7.42) definierte Reihe mit A0 /2 zu beginnen. A0 ist daher der nullte Amplitudenkoeffizient, und A0 /2 ist der Gleichstromterm in der Reihe. Wenn wir die gesamte Prozedur noch einmal durchlaufen, um den Koeffizienten B1 zu berechnen, wobei wir diesmal mit sin 1kx multiplizieren, dann erhalten wir ein ganz ähnliches Ergebnis: B1 =

2 × Fläche unterf (x) sin kx , λ

berechnet über eine räumliche Periode von f (x). Allgemein gilt für m = 0, 1, 2, 3, . . . Bm =

2 × Fläche unterf (x) sin mkx . λ

Sehr oft liegt f (x) nicht in Form einer Funktion vor, sondern als Sammlung von Datenpunkten (siehe Abschn. 7.4.4). Die Prozedur der numerischen Bestimmung der Koeffizienten Am und Bm mithilfe des soeben dargelegten Schemas wird diskrete Fourier-Analyse genannt, und sie wird gewöhnlich mithilfe des Computers ausgeführt. Wenn allerdings ein analytischer Ausdruck für f (x) gegeben ist, dann ist es am einfachsten, die benötigten Flächeninhalte durch Integration auszurechnen. Was nun folgt, ist die Entsprechung von dem, was wir bereits grafisch skizziert haben, doch wir wollen die Analyse nun tatsächlich mithilfe von gutartigen Funktionen und Integralen ausführen. Das Ziel ist das gleiche, nämlich die Bestimmung der Koeffizienten Am und Bm . Zu diesem Zweck integrieren wir beide Seiten von Gleichung (7.42) über ein räumliches Intervall λ, das beispielsweise von 0 bis λ, von −λ/2 bis +λ/2 oder allgemeiner von x bis x + λ reicht. Da über jedes derartige Intervall ˆ λ ˆ λ sin mkx dx = cos mkx dx = 0 0

0

7.3 Anharmonische periodische Wellen

593

ist, gibt es nur einen Term, der ungleich null ist und entwickelt wird, nämlich ˆ λ ˆ λ A0 λ dx = A0 , f (x)dx = 2 2 0 0 und daher ist 2 A0 = λ

ˆ

λ

f (x)dx .

(7.43)

0

Um Am und Bm zu finden, nutzen wir die Orthogonalität von Sinusfunktionen aus (Aufgabe 7.43), nämlich ˆ λ sin akx cos bkx dx = 0 (7.44) 0 ˆ λ λ cos akx cos bkx dx = δab (7.45) 2 0 ˆ λ λ sin akx sin bkx dx = δab , (7.46) 2 0 wobei a und b positive Zahlen ungleich null sind. Das so genannte Kronecker-Symbol δab ist eine Kurzschreibweise für eine Zahl, die gleich null ist, wenn a = b, und gleich 1, wenn a = b ist. Um Am zu bestimmen, multiplizieren wir beide Seiten der Gleichung (7.42) mit cos kx ( ist eine positive ganze Zahl) und integrieren dann über eine räumliche Periode. Nur ein Term verschwindet nicht, nämlich derjenige Beitrag in der zweiten Summe, der  = m entspricht. Für diesen Fall erhalten wir ˆ λ ˆ λ λ f (x) cos mkx dx = Am cos2 mkx dx = Am 2 0 0 und somit Am =

2 λ

ˆ

λ

f (x) cos mkx dx .

(7.47)

0

Diesen Ausdruck können wir benutzen, um die Am für alle Werte von m einschließlich m = 0 zu entwickeln, wie wir durch Vergleich der Gleichungen (7.43) und (7.47) erkennen. In gleicher Weise führt die Multiplikation der Gleichung (7.42) mit sin kx und anschließende Integration zu ˆ 2 λ f (x) sin mkx dx . (7.48) Bm = λ 0 Damit können wir eine periodische Funktion f (x) als eine Fourier-Reihe f (x) =

∞ ∞   A0 + Am cos mkx + Bm sin mkx 2 m=1 m=1

[7.42]

594

7 Superposition von Wellen

aufschreiben, wobei die Koeffizienten aus den Gleichungen ˆ 2 λ f (x) cos mkx dx Am = λ 0 und ˆ 2 λ f (x) sin mkx dx Bm = λ 0

[7.47]

[7.48]

berechnet werden können, wenn f (x) bekannt ist. Nicht vergessen dürfen wir einige mathematische Details wie die Konvergenz der Reihe und die Anzahl der Singularitäten von f (x), doch wollen wir uns hier nicht näher damit beschäftigen. Bestimmte Symmetriebedingungen können den Rechenweg abkürzen. Wenn eine Funktion f (x) gerade ist, also wenn f (−x) = f (x) gilt, oder, gleichbedeutend, wenn sie symmetrisch um x = 0 verläuft, enthält ihre Fourier-Reihe nur Kosinusterme (Bm = 0 für alle m), welche selbst gerade Funktionen sind. In gleicher Weise enthalten die Reihenentwicklungen ungerader Funktionen, bei denen f (−x) = −f (x) ist, nur Sinusfunktionen (Am = 0 für alle m). In beiden Fällen kann man sich die Berechnung einer der beiden Koeffizientenreihen sparen. Dies ist besonders hilfreich, wenn man den Nullpunkt so wählen kann, dass sich die Rechnung entsprechend vereinfacht. Allerdings müssen wir bedenken, dass viele gewöhnliche Funktionen (zum Beispiel ex ) weder ungerade noch gerade sind. Die „gezackte“ Sägezahnfunktion mit der Wellenlänge λ, die in Abbildung 7.30 gezeichnet ist, ist eine ungerade Funktion: Ihr Wert in einem bestimmten Abstand links vom Ursprung entspricht stets dem Negativen ihres Wertes im gleichen Abstand rechts vom Ursprung. Sie kann deshalb ausschließlich aus Sinusfunktionen zusammengesetzt werden. Außerdem sind die harmonischen Komponenten alle phasengleich und im Ursprung gleich null. Warum das so ist, wird anhand von Abbildung 7.31 deutlich. Hier können Sie sehen, wie die sinusförmigen Elementarwellen, die alle bei null starten, sich hinter dem Ursprung zunächst aufsummieren, weiter rechts dann phasenverschoben abfallen, noch weiter rechts beginnen, sich gegenseitig auszulöschen, und bei λ/2 schließlich alle wieder null sind (dies entspricht der ersten gestrichelten Linie in Abb. 7.30). Hinter diesem Punkt sehen die Kurven aus, als wären sie horizontal (an der Achse) und vertikal (an der senkrecht durch den Punkt gehenden Geraden) gespiegelt – diese Symmetrie hat auch die resultierende Kurve, die nun im negativen Bereich verläuft. Beachten Sie, dass die kleinste Komponente der Zerlegung sechs mal in das Intervall der Länge λ passt und dass es sechs kleine Dellen auf der Flanke des aus sechs Termen zusammengesetzten Sägezahns gibt. Dies legt die Vermutung nahe, dass die zusammengesetzte Funktion durch Hinzufügen von immer mehr Termen von immer höherer Frequenz, kürzeren Wellenlängen und

7.3 Anharmonische periodische Wellen

595

(a)

(b) Harmonische Wellen

1.

2. 3.

(c)

Amplitude

4. 5. 6.

Frequenz

Abb. 7.30: (a) Näherung einer Sägezahnfunktion. Normalerweise setzt man eine solche Funktion aus Tausenden von Sinuskomponenten zusammen, wodurch sie gerade Kanten erhält, die in scharfen Spitzen zusammenlaufen. (b) Aus diesen sechs harmonischen Wellen mit verschiedenen Amplituden und Frequenzen setzt sich die etwas krakelige Sägezahnfunktion in (a) zusammen. (c) Zugehöriges Frequenzspektrum.

kleineren Amplituden mehr und mehr geglättet wird. Dies ist in Abbildung 7.32 illustriert, wo es anfangs 3, dann 7, dann 11 und schließlich 100 Terme gibt. Die Spitzen im letzten Teil der Abbildung sind ein Artefakt der Prozedur, das als gibbsches Phänomen bezeichnet wird.

Abb. 7.31: Zusammensetzung einer Sägezahnkurve aus ihren Komponenten.

7 Superposition von Wellen

596

(a)

(b)

(c)

(d)

Abb. 7.32: Fourier-Reihen für eine Sägezahnkurve; (a) drei Terme, (b) sieben Terme, (c) elf Terme, (d) hundert Terme.

Beispiel 7.5 Berechnen Sie die Fourier-Reihe für die in Abb. 7.33 gezeigte Rechteckwelle. Lösung Wir wählen den Nullpunkt wie in Abbildung 7.33, und so gilt $ +1 wenn 0 < x < λ/2 f (x) = −1 wenn λ/2 < x < λ Da f (x) ungerade ist, ist Am = 0, während ˆ ˆ 2 λ/2 2 λ (+1) sin mkx dx + (−1) sin mkx dx Bm = λ 0 λ λ/2 ist, und daher wird Bm =

1 1 λ/2 [− cos mkx]0 + [cos mkx]λλ/2 . mπ mπ

2 (1 − cos mπ). Die Fourier-Koeffizienten Mit k = 2π/λ ergibt sich Bm = mπ sind deshalb 4 4 4 , B4 = 0, B5 = ,... , B1 = , B2 = 0, B3 = π 3π 5π und die gesuchte Reihe ist einfach   1 1 4 sin kx + sin 3kx + sin 5kx + . . . . (7.49) f (x) = π 3 5

7.3 Anharmonische periodische Wellen kp +

597

π L

+1

−λ

−λ/2

λ/2

0

λ

−1

x

Abb. 7.33: Eine periodische Rechteckwelle.

Abbildung 7.34 ist ein Diagramm einiger Teilsummen der Reihe, wobei die Zahl der Terme zunimmt. Wir könnten nun das zeitliche Verhalten untersuchen, um f (t) zu bestimmen, indem wir lediglich kx in ωt umwandeln. Wir betrachten dazu drei elektronische Oszillatoren mit sinusförmiger Ausgangsspannung sowie regelbarer Frequenz und Amplitude. Schaltet man diese Oszillatoren in Reihe, so addieren sich die zeitabhängigen Spannungen (mit den Frequenzen ω, 3ω und 5ω). Das Resultat kann man mit einem Oszillographen sichtbar machen, wobei sich eine Kurve wie beispielsweise in Abbildung 7.34 d ergibt. Ähnlich kann man auf einem entsprechend gestimmten Klavier gleichzeitig drei Tasten mit jeweils der richtigen Kraft anschlagen, um einen Akkord oder eine zusammengesetzte Schallwelle zu erzeugen, deren Form Abbildung 7.34 c entspricht. Erstaunlicherweise kann das menschliche Hörsystem (Ohr und Gehirn) eine einfache zusammengesetzte Welle in ihre harmonischen Bestandteile zerlegen, also eine Fourier-Analyse vornehmen. Vermutlich gibt es Menschen, die sogar jede Note des Akkords nennen könnten. Bisher haben wir jede detaillierte Betrachtung anharmonischer periodischer Funktionen aufgeschoben und unsere Analyse auf rein sinusförmige Wellen beschränkt. Jetzt ist auch klar, warum: Wir können uns anharmonische Schwingungen nun als Superposition harmonischer Einzelschwingungen verschiedener Frequenz vorstellen, die getrennt voneinander analysiert werden können. Entsprechend dürfen wir für jede derartige anharmonische periodische Welle in der Form f (x ± vt) =

∞ ∞  A0  + Am cos mk (x ± vt) + Bm sin mk (x ± vt) 2 m=1 m=1

(7.50) schreiben, oder äquivalent f (x ± vt) =

∞ 

Cm cos [mk (x ± vt) + εm ] .

(7.51)

m=1

Als letztes Beispiel wollen wir nun die Rechteckwelle in Abbildung 7.35 in ihre Fourier-Komponenten zerlegen. Wir stellen fest, dass die Funktion mit dem dargestellten

7 Superposition von Wellen

598

1

0

(a)

(b)

(c)

Abb. 7.34: Synthese einer periodischen Rechteckwelle. Beachten Sie, dass alle Teilwellen in Phase sind und den Wert null haben, wenn die Rechteckwelle null ist. Da alle Sinuswellen bei x = 0 in Phase sind, werden alle Koeffizienten Bm positiv. (Foto E. H.)

Nullpunkt gerade ist und alle Bm -Terme verschwinden. Die entsprechenden FourierKoeffizienten (Aufgabe 7.44) sind dann   4 4 sin m2π/a und Am = . (7.52) A0 = a a m2π/a Übrigens, wäre der Puls ein Rechteck mit der Höhe h anstatt ein Quadrat mit der Kantenlänge 1, dann müssten alle Koeffizienten in Gleichung (7.52) mit h multipliziert werden. Anders als bei der vorherigen Funktion ist A0 jetzt verschieden von null, weil die Kurve vollständig oberhalb der Achse liegt.

7.3 Anharmonische periodische Wellen (a)

599

f(x)

1

–l/a

0

l/a

x

l f(x)

ein Kosinusterm zwei Kosinusterme drei Kosinusterme 1 Gleichstromterm 2 a

(b)

–l/a

0

l/a

x

Abb. 7.35: Eine ungerade, periodische, anharmonische Funktion. In Teil (b) ist die Fläche unter dem Puls 2λ/a · 1 und A0 = 2/λ · 2λ/a = 4/a. Der Gleichstromterm in der Fourier-Reihe ist A0 /2 = 2/a.

Der bereits untersuchte Ausdruck (sin u) /u (Abschn. 3.3.1) wird auch als sinc u bezeichnet. Da der Grenzwert von sinc u für u → 0 gleich 1 ist, kann Am alle Koeffizienten darstellen, wenn wir m = 0, 1, 2, . . . setzen. Beachten Sie, dass einige der Koeffizienten Am negativ werden, weil die sinc-Funktion auch negative Werte annimmt. Das bedeutet, dass einige der Kosinusfunktionen höherer Ordnung gegenüber der Schwingung mit m = 1 um 180◦ phasenverschoben sind. Ein negatives Am im Frequenzspektrum sagt uns also, dass der zugehörige Kosinusterm beim Addieren an der x-Achse gespiegelt werden muss. Wir werden darauf in Kürze zurückkommen. Die Funktionen in den Abbildungen 7.33 und 7.35 haben die gleiche Gestalt, abgesehen von drei Details: der Lage der Achse x = 0, der Lage der Achse f (x) = 0 und der Höhe der Stufen. Daraus folgt, dass (mit Ausnahme von A0 ) die harmonischen Teilterme bezüglich beider f (x) in gleicher Weise aufgetragen werden können. Anders ausgedrückt: Wenn wir die Achse x = 0 von ihrer Position in Abbildung 7.33 zur Position in Abbildung 7.35 verschieben, wandeln sich die Sinusfunktionen der Reihe in Kosinusfunktionen um, doch ansonsten bleiben die harmonischen Teilfunktionen unverändert; die Sinuskurven, die den Rechteckimpuls in Abbildung 7.34 bilden, entsprechen gerade den Kosinuskurven, die den Impuls in Abbildung 7.35 b bilden. Befindet sich die senkrechte Achse in der Mitte des Rechteckimpulses, so folgt aus Abbildung 7.35 b, dass jede zweite Kosinusfunktion bei x = 0 negativ sein muss.

7 Superposition von Wellen

600

Die Breite eines Rechteckimpulses, 2 (λ/a), kann in Abhängigkeit von a ein beliebiger Bruchteil der Gesamtwellenlänge sein. Die Fourier-Reihe ist dann ∞ 2  4 sinc m2π/a cos mkx . f (x) = + a a

(7.53)

m=1

Denselben Ausdruck erhalten wir, wenn wir die zugehörige Zeitfunktion mit einer Breite des Rechteckmaximums von 2 (τ /a) ansetzen; kx wird dann einfach durch ωt ersetzt. Hier ist ω die Kreisfrequenz der periodischen Funktion f (t), die Grundschwingung. Sie hat die niedrigste Frequenz und entsteht bei m = 1. Frequenzen von 2ω, 3ω, 4ω, . . . nennt man Oberschwingungen (oder Harmonische) der Grundschwingung, und sie sind mit m = 2, 3, 4 usw. verknüpft. In gleicher Weise ist κ ≡ 1/λ die Raumfrequenz, da λ die räumliche Periode ist, und k = 2πκ nennt man die Wellenzahl. Wieder spricht man bei 2k, 3k, 4k usw. von Oberschwingungen (oder Harmonischen) der Wellenzahl, wobei hier die räumlichen Veränderungen gemeint sind. Offensichtlich ist die Dimension von κ Schwingungen pro Längeneinheit (zum Beispiel Schwingungen pro mm oder einfach cm−1 ), während diejenige von k Radianten pro Längeneinheit ist. Bevor wir fortfahren, sollten wir ein häufiges Missverständnis bezüglich der Verwendung der Begriffe Raumfrequenz und räumliche Periode klären. Abbildung 7.35 a zeigt eine eindimensionale periodische Rechteckfunktion, die sich entlang der x-Achse im Raum ausbreitet. Dies könnte ein Muster sein, das man auf einem Oszillographen sieht, oder eine (zugegebenermaßen ungewöhnliche) Welle auf einem straff gespannten Seil. In allen Fällen wiederholt sich das Muster über eine bestimmte Distanz – dies ist die Wellenlänge, und der Kehrwert der Wellenlänge ist die Raumfrequenz. Nehmen wir nun an, das Muster entspreche einer Bestrahlungsstärkenverteilung aus hellen und dunklen Streifen. Diese Art von Muster kann man beispielsweise sehen, wenn man durch einen schmalen horizontalen Spalt auf einen Lattenzaun blickt, oder (noch besser) wenn man seine Augen über eine Linie wandern lässt, welche quer über eine monochromatisch beleuchtete Anordnung abwechselnd durchsichtiger und undurchsichtiger Bänder läuft (Abb. 13.30). Wieder hat das Muster eine räumliche Periode und eine Raumfrequenz, welche durch die Geschwindigkeit der Wiederholung im Raum bestimmt ist. Das Licht selbst hat jedoch unabhängig davon ebenfalls eine Raumfrequenz κ, eine Wellenlänge λ, eine zeitliche Frequenz und Periode. Das Muster könnte eine Wellenlänge λ von 20 cm, das Licht, welches das Muster erzeugt, hingegen eine Wellenlänge λ von 500 nm haben. Hier liegt die Ursache möglicher Missverständnisse. Wir werden deshalb das Symbol k ab sofort für die Lichtwelle selbst und k für die Beschreibung räumlicher Muster verwenden. Diese Unterscheidung wird in späteren Kapiteln wichtig werden.

7.3 Anharmonische periodische Wellen

601

Wir kehren nun zu der Rechteckfunktion in Abbildung 7.35 zurück und setzen a = 4. Mit anderen Worten, wir stellen die Breite des Rechteckmaximums auf λ/2 ein. In diesem Fall wird   1 1 1 2 cos kx − cos 3kx + cos 5kx − . . . . (7.54) f (x) = + 2 π 3 5 Kann die Funktion f (x) in einer grafischen Darstellung durch eine horizontale Linie in gleich geformte Abschnitte oberhalb und unterhalb der Linie geteilt werden, so besteht die Fourier-Reihe lediglich aus ungeraden Oberschwingungen. Anhand von Abbildung 7.34 können Sie erkennen, warum das so ist. Dort enthält jede Halbperiode der rechteckigen Wellenform von jedem ungeraden harmonischen Beitrag eine ungerade Anzahl von halben Wellenlängen. Das bedeutet, dass die Fläche unter der Produktkurve [hier f (x) sin mkx] verschieden von null sein muss und alle ungeraden Harmonischen von null verschiedene Koeffizienten haben. Wenn dagegen das Argument einer gegebenen Komponente ein geradzahliges Vielfaches von kx ist, dann gibt es ein geradzahliges Vielfaches von Wellenlängen dieser Harmonischen innerhalb des Intervalls λ. Das heißt, eine gerade Anzahl dieser harmonischen Wellenformen passt genau in eine Halbperiode von f (x). Wenn die zusammengesetzte Funktion so verschoben werden kann (durch einen Gleichstromterm), dass sie symmetrisch bezüglich der horizontalen Achse ist, dann wird die Produktfläche [f (x) sin mkx oder f (x) cos mkx] für m = 2, 4, 6, . . . über ein Intervall λ null, und die zugehörigen Koeffizienten Am oder Bm sind null (siehe z. B. die Dreiecksfunktion in Aufgabe 7.45). Abbildung 7.36 zeigt einen Rechteckpuls mit a = 4, der durch die Reihe (7.54) beschrieben wird. Dabei ist A0 = 1 und der Gleichstromterm ist A0 /2. Entsprechend fehlen alle Terme mit geradem m. Gleichung (7.53) für die Fourier-Koeffizienten enthält die Größe sinc m2π/a, und daher ist die gestrichelte Kurve, welche die Einhüllende der Am -Koeffizienten darstellt, eine sinc-Funktion. Wir haben in Kapitel 3 gesehen, dass sinc u für u = π, 2π, 3π usw. null ist. Für a = 4 wird der Term m2π/a zu mπ/2, und für m = 2, 4, 6 . . . ist sinc null, die gestrichelte Kurve schneidet die Achse, und die zugehörigen Am -Koeffizienten fehlen wieder in der Reihe. Die Kurve für die Teilsumme der Terme bei m = 9 gleicht der Rechteckwelle annähernd. Je schmaler das Maximum dagegen wird, umso mehr Terme werden benötigt, um dieselbe Ähnlichkeit mit f (x) zu erreichen. Dies kann man sich durch Untersuchung des Quotienten sin m2π/a Am = A1 m sin 2π/a bewusst machen.

(7.55)

7 Superposition von Wellen

602 f (x) a=4 l = 1 cm

Fourier-Koeffizienten

1

1 A0 1 2

0

–l / 4 0 l /4 –1 / 4 0 1/ 4 A1

l 1 (cm)

x

l k = 2p

A2 A3 0 k 2k 3k 4k 5k 0 2p 4p 6p 8p 10p

mk 8k 16p

10k 20p

Abb. 7.36: Eine periodische, rechteckige Wellenform und ihr räumliches Frequenzspektrum. Hier ist λ, die räumliche Periode, gleich 1,0 cm, und jeder Puls ist eine halbe Wellenlänge breit. Gezeigt sind nur zwei der unendlich vielen Peaks.

Wir stellen fest, dass für a = 4 der neunte Term (m = 9) recht klein ist: A9 ≈ 10% von A1 . Für ein hundert Mal schmaleres Maximum (a = 400) ist A9 ≈ 99% von A1 . Wird das Maximum schmaler, so treten Oberschwingungen höherer Ordnung mit ihrerseits kleineren Wellenlängen auf. Wir sehen, dass weniger die Gesamtzahl der Terme von Bedeutung ist als die relative Größe der kleinsten wiedergegebenen Strukturen sowie die verfügbaren zugehörigen Wellenlängen.2 Enthält die Form feine Details, dann muss die Reihe vergleichsweise kurzwellige Terme (oder, in der Zeitdomäne, Terme mit kurzer Periode) enthalten. Die negativen Am in Gleichung (7.53) sollte man sich einfach als Amplituden jener harmonischen Beiträge vorstellen, deren Phasen im Vergleich zu den positiven Termen um 180◦ verschoben sind. Die Äquivalenz einer negativen Amplitude mit einer Phasenverschiebung von π geht aus der Beziehung Am cos (kx + π) = −Am cos kx hervor. Um zu sehen, wie das alles zusammenwirkt, untersuchen wir die Funktion in Abbildung 7.37, wobei nun a = 8 gilt, die Höhe des Peaks aber unverändert bleibt, weil die räumliche Periode von 1 cm auf 2 cm verdoppelt wird. Die Funktion ist noch immer gerade, und daher gibt es wie zuvor nur Am -Terme in der Reihe. Dennoch hat sich das Frequenzspektrum in mehreren Aspekten verändert. Anders als in Abbildung 7.36, wo A2 , A4 und A6 null waren, kann die Wellenform jetzt nicht mehr einfach angehoben oder abgesenkt werden, um sie symmetrisch bezüglich der Achse zu machen; folglich enthält die zusammengesetzte Funktion sowohl Komponenten mit geradem als auch mit ungeradem m. Der Abstand zwischen aufeinanderfolgenden Am -Termen ist k, was 2π/λ ist, und da sich λ verdoppelt hat, hat sich dieser Abstand halbiert; es sind nun mehr Kosinusbeiträge enger zusammengequetscht. 2

Ein Haus kann man nicht aus Steinen bauen, die fast so groß sind wie das Haus selbst werden soll.

7.4 Nichtperiodische Wellen

603 a=8 l = 2 cm

f (x)

Fourier-Koeffizienten

1

1 2 1 4

2p l

A0

–l/8 0 l/8 –1/ 4 0 1 / 4

A2

l 2 (cm) l

A4 A6 A8 0 k 3k 8k 0 2k 4k 6k 0 2p 4p 6p 8p

x

k=p mk

12p

16p

20p

Abb. 7.37: Eine periodische, rechteckige Wellenform und ihr räumliches Frequenzspektrum. Hier ist λ, die räumliche Periode, gleich 2,0 cm, und jeder Puls ist eine viertel Wellenlänge breit. Gezeigt sind nur zwei der unendlich vielen Peaks.

7.4

Nichtperiodische Wellen

Alle realen Wellen sind Pulse (d. h. endliche Wellenzüge, wenn auch manchmal ziemlich lange), weshalb es wichtig ist, nichtperiodische Funktionen analysieren zu können. Derartige Funktionen kommen in der Physik oft vor, neben der Optik besonders auch in der Quantenmechanik. Wir haben bereits gesehen, wie durch Addition zweier Sinuswellen Schwebungen entstehen: Die Funktionen geraten außer Phase, die Hüllkurve durchläuft ein Minimum; die Phasendifferenz der Funktionen wird wieder kleiner und verschwindet schließlich, dort durchläuft die Hüllkurve ein Maximum (Abb. 7.16). Nun ist zu vermuten, dass der räumliche Abstand, bis die Phasengleichheit wieder erreicht ist und ein Maximum der Hüllkurve auftritt, umso größer ist, je mehr Frequenzkomponenten vorhanden sind (Abb. 7.38). Mit anderen Worten: Die Anzahl beteiligter Komponenten beeinflusst den Abstand der Maxima. Wie Sie sich erinnern werden, schwingt die Trägerwelle im Schwebungsmuster mit der mittleren Frequenz. (Wir nennen sie kM , da sie, wie sich gleich zeigen wird, der Frequenz der Maxima entspricht.) Fügen wir also symmetrisch um kM Sinusfunktionen hinzu, so sollte sich die Frequenz der Trägerwelle nicht ändern (siehe Abb. 7.38 b und Aufgabe 7.21). Wenn wir jetzt aus harmonischen Komponenten einen einzelnen Puls erzeugen wollen (Abb. 7.38 e, so müssen wir exakt bestimmen, welche und wie viele Frequenzkomponenten hinzuzunehmen sind. Bisher haben wir einen eleganten mathematischen Formalismus entwickelt, mit dem wir Wellenformen, ausgedrückt durch Frequenzen, gewinnen können; doch haben wir uns dabei noch nicht mit Anwendungen befasst. Daher wollen wir an dieser Stelle die Gelegenheit für einen kurzen Abstecher in die moderne optische Technologie nutzen. Zu den wichtigsten neuen Methoden gehört der optische Frequenzkamm, eine Messtechnik mit einer Vielzahl von Anwendungsgebieten. Diese reichen von ultrasensitiven chemischen Detektoren, über Glasfaserkommunikation und Lidar-Systemen (von engl. light detecting and ranging) bis hin zu einer neuen Generation von Atomuhren. Ein Frequenzkamm besteht aus einigen zehn- oder sogar hunderttausend äquidistanten,

7 Superposition von Wellen

604

f (x)

Amplitude

(a)

x

kp

k

f (x)

Amplitude

(b)

x

kp

k

f (x)

Amplitude

(c)

x

kp

k

f (x)

Amplitude

(d)

x

kp

k

f (x)

Amplitude

(e)

x

kp

k

Abb. 7.38: Wir beginnen hier mit einer einzigen Sinusfunktion mit der Raumfrequenz kM (der Trägerfrequenz). Die Hinzunahme zweier weiterer Komponenten symmetrisch zu kM verändert die Trägerfrequenz (die mittlere Frequenz) nicht, erzeugt aber Schwebungen. Addiert man paarweise immer mehr Sinusfunktionen, so rücken die Pulse auseinander, ohne dabei ihre Form zu ändern. Das ist konsistent mit der Tatsache, dass man sich den Puls mit zunehmenden λ als immer feiner werdendes Detail der gesamten Wellenform vorstellen kann. Wie wir in Abbildung 7.44 sehen werden, sind die Hüllkurven der Pulse Gaußfunktionen, wenn die Amplituden der beteiligten Funktionen gaußförmige Hüllkurven bilden.

dicht benachbarten zeitlichen „Frequenzzinken“, die den sichtbaren Bereich des Spektrums aufspannen (was durch den räumlichen Frequenzkamm in Abb. 7.38 d illustriert

7.4 Nichtperiodische Wellen

605

wird). Diese „Frequenzzinken“ können wie die Striche auf einem Lineal verwendet werden, was den Frequenzkamm zu einem Werkzeug zur Frequenzmessung macht. Dabei sind weit höhere Frequenzbereiche zugänglich als bei jeder anderen Methode, und gleichzeitig wird eine außergewöhnliche Genauigkeit erzielt. Abbildung 7.39 ist das zeitliche Äquivalent zu Abbildung 7.38: Die Wellenform in Abbildung 7.38 d existiert im Raum, und das Spektrum zeigt die räumlichen Frequenzen. Die Wellenform in Abbildung 7.39 d existiert dagegen in der Zeit, und das Spektrum (Abb. 7.39 b) zeigt die zeitlichen Frequenzen. Ein kurzer Puls von beispielsweise 10 Femtosekunden (10 × 10−15 s) Dauer wäre im Vakuum nur etwa 3 × 10−6 m lang. Mit einer Trägerwellenlänge am Ende des sichtbaren Spektrums umfasst jeder Puls nur einige wenige Oszillationen der Trägerwelle (Abb. 7.39 a). Beachten Sie, dass – wie auch in Abbildung 7.38 – der zentrale Peak des Kamms dem Mittelwert der Trägerfrequenz entspricht. Die Breite der Einhüllenden des Kamms ist umgekehrt proportional zur Dauer jedes Wellenpakets, das vom Laser emittiert wird. (a)

E(t) t t

(b)

violett

blau

grün

gelb

rot

1 t

n

Abb. 7.39: (a) Ein Strom aus Femtosekunden-Wellenpaketen, von denen jedes eine gaußsche Einhüllende hat, entspricht einem Frequenzspektrum (b) in Form eines Kamms, der eine gaußsche Einhüllende hat.

Um einen solchen Frequenzkamm praktisch zu realisieren, wird eine Reihe von äquidistanten, identischen, sehr kurzen Signalen erzeugt. Das ideale Instrument hierfür ist ein modengekoppelter Laser mit einer sehr regelmäßigen Wiederholrate, typischerweise von 109 Hz. Die zeitliche Periode τ des Pulses (nicht die Periode der Trägerwelle) ist die Zeit zwischen zwei Signalfolgen (d. h., es gibt eine Signalfolge pro Periode), und sie ist konstant. Wie auch in dem räumlichen Fall, der in Abbildung 7.37 dargestellt ist, skaliert der Abstand zwischen aufeinanderfolgenden zeitlichen „Frequenzzinken“ in Abbildung 7.39 b wie 1/τ , was der Kehrwert der Zeit zwischen zwei Pulsen ist. Wenn der Laser alle N Nanosekunden einen Puls ausstößt, haben die Zinken des Kamms jeweils einen Abstand von 1/N GHz. Je kürzer die Signalfolge relativ zu τ ist, umso mehr Zinken hat der Kamm. Mit einer Wiederholrate von 1 GHz hat ein Kamm, der den ca. 380 × 1012 Hz breiten sichtbaren Bereich aufspannt (siehe Tab. 3.4), etwa 380 × 1012 Frequenzzinken. Ein stabiler Laser ist in der Lage, einen Kamm zu erzeugen, dessen Zinken sehr nahe beieinander liegen. Heute ist der am besten für diese Aufgabe geeignete Laser der Titan:Saphir-Laser.

7 Superposition von Wellen

606

Die meisten Materialien haben einen Brechungsindex, der nur schwach von der Bestrahlungsstärke abhängt (Abschn. 13.4). Dies ermöglicht einen Mechanismus, der Selbstphasenmodulation genannt wird. Wenn der Ausstoß eines Titan:SaphirLasers durch ein geeignet dickes Stück eines transparentes Materials wie Quarzglas geht, dann verbreitert die Selbstphasenmodulation die Frequenzeinhüllende ohne die Kammstruktur zu beeinflussen. Das Ziel ist es, die Einhüllende so zu verbreitern, dass sie den sichtbaren Bereich aufspannt. Was auch immer der Effekt eines Mediums auf einen einzelnen Puls ist, dieser Effekt wird bei jedem anderen, identischen Puls der gleiche sein. Daher erhält man aus einer periodischen Folge von Pulsen einen Frequenzkamm. Dies alles lässt sich recht effizient durchführen, indem man den Nahinfrarotstrahl eines Lasers durch eine lange mikrostrukturierte Faser (auch photonischer Kristall genannt) gehen lässt, die die erforderliche hohe Bestrahlungsstärke über eine lange Strecke aufrechterhalten und somit das Spektrum effektiver verbreitern kann.3 Im Jahr 2005 wurden John Hall und Theodor Hänsch „für ihre Beiträge zur Entwicklung der laserbasierten Präzisionsspektroskopie einschließlich der Methode des optischen Frequenzkamms“ mit dem Nobelpreis für Physik geehrt.

7.4.1 Fourier-Integrale Wir kehren zu Abbildung 7.35 zurück und stellen uns vor, dass die Breite des Rechteckmaximums konstant bleibt, während λ unbegrenzt wächst. Wenn λ gegen unendlich geht, ist die resultierende Funktion nicht mehr periodisch. Wir haben dann einen einzelnen Rechteckimpuls, und die benachbarten Maxima haben sich ins Unendliche verschoben. Dies legt einen möglichen Weg der Verallgemeinerung der Methode der Fourier-Reihe auf nichtperiodische Funktionen nahe. Um einen hinreichend großen Abschnitt der Funktion in Abbildung 7.35 zu betrachten, setzen wir zunächst a = 4. Für λ können wir einen beliebigen Wert wählen, zum Beispiel λ = 1 cm, passend zu Abbildung 7.36. Der Peak hat dann eine Breite von 12 cm, d. h. 2 (λ/a), und ist in x = 0 zentriert (Abb. 7.40 a). Die Bedeutung jeder einzelnen Oberschwingung mk kann man durch Untersuchung des Wertes der entsprechenden Fourier-Koeffizienten, in diesem Fall Am , verstehen. Man kann sich die Koeffizienten als Wichtungsfaktoren vorstellen, die einzelne Oberschwingungen in geeigneter Weise hervorheben. In Abbildung 7.40 a wurden für die Rechteckwelle mehrere Werte von Am (mit m = 0, 1, 2, . . . ) über mk aufgetragen; eine solche Kurve nennt man räumliches Frequenzspektrum. Wir können Am als eine Funktion A (mk) auffassen, die nur bei Werten von m = 0, 1, 2, . . . ungleich null sein darf. Setzt man nun a = 8 und vergrößert λ auf 2 cm, so bleibt die Breite des Maximums gleich. Die einzige Veränderung ist eine Verdoppelung des Abstandes zwischen den Maxima. Man kann jedoch eine äußerst interessante 3

S. Cundiff, J. Ye, and J. Hall, „Rulers of light“, Sci. Am. 298, 74 (2008).

7.4 Nichtperiodische Wellen

607

Veränderung im Raumspektrum in Abbildung 7.40 b feststellen: Die Dichte der Komponenten längs der mk-Achse ist merklich angewachsen; trotzdem ist A (mk) immer noch null, wenn mk = 4π, 8π, 12π, . . . ist. Da aber nun k statt 2π den Wert π hat, gibt es zwischen diesen Nullpunkten weitere Terme. Schließlich setzen wir a = 16 und vergrößern λ auf 4 cm. Wieder sind die einzelnen Maxima in der Form unverändert, doch die Terme des Raumfrequenzspektrums sind nun noch dichter gepackt. Dies bewirkt, dass der Impuls verglichen mit λ immer kleiner wird, wodurch man höhere Frequenzen zu seiner Zusammensetzung benötigt.

Fourier-Koeffizienten

f (x) a=4 λ = 1 cm

1

A0

1 2

A1

λ 1 (cm) k = 2π

A2 A3

0 0 0

(a)

−λ/4 0 λ/4 −1/4 0 1/4

mk

k 2k 3k 4k 5k 2π 4π 6π 8π 10π

8k 16π

10k 20π

Fourier-Koeffizienten

f (x)

a=8 λ = 2 cm

−λ/8 0 λ/8 −1/4 0 1/4

1 2

x

λ 2(cm)

1 4

k=π mk 0 k 2k3k4k5k 10k 0 2π 4π 6π 8π 10π 12π

16π

20π

(b)

Fourier-Koeffizienten

f (x)

1 4

x

−λ/16 0 λ/16 −1/4 0 1/4

4(cm) λ

1 8

k = π/2 k 3k5k 0 2k4k 8k 0 π 2π 4π

(c)

a = 16 λ = 4 cm

mk 8π

12π

16π

20π

Abb. 7.40: Der Rechteckpuls als Grenzfall. Dargestellt ist eine periodische Wellenform mit nur zwei ihrer Peaks. Die negativen Koeffizienten entsprechen einer Phasenverschiebung von π rad. Wenn immer mehr Frequenzterme hinzugefügt werden, verschieben sich die Maxima auf beiden Seiten des Maximums im Ursprung nach außen im Richtung unendlich (±∞). Liegt schließlich eine kontinuierliche Verteilung von Frequenzkomponenten vor, entsteht nur noch ein einziger Rechteckpuls im Ursprung.

7 Superposition von Wellen

608

In Abbildung 7.40 a ist A2 = 0, und in Abbildung 7.40 b ist die sinc-Funktion an der gleichen Stelle null, doch es ist hier der Koeffizient A4 , der null ist, ebenso wie A8 in Abbildung 7.40 c null ist. Um uns davon zu überzeugen, dass es diese Terme mit Amplitude null geben muss, betrachten wir noch einmal die Beziehung 2 × λ

Am =

Fläche unter f (x) cos mkx .

Hierbei ist f (x) entweder 1 oder 0, d. h., Am entspricht der Fläche des Segments von cos mkx unter dem Peak. Der Gleichstromterm in der Reihe ist 12 A0 , wobei A0 = (2/λ) [Fläche unter f (x)]. Er ist für jede Wellenform in Abbildung 7.40 verschieden, und zwar umso kleiner, je kleiner der Peak relativ zu λ wird. In Abbildung 7.40 c beispielsweise, wo die Fläche (1 cm)( 12 cm) ist, wird A0 für λ = 4 gleich 14 . Abbildung 7.41 zeigt eine Sequenz von Überlappungen des Rechteck-Peaks und einige Kosinusfunktionen: cos 1kx, cos 3kx und cos 8kx. Die schattierten Flächen [die Flächen unter f (x) cos mkx] werden mit zunehmendem m kleiner, und folglich werden auch die Koeffizienten A1 , A2 , A3 , . . . kleiner. Die Komponente cos 4kx hat eine Wellenlänge von 1 cm (d. h. 14 λ) und eine Halbperiode von ihr passt exakt in den Rechteck-Peak. Die Beiträge von Termen für höhere m sind negativ mit zunehmendem Betrag. Für m = 8 passt ein ganzes cos 8kx-Profil genau in den Peak (eine Hälfte oberhalb und eine unterhalb der Achse), sodass die Überlappungsfläche null ist – das ist der Grund für das Fehlen des A8 -Terms in Abbildung 40 c. Immer, wenn die sinc-Funktion für einen Wert von m null ist, gibt es eine ganze Reihe von cos mkxWellenformen, die den Peak aufspannen. Die Einhüllende der Kurve, die in Abbildung 7.40 a kaum sichtbar ist, kann man in Abbildung 7.40 c gut erkennen. Tatsächlich ist die Einhüllende bis auf einen Maßstabsfaktor in jedem Fall identisch: Sie ist nur durch die Form des ursprünglichen f (x) 1 m=1 (a)

cos kx 0

m=3 (b)

l = 4 cm cos 3kx x

0

m=8 (c)

x

1 cm 2

cos 8kx 0

x

Abb. 7.41: Das schattierte Gebiet ist die Fläche unter dem Produkt f (x) × cos mkx. Wenn wir diese Fläche mit 2λ multiplizieren, erhalten wir die Werte von Am . Wie Sie sehen, ist die Produktfläche für m = 8 null (denn die eine Hälfte liegt über und die andere unter der Achse), und es gilt A8 = 0.

7.4 Nichtperiodische Wellen

609

Signals bestimmt. Die Schlussfolgerung lautet: Wenn λ zunimmt und die Funktion einem einzelnen Rechteckimpuls immer ähnlicher wird, nimmt der Abstand zwischen den einzelnen A(mk)-Beiträgen im Spektrum ab. Die diskreten Spektrallinien gehen bei abnehmenden Amplituden allmählich ineinander über, bis sie einzeln nicht mehr auflösbar sind. Mit anderen Worten: Geht λ gegen ∞, so rücken die Spektrallinien infinitesimal eng zusammen. Wird k extrem klein, muss m folglich äußerst groß werden, wenn mk überhaupt einen nennenswerten Betrag haben soll. Wir ersetzen nun die Bezeichnung der Oberschwingung mk einer Wellenzahl k durch km . Zwar sind die km -Werte diskret, aber im Grenzfall wird km zu k, also zu einer kontinuierlichen Verteilung. Die Funktion A (km ) wird im Grenzfall zur Einhüllenden (Abb. 7.40). Es ist dann nicht mehr sinnvoll, von der Grundfrequenz und ihren Oberschwingungen zu sprechen. Der zusammengesetzte Impuls f (x) hat keine erkennbare Grundfrequenz. Ein Integral ist definitionsgemäß der Grenzwert einer Summe, wobei die Anzahl der Elemente gegen unendlich und die Größe dieser Elemente gegen null geht. So sollte es nicht überraschen, dass die Fourier-Reihe durch das so genannte Fourier-Integral ersetzt werden muss, wenn λ gegen unendlich geht. Das Fourier-Integral, das wir hier ohne Beweis angeben, lautet ˆ ∞ ˆ ∞ 1 A (k) cos kx dk + B (k) sin kx dk , (7.56) f (x) = π 0 0 vorausgesetzt, dass ˆ ∞ f (x) cos kx dx A (k) = −∞

und

ˆ B (k) =

∞ −∞

f (x) sin kx dx

(7.57)

ist. Die Ähnlichkeit mit der Reihendarstellung ist augenfällig. Die Größen A (k) und B (k) werden als Amplituden der Sinus- und Kosinusbeiträge im Bereich der Wellenzahl zwischen k und k + dk interpretiert. Man nennt sie im Allgemeinen die Fourier-Kosinus- bzw. Sinustransformierte. Im vorangegangenen Beispiel eines Rechteckimpulses (Abb. 7.40) entspricht die Kosinustransformierte A (k) der Einhüllenden. Wir erinnern uns, dass der erste Term der Reihe 12 A0 und nicht A0 lautet, was auf eine weitere Art der Darstellung des Frequenzspektrums schließen lässt. Da cos (mkx) = cos (−mkx) ist, können wir die Amplitude jedes Beitrages außer m = 0 halbieren und zweimal zeichnen, einmal mit einem positiven Wert von k und einmal mit einem negativen Wert (Abb. 7.42). Dieser mathematische Kunstgriff, der eine schön symmetrische Kurve liefert, wird hier eingeführt, weil es weit verbreitet ist, Frequenzspektren auf diese Weise darzustellen.

7 Superposition von Wellen

610 Am

0.50

0.25

−7k

−3k −6k −5k −4k

3k −2k −k

0

k

2k

7k 4k

5k

6k

mk

Abb. 7.42: Symmetrisches Frequenzspektrum für die Wellenform in Abb. 7.40 a. Beachten Sie, dass der nullte Term tatsächlich A0 /2 ist, was die Amplitude des m = 0-Beitrags der Reihe ist.

Wir werden in Kapitel 11 sehen, dass die leistungsfähigsten Methoden zur Fourier-Transformation eine komplexe Darstellung verwenden, die automatisch eine symmetrische Verteilung von positiven und negativen Raumfrequenztermen bedingt. Bestimmte optische Phänomene (z. B. die Beugung) sind ebenfalls räumlich symmetrisch; man kann sie in beeindruckender Weise zum Raumfrequenzspektrum in Beziehung setzen, soweit dieses positive und negative Frequenzen umfasst. Die negative Frequenz ist demnach ein nützliches mathematisches Hilfsmittel zur Beschreibung symmetrischer physikalischer Systeme.

7.4.2 Impulse und Wellenpakete Wir wollen nun den Rechteckimpuls in Abbildung 7.43, % E0 wenn |x| < L/2 , f (x) = 0 wenn |x| > L/2 als Fourier-Integral aufschreiben. Dabei wollen wir uns zunächst auf positive Werte von k beschränken. Da f (x) eine gerade Funktion ist, wird die Sinustransformierte B (k) null; es verbleibt also ˆ +L/2 ˆ ∞ f (x) cos kx dx = E0 cos kx dx . A (k) = −∞

−L/2

Daher ist

+L/2  2E0 E0 sin kx sin kL/2 . = A (k) = k k −L/2

Durch Erweitern mit L und Umstellung der Terme erhalten wir A (k) = E0 L

sin kL/2 kL/2

7.4 Nichtperiodische Wellen

611 f (x) E0

A(k)=E0 L sinc (kL/2)

(a)

−L/2

x

L/2

0

E0 L

0 −0.2E0 L

π 2

π







5π kL/2 Abb. 7.43: Der Rechteckimpuls

(b)

und seine Fourier-Transformierte.

oder äquivalent A (k) = E0 L sinc (kL/2) .

(7.58)

Die Fourier-Transformierte des Rechteckimpulses ist in Abbildung 7.43 b gezeigt; vergleichen Sie sie mit der Einhüllenden in Abbildung 7.40. Die Abstände zwischen benachbarten Nullstellen von A (k) werden kleiner, wenn L zunimmt, und umgekehrt. Wenn k = 0 ist, folgt überdies aus Gleichung (7.58) A (0) = E0 L. Die Integraldarstellung von f (x) lässt sich nun unter Verwendung der Gleichung (7.56) sofort ausschreiben: ˆ 1 ∞ E0 L sinc (kL/2) cos kx dk . (7.59) f (x) = π 0 In Aufgabe 7.50 soll dieses Integral berechnet werden. Der Kosinus-Wellenzug Es wurde bereits mehrfach betont, dass monochromatische Wellen Idealisierungen sind, die so in Wirklichkeit nicht existieren – denn jeder noch so ideale Sender muss zu irgendeinem Zeitpunkt eingeschaltet werden. Abbildung 7.44 stellt einen idealisierten harmonischen Impuls dar, der durch die Funktion % E0 cos kp x wenn − L ≤ x ≤ L E (x) = 0 wenn |x| > L beschrieben wird. Wir arbeiten hier im Raumbereich, könnten die Schwingung aber ebenso gut als Funktion der Zeit behandeln. Im Prinzip betrachten wir also statt des

7 Superposition von Wellen

612

0

(a)

0 (b)

(c)

Abb. 7.44: Ein endlich langer Kosinuswellenzug und seine Transformierte.

zeitlichen Profils der Welle E (x − vt) bei x = 0 die räumliche Form dieser Welle bei t = 0. Die Raumfrequenz kp gehört zu dem Bereich, in dem der Wellenzug harmonisch ist (d. h., sie entspricht den vielen cos-Wellenformen wie sie in Abb. 7.44 a gezeigt sind). Des Weiteren stellen wir fest, dass E (x) eine gerade Funktion ist, folglich wird B (k) = 0 und ˆ +L E0 cos kp x cos kx dx . A (k) = −L

Dies ist identisch mit ˆ +L 1 E0 [cos (kp + k) x + cos (kp − k) x] dx . A (k) = 2 −L Die Integration führt zu  sin (kp + k) L sin (kp − k) L + A (k) = E0 L (kp + k) L (kp − k) L oder A (k) = E0 L [sinc (kp + k) L + sinc (kp − k) L] .

(7.60)

7.4 Nichtperiodische Wellen

613

Sind viele Wellen im Wellenzug vorhanden (λp  L), dann gilt kp L  2π. Daher ist (kp + k) L  2π, und die Werte von sinc (kp + k) L werden recht klein. Ist dagegen kp = k, so nimmt die zweite sinc-Funktion in den Klammern den Maximalwert 1 an. Mit anderen Worten: Die Funktion aus Gleichung (7.60) hat ein Maximum in k = −kp (Abb. 7.44 b). Wenn nur positive Werte von k zugelassen werden, leistet lediglich derjenige Ausläufer des linken Maximums, der in den positiven k-Bereich hineinläuft, einen Beitrag. Wie wir gerade gesehen haben, werden solche Beiträge weit von k = −kp entfernt vernachlässigbar klein. Dies trifft insbesondere zu, wenn L  λp ist und die Maxima sowohl schmal sind als auch weit auseinander liegen. Der positive Ausläufer des linksseitigen Maximums fällt dann jenseits von k = −kp sehr schnell ab. Folglich dürfen wir die erste sinc-Funktion in diesem speziellen Fall vernachlässigen, und wir schreiben die Transformierte als A (k) = E0 L sinc (kp − k) L

(7.61)

(Abb. 7.44 c). Der Wellenzug ist zwar sehr lang, aber nicht unendlich, und daher muss er aus einem kontinuierlichen Spektrum von Raumfrequenzen zusammengesetzt werden. Solche Impulse nennt man Wellenpaket oder Wellengruppe. Wie zu erwarten, stammt der dominierende Beitrag von k = kp . Hätten wir die Analyse in der Zeitdomäne vorgenommen, so hätten wir dasselbe Resultat erhalten, nur wäre die Transformierte um die Winkelfrequenz ωp zentriert. Wird der Wellenzug unendlich lang (L → ∞), so schrumpft natürlich das Frequenzspektrum, und die Kurve in Abbildung 7.44 c wird zu einer einzigen hohen Spitze in kp (oder ωp ). Dies ist der Grenzfall der idealisierten monochromatischen Welle. Da wir uns A (k) als die Amplitude der Beiträge zu E (x) im Bereich von k bis k + dk vorstellen können, muss A2 (k) in diesem Bereich mit der Energie der Welle zusammenhängen (Aufgabe 7.54). Darauf werden wir in Kapitel 11 bei der Besprechung des Leistungsspektrums zurückkommen. Hier wollen wir lediglich feststellen (Abb. 7.44 c), dass der größte Teil der Energie im Raumfrequenzbereich von kp − π/L bis kp + π/L übertragen wird, der zwischen den Minima zu beiden Seiten des Maximums liegt. Je länger der Wellenzug ist, desto schmaler wird der k-Bereich um kp , in dem sich die Energie der Welle konzentriert. Das Wellenpaket in der Zeitdomäne, also % E0 cos ωp t wenn − T ≤ t ≤ T E (t) = 0 wenn |t| > T hat die Transformierte A (ω) = E0 T sinc (ωp − ω) T ,

(7.62)

wobei ω und k über die Phasengeschwindigkeit miteinander verknüpft sind. Das Frequenzspektrum ist, abgesehen von der Bezeichnungsänderung von k zu ω und L zu T , identisch mit Abbildung 7.44 c.

614

7 Superposition von Wellen

Zusammengefasst können wir sagen, dass die Wellenform (Abb. 7.44 a), deren Transformierte wir berechnet haben, ein kosinusförmiger Puls ist, der mit einer konstanten räumlichen Winkelfrequenz von kp oszilliert. Wir stellen uns vor, dass diese Oszillation, die nur eine Frequenz hat, moduliert ist durch einen Rechteckpuls, der sich von −L bis +L erstreckt, sodass die Resultierende außerhalb dieses Intervalls überall null ist. Die gesuchte Transformierte ist die Transformierte der Einhüllenden (d. h. des Rechtecks), und sie ist eine sinc-Funktion. Die Tatsache, dass wir es nicht nur mit einer Rechteckfunktion zu tun haben, führt dazu, dass die sinc-Funktion um den Betrag kp entlang der positiven k-Achse verschoben wird. Die dominierende Frequenz der Transformierten ist offensichtlich die Frequenz der Oszillation des Kosinusanteils der Wellenform. Beachten Sie, dass die Breite der Transformierten (gemessen zwischen den beiden ersten Nulldurchgängen) gleich 2π/L ist. Je länger der oszillatorische Wellenzug (2L) ist, umso schmaller ist seine Transformierte. Wir können daher einfach auf die Transformierte (Abb. 7.44 c) schauen und aus ihrer Form ablesen, dass die ursprüngliche Wellenform rechteckig sein muss. Aus ihrer Lage auf der k-Achse wissen wir, dass der originale Puls mit der Frequenz kp oszillieren muss, und aus seiner Breite gewinnen wir eine Vorstellung von der Länge des Wellenzugs. Wegen der Tatsache, dass es sich um eine Kosinustransformierte handelt, kennen wir die Phase der Oszillation bei x = 0. Hätten wir eine kosinusförmige Oszillation betrachtet, die durch irgendeine andere Einhüllende moduliert ist, dann hätten wir als Transformierte die Transformierte dieser einhüllenden Funktion erhalten (zentriert bei kp , der Frequenz der kosinusförmigen Oszillation). Siehe zum Beispiel Abbildung 7.46. Die Frequenzbandbreite Der Frequenzbereich (ω oder k), den die Transformierte in unserem speziellen Fall überstreicht, ist offensichtlich nicht endlich. Betrachten wir jedoch die Breite der Transformierten (Δω oder Δk), so sollte laut Abbildung 7.44 c Δk = 2π/L oder Δω = 2π/T verwendet werden. Im Unterschied dazu ist die räumliche oder zeitliche Ausdehnung des Impulses zweifellos Δx = 2L bzw. Δt = 2T . Das Produkt aus der Breite des Paketes im k-Raum und seiner Breite im x-Raum ist Δk Δx = 4π oder analog Δω Δt = 4π. Man nennt die Größen Δk und Δω die Frequenzbandbreiten. Für einen anders geformten Impuls wäre das Produkt aus Bandbreite und Impulslänge sicher anders ausgefallen. Bis jetzt haben wir uns jedoch noch nicht auf eine der alternativen Möglichkeiten zur Festlegung von Δω und Δk festgelegt, woraus eine Mehrdeutigkeit entsteht: Wir hätten zum Beispiel nicht die ersten Minima von A (k) verwenden müssen (es gibt Transformierte, die keine derartigen Minima haben, wie die Gauß-Funktion aus Abschn. 11.2), sondern Δk als Breite von A2 (k) in einem Punkt festlegen können, in dem die Kurve etwa auf 12 oder 1e ih-

7.4 Nichtperiodische Wellen

615

res Maximalwertes gefallen ist. Zunächst genügt uns die Feststellung, dass wegen Δω = 2πΔν Δν ≈ 1/Δt

(7.63)

ist – die Frequenzbandbreite liegt in der Größenordnung des reziproken Wertes der zeitlichen Ausdehnung des Impulses (Aufgabe 7.39). Ist die Bandbreite des Wellenpakets schmal, so dehnt sich das Paket über einen großen Raum- und Zeitbereich aus. Dementsprechend kann ein Radio, das für den Empfang einer Bandbreite von Δν abgestimmt ist, nur Impulszeiten erfassen, die länger als Δt ≈ 1/Δν sind. Diese Betrachtungen sind von grundlegender Bedeutung für die Quantenmechanik, in der Wellenpakete Elementarteilchen beschreiben. Gleichung (7.63) ist verwandt mit der heisenbergschen Unschärferelation.

7.4.3 Die Kohärenzlänge Wir betrachten nun Licht aus einer Quelle, die man in erster Näherung gern als monochromatisch bezeichnet, beispielsweise aus einer Natriumdampflampe. Bei der Spektralanalyse des Strahlenbündels kann man die verschiedenen Frequenzkomponenten beobachten. Typischerweise findet man einige schmale Frequenzbereiche, in denen sich der größte Teil der Energie konzentriert und die durch größere dunkle Bereiche voneinander getrennt sind. Die hellen Bänder nennt man Spektrallinien. In manche Spektrographen tritt das Licht durch einen Spalt ein; jede Linie ist dann in Wirklichkeit eine farbige Abbildung dieses Spaltes. Andere Analysatoren stellen die Frequenzverteilung auf einem Oszillographenschirm dar. Niemals sind die einzelnen Linien jedoch unendlich scharf – stets bestehen sie aus einem endlichen Bereich von Frequenzen, mag dieser auch sehr schmal sein (Abb. 7.45). Die elektronischen Übergänge, die für die Lichterzeugung verantwortlich sind, haben eine Dauer in der Größenordnung von 10−8 bis 10−9 s. Da die emittierten Wellenzüge endlich sind, gibt es eine Frequenzstreuung, die als natürliche Linienbreite bezeichnet wird (siehe Abschn. 11.3.4). Außerdem befinden sich die Atome ständig in zufälliger thermischer Bewegung, weshalb auch der Doppler-Effekt das Frequenzspektrum beeinflusst. Zusätzlich stoßen die Atome zusammen, die Wellenzüge werden unterbrochen und wiederum verbreitert sich die Frequenzverteilung. Der Gesamteffekt aller dieser Vorgänge besteht darin, dass jede Spektrallinie statt einer einzigen Frequenz eine Bandbreite Δν hat. Die Zeit, die Gleichung (7.63) erfüllt, bezeichnet man als Kohärenzzeit (nachfolgend als Δtc geschrieben), und die Länge Δxc , gegeben durch Δxc = cΔtc ,

(7.64)

als Kohärenzlänge. Man sieht sofort, dass die Kohärenzlänge diejenige Länge im Raum ist, in der die Welle die Sinusform annimmt, sodass man ihre Phase exakt angeben kann. Die entsprechende Zeitdauer ist die Kohärenzzeit. Diese Begriffe sind

7 Superposition von Wellen

616 I Imax

Imax 2

−0.002 −0.001

λ (nm) +0.001 +0.002 643.847

±0.00065 nm bei Imax /2

Abb. 7.45: Die von einer Niederdrucklampe erzeugte rote Cd-Linie (λ = 643,847 nm).

für die Diskussion der Wechselwirkung von Wellen außerordentlich wichtig, und wir werden später auf sie zurückkommen. Das Konzept des Photonenwellenzugs kennen wir bereits. Mithilfe der Fourier-Analyse können wir nun einiges über die Form dieses Wellenzugs aussagen. Dazu schließen wir gewissermaßen rückwärts, ausgehend von der experimentellen Beobachtung, dass die Frequenzverteilung einer Spektrallinie aus einer quasimonochromatischen Quelle (kein Laser) durch eine glockenförmige Gaußfunktion dargestellt werden kann (Abschn. 2.1). Das heißt, der Graph der Bestrahlungsstärke als Funktion der Frequenz ist eine Gaußkurve. Da nun das Quadrat einer Gaußfunktion wieder eine Gaußfunktion ist, folgt, dass die Amplitude des Lichtfeldes auch glockenförmig ist. Ein einzelner Photonenwellenzug (eines von N identischen Paketen, die den Strahl bilden) sei nun eine harmonische Funktion, die durch eine gaußsche Einhüllende moduliert ist, ähnlich der Funktion in Abbildung 7.46 a. Ihre Fourier-Transformierte A (ω) ist ebenfalls eine Gaußfunktion. Betrachten wir dabei lediglich eine einzige harmonische Frequenzkomponente, die zu jedem Photonenwellenzug einen Beitrag leistet, zum Beispiel ω  . Wie wir wissen, ist diese Komponente eine unendlich lange sinusförmige Funktion konstanter Amplitude. Wenn jedes Paket die gleiche Form hat, so ist die Amplitude der Fourier-Komponente, die mit ω  verknüpft ist, für jedes Paket gleich. In jedem Punkt in einem Photonenstrom haben die monochromatischen Wellen, die der ω  -Komponente entsprechen und von denen jeweils eine zu jedem einzelnen Wellenzug gehört, eine zufällige relative Phasenverteilung, die sich zeitlich mit dem Eintreffen jedes einzelnen Photons schnell verändert. Daher entsprechen alle derartigen Beiträge zusammengenommen [Gl. (7.21)] im Mittel einer harmonischen Welle mit der Frequenz ω  und einer Amplitude proportional zu N 1/2 ; dies ist der

7.4 Nichtperiodische Wellen

617

E(t)

t

Δtc

(a)

A(ω)

0

¯ ω ω Δω

ω (b)

Abb. 7.46: Ein kosinusförmiger Wellenzug, der durch eine gaußsche Einhüllende moduliert wird, und seine Transformierte, ebenfalls eine Gaußfunktion.

ω  -Teil des beobachteten Feldes. Gleiches gilt für alle anderen in den Paketen enthaltenen Frequenzen. Dies bedeutet, dass jeder Frequenz im Lichtfeld des Strahlenbündels derselbe Energiebetrag zugeordnet ist wie in den einzelnen Wellenzügen. Über diese Energie-Frequenz-Verteilung wissen wir Bescheid: Sie ist eine Gaußfunktion, und daher muss die Transformierte des Photonenwellenzuges ebenfalls eine Gaußfunktion sein. Mit anderen Worten: Die beobachtete Spektrallinie entspricht dem Leistungsspektrum des Strahlenbündels, aber sie entspricht gleichzeitig dem Leistungsspektrum eines einzelnen Photonenwellenzuges. Aufgrund der Zufälligkeit der Wellenzüge haben die harmonischen Komponenten der resultierenden Welle nicht dieselben relativen Phasen wie in jedem einzelnen Paket. Das Profil der resultierenden Welle unterscheidet sich deshalb vom Profil der einzelnen Wellenpakete, obwohl die Amplitude jeder Frequenzkomponente der Resultierenden einfach dem N 1/2 -Fachen der Amplitude in jedem einzelnen Paket entspricht. Die Anzahl der sich zufällig überdeckenden Wellengruppen ist in der Regel sehr groß, sodass die Einhüllende der Resultierenden äußerst selten verschwindet. Wenn die Quelle quasimonochromatisch ist (wenn die Bandbreite im Vergleich zur mittleren Frequenz ν klein ist), so können wir die Resultierende als „fast“ sinusförmig betrachten. Zusammenfassend können wir die Lichtwelle wie in Abbildung 7.47 darstellen. Wir können uns vorstellen, dass Frequenz und Amplitude beliebig variieren, Erstere über einen Bereich Δν mit dem Mittelpunkt ν. Die Frequenzstabilität, definiert als Δν/ν, ist dann ein nützliches Maß für die spektrale Reinheit („Einfarbigkeit“). Selbst eine Kohärenzzeit von nur 10−9 s entspricht bereits rund einigen Millionen Wellenzügen

7 Superposition von Wellen

618 E(t)

t Abb. 7.47: Eine quasimonochromatische Lichtwelle.

des schnell schwingenden Trägers (ν); alle Amplituden- oder Frequenzveränderungen erfolgen im Vergleich dazu sehr langsam. Äquivalent können wir einen zeitlich variierenden Phasenfaktor einführen und damit die Schwingung als E (t) = E0 (t) cos [ε (t) − 2πνt]

(7.65)

aufschreiben, wobei sich der Abstand zwischen den Wellenbergen mit der Zeit ändert. Die mittlere Dauer eines Wellenzuges ist Δtc . Zwei Punkte auf der Welle in Abbildung 7.47, die weiter als Δtc auseinander liegen, müssen sich deshalb auf verschiedenen beitragenden Wellenzügen befinden. Die Phasen dieser Punkte sind völlig unkorreliert. Beobachten wir das elektrische Feld der zusammengesetzten Welle während des Vorbeilaufs an einem idealisierten Detektor, so können wir ihre Phase für Zeitpunkte, die weniger als Δtc voneinander entfernt sind, ziemlich genau voraussagen, für Zeitpunkte, die nach Δtc kommen, jedoch überhaupt nicht. In Kapitel 12 werden wir den Kohärenzgrad betrachten, der sich auch auf den Bereich zwischen diesen Extremen bezieht. Der Frequenzbereich von weißem Licht liegt ungefähr zwischen 0,4 × 1015 Hz und 0,7 × 1015 Hz, die Bandbreite beträgt also etwa 0,3 × 1015 Hz und die Kohärenzzeit etwa 3 × 10−15 s. Dies entspricht Wellenzügen [Gl. (7.64)] mit einer räumlichen Ausdehnung von nur wenigen Wellenlängen (Tab. 7.1). Weißes Licht kann man sich also als zufällige Folge sehr kurzer Pulse vorstellen. Um weißes Licht zu synthetisieren, müssen wir harmonische Komponenten aus einem breiten, kontinuierlichen Bereich überlagern, um die sehr kurzen Wellenpakete zu erzeugen. Umgekehrt können wir tatsächlich alle diese Bestandteile beobachten, wenn wir weißes Licht durch einen Fourier-Analysator (beispielsweise ein Beugungsgitter oder ein Prisma) leiten. Mit rund 300 THz ist die verfügbare Bandbreite im sichtbaren Spektrum sehr groß, geradezu ein „Schlaraffenland“ für Kommunikationstechniker. Ein typischer Fernsehkanal zum Beispiel belegt einen Frequenzbereich von 4 MHz (Δν ist durch die Dauer der Impulse bestimmt, die man zur Steuerung des Elektronenstrahls in der Bildröhre benötigt). Deshalb könnte man im sichtbaren Bereich etwa 75 Millionen Fernsehkanäle übertragen. Es versteht sich von selbst, dass auf diesem Gebiet aktiv geforscht wird (siehe Abschn. 8.11).

7.4 Nichtperiodische Wellen

619

Tabelle 7.1: Typische Kohärenzlängen einiger Lichtquellen

Quelle

mittlere Wellenlänge Linienbreite∗ ¯ (nm) λ Δλ (nm)

Kohärenzlänge Δlc

fernes IR (8000 − 12 000 nm) mittleres IR (3000 − 5000 nm) Tageslicht Quecksilber-Bogenlampe Kr86 -Entladungslampe stabilisierter He-Ne-Laser He-Ne-Speziallaser

10 000 4000 550 546,1 605,6 632,8 1153

¯ ≈ 25 000 nm = 2,5λ ¯ ≈ 8000 nm = 2λ ¯ ≈ 900 nm = 1,6λ < ∼ 0,03 cm 0,3 m < ∼ 400 m 15 × 106 m



≈ 4000 ≈ 2000 ≈ 300 ≈ 1,0 1,2 × 10−3 ≈ 10−6 8,9 × 10−11

¯0. Zur Bestimmung der zugehörigen Frequenzbandbreite verwende man die Beziehung Δν/Δλ0 = ν/λ

Gewöhnliche Entladungslampen haben relativ große Bandbreiten, die Kohärenzlängen in der Größenordnung von nur wenigen Millimetern entsprechen. NiederdruckIsotopenstrahler, z. B. Hg198 (λLuft = 546,078 nm) oder der internationale Standard Kr86 (λLuft = 605,616 nm), haben Bandbreiten von etwa 1000 MHz. Die entsprechenden Kohärenzlängen liegen bei etwa 0,3 m, die Kohärenzzeiten bei etwa 1 ns. Die Frequenzstabilität beträgt ungefähr ein Millionstel – diese Quellen können sicherlich als quasimonochromatisch angesehen werden. Der Laser ist bei weitem die spektakulärste verfügbare Strahlungsquelle. Unter optimalen Bedingungen, mit sorgfältiger Unterdrückung von Temperaturschwankungen und Vibrationen, wurden Laser in der Nähe der theoretischen Grenze der Frequenzstabilität betrieben. Eine kurzzeitige Frequenzstabilität von etwa 8 pro 1014 wurde mit einem kontinuierlichen He-Ne-Gaslaser bei λ0 = 1153 nm erreicht.4 Das entspricht einer bemerkenswert schmalen Bandbreite von etwa 20 Hz. Häufiger und leichter zu erreichen sind Frequenzstabilitäten von einigen Milliardstel. Manche kommerziell erhältlichen CO2 -Laser weisen ein kurzzeitiges (≈ 10−1 s) Δν/ν-Verhältnis von 10−9 und einen langzeitigen (≈ 103 s) Wert von 10−8 auf. Beispiel 7.6 Eine rote LED strahlt im Vakuum bei einer mittleren Wellenlänge von 607 nm. Wenn die Emission eine Linienbreite von 18 nm hat, wie groß ist dann die Frequenzbandbreite? Lösung Wir müssen Δλ0 , die Linienbreite im Vakuum, mit Δν, der Frequenzbandbreite, in Beziehung setzen. Entsprechend muss ν = c/λ0 nach λ0 −2 differenziert werden, was Δν/Δλ0 = cλ0 liefert. Wir haben das Minuszeichen weggelassen, weil es uns nur sagt, dass eine Erhöhung von Δν mit einer

4

T. S. Jaseja, A. Javan und C. H. Townes, „Frequency Stability of Helium-Neon Lasers and Measurements of Length“, Phys. Rev. Letters 10 (1963) 165.

7 Superposition von Wellen

620

Verringerung von Δλ0 einhergeht. Damit ist die Frequenzbandbreite bei λ0 , der mittleren Vakuumwellenlänge, Δν =

cΔλ0 2

λ0

=

(3,0 × 108 m/s)(18 × 10−9 m) (607 × 10−9 m)2

und Δν = 1,47 × 1013 Hz = 15 THz .

7.4.4 Diskrete Fourier-Transformation Für jede Funktion, die einen physikalischen Prozess beschreibt, kann man eine Fourier-Analyse vornehmen und die Transformierte analytisch bestimmen. Die grundlegenden Verfahrensweisen haben wir nun kennengelernt, und in Kapitel 11 werden wir darauf zurückkommen. An dieser Stelle wollen wir das Konzept der Fourier-Analyse jedoch noch erweitern – auf Situationen, in denen keine funktionale Darstellung der Daten zur Verfügung steht. In der Praxis liegt häufig eine Menge von Datenpunkten vor, vielleicht auch eine Kurve, die von einem Plotter oder Bildschirm erzeugt wurde. Diese Daten kann man digitalisieren, d. h., man ordnet in geeigneten Intervallen Punkten auf der Kurve Zahlen zu. Um zu bestimmen, welche Frequenzen in einer derartigen Datenmenge enthalten sind, benutzt man eine numerische Methode, die diskrete Fourier-Transformation. Die Berechnung selbst übernimmt ein Computer, weshalb es für unsere Zwecke ausreicht, das grundlegende Prinzip zu verstehen, damit wir die Ergebnisse bewerten können. Bis jetzt haben wir uns mit Funktionen wie f (x) beschäftigt, die eine Größe wie zum Beispiel das elektrische Feld beschreiben und Werte für alle x liefern. Betrachten wir stattdessen nun eine endliche Anzahl N von Punkten in 0, x1 , x2 , . . . , xN −1 mit den zugehörigen Funktionswerten f0 , fx1 , fx2 , usw. Wenn die Stützstellen den gleichen Abstand x0 voneinander haben, kann man die Folge als f0 , fx0 , f2x0 , . . . angeben. Jedes Fourier-Integral [Gl. (7.57)] kann durch eine Summe angenähert werden, die Punkt für Punkt über den gesamten Bereich der verfügbaren Daten (f0 , fx0 , f2x0 , . . . ) läuft. Abbildung 7.48 zeigt einen handgezeichneten Impuls und die zugehörige, computerberechnete, diskrete Fourier-Transformierte (mit positiven und negativen Frequenzwerten wie in Abb. 7.42). Die Fourier-Analyse kann leicht auf zweidimensionale Funktionen f (x, y) erweitert werden (Abschn. 11.2.2). Ist beispielsweise die in Abbildung 7.49 b gezeigte Kurve die Transformierte des eindimensionalen Rechteckimpulses als Funktion der Raumfrequenz k, so entspricht die Figur in Abbildung 7.49 d der Transformierten des zweidimensionalen Rechteckimpulses als Funktion der Raumfrequenzen kx und ky .

7.4 Nichtperiodische Wellen (a)

621 (b)

Eingangssignal

Transformierte

0 0

Abb. 7.48: Ein Eingangssignal und seine diskrete Fourier-Transformierte.

Physiker sind es gewohnt, Prozesse bezüglich der Energie zu betrachten, insbesondere, wenn sie Messungen vornehmen wollen. Die Energie einer harmonischen Welle ist proportional zu ihrem Amplitudenquadrat. Da die Transformierte die Amplituden aller sinusförmigen Teilschwingungen enthält, ist das Quadrat der Transformierten ein Maß für die Energie- oder Leistungsverteilung bezüglich jeder Teilfrequenz, folglich eine Funktion der Raumfrequenz, und wird Leistungsspektrum genannt. Da die Transformierte oft als komplexe Größe geschrieben wird, kann das Leistungsspektrum als das Produkt aus der Transformierten und ihres konjugiert Komplexen definiert werden, angegeben in der Einheit W/m−2 oder W · m2 .

(a)

(d)

(b)

(c)

(e)

Abb. 7.49: (a) Ein eindimensionaler Rechteckimpuls und (b) seine Transformierte. (c) Ein zweidimensionaler Rechteckimpuls und (d) seine Transformierte. (e) Das Leistungsspektrum der Transformierten in (d), im zweidimensionalen k-Raum aufgezeichnet. (Mit freundlicher Genehmigung von R. G. Wilson, Illinois Wesleyan University.)

7 Superposition von Wellen

622

Abbildung 7.49 e zeigt das Leistungsspektrum des zweidimensionalen Rechteckimpulses (im k-Raum). Dieses Spektrum ist überall positiv, was für die Transformierte nicht gilt. Aus dem Leistungsspektrum geht klar hervor, dass der Hauptteil der Energie des Signals mit relativ niedrigen Frequenzen verknüpft ist – die Frequenzen nehmen radial vom Mittelpunkt nach außen hin zu. Da das Leistungsspektrum immer positiv ist, kann man die Leistung durch mehr oder weniger helle Flecken in einem zweidimensionalen Diagramm darstellen. Jeder Punkt entspricht dann dem Beitrag einer bestimmten Frequenz. Im Abschnitt 11.3.3 werden wir die Transformierte bezüglich der Koordinaten (Y , Z) eines weit entfernten Beobachtungsschirms formulieren und feststellen, dass das Quadrat dieser Transformierten identisch mit der Verteilung der Bestrahlungsstärke des Beugungsmusters auf diesem Schirm ist. In diesem Zusammenhang kann das Quadrat der Transformierten (in Einheiten von W/m2 ) als Bestrahlungsspektrum bezeichnet werden. Obwohl es einen mathematischen Unterschied zwischen dem Leistungsspektrum und dem Bestrahlungsspektrum gibt, könnten Sie zwischen zwei (unbeschrifteten) Darstellungen (erstere im k-Raum aufgetragen, Letztere in einem gewöhnlichen Koordinatensystem) wohl kaum einen Unterschied erkennen.

(a)

(c)

(b)

(d)

Abb. 7.50: (a) Ausschnitt aus da Vincis Mona Lisa und (b) das zentrale Gebiet des zugehörigen Leistungsspektrums. (c) Derselbe Ausschnitt bei Entfernung hoher Raumfrequenzen bzw. (d) bei Entfernung niedriger Raumfrequenzen. (Foto Synoptics Image Processing Systems, Cambridge, UK.)

Wenn analytische Funktionen nicht verfügbar sind, kann man ähnliche Ergebnisse mit der diskreten Fourier-Transformation erhalten. Ein zweidimensionales Datenfeld (et-

7.4 Nichtperiodische Wellen

623

wa das Bild der Mona Lisa in Abb. 7.50 a kann durch Scannen und Digitalisieren erzeugt und die diskrete Transformierte berechnet werden. Der Graph der Transformierten eines so komplizierten Signals ist seinerseits recht kompliziert, weshalb stattdessen das Leistungsspektrum (Abb. 7.50 b abgebildet wurde. Wegen der Art und Weise der Einführung negativer Frequenzen ist das Muster symmetrisch bezüglich jeder Diagonale. Das helle, schmale, zentrierte Kreuz kommt durch die scharfen Bildbegrenzungen zustande. (Wie wir noch sehen werden, erzeugt der horizontale Rand die vertikale Linie und der vertikale Rand die horizontale Linie, siehe dazu Abb. 13.34.) Filtert man die höheren Raumfrequenzen fernab vom Mittelpunkt, die die feinen Details enthalten, heraus und rekonstruiert das Bild aus dem Rest, so erhält man ein weich gezeichnetes, unscharfes Bild (Abb. 7.50 c). Wenn man dagegen die niedrigen Frequenzen entfernt, indem man den mittleren Bereich der Transformierten sperrt, erzeugen die verbleibenden hohen Frequenzen ein scharfes Bild der Konturen (Abb. 7.50 d). Die Form der Bildelemente bestimmt die Transformierte und damit auch das Leistungsspektrum. Die Bilder in Abbildung 7.51 wurden von einem Computer erzeugt und mit einem vertikalen sinusförmigen Muster überlagert, um zu unterstreichen, worum es bei unserer Argumentation geht. Der Grundgedanke besteht darin, verschiedene Teilgebiete des Bildes herauszunehmen, ihre Transformierte zu untersuchen und zu filtern. Die vertikale periodische Modulation bildet ein sinusförmiges Muster oder Gitter mit einer festen Raumfrequenz κ0 . Das Muster verrät sich in dem berechneten Leistungsspektrum jedes Bildausschnittes in Gestalt zweier heller Flecke auf der horizontalen Achse bei ±κ0 . Idealerweise ist das Leistungsspektrum eines Signals in der Gestalt eines sinusförmigen Gitters sehr einfach. Es besteht aus zwei Spitzen, eine bei der positiven und eine bei der negativen Gitterfrequenz.

(a)

(b)

Abb. 7.51: Zwei computerbearbeitete Bilder. Die kleinen Bildausschnitte auf der linken Seite wurden durch Ausfiltern der Sinusmodulation gewonnen. Der weiße Ausschnitt zeigt die Filterfunktion, und der schwarze ist jeweils das gefilterte Leistungsspektrum.

624

7 Superposition von Wellen

Das Filter (dargestellt durch das weiße Quadrat mit zwei schwarzen Flecken) wurde benutzt, um die eingefügten kleinen Abschnitte in jedem Bild zu erzeugen: Es entfernt die Frequenzen +κ0 und −κ0 aus den Leistungsspektren (deren gefilterte Versionen rechts oben angegeben sind). Die Bildausschnitte wurden dann aus den gefilterten Leistungsspektren rekonstruiert und die derart von der Sinusstörung „gesäuberten“ Bilder an ihrem ursprünglichen Ort im Original abgebildet. Beachten Sie, wie unterschiedlich die beiden Spektren sind – die Facetten des geschliffenen Glases dominieren das Spektrum in Abbildung 7.51 b. Offensichtlich ist der Frequenzgehalt eines Bildes, dargestellt entweder als Fourier-Transformierte oder als Leistungsspektrum, eine faszinierende Art, den Inhalt eines Bildes neu zu beschreiben. Fourier-Analyse und Beugung Die computergestützte Bildauswertung, eine Art virtuelle Optik, ist allein schon faszinierend. Daneben lässt sie aber einen grundlegenderen Aspekt der Beugung erahnen, den wir in diesem Kapitel nur streifen können. Das Diapositiv (zum Beispiel mit der Mona Lisa) in Abbildung 7.52 a ist eine zweidimensionale Aufzeichnung der Lichtverteilung, die einmal das Bild des Gemäldes war. Die gespeicherte Information kann gelesen werden, indem man das Dia beleuchtet, was hier mit monochromatischen ebenen Wellen geschieht. Jeder Punkt auf der Oberfläche des Dias ist ein Streuzentrum, von dem aus Strahlen in alle möglichen Richtungen ausgehen (Abb. 7.52 b). Zu jeder ebenen Welle, die das Dia unter einem bestimmten Winkel oberhalb der Achse verlässt, gibt es einen Strahl, der das Dia unter demselben Winkel unterhalb der Achse verlässt. Jede ebene Welle (oder jedes parallele Stahlenbündel), die (das) in einer bestimmten κi -Richtung verläuft, ist eine räumliche Fourier-Frequenzkomponente. Alle diese partiellen ebenen Wellen bilden die Transformierte des optischen Felds am Ort direkt hinter dem Dia. Die Fourier-Transformierte des elektrischen Feldes am Ort des Dias ist eine Wichtungsfunktion, die die relative Stärke jeder Frequenzkomponente dieses Feldes und somit auch die relative Stärke jeder Folge ebener Wellen, die aus der Blende austreten, angibt. Die Summe aller ebenen Wellen ist das durchgelassene Licht, sie muss deshalb äquivalent sein zu der komplizierten Mona-Lisa-Wellenfront, die das Dia verlässt (und ebenfalls das durchgelassene Licht ist). Eine andere hübsche Überlegung ist folgende: Nehmen wir an, jedes Bildelement mit einer Raumfrequenz bezüglich einer beliebigen Richtung in der Fotoebene wirkt als sinusförmiges Gitter. Jedes dieser Gitter beugt Licht in zwei symmetrische Ströme ebener Wellen, die unter einem Winkel austreten, der proportional zur Gitterfrequenz ist (Abschn. 10.2.8). Das Gebiet rechts des Dias füllt sich mit Wellen, die einander umso stärker überlagern, je mehr die Entfernung vom Dia zunimmt. In der Nähe des Dias gibt ein Beobachtungsschirm die Mona Lisa noch ziemlich scharf wieder, doch wenn wir den Schirm

7.4 Nichtperiodische Wellen

(a)

625

+k2 +k1

+k0 (b)

−k1 −k2

+k1 +k0 (c)

−k1

Abb. 7.52: Ein beleuchtetes Diapositiv. (a) Einfallende monochromatische ebene Wellen. (b) Gestreute parallele Strahlenbündel (ebene Wellen). (c) Die Projektion des Leistungsspektrums auf einen Beobachtungsschirm.

wegbewegen, verschwimmt das Bild, bis es nicht mehr erkennbar ist. Das Gebiet hinter dem Dia enthält eine komplizierte Lichtverteilung, das Beugungsmuster des Dias. Mathematisch gesehen gibt es zwei Zonen: die der fresnelschen Beugung nahe des Dias und die der fraunhoferschen Beugung in großer bis unendlicher Entfernung vom Dia (Abschn. 10.1.2). Setzen wir eine Linse in der Entfernung ihrer Brennweite hinter das Dia (Abb. 7.52 c), so fokussiert sie die parallelen Strahlenbündel (welche in einer effektiv unendlichen Entfernung ein fraunhofersches Beugungsmuster erzeugen) auf einem nahe gelegenen Schirm. Dort entspricht jeder Lichtpunkt in der resultierenden diagonalsymmetrischen zweidimensionalen Strahlungsverteilung einer bestimmten Raumfrequenz. Die Amplitude des elektrischen Feldes im fraunhoferschen Beugungsmuster entspricht der Fourier-Transformierten des Eingangssignals, d. h., der Verteilung des elektrischen Feldes über die Blende (keine der beiden Größen kann jedoch direkt gemessen werden). Das beobachtete Phänomen ist die zweidimensionale Strahlungsverteilung, die identisch mit dem Quadrat der Fourier-Transformierten des Eingangsfeldes ist. Es ist auch

7 Superposition von Wellen

626

eine Abbildung des räumlichen Frequenzgehalts der Mona Lisa und stimmt überdies mit dem Leistungsspektrum in Abbildung 7.50 b überein. Wie wir noch sehen werden (Abschn. 13.2.3), kann man die optische Transformierte räumlich ausfiltern, um das rekonstruierte Bild zu verändern. Auf diese Weise wurden die Abbildungen 7.50 c und d mithilfe eines Computers erzeugt. Lichtgeschwindigkeiten größer als c Die Überschrift dieses Abschnitts kündigt an, dass wir uns jetzt mit Licht beschäftigen werden, das sich „schneller als Licht“ bewegt. Sicherlich erscheint Ihnen dies seltsam, aber vielleicht ist Ihnen aufgefallen, dass Effekte dieser Art in letzter Zeit verschiedentlich Schlagzeilen in den Medien machten und auch eine Rolle in der öffentlichen wissenschaftlichen Diskussion spielen. Die spezielle Relativitätstheorie behauptet einerseits, ein Signal (eine Übermittlung von Nachrichten, bei der zwangsläufig Energie transportiert wird) könne sich unter keinen Umständen schneller fortpflanzen als mit der Lichtgeschwindigkeit c. Andererseits haben wir aber bereits gesehen (Abschn. 3.5.1), dass die Phasengeschwindigkeit c durchaus übersteigen kann. Tatsächlich zeigte R. W. Wood bereits 1904 auf experimentellem Wege, dass weißes Licht eine mit Natriumdampf gefüllte Kammer mit einer Phasengeschwindigkeit größer als c durchlaufen kann. Wood konzentrierte sich bei seinen Versuchen auf den Wellenlängenbereich mit anomaler Dispersion in der Umgebung der beiden eng benachbarten so genannten Natrium-D-Linien (589,0 nm und 589,6 nm). Bei weit von den Natrium-Resonanzen entfernten Frequenzen war der Brechungsindex wie erwartet etwas größer als 1; im Frequenzbereich der Absorptionsbande wurde wenig oder kein Licht durchgelassen. Lag die Frequenz des Lichts jedoch dicht neben denen der D-Linien, so wies der Brechungsindex n (ν) Merkmale der anomalen Dispersion auf. Näherte sich die Frequenz den Resonanzen von oben (die Wellenlänge entsprechend von unten), so fiel n steil ab und wurde deutlich kleiner als 1 (v > c). Phasengeschwindigkeiten größer als c sind also schon seit etlichen Jahrzehnten bekannt. Der Widerspruch zur Relativitätstheorie ist nur ein scheinbarer. Eine monochromatische Welle kann sich mit Geschwindigkeiten größer als c ausbreiten, aber sie kann keine Informationen übertragen. Ein Signal in Form einer modulierten Welle hingegen breitet sich stets mit der Gruppengeschwindigkeit aus, die in normal dispergierenden Medien stets kleiner ist als c.5 5

In Bereichen anomaler Dispersion (Abschn. 3.5.1) mit dn/dk < 0 kann vg größer sein als c. Das Signal pflanzt sich hier aber mit einer anderen Geschwindigkeit fort, der so genannten Signalgeschwindigkeit vs . Das bedeutet, mit Ausnahme der Absorptionsbanden ist vg = vs . Die Geschwindigkeit der Energieübertragung ist stets gleich vs und übersteigt c niemals.

7.4 Nichtperiodische Wellen

627

Seit den 1980er-Jahren versuchen verschiedene Experimentatoren6 zu beweisen, dass auch die Gruppengeschwindigkeit größer als c werden kann. Der Gruppen-Brechungsindex eines Lichtpulses mit der Frequenz ν ist gegeben durch dn (ν) . dν (In Aufgabe 7.32 sollen Sie zeigen, dass diese Beziehung korrekt ist.) Der Ausdruck lässt vermuten, dass sich Pulse mit Überlichtgeschwindigkeit im Bereich der anomalen Dispersion erzeugen lassen könnten, wo n (ν) stark mit ν variiert. Damit ng < 1 werden kann, muss dn (ν) /dν negativ werden – genau dies ist innerhalb einer Absorptionsbande der Fall, dort ist die Steigung von n (ν), aufgetragen als Funktion von ν, negativ. ng = n (ν) + ν

Das Problem an diesem Ansatz besteht in Folgendem: Innerhalb der Absorptionsbanden ist natürlich die Absorption ausgeprägt, weshalb der eingestrahlte Puls deutlich abgeschwächt oder gestört wird. Die Ergebnisse sind dann nicht mehr eindeutig interpretierbar. Ein Ausweg könnte sein, ein lichtverstärkendes Medium zu verwenden, beispielsweise eine kleine, Cäsiumgas enthaltende Zelle. Das gewünschte Indexprofil wurde durch Pumpen der Cäsiumatome mithilfe zweier Laserstrahlen verschiedener Frequenz erhalten. Zwischen den beiden Verstärkungslinien entstand so ein Bereich verlustfreier anomaler Dispersion (Abb. 7.53).

Verstärkungskoeffizient

Brechungsindex

Verstärkung

Brechungsindex

−4 −3 −2 −1 0 1 2 Abstimmung (MHz)

3

4

Abb. 7.53: Lineare anomale Dispersion in einem Medium mit Verstärkung zur Demonstration von Gruppengeschwindigkeiten größer als c. Der Brechungsindex und der Verstärkungskoeffizient des Cäsiumgases weisen zwei eng benachbarte Verstärkungslinien auf.

Mit einem Diodenlaser wurde nun ein sehr langer (3,7 µs), nahezu gaußförmiger Puls auf eine Stirnseite der 6 cm langen Zelle abgegeben. Erstaunlicherweise wurde ein im Wesentlichen identischer Puls auf der dem Laser abgewandten Seite der Zelle registriert, bevor das Maximum des eingestrahlten Pulses überhaupt in die Zelle eingetreten war. Aus der Zeitdifferenz von 62 ns folgte, dass der austretende Puls dem eintretenden um rund 20 m vorauseilte; zum Durchlaufen der 6 cm im Vakuum 6

S. Chu und S. Wong, „Linear Pulse Propagation in an Absorbing Medium“, Phys. Rev. Lett. 48 (1982) 738; L. J. Wang, A. Kuzmich und A. Dogariu, „Gain-assisted superluminal light propagation“, Nature 406 (2000) 277; D. Mognai, A. Ranfagni und A. Ruggeri, „Observation of Superluminal Behavior in Wave Propagation“, Phys. Rev. Lett. 84 (2000) 4830.

628

7 Superposition von Wellen

(mit Lichtgeschwindigkeit) hätte ein gewöhnlicher Puls 0,2 ns benötigt, d. h., der austretende Puls war rund 310 Mal schneller. Ist dn (ν) /dν sehr groß und negativ, kann ng – auch wenn es dem gesunden Menschenverstand widerspricht – negativ sein. Im beschriebenen Experiment war ng = −310. Um richtig zu begreifen, was das bedeutet, überlegen wir Folgendes: Um ein Medium der Länge L zu durchlaufen, benötigt ein Lichtpuls die Zeit L/vg = ng L/c, zum Durchlaufen derselben Strecke im Vakuum hingegen L/c. Die Differenz zwischen beiden Zeitspannen, Δt = L/vg − L/c = (ng − 1) L/c, entspricht natürlich der Verzögerung des Pulses im Medium im Vergleich zum Vakuum. Ist nun aber ng < 1, so wird Δt < 0, und der Puls wird nicht verzögert, sondern er tritt eher aus der Zelle aus, als wenn er die Strecke L im Vakuum durchlaufen hätte. Wie ist diese Beobachtung zu erklären? Stellen wir uns ein gaußsches Wellenpaket vor, dessen Amplitude vor und hinter dem mittleren Bereich auf null abfällt. Physikalisch entspricht dies exakt einer großen Gruppe einander überlagernder Sinuswellen, die sich jeweils im Maximum des Pulses zu jeder Zeit vollständig in Phase befinden. Da die Wellenlängen der Fourier-Komponenten verschieden sind, wechselt deren Phasenbeziehung außerhalb des Maximums ständig; wenn man auf beiden Seiten des Maximums nach außen geht, löschen die Komponenten einander zunehmend aus, wodurch die langen, spitz zulaufenden „Flügel“ des Pulses entstehen. Der springende Punkt ist nun, dass die Sinuswellenverteilung im Maximum und außen in den Flügeln gleich ist – ungeachtet des Unterschieds der Amplitude. In den Ausläufern des Pulses überlagern die Komponenten einander so, dass die Nettoamplitude stark abgeschwächt ist. Durchläuft der vordere Ausläufer des Wellenpakets die Zelle, so absorbieren die Cäsiumatome die Komponenten und emittieren sie wieder, wobei sich allerdings (frequenzabhängig) deren Phasenbeziehung ändert. Dadurch wird ein Klon des ursprünglichen Wellenpakets erzeugt. Der zusammengesetzte Puls erscheint am gegenüberliegenden Ende der Zelle so rasch, als wenn er die Strecke viel schneller als mit c zurückgelegt hätte, während der einfallende Puls innerhalb des Gases verschwindet. Lichtgeschwindigkeiten kleiner als c Während manche Forscher Wellenpakete zu erzeugen versuchten, die sich mit Überlichtgeschwindigkeit fortpflanzen, gelang anderen Experimentatoren ein nicht weniger spektakulärer Durchbruch bei der Verlangsamung von Lichtpulsen sogar bis auf eine Geschwindigkeit von null.7 7

Lene Vestergaard Hau, S. E. Harris, Z. Dutton und C. H. Behroozi, „Light speed reduction to 17 metres per second in an ultracold atomic gas“, Nature 397 (1999) 594; Chien Liu, Z. Dutton, C. H. Behroozi und Lene Vestergaard Hau, „Observation of coherent optical information storage in an atomic medium using halted light pulses“, Nature 409 (2001) 490; D. F. Phillips, A. Fleischhauer, A. Mair, R. L. Walsworth und M. D. Lukin, „Storage of Light in Atomic Vapor“, Phys. Rev. Lett. 86 (2001) 783. Siehe auch Kirk T. McDonald, „Slow light“, Am. J. Phys. 68 (2000) 293. Einen kurzen Überblick gibt Barbara Gross Levi, „Researchers Stop, Store, and Retrieve Photons – or at Least the Information They Carry“, Phys. Today 54 (2001) 17.

7.4 Nichtperiodische Wellen

629

In einem Experiment brachte man mithilfe von Laserkühlung (Abschn. 3.4.4) und Verdampfungskühlung Natriumatome auf sehr tiefe Temperaturen. Beim Unterschreiten von 435 Nanokelvin wandelte sich das Gas in ein Bose-Einstein-Kondensat (BEC) um, eine dichte Wolke von sämtlich im gleichen Quantenzustand befindlichen Atomen. Eine weitestmögliche Verdichtung (hier bis zu ungefähr 5 × 1012 Atomen/ cm3 ) des Gases ist wünschenswert, weil dann die Kurve von n (ν) als Funktion von ν sehr steil abfällt. Normalerweise beobachtet man in einem dichten Gas eine ausgeprägte dissipative Absorption in der Nachbarschaft jeder seiner Resonanzen (Spektrallinien). Genau in diesem Bereich wollen wir Laserpulse (mit den Maxima jeweils in νp ) schicken. Mit anderen Worten, in einem dichten Gas findet beim Übergang vom Grundzustand |1 in den ersten angeregten Zustand |3 dissipative Absorption des Lichts bei der Frequenz ν0 statt (siehe Abb. 7.54 a). Ein Atom wird durch die Absorption eines Photons angeregt; bevor es das Photon jedoch wieder abstrahlen kann, stößt es mit einem Nachbaratom zusammen und verliert dabei die aufgenommene Energie. Folglich ist das Medium für Pulse mit dem Maximum im ν0 undurchlässig.

vc

Brechungsindex

|3

v0

1.000

vp

0.996 v0 Abstimmung (MHz)

|2 (a)

1.004

|1

(b)

Abb. 7.54: (a) Anordnung der Energieniveaus bei der Erzeugung elektromagnetisch induzierter Transparenz. (b) Brechungsindex von Natrium in Abhängigkeit von der Frequenz; man erkennt den Bereich mit starker Steigung und normaler Dispersion in der Umgebung der Resonanzfrequenz.

Diesem Problem lässt sich mithilfe der elektromagnetisch induzierten Transparenz (EIT; auch Dunkelresonanz genannt) begegnen. Durch magnetische Filterung bringt man zunächst alle Atome in den Zustand |1 . Dann belichtet man das Gas mit einem zweiten Laserstrahl, dem Kopplungsstrahl (νc ), der auf den Übergang zwischen einem dicht benachbarten Hyperfeinniveau des Grundzustands (|2 ) und demselben angeregten Zustand |3 eingestellt wird. Dadurch kommt es zur Kopplung der beiden Grundzustände (ein Quanteninterferenzeffekt), und Licht innerhalb eines schmalen Bandes um ν0 kann nicht mehr absorbiert werden – der Übergang von |1 nach |3 wird also ausgeschlossen. Anders gesagt: Wird der Kopplungsstrahl eingeschaltet und alle Atome befinden sich in |1 , so befindet sich das System in einem „Dunkelzustand“, in dem keines der Atome Licht mit der ursprünglichen Resonanzfrequenz ν0 absorbieren kann. Liegt nun die Frequenz νp des Sondenstrahls innerhalb der Transmissionsbande um ν0 , so „sieht“ dieser Strahl ein im Wesentlichen transparentes Medium mit gewöhnlicher Dispersion, aber ohne Absorption und nachfolgende Dissipation von Energie aus dem eingestrahlten Puls. Um eine Störung des Signalpulses zu vermeiden,

7 Superposition von Wellen

630

wird dieser so lang gehalten, dass sein Frequenzspektrum schmal genug wird, um in die durchlässige Bande zu passen. Die Frequenzabhängigkeit des Brechungsindex ist in Abb. 7.54 b skizziert. Bei ν0 ist der Index gleich 1 und der zweite Term des Ausdrucks ng = n (ν) + v

dn (ν) dν

überwiegt. Der steile Kurvenabschnitt (mit großem, positivem dn(ν)/dν) gehört zu einem Bereich mit normaler Dispersion mit großem Gruppenindex ng . Pulse mit Maxima bei νp = ν0 pflanzen sich mit Gruppengeschwindigkeiten bis hinunter zu 17 m/s durch das Gas fort. Schon bald nach diesen Experimenten koppelten Forscher die Natrium-D2 -Linie mit der Natrium-D1 -Linie (Sondenlinie), wodurch die Gruppengeschwindigkeit bis auf 0,44 m/s absank. Unabhängig voneinander bremsten zwei Arbeitsgruppen der Harvard University Lichtpulse erst stark ab und brachten sie dann vollständig zum Halten, indem sie den Kopplungslaser ausschalteten, wodurch das Medium wieder undurchsichtig wurde. (Eine der Gruppen arbeitete mit kalten Natrium-, die andere mit warmen Rubidiumatomen.) Natürlich unterbrechen Sie die Fortpflanzung von Lichtwellen auch jedes Mal, wenn Sie blinzeln; hier handelte es sich aber um einen prinzipiell anderen Vorgang. Das Licht wurde zunächst an ein Atomsystem gekoppelt; die Information über charakteristische Merkmale der Sinuskomponenten des Signalpulses (Frequenz, Amplitude, Drehimpuls) wurde dem Gas in Form einer kohärenten Ordnung der Atomspins aufgeprägt. Später wurde diese Information an das Lichtfeld zurück übertragen, woraufhin der ursprüngliche Puls wieder erschien. Im Folgenden soll der Ablauf des Experiments kurz beschrieben werden. Der Signalpuls (mit einer Länge von 3,4 km im freien Raum) trat in das dichte, im Dunkelzustand befindliche Gas ein und wurde dabei um einen Faktor c/vg komprimiert. (Stellen Sie sich vor, die vorauslaufende Flanke des Pulses wird beim Eintritt in das Medium verlangsamt; der mit hoher Geschwindigkeit dahinter ankommende Rest des Pulses wird dann in sich zusammengepresst. Als Analogie können Sie sich eine Reihe von Athleten vorstellen, die – einer nach dem anderen, immer im Abstand von wenigen Schritten – eine trockene Straße entlanglaufen. Der führende Läufer trifft plötzlich auf einen knietiefen Wassergraben, der zu überwinden ist. Wenn der Letzte das Wasser erreicht hat, ist der Abstand zwischen den Läufern viel kleiner als zuvor, und der „Puls“ bewegt sich insgesamt deutlich langsamer.) Die Versuchsanordnung wurde so eingerichtet, dass der komprimierte Signalpuls, bestehend aus ungefähr 27 × 103 Photonen, gerade in die ultrakalte Natriumwolke (339 µm) passte. Der Puls bewegte sich bereits sehr langsam, da ein großer Teil seiner Energie bereits auf das Kopplungsfeld übergegangen war (durch induzierte Emission, siehe Abschn. 13.1.2) und die Zelle verlassen hatte. Die Atome im aktiven Bereich des Pulses befanden sich in einem Superpositionszustand, der durch die Amplituden und Phasen der beiden Laserfelder bestimmt war.

7.4 Nichtperiodische Wellen

631

Als der Puls gerade in der Atomwolke verschwunden war und bevor er wieder austreten konnte, wurde der Kopplungsstrahl plötzlich abgeschaltet. Die sehr geringe noch mit dem Puls verbundene Energie floss in eine kollektive Spinanregung der Gaswolke. Ungefähr eine Millisekunde lang hielten die beteiligten Atome die physikalischen Kenngrößen der Sinuskomponenten des Pulses fest. Als der Kopplungsstrahl dann schlagartig wieder eingeschaltet wurde, trat eine Kopie des Originalpulses aus dem Gas aus. Mit anderen Worten, die aktivierten Atome wirkten als kohärentes quantenmechanisches System und speicherten einen „Bauplan“ des Pulses. Nach dem Wiedereinschalten des Dunkelzustands war (durch den Kopplungsstrahl) erneut elektromagnetische Energie verfügbar, und der Signalpuls wurde wiederhergestellt. Alles, was in diesem Abschnitt gesagt wurde, bezieht sich auf Lichtpulse und ihre Gruppengeschwindigkeit, sei diese nun größer oder kleiner als c. Photonen existieren selbstverständlich nur bei c – entweder sie existieren dort oder gar nicht. Sie lassen sich weder beschleunigen noch abbremsen oder gar bewegungslos in Wartestellung halten. Negative Phasengeschwindigkeit Wie wir in Kapitel 3 gesehen haben, ist es möglich, exotische Strukturen herzustellen, sogenannte Metamaterialien, die einen negativen Brechungsindex haben. Eine elektromagnetische Welle, die sich in einem solchen Medium fortpflanzt, muss eine negative Phasengeschwindigket haben. Der Poynting-Vektor entspricht weiterhin der Richtung des Energieflusses, die auch in diesen exotischen Materialien die Richtung des Lichtstrahls ist. Jeder „Strahl“ von elektromagnetischer Strahlung ist letzten Endes ein Puls. Stellen wir uns deshalb ein Wellenpaket von endlicher Ausdehnung vor und nehmen wir an, es hat einen amplitudenmodulierten harmonischen Träger wie in Abbildung 7.38. Wenn sich die Welle in einem Medium mit negativem Brechungsindex fortpflanzt, hat sie eine negative Phasengeschwindigkeit, und das kann nur bedeuten, dass der Träger rückwärts propagiert. Der Puls bewegt sich vorwärts, die mit der Störung verbundene Energie bewegt sich vorwärts, doch der Träger bewegt sich rückwärts. Das behalten wir im Hinterkopf, und nehmen nun an, dass ein Laser von einem, allerdings hypothetischen, Medium mit negativem Brechungsindex umgeben ist. Der Strahl beleuchtet eine entfernte Wand, wobei die Energie wie gewöhnlich mit der Gruppengeschwindigkeit vorwärts, d. h. in Richtung der Wand, propagiert. Doch anstatt auseinanderzulaufen, würde der Strahl konvergieren. Wenn wir den Träger sehen könnten, würden wir beobachten, wie die harmonischen Elementarwellen von der Wand kommend rückwärts zum Laser wandern. Mit anderen Worten, obwohl sich das Wellenpaket mit vg weg vom Laser bewegt und dabei Energie mit sich führt, fließen die konstituierenden Fourier-Komponenten mit v zurück in Richtung der Quelle (siehe Abbildung 4.30).

7 Superposition von Wellen

632

Aufgaben Lösungen zu den Aufgaben ohne ∗ finden Sie am Ende des Buches. 7.1

Bestimmen Sie die Resultierende der Superposition der parallelen Wellen E1 = E01 sin (ωt + ε1 ) und E2 = E02 sin (ωt + ε2 ), wenn ω = 120π, E01 = 6, E02 = 8, ε1 = 0 und ε2 = π/2. Zeichnen Sie die gegebenen Funktionen und die Resultierende.

7.2* Angenommen, wir wären bei der Suche nach E = E1 + E2 in Abschnitt 7.1 von zwei Kosinusfunktionen E1 = E01 cos (ωt + α1 ) und E2 = E02 cos (ωt + α2 ) ausgegangen. Um uns die Rechnung zu erleichtern, setzen wir E01 = E02 und α1 = 0. Addieren Sie die beiden Wellen algebraisch und nutzen Sie die bekannte trigonometrische Gleichung cos θ + cos Φ = 2 cos 12 (θ + Φ) cos 12 (θ − Φ) aus, um zu zeigen, dass E = E0 cos (ωt + α) ist mit E0 = 2E01 cos α2 /2 und α = α2 /2. Zeigen Sie nun, dass dieselben Ergebnisse aus den Gleichungen (7.9) und (7.10) folgen. 7.3* Die beiden Wellen der Gleichung (7.5) seien in Phase. Zeigen Sie, dass das Quadrat der 2 resultierenden Amplitude dann ein Maximum und gleich (E01 + E01 ) ist. Zeigen Sie, 2 dass ein Minimum gleich (E01 − E02 ) vorliegt, wenn die Wellen außer Phase sind. 7.4* Zeigen Sie, dass die optische Weglänge (definiert als Summe der Produkte aus den verschiedenen Brechungsindizes und der vom Strahl durchlaufenen jeweiligen Mediendicke, Σi ni x ) gleich der Länge des Weges im Vakuum ist, den der Strahl in der gleichen Zeit zurücklegt. 7.5

a) Wie viele Wellenlängen von λ0 = 500 nm kommen auf einen 1 m langen Lichtstrahl im Vakuum? b) Wie viele Wellenlängen sind es, wenn eine 5 cm dicke Glasplatte (n = 1,5) in den Weg gebracht wird? c) Bestimmen Sie den optischen Wegunterschied zwischen den beiden Fällen. d) Verifizieren Sie, dass Λ/λ0 der Differenz zwischen den Lösungen zu (a) und (b) entspricht.

7.6* Bestimmen Sie den optischen Wegunterschied für die Wellen A und B, die beide im Vakuum Wellenlängen von 500 nm haben (Abb. A.7.6). Der Glasbehälter (n = 1,52) sei mit Wasser (n = 1,33) gefüllt. Wie groß ist der relative Phasenunterschied an der Ziellinie, wenn die Wellen phasengleich starten und alle obigen Zahlen exakt sind? 0.5 cm

10 cm 0.5 cm

Start A B 100 cm

Ziel

Abb. A.7.6

Aufgaben

633

7.7* Zeigen Sie unter Verwendung der Gleichungen (7.9), (7.10) und (7.11), dass die Resultierende der beiden Wellen E1 = E01 sin [ωt − k (x + Δx)] gleich

 E = 2E01 cos

k Δx 2



und E2 = E01 sin (ωt − kx)

   Δx sin ωt − k x + 2

[7.17]

ist. 7.8

Addieren Sie die beiden Wellen aus Aufgabe 7.7 direkt, um den Ausdruck (7.17) zu erhalten.

7.9

Wenden Sie die komplexe Darstellung an, um die Resultierende E = E1 + E2 mit E1 = E0 cos (kx + ωt)

und E2 = −E0 cos (kx − ωt)

zu bestimmen. Beschreiben Sie die zusammengesetzte Welle. 7.10* Betrachten Sie die Funktionen E1 = 3 cos ωt und E2 = 4 sin ωt. Beweisen Sie zunächst, dass E2 = 4 cos (ωt − π/2). Zeigen Sie dann mithilfe von Zeigern und Abbildung A.7.10, dass E3 = E1 + E2 = 5 cos (ωt − ϕ) ist, und bestimmen Sie ϕ. Diskutieren Sie die Werte von E3 , wenn entweder E1 = 0 oder E2 = 0 gilt. Eilt E3 E1 voraus oder nach? Erklären Sie Ihre Antwort. 3 1 −1 −3

3∠0 π

4 2 0 −2 −4





ωt

4∠ − π/2 π π 2





ωt

5 5∠ − ϕ

3 0 −3 −5

ϕ

π





ωt

Abb. A.7.10

7.11* Bestimmen Sie mithilfe von Zeigern die Amplitude und die Phase der durch ψ(t) = 6 cos ωt + 4 cos(ωt + π/2) + 3 cos(ωt + π) gegebenen Wellenform. Zeichnen Sie dazu ein Diagramm. Mit anderen Worten, bestimmen Sie aus der Kenntnis, dass ψ(t) = A cos(ωt + α) ist, mithilfe von Lineal und Winkelmesser die Parameter A und α. 7.12* Bestimmen Sie mithilfe von Zeigern die Amplitude und die Phase der durch ψ(t) = 16 cos ωt + 8 cos(ωt + π/2) + 4 cos(ωt + π) + 2 cos(ωt + 3π/2)

7 Superposition von Wellen

634

gegebenen Wellenform. Mit anderen Worten, bestimmen Sie aus der Kenntnis, dass ψ(t) = A cos(ωt + α)A ist, mit Lineal und Winkelmesser die Parameter A und α. 7.13 Das elektrische Feld einer stehenden elektromagnetischen Welle ist durch E (x, t) = 2E0 sin kx cos ωt

[7.30]

gegeben. Leiten Sie den Ausdruck für B (x, t) her (siehe Abschn. 3.2). Fertigen Sie eine Skizze der stehenden Welle an. 7.14* Wir betrachten Wieners Experiment (Abb. 7.1) in monochromatischem Licht der Wellenlänge 550 nm. Die Ebene des Films bildet einen Winkel von 1◦ mit der reflektierenden Fläche. Bestimmen Sie die Anzahl der hellen Streifen, die pro Zentimeter auf der Fläche erscheinen. 7.15* Mikrowellen der Frequenz 1010 Hz werden direkt auf einen Metallreflektor gestrahlt. Bestimmen Sie unter Vernachlässigung des Brechungsindex der Luft den Abstand zwischen aufeinanderfolgenden Knoten in dem resultierenden stehenden Wellenmuster. 7.16* Eine stehende Welle sei durch 2 E = 100 sin πx cos 5πt 3 gegeben. Bestimmen Sie zwei Wellen, deren Superposition die stehende Welle ergibt. 7.17* Zeigen Sie, dass eine stehende Welle, die aus den zwei Wellen mit verschiedenen Amplituden, EI = E0 sin(kx ∓ ωt)

und

ER = ρE0 sin(kx ± ωt)

gebildet wird, folgende Form hat: E = 2ρE0 sin kx cos ωt + (1 − ρ)E0 sin(kx ∓ ωt) . Hierbei ist ρ das Verhältnis der reflektierten zur einfallenden Amplitude. Diskutieren Sie die Bedeutung der beiden Terme. Was passiert im Falle ρ = 1? 7.18* Was hören wir, wenn wir zwei Stimmgabeln anschlagen, von denen eine mit 340 Hz und eine mit 342 Hz schwingt? 7.19* Wenden Sie für folgende Aufgabe die Zeigermethode an, wie sie anhand von Abbildung 7.17 beschrieben wurde. Erklären Sie, wie aus der Superposition zweier Wellen mit gleicher Amplitude, aber geringfügig verschiedener Frequenz das in den Abbildungen 7.19 oder A.7.19 a gezeigte Schwebungsmuster entsteht. In Abbildung A.7.19 b wurde die Phase der Resultierenden skizziert, gemessen bezüglich einer der beteiligten Wellen. Erläutern Sie die wichtigsten Merkmale dieser Kurve. Wo und warum treten Nullstellen auf? Wo und warum ändert sich plötzlich die Phase? 7.20* Wie wir gesehen haben, beschreibt Gleichung (7.33) das Schwebungsmuster. Wir wollen nun eine alternative Form dieses Ausdrucks herleiten und nehmen dazu an, die beiden einander überlagernden, kosinusförmigen Wellen gleicher Amplitude haben Raumfrequenzen von kc + Δk bzw. kc − Δk und Winkelfrequenzen von ωc + Δω bzw. ωc − Δω. Dabei entsprechen kc und ωc jeweils den mittleren Werten. Zeigen Sie, dass die resultierende Welle dann gegeben ist durch E = 2E01 cos (Δkx − Δωt) cos (kc x − ωc t) .

Aufgaben

635

Abb. A.7.19

Setzen Sie die einzelnen Terme zu den Termen von Gleichung (7.33),   E = 2E01 cos (km x − ωm t) cos kx − ωt ,

[7.33]

in Beziehung. Beweisen Sie, dass die Geschwindigkeit der Einhüllenden – das ist deren Wellenlänge geteilt durch deren Periode – gleich der Gruppengeschwindigkeit, also Δω/Δk ist. 7.21 Abbildung A.7.21 zeigt eine Trägerwelle der Frequenz ωc , die durch eine Sinuswelle der Frequenz ωm amplitudenmoduliert wird: E = E0 (1 + a cos ωm t) cos ωc t . Zeigen Sie, dass dies äquivalent zur Superposition dreier Wellen der Frequenzen ωc , ωc + ωm und ωc − ωm ist. Sind mehrere Modulationsfrequenzen vorhanden, so schreiben wir E als Fourier-Reihe und summieren über alle ωm -Werte. Die Glieder ωc + ωm sind das obere Seitenband, die Glieder ωc − ωm das untere Seitenband. Welche Bandbreite würden Sie benötigen, um den gesamten hörbaren Bereich zu übertragen?

E

Bild A.7.21

2

7.22 Gegeben sei eine Dispersionsrelation ω = ak . Berechnen Sie die Phasen- und die Gruppengeschwindigkeit. 7.23* Gehen Sie davon aus, dass vg = dω/dk ist, und beweisen Sie vg = −λ2

dν . dλ

7.24* Zeigen Sie, dass vg =

c d(1/n) c + . n λ d(1/λ)

[Hinweis: Beweisen Sie zunächst, dass vg = dν/d(1/λ).]

7 Superposition von Wellen

636

7.25* Zeigen Sie, ausgehend von der vorherigen Aufgabe, dass  dn c . vg = v 1 − λn2 d(1/λ) Beweisen Sie dann, dass wegen d dν d = d(1λ) d(1/λ) dν gelten muss v vg = . 1 + (ν/n)(dn/dν) Überzeugen Sie sich durch Überprüfen der Einheiten davon, dass dieser Ausdruck korrekt ist. 7.26* Bei einer Wellenlänge von 1100 nm hat reines Silikatglas einen Brechungsindex von 1,449. (a) Bestimmen Sie unter Verwendung von Abbildung 7.22 den Gruppenindex bei dieser Wellenlänge. (b) Bestimmen Sie dann die Gruppengeschwindigkeit und (c) vergleichen Sie diese mit der Phasengeschwindigkeit. 7.27* Beweisen Sie unter Verwendung der Beziehung 1/vg = dκ/dν, dass ν dv 1 1 . = − 2 vg v v dν 7.28* Beweisen Sie für Lichtwellen, dass 1 n ν dn . = − vg c c dν 7.29 Die Fortpflanzungsgeschwindigkeit (Phasengeschwindigkeit) einer Oberflächenwelle auf einer Flüssigkeit mit einer Tiefe, die viel größer als λ ist, ergibt sich zu & gλ 2πY v= + . 2π ρλ Dabei ist g die Erdbeschleunigung, λ die Wellenlänge, ρ die Dichte und Y die Oberflächenspannung. Berechnen Sie die Gruppengeschwindigkeit eines Impulses für den Grenzfall langer Wellen (diese nennt man Schwerewellen). 7.30* Zeigen Sie, dass die Gruppengeschwindigkeit als dν vg = v − λ dλ geschrieben werden kann. 7.31 Zeigen Sie, dass die Gruppengeschwindigkeit als c vg = n + ω (dn/dω) geschrieben werden kann. 7.32* Beweisen Sie in Anlehnung an Aufgabe 7.24, dass ng = n (ν) + ν

dn (ν) . dν

Aufgaben

637

7.33* Zeigen Sie, ausgehend von der vorherigen Aufgabe, dass dn . ng = n − λ dλ 7.34* In einem bekannten Optik-Lehrbuch ist die Gleichung   c c dn 1 dn dω = = 2 =v 1− vg = dk n n dk n dk angegeben. Kann das richtig sein? Erläutern Sie Ihre Antwort. [Hinweis: Überprüfen Sie die Einheiten.] 7.35* Bestimmen Sie die Gruppengeschwindigkeit von Wellen, wenn die Phasengeschwindigkeit zur Wellenlänge umgekehrt proportional ist. 7.36* Zeigen Sie, dass man die Gruppengeschwindigkeit als λc dn c vg = + 2 n n dλ schreiben kann. 7.37* Für Licht der Wellenlänge λ1 = 656,3 nm hat Wasser einen Brechungsindex von n1 = 1,3311. Für die Wellenlänge λ1 = 589,3 nm ist der Brechungsindex n2 = 1,3330. Bestimmen Sie einen Näherungswert für die Gruppengeschwindigkeit von Licht in Wasser. Ist v > vg ? [Hinweis: Schauen Sie sich noch einmal Aufgabe 7.36 an, nähern Sie die Differentiale durch endliche Differenzen und erinnern Sie sich an das ω in der Definition von vg . Achten Sie auf den Anstieg von n relativ zu λ.] 7.38* Gegeben sei eine Welle, die sich in einer periodischen Struktur mit ω(k) = 2ω0 sin(k/2) ausbreitet. Bestimmen Sie Phase und Gruppengeschwindigkeit. Schreiben Sie Erstere als sinc-Funktion auf. 7.39* Ein ionisiertes Gas oder Plasma ist ein dispergierendes Medium für elektromagnetische Wellen. Die Dispersionsgleichung sei ω 2 = ωP2 + c2 k 2 , wobei ωP die konstante Plasmafrequenz ist. Leiten Sie Gleichungen sowohl für die Phasengeschwindigkeit als auch für die Gruppengeschwindigkeit ab und zeigen Sie, dass vvg = c2 ist. 7.40 Zeigen Sie unter Verwendung der Dispersionsgleichung   fj N qe2  2 , n (ω) = 1 + 2 − ω2  0 me j ω0j

[3.71]

dass die Gruppengeschwindigkeit für hochfrequente Wellen (z. B. Röntgenstrahlen) durch c vg = 2 1 + N qe /20 me ω 2 gegeben ist. Denken Sie daran, dass Σj fj = 1 ist, weil die fj die Wichtungsfaktoren sind. Wie groß ist die Phasengeschwindigkeit? Zeigen Sie, dass vvg ≈ c2 ist. 7.41* Bestimmen Sie analytisch die Resultierende der Superposition von E1 = 2E0 cos ωt und E2 = 12 E0 sin 2ωt. Zeichnen Sie E1 , E2 und E = E1 + E2 . Ist die Resultierende periodisch? Wenn ja, wie lautet ihre Periode in Abhängigkeit von ω?

7 Superposition von Wellen

638

7.42* Abbildung A.7.42 zeigt (in beliebigen Einheiten) die zeitliche Entwicklung eines elektrischen Feldes und die Fourier-Komponenten, aus denen es zusammengesetzt ist. Der entsprechende analytische Ausdruck ist 1 1 1 1 E(t) = + sin ωt + cos 2ωt + sin 2ωt + sin 3ωt . 3 6 8 6 (a) Erklären Sie, warum die Reihe sowohl Sinus- als auch Kosinusterme enthält. (b) Warum sind einige der harmonischen Terme geradzahlige Vielfache von ωt und andere ungeradzahlige Vielfache? (c) Welchen Wert hat der Gleichstromterm? (d) Welchen Wert hat A0 ? (e) Wie groß ist die Periode von E(t)? (f) Zeichnen Sie das Frequenzspektrum einschließlich des (ω = 0)-Terms.

elektrisches Feld

(a)

elektrisches Feld

(b)

1.2 0.8 0.4 0 –0.4 –0.8

E(t)

1 2 3 4 5 6 7 8 9 10

1.2 0.8 0.4 0 –0.4 –0.8

5

10

15

Zeit

15

Zeit

Bild A.7.42

7.43 Zeigen Sie, dass ˆ λ sin akx cos bkx dx = 0

[7.44]

0

ˆ

λ

cos akx cos bkx dx = 0

ˆ

λ

sin akx sin bkx dx = 0

λ δab 2

[7.45]

λ δab , 2

[7.46]

wobei a = 0, b = 0, und a und b positive ganze Zahlen sind. 7.44 Berechnen Sie die Komponenten der Fourier-Reihe für die periodische Funktion in Abbildung 7.35. 7.45* Bestimmen Sie die Fourier-Reihe für die in Abbildung A.7.45 gezeigte Funktion.

Aufgaben

639 f(x) 2 –4

–2

0

2

4

x

Bild A.7.45

7.46* Bestimmen Sie die Fourier-Reihe der Funktion f (x) = A cos (πx/L). 7.47* Betrachten Sie die über eine Wellenlänge definierte Funktion f (x) = (kx)2

mit

− π < kx < π ,

die sich mit einer Periode von 2π fortwährend wiederholt. Skizzieren Sie f (x) und bestimmen Sie die zugehörige Fourier-Darstellung. 7.48* Betrachten Sie die Funktion f (θ) = θ2 im Intervall 0 < θ < 2π, die sich mit der Periode 2π wiederholen soll. Zeigen Sie, dass die Fourier-Reihe dieser Funktion  ∞   4π 2 4 4π + sin mθ f (x) = cos mθ − 3 m2 m m=1 ist. 7.49* Zeigen Sie, dass die Fourier-Reihe der Funktion f (θ) = |sin θ| ∞ 2 4  cos 2mθ f (θ) = − π π m=1 4m2 − 1 ist. 7.50 Ändern Sie die obere Grenze von Gleichung (7.59) von ∞ in a und berechnen Sie das Integral. Erfassen Sie die Lösung in Ausdrücken des so genannten Integralsinus ˆ z Si (z) = sinc w dw . 0

Die Werte dieser Funktion liegen in tabellierter Form vor. 7.51* Betrachten Sie die periodische Funktion E(t) = E0 cos ωt und nehmen Sie an, dass alle negativen Halbperioden entfernt wurden. Bestimmen Sie die Fourier-Reihe der modifizierten Funktion. 7.52* Betrachten Sie die über eine Wellenlänge definierte periodische Funktion $ sin kx 0 < kx < π f (x) = 0 π < kx < 2π Bestimmen Sie die Fourier-Darstellung von f (x). Skizzieren Sie f (x). 7.53* Betrachten Sie Abbildung A.7.53, in der drei periodische Funktionen und ihre jeweiligen Fourier-Spektren dargestellt sind. Diskutieren Sie die Graphen und erklären Sie, was in den aufeinanderfolgenden Abschnitten passiert. Wie verhalten sich die Einhüllenden der Frequenzspektren, wenn die Wellenlänge zunimmt? Warum gibt es in jedem

7 Superposition von Wellen

640

Spektrum innerhalb eines bestimmten Frequenzbereichs, z. B. zwischen 0 und 4k, die gleiche Anzahl von Frequenztermen? Warum gibt es in jedem Spektrum einen Gleichstromterm und warum hat dieser überall den gleichen Wert? Warum gibt es keine Terme, die A2 , A4 , A6 usw. entsprechen? f (x)

Am A0

(a) l = 0.5

x

f (x)

A1 k

0

2k

A3

Am A0

(b) l = 1.0

x

f (x)

A5 k 2k

0

A0

l = 3.0

x

mk

A1

Am

(c)

4k

A1

0 k

3k

A3

A5 A9 7k

4k

mk

mk

Bild A.7.53

7.54 Schreiben Sie einen Ausdruck für die Transformierte A (ω) des harmonischen Impulses in Abbildung A.7.54 auf. Prüfen Sie nach, dass sinc u 50 % (oder 0,5) oder mehr für Werte von u ist, die in etwa kleiner als π/2 sind. Verwenden Sie dies um zu zeigen, E(t) dass ΔνΔt ≈ 1 ist, wobei Δν die BandE0 breite der Transformierten bei der Hälfte E(t) = E0 cos ωp t ihrer Amplitude ist. Prüfen Sie außerdem t nach, dass bei der Hälfte der maximalen Bestrahlungsstärke ΔνΔt ≈ 1 ist. (Wir wollen damit eine gewisse Vorstellung von Δt der Art der Näherungen erhalten, die in der Diskussion verwendet werden.) Bild A.7.54 7.55 Leiten Sie einen Ausdruck für die Kohärenzlänge (im Vakuum) eines Wellenzuges mit der Frequenzbandbreite Δν her. Geben Sie Ihre Antwort in Abhängigkeit von der ¯ 0 des Wellenzuges an. Linienbreite Δλ0 und der mittleren Wellenlänge λ 7.56* Eine blaue LED mit einer mittleren Wellenlänge von 446 nm hat eine Linienbreite von 21 nm. Bestimmen Sie die Kohärenzzeit und die Kohärenzlänge. 7.57 Betrachten Sie ein Photon im sichtbaren Bereich des Spektrums, das während eines atomaren Übergangs von etwa 10−8 s Dauer emittiert wird. Wie lang ist das Wellenpaket?

Aufgaben

641

¯ 0 = 500 nm) unter Beachtung der ErgebSchätzen Sie die Linienbreite des Paketes (λ nisse der vorangegangenen Aufgabe ab. Was können Sie über seine Monochromatizität sagen, die man an der Frequenzkonstanz erkennen kann? 7.58 Das erste Experiment8, in dem die Bandbreite eines Lasers (in diesem Fall eines kontinuierlichen Pb0,88 Sn0,12 Te-Diodenlasers) direkt bestimmt wurde, wurde 1969 durchgeführt. Der Laser, der bei λ0 = 10 600 nm arbeitete, wurde mit einem CO2 -Laser überlagert, wobei Bandbreiten von nur 54 kHz beobachtet wurden. Berechnen Sie die entsprechende Frequenzstabilität und Kohärenzlänge für den Blei-Zinn-Tellurid-Laser. 7.59* Eine Magnetfeld-Technik zur Stabilisierung eines He-Ne-Lasers bis auf zwei Teile von 1010 wurde patentiert. Wie groß wäre die Kohärenzlänge eines Lasers bei 632,8 nm mit einer derartigen Frequenzkonstanz? 7.60 Stellen Sie sich vor, wir zerhacken einen kontinuierlichen Laserstrahl (monochromatisch bei λ0 = 632,8 nm) unter Verwendung irgendeines Verschlusses in Pulse von 0,1 ns Dauer. Berechnen Sie die resultierende Linienbreite Δλ, die Bandbreite und die Kohärenzlänge. Bestimmen Sie die Bandbreite und die Linienbreite, die sich ergäbe, wenn wir den Strahl mit 1015 Hz zerhackten. 7.61* Ein Filter habe einen Durchlassbereich von 1,0 Å (0,1 nm) mit dem Zentrum bei 600 nm. Wie groß ist die Kohärenzlänge der durchgelassenen Welle bei Beleuchtung des Filters mit Sonnenlicht? ¯ 0 = 500 nm durch. Die 7.62* Ein Filter lässt Licht mit einer mittleren Wellenlänge von λ ¯ austretenden Wellen seien etwa 20λ0 lang. Wie groß ist die Frequenzbandbreite des austretenden Lichts? 7.63* Angenommen, wir teilen weißes Licht mithilfe eines Beugungsgitters in verschiedene Wellenlängen und leiten einen kleinen, ausgewählten Bereich dieses Spektrums durch einen Spalt. Aufgrund der Breite des Spaltes tritt ein 1,2 nm breites Wellenlängenbündel aus, dessen Zentrum bei 500 nm liegt. Bestimmen Sie die Frequenzbandbreite und die Kohärenzlänge dieses Lichts.

8

D. Hinkley und C. Freed, Phys. Rev. Letters 23 (1969) 277.

8

Polarisation

8.1

Die Natur des polarisierten Lichts

Wir haben bereits dargelegt, dass Licht als eine transversale elektromagnetische Welle betrachtet werden kann. Bisher haben wir nur linear (in einer Ebene) polarisiertes Licht betrachtet, also Licht, bei dem die Orientierung des elektrischen Feldes konstant ist, während sich Betrag und Vorzeichen zeitlich verändern (Abb. 3.14). Das elektrische Feld oder die optische Schwingung liegt deshalb in der so genannten Schwingungsebene, welche sowohl E, den elektrischen Feldvektor, als auch k, den Propagationsvektor in Ausbreitungsrichtung, enthält. Wir betrachten nun zwei harmonische, linear polarisierte Lichtwellen gleicher Frequenz, die sich durch denselben Raumbereich in dieselbe Richtung bewegen. Sind ihre elektrischen Feldvektoren parallel, so überlagern sich die Schwingungen einfach zu einer linear polarisierten Welle. Ihre Amplitude und Phase unter verschiedenen Bedingungen wollen wir im nächsten Kapitel untersuchen, wenn wir das Phänomen der Interferenz behandeln. Stehen dagegen die elektrischen Felder der beiden Lichtwellen senkrecht aufeinander, so muss die resultierende Welle nicht notwendigerweise linear polarisiert sein. In diesem Kapitel wird uns der Polarisationszustand des Lichts beschäftigen, seine Beobachtung, Erzeugung, Änderung und Anwendung.

Viele Tiere können Variationen der Polarisation so deutlich unterscheiden wie wir Farben. Ein Beispiel ist dieser Zwergkrake: Das an seiner Oberfläche reflektierte wechselnde Muster polarisierten Lichts lässt vermuten, dass der Oktopus auf diese Weise mit seinen Artgenossen kommuniziert, ähnlich wie manche Vogelarten es mit Farbänderungen tun. (Foto mit frdl. Genehmigung von Thomas W. Coronin und Nadav Shashar, University of Maryland.) https://doi.org/10.1515/9783111025599-008

8 Polarisation

644

8.1.1 Lineare Polarisation Wir können die beiden oben erwähnten orthogonalen optischen Schwingungen in der Form Ex (z, t) = ˆıE0x cos (kz − ωt)

(8.1)

Ey (z, t) = ˆjE0y cos (kz − ωt + ε)

(8.2)

und aufschreiben, wobei ε der relative Phasenwinkel zwischen den beiden Wellen ist, die sich beide in z-Richtung bewegen. Wie wir wissen, bewirkt die Addition eines positiven ε zu einer Phase in der Form (kz − ωt), dass die Kosinusfunktion in Gleichung (8.2) denselben Wert wie die Kosinusfunktion in der Gleichung (8.1) erst zu einer späteren Zeit (ε/ω) erreicht. Daher eilt Ey der Komponente Ex um einen Betrag ε > 0 nach. (Ist ε eine negative Größe, so eilt Ey der Komponente Ex natürlich effektiv um ε < 0 voraus.) Die resultierende optische Welle ist die vektorielle Summe der beiden zueinander senkrecht stehenden Wellen: E(z, t) = Ex (z, t) + Ey (z, t) .

(8.3)

Ist ε = 0 oder ein ganzzahliges Vielfaches von ±2π, so sind die Wellen in Phase (phasengleich). In diesem Spezialfall wird Gleichung (8.3) zu E = (ˆıE0x + ˆjE0y ) cos (kz − ωt) .

(8.4)

Die resultierende Welle hat dann eine feste Amplitude (ˆıE0x + ˆjE0y ); mit anderen Worten, auch sie ist linear polarisiert (Abb. 8.1). Die Wellen bewegen sich auf eine Beobachtungsebene zu, auf der die Felder gemessen werden sollen. Dort sieht man ein (a)

(b)

y

(c)

E Ey

E Ex

Ey

E

x z

y Ey

E

Ex

x

E Ex E

E

Ey

E

Ex

Ex

z

Ex E

E Ex E

Ey

Ey

Ey

Abb. 8.1: Linear polarisiertes Licht. (a) Das E-Feld ist im ersten und dritten Quadranten linear polarisiert. (b) Dasselbe oszillierende Feld, von vorn gesehen. (c) Im zweiten und vierten Quadranten linear polarisiertes Licht.

8.1 Die Natur des polarisierten Lichts

645

einzelnes resultierendes E-Feld längs einer geneigten Ebene zeitlich kosinusförmig schwingen (Abb. 8.1 b). Der Neigungswinkel θ ist bestimmt durch die Amplituden der ursprünglichen orthogonalen Wellen. Aus Gleichung (8.4) folgt tan θ =

E0y , E0x

und wenn, wie in Abbildung 8.1, E0x = E0y gilt, oszilliert das elektrische Feld in einer Ebene mit dem Neigungswinkel θ = 45◦ . Das E-Feld durchläuft einen vollständigen Schwingungszyklus, während die Welle längs der z-Achse eine Wellenlänge voranschreitet. Dieser Vorgang lässt sich ebenso gut umkehren, d. h., wir können jede beliebige linear polarisierte Welle in zwei orthogonale Komponenten zerlegen. Beispiel 8.1 Angenommen, Ey (z, t) läuft Ex (z, t) um 2π hinterher. Zeigen Sie explizit, dass die resultierende Welle dann durch Gleichung (8.4) gegeben ist. Lösung Wenn Ey (z, t) um 2π hinterherläuft, ist E = ˆıE0x cos(kz − ωt) + ˆjE0y cos(kz − ωt + 2π) . Unter Verwendung der Identität cos(x ± y) = cos x cos y ∓ sin x sin y erhalten wir als resultierende Welle E = ˆıE0x cos(kz−ωt)+ˆjE0y [cos(kz−ωt) cos 2π−sin(kz−ωt) sin 2π] und somit E = (ˆıE0x + ˆjE0y ) cos(kz − ωt) , was zu beweisen war.

Die kosmische Mikrowellen-Hintergrundstrahlung wurde von heißem Plasma in einer sehr frühen Phase des Universums emittiert. Die Linien sollen eine grobe Vorstellung von der Polarisation der Strahlung geben.

8 Polarisation

646

Nun sei ε ein ungeradzahliges Vielfaches von ±π. Die beiden Wellen sind dann um 180◦ außer Phase, und E = (ˆıE0x − ˆjE0y ) cos (kz − ωt) .

(8.5)

Diese Welle ist wieder linear polarisiert, jedoch wurde die Schwingungsebene im Vergleich zur vorangegangenen Situation gedreht (Abb. 8.2), und zwar nicht notwendigerweise um 90◦ . (a)



E

y



E

x z



Ey



Ex



E

Ey

Ex

E

(b)



E

Abb. 8.2: (a) Linear polarisiertes, im zweiten und vierten Quadranten schwingendes Lichtfeld. (b) Die x-Komponente eilt der y-Komponente um eine halbe Periode (oder π) voraus. Wenn Ey gerade anfängt, nach oben zu gehen, hat Ex schon ein positives Maximum durchlaufen, ist auf null gefallen und beginnt gerade, in die negative x-Richtung zu laufen.

Beispiel 8.2 Angenommen, Ey (z, t) läuft Ex (z, t) um π hinterher. Zeigen Sie explizit, dass die resultierende Welle dann durch Gleichung (8.5) gegeben ist. Lösung Wenn Ey (z, t) der Komponente Ex (z, t) um π hinterherläuft, ist E = ˆıE0x cos(kz − ωt) + ˆjE0y cos(kz − ωt + π) . Unter Verwendung der Identität cos(x ± y) = cos x cos y ∓ sin x sin y

8.1 Die Natur des polarisierten Lichts

647

erhalten wir als resultierende Welle E = ˆıE0x cos(kz−ωt)+ˆjE0y [cos(kz−ωt) cos π)−sin(kz−ωt) sin π] und somit E = (ˆıE0x − ˆjE0y ) cos(kz − ωt), was zu beweisen war. Die Zeigeraddition ist ein äußerst nützliches Hilfsmittel bei der Superposition von orthogonalen Wellen wie den durch die Gleichungen (8.1) und (8.2) gegebenen. Die Nützlichkeit der Methode wird später in diesem Kapitel offensichtlich werden, wenn wir die Phasen von zwei Wellen verschieben, indem wir sie durch ein anisotropes Medium gehen lassen. Abbildung 8.3 illustriert das grundlegende Prinzip für den einfachen Fall zweier orthogonaler Wellen, die phasengleich sind, ε = 0. Ey

1, 1

2, 2

3, 3

0

0, 0 8, 8 7, 7

u 6, 6

E0y

7

1

6

2

5

5, 5

3 4

4, 4

6 5

7

4

0 E0x Ex 3

1 2

Abb. 8.3: Zeigeraddition zweier orthogonaler Wellen mit gleicher Phase und den Amplituden E0x und E0y . Beide drehen sich mit der Rate ω im Uhrzeigersinn.

Die Radien der beiden Kreise entsprechen den beiden Amplituden der elektrischen Felder, und es gilt hier E0y > E0x . Der Ey -Zeiger zeigt an seiner unverschobenen Position 0 senkrecht nach unten und dreht sich dann im Uhrzeigersinn. In jedem Moment entspricht die durch (8.2) gegebene, in y-Richtung oszillierende Welle der Projektion des rotierenden Ey -Zeigers auf die y-Achse. Wie wir bald sehen werden, wird durch eine anfängliche Phasenverschiebung einfach die Referenzachse aus der Vertikalen gedreht, d. h., die Position 0 wird geändert. Entsprechend zeigt der Ex Zeiger in Position 0 horizontal nach rechts. Auch er rotiert im Uhrzeigersinn, und zwar mit der gleichen Rate ω wie Ey . In jedem Moment entspricht die durch (8.1) gegebene, in x-Richtung oszillierende Welle der Projektion des rotierenden Ex -Zeigers auf die x-Achse.

8 Polarisation

648

Alle Zeiger drehen sich gleichmäßig in ihre jeweiligen Positionen 1, 2, 3 usw. Die resultierende Welle wird durch den Schnitt der horizontalen und vertikalen Projektionen der beiden Zeiger gebildet. Die Punkte (0, 0), (1, 1), (2, 2) usw., die im hier betrachteten Fall auf einer Geraden liegen, geben die Orte der jeweiligen Summen der beiden orthogonalen elektrischen Feldvektoren an [siehe Gl. (8.3)]. Die resultierende Welle ist in diesem Fall also linear polarisiert und schwingt im ersten und dritten Quadranten, wobei für den Neigungswinkel θ > 45◦ gilt, da E0y > E0x .

8.1.2 Zirkulare Polarisation Ein besonders interessanter Fall liegt vor, wenn die Amplituden der Einzelwellen gleich sind (E0x = E0y = E0 ) und außerdem ihr relativer Phasenunterschied ε = −π/2+2mπ mit m = 0, ±1, ±2, . . . beträgt. Mit anderen Worten ist dann ε = −π/2 oder ein anderer Wert plus oder minus ein ganzzahliges Vielfaches von 2π, und Ey (z, t) geht Ex (z, t) um π/2 voraus. Dementsprechend wird Ex (z, t) = ˆıE0 cos (kz − ωt) Ey (z, t) = ˆjE0 cos (kz − ωt − π/2) ,

(8.6) (8.7)

was äquivalent ist mit Ey (z, t) = ˆjE0 [cos(kz − ωt) cos π/2 + sin (kz − ωt) sin π/2] = ˆjE0 sin (kz − ωt) . y x z

E

Ey Ex

Ey

E Ex

Abb. 8.4: Rechtszirkular polarisiertes Licht. (a) Das elektrische Feld mit konstanter Amplitude rotiert hier im Uhrzeigersinn mit der gleichen Frequenz, mit der es auch oszilliert. (b) Zwei senkrecht zueinander stehende Antennen, die Wellen mit einer Phasendifferenz von 90◦ aussenden, erzeugen zirkular polarisierte elektromagnetische Strahlung.

8.1 Die Natur des polarisierten Lichts

649

y E

Ey

gsBezu achse

ωt kz0 Ex

E0

ωt = 0 ωt = π/4

π/4

x ωt = π/2 ωt = 3π/4 Zeit

(b)

(a)

Abb. 8.5: Rotation des elektrischen Feldvektors in einer rechtszirkular polarisierten Welle. Die Rotationsgeschwindigkeit ist hier ω, und kz = π/4.

Die resultierende Welle ist durch E = E0 [ˆı cos (kz − ωt) + ˆj sin (kz − ωt)]

(8.8)

gegeben (Abb. 8.4). Beachten Sie, dass die skalare Amplitude von E, d. h. (E·E)1/2 = E0 , nun eine Konstante ist. Die Richtung von E verändert sich allerdings mit der Zeit und ist nicht, wie bisher, auf eine einzelne Ebene beschränkt. Abbildung 8.5 zeigt die Verhältnisse in einem beliebigen Punkt z0 auf der Achse: Bei t = 0 liegt E in Abbildung 8.5 a auf der Bezugsachse, und so ist Ex = ˆıE0 cos kz0

und

Ey = ˆjE0 sin kz0 .

Zu einem späteren Zeitpunkt t = kz0 /ω ist Ex = ˆıE0 , Ey = 0, und E liegt auf der x-Achse. Der resultierende elektrische Feldvektor E dreht sich im Uhrzeigersinn mit der Kreisfrequenz ω. Diesen Eindruck hat ein Beobachter, der zur Quelle schaut und die Welle auf sich zukommen sieht. Eine solche Welle nennt man rechtszirkular polarisiert (Abb. 8.6) oder rechtszirkulares Licht. Der E-Vektor führt eine vollständige Drehung aus, während die Welle um eine Wellenlänge fortschreitet. Abbildung 8.7 zeigt fünf aufeinanderfolgende Momente der Entfaltung eines rechtszirkularen E-Feldes. Ey geht hier Ex um π/2 voraus, sodass in Teil (a) der Punkt auf der y-Achse (der Ey entspricht) seine maximale Auslenkung (E0 ) hat und im Begriff ist, nach unten zu wandern, während Ex gleich null ist und der Punkt auf der x-Achse nach rechts wandert. Das Nettofeld ist E = E0ˆj, und dieser Vektor dreht sich im Uhrzeigersinn, bis er in Teil (d) auf der x-Achse ist und E = E0ˆı gilt. Es bleibt dem Leser überlassen zu zeigen, wie die Zeigeraddition (in der Art und Weise wie in Abb. 8.3) zu zirkularem Licht führt.

8 Polarisation

650 y x

kz E

z

Abb. 8.6: Rechtszirkular polarisiertes Licht. Die z-Achse entlang in Richtung Ursprung gesehen, rotiert der elektrische Feldvektor im Uhrzeigersinn, wenn sich die Welle in Richtung des Beobachters ausbreitet.

B z

Wenn dagegen ε = π/2, 5π/2, 9π/2 usw. ist, also ε = π/2 + 2mπ mit m = 0, ±1, ±2, ±3, . . . , so wird E = E0 [ˆı cos (kz − ωt) − ˆj sin (kz − ωt)] ;

(8.9)

die Amplitude bleibt unbeeinflusst, doch E dreht sich nun entgegen dem Uhrzeigersinn. Die Welle heißt dann linkszirkular polarisiert. Eine linear polarisierte Welle kann aus zwei entgegengesetzt zirkular polarisierten Wellen gleicher Amplitude zusammengesetzt werden. Addieren wir die rechtszirkulare Welle aus Gleichung (8.8) zur linkszirkularen aus Gleichung (8.9), so erhalten wir E = 2E0ˆı cos (kz − ωt) .

(8.10)

Diese Welle hat einen konstanten Amplitudenvektor von 2E0ˆı und ist deshalb linear polarisiert. (a)

y

(b) y

(c)

y

E E

Ey = E0

E

Ey Ey x

Ex = 0 (d)

(e)

y

Ey = 0

E

x

Ex

Ex

x

y

Ex

x

x

Ex = E0 Ey

E

Abb. 8.7: Die Bildung von rechtszirkularem Licht. Beachten Sie, dass Ey um π/2 oder 1/4 vor Ex läuft.

8.1 Die Natur des polarisierten Lichts

651

8.1.3 Elliptische Polarisation Sowohl das linear als auch das zirkular polarisierte Licht sind Spezialfälle des elliptisch polarisierten (elliptischen) Lichts. Damit meinen wir Licht, dessen resultierender elektrischer Feldvektor E sowohl rotiert als auch seinen Betrag ändert. In solchen Fällen beschreibt der Endpunkt von E beim Durchlauf der Welle eine Ellipse auf einer senkrecht zu k stehenden Ebene. Wir verstehen dies besser, wenn wir einen Ausdruck für die Kurve aufschreiben, welche die Spitze von E durchläuft. Dazu erinnern wir uns, dass Ex = E0x cos (kz − ωt)

(8.11)

Ey = E0y cos (kz − ωt + ε)

(8.12)

und ist. Die Gleichung der gesuchten Kurve sollte weder eine Funktion des Ortes noch der Zeit sein, d. h., wir sollten uns von der Abhängigkeit von (kz − ωt) befreien können. Die Erweiterung des Ausdrucks für Ey zu Ey = cos (kz − ωt) cos ε − sin (kz − ωt) sin ε E0y und die Kombination mit der entsprechenden Beziehung für Ex /E0x liefert Ey Ex − cos ε = − sin (kz − ωt) sin ε . E0y E0x

(8.13)

Aus Gleichung (8.11) folgt 1/2

, sin (kz − ωt) = 1 − (Ex /E0x )2 und damit führt Gleichung (8.13) zu 2      Ex Ex 2 Ey − cos ε = 1 − sin2 ε . E0y E0x E0x Nach Umordnen erhalten wir schließlich        Ex 2 Ex Ey Ey 2 + −2 cos ε = sin2 ε . E0y E0x E0x E0y

(8.14)

Dies ist die Gleichung einer Ellipse, welche mit dem Koordinatensystem (Ex , Ey ) einen Winkel α bildet (Abb. 8.8), sodass tan 2α =

2E0x E0y cos ε 2 − E2 E0x 0y

(8.15)

8 Polarisation

652 E0y

Ey E α

E0x

Ex

Abb. 8.8: Elliptisch polarisiertes Licht. Die Spitze des elektrischen Feldvektors beschreibt bei jeder Umdrehung eine Ellipse.

ist. Gleichung (8.14) vereinfacht sich, wenn die Hauptachsen der Ellipse nach den Koordinatenachsen ausgerichtet werden, also α = 0 oder äquivalent ε = ±π/2, ±3π/2, ±5π/2, . . . . In diesen Fällen erhalten wir die gewohnte Form Ey2 Ex2 + 2 2 = 1. E0y E0x

(8.16)

Ist außerdem E0y = E0x = E0 , vereinfacht sich die Gleichung weiter zu Ey2 + Ex2 = E02 ,

(8.17)

was in Übereinstimmung mit unseren bisherigen Betrachtungen einem Kreis entspricht. Wenn ε ein geradzahliges Vielfaches von π ist, so führt Gleichung (8.14) zu Ey =

E0y Ex , E0x

(8.18)

und für ungeradzahlige Vielfache von π ergibt sich in ähnlicher Weise Ey = −

E0y Ex . E0x

(8.19)

Dies sind beides Geraden mit einer Steigung von ±E0y /E0x ; mit anderen Worten, wir haben linear polarisiertes Licht. Abbildung 8.9 fasst die meisten Schlussfolgerungen zusammen. Das Diagramm in Abbildung 8.9 a enthält unten die Beschriftung „Ex eilt Ey voraus um 0, π/4, π/2, 3π/4, . . . “: Dies sind die positiven Werte von ε, die in Gleichung (8.2) verwendet wurden. Die gleiche Menge Kurven entsteht im Fall „Ey eilt Ex voraus um 2π, 7π/4, 3π/2, 5π/4, . . . “, nämlich, wenn ε gleich −2π, −7π/4, −3π/2, −5π/4 usw. ist. Abbildung 8.9 b demonstriert die Äquivalenz der Aussagen „Ex eilt Ey um π/2 voraus“ und „Ey eilt Ex um 3π/2 voraus“ (wobei die Summe dieser beiden Winkel gleich 2π ist). Dieser Gedanke wird uns wieder interessieren, wenn wir die relativen Phasen der beiden orthogonalen Komponenten der Lichtwelle verschieben wollen. Um die allgemeine Natur von elliptischem Licht zu illustrieren, verwenden wir ein Zeigerdiagramm wie das in Abbildung 8.3. Angenommen, wir suchen die Resultierende zweier orthogonaler harmonischer elektrischer Felder mit unterschiedlichen Amplituden (E0x > E0y ), wobei Ey der Komponente Ex um 60◦ vorauseilt. Weil Ey vorauseilt, drehen wir die Ey -Referenzachse um π/3 rad oder 60◦ aus der Vertikalen,

8.1 Die Natur des polarisierten Lichts eilt

eilt

653

voraus um:

0

voraus um: 0 (a)

Abb. 8.9: (a) Verschiedene Konfigurationen der Polarisation. Das Licht wäre zirkular polarisiert bei ε = π/2 oder 3π/2, wenn E0x = E0y ist, doch im Sinne der allgemeinen Anwendbarkeit haben wir E0y größer gewählt als E0x . (b) Ex eilt Ey um π/2 voraus (oder Ey eilt Ex nach), oder, alternativ, Ey eilt Ex um 3π/2 voraus (bzw. Ex eilt Ey um diesen Betrag nach).

(b)

während die Ex -Achse horizontal bleibt. Abbildung 8.10 zeigt, dass das resultierende Licht rechtshändig elliptisch ist, wie man nach Abbildung 8.9 a erwartet. In Übereinstimmung mit Abbildung 8.8 passt die Ellipse in ein Rechteck der Höhe 2E0y und der Breite 2E0x .

9, 9

10, 10

11, 11

8, 8

1, 1

6, 6

9

2 4

3

10 11

6

0 5

1 3

1

5

7

4

Ey

0

6

2, 2

8

60° 11

7

3, 3

4, 4

10

8

0, 0

7, 7

5, 5

9

2

Ex

Abb. 8.10: Die Zeigerdarstellung der Superposition zweier elektromagnetischer Wellen. Hier gilt E0x > E0y , wobei diese Größen den Radien der Kreise entsprechen. Ey eilt Ex um 60◦ voraus, und daher ist die Position 0 von Ey um 60◦ (im Uhrzeigersinn) voraus.

654

8 Polarisation

Wir können nun Wellen nach ihrem Polarisationszustand klassifizieren. Dazu legen wir fest, dass sich linear polarisiertes Licht in einem P-Zustand, rechts- und linkszirkular polarisiertes Licht dagegen in einem R- bzw. in einem L-Zustand befindet. Die elliptische Polarisation entspricht einem E-Zustand. Wir haben bereits gelernt, dass ein P-Zustand als Superposition von R- und L-Zuständen [Gl. (8.10)] dargestellt werden kann, und dasselbe gilt für einen E-Zustand. In letzterem Fall sind die Amplituden der beiden zirkularen Wellen unterschiedlich (Abb. 8.11). (Die analytische Behandlung verschieben wir auf Aufgabe 8.6).

Abb. 8.11: Elliptisch polarisiertes Licht als Superposition eines R- und eines L-Zustands.

8.1.4 Natürliches Licht Eine gewöhnliche Lichtquelle besteht aus einer sehr großen Zahl zufällig ausgerichteter atomarer Strahler. Jedes angeregte Atom sendet etwa 10−8 s lang einen polarisierten Wellenzug aus. Alle diese Wellen gleicher Frequenz überlagern sich zu einer einzigen polarisierten Welle, die maximal 10−8 s lang stabil bleibt. Ständig werden neue Wellenzüge emittiert, und die Gesamtpolarisation ändert sich in unvorhersehbarer Weise. Finden diese Veränderungen mit so großer Geschwindigkeit statt, dass man die einzelnen resultierenden Polarisationszustände nicht mehr erkennen kann, so spricht man von natürlichem Licht oder unpolarisiertem Licht, wobei letztere Bezeichnung etwas irreführend ist, da sich das Licht in Wirklichkeit aus einer schnell veränderlichen Abfolge verschiedener Polarisationszustände zusammensetzt. Zufällig polarisiertes Licht ist wahrscheinlich eine treffendere Bezeichnung. Wir können natürliches Licht mathematisch anhand zweier beliebiger, inkohärenter, orthogonaler, linear polarisierter Wellen gleicher Amplitude aufschreiben, also Wellen, deren relativer Phasenunterschied sich schnell und zufällig verändert. Dabei wollen wir nicht vergessen, dass eine idealisierte monochromatische Welle als unendlicher Wellenzug dargestellt werden muss. Wird diese Welle in zwei orthogonale Komponenten senkrecht zur Fortpflanzungsrichtung zerlegt, so müssen die Komponenten ihrerseits dieselbe Frequenz besitzen, unendlich ausgedehnt und deshalb wechselseitig kohärent sein (ε = konstant). Mit anderen Worten: Eine ideal monochromatische ebene Welle ist immer polarisiert. Die Gleichungen (8.1) und (8.2)

8.1 Die Natur des polarisierten Lichts

655

sind in der Tat genau die kartesischen Komponenten einer transversalen (Ez = 0), harmonischen, ebenen Welle. In der Regel ist Licht, ob „natürlichen“ oder „künstlichen“ Ursprungs, weder vollkommen polarisiert noch unpolarisiert – beides sind Grenzfälle. Der elektrische Feldvektor verändert sich meistens weder völlig unregelmäßig noch völlig regelmäßig, weshalb man solches Licht auch teilweise polarisiert nennt. Am einfachsten beschreibt man dieses Verhalten mit einer Überlagerung von natürlichem und polarisiertem Licht.

8.1.5 Der Drehimpuls und das Photonenbild Wir haben bereits gelernt, dass eine elektromagnetische Welle, die auf ein Objekt trifft, auf dieses Energie und Impuls überträgt. Ist die einfallende ebene Welle außerdem zirkular polarisiert, so ist zu erwarten, dass die Elektronen innerhalb des Stoffes als Reaktion auf die Kraft, welche das rotierende E-Feld ausübt, in kreisförmige Bewegungen versetzt werden. Alternativ können wir das Feld als aus zwei orthogonalen, um 90◦ phasenverschobenen P-Zuständen bestehend darstellen. Diese lenken das Elektron gleichzeitig in zwei zueinander senkrechte Richtungen mit einem Phasenunterschied von π/2. Die resultierende Bewegung ist wieder zirkular. Das Drehmoment, das durch das B-Feld ausgeübt wird, mittelt sich auf einer Kreisbahn zu null, und das E-Feld treibt das Elektron mit einer Winkelgeschwindigkeit ω gleich der Frequenz der elektromagnetischen Welle an. Die Welle überträgt somit einen Drehimpuls auf die Substanz, in die die Elektronen eingebettet und an die sie gebunden sind. Wir können das Problem recht einfach behandeln, ohne uns mit den Einzelheiten der Dynamik zu befassen. Die Leistung, die dem System zugeführt wird, ist gleich der pro Zeiteinheit übertragenen Energie (dE/dt). Außerdem erzeugt ein Drehmoment Γ, das auf einen rotierenden Körper wirkt, gerade die Leistung ωΓ (analog zu vF bei der linearen Bewegung), und so gilt dE = ωΓ . dt

(8.20)

Da das Drehmoment gleich der zeitlichen Änderungsgeschwindigkeit des Drehimpulses ist, erhält man im Mittel dL dE =ω . (8.21) dt dt Eine Ladung, die aus der einfallenden zirkularen Welle eine Energiemenge E absorbiert, nimmt gleichzeitig einen Drehimpuls L auf, sodass L=

E ω

(8.22)

ist. Befindet sich die einfallende Welle in einem R-Zustand, so dreht sich ihr E-Vektor im Uhrzeigersinn (mit Blickrichtung gegen die Quelle). In diese Richtung würde

8 Polarisation

656

sich auch eine positive Ladung im absorbierenden Medium drehen; man lässt daher den Drehimpulsvektor in die der Fortpflanzung entgegengesetzte Richtung zeigen (Abb. 8.12).1 k L

L

p

k p

L-Zustand

R-Zustand

Abb. 8.12: Der Drehimpuls eines Photons.

Gemäß der quantenmechanischen Beschreibung überträgt eine elektromagnetische Welle Energie in quantisierten Paketen oder Photonen, wobei E = hν ist. Daher ist E = ω ( ≡ h/2π), und der Eigendrehimpuls oder Spin eines Photons ist entweder − oder +, wobei das Vorzeichen die Rechts- oder Linkshändigkeit angibt. Beachten Sie, dass der Drehimpuls eines Photons in keiner Weise von seiner Energie abhängt. Wenn ein geladenes Teilchen elektromagnetische Strahlung emittiert oder absorbiert, ändert sich neben seiner Energie und seinem linearen Impuls auch sein Drehimpuls um ein ganzzahliges Vielfaches von ±.2 Man kann sich vorstellen, dass eine einfallende Welle Energie in Form eines Stromes identischer Photonen zu einem Ziel transportiert. Entsprechend können wir eine Quantisierung des Drehimpulstransports erwarten. Eine rein linkszirkular polarisierte, ebene Welle verleiht dem Ziel einen Drehimpuls, als ob die Spinvektoren aller einzelnen Photonen im Strahl in Fortpflanzungsrichtung ausgerichtet gewesen wären. Bei rechtszirkularem Licht ist die Spinausrichtung und das Drehmoment, das auf das Ziel wirkt, umgekehrt. Unter Verwendung eines äußerst empfindlichen Torsionspendels gelang es Richard A. Beth 1935 tatsächlich, solche Effekte zu messen.3 Im Photonenbild kann man rein rechts- oder linkszirkular polarisiertes Licht offenbar problemlos beschreiben. Was jedoch ist linear oder elliptisch polarisiertes Licht? 1

2

3

Diese Terminologie ist zugegebenermaßen ungünstig. Trotzdem ist ihre Verwendung in der Optik fest etabliert, obwohl sie genau das Gegenteil der vernünftigeren Festlegung in der Elementarteilchenphysik besagt. Als ein ziemlich wichtiges, aber vergleichsweise einfaches Beispiel betrachten wir das Wasserstoffatom. Es besteht aus einem Proton und einem Elektron mit jeweils einem Spin von /2. Wenn die Spins beider Teilchen parallel ausgerichtet sind, ist das Atom etwas energiereicher. Es ist jedoch möglich, dass in einer sehr langen Zeit (etwa 107 Jahre) einer der Spins umklappt und zum anderen antiparallel wird. Die Änderung des Drehimpulses des Atoms ist dann , und diese Differenz wird einem emittierten Photon verliehen, das den leichten Energieüberschuss abtransportiert. Dies ist der Ursprung der in der Radioastronomie bedeutsamen 21-cm-Mikrowellenemission. Richard A. Beth, „Mechanical Detection and Measurement of the Angular Momentum of Light“, Phys. Rev. 50 (1936) 115.

8.2 Polarisatoren

657

Klassisch kann Licht in einem P-Zustand durch kohärente Überlagerung von gleich starkem Licht im R- und L-Zustand (mit einem geeigneten Phasenunterschied) gebildet werden. Jedes einzelne Photon (angenommen, man könnte dessen Drehimpuls irgendwie messen) hat entweder einen parallelen oder einen antiparallelen Spin bezüglich k. Ein Strahlenbündel linearen Lichts tritt mit Materie in Wechselwirkung, als enthielte es in diesem Augenblick gleich viele rechts- und linksdrehende Photonen. In Wirklichkeit können wir allerdings keineswegs annehmen, das Strahlenbündel sei aus gleich vielen Photonen definierter Drehrichtung zusammengesetzt: Alle Photonen sind identisch, und jedes einzelne Photon existiert mit gleicher Wahrscheinlichkeit in einem der beiden möglichen Spinzustände. Könnte man den Drehimpuls einzelner Photonen messen, so fände man − ebenso oft wie +. Mehr kann man nicht beobachten. Man kann nichts darüber aussagen, in welchem Zustand sich das Photon vor der Messung befand (falls es vor der Messung wirklich existierte). Ein linear polarisiertes Strahlenbündel als Ganzes kann einem Ziel daher keinen Gesamtdrehimpuls verleihen. Nehmen die Photonen dagegen nicht mit gleicher Wahrscheinlichkeit beide Spinzustände ein, d. h., misst man einen Drehimpuls (zum Beispiel +) häufiger als den anderen (−), so erhält das Ziel einen positiven Gesamtdrehimpuls. Es handelt sich dann um elliptisch polarisiertes Licht, also eine Superposition ungleicher Anteile von R- und L-Licht mit einer bestimmten Phasenbeziehung.

8.2

Polarisatoren

Da wir nun eine gewisse Vorstellung von polarisiertem Licht haben, wollen wir untersuchen, mittels welcher Techniken man polarisiertes Licht erzeugt, verändert und nach Wunsch manipuliert. Ein optisches Gerät, das natürliches Licht in polarisiertes Licht einer bestimmten Form umwandelt, heißt Polarisator. Wir erinnern uns, dass eine mögliche Darstellung von unpolarisiertem Licht die Superposition von zwei inkohärenten, orthogonalen P-Zuständen gleicher Amplitude ist. Ein Linearpolarisator lässt nur eine dieser beiden Komponenten passieren. Je nach Form des Resultats könnten wir uns auch Zirkularpolarisatoren oder Polarisatoren zur Erzeugung von elliptisch polarisiertem Licht vorstellen. Alle Geräte können mit unterschiedlicher Effektivität betrieben werden; Streu- oder Teilpolarisatoren jedoch sind am wenigsten effektiv. Polarisatoren gibt es in vielen verschiedenen Formen, doch alle basieren auf einem von vier fundamentalen physikalischen Mechanismen: Dichroismus oder selektive Absorption, Reflexion, Streuung und Doppelbrechung. Eine grundlegende, allen diesen Prozessen gemeinsame Eigenschaft ist irgendeine Art der Asymmetrie. Dies ist verständlich, denn der Polarisator muss einen bestimmten Polarisationszustand auswählen und alle anderen abtrennen. Die Asymmetrie kann mit dem Eintritts- oder Blickwinkel zusammenhängen, doch gewöhnlich liegt eine Anisotropie im Stoff des Polarisators selbst vor.

8 Polarisation

658

8.2.1 Das malussche Gesetz Zunächst müssen wir eine Frage klären: Wie kann man experimentell bestimmen, ob ein Gerät als Linearpolarisator wirkt? Fällt natürliches Licht auf einen idealen Linearpolarisator (Abb. 8.13), so wird per Definition nur Licht in einem P-Zustand durchgelassen, welcher parallel zu einer bestimmten Richtung ist, die wir die Durchlassachse des Polarisators nennen. Mit anderen Worten: Nur die Komponente des optischen Feldes, die parallel zur Durchlassachse ist, durchläuft das Gerät im Wesentlichen unbeeinträchtigt. Dreht man den Polarisator in Abbildung 8.13 um die z-Achse, so ist die Anzeige des Detektors (z. B. eine Photozelle) wegen der vollkommenen Symmetrie des unpolarisierten Lichts unverändert. Zwar haben wir es mit Wellen zu tun, doch misst unser Detektor aus praktischen Gründen (wegen der sehr hohen Frequenz des Lichts) nur die einfallende Bestrahlungsstärke. Diese wiederum ist proportional zum Quadrat der Amplitude des elektrischen Feldes [Gl. (3.44)], sodass wir uns nur mit dieser Amplitude zu befassen brauchen.

θ natürlic hes Licht

hse sac s a l rch Du linear polarisiertes Licht

θ Linearpolarisa tor

E

Abb. 8.13: Natürliches (unpolarisiertes) Licht fällt auf einen Linearpolarisator, dessen Achse um einen Winkel θ gegen die Senkrechte geneigt ist.

Nun führen wir einen zweiten, identischen idealen Polarisator oder Analysator ein, dessen Durchlassachse vertikal ist (Abb. 8.14). Lässt der Polarisator eine Amplitude E01 des elektrischen Feldes durch, so erreicht nur deren Komponente E01 cos θ, die parallel zur Durchlassachse des Analysators ist, den Detektor (unter der Voraussetzung, dass kein Licht absorbiert wird). Nach Gleichung (3.44) ist dann die Bestrahlungsstärke, die den Detektor erreicht, durch c0 2 E cos2 θ (8.23) I (θ) = 2 01 2 /2 = I tritt auf, wenn der gegeben. Die maximale Bestrahlungsstärke I (0) = c0 E01 1 Winkel θ zwischen den Durchlassachsen des Analysators und des Polarisators null ist. Gleichung (8.23) kann entsprechend in

I (θ) = I (0) cos2 θ

(8.24)

umgeformt werden. Diese Beziehung nennt man das malussche Gesetz. Es wurde erstmals 1809 von Étienne Louis Malus, Militäringenieur und Hauptmann in der Armee Napoleons, veröffentlicht.

8.2 Polarisatoren

659 I0 I (0) I (θ )

θ

θ os θ c 1

E0 01

natürliches E Polarisato Licht r

1

E0

E 1

E0

02

=

E

01

sθ co

2

E0

Analysato r

2

E0

Detektor

Abb. 8.14: Zum malusschen Gesetz: Ein Linearpolarisator und ein Analysator. Natürliches Licht fällt mit der Bestrahlungsstärke I0 auf den ersten Linearpolarisator (links), dessen Achse um einen Winkel θ gegen die Senkrechte geneigt ist. Das austretende Licht hat die Bestrahlungsstärke I1 = I(0). Die Achse des zweiten Linearpolarisators ist um θ gegen die Achse des ersten geneigt, und die austretende Bestrahlungsstärke ist gleich I(θ).

Wie Sie wissen, ist I(0) die am Analysator ankommende Bestrahlungsstärke. Fällt auf den ersten Linearpolarisator in Abbildung 8.14 natürliches Licht mit I = 1000 W/ m2 , so tritt dort lineares Licht mit I(0) = 500 W/ m2 aus. Mithilfe von Gleichung (8.24) können wir die durchgelassene Bestrahlungsstärke I(θ) in Abhängigkeit von θ berechnen. Fällt auf den ersten Linearpolarisator hingegen linear (parallel zur Durchlassachse) polarisiertes Licht mit I = 1000 W/ m2 , so ist natürlich I(0) = 1000 W/ m2 . Beachten Sie, dass I (90◦ ) = 0 ist. Dies ergibt sich daraus, dass das elektrische Feld, das durch den Polarisator gelaufen ist, senkrecht auf der Durchlassachse des Analysators steht (die beiden Geräte, die derart angeordnet sind, bezeichnet man als gekreuzt). Das Feld ist dann parallel zur so genannten Auslöschungsachse des Analysators und hat offensichtlich keine Komponente längs der Durchlassachse. Die in Abbildung 8.14 gezeigte Anordnung in Verbindung mit dem malusschen Gesetz können wir verwenden um herauszufinden, ob ein Gerät wirklich als Linearpolarisator wirkt. Wie weiter unten näher erläutert werden soll, ist der meistverwendete Linearpolarisator heute das Polaroidfilter. Ohne Probleme können Sie das malussche Gesetz mit zwei gewöhnlichen Polaroidfiltern nachprüfen; achten Sie aber darauf, dass Sie mit Licht im Frequenzbereich von ≈ 450 nm bis ≈ 650 nm arbeiten, weil die Filter Infrarotlicht nicht besonders gut polarisieren. Beispiel 8.3 Das elektrische Feld eines linear polarisierten Lichtstrahls von 1000 W/m2 oszilliert in einem Winkel von +10,0◦ mit der Vertikalen im ersten und dritten Quadranten. Der Strahl geht senkrecht durch zwei aufeinanderfolgende ideale lineare Polarisatoren. Die Durchlassachse des ersten Polarisators liegt im zweiten

8 Polarisation

660

und vierten Quadranten und bildet einen Winkel von −80,0◦ mit der Vertikalen. Der zweite Polarisator liegt im ersten und dritten Quadranten und bildet einen Winkel von +55,0◦ mit der Vertikalen. (a) Wie viel Licht tritt aus dem zweiten Polarisator? (b) Nehmen Sie nun an, dass die beiden Polarisatoren vertauscht werden, ohne dabei ihre Orientierungen zu ändern. Wie viel Licht tritt jetzt aus? Erläutern Sie Ihre Antworten. Lösung (a) Das einfallende Licht (mit +10◦ ) ist senkrecht zur Durchlassachse des ersten Polarisators (im Winkel von −80,0◦ ), und daher tritt kein Licht aus dem zweiten Polarisator. (b) Wenn die Polarisatoren vertauscht werden, oszilliert das Licht in einer Ebene, die um 45◦ gegenüber der Durchlassachse des ersten Polarisators geneigt ist. Für diese gilt nach dem malusschen Gesetz I(θ) = I(0) cos2 θ , und somit ist hier I1 = (1000 W/m2 ) cos2 45,0◦ = 500 W/m2 . Dieses bei 55◦ oszillierende Licht bildet einen Winkel von 45,0◦ mit der Durchlassachse des neuen zweiten Polarisators. Damit ergibt sich für die aus diesem austretende Bestrahlungsstärke I2 I2 = (500 W/m2 ) cos2 45,0◦ = 250 W/m2 . Das austretende Licht ist linear polarisiert und oszilliert im zweiten und vierten Quadranten im Winkel von −80,0◦ . Wir stellen also fest, dass die Reihenfolge der Polarisatoren wesentlich ist.

8.3

Dichroismus

Im weitesten Sinne bezeichnet der Ausdruck Dichroismus die selektive Absorption einer der beiden orthogonalen P-Zustandskomponenten eines einfallenden Strahlenbündels. Der dichroitische Polarisator ist physikalisch anisotrop und absorbiert eine Feldkomponente in stark asymmetrischer oder selektiver Weise, während er für die andere im Wesentlichen transparent ist.

8.3.1 Der Drahtgitterpolarisator Das einfachste Gerät dieser Art ist ein Gitter aus parallelen leitenden Drähten (Abbildung 8.15). Eine unpolarisierte elektromagnetische Welle treffe von rechts auf das Gitter. Das elektrische Feld kann in die üblichen beiden orthogonalen Komponenten zerlegt werden; in diesem Fall wählt man die eine parallel zu den Drähten und die

8.3 Dichroismus

661

E

Abb. 8.15: Ein Drahtgitterpolarisator. Das Gitter eliminiert die vertikale (zu den Drähten parallele) Komponente des E-Feldes, während die horizontale Komponente durchgelassen wird.

andere senkrecht zu ihnen. Die y-Komponente des Feldes bewegt die Leitungselektronen längs jedes Drahtes und erzeugt so einen Strom. Die Elektronen wiederum geben Energie an die Gitteratome ab, wodurch sich die Drähte erwärmen. Auf diese Weise wird Energie vom Feld auf das Gitter übertragen. Elektronen, die entlang der y-Achse beschleunigt werden, strahlen außerdem sowohl vorwärts als auch rückwärts. Wie erwartet, wird die einfallende Welle dann von der in Vorwärtsrichtung reemittierten Welle ausgelöscht, weshalb das Gitter für die y-Komponente des Feldes nur wenig oder überhaupt nicht durchlässig ist. Die Strahlung, die sich rückwärts ausbreitet, erscheint einfach als reflektierte Welle. Im Gegensatz dazu können sich die Elektronen in x-Richtung nicht sehr weit bewegen, und die entsprechende Feldkomponente der Welle bleibt während der Fortpflanzung durch das Gitter im Wesentlichen unverändert. Die Durchlassachse des Gitters steht senkrecht zu den Drähten. Ein verbreiteter, naiver Irrtum besteht in der Annahme, die y-Komponente des Feldes „schlüpfe“ irgendwie durch den Raum zwischen den Drähten. Mithilfe von Mikrowellen und einem Gitter aus gewöhnlichem Kupferdraht sind diese Schlussfolgerungen leicht nachzuvollziehen. Ein Gitter herzustellen, das Licht polarisiert, ist viel schwieriger: Im Jahre 1960 erzeugten George R. Bird und Maxfield Parrish Jr.4 ein Gitter mit unglaublichen 2160 Drähten pro Millimeter. Das Kunststück bestand darin, einen Strom von Goldatomen (oder Aluminiumatomen) bei streifendem Einfall auf ein Gitterrelief aus Kunststoff aufzudampfen (siehe Abschn. 10.2.7). Das Metall sammelte sich längs der Furchen an und bildete mikroskopisch feine „Drähte“, deren Breiten und gegenseitige Abstände kleiner als eine Wellenlänge waren. Es sind verschiedene Arten von Drahtgitterpolarisatoren im Handel erhältlich, darunter solche, die aus mikroskopischen Aluminiumdrähten gefertigt sind. Diese Polarisatoren ermöglichen eine sehr gute Transmission vom sichtbaren Bereich bis zum mittleren Infrarotbereich. Obwohl der Drahtgitterpolarisator besonders im Infraroten brauchbar ist, erwähnen wir ihn hier mehr aus didaktischen als aus praktischen Gründen. Das Prinzip liegt auch den weiter verbreiteten dichroitischen Polarisatoren zugrunde. 4

G. R. Bird und M. Parrish Jr., „The Wire Grid as a Near-Infrared Polarizer“, J. Opt. Soc. Am. 50 (1960) 886.

8 Polarisation

662

8.3.2 Dichroitische Kristalle

optische Achse

Bestimmte Stoffe sind aufgrund einer Anisotropie ihrer Kristallstruktur von Natur aus dichroitisch. Einer der bekanntesten ist das natürlich vorkommende Mineral Turmalin, ein Halbedelstein und Schmuckstein. Übrigens gibt es verschiedene Turmaline, Borosilicate unterschiedlicher chemischer Zusammensetzung, beispielsweise NaFe3 B3 Al6 Si6 O27 (OH)4 . Solche Kristalle besitzen eine Vorzugsrichtung, die Hauptachse oder optische Achse, die durch den atomaren Aufbau bestimmt ist. Die senkrecht auf der Hauptachse stehende elektrische Feldkomponente einer einfallenden Lichtwelle wird von der Probe stark absorbiert. Je dicker der Kristall ist, desto stärker ist die Absorption (Abb. 8.16). Eine mehrere Millimeter dicke Platte, die von einem Turmalinkristall parallel zu seiner Hauptachse geschnitten wurde, dient demgemäß als Linearpolarisator. In diesem Fall wird die Hauptachse des Kristalls zur Durchlassachse des Polarisators. Die Kleinheit der Kristalle beschränkt aber die Brauchbarkeit des Turmalins für diesen Zweck. Außerdem wird auch ein bestimmter Anteil der durchgelassenen Komponente absorbiert. Komplizierter wird die Sache dadurch, dass diese unerwünschte Absorption stark wellenlängenabhängig ist – die Probe erscheint deshalb farbig. Hält man einen Turmalinkristall gegen weißes Tageslicht, so könnte er grün erscheinen, wenn er senkrecht zur Hauptachse betrachtet wird (es gibt auch Turmaline in anderen Farben), und fast schwarz, wenn er längs derjenigen Achse betrachtet wird, auf der alle E-Felder senkrecht stehen (daher der Ausdruck dichroitisch, zweifarbig).

Abb. 8.16: Ein dichroitischer Kristall. Die natürlich vorkommenden Rillen auf den Turmalinkristallen im Foto oben entsprechen der optischen Achse. Das E-Feld parallel zu dieser Achse wird ohne jede Abschwächung durchgelassen. (Foto E. H.)

Einige andere Substanzen weisen ähnliche Merkmale auf. Ein Kristall des Minerals Hypersthen (Fe,Mg)2 [Si2 O6 ] kann unter weißem Licht, das in einer bestimmten

8.3 Dichroismus

663

Richtung polarisiert ist, grün, für eine andere Polarisationsrichtung dagegen rosa aussehen. Die mikroskopische Struktur solcher Kristalle liefert Hinweise auf den Mechanismus, der den Kristalldichroismus verursacht (siehe auch Abschn. 3.5). Die Atome eines Kristalls werden durch kurzreichweitige Kräfte zusammengehalten und bilden ein periodisches Gitter. Die Elektronen, die für die optischen Eigenschaften verantwortlich sind, kann man sich elastisch an ihren jeweiligen Gleichgewichtspositionen gebunden vorstellen. Die Elektronen jedes einzelnen Atoms werden von den Nachbaratomen beeinflusst, welche selbst vielleicht nicht symmetrisch verteilt sind. Folglich sind die elastischen Bindungskräfte, die auf die Elektronen wirken, in verschiedenen Richtungen unterschiedlich. Entsprechend variiert ihre Reaktion auf das harmonische elektrische Feld einer einfallenden elektromagnetischen Welle mit der Richtung von E. Absorbiert der Stoff zusätzlich zu seiner Anisotropie, so müsste eine detaillierte Analyse die orientierungsabhängige Leitfähigkeit berücksichtigen. Es werden Ströme induziert, und Energie der Welle wird in Wärme umgewandelt. Die Abschwächung kann zusätzlich zur Richtungsabhängigkeit auch frequenzabhängig sein. Befindet sich das ankommende Licht in einem P-Zustand, so erscheint der Kristall gefärbt, wobei die Farbe von der Richtung von E abhängt. Substanzen, die zwei oder sogar drei verschiedene Farben zeigen, nennt man dichroitisch bzw. trichroitisch.5

8.3.3 Das Polaroidfilter 1928 erfand Edwin Herbert Land, ein 19 Jahre alter Student am Harvard College, die erste dichroitische Polarisationsfolie, die unter dem Namen Polaroid J-Sheet in den Handel kam. Sie enthielt eine synthetische dichroitische Substanz, das so genannte Herapathit oder Chininsulfat-periodid 6 . Lands eigene rückblickende Beschreibung seiner frühen Arbeiten ist informativ und fesselnd zu lesen – es ist interessant, die manchmal wundersamen Ursprünge dieser heute am häufigsten benutzten Gruppe von Polarisatoren zu verfolgen. In dem Bericht von Land lesen wir: In der Literatur gibt es einige wichtige Höhepunkte in der Entwicklung von Polarisatoren. Besondere Beachtung verdient die Arbeit von William Bird Herapath, Arzt in Bristol, England. Dessen Schüler, ein Mr. Phelps, hatte beobachtet, dass sich kleine funkelnde grüne Kristalle bilden, wenn er Iod in den Urin eines Hundes tropfen ließ, der mit Chinin gefüttert worden war. Phelps ging zu seinem Lehrer, und Herapath tat etwas, was ich [Land] unter diesen Umständen für seltsam halte: Er betrachtete die Kristalle unter 5

6

Auf diese Prozesse werden wir bei der Behandlung der Doppelbrechung genauer eingehen. An dieser Stelle sei lediglich erwähnt, dass es für einachsige Kristalle zwei unterscheidbare Richtungen gibt. Absorbierende Proben können daher zwei Farben zeigen. In zweiachsigen Kristallen gibt es drei verschiedene Richtungen und möglicherweise drei Farben. E. H. Land, „Some Aspects of the Development of Sheet Polarizers“, J. Opt. Soc. Am. 41 (1951) 957.

664

8 Polarisation dem Mikroskop. Dabei bemerkte er, dass einander überdeckende Kristalle manchmal hell und manchmal dunkel erschienen. Er erkannte, dass es sich um ein bemerkenswertes Phänomen handelte, einen neuen polarisierenden Stoff [den man heute Herapathit nennt]. . . . Herapaths Arbeit erregte die Aufmerksamkeit Sir David Brewsters, der in jenen glücklichen Tagen am Kaleidoskop arbeitete. . . . Brewster, der das Kaleidoskop erfand, schrieb ein Buch darüber und erwähnte darin, dass er für das Okular gerne Herapathitkristalle verwenden wollte. Als ich 1926 und 1927 dieses Buch las, stieß ich zufällig auf diese bemerkenswerten Kristalle und das entzündete mein Interesse an Herapathit.

Lands ursprünglicher Ansatz zur Herstellung einer neuen Form von Linearpolarisatoren bestand darin, Herapathit zu Millionen submikroskopischer Kristalle zu vermahlen, welche von Natur aus nadelförmig sind. Ihre geringe Größe vermindert das Problem der Lichtstreuung. In Lands frühen Experimenten wurden die Kristalle unter Anwendung magnetischer und elektrischer Felder fast parallel ausgerichtet. Später fand Land heraus, dass sie sich mechanisch ausrichten, wenn eine zähflüssige kolloide Suspension der Herapathitnadeln durch einen langen engen Schlitz gepresst wird. Die sich ergebende J-Folie war effektiv ein großer, flacher, dichroitischer Kristall. Die einzelnen submikroskopischen Kristalle streuten das Licht immer noch ein wenig, und demzufolge war die J-Folie etwas trübe. 1938 erfand Land die H-Folie, die mittlerweile wahrscheinlich der am weitesten verbreitete Linearpolarisator ist. Die H-Folie enthält keine dichroitischen Kristalle, sie ist vielmehr ein molekulares Gegenstück zum Drahtgitterpolarisator. Eine Schicht aus farblosem Polyvinylalkohol wird erhitzt und in eine bestimmte Richtung gestreckt, wobei sich die langkettigen Kohlenwasserstoffmoleküle ausrichten. Die Folie wird dann in eine iodhaltige Farblösung getaucht. Das Iod dringt in den Kunststoff ein und bindet an die linearen langkettigen Moleküle, wobei es seinerseits eigene Ketten bildet. Die Leitungselektronen der Iodatome können sich die Ketten entlang bewegen, als ob diese lange dünne Drähte wären. Die E-Komponente einer parallel zu den Molekülen einfallenden Welle regt die Elektronen an, leistet Arbeit an ihnen und wird stark absorbiert. Die Durchlassachse des Polarisators steht daher senkrecht auf der Richtung, in der die Schicht gestreckt wurde. Jede einzelne winzige dichroitische Einheit bezeichnet man als Zweifarbträger. In der H-Folie sind die Zweifarbträger von molekularer Größe, sodass die Streuung kein Problem ist. Die H-Folie ist im gesamten sichtbaren Spektrum ein sehr effektiver Polarisator, etwas schwächer allerdings am blauen Ende. Betrachtet man weißes Licht durch ein Paar gekreuzter H-Polaroidfilterfolien, so ist die Extinktionsfarbe demzufolge ein tiefes Blau. HN-50 wäre die Bezeichnung einer hypothetischen idealen H-Folie, die eine neutrale Farbe (N) hat und 50% des einfallenden Lichts durchlässt, während es die andere Hälfte, die unerwünschte Polarisationskomponente, absorbiert. In der Praxis werden jedoch 4 Prozent des ankommenden Lichts an jeder

8.3 Dichroismus

665

der beiden Oberflächen reflektiert (Antireflexbeschichtungen werden im Allgemeinen nicht verwendet), wodurch 92 Prozent übrigbleiben. Die Hälfte davon wird vermutlich absorbiert, und deshalb könnten wir mit einem HN-46-Polaroidfilter rechnen. HN-38, HN-32 und HN-22 werden im großen Maßstab kommerziell hergestellt. Diese Folien unterscheiden sich durch die Menge des enthaltenen Iods (siehe Aufgabe 8.15).

Ein Paar gekreuzter Polaroidfilter. Beide Filter erscheinen grau, weil sie jeweils etwa die Hälfte des einfallenden Lichts absorbieren. (Foto E. H.)

Viele andere Formen von Polaroidfiltern wurden entwickelt.7 Die feuchtigkeits- und wärmebeständige K-Folie hat als Zweifarbträger die lineare Kohlenwasserstoffkette Polyvinylen. Eine Kombination der Bestandteile der H-und K-Folien führt zur HRFolie, einem Polarisator im nahen Infrarot. Kommerziell verfügbar sind inzwischen auch dichroitische Folien, die im Ultravioletten (≈ 300 nm bis ≈ 400 nm) als Linearpolarisatoren wirken. Denken Sie daran, dass dichroitische Polarisatoren stets für einen spezifischen Wellenlängenbereich ausgelegt sind. Ein Paar gekreuzter Folien, das zur Ausblendung des sichtbaren Bereichs gedacht ist, lässt unterhalb ≈ 450 nm und oberhalb ≈ 650 nm einen merklichen Anteil des Lichts durch. Alle Arten von dichroitischen Polarisatoren, von der Polarisationsfolie über PolarcorTM (ein Glas, das ausgerichtete, längliche Silberkristalle enthält) bis Turmalin, können durch ihre Transmissionseigenschaften spezifiziert werden. Dazu betrachten wir einen linear polarisierten Strahl von vertikalem Licht, der normal auf einen linearen Polarisator fällt. Letzterer kann um einen Winkel θ bezüglich einer parallel zum Strahl verlaufenden Achse (gemessen von der Transmissionsachse zur Vertikalen) gedreht sein. Wenn das elektrische Feld des Strahls parallel zur Transmissionsachse (θ = 0) ist, erreicht die durchgelassene Bestrahlungsstärke ihr Maximum. Die Größe It 0 /Ii (wobei die einfallende Bestrahlungsstärke Ii als bekannt vorausgesetzt wird) wird Hauptdurchlässigkeit genannt (Formelzeichen T0 ). Sie quantifiziert den Anteil des parallel zur Transmissionsachse einfallenden Lichts, der durch den Polarisator geht. Wenn das elektrische Feld parallel zur Transmissionsachse oszilliert, ist die vom Polarisator durchgelassene Bestrahlungsstärke minimal, und It 90 /Ii wird Fehldurchlässigkeit T90 genannt. Dies ist der Anteil des einfallenden Lichts, der senkrecht zur Transmissionsachse ausgerichtet ist und vom Polarisator durchgelassen wird. 7

Siehe Polarized Light: Production and Use von Shurcliff oder die leichter zu lesende kleinere Ausgabe Polarized Light von Shurcliff und Ballard.

8 Polarisation

666

Stellen wir uns wieder einen Strahl von linearem Licht vor, der auf einen linearen dichroitischen Polarisator fällt und dabei einen Winkel θ mit der Transmissionsachse bildet. Da die Bestrahlungsstärke proportional zum Quadrat der Feldamplitude ist und da es Komponenten dieser Amplitude parallel und senkrecht zur Transmissionsachse gibt, ist die Durchlässigkeit des mit linearem Licht bestrahlten Polarisators Tl = T0 cos2 θ + T90 sin2 θ .

(8.25)

Das Durchlassverhältnis ist definiert als (It0 /Ii )(It 90 /Ii ) = T0 /T90 = It0 /It 90 , und es kann eine Größe von 30 000 : 1 erreichen. Das Auslöschungsverhältnis ist der Kehrwert davon, also T90 /T0 . Allgemein gilt T0  T90 . Für einen idealen dichroitischen linearen Polarisator unter natürlicher Bestrahlung wird alles Licht, das parallel zur Transmissionsachse ist, durchgelassen, und somit gilt T0 = 1,0; dagegen wird nichts von dem senkrecht einfallenden Licht durchgelassen, d. h., es gilt T90 = 0. Wenn ein realer Polarisator mit natürlichem Licht bestrahlt wird, werden beide zueinander orthogonale Richtungen durchgelassen, und die Gesamtdurchlässigkeit (Tn ) des Geräts ist gegeben durch Tn = 12 (T0 + T90 ) ≈ 12 T0 . Der Faktor 12 tritt hier auf, weil im Idealfall die Hälfte des unpolarisierten einfallenden Lichts absorbiert wird. Bezeichnungen wie HN-38, HN-32 und HN-22 für Polaroidfolien stehen dafür, dass die Gesamtdurchlässigkeit (≈ 12 T0 ) entsprechend ≈ 38 %, ≈ 32 % oder ≈ 22 % beträgt, und T0 ist dann 76 %, 64 % oder 44 %. Mit anderen Worten, eine HN-38-Folie lässt 76 % des linearen Lichts parallel zur Transmissionsachse durch. Durch Hinzufügen von mehr Iod kann die Fehldurchlässigkeit T90 verringert werden, aber das gilt dann auch für die erwünschte Durchlässigkeit T0 . So hat beispielsweise eine HN-32-Folie eine Fehldurchlässigkeit von etwa 0,005 %, während der entsprechende Wert für eine HN-22-Folie nahe 0,0005 % liegt, was nahezu gleichbedeutend damit ist, dass es keine Fehldurchlässigkeit mehr gibt. Der Grund, warum sich keine höhere Präzission erzielen lässt, ist die Frequenzabhängigkeit der Durchlässigkeit; das Maximum von T90 liegt bei etwa 400 nm, also im blauen Bereich. Heute bieten viele Firmen unterschiedlichste Polarisationsfilter an, und es gibt kein System zur Bezeichnung wie HN, das allgemein akzeptiert wäre. Polarisationsfolien werden zum Teil durch ihre Durchlässigkeit in unpolarisiertem Licht, Tn , spezifiziert, wobei dieser Wert bis zu 46 % betragen kann. Wenn zwei identische, reale lineare Polarisatoren in natürlichem Licht so hintereinander positioniert werden, dass ihre Transmissionsachsen parallel sind, dann ist die resultierende Durchlässigkeit 1 1 Tn || = T0 T0 + T90 T90 ≈ 12 T02 . 2 2

(8.26)

8.3 Dichroismus

667

Wenn dagegen zwei solche, mit natürlichem Licht bestrahlte Polarisatoren gekreuzt werden, was bedeutet, dass ihre Transmissionsachsen senkrecht zueinander sind, dann ergibt sich die Gesamtdurchlässigkeit 1 1 T0 T90 + T90 T0 = 12 T0 T90 . (8.27) 2 2 Für den allgemeinen Fall, dass die Transmissionsachsen der beiden Filter einen Winkel θ einschließen, ist die Durchlässigkeit Tn⊥ =

Tnθ = ( 12 T0 T0 + 12 T90 T90 ) cos2 θ + T0 T90 sin2 θ oder Tnθ ≈ 12 T02 cos2 θ .

(8.28)

Beispiel 8.4 Die neueren Varianten von dichroitischen linearen HN-42HE-Folien kombinieren hohe Durchlässigkeit mit erhöhter Auslöschung. Gegeben seien zwei solche identische Filter, die so hintereinander angeordnet sind, dass ihre Transmissionsachsen parallel sind. Wenn natürliches Licht mit einer Leistung von 250 W/m2 normal auf den ersten Polarisator fällt, wie viel Licht tritt dann aus dem zweiten Polarisator aus? Lösung Da das Licht unpolarisiert ist, können wir annehmen, dass 50 % der einfallenden Leistung (Ii ) parallel zur Transmissionsachse des ersten Polarisators oszilliert und die anderen 50 % im Wesentlichen absorbiert werden. Wenn der erste Polarisator perfekt wäre, würde er 12 Ii durchlassen, doch tatsächlich wird nur ein Anteil T0 davon, also 12 Ii T0 durchgelassen. In diesem Fall haben wir einen HN-42HE-Filter, für den 12 T0 ≈ 42 % gilt, und somit T0 ≈ 84 %. Dies ist der prozentuale Anteil des linaeren Lichts, das vollständig parallel zur Transmissionsachse ist und das vom ersten Filter durchgelassen wird. Der zweite Polarisator lässt den Anteil T0 des auf ihn einfallenden linearen Lichts ( 12 Ii T0 ) durch; also haben wir It = ( 12 Ii T02 ) = 12 (250 W/m2 )(0,84)2 = 0,353(250 W/m 2 ) = 88,2 W/m2 . Wir können dieses Ergebnis mithilfe von Gleichung (8.26) überprüfen: Demnach ist Tn || ≈ 12 T02 und somit It = ( 12 Ii T02 ), was wir zuvor aus anderen Überlegungen geschlussfolgert hatten.

Das Material Polaroid vectograph wurde ursprünglich mit dem Ziel der Erzeugung dreidimensionaler Fotografien entwickelt. Es konnte zwar nicht erfolgreich eingesetzt werden, doch man kann es für einige zum Nachdenken anregende Demonstrationen benutzen. Vectograph-Film ist eine glasklare Kunststoffschichtanordnung aus zwei Polyvinylalkohol-Folien, deren Streckrichtungen rechtwinklig zueinander sind. In

8 Polarisation

668

dieser Form gibt es keine Leitungselektronen, und die Schicht ist kein Polarisator. Angenommen, wir zeichnen mit einer Iodlösung ein X auf die eine Seite der Schicht und ein Y so auf die andere Seite, dass es das X überdeckt. Tageslicht, das durch das X läuft, ist in einem P-Zustand, der senkrecht zu dem P-Zustand des Lichts ist, das vom Y kommt. Anders ausgedrückt, die gezeichneten Gebiete bilden gekreuzte Polarisatoren, die sich gegenseitig überlagern. Betrachtet man den Vectograph-Film durch einen drehbaren Linearpolarisator, so kann man entweder X, Y oder beide Buchstaben sehen.

8.4

Doppelbrechung

Viele Kristalle – Festkörper, deren Atome in einer sich räumlich wiederholenden Konfiguration angeordnet sind – sind optisch anisotrop: Ihre optischen Eigenschaften sind nicht in allen Raumrichtungen gleich. Eine spezielle Untergruppe bilden die dichroitischen Kristalle, die wir im vorherigen Abschnitt beschrieben haben. Dort haben wir gesehen, dass für Anordnungen der Gitteratome, die nicht völlig symmetrisch sind, die Bindungskräfte der Elektronen anisotrop werden. In Abbildung 3.38 b hatten wir den isotropen Oszillator mithilfe des einfachen mechanischen Modells einer geladenen Kugelschale dargestellt, die durch identische Federn an einen festen Punkt (den Atomkern) gebunden ist. Für optisch isotrope Substanzen ist dieses Modell geeignet (amorphe Festkörper wie Gläser und Kunststoffe sind meist, aber nicht immer, isotrop). In Abbildung 8.17 sehen wir wieder eine geladene Kugelschale. Die Federn haben hier jedoch unterschiedliche Federkonstanten. Ein Elektron, das parallel zu einem der „Federpaare“ ausgelenkt wird, oszilliert dann mit einer charakteristischen Frequenz, die offensichtlich davon abhängt, um welches Paar es sich handelt. x

Elektronenwolke

z y

Abb. 8.17: Mechanisches Modell: Eine negativ geladene Schale ist durch Paare von Federn mit unterschiedlichen Federkonstanten an den positiven Kern gebunden.

Die Lichtausbreitung durch einen transparenten Stoff erfolgt, wie bereits gesagt, aufgrund der Anregung der Elektronen innerhalb des Mediums: Die Elektronen werden durch das E-Feld angeregt und reemittieren, die sekundären Elementarwellen vereinigen sich wieder, und die resultierende gebrochene Welle bewegt sich weiter fort. Die Geschwindigkeit der Welle und daher der Brechungsindex ist durch die Differenz zwi-

8.4 Doppelbrechung

669

schen der Frequenz des E-Feldes und der Eigenfrequenz des Elektrons bestimmt. Eine Anisotropie der Bindungskraft zeigt sich deshalb in einer Anisotropie des Brechungsindex. Läuft beispielsweise Licht im P-Zustand durch einen hypothetischen Kristall, wobei es Elektronen wie in Abbildung 8.17 begegnet, so wird seine Geschwindigkeit durch die Orientierung von E bestimmt. Ist E parallel zu den stärkeren Federn, also zu einer Richtung starker Bindungskraft (hier die x-Achse), so ist die Eigenfrequenz des Elektrons groß (nämlich proportional zur Wurzel der Federkonstante). Entspricht die Richtung von E dagegen der y-Achse, wo die Bindungskraft schwächer ist, so ist die Eigenfrequenz etwas geringer. Mithilfe unserer Bemerkungen zur Dispersion und der n (ω)-Kurve in Abbildung 3.41 kann man für die entsprechenden Brechungsindizes Kurven wie in Abbildung 8.18 zeichnen. Einen Stoff dieser Art mit zwei verschiedenen Brechungsindizes nennt man doppelbrechend. n(ω) ny 1

ω nx

n(ω) 1

ωb

ωd

ω

Abb. 8.18: Der Brechungsindex als Funktion der Frequenz entlang zweier Achsen in einem Kristall. Bereiche, in denen dn/dω < 0 ist, gehören zu Absorptionsbanden.

Liegt die Frequenz des einfallenden Lichts für einen bestimmten Kristall in der Nähe von ωd (Abb. 8.18), so erscheint sie in der Absorptionsbande von ny (ω). Ein in dieser Weise beleuchteter Kristall absorbiert Licht in einer Polarisationsrichtung (y) stark und ist für die andere (x) durchlässig. Ein doppelbrechender Stoff, der Licht eines der orthogonalen P-Zustände absorbiert und Licht des anderen Zustandes durchlässt, ist dichroitisch. Des Weiteren nehmen wir an, dass die Bindungskräfte in den Richtungen y und z aufgrund der Kristallsymmetrie identisch sind (d. h., die betreffenden Federn sind gleich stark). Dann definiert die x-Achse die Richtung der optischen Achse. Da ein Kristall aus einer räumlich wiederkehrenden Anordnung solcher anisotropen geladenen Oszillatoren besteht, ist die optische Achse tatsächlich eine Richtung und nicht nur eine einzelne Linie. Das Modell funktioniert für dichroitische Kristalle recht gut: Licht, das sich längs der optischen Achse ausbreitet (mit E in der yz-Ebene), wird stark absorbiert; Licht, das sich senkrecht zur optischen Achse ausbreitet, tritt linear polarisiert aus dem Kristall aus.

8 Polarisation

670

Oft erscheinen doppelbrechende Kristalle farblos, weil ihre Eigenfrequenzen oberhalb des sichtbaren Bereichs liegen. Dies ist aus Abbildung 8.18 ersichtlich, wo das einfallende Licht Frequenzen im Bereich von ωb hat. Es ergeben sich zwei verschiedene Brechungsindizes, wohingegen die Absorption für beide Polarisationen vernachlässigbar ist. Gleichung (3.71) zeigt, dass n (ω) umgekehrt proportional zur Eigenfrequenz ist. Dies bedeutet, dass eine große Federkonstante (eine starke Bindung) einer geringeren Polarisierbarkeit, einer kleineren Dielektrizitätskonstante und einem kleinen Brechungsindex entspricht. Wir werden den Aufbau eines Linearpolarisator besprechen, der die Doppelbrechung ausnutzt und in dem die beiden orthogonalen P-Zustände verschiedene Wege zurücklegen, wobei sie getrennt werden. Mit doppelbrechenden Kristallen lassen sich weitere faszinierende Effekte beobachten, die im Folgenden ebenfalls beschrieben werden.

8.4.1 Kalkspat Wir wollen uns zunächst ausführlich einem typischen doppelbrechenden Kristall, dem Kalkspat, widmen. Kalkspat (Calcit, Doppelspat), chemisch Calciumcarbonat (CaCO3 ), ist eine weit verbreitete, natürlich vorkommende, gesteinsbildende Substanz. Sowohl Marmor als auch Kalkstein bestehen aus vielen kleinen, miteinander verbundenen Kalkspatkristallen. Von besonderem Interesse sind die großen Einkristalle, die man (allerdings immer seltener) insbesondere in Indien, Mexiko und Südafrika finden kann. Kalkspat ist das Material, das für die Herstellung von Linearpolarisatoren für Hochleistungslaser am häufigsten verwendet wird. optische Achse

Kohlenstoff Calcium Sauerstoff

Abb. 8.19: Atomgitter im Kalkspat.

Abbildung 8.19 zeigt die Anordnung der Kohlenstoff-, Calcium- und Sauerstoffatome im Kalkspatkristall. Abbildung 8.20 ist eine Ansicht von oben, genauer gesagt längs der optischen Achse von Abbildung 8.19. Jede CO3 -Gruppe bildet eine dreieckige An-

8.4 Doppelbrechung

671

Abb. 8.20: Atome im Kalkspat beim Blick in Richtung der optischen Achse.

ordnung, deren Ebene senkrecht zur optischen Achse steht. Wenn wir Abbildung 8.20 um eine Linie drehen, die senkrecht auf einer Carbonateinheit steht und durch deren Zentrum verläuft, dann erscheint während jeder Umdrehung dieselbe Atomanordnung genau dreimal. Unsere optische Achse wird in der Kristallographie daher als Achse mit dreizähliger Symmetrie klassifiziert. Die starke Doppelbrechung des Kalkspatkristalls entsteht dadurch, dass die Ebenen der Carbonatgruppen senkrecht zur optischen Achse liegen. Das Verhalten der Elektronen bzw. die Wechselwirkung der induzierten Dipolmomente der Sauerstoffatome hängt wesentlich davon ab, ob E in den Carbonatebenen oder senkrecht dazu liegt (siehe Aufgabe 8.34). Die Asymmetrie ist klar erkennbar. Kalkspatproben kann man leicht spalten; dabei bilden sich glatte Flächen, die Spaltebenen. Der Kristall bricht aufgrund seines Aufbaus zwischen bestimmten Atomebenen auseinander, deren interatomare Bindung relativ schwach ist. Alle Spaltebenen (Abb. 8.20) stehen senkrecht auf drei verschiedenen Raumrichtungen. Während ein Kristall wächst, werden Atome Schicht für Schicht angelagert. Nun könnte zwar auf der einen Seite mehr Rohmaterial vorhanden sein als auf der anderen, wodurch der Kristall eine komplizierte äußere Form annähme, doch die Spaltebenen wären trotzdem von der Atomanordnung abhängig: Schneidet man die Probe längs ihrer Spaltebenen, so entsteht eine Form, die durch den Aufbau des Atomgitters bedingt ist. Ein solches Exemplar bezeichnet man als Spaltform. Im Falle des Kalkspats erhält man ein Rhomboeder, bei dem jede Oberfläche ein Parallelogramm mit Winkeln von 78◦ 5 und 101◦ 55 ist (Abb. 8.21).

8 Polarisation

672 optische Achse

Abb. 8.21: Spaltform des Kalkspats.

Es gibt lediglich zwei stumpfe Ecken, in denen die Oberflächen drei stumpfe Winkel bilden. Eine Gerade, die so durch den Scheitelpunkt einer der stumpfen Ecken läuft, dass sie gleiche Winkel mit jeder Oberfläche (45,5◦ ) und jeder Kante (63,8◦ ) bildet, ist offensichtlich eine Achse mit dreizähliger Symmetrie. (Dies wird ein wenig deutlicher, wenn wir das Parallelepiped so schneiden, dass wir Kanten gleicher Länge erhalten.) Eine solche Gerade entspricht der optischen Achse: Wie auch immer die natürliche Form eines Kalkspates beschaffen ist, man braucht nur die stumpfe Ecke zu finden, um die optische Achse zu identifizieren. Im Jahre 1669 stieß Erasmus Bartholinus (1626–1692), Doktor der Medizin und Professor der Mathematik an der Universität Kopenhagen (und übrigens der Schwiegervater von Ole Rømer, der 1679 als Erster die Lichtgeschwindigkeit maß), auf die von ihm so benannte Doppelbrechung, ein neues und bemerkenswertes Phänomen in Kalkspat. Kalkspat war kurze Zeit vorher in der Nähe von Eskifjordur in Island entdeckt worden und wurde damals als Islandspat bezeichnet. Bartholinus schrieb:8 Von allen Menschen hoch geschätzt ist der Diamant, und reiche Freuden bringen ähnliche Schätze, wie kostbare Perlen und Edelsteine . . . wer aber andererseits das Wissen um außergewöhnliche Phänomene diesen Freuden vorzieht, wird, so hoffe ich, nicht weniger Vergnügen an einem neuen Stoff haben, nämlich einem durchsichtigen Kristall, der uns kürzlich von Island gebracht wurde und vielleicht eines der größten Wunder ist, die die Natur hervorgebracht hat . . . Im Verlauf meiner Nachforschungen über diesen Kristall zeigte sich ein wunderbares, seltsames Phänomen: Von Objekten, die man durch den Kristall ansieht, erblickt man nicht wie im Falle anderer durchsichtiger Körper ein einzelnes gebrochenes Bild, sondern sie erscheinen doppelt. Dieses doppelte Bild ist in den Fotos auf S. 673 deutlich zu sehen. Tritt ein schmales Strahlenbündel aus Tageslicht senkrecht zur Spaltebene ein, so wird es aufgespalten, 8

W. F. Magie, A Source Book in Physics.

8.4 Doppelbrechung

673

und zwei parallele Strahlenbündel treten wieder aus. Um diesen Effekt zu beobachten, brauchen wir nur einen schwarzen Punkt auf ein Stück Papier zu zeichnen und mit einem Rhomboeder aus Kalkspat zu bedecken. Das Bild besteht nun aus zwei grauen (an den Überdeckungsstellen schwarzen) Punkten. Beim Drehen des Kristalls scheint ein Punkt zu ruhen, der andere dagegen, der Bewegung des Kristalls folgend, sich auf einer Kreisbahn um den Ersten zu bewegen. Der ruhende Punkt befindet sich stets näher an der oberen stumpfen Ecke; die Strahlen, die ihn abbilden, verhalten sich nicht anders als beim Durchtritt durch eine Glasplatte. Nach einem Vorschlag von Bartholinus nennt man diese die ordentlichen (ordinären) Strahlen oder o-Strahlen. Die Strahlen, die von dem anderen Punkt kommen und sich in einer derartig ungewöhnlichen Weise verhalten, nennt man außerordentliche (extraordinäre) Strahlen oder e-Strahlen. Bei der Betrachtung des Kristalls durch einen Analysator stellt man fest, dass die ordentlichen und außerordentlichen Strahlen linear polarisiert sind (Foto rechts), wobei die Polarisationsebenen senkrecht aufeinander stehen.

Doppelbild, das von einem Kalkspatkristall erzeugt wird (keine Spaltform). (Foto E. H.)

Ein Kalkspatkristall (die stumpfe Ecke ist unten). Die Transmissionsachsen der beiden Polarisatoren sind parallel zu den kurzen Kanten. Der untere, nicht abgelenkte Teil des Bildes wird von ordentlichen Strahlen erzeugt. Schauen Sie genau hin: Es gibt eine Menge zu sehen. (Foto E. H.)

Man kann beliebig viele Ebenen durch das Rhomboeder legen, die die optische Achse enthalten. Dies sind die Hauptebenen. Eine Hauptebene, die gleichzeitig senkrecht auf einem Paar einander gegenüberliegender Flächen der Spaltform steht, bildet einen Hauptschnitt durch den Kristall. Offensichtlich gibt es drei Hauptschnitte; jeder von ihnen entspricht einem Parallelogramm mit Winkeln von 109◦ und 71◦ . Abbildung 8.22 zeigt ein ursprünglich unpolarisiertes Strahlenbündel, das einen Hauptschnitt eines Rhomboeders aus Kalkspat durchläuft. Die kleinen ausgefüllten Kreise und/oder Pfeile längs der Strahlen zeigen an, dass das elektrische Feld des oStrahls senkrecht, das Feld des e-Strahls dagegen parallel zum Hauptschnitt liegt. Um die Dinge etwas zu vereinfachen, sei E in der einfallenden ebenen Welle senkrecht zur optischen Achse linear polarisiert (Abb. 8.23). Die Welle trifft auf die Oberfläche des Kristalls und versetzt daraufhin die Elektronen in Schwingungen, die ihrerseits

8 Polarisation

674 optische Achse

-Strahl E -Strahl

-Strahl -Strahl

optische Achse

Abb. 8.22: Ein Lichtstrahl mit zwei orthogonalen Feldkomponenten beim Durchlaufen eines Hauptschnittes eines Kalkspatkristalls.

wieder sekundäre Elementarwellen ausstrahlen. Die Elementarwellen überlagern einander zur Brechungswelle. Dieser Vorgang wiederholt sich immer wieder, bis die Welle aus dem Kristall austritt. Dies ist ein überzeugendes physikalisches Argument für die Anwendung des huygensschen Prinzips. Huygens verwendete schon 1690, also lange vor der Theorie des Elektromagnetismus, seinen Ansatz zur erfolgreichen Erklärung vieler Aspekte der Doppelbrechung im Kalkspat. Seine Behandlung ist zwar bestechend einfach, jedoch nicht vollständig.9

E

-Welle

op Ac tisch hs e e

Abb. 8.23: Eine ebene Welle, die senkrecht zum Hauptschnitt polarisiert ist.

Da das E-Feld senkrecht zur optischen Achse steht, kann man sich vorstellen, dass die Wellenfront unzählige Atome an der Oberfläche zur Aussendung sphärischer, sämtlich phasengleicher Elementarwellen anregt. Falls das Feld der Elementarwellen überall senkrecht auf der optischen Achse steht, breiten sich diese Elementarwellen in allen Raumrichtungen des Kristalls wie in einem isotropen Medium mit einer Geschwindigkeit v⊥ aus. (Denken Sie daran, dass die Geschwindigkeit eine Funktion der Frequenz ist.) Da die o-Welle kein anomales Verhalten zeigt, scheint diese Annahme vernünftig zu sein. Die Einhüllende der Elementarwellen ist im Prinzip ein 9

A. Sommerfeld, Optik.

8.4 Doppelbrechung

675

Teil einer ebenen Welle, die ihrerseits sekundäre atomare Punktquellen anregt. Der Prozess setzt sich fort, und die Welle bewegt sich geradlinig durch den Kristall. Im Unterschied dazu betrachten wir die einfallende Welle in Abbildung 8.24, deren E-Feld parallel zum Hauptschnitt ist. E besitzt nun eine Komponente senkrecht und eine Komponente parallel zur optischen Achse. Da das Medium doppelbrechend ist, breitet sich parallel zu optischen Achse polarisiertes Licht einer bestimmten Frequenz mit einer Geschwindigkeit v || aus, wobei v || = v⊥ ist. Insbesondere gilt für Kalkspat und gelbes Natriumlicht (λ = 589 nm) 1,486 v || = 1,658 v⊥ = c. Welche Art von huygensschen Elementarwellen können wir nun erwarten? Auf die Gefahr hin, zu stark zu vereinfachen, stellen wir jede e-Elementarwelle als kleine Kugel dar (Abb. 8.25). Es ist aber v || > v⊥ , sodass sich die Elementarwelle in allen Richtungen senkrecht zur optischen Achse ausdehnt. Wir vermuten daher wie Huygens, dass die von der e-Welle erzeugten sekundären Elementarwellen Rotationsellipsoide um die optische Achse bilden. Die Einhüllende aller Ellipsoid-Elementarwellen ist eine ebene Welle parallel zur einfallenden Welle; diese ebene Welle wird beim Durchgang durch den Kristall lediglich seitlich verschoben. Das Strahlenbündel bewegt sich parallel zu den Geraden, die jeweils den Ursprung einer Elementarwelle mit dem Punkt verbinden, wo die ebene Einhüllende tangential zur Elementarwelle liegt. Diese Richtung heißt Strahlrichtung, und sie entspricht der Richtung der Energieausbreitung. Offensichtlich steht in einem anisotropen Kristall die Strahlrichtung nicht senkrecht auf der Wellenfront. Ist das einfallende Strahlenbündel nun natürliches Licht, so existieren die in den Abbildungen 8.23 und 8.24 dargestellten Situationen gleichzeitig. Folglich spaltet sich das Strahlenbündel in zwei orthogonale, linear polarisierte Strahlenbündel auf (Abb. 8.22). Tatsächlich kann man die beiden divergierenden Strahlenbündel innerhalb des Kristalls sehen, wenn man einen geeignet orientierten schmalen Laserstrahl

v

E e-Welle E

op tis ch eA

ch se

Abb. 8.24: Eine ebene Welle, die parallel zum Hauptschnitt polarisiert ist.

v⊥ opt isc he A

chs e

Abb. 8.25: Wellen im Kalkspat.

8 Polarisation

676

verwendet (üblicherweise steht E weder senkrecht noch parallel zur Hauptachse). Das Licht wird an Kristallfehlern gestreut, sodass sich sein Weg gut verfolgen lässt. Die elektromagnetische Beschreibung dieser Vorgänge ist kompliziert, doch lohnt an dieser Stelle zumindest eine oberflächliche Diskussion. Aus Kapitel 3 wissen wir, dass das einfallende E-Feld das Dielektrikum polarisiert: Es verschiebt die Ladungsverteilung, wodurch elektrische Dipole erzeugt werden. Das Feld im Dielektrikum wird durch das induzierte Feld beeinflusst, und es bietet sich die Einführung einer neuen Größe an, der elektrischen Verschiebung D (siehe Anhang 1), die eine elektrische Flussdichte ist. In isotropen Medien ist D mit E durch eine skalare Größe , die Permittivität, verknüpft; es gilt D = E, sodass beide stets zueinander parallel sind. In anisotropen Medien dagegen ist D mit E durch einen Tensor verknüpft, und beide Größen sind im Allgemeinen nicht parallel. Wenden wir nun die maxwellschen Gleichungen auf eine Welle an, die sich durch ein solches Medium bewegt, so stellen wir fest, dass jetzt die Felder D und B innerhalb der Wellenfront schwingen, nicht, wie bisher, E und B. D

E H B

k

k

S

Str

ah

l

Abb. 8.26: Die Beziehungen zwischen H, B, E, D, k und S in einem anisotropen Medium.

Wir erinnern uns, dass B = μH ist, d. h., hier enthält B einen Faktor μ und es ist die Größe H, die unabhängig vom Medium ist. Da jedoch μ für alle Materialien, mit denen wir uns beschäftigen werden, ein Skalar ist, sind B und H parallel, und wir müssen uns im Allgemeinen nicht um H kümmern. Der Wellenvektor k, der senkrecht auf den Flächen konstanter Phase steht, ist nun anstatt zu E senkrecht zu D; D, E und k sind koplanar (Abb. 8.26). Die Strahlrichtung entspricht dann offensichtlich der Richtung des Poynting-Vektors S = v 2 E × B, die im Allgemeinen anders als die Richtung von k ist. Aufgrund der speziellen Anordnung der Atome sind E und D jedoch kolinear, wenn sie entweder beide parallel oder beide senkrecht zur optischen Achse ausgerichtet sind.10 Dies bedeutet, dass die o-Elementarwelle in ein effektiv 10

Im Oszillatormodell ist E im allgemeinen Fall nicht parallel zu einer der Federrichtungen. Das Feld regt die Ladung an, doch die resultierende Bewegung erfolgt aufgrund der Anisotropie der Bindungskräfte nicht in Richtung von E. Die Ladung wird bezüglich jeder einzelnen Kraftkomponente am weitesten in die Richtung des geringsten Widerstandes verschoben. Das induzierte Feld hat daher eine andere Orientierung als E.

8.4 Doppelbrechung

677

isotropes Medium eintritt und daher sphärisch ist, wobei S und k kolinear sind. Im Unterschied dazu sind für e-Elementarwellen S und k, oder äquivalent E und D, nur in Richtungen längs der oder senkrecht zur optischen Achse parallel. In allen anderen Punkten auf der Elementarwelle ist D tangential zum Ellipsoid, und darum liegt D innerhalb des Kristalls stets auf der Einhüllenden oder zusammengesetzten ebenen Wellenfront (Abb. 8.27).

E

S E S

D

k k

-Welle

D

e isch opt hse Ac

-Welle

Abb. 8.27: Orientierung der Vektoren E, D, S und k.

8.4.2 Doppelbrechende Kristalle In kubischen Kristallen wie Natriumchlorid (Kochsalz) sind die Atome in einer relativ einfachen, stark symmetrischen Weise angeordnet. (Es gibt vier dreizählige Symmetrieachsen; jede verbindet zwei einander gegenüberliegende Ecken. Kalkspat dagegen hat nur eine einzige derartige Achse.) Licht, das von einer Punktquelle innerhalb eines solchen Kristalls ausgeht, breitet sich als Kugelwelle gleichmäßig in alle Raumrichtungen aus. Wie bei amorphen Festkörpern gibt es keine Vorzugsrichtung; der Kristall hat einen einzigen Brechungsindex und ist optisch isotrop (siehe Foto). In diesem Fall sind alle Federn im Oszillatormodell identisch.

Einkristalle von Kaliumchlorid, Calciumcarbonat (Calcit) und Natriumchlorid (Kochsalz). Nur am Calcit entsteht ein Doppelbild; den Kristall bezeichnet man deswegen als doppelbrechend. (Foto E. H.)

8 Polarisation

678

In Kristallen, die zum hexagonalen, tetragonalen oder trigonalen System gehören, trifft das Licht bei der Ausbreitung in einer bestimmten Hauptrichtung auf eine asymmetrische Struktur. Solche Substanzen sind optisch anisotrop und doppelbrechend. Bei ihnen entspricht die optische Achse einer Richtung, um die die Atome symmetrisch angeordnet sind. Kristalle wie diese, für die es nur eine solche Richtung gibt, bezeichnet man als einachsig.

-Welle -Welle optische Achse

Abb. 8.28: Elementarwellen in einem negativ einachsigen Kristall (ihre Differenzen sind stark übertrieben dargestellt). Die Pfeile und Punkte bezeichnen das E-Feld der außerordentlichen bzw. der ordentlichen Welle. Das E-Feld der o-Welle steht überall senkrecht auf der optischen Achse. An diesen speziellen Positionen auf den Elementarwellen sind die Felder E und D parallel. Eine Linie vom Mittelpunkt zur Ellipse entspricht einem Strahl in dieser Richtung, wobei dessen Länge die Geschwindigkeit der Welle in dieser Richtung anzeigt. Eine Tangente an die Ellipse im Schnittpunkt mit dem Strahl ist die Richtung von D. Das Gleiche gilt für die o-Welle, wo E und D zueinander parallel und senkrecht zur Zeichenebene sind.

Eine Punktquelle natürlichen Lichts, die sich innerhalb eines dieser Kristalle befindet, verursacht kugelförmige o- und ellipsoidförmige e-Elementarwellen. Die Orientierung des Feldes bezüglich der optischen Achse bestimmt die Geschwindigkeiten, mit denen sich diese Elementarwellen ausbreiten. Das E-Feld der o-Welle ist überall senkrecht zur optischen Achse und bewegt sich daher mit einer Geschwindigkeit v⊥ in alle Richtungen. Die e-Welle hat nur in Richtung der optischen Achse, entlang derer sie immer tangential zur o-Welle ist, die Geschwindigkeit v⊥ (Abb. 8.25). Senkrecht zu dieser Richtung ist E parallel zur optischen Achse, und der entsprechende Teil der Elementarwelle breitet sich mit einer Geschwindigkeit v || aus (Abb. 8.28). Einachsige Stoffe haben zwei Hauptbrechungsindizes ne ≡ c/v || und no ≡ c/v⊥ (Aufgabe 8.36), wie in Tabelle 8.1 angegeben. Für solche Kristalle gibt es stets eine eindeutige Richtung, die optische Achse, auf der die beiden Elementarwellen eine gemeinsame Tangente haben. Daher bleibt für alle ebenen Wellen, die sich in diese Richtung fortpflanzen, der Polarisationszustand erhalten. Die Differenz Δn = (ne − no ) ist ein Maß für die Doppelbrechung. Im Kalkspat, in dem v || > v⊥ gilt, ist (ne − no ) = −0,172, und der Kristall heißt daher negativ einachsig. Dagegen gilt für manche Kristalle, beispielsweise Quarz (kristallines Siliciumdioxid) und Wassereis, v⊥ > v || . Folglich sind die ellipsoidförmigen e-Elementarwellen in die sphärischen o-Elementarwellen eingeschlossen (Abb. 8.29). (Quarz ist optisch aktiv und daher in Wirklichkeit ein wenig komplizierter.) In diesem

8.4 Doppelbrechung

679

Tabelle 8.1: Brechungsindizes einiger einachsiger, doppelbrechender Kristalle bei λ0 = 589,3 nm.

Kristall

no

ne

Calcit (CaCO3 ) Wassereis KDP Lithiumnionat Quarz Rutil (TiO2 ) Natriumnitrat Turmalin

1,6584 1,309 1,51 2,30 1,5443 2,616 1,5854 1,669

1,4864 1,313 1,47 2,21 1,5534 2,903 1,3369 1,638

Fall ist (ne − no ) positiv, und man bezeichnet den Kristall als positiv einachsig. Von den modernen elektrooptischen Kristallen ist Lithiumtantalat (LiTaO3 ) positiv doppelbrechend, während Lithiumniobat (LiNbO3 ), KDP (Kaliumdihydrogenphosphat) und ADP (Ammoniumdihydrogenphosphat) negativ doppelbrechend sind.

optische Achse -Welle -Welle

Abb. 8.29: Elementarwellen in einem positiv einachsigen Kristall (ihre Differenzen sind stark übertrieben dargestellt). Die Pfeile und Punkte bezeichnen das E-Feld der außerordentlichen bzw. der ordentlichen Welle. Das E-Feld der o-Welle steht überall senkrecht auf der optischen Achse. An diesen speziellen Positionen auf den Elementarwellen sind die Felder E und D parallel. Die Länge einer Linie vom Mittelpunkt zu einer der Elementarwellen entspricht der Geschwindigkeit dieser Elementarwelle in dieser Richtung. Daher hat die o-Welle in jeder Richtung die gleiche Geschwindigkeit.

Die übrigen kristallographischen Grundgitter, das orthorhombische, das monokline und das trikline, haben zwei optische Achsen, und man bezeichnet sie daher als zweiachsig. Solche Substanzen wie z. B. der Glimmer KH2 Al3 (SiO4 )3 haben drei verschiedene Hauptbrechungsindizes. Im Oszillatormodell wären dann alle Federpaare verschieden. Die Doppelbrechung der zweiachsigen Kristalle wird als Differenz der Zahlenwerte des größten und des kleinsten Index angegeben. Für Minerale der Glimmergruppe (z. B. Muscovit bei 589,3 nm) sind diese Indizes 1,561, 1,590 und 1,594, wobei die letzten beiden so dicht beieinander liegen, dass Glimmer gewöhnlich als einachsig betrachtet werden kann. Die Konfiguration der dreidimensionalen Wellenfront in einem zweiachsigen Kristall ist ziemlich komplex. Abbildung 8.30 illustriert die Struktur durch einen Schnitt einer

8 Polarisation

680

A

e ch tis e op chs A

op tis ch che se

Koordinatenebene mit der Wellenfront. Anstatt zwei orthogonale Hauptindizes wie im Falle des einachsigen Systems, hat der zweiachsige Kristall drei: Zwei sind mit dem elliptischen Element verbunden und einer mit dem Kreis. Doch hier vermischen sich die beiden Elementarwellen, und daher sollten sie nicht als unabhängig betrachtet werden. Die Wellenfront ist eine komplizierte dreidimensionale, stetige Fläche.

Abb. 8.30: Der Schnitt einer Koordinatenebene mit der komplexen stetigen Wellenfront, die sich in einem zweiachsigen Kristall fortpflanzt.

Eine optische Achse entspricht wieder einer Richtung, in der sich ebene Wellen mit einer eindeutigen, festen Geschwindigkeit unabhängig von der Richtung von D fortpflanzen können. In der Zeichnung gibt es vier Orte, an denen Ellipse und Kreis eine gemeinsame Tangentenebene haben. Die beiden Richtungen, die durch das Zentrum (d. h. die gedachte eingebettete Punktquelle) gehen und die Ebenen im den Tangentenpunkten senkrecht durchstoßen, sind die optischen Achsen der Probe. In diesen Richtungen pflanzen sich alle ebenen Wellen unabhängig von der Richtung ihrer D-Felder mit der gleichen Geschwindigkeit fort. Bei solchen Wellen bleiben die Polarisationszustände erhalten, während sie durch den Kristall propagieren. Da zweiachsige Kristalle im Allgemeinen keine große praktische Bedeutung haben, müssen wir uns zum Glück nicht weiter mit diesen komplizierten Strukturen beschäftigen. Wellenfronten und Strahlen in einachsigen Kristallen Wir sind nun in der Lage, ein grafisches Verfahren zu entwickeln, mit dem man demonstrieren kann, wie ebene Wellen in einen einachsigen Kristall eintreten. Von Huygens stammt die Methode für die Grenzfläche zwischen zwei isotropen Materialien, die in Abbildung 4.31 illustriert ist. Das Schema ist äquivalent mit dem in Abbildung 4.19, das wir benutzt hatten, um das snelliussche Gesetz abzuleiten, und es funktioniert ebenso gut für anisotrope Medien. Stellen wir uns eine ebene Wellenfront AB vor, die schräg auf die plane Fläche eines von Luft umgebenen, negativ einachsigen Kristalls fällt (Abb. 8.31). Der Einfachheit halber ist die Zeichenebene so gewählt, dass die optische Achse wie gezeigt in ihr liegt. Betrachten wir zunächst die o-Welle. Die einlaufende Welle propagiert in Luft, und ihr Endpunkt B bewegt sich in der Zeit Δt = BQ/c nach Q. Das ist die gleiche Zeit,

8.4 Doppelbrechung

681

B

A

Luft

Q

Kristall

C

opt

isch

D

Se e-Strahl

eA

chs

e

So o-Strahl

Abb. 8.31: Eine ebene Welle fällt auf einen negativ einachsigen Kristall.

die die zirkulare o-Elementarwelle, die bei A emittiert wird, benötigt, um im Kristall bis zu C zu kommen, wobei sie mit der Geschwindigkeit v⊥ = c/no propagiert. Dementsprechend konstruieren wir eine zirkulare Elementarwelle mit dem Radius AC = v⊥ Δt = v⊥ (BQ/c) = BQ/no und dem Mittelpunkt bei A. Dazu zeichnen wir eine Linie von Q, die tangential zu dieser o-Elementarwelle verläuft. Während die einfallende Welle über die Grenzfläche streicht, sind alle sukzessive erzeugten, gestreuten zirkularen o-Elementarwellen ebenfalls tangential zu dieser Linie, die der o-Wellenfront enstpricht. Die Linie von A zum Tangentenpunkt ist der o-Strahl, der die Richtung des Energieflusses, d. h. des Poynting-Vektors So , hat. Sie ist senkrecht zur o-Wellenfront, da sich dieser Anteil der elektromagnetischen Störung so verhält, als wäre das kristalline Medium isotrop. Aus dem gleichen Grund haben die Punkte auf dem o-Strahl die Schwingungsrichtungen der Felder E und D, die parallel zueinander und senkrecht zur Zeichenebene sind. Als Regel können wir festhalten, dass ein oStrahl mit dem snelliusschen Gesetz im Einklang steht, weil er sich in alle Richtungen mit der gleichen Geschwindigkeit fortpflanzt, so als wäre das Medium isotrop. Als nächstes konstruieren wir eine elliptische e-Elementarwelle, die um A zentriert ist, sodass ihre große Halbachse, d. h. ihre maximale Auslenkung, AD = BQ/ne ist. Für einen negativen Kristall gilt AD > AC, und die e-Elementarwelle liegt tangential zu der o-Elementarwelle auf der optischen Achse. Nun zeichnen wir eine Linie von Q, die tangential zu dieser e-Elementarwelle verläuft. Diese Linie entspricht der eWellenfront nach der Zeit Δt. Die Linie von A zu diesem Tangentenpunkt ist der e-Strahl, der die Richtung des Energieflusses bzw. des Poynting-Vektors Se hat; sie steht nicht senkrecht auf der e-Wellenfront, und die kleinen Pfeile repräsentieren das D-Feld, das in der Ebene der Wellenfront liegt. Alternativ hätten wir kleine Pfeile zeichnen können, die das E-Feld repräsentieren – diese wären senkrecht zum Poynting-Vektor Se gewesen, der wiederum dem e-Strahl entspricht. Als Regel können wir festhalten, dass eine e-Welle, die sich in einem doppelbrechenden Kristall fortpflanzt, nicht in allen Richtungen die gleiche Geschwindigkeit hat, und daher ein e-Strahl im Allgemeinen nicht das snelliussche Gesetz erfüllt.

8 Polarisation

682

Es ist allerdings möglich, einen einachsigen Kristall so zu schneiden und zu schleifen, dass seine optische Achse überall parallel zum Feld der e-Welle ist. Betrachten wir einen Kristallwürfel, dessen Kanten den Achsen x, y, z entsprechen, wobei x und y die horizontale Ebene aufspannen, während z die vertikale Achse ist. Die linke vertikale Würfelfläche liegt also in der xz-Ebene. Nehmen wir nun an, dass die optische Achse des Kristalls in die z-Richtung zeigt und das Licht in die y-Richtung propagiert. Das elektrische Feld der einfallenden Lichtwelle kann als aus zwei orthogonalen Komponenten bestehend angenommen werden, von denen die eine horizontal und die andere vertikal oszilliert. Das horizontale Feld ist überall senkrecht zur vertikal verlaufenden optischen Achse. Dies ist die ordentliche Welle, die wie immer das snelliussche Gesetz erfüllt. Die vertikale Komponente entspricht der außerordentlichen Welle, und in diesem speziellen Fall ist sie überall parallel zur optischen Achse. Die e-Welle „sieht“ ein effektiv isotropes Medium, propagiert in der horizontalen Ebene mit der gleichen Geschwindigkeit in alle Richtungen und erfüllt das snelliussche Gesetz. Beispiel 8.5 Ein Kalkspatkristall (no = 1,6584, ne = 1,4864) ist so geschnitten und geschliffen, dass die optische Achse in der Skizze senkrecht zur Zeichenebene verläuft.

Luft

40.0°

Strahl 1 θ1

θ2

Strahl 2

Kalkspat

(a) Welcher Strahl ist der ordentliche und welcher der außerordentliche? Erläutern Sie Ihre Antwort. (b) Für welchen der beiden Strahlen verläuft sein elektrisches Feld senkrecht zur optischen Achse? (c) Bestimmen Sie den Winkel zwischen den gebrochenen Strahlen. Lösung (a) Wegen der Art, wie der Kristall geschnitten ist, verläuft eine der Feldkomponenten überall parallel zur optischen Achse, während die andere überall senkrecht zu ihr ist. Jede „sieht“ ein isotropes Medium. Folglich gilt das snelliussche Gesetz für beide Wellen, und es bestimmt die beiden Brechungswinkel. Aus der Tatsache, dass θt umso kleiner wird, je größer der Brechungsindex ist, folgt wegen no > ne für die Winkel θo < θe und somit θo = θ2 und θe = θ1 . Strahl 1 ist also der außerordentliche Strahl und Strahl 2 der ordentliche.

8.4 Doppelbrechung

683

(b) Das elektrische Feld des ordentlichen Strahls verläuft überall senkrecht zur optischen Achse. Folglich muss das elektrische Feld in der Zeichenebene senkrecht zu Strahl 2 sein. (c) Aus dem snelliusschen Gesetz, das hier für beide Strahlen gilt, folgt sin θ1 = sin θe =

1,00 sin 40,0◦ = 0,4324 1,4864

und somit θ1 = θe = 25,62◦ sowie sin θ2 = sin θo =

1,00 sin 40,0◦ = 0,3876 1,6584

und somit θ2 = θo = 22,80◦ . Der Winkel zwischen den gebrochenen Strahlen ist θ1 − θ2 = θe − θo = 2,82◦ .

8.4.3 Doppelbrechende Polarisatoren Man kann sich nun leicht vorstellen, wie man doppelbrechende Linearpolarisatoren herstellt. Viele Methoden zur Trennung der o- und e-Wellen wurden entwickelt, die natürlich alle darauf beruhen, dass ne = no ist. Der bekannteste doppelbrechende Polarisator wurde 1828 von dem schottischen Physiker William Nicol (1768 – 1851) konstruiert. Dieses Nicol-Prisma ist heute hauptsächlich von historischem Interesse, da es in der Praxis seit langem durch effektivere Geräte ersetzt wurde. Zur Herstellung des Nicol-Prismas schleift und poliert man zunächst die Enden eines geeigneten, langen und schmalen Kalkspat-Rhomboeders (von 71◦ auf 68◦ ; siehe Abb. 8.23), schneidet den Kristall anschließend diagonal durch, poliert die beiden Teile und kittet sie mit Kanadabalsam zusammen (Abb. 8.32). Kanadabalsam ist durchsichtig und hat einen Brechungsindex von 1,55, fast in der Mitte zwischen ne und no . Das Strahlenbündel tritt in das „Prisma“ ein, die o- und e-Strahlen werden gebrochen, trennen sich und treffen auf die Balsamschicht. Der Grenzwinkel der Totalreflexion an der Kalkspat-Balsam-Grenzfläche beträgt für den o-Strahl etwa 69◦ (Aufgabe 8.38). Der o-Strahl, der innerhalb eines schmalen Strahlkegels mit einem Öffnungswinkel von maximal etwa 28◦ eintritt, wird innen totalreflektiert und danach von einer Schicht schwarzer Farbe auf den Seitenenden des Rhomboeders absorbiert. Der e-Strahl tritt seitlich verschoben, aber ansonsten zumindest im sichtbaren Spektralbereich im Wesentlichen unverändert aus (Kanadabalsam absorbiert im Ultravioletten).

8 Polarisation

684

optische Achse

-Strahl

-Strahl

Abb. 8.32: Das Nicol-Prisma. Die kleine Abschrägung an der stumpfen Ecke kennzeichnet die optische Achse. (Foto E. H.)

Der Glan-Focault-Polarisator (Abb. 8.33) besteht ebenfalls aus Kalkspat, dessen Durchlässigkeitsbereich von etwa 5000 nm im Infraroten bis ungefähr 230 nm im Ultravioletten reicht. Der ankommende Strahl trifft senkrecht auf die Oberfläche, und E kann in zwei Komponenten zerlegt werden, die entweder vollkommen parallel oder senkrecht zur optischen Achse liegen. Die beiden Strahlen durchlaufen den ersten Kalkspatabschnitt ohne Ablenkung. (Wir kommen in Abschnitt 8.7.1 im Zusammenhang mit Phasenplättchen darauf zurück.) Ist der Einfallswinkel an der Kalkspat-LuftGrenzfläche θ, so braucht man nur dafür zu sorgen, dass ne < 1/ sin θ < no ist, damit der o-Strahl und nicht der e-Strahl totalreflektiert wird. Das durchgelassene Licht ist zu 100 % linear polarisiert, aber der reflektierte Strahl ist es nicht. Werden die beiden Prismen zusammengekittet (für den Gebrauch im Ultravioletten mit Glycerin oder Mineralöl) und der Grenzflächenwinkel entsprechend eingestellt, so nennt man das Gerät einen Glan-Thompson-Polarisator. Sein Blickfeld beträgt etwa 30◦ , verglichen mit etwa 10◦ für den Glan-Focault-Polarisator (auch Glan-Air genannt). Letzterer hat jedoch den Vorteil, die beträchtlich höheren Leistungsdichten von Lasern verarbeiten zu können: Die maximale Bestrahlungsstärke liegt für ein Glan-Thompson-Prisma bei etwa 1 W/cm2 (im Dauerstrich), ein typisches GlanFocault-Prisma verkraftet dagegen bis zu 100 W/cm2 im Dauerstrich. Die Ursache für diesen Unterschied ist die Zersetzung des Kitts und gegebenenfalls der absorbierenden Farbe. Das Glan-Taylor-Prisma (Abb. 8.33 b) hat eine bessere Durchlässigkeit als das Glan-Foucault-Prisma, und daher hat das reflektierte Licht einen höheren Polarisationsgrad. Damit ist es geeignet als polarisierender Strahlteiler. Das Wollaston-Prisma ist eigentlich ein Polarisations-Strahlteiler, da es beide orthogonal polarisierten Komponenten durchlässt. Es kann aus Kalkspat oder Quarz in der in

8.4 Doppelbrechung

685

absorbierende Farbschicht oder Glasplatte o-Strahl

optische Achse

38.5° e-Strahl

optische Achse

Kalkspat v||

v⊥

(a)

e-Strahl Kalkspat

(b)

o-Strahl

Abb. 8.33: (a) Das Glan-Focault-Prisma. (b) Das Glan-Taylor-Prisma. (Foto E. H.)

Abbildung 8.34 gezeigten Form hergestellt werden. Die beiden Strahlen teilen sich an der diagonalen Grenzfläche. Dort wird der e-Strahl zum o-Strahl, und sein Brechungsindex ändert sich entsprechend. Im Kalkspat ist ne < no , und der austretende o-Strahl wird zur Normalen hin abgelenkt. Der o-Strahl, dessen Feld ursprünglich senkrecht zur optischen Achse stand, wird im rechten Abschnitt zum e-Strahl, welcher diesmal von der Normalen weg zur Grenzfläche hin abgelenkt wird (siehe Aufgabe 8.38). Der Winkel zwischen den beiden austretenden Strahlen ist durch den Keilwinkel θ des Prismas bestimmt. Im Handel erhält man Prismen mit Winkeln zwischen den Strahlen von etwa 15◦ bis 45◦ . Man kann sie gekittet (beispielsweise mit Rhizinusöl oder Glycerin) oder ungekittet (angesprengt) erwerben, was von der Frequenz und den Leistungsanforderungen abhängt.

8 Polarisation

686 optische Achse e-Strahl

o-Strahl

optische Achse

θ

v Kalkspat v⊥

Abb. 8.34: Das Wollaston-Prisma.

8.5

Streuung und Polarisation

Sonnenlicht, das aus einer Richtung in die Atmosphäre eintritt, wird von den Molekülen der Luft in alle Richtungen gestreut (siehe Abschn. 4.2). Hätte die Erde keine Atmosphäre, dann wäre der Himmel am Tag so schwarz wie die Leere des Weltraums – ein Effekt, den die Apollo-Mondfotografien eindrucksvoll demonstrieren. Ein Beobachter sieht dann nur das Licht, welches direkt auf ihn trifft. Die Atmosphäre streut das rote Ende des sichtbaren Spektrums wenig oder nicht, das blaue oder hochfrequente Ende dagegen zu einem erheblichen Teil. Das hochfrequente Streulicht erreicht den Beobachter aus vielen Richtungen; der gesamte Himmel erscheint hell und blau (Abb. 8.35). Zigarettenrauch besteht aus Partikeln, deren Abmessungen kleiner als die Wellenlänge von Licht sind. Daher sieht er gegen einen dunklen Hintergrund blau aus. Dagegen enthält ausgeatmeter Rauch relativ große Wassertröpfchen und erscheint weiß. Jedes dieser Tröpfchen ist größer als die Wellenlängen des Lichts und enthält daher so viele Oszillatoren, dass es die normalen Reflexions- und Brechungsprozesse aufrechterhalten kann. Diese Effekte haben im einfallenden Licht keine bevorzugte Frequenzkomponente. Natürliches Licht, das mehrmals von einem Partikel reflektiert und gebrochen wird und dann zum Beobachter zurück kommt, ist daher ebenfalls weiß. Dies erklärt das Weiß der kleinen Salz- und Zuckerkörnchen, des Nebels, der Wolken, des Papiers, Puders und Mattglases und des typisch fahlen Smoghimmels. Partikel, die näherungsweise die Größe einer Wellenlänge haben (der Durchmesser von Atomen beträgt, wie wir wissen, Bruchteile eines Nanometers), streuen Licht in einer charakteristischen Art und Weise. Eine große Verteilung derartiger gleich großer Par-

8.5 Streuung und Polarisation

Halbe Erde am schwarzen Mondhimmel. (Foto mit frdl. Genehmigung der NASA.)

687

Abb. 8.35: Streuung des Himmelslichts.

tikel kann eindrucksvolle Farbenspiele verursachen. 1883 explodierte der Vulkan Krakatau westlich von Java in einem gigantischen Ausbruch. Große Mengen von feinem Vulkanstaub wurden hoch in die Atmosphäre geschleudert und trieben über große Gebiete der Erde. In den darauffolgenden Jahren erschienen Sonne und Mond wiederholt grün oder blau, und Sonnenaufgänge und Sonnenuntergänge waren seltsam gefärbt.

8.5.1 Polarisation durch Streuung Wir betrachten eine linear polarisierte, ebene Welle, die wie in Abbildung 8.36 auf ein Gasmolekül in der Luft fällt. Die Ausrichtung des elektrischen Feldes der Streustrahlung (Es ) entspricht der Dipolgestalt, sodass Es , der Poynting-Vektor S und der oszillierende Dipol koplanar sind (Abb. 3.37). Die im Atom induzierten Schwingungen sind parallel zum E-Feld der eintreffenden Lichtwelle und stehen daher senkrecht auf der Fortpflanzungsrichtung. Wieder stellen wir fest, dass der Dipol nicht in Richtung seiner Achse strahlt. Ist die einfallende Welle nicht polarisiert, so kann sie durch zwei orthogonale, inkohärente P-Zustände dargestellt werden. Das Streulicht (Abb. 8.37) entspricht dann einer Überlagerung der Situationen in den Abbildungen 8.36 a und b. Offensichtlich ist das Streulicht in Vorwärtsrichtung vollkommen polarisiert; außerhalb jener Achse ist es teilweise polarisiert, und der Polarisationsgrad nimmt mit dem Winkel zu. Ist die Beobachtungsrichtung senkrecht zum Primärstrahl, so ist das Licht vollständig linear polarisiert. Mit einem Polaroidfilter kann man diese Schlussfolgerungen leicht verifizieren. Wir bestimmen die Lage der Sonne und untersuchen dann den Bereich des Himmels in

8 Polarisation

688

E

E

Es

S

Es

S

Abb. 8.36: Streuung polarisierten Lichts an einem Molekül.

E

Es

S

Abb. 8.37: Streuung unpolarisierten Lichts an einem Molekül.

einem Winkel von ungefähr 90◦ zu den Sonnenstrahlen. Dieser Teil des Himmels ist senkrecht zu den Strahlen teilweise polarisiert (siehe Foto S. 689, links). Einer vollständigen Polarisation wirken Anisotropien der Moleküle, große Partikel in der Luft und die Depolarisationseffekte der Mehrfachstreuung entgegen. Letzteren Effekt kann man durch das Einbringen eines Stücks Wachspapier zwischen gekreuzte Polaroidfilter veranschaulichen (siehe Foto S. 689 rechts). Da das Licht innerhalb des Papiers viele Male gestreut und reflektiert wird, kann ein bestimmter Oszillator die Überlagerung vieler voneinander unabhängiger E-Felder „sehen“. Die resultierende Emission ist fast vollkommen depolarisiert.

8.6 Polarisation durch Reflexion

Ein Paar gekreuzter Polarisatoren. Die obere Polaroidfolie ist merklich dunkler als die untere, was auf die teilweise Polarisierung des Himmelslichts zurückzuführen ist. (Foto E. H.)

689

Ein Stück Wachspapier zwischen gekreuzten Polarisatoren. (Foto E. H.)

Als abschließendes Experiment geben wir einige Tropfen Milch in ein Glas Wasser und beleuchten dieses (von oben) mit einer hellen Taschenlampe. Die Suspension erscheint im Streulicht bläulich weiß und im direkten transmittierten Licht gelblich, was anzeigt, dass der maßgebliche Mechanismus die Rayleigh-Streuung ist. Entsprechend ist das Streulicht, wie erwartet, teilweise polarisiert. Charles Glover Barkla (1877–1944) gelang es 1906 unter Verwendung weitgehend derselben Ideen die transversale Wellennatur der Röntgenstrahlung nachzuweisen, indem er zeigte, dass diese infolge der Streuung an Materie in bestimmten Richtungen polarisiert ist.

8.6

Polarisation durch Reflexion

Eine der häufigsten Quellen polarisierten Lichts ist der allgegenwärtige Vorgang der Reflexion an dielektrischen Medien. Der helle Schein auf einer Fensterscheibe, einem Blatt Papier oder einer Glatze, der Glanz auf der Oberfläche eines Telefons, einer Billardkugel oder einer Buchhülle ist im Allgemeinen teilweise polarisiert. Der Effekt wurde erstmals 1808 von Étienne Louis Malus untersucht. Die Pariser Akademie hatte für eine mathematische Theorie der Doppelbrechung einen Preis ausgeschrieben, woraufhin Malus dieses Problem untersuchte. Er stand abends am Fenster seines Hauses in der Rue d’Enfer und untersuchte einen Kalkspatkristall. Die Sonne ging unter, und ihr Bild wurde von den Fenstern des nahegelegenen Palais du Luxembourg zu Malus reflektiert. Dieser hielt den Kristall hoch und sah durch ihn gegen das reflektierte Sonnenlicht. Zu seinem Erstaunen verschwand eines der Doppelbilder, als er den Kalkspat drehte. Nachdem die Sonne untergegangen war, arbeitete er bis in die Nacht an der Verifizierung seiner Beobachtungen, wobei er

8 Polarisation

690

Kerzenlicht verwendete, das an Wasser- und Glasoberflächen reflektiert wurde.11 Die Bedeutung der Doppelbrechung und die wahre Natur des polarisierten Lichts wurden dadurch erstmals offensichtlich. Zu jener Zeit konnte man die Polarisation im Rahmen der Wellentheorie noch nicht erklären. In den darauffolgenden 13 Jahren führten die Arbeiten vieler Forscher, vornehmlich Thomas Young und Augustin Fresnel, zur Darstellung von Licht als eine Art transversale Schwingung. (Man darf nicht vergessen, dass die elektromagnetische Theorie des Lichts erst 40 Jahre später aufgestellt wurde.) Das Modell des elektronischen Oszillators führt zu einer einfachen Erklärung des Polarisationsvorgangs bei der Reflexion von Licht. Leider beschreibt es den Vorgang nicht vollständig, da es das Verhalten magnetischer, nicht leitender Stoffe nicht erfasst.12 Betrachten wir trotzdem eine ankommende ebene Welle, die in einer Weise linear polarisiert ist, dass ihr E-Feld senkrecht zur Einfallsebene liegt (Abb. 8.38). Die Welle wird an der Grenzfläche gebrochen und tritt unter einem Brechungswinkel θt in das Medium ein. Ihr elektrisches Feld regt die gebundenen Elektronen, in diesem Fall senkrecht zur Einfallsebene, an, und diese strahlen ihrerseits ein elektromagnetisches Feld ab. Ein Teil der reemittierten Energie erscheint in Form einer reflektierten Welle. Aus der Geometrie und dem Muster der Dipolstrahlung folgt, dass sich sowohl die reflektierten Wellen als auch die Brechungswellen in P-Zuständen senkrecht zur Einfallsebene befinden müssen.13 Liegt das ankommende E-Feld dagegen in der Einfallsebene, so schwingen die Elektronenoszillatoren in der Nähe der Oberfläche unter dem Einfluss der Brechungswelle, wie in Abbildung 8.38 b gezeigt ist. Die Flussdichte der reflektierten Welle ist nun relativ klein, weil der reflektierte Strahl einen kleinen Winkel θ mit der Dipolachse bildet. Wird θ = 0 oder äquivalent θr + θt = 90◦ , so verschwindet die reflektierte Welle. Unter diesen Bedingungen wird von einer ankommenden unpolarisierten Welle, die aus zwei inkohärenten, orthogonalen P-Zuständen besteht, nur diejenige Komponente reflektiert, die senkrecht zu Einfallsebene, also parallel zur Oberfläche, polarisiert ist. Der spezielle Einfallswinkel θp , für den dies zutrifft, wird als Polarisationswinkel oder brewsterscher Winkel bezeichnet, wobei θp + θt = 90◦ ist. Gemäß dem snelliusschen Gesetz gilt ni sin θp = nt sin θt 11

12

13

Versuchen Sie dies mit einer Kerzenflamme und einem Stück Glas (als reflektierende Oberfläche anstelle des Palastfensters). Halten Sie das Glas unter einem Winkel von θp ≈ 56◦ [siehe dazu Gl. (8.25)], um einen deutlichen Effekt zu erhalten. Nahe des streifenden Einfalls sind beide Bilder hell, und keines von beiden verschwindet, wenn Sie den Kristall drehen – Malus sah anscheinend in einem geeigneten Winkel durch den Kristall auf das Palastfenster. W. T. Doyle, „Scattering Approach to Fresnel’s Equations and Brewster’s Law“, Am. J. Phys. 53 (1985) 463. Der Reflexionswinkel ist durch das huygenssche Prinzip festgelegt (siehe Abschn. 10.2.7). Dort zeigen wir, dass sich die gestreuten Elementarwellen im Allgemeinen konstruktiv nur in einer Richtung zu einem reflektierten Strahl vereinigen, dessen Winkel gleich dem Einfallswinkel ist.

8.6 Polarisation durch Reflexion

Einfa

691

llsebe

ne

di ele kt ris

e en eb

ch e

gs

un

Ob

g in

er fla¨ ch e

hw Sc

(c)

(a) Einfall

sebene

Wellen in der Einfallsebene Wellen senkrecht zur Einfallsebene Gre

nzf

(b)

läch

e

ft Lu s Gla

(d)

Abb. 8.38: (a) Eine Welle wird an einer Grenzfläche reflektiert und gebrochen. (b) ElektronenOszillatoren und das brewstersche Gesetz. (c) Das Reflexionsmuster eines Dipols. (d) Polarisation von Licht bei der Reflexion an einem Dielektrikum, beispielsweise Glas, Wasser oder Plastik. Beim Winkel θp ist der reflektierte Strahl im P-Zustand rechtwinklig zur Einfallsebene. Der transmittierte Strahl ist parallel zur Einfallsebene stark, senkrecht zur Einfallsebene nur schwach polarisiert – er ist teilweise polarisiert.

und aus θt = 90◦ − θp folgt ni sin θp = nt cos θp und tan θp = nt /ni .

(8.29)

Dieser Ausdruck wird nach Sir David Brewster (1781–1868), Professor für Physik an der St. Andrews University und, nicht zu vergessen, Erfinder des Kaleidoskops, brewstersches Gesetz genannt. Brewster fand die Beziehung auf empirische Weise. Befindet sich der einfallende Strahl in Luft (ni = 1) und ist das brechende Medium Glas (nt ≈ 1,5), so beträgt der Polarisationswinkel rund 56◦ . Trifft ein unpolarisierter

8 Polarisation

692

Licht, das von einer Pfütze reflektiert wird, ist teilweise polarisiert. (a) Durch ein Polaroidfilter, dessen Durchlassachse parallel zum Boden liegt, sieht man den Glanz der Oberfläche. (b) Dreht man das Filter, sodass die Durchlassachse nun senkrecht zum Boden liegt, so verschwindet der Glanz weitgehend. (Foto mit freundlicher Genehmigung von Martin Seymour.)

Strahl unter einem Winkel von 53◦ auf die Oberfläche eines Teiches (nt ≈ 1,33), so wird der reflektierte Strahl vollständig polarisiert, sodass sein E-Feld senkrecht zur Einfallsebene und damit parallel zur Wasseroberfläche steht (siehe Foto). Dies bringt uns auf eine Idee, wie man die Durchlassachse eines nicht gekennzeichneten Polarisators herausfinden kann – man braucht dazu nur ein Stück Glas oder einen Teich. Bei der Ausnutzung dieses Phänomens zur Konstruktion eines Polarisators ergibt sich allerdings ein Problem: Das reflektierte Strahlenbündel, obwohl vollkommen polarisiert, ist schwach; das durchgelassene Strahlenbündel ist intensiv, jedoch nur teilweise polarisiert. Eine Anordnung wie in Abbildung 8.39 nennt man einen GlasplattensatzPolarisator. Er wurde 1812 von Dominique F. J. Arago erfunden. Vorrichtungen dieser Art können für sichtbares Licht aus Glasplatten, für Infrarotlicht aus Silberchloridplatten und für ultraviolettes Licht aus Quarz- oder Vycor-Glasplatten hergestellt werden. Eine primitive Anordnung dieser Art kann man leicht aus etwa einem Dutzend Objektträgern aufbauen. (Die wundervollen Farben, die bei gegenseitiger Berührung der Objektträger erscheinen können, werden im nächsten Kapitel diskutiert.)

θp

θp

Abb. 8.39: Ein Glasplattensatz-Polarisator.

8.6 Polarisation durch Reflexion

693

Nach demselben Prinzip arbeitet ein Strahlteilerwürfel, der zwei orthogonal zueinander linear polarisierte Strahlen erzeugt, welche bequemerweise durch einen Winkel von 90◦ getrennt sind (Abb. 8.40). Auf die diagonale Fläche eines der beiden Prismen sind mehrere verschiedene transparente, dielektrische Schichten aufgebracht. Da die Absorption gering oder null ist, eignen sich solche Würfel besonders für die Arbeit mit Laserstrahlen, wo die Beschädigung optischer Geräte vermieden und die Wellenfronten ungestört durchgelassen werden sollen.

Abb. 8.40: Die Diagonalfläche des Polarisationswürfels ist mit mehreren dielektrischen Schichten ausgerüstet. Bei der Reflexion an dieser Schichtstruktur wird das Licht ähnlich wie an einem Glasplattensatz polarisiert.

8.6.1 Eine Anwendung der fresnelschen Gleichungen Im Abschnitt 4.6.2 entwickelten wir die fresnelschen Gleichungen. Sie beschreiben, was geschieht, wenn eine ebene elektromagnetische Welle auf die Grenzfläche zwischen zwei verschiedenen Dielektrika trifft. Diese Gleichungen verknüpfen die Amplitude des reflektierten bzw. durchgelassenen Feldes über den Einfallswinkel θi und den Brechungswinkel θt mit der Amplitude des einfallenden Feldes. Für linear polarisiertes Licht, dessen E-Feld parallel zur Einfallsebene ist, definierten wir den Amplituden-Reflexionskoeffizienten als r || ≡ [E0r /E0i ] || , also als den Quotienten aus der reflektierten und der einfallenden elektrischen Feldamplitude. Steht das elektrische Feld senkrecht auf der Einfallsebene, so erhalten wir r⊥ ≡ [E0r /E0i ]⊥ . Das entsprechende Verhältnis der Bestrahlungsstärke (bei gleicher Querschnittsfläche des einfallenden und des reflektierten Strahlenbündels) nennt man Reflexionsgrad. Da die Bestrahlungsstärke proportional zum Quadrat der Amplitude des Feldes ist, gilt R || = r 2|| = [E0r /E0i ]2||

und

2 R⊥ = r⊥ = [E0r /E0i ]2⊥ .

Quadrieren der zugehörigen fresnelschen Gleichungen liefert R || =

tan2 (θi − θt ) tan2 (θi + θt )

(8.30)

R⊥ =

sin2 (θi − θt ) . sin2 (θi + θt )

(8.31)

und

8 Polarisation

694

Während R⊥ niemals null sein kann, wird R || tatsächlich null, wenn der Nenner unendlich ist, d. h., wenn θi + θt = 90◦ wird. Der Reflexionsgrad verschwindet daher für linear polarisiertes Licht mit E parallel zur Einfallsebene, Er || = 0, und der Strahl wird vollständig durchgelassen. Dies ist die Kernaussage des brewsterschen Gesetzes. Ist das eintreffende Licht unpolarisiert, so können wir es wie gewohnt durch zwei orthogonale, inkohärente, amplitudengleiche P-Zustände darstellen. Übrigens bedeutet die Amplitudengleichheit, dass die Energie in beiden Polarisationszuständen gleich ist (Ii || = Ii⊥ = Ii /2). Daher ist Ir || = Ir || Ii /2Ii || = R || Ii /2 , und in der gleichen Weise ist Ir⊥ = R⊥ Ii /2. Der Reflexionsgrad R = Ir /Ii in natürlichem Licht ist deshalb durch R=

1 Ir || + Ir⊥ = (R || + R⊥ ) Ii 2

(8.32)

gegeben. In Abbildung 8.41 sind die Funktionen (8.30), (8.31) und (8.32) für ni = 1 und nt = 1,5 aufgetragen. Die mittlere Kurve für einfallendes natürliches Licht zeigt, dass bei θi = θp nur etwa 7,5% des ankommenden Lichts reflektiert werden. Das durchgelassene Licht ist dann offensichtlich teilweise polarisiert. Bei θi = θp ist sowohl die Brechungswelle als auch die reflektierte Welle teilweise polarisiert.

1.0 0.9

Reflexionsgrad

0.8 0.7 0.6 0.5 0.4 0.3 0.2 0.1 0.04

Abb. 8.41: Das Reflexionsvermögen als Funktion des Einfallswinkels.

8.6 Polarisation durch Reflexion

695

Beispiel 8.6 Angenommen, natürliches Licht mit einer Bestrahlungsstärke von 200 W/m2 fällt unter seinem Polarisationswinkel auf ein Stück Glas. Die Gesamtdurchlässigkeit an der Luft-Glas-Grenzfläche sei 92,5 %. Wie viel Licht wird an der Grenzfläche in einem P-Zustand normal zur Einfallsebene reflektiert? Lösung Gegeben ist T = 12 (T || + T⊥ ) = 92,5 % . Im Polarisationswinkel wird alles Licht durchgelassen, das parallel zur Einfallsebene ist, d. h. T || = 1. Damit ist T = 12 (1 + T⊥ ) = 0,925 1 2 T⊥

= 0,925 − 0,50 = 0,425 ,

d. h. T⊥ = 0,850 (85 %). Das senkrecht zur Einfallsebene polarisierte Licht wird also zu 15 % reflektiert. Von dem parallelen Licht wird nichts reflektiert. Aus R = 12 (R || + R⊥ ) = 12 (0 + 0,150) folgt, dass die Gesamtreflexion 7,5 % ist. Damit ist die reflektierte Bestrahlungsstärke (0,075)(200 W/m 2 ) = 15,0 W/m2 .

Häufig ist es sinnvoll, den Polarisationsgrad zu verwenden, der als V =

Ip Ip + Iu

(8.33)

definiert ist; Ip und Iu sind die Flussdichten des polarisierten und des unpolarisierten Lichts. Für Ip = 4 W/m2 und Iu = 6 W/m2 beispielsweise ist V = 40%, und das Strahlenbündel ist teilweise polarisiert. Mit unpolarisiertem Licht ist Ip = 0 und offensichtlich V = 0, während im anderen Extrem V = 1 wird, wenn Iu = 0 ist, und das Licht ist vollkommen polarisiert; daher gilt 0 ≤ V ≤ 1. Oft hat man es mit teilweise linear polarisiertem, quasimonochromatischem Licht zu tun. Drehen wir einen Analysator im Strahlenbündel, so gibt es dann eine Ausrichtung, in der die durchgelassene Bestrahlungsstärke maximal (Imax ) wird, und senkrecht dazu eine Richtung, in der sie minimal (Imin ) wird. Es ist Ip = Imax − Imin , und so gilt V =

Imax − Imin . Imax + Imin

(8.34)

Beachten Sie, dass V eigentlich eine Eigenschaft des Strahlenbündels ist, das teilweise oder sogar vollkommen polarisiert sein kann, bevor es auf den Polarisator trifft.

8 Polarisation

696

8.7

Verzögerungsplättchen

Wir wollen nun optische Elemente betrachten, mit deren Hilfe man die Polarisation einer einfallenden Welle verändern kann – die Verzögerungsplättchen. Das Prinzip eines solchen Gerätes ist recht einfach. Einer der beiden kohärenten P-Zustände wird auf irgendeine Weise dazu gebracht, dass er gegenüber dem anderen eine vorgegebene Phasenverschiebung hat. Beim Austritt aus dem Plättchen haben die beiden Komponenten dann eine andere relative Phase als beim Eintritt, daher ist der Polarisationszustand ebenfalls ein anderer. Mithilfe des Verzögerungsplättchens kann man tatsächlich jeden gegebenen Polarisationszustand in einen beliebigen anderen umwandeln und damit auch Zirkularpolarisatoren und Polarisatoren zur Erzeugung elliptisch polarisierten Lichts herstellen. Der Begriff „Verzögerungsplättchen“ ist etwas irreführend, da man die Phase mit einem solchen Bauelement nicht nur verzögern, sondern ebenso gut nach vorn verschieben kann. Tatächlich wäre die Bezeichnung „relativer Phasenverschieber“ treffender, denn ein Verzögerungsplättchen verschiebt die Phase von einem der beiden orthogonalen elektrischen Felder um einen gewünschten Betrag. Betrachten Sie noch einmal Abbildung 8.9, in der eine Sequenz von Polarisationszuständen und ihre relativen Phasen gezeigt sind. Eine im jetzigen Zusammenhang nützlichere Version dieses Diagramms ist Abbildung 8.42, in der unmittelbar ersichtlich ist, dass das Muster endlos ist – die Sequenz beginnt nach einem Umlauf immer wieder von vorn. Wie Sie sehen, ist Ex der Komponente Ey stets um den angegebenen positiven Betrag voraus – oder anders formuliert, Ex liegt stets um den entsprechenden negativen Betrag zurück. Der Phasenverschieber hat immer zwei spezielle senkrechte Achsen, die schnelle und die langsame. Wenn die schnelle Achse in x-Richtung (horizontal) verläuft, ist Ex um einen festen Betrag voraus und Ey bleibt unverändert. Wenn die schnelle Achse in y-Richtung (vertikal) verläuft, ist Ey um einen festen Betrag voraus und Ex bleibt unverändert. Um in Abbildung 8.42 im Uhrzeigersinn von einem Polarisationszustand zum nächsten zu gehen, führen wir eine Phasenverschiebung von +π/4 ein. Um gegen den Uhrzeigersinn von einer Position zur nächsten zu gehen, führen wir eine Verschiebung von −π/4 ein, und nach acht solchen Verschiebungen (insgesamt also um +2π oder −2π) ist das Licht wieder im Ausgangszustand. Wenn beispielsweise Licht, das im ersten und dritten Quadranten schwingt (Ex eilt Ey um 0 voraus), durch ein Verzögerungsplättchen geschickt wird, dessen schnelle Achse horizontal verläuft, dann wird das Licht in dem Diagramm im Uhrzeigersinn verschoben. Mit einer Phasendifferenz von π/4 oder π/2 oder π wird das Licht linkshändig elliptisch (Ex eilt Ey um π/4 voraus), linkszirkular (Ex eilt Ey um π/2 voraus), linear im zweiten und vierten Quadranten (Ex eilt Ey um π voraus) usw. aus dem Plättchen austreten. Entsprechend wird rechtszirkulares Licht (Ex eilt Ey um 3π/2 voraus), das durch ein Verzögerungsplättchen mit vertikaler schneller Achse geht, als linkszirkulares Licht (Ex eilt Ey um 3π/2 − π = π/2 voraus) aus dem Plättchen austreten.

8.7 Verzögerungsplättchen links

697

p p

rechts –3p / 4

–5p / 4 3p / 4

5p / 4 + +

+ + +e

–3p / 2

+ +

p /2

+ +

+ +

3p / 2 –p / 2

–e + +

+ +

p /4

7p / 4

–7p / 4

–p / 4 2p 0

Abb. 8.42: Die resultierenden Polarisationszustände, wenn das Feld Ex dem Feld Ey um den angegebenen positiven oder negativen Wert von ε vorauseilt.

8.7.1 Phasenplättchen und Rhomboeder Wie wir wissen, teilt sich eine ebene monochromatische Welle beim Durchgang durch einen einachsigen Kristall wie zum Beispiel Kalkspat in der Regel in zwei Strahlen, einen ordentlichen (ordinären) und einen außerordentlichen (extraordinären). Wir können einen Kalkspatkristall aber auch so schneiden und polieren, dass seine optische Achse sowohl auf der vorderen als auch auf der hinteren Oberfläche senkrecht steht (Abb. 8.43). Das E-Feld einer senkrecht einfallenden ebenen Welle kann nur senkrecht zur optischen Achse stehen. Die in der Zeichenebene liegende Komponente des E-Feldes bleibt nicht überall senkrecht zur optischen Achse, während sie sich (als die außerordentliche Welle) in alle Richtungen in den Kristall ausbreitet. Sie verformt sich dabei zu einem Ellipsoid. Die senkrecht zur Zeichenebene stehende Komponente des E-Feldes bleibt überall senkrecht, während sie sich als sphärische ordentliche Welle ausbreitet. Die sekundären sphärischen und ellipsoidförmigen Elementarwellen sind dann in der Richtung der optische Achse zueinander tangential. Die o- und eWellen, Einhüllende dieser Elementarwellen, fallen nun zusammen, und eine einzige, nicht abgelenkte ebene Welle läuft durch den Kristall; es gibt keine relativen Phasenverschiebungen und keine Doppelbilder.14 Die optische Achse sei nun zur vorderen und hinteren Oberfläche des Kristalls parallel (Abb. 8.44). Hat das E-Feld einer einfallenden monochromatischen, ebenen Welle Komponenten parallel und senkrecht zur optischen Achse, so breiten sich zwei getrennte ebene Wellen im Kristall aus. Wegen v || > v⊥ ist no > ne , und die e-Welle durchläuft den Kristall schneller als die o-Welle. Nach dem Durchlaufen 14

Wenn Ihnen ein Kalkspatrhomboeder zur Verfügung steht, dann fixieren Sie die stumpfe Ecke und richten den Kristall so aus, dass Sie durch eine Oberfläche längs der Richtung der optischen Achse sehen. Die beiden Bilder laufen zusammen, bis sie sich vollständig überdecken.

8 Polarisation

698

-Welle -Welle

optische Achse

optische Achse

Abb. 8.43: Eine Kalkspatplatte, die senkrecht zur optischen Achse geschnitten ist.

optische Achse

optische Achse

Abb. 8.44: Eine Kalkspatplatte, die parallel zur optischen Achse geschnitten ist.

eines Plättchens der Dicke d wird die resultierende elektromagnetische Welle als Überlagerung der e- und der o-Welle gebildet, deren relativer Phasenunterschied jetzt Δϕ ist. Bekanntlich sind die Komponenten harmonische Wellen derselben Frequenz mit orthogonalen E-Feldern. Der relative optische Wegunterschied ist dann durch Λ = d (|no − ne |)

(8.35)

gegeben, und wegen Δϕ = k0 Λ ist der Phasenunterschied im Radiant gleich Δϕ =

2π d (|no − ne |) , λ0

(8.36)

wobei λ0 wie immer die Wellenlänge im Vakuum ist. (Die Form der Gleichung, die den Absolutbetrag der Differenz der Brechungsindizes enthält, ist die allgemeinste.) Der Polarisationszustand des austretenden Lichts hängt offensichtlich von den Amplituden der ankommenden orthogonalen Feldkomponenten und natürlich von Δϕ ab.

y x

d

Schematische Darstellung zu Beispiel 8.7

8.7 Verzögerungsplättchen

699

Beispiel 8.7 Die Abbildung auf der vorherigen Seite zeigt ein Kalkspatplättchen, dessen optische Achse senkrecht auf der Zeichenebene steht. Erläutern Sie was passiert und finden Sie einen Ausdruck für die Phasendifferenz, die sich ergibt, wenn das Licht durch den Kristall geht. Lösung Ey entspricht der o-Welle, da es überall senkrecht zur optischen Achse ist. Wie gewöhnlich sind die o-Elementarwellen sphärisch, da sie ein isotropes Medium „sehen“. Ez dagegen entspricht der e-Welle. Es ist überall parallel zur optischen Achse und breitet sich daher ebenfalls als sphärische Elementarwelle aus. In Kalkspat ist v || > v⊥ , und die e-Welle pflanzt sich daher schneller fort als die o-Welle. Entsprechend ist no > ne , und für die Differenz der optischen Weglänge auf dem Plättchen ergibt sich d(no − ne ). Folglich gilt Δϕ =

2π d(no − ne ) , λ0

was Gleichung (8.36) entspricht. Wir stellen also fest, dass das E-Feld nur dann als Ellipsoid propagieren wird, wenn die e-Welle sowohl parallele als auch senkrechte Komponenten zur optischen Achse hat.

Das λ-Plättchen Ist Δϕ gleich 2π, so beträgt die relative Phasenverschiebung eine Wellenlänge. Die e- und die o-Welle sind wieder phasengleich, und man kann keinerlei Auswirkung auf die Polarisation des einfallenden monochromatischen Strahlenbündels beobachten. Beträgt die relative Phasenverschiebung Δϕ, die man auch als Phasenverschiebungsgrad bezeichnet, 360◦ , so nennt man das Gerät ein λ-Plättchen. (Dies bedeutet nicht, dass die Dicke der Platte d = λ ist.) Im Allgemeinen ändert sich der Betrag |no − ne | in Gleichung (8.36) im optischen Spektralbereich wenig, sodass Δϕ effektiv proportional zu 1/λ0 ist. Offensichtlich kann ein λ-Plättchen in der beschriebenen Weise nur für eine bestimmte Wellenlänge funktionieren, weshalb man Verzögerungsplättchen dieser Art als chromatisch bezeichnet. Wird ein derartiges Gerät in einer beliebigen Ausrichtung zwischen gekreuzte Linearpolarisatoren gestellt, so ist das gesamte eintretende Licht linear polarisiert. Nur die Wellenlänge, die Gleichung (8.36) mit Δϕ = 2π erfüllt, läuft unbeeinflusst durch das Verzögerungsplättchen und wird im Analysator absorbiert. Alle anderen Wellenlängen erfahren eine bestimmte Phasenverschiebung und treten aus dem Plättchen unterschiedlich elliptisch polarisiert aus. Ein Teil des Lichts gelangt durch den Analysator, aus dem schließlich Licht mit der Komplementärfarbe der ausgelöschten Farbe austritt. Wenn der Analysator stattdessen so positioniert wird, dass seine Durchlassachse parallel zur Durchlassachse des ersten Analysators ist, wobei das λ-Plättchen zwischen beiden ist, wirkt das System als Filter. Ein Stapel

8 Polarisation

700

mehrerer solcher Anordnungen erzeugt einen schmalbandigen Filter. Es ist ein verbreiteter Irrtum, anzunehmen, ein λ-Plättchen verhalte sich bei allen Frequenzen isotrop. Wir erinnern uns, dass im Kalkspat diejenige Welle am schnellsten wandert, deren EFeldschwingungen parallel zur optischen Achse liegen, also v || > v⊥ . In einem negativ einachsigen Verzögerungsplättchen bezeichnet man die Richtung der optischen Achse daher als schnelle Achse, während man die Richtung senkrecht zu ihr die langsame Achse nennt. Bei positiv einachsigen Kristallen wie Quarz ist es umgekehrt – die langsame Achse entspricht nun der optischen Achse. λ-Plättchen werden oft verwendet, um unerwünschte Veränderungen des Polarisationszustandes von Licht, das durch ein optisches System fällt, zu korrigieren. Lineares Licht z. B. ist nach der Reflexion an einem Spiegel mit Metalloberfläche durch Phasenverschiebungen elliptisch polarisiert. Den Strahl durch ein λ-Plättchen zu leiten, das geringfügig entweder um seine schnelle oder seine langsame Achse geneigt wurde, schafft hier Abhilfe. Das λ/2-Plättchen Ein Phasenplättchen, das einen relativen Phasenunterschied von π rad oder 180◦ zwischen der o- und der e-Welle einführt, nennt man λ/2-Plättchen. Angenommen, die Schwingungsebene eines eintreffenden linearen Lichtstrahlenbündels bildet einen beliebigen Winkel θ mit der schnellen Achse (Abb. 8.45). In einem optisch negativen Material hat die e-Welle eine größere Geschwindigkeit (dasselbe ν) und eine größere Wellenlänge als die o-Welle. Beim Austritt aus dem Plättchen beträgt die relative Phasenverschiebung λ0 /2 (2π/2 rad), und E hat sich um 2θ gedreht (Abb. 8.46; λ/2-Plättchen werden aus diesem Grund auch als „Polarisationsdreher“ bezeichnet). Betrachten wir noch einmal Abbildung 8.9, dann sehen wir, dass ein λ/2-Plättchen elliptisch polarisiertes Licht ähnlich beeinflusst. Außerdem kehrt es die Drehrichtung von zirkular oder elliptisch polarisiertem Licht um (rechts wird zu links und umgekehrt). Ein λ/2-Plättchen verschiebt die Polarisationszustände in Abbildung 8.42 um eine halbe Drehung. Beim Durchlauf durch ein Phasenplättchen nimmt der relative Phasenunterschied Δϕ der e- und o-Wellen zu, wobei sich der Polarisationszustand der Welle allmählich ändert. Abbildung 8.9 kann man sich als Auswahl einiger dieser Zustände vorstellen, die zu einem bestimmten Zeitpunkt, aber verschiedenen Orten gehören. Ist die Dicke des Stoffes so, dass d (|no − ne |) = (2m + 1) λ0 /2

(8.37)

mit m = 0, 1, 2, . . . gilt, so handelt es sich offensichtlich um ein λ/2-Plättchen (Δϕ = π, 3π, 5π usw.). Obwohl das Verhalten von Kalkspat sehr anschaulich ist, wird dieses Material selten zur Herstellung von Phasenplättchen verwendet. Es ist ziemlich brüchig und in dünnen Schichten schwer zu handhaben, doch entscheidend ist, dass seine Doppelbrechung,

8.7 Verzögerungsplättchen

701

optische Achse

θ

e-Welle o-Welle schnelle Achse

θ

θ

θ

ttchen λ/2-Plä

E

Abb. 8.45: Ein λ/2-Plättchen; man erkennt, wie der relative Phasenunterschied der e- und o-Welle beim Durchlaufen des Plättchens zunimmt.

Abb. 8.46: Ein λ/2-Plättchen dreht die Polarisationsebene von linear polarisiertem Licht insgesamt um 2θ. Die Schwingungsebene des einfallenden Lichts liegt hier im ersten und dritten, die des austretenden Lichts im zweiten und vierten Quadranten.

also der Unterschied zwischen ne und no , für diese Verwendung viel zu groß ist. Quarz mit seiner wesentlich kleineren Doppelbrechung wird dagegen oft eingesetzt; er hat aber keine natürlichen Spaltebenen und muss geschnitten, geschliffen und poliert werden, was insgesamt recht teuer ist. Meistens verwendet man den zweiachsigen Glimmerkristall. Verschiedene Arten Glimmer sind für diesen Zweck ausgezeichnet geeignet, z. B. Fluorphlogopit, Biotit oder Muskowit. Die am weitesten verbreitete Art ist der blassbraune Muskowit, der sich leicht in sehr flexible, äußerst dünne, großflächige Stücke spalten lässt. Außerdem sind seine beiden Hauptachsen fast exakt parallel zu den Spaltebenen. Längs dieser Achsen betragen die Brechungsindizes für Natriumlicht etwa 1,599 und 1,594; zwar variieren diese Zahlen von Probe zu Probe leicht, aber ihre Differenz ist recht konstant. Die minimale Dicke eines λ/2-Plättchens aus Glimmer beträgt etwa 60 µm. Kristallquarz, einkristallines Magnesiumfluorid (für den infraroten Bereich von 3000 nm bis etwa 6000 nm) und Cadmiumsulfid (für den infraroten Bereich von 6000 nm bis etwa 12 000 nm) werden für Phasenplättchen ebenfalls häufig verwendet. Verzögerungsplättchen werden auch aus Polyvinylalkohol-Folien hergestellt, die gestreckt werden, um ihre langkettigen organischen Moleküle auszurichten. Wegen der Anisotropie wirken parallel und senkrecht zur Richtung der Moleküle nicht die glei-

702

8 Polarisation

chen Bindungskräfte auf die Elektronen. Substanzen dieser Art sind deshalb stets doppelbrechend, obwohl sie nicht kristallin sind. Man erhält ein recht genaues λ/2-Plättchen, wenn man einen Streifen glänzendes Cellophan-Klebeband auf der Oberfläche eines Objektträgers anbringt. (Das funktioniert allerdings nicht mit allen Marken.) Die schnelle Achse, also die Schwingungsrichtung der schnelleren Welle, liegt quer über dem Band, die langsame Achse längs dazu. Cellophan wird aus Cellulose hergestellt, die ihrerseits aus Holz oder Baumwolle stammt. Bei der Extrusion zu Folien richten sich die Moleküle aus, und das Band wird doppelbrechend. Bringt man ein solches λ/2-Plättchen zwischen gekreuzte Linearpolarisatoren, so bemerkt man keinen Effekt, wenn seine Hauptachsen mit denen der Polarisatoren zusammenfallen. Orientiert man die Hauptachsen jedoch in einem Winkel von 45◦ bezüglich der Achsen des Polarisators, so wird das E-Feld, das aus dem Band austritt, um 90◦ gekippt und ist dann parallel zur Durchlassachse des Analysators. Das von dem Band abgedeckte Gebiet erscheint wie eine Aussparung im schwarzen Hintergrund der gekreuzten Polarisatoren (siehe Foto). Cellophan-Verpackungsfolie (z. B. von Zigarettenschachteln) funktioniert im Allgemeinen ebenfalls als λ/2-Plättchen. Versuchen Sie, die Ausrichtung der Hauptachsen unter Verwendung des Cellophan-Plättchens und gekreuzter Polaroidfilter festzustellen. (Beachten Sie dabei die feinen parallelen Rippen auf der Cellophanfolie.)

Ein Stück Klebeband auf einem Objektträger wird zwischen zwei gekreuzte Polarisatoren gehalten. (Foto von E. H.)

Das λ/4-Plättchen Das λ/4-Plättchen führt zwischen den orthogonalen o- und e-Komponenten einer Welle eine relative Phasenverschiebung von Δϕ = π/2 ein. Eine Phasenverschiebung von 90◦ verwandelt linear polarisiertes in elliptisch polarisiertes Licht und umgekehrt (siehe dazu wieder Abb. 8.9). Linear polarisiertes Licht, das parallel zu einer der beiden Hauptachsen einfällt, wird natürlich von keinem Verzögerungsplättchen beeinflusst, denn einen relativen Phasenunterschied kann man nur erhalten, wenn zwei Komponenten vorhanden sind. Bei Einfall natürlichen Lichts sind die beiden P-Zustände inkohärent: Ihr relativer Phasenunterschied ändert sich zufällig und schnell. Ein Verzögerungsplättchen führt zwar eine zusätzliche konstante Phasenverschiebung ein, aber dies hat keinen erkennbaren Effekt, weil die entstehende Phasendifferenz noch immer zufällig ist.

8.7 Verzögerungsplättchen

45 ◦

703

schnelle Achse ϕ

ttchen λ/4-Plä

Abb. 8.47: Ey eilt Ex um π/4 voraus, nachdem das Licht durch das Verzögerungsplättchen gegangen ist. Das λ/4-Plättchen wandelt somit ursprünglich linear polarisiertes Licht (θ = 45◦ , Schwingungsebene im ersten und dritten Quadranten) in rechtszirkular polarisiertes Licht um (Rotation im Uhrzeigersinn, wenn man in Richtung Quelle blickt).

Fällt linear polarisiertes Licht in einem Winkel von 45◦ zu einer der beiden Hauptachsen auf ein λ/4-Plättchen, so sind die Amplituden der o- und der e-Komponente identisch. Unter diesen besonderen Umständen wandelt eine Phasenverschiebung um 90◦ die Welle in zirkular polarisiertes Licht um (Abb. 8.47). Ebenso tritt ein ankommender, zirkular polarisierter Strahl linear polarisiert aus. Immer, wenn lineares Licht von einem λ/4-Plättchen in elliptisches oder zirkulares Licht umgewandelt wird, entspricht die dabei entstehende Händigkeit der Richtung, die man wählen müsste, um das ursprünglich lineare Licht (unter dem kleinsten Winkel) so zu drehen, dass es mit der langsamen Achse ausgerichtet ist. Ein λ/4-Plättchen verschiebt den Polarisationszustand in Abbildung 8.42 um eine viertel Drehung. λ/4-Plättchen werden gewöhnlich ebenfalls aus Quarz, Glimmer oder organischen Polymeren hergestellt. In jedem Fall muss die Dicke des doppelbrechenden Stoffes die Gleichung d (|no − ne |) = (4m + 1) λ0 /4

(8.38)

mit m = 0, 1, 2, . . . erfüllen. Ein leidlich genaues λ/4-Plättchen kann man aus Frischhaltefolie für Lebensmittel herstellen. Wie Cellophan hat diese Folie Längsrippen parallel zur Hauptachse. Legen Sie etwa ein halbes Dutzend Schichten aufeinander und achten Sie darauf, dass die Rippen parallel bleiben. Orientieren Sie den Kunststoff in einem Winkel von 45◦ zu den Achsen eines Polarisators und betrachten Sie ihn durch einen rotierenden Analysator. Fügen Sie Schicht für Schicht hinzu, bis die Bestrahlungsstärke beim Drehen des Analysators etwa konstant bleibt; dann haben Sie zirkular polarisiertes Licht und ein λ/4-Plättchen. Mit weißem Licht ist es gar nicht so einfach, dieses Experiment nachzuvollziehen, aber ein Versuch lohnt sich. Beispiel 8.8 Wellenplättchen werden oft aus Glimmer gefertigt, weil das Material sich leicht in dünne Plättchen spalten lässt. Für gelbes Licht der Wellenlänge 589 nm, das normal auf ein solches Plättchen fällt, können die beiden Komponenten der oszillierenden Lichtwelle auf Brechungsindizes von 1,5997 und 1,5941 treffen,

8 Polarisation

704

wobei diese Werte in Abhängigkeit vom konkreten Mineral etwas variieren können. Wie dick muss ein Glimmerplättchen mindestens sein, damit es als λ/4Plättchen verwendet werden kann? Lösung Für ein λ/4-Plättchen muss der optische Wegunterschied ein ungeradzahliges Vielfaches von λ0 /4 sein: opt. Wegunterschied = d(|no − ne |) = (4m + 1)λ0 /4 mit m = 0, 1, 2, . . . . Daraus folgt d=

(4m + 1)λ0 (|no − ne |)4

und mit m = 0 d=

589 nm . (1,5997 − 1,5941)4

Wir erhalten d = 2,63 × 10−5 m oder 26,3 µm. Wellenplättchen werden im Handel allgemein mit ihrer linearen Phasenverschiebung gekennzeichnet. Für ein λ/4-Plättchen könnten dies zum Beispiel 140 nm sein. Diese Zahl bedeutet, dass das Gerät eine Phasenverschiebung von 90◦ bei grünem Licht einer Wellenlänge von 560 nm (4 × 140 nm) bewirkt. Die lineare Phasenverschiebung wird gewöhnlich nicht ganz so genau angegeben; 140 ± 20 nm ist realistisch. Durch leichtes Schrägstellen eines Wellenplättchens kann man das angegebene Verschiebungsvermögen vergrößern oder verkleinern. Wird das Plättchen um seine schnelle Achse gedreht, so nimmt die Phasenverschiebung zu, eine Drehung um die langsame Achse hat den entgegengesetzten Effekt. Auf diese Weise kann ein Wellenplättchen bezüglich einer bestimmten Frequenz auf seinen Nennwert justiert werden. Verzögerungsplättchen (Wellenplättchen): Allgemeine Anmerkungen Neben doppelbrechenden Verzögerungsplättchen gibt es auch Plättchen auf Flüssigkristallbasis (siehe Abschnitt 8.12). Diese können typischerweise eine elektrisch kontrollierte Verzögerung bis zu λ0 /2 erzeugen. Verzögerungsplättchen lassen sich in drei allgemeine Gruppen unterteilen: Plättchen nullter Ordnung, Plättchen höherer Ordnung sowie Compound-Plättchen nullter Ordnung. Ein Verzögerungsplättchen nullter Ordnung ist so dünn, dass die erwünschte Phasendifferenz gerade erreicht werden kann. Betrachten wir zum Beispiel ein λ/4-Plättchen aus Quarz mit einer Doppelbrechung von nur 0,0092 bei 550 nm. Aus Gleichung (8.36) folgt für Δϕ = π/2, dass ein solches Plättchen (nullter Ordnung) nur 15 µm dick sein muss. Es ist dann zwar sehr zerbrechlich und schwierig herzustellen, hat aber ein großes Sehfeld.

8.7 Verzögerungsplättchen

705

Die Dicke von Verzögerungsplättchen höherer Ordnung entspricht einer Phasenverschiebung um ganzzahlige Vielfache von 2π plus der gewünschten Phasendifferenz Δϕ, die 2π, π oder π/2 sein kann. Solche Elemente lassen sich einfacher herstellen und sind billiger, reagieren dafür aber empfindlich auf Schwankungen der Wellenlänge, des Einfallswinkels und der Temperatur. Außerdem ist ihr Sehfeld stark begrenzt. Durch Kombination zweier Wellenplättchen höherer Ordnung, deren Verschiebungsdifferenz gleich dem gewünschten Wert Δϕ ist, erhalten wir ein Compound-System nullter Ordnung (siehe Beispiel 8.9). Bei einem solchen System wird die schnelle Achse des einen Plättchens mit der langsamen Achse des anderen zur Deckung gebracht. Die Empfindlichkeit gegenüber Temperaturschwankungen kann so weitgehend eliminiert werden, doch auch bei Compound-Systemen gibt es das Problem des eingeschränkten Sehfeldes. Beispiel 8.9 Gegeben sei ein einachsiges doppelbrechendes Kristallplättchen der Dicke d1 , dessen optische Achse in x-Richtung liegt. Hinter diesem Plättchen befindet sich ein ähnliches Plättchen der Dicke d2 , dessen optische Achse in y-Richtung liegt. Die Kombination der beiden Plättchen ergibt ein Compound-System nullter Ordnung. Bestimmen Sie einen Ausdruck für den Verzögerungsgrad und vergleichen Sie diesen mit Gleichung (8.36). Lösung Wir gehen genau so vor wie bei der Analyse, die zu Gleichung (8.36) führte. Das heißt, wir schreiben zunächst Ausdrücke für die optischen Weglängen auf (bezeichnet mit lx und ly ), die von den Feldkomponenten Ex und Ey zurückgelegt werden, während die Welle in z-Richtung durch die beiden Plättchen geht. Da Ex im ersten Plättchen parallel zur optischen Achse ist, ist diese Komponente mit der e-Welle verbunden. Für das erste Plättchen allein gilt somit lx1 = ne d1 und ly1 = no d1 . o- und e-Welle sind im zweiten Plättchen vertauscht, wo lx2 = no d2 und ly2 = ne d2 gilt. Für beide Plättchen zusammen gilt somit lx = ne d1 + no d2

und

ly = no d1 + ne d2 .

Der Wegunterschied Λ ist dann Λ = ly − lx = d1 (no − ne ) + d2 (ne − no ) und somit 2π (d1 − d2 )(no − ne ) . Δϕ = λ0

(8.39)

Der Vergleich mit Gleichung (8.36) ergibt, dass dieser Ausdruck nicht von der Dicke des Plättchens abhängt, sondern von der Differenz der Dicken der beiden Komponenten.

8 Polarisation

706

Doppelbrechende Polymere lassen sich bequem zu Verzögerungsplättchen nullter Ordnung verarbeiten, weil ihre Doppelbrechung klein ist. Sie zeichnen sich durch ein weites Sehfeld aus und können mit großen Öffnungen kombiniert werden. y´ 1

0

2

m gsa lan

0, 0

y

7

E0

6, 6

4

5

30°

u q

1, 1

3

l nel schx 6 ´

7, 7

E0



x 5, 5

2, 2

4, 4 3, 3

5

4



6 3 7 2

1

0

Abb. 8.48: Linkshändig elliptisches Licht mit dem Neigungswinkel der schnellen Achse ergibt sich, wenn lineares Licht (E) durch ein λ/4-Plättchen geht. Hier hat die schnelle Achse den Winkel +30,0◦ .

Die Zeigermethode für die Behandlung von ortogonalen Wellen kann auch für Verzögerungsplättchen angewendet werden.15 Beginnen wir mit linearem Licht, das im ersten und dritten Quadranten schwingt, wobei die Schwingungsebene einen beliebigen Winkel θ mit der x-Achse bildet (Abb. 8.48). Die Länge des elektrischen Feldvektors ist die angegebene Amplitude E0 . Nehmen wir nun an, dass diese Welle durch ein λ/4-Plättchen geht, und stellen wir uns vor, dass die schnelle Achse des Verzögerungsplättchens um einen gewissen Winkel, beispielsweise 30◦ , gegenüber der x-Achse gedreht ist. In Abbildung 8.48 ist im Winkel von 30◦ durch den Ursprung des xyKoordinatensytems eine Referenzlinie gezeichnet, die der schnellen Achse entspricht. Diese Linie bildet zusammen mit ihrer Normalen ein neues x y  -Koordinatensystem. In diesem Koordinatensystem konstruieren wir aus den Projektionen von E auf die schnelle und die langsame Achse ein Rechteck. Damit haben wir E0x und E0y , die beiden Amplituden im x y  -Koordinatensystem. Diese Amplituden, in Richtung der schnellen Achse und senkrecht dazu, gestatten es uns, ein Rechteck zu konstruieren, in das der resultierende Polarisationszustand hineinpasst, so, wie wir es in 15

Für eine ausführlichere Behandlung siehe K. Iizuka, Elements of Photonics, Vol. 1, WileyIntersience, 2002.

8.7 Verzögerungsplättchen

707

Abbildung 8.10 gemacht hatten. Wir verlängern die Begrenzungen des Rechtecks und zeichnen zwei Kreise, die die Amplituden (d. h. die Radien) E0x und E0y haben. Da die schnelle Achse die x -Achse ist, ist der zu dem kleineren Kreis gehörende Zeiger Ey . Er beginnt seinen Umlauf auf der y  -Achse in seiner vertikalen 0-Position. Entsprechend beginnt der Zeiger Ex in dem größeren Kreis auf der x -Achse und zeigt nach rechts, weil er Ey um 90◦ voraus ist. Seine 0-Position ist demnach auf der y  -Achse und zeigt nach unten. Die resultierende Polarisation ist linkshändiges elliptisches Licht, das um 30◦ geneigt ist, bzw. im allgemeinen Fall geneigt um den beliebigen Winkel der schnellen Achse des Verzögerungsplättchens. Das fresnelsche Rhomboeder Aus Kapitel 4 wissen wir, dass die innere Totalreflexion einen Phasenunterschied der beiden orthogonalen Feldkomponenten verursacht. Die Komponenten parallel und senkrecht zur Einfallsebene sind zueinander phasenverschoben. In Glas (n = 1,51) entsteht bei dem speziellen Einfallswinkel von 54,6◦ auf diese Weise ein Phasenunterschied von 45◦ (Abb. 4.52 e). Das fresnelsche Rhomboeder (Abb. 8.49) nutzt diesen Effekt aus: Der Strahl wird zweimal innen reflektiert, wodurch seine Komponenten eine relative Phasenverschiebung von 90◦ erhalten. Ist die eintreffende ebene Welle 45◦ zur Einfallsebene linear polarisiert, so sind die Feldkomponenten [Ei ]⊥ und [Ei ] || ursprünglich gleich. Nach der ersten Reflexion ist die Welle innerhalb des Glases elliptisch, nach der zweiten Reflexion zirkular polarisiert. Da die Phasenverschiebung über einen großen Bereich fast nicht von der Frequenz abhängt, ist das Parallelepiped eigentlich ein achromatisches 90◦ -Plättchen. Fügt man zwei Rhomboeder an den Enden zusammen, so erreicht man eine λ0 /2-Verschiebung in einem großen Wellenlängenbereich (etwa 2000 nm). Das mooneysche Rhomboeder (n = 1,65), Abbildung 8.50, ist prinzipiell ähnlich aufgebaut.

54.6◦

Abb. 8.49: Das fresnelsche Rhomboeder.

60◦

Abb. 8.50: Das mooneysche Rhomboeder.

8 Polarisation

708

8.7.2 Kompensatoren Ein Kompensator ist ein optisches Gerät, das die Phase einer Welle regulierbar verschieben kann. Im Unterschied zu einem Phasenplättchen, in dem Δϕ fest ist, kann der von einem Kompensator erzeugte relative Phasenunterschied kontinuierlich variiert werden. Von den vielen verschiedenen Arten von Kompensatoren werden wir nur die beiden meistverwendeten betrachten. Der Babinet-Kompensator besteht aus zwei unabhängigen Kalkspat- oder (häufiger) Quarzkeilen, deren optische Achsen in Abbildung 8.51 durch die Linien und Punkte angedeutet sind. Ein Strahl, der vertikal nach unten in einem beliebigen Punkt des Gerätes eintritt, durchläuft im oberen Keil die Dicke d1 , im unteren die Dicke d2 . Vom ersten Kristall wird der Welle der relative Phasenunterschied 2πd1 (|no − ne |) /λ0 verliehen, vom zweiten die Differenz −2πd2 (|no − ne |) /λ0 . Wie im Wollaston-Prisma, das diesem System sehr ähnelt, aber größere Winkel hat und viel dicker ist, wird der o- bzw. e-Strahl im oberen Keil zum e- bzw. o-Strahl im unteren Keil. Der Kompensator ist dünn (der Keilwinkel ist typischerweise etwa 2,5◦ ), weshalb der Abstand der Strahlen vernachlässigt werden kann. Der gesamte Phasenunterschied ist dann Δϕ =

2π (d1 − d2 ) (|no − ne |) . λ0

(8.40)

Für einen Kompensator aus Kalkspat eilt die e-Welle der o-Welle im oberen Teil voraus. Deshalb entspricht Δϕ dem Gesamtwinkel, um den die e-Komponente vorauseilt, wenn d1 > d2 ist. Das Gegenteil gilt für einen Kompensator aus Quarz: Bei d1 > d2 ist Δϕ der Winkel, um den die o-Welle der e-Welle vorauseilt. In der Mitte, bei d1 = d2 , löschen die beiden Keile einander in ihrer Wirkung gerade aus und für alle Wellenlängen ist Δϕ = 0. Die Phasenverschiebung ist von Punkt zu Punkt über der Oberfläche verschieden und in schmalen Bereichen entlang der Breite des Kompensators gleich, an denen die Keildicken gleich sind. Tritt Licht durch einen Schlitz parallel zu einem dieser Bereich ein und bewegen wir dann einen der Keile horizontal mit einer Mikrometerschraube, so können wir jedes gewünschte Δϕ einstellen.

d1 d2

Abb. 8.51: Der Babinet-Kompensator.

8.8 Zirkularpolarisatoren

709

Befindet sich der Babinet-Kompensator in einem Winkel von 45◦ zwischen gekreuzten Polarisatoren, so erscheinen quer über die Breite des Kompensators parallele, gleichmäßig verteilte, dunkle Auslöschungsstreifen. Diese markieren die Stellen, an denen sich das Gerät wie ein λ-Plättchen verhält. In weißem Licht sind die Streifen mit Ausnahme des schwarzen Zentralbereichs (Δϕ = 0) farbig. Man kann die Phasenverschiebung eines unbekannten Plättchens bestimmen, indem man es auf den Kompensator legt und die Streifenverschiebungen untersucht, die es verursacht. Da die Streifen schmal und elektronisch schwer abzulesen sind, hat der Babinet-Kompensator mittlerweile an Beliebtheit verloren. Er lässt sich so modifizieren, dass sich eine gleichmäßige Phasenverschiebung über der Oberfläche ergibt. Dazu dreht man den oberen Keil um 180◦ um die Senkrechte, sodass seine dünne Kante auf der dünnen Kante des unteren Keils liegt. Diese Anordnung lenkt den Strahl allerdings leicht ab. Eine andere Variante des Babinet-Kompensators, die den Vorteil hat, ohne Strahlablenkung eine gleichmäßige Phasenverschiebung zu erzeugen, ist der in Abbildung 8.52 gezeigte Soleil-Kompensator. Er wird im Allgemeinen aus Quarz hergestellt (im Infrarotbereich verwendet man MgF2 oder CdS) und besteht aus zwei Keilen und einer planparallelen Platte, deren optische Achsen wie angegeben ausgerichtet sind. Die Größe d1 entspricht nun der Gesamtdicke beider Keile, die für jede Einstellung der Mikrometerschraube konstant ist.

d1 d2

8.8

Abb. 8.52: Der Soleil-Kompensator.

Zirkularpolarisatoren

Wir wissen bereits, dass linear polarisiertes Licht, dessen E-Feld bezüglich der Hauptachsen eines λ/4-Plättchens um 45◦ geneigt ist, aus diesem Plättchen zirkular polarisiert austritt. Jede Kombination eines geeignet ausgerichteten Linearpolarisators und eines 90◦ -Plättchens ist daher ein Zirkularpolarisator. Die beiden Elemente sind vollständig unabhängig voneinander; das eine könnte z. B. nach dem Prinzip der Doppelbrechung, das andere nach dem der Reflexion arbeiten. Die Drehrichtung

8 Polarisation

710

des austretenden zirkular polarisierten Lichts hängt davon ab, ob die Durchlassachse des Linearpolarisators um +45◦ oder −45◦ gegenüber der schnellen Achse des Verzögerungsplättchens geneigt liegt. Beide zirkular polarisierte Zustände, L und R, lassen sich gleichermaßen einfach erzeugen. Befindet sich der Linearpolarisator zwischen zwei Verzögerungsplättchen, wobei einer mit +45◦ und der andere mit −45◦ ausgerichtet ist, so ist die Kombination von beiden Seiten anwendbar: Sie liefert einen R-Zustand für Licht, das auf der einen Seite eintritt, und einen L-Zustand für Licht, das von der anderen Seite einfällt. Der Handelsname eines beliebten einteiligen Zirkularpolarisators ist CP-HN. Das Gerät besteht aus zwei miteinander verbundenen Schichten, einem HN-Polaroidfilter und einem 90◦ -Plättchen aus Polyvinylalkohol. Die Eingangsseite einer derartigen Anordnung ist die Oberfläche des Linearpolarisators. Fällt das Strahlenbündel auf die Ausgangsseite, d. h. auf das Verzögerungsplättchen, so läuft es anschließend durch die H-Folie und kann nur linear polarisiert austreten. A C

45 ◦

B

45 ◦

D

Linearpolarisa tor

λ/4Plättche n

λ/4Plättche n

Linearpolarisa tor

Abb. 8.53: Zwei Linearpolarisatoren und zwei λ/4-Plättchen.

Mithilfe eines Zirkularpolarisators lässt sich die Drehrichtung einer Welle bestimmen, von der man bereits weiß, dass sie zirkular polarisiert ist. Um das Prinzip zu verstehen, betrachten wir die vier Elemente, die in Abbildung 8.53 mit A, B, C und D gekennzeichnet sind. Die ersten beiden, A und B, bilden zusammen einen Zirkularpolarisator, ebenso C und D. Sind die schnellen Achsen der Wellenplättchen parallel, so ist die exakte Dreheigenschaft der Polarisatoren unwichtig. Linear polarisiertes Licht, das von A kommt, erhält von B eine 90◦ -Phasenverschiebung; von diesem Punkt an ist das Licht zirkular polarisiert. Beim Durchgang durch C wird noch eine 90◦ -Phasenverschiebung hinzugefügt, was wieder zu einer linear polarisierten Welle führt. B und C bilden zusammen ein λ/2-Plättchen, das die Polarisationsebene des Lichts von A um einen Raumwinkel von 2θ, in diesem Fall 90◦ , kippt. Da die Polarisationsebene nach C parallel zur Durchlassachse von D ist, läuft die Welle durch D und aus dem System heraus. Die Beschreibung dieses einfachen Prozesses führt uns zu einer interessanten Erkenntnis: Angenommen, die Zirkularpolarisatoren A + B und C + D seien beide linksdrehend. Dann haben wir gezeigt, dass linkszirkular polarisiertes Licht, das in einen linksdrehenden Zirkularpolarisator von der Ausgangsseite aus eintritt, durchgelassen

8.9 Polarisation von polychromatischem Licht

711

Wenn Sie ein zerknittertes Stückchen Cellophan zwischen gekreuzte Polarisatoren halten, sehen Sie farbige Effekte. In Abhängigkeit von der Frequenz des einfallenden Lichts und der Dicke der Folie dreht diese das elektrische Feld unterschiedlich stark. Wenn Sie nun ein Filter drehen, verschieben sich die Farben zur jeweiligen Komplementärfarbe.

wird. Ferner erzeugt rechtszirkular polarisiertes Licht offenbar einen P-Zustand, der senkrecht zur Durchlassachse von D ist und daher absorbiert wird. Die Umkehrung gilt ebenso: Nur Licht in einem R-Zustand, das von der Ausgangsseite her eintritt, gelangt durch einen rechtsdrehenden Zirkularpolarisator.

8.9

Polarisation von polychromatischem Licht

8.9.1 Bandbreite und Kohärenzzeit einer polychromatischen Welle Rein monochromatisches Licht, das streng genommen natürlich nicht existiert, muss polarisiert sein. Die beiden orthogonalen Komponenten einer solchen Welle haben dieselbe Frequenz, und beide Amplituden sind konstant. Wäre die Amplitude einer der beiden sinusförmigen Komponenten veränderlich, so wäre dies gleichbedeutend mit der Anwesenheit zusätzlicher Frequenzen im Fourier-Spektrum. Die beiden Komponenten haben außerdem einen konstanten relativen Phasenunterschied, sie sind kohärent. Eine monochromatische Welle ist ein unendlicher Wellenzug, dessen Eigenschaften für alle Zeiten festgelegt sind; die Welle ist vollständig polarisiert, ob sie sich nun in einem R-, L-, P- oder E-Zustand befindet. Reale Lichtquellen sind polychromatisch: Sie emittieren Strahlungsenergie, die eine Reihe von Frequenzen enthält. Wir wollen nun untersuchen, was im submikroskopischen Maßstab geschieht, wobei wir besonders den Polarisationszustand der emittierten Welle betrachten. Wir stellen uns einen Elektronen-Oszillator vor, der strahlt, nachdem er zur Schwingung (möglicherweise durch einen Zusammenstoß) angeregt worden ist. Der Oszillator emittiert, entsprechend seiner Bewegung, exakt eine bestimmte Form polarisierten Lichts. Wie in Abschnitt 7.4.3 stellen wir uns die von einem einzelnen Atom stammende Strahlungsenergie als Wellenzug mit endlich großer räumlicher Ausdehnung Δlc vor. Momentan wollen wir annehmen, dass der Polarisationszustand dieses Wellenzuges im Wesentlichen für eine Dauer in der Größenordnung der Kohärenzzeit Δtc gleich bleibt. (Die Kohärenzzeit entspricht, wie wir uns erinnern, der zeitlichen Ausdehnung des Wellenzuges, Δlc /c.) Eine typische Quelle besteht im Allgemeinen aus sehr

712

8 Polarisation

vielen strahlenden Atomen, die unserer Vorstellung nach mit verschiedenen Phasen bei einer dominierenden Frequenz ν schwingen. Wir betrachten nun das Licht, das aus einem sehr kleinen Bereich der Quelle kommt. Im Beobachtungspunkt treffen dann im Wesentlichen parallele Strahlen ein. Während einer Zeit, die kurz im Vergleich zur mittleren Kohärenzzeit ist, bleiben die Amplituden und Phasen der Wellenzüge der einzelnen Atome mehr oder weniger konstant. Beim Blick auf die Quelle aus einer beliebigen Richtung könnten wir dann, wenigstens für einen Augenblick, eine kohärente Überlagerung der Wellen „sehen“, die in dieser Richtung ausgestrahlt werden, nämlich eine resultierende Welle mit einem bestimmten Polarisationszustand. Dieser Zustand dauert nur eine Zeit lang, die kleiner als die Kohärenzzeit ist, aber trotzdem für eine große Anzahl von Schwingungen der Frequenz ν ausreicht. Ist die Bandbreite Δν groß, so ist die Kohärenzzeit (Δtc ≈ 1/Δν) klein, und jeder Polarisationszustand ist kurzlebig. Offensichtlich sind die Begriffe Polarisation und Kohärenz in einer fundamentalen Weise verknüpft. Betrachten wir nun eine Welle, deren Bandbreite im Vergleich zu ihrer mittleren Frequenz sehr schmal ist, d. h., eine quasimonochromatische Welle. Diese kann durch zwei orthogonale, harmonische P-Zustände wie in den Gleichungen (8.1) und (8.2) dargestellt werden; hier sind die Amplituden und Phasenkonstanten jedoch Funktionen der Zeit. Weiterhin entsprechen die Frequenz und die Wellenzahl den mittleren Werten des Spektrums, das in der Welle vorhanden ist, nämlich ω und k. Daher gilt   (8.41a) Ex (t) = ˆıE0x (t) cos kz − ωt + εx (t) und   (8.41b) Ey (t) = ˆjE0y (t) cos kz − ωt + εy (t) . Der Polarisationszustand und dementsprechend E0x (t), E0y (t), εx (t), εy (t) verändern sich langsam und bleiben über viele Schwingungen hinweg im Prinzip konstant. Wir erinnern uns, dass die schmale Bandbreite eine relativ große Kohärenzzeit impliziert. Beobachten wir die Welle während eines viel längeren Zeitraums, so verändern sich die Amplituden und Phasenkonstanten entweder unabhängig voneinander oder in korrelierter Weise. Im ersteren Fall bleibt der Polarisationszustand nur für ein Intervall konstant, das im Vergleich zur Kohärenzzeit klein ist. Die Ellipse, die den Polarisationszustand beschreibt, kann also ihre Form, Ausrichtung und Drehrichtung verändern. Da kein existierender Detektor einen Zustand erfassen könnte, der eine so kurze Zeit andauert, würden wir in der Praxis folgern, dass die Welle nicht polarisiert war. Ist der Quotient E0x (t) /E0y (t) dagegen konstant, obwohl sich beide Glieder verändern, und ist ε = εy (t) − εx (t) ebenfalls konstant, so ist die Welle polarisiert. Hier ist die Notwendigkeit für die Korrelation zwischen den verschiedenen Funktionen offensichtlich. Wir können einer Welle jedoch tatsächlich diese Eigenschaften verleihen, indem wir sie lediglich durch einen Polarisator leiten, wodurch alle unerwünschten Bestandteile beseitigt werden. Das Zeitintervall, in dem die Welle danach ihren Polarisationszustand beibehält, ist nicht mehr von der Bandbreite abhängig, weil die

8.9 Polarisation von polychromatischem Licht

713

Komponenten der Welle in entsprechende Korrelation gebracht worden sind. Das Licht könnte polychromatisch (sogar weiß) und trotzdem vollkommen polarisiert sein. Es würde sich ähnlich wie die idealisierten monochromatischen Wellen verhalten, die wir in Abschnitt 8.1 behandelt haben. Zwischen diesen beiden Extremen, dem vollkommen polarisierten und dem vollkommen unpolarisierten Licht, liegt der Zustand der teilweisen Polarisation. Es kann in der Tat gezeigt werden, dass jede quasimonochromatische Welle als die Summe einer polarisierten und einer unpolarisierten Welle dargestellt werden kann, wobei die Summanden voneinander unabhängig sind und einer von beiden null sein darf.

8.9.2 Interferenzfarben Bringen Sie ein zusammengeknülltes Cellophanpapier zwischen zwei Polaroidfilter, die mit weißem Licht beleuchtet werden. Alternativ können Sie auch Folie einer Tragetasche aus Polyethylen nehmen, die sich zwischen gekreuzten Polaroidfiltern in keiner Hinsicht auffällig verhält, und sie dehnen. Dies richtet die Moleküle aus und macht die Folie doppelbrechend. Nun zerknüllen Sie das Material und untersuchen es wiederum zwischen den Filtern. Das resultierende Muster besteht aus vielfarbigen Bereichen, die sich im Farbton verändern, wenn Sie das Filter drehen. Diese so genannten Interferenzfarben resultieren aus der Abhängigkeit der Phasenverschiebung von der Wellenlänge. Die gewöhnlich buntgescheckte Struktur der Muster ist eine Folge räumlicher Unterschiede der Dicke und/oder der Doppelbrechung. Interferenzfarben kommen sehr häufig vor und können in sehr vielen Substanzen leicht beobachtet werden, z. B. an einem mehrschichtigen Glimmerstück, einem Eissplitter, einer gedehnten Plastiktüte oder fein zerkleinerten Teilchen eines gewöhnlichen Kieselsteins (Quarz). Um dieses Phänomen zu verstehen, betrachten wir Abbildung 8.54. Schematisch dargestellt ist ein schmales, monochromatisches, linear polarisiertes Lichtstrahlenbündel, das durch einen kleinen Bereich einer doppelbrechenden Platte Σ läuft. Über diese Fläche sollen Doppelbrechung und Dicke konstant sein. Das durchgelassene Licht ist in der Regel elliptisch polarisiert. Stellen wir uns nun vor, das aus Σ kommende Licht bestehe aus zwei orthogonalen, linear polarisierten Wellen (der x- und der y-Komponente des E-Feldes) mit einem relativen Phasenunterschied Δϕ, der durch Gleichung (8.36) bestimmt ist. Nur die Komponenten, die in Richtung der Durchlassachse des Analysators orientiert sind, passieren diesen und erreichen den Beobachter. Diese Komponenten haben ebenfalls einen Phasenunterschied von Δϕ und sind koplanar, weshalb sie interferieren können. Ist Δϕ = π, 3π, 5π usw., so sind die Komponenten vollkommen außer Phase und löschen einander aus. Ist Δϕ = 0, 2π, 4π usw., so sind sie vollkommen phasengleich und verstärken sich gegenseitig. Die Phasenverschiebung, die in einem Punkt P1 auf Σ für blaues Licht (λ0 = 435 nm) entsteht, sei 4π. In diesem Fall wird Blau gut hindurchgelassen. Es folgt aus Gleichung (8.32), dass λ0 Δϕ = 2πd (|no − ne |) im Prinzip eine Konstante ist, die

8 Polarisation

714

E

θ

y



x

Ey

Ex Ex s in θ Ey c os θ

Abb. 8.54: Der Ursprung der Interferenzfarben.

durch die Dicke und die Doppelbrechung bestimmt ist. Für alle Wellenlängen ist hier also λ0 Δϕ = 1740π. Betrachten wir nun gelbes Licht (λ0 = 580 nm), so wird Δϕ ≈ 3π und das Licht von P1 wird vollständig gelöscht. Bei Beleuchtung mit weißem Licht erscheint jener spezielle Punkt auf Σ so, als ob das Gelb vollständig entfernt wäre, während alle anderen Farben durchgelassen würden, am stärksten jedoch Blau. Das blaue Licht, das von dem Gebiet um P1 ausgeht, ist parallel zur Durchlassachse des Analysators linear polarisiert (Δϕ = 4π). Im Gegensatz dazu ist das gelbe Licht längs der Auslöschungsachse linear polarisiert (Δϕ = 3π); die anderen Farben sind elliptisch polarisiert. Der Bereich um P1 verhält sich wie ein λ/2-Plättchen für Gelb und ein λ-Plättchen für Blau. Dreht man den Polarisator nun um 90◦ , so wird das Gelb durchgelassen und das Blau ausgelöscht. Definitionsgemäß bezeichnet man zwei Farben als komplementär, wenn ihre Überlagerung weißes Licht ergibt. Der Analysator wird bei einer Drehung um 90◦ daher abwechselnd Komplementärfarben durchlassen oder absorbieren. Auf die gleiche Art könnte sich auf einer anderen Stelle von Σ ein Punkt P2 befinden, in dem Δϕ = 4π für Rot ist (λ0 = 650 nm). Dann ist λ0 Δϕ = 2600π, woraufhin das blaugrüne Licht (λ0 = 520 nm) eine Phasenverschiebung von 5π erfährt und ausgelöscht wird. Variiert das Verschiebungsvermögen des Materials von einem Bereich zum anderen, dann variiert auch die Farbe des Lichts, das vom Analysator durchgelassen wird.

8.10 Optische Aktivität Die Art und Weise der Wechselwirkung von Licht mit Materie liefert oft wertvolle Informationen über deren molekulare Struktur. Als Nächstes untersuchen wir einen Vorgang, der in der Optik von speziellem Interesse und für Chemie und Biologie früher wie heute von Bedeutung ist. Im Jahre 1811 beobachtete der französische Physiker Dominique F. J. Arago erstmals das faszinierende Phänomen der optischen Aktivität. Arago entdeckte, dass sich die Schwingungsebene eines linear polarisierten Lichtstrahls kontinuierlich dreht, während sich der Strahl entlang der optischen Achse einer Quarzplatte fortpflanzt (Abb. 8.55). Ungefähr zur selben Zeit bemerkte auch Jean Baptiste Biot (1774–1862)

8.10 Optische Aktivität

715

Quarz

rechtsdrehend

(a) rechts

Abb. 8.55: Optische Aktivität von Quarz.

optische Achse

optische Achse

optische Achse

diesen Effekt, als er gasförmige und flüssige Formen verschiedener Naturstoffe wie Terpentin untersuchte. Einen solchen Stoff, der das E-Feld einer einfallenden linear polarisierten, ebenen Welle dreht, nennt man optisch aktiv. Dabei muss man, wie Biot herausfand, zwischen rechts- und linkshändiger Drehung unterscheiden. Erscheint beim Blick in die Richtung der Quelle die Schwingungsebene nach rechts gedreht, so bezeichnet man die Substanz als rechtsdrehend (Symbol D von lat. dextro, rechts). Dagegen nennt man den Stoff linksdrehend (Symbol L von lat. laevo, links), wenn E nach links gedreht erscheint.

(b) links

Abb. 8.56: Rechts- und linkshändige Quarzkristalle.

Im Jahre 1822 erkannte der Astronom F. W. Herschel (1792–1871), dass das rechtsund linksdrehende Verhalten von Quarz in Wirklichkeit zwei verschiedenen Kristallstrukturen entspricht. Obwohl die chemische Zusammensetzung identisch ist (SiO2 ), kann Kristallquarz in Abhängigkeit von der Anordnung seiner Moleküle entweder rechts- oder linksdrehend sein. Wie in Abbildung 8.56 gezeigt, gleichen die äußeren Erscheinungsbilder der beiden Kristallarten einander in jeder Hinsicht, nur ist eines das Spiegelbild der anderen: Sie sind enantiomorph. Alle lichtdurchlässigen enantiomorphen Substanzen sind optisch aktiv; geschmolzener Quarz und Quarzglas hingegen, beide nicht kristallin, sind optisch inaktiv. Die optische Aktivität von Quarz ist offensichtlich mit der Kristallstruktur, also der Anordnung der Atome im Material, verknüpft. Viele Substanzen, sowohl organische als auch anorganische (z. B. Benzil und NaBrO3 ), zeigen wie Quarz nur in ihrer kristallinen Form eine optische Aktivität. Natürlich vorkommende organische Verbindungen wie Zucker, Weinsäure oder Terpentin sind dagegen in Lösung oder im flüssigen Zustand optisch aktiv. Das Drehvermögen ist hier offensichtlich eine Eigenschaft der einzelnen Moleküle. Bei komplizierteren Substanzen kann die optische Aktivität sowohl mit den Molekülen selbst als auch mit ihrer Anordnung innerhalb der verschiedenen Kristalle verknüpft sein. Ein Beispiel ist Rubidiumtartrat: Aus einer rechtsdrehenden Lösung dieser Verbindung scheiden sich linksdrehende Kristalle ab.

8 Polarisation

716

Fresnel beschrieb die optische Aktivität 1825 in einfacher Weise phänomenologisch, ohne sich dem eigentlichen Mechanismus zu widmen. Da die einfallende linear polarisierte Welle als eine Überlagerung von R- und L-Zuständen dargestellt werden kann, schlug Fresnel vor, dass diese beiden Formen zirkular polarisierten Lichts sich mit verschiedenen Geschwindigkeiten ausbreiten. Ein aktiver Stoff zeigt zirkulare Doppelbrechung – er besitzt zwei Brechungsindizes, einen für den R-Zustand (nR ) und einen für den L-Zustand (nL ). Beim Durchgang durch eine optisch aktive Probe geraten die beiden Wellen außer Phase, und die resultierende linear polarisierte Welle erscheint gedreht. Analytisch können wir dies ausgehend von den Gleichungen (8.8) und (8.9) beschreiben, die monochromatisches, rechts- und linkszirkular polarisiertes, sich in z-Richtung ausbreitendes Licht erfassen. Aus Gleichung (8.10) entnehmen wir, dass die Summe dieser beiden Wellen tatsächlich linear polarisiert ist. Wir verändern nun diese Ausdrücke, um den Faktor 2 aus der Amplitude der Gleichung (8.10) zu entfernen, wodurch ER =

E0 [ˆı cos (kR z − ωt) + ˆj sin (kR z − ωt)] 2

(8.42a)

EL =

E0 [ˆı cos (kL z − ωt) − ˆj sin (kL z − ωt)] 2

(8.42b)

und

die rechts- und linksdrehenden einzelnen Wellen darstellen. Da ω konstant ist, gilt kR = k0 nR und kL = k0 nL . Die Resultierende ist durch E = ER + EL gegeben und nach einigen trigonometrischen Umformungen erhalten wir E = E0 cos [(kR + kL ) z/2 − ωt] × [ˆı cos (kR − kL ) z/2 + ˆj sin (kR − kL ) z/2] .

(8.43)

Wo die Welle maximal wird (z = 0), ist sie längs der x-Achse linear polarisiert (Abb. 8.57), d. h. E = E0ˆı cos ωt .

(8.44)

Man beachte, dass in jedem Punkt längs des Weges beide Komponenten dieselbe Zeitabhängigkeit besitzen und die Resultierende deshalb auf der z-Achse linear polarisiert ist (Abb. 8.58), obwohl ihre Orientierung offensichtlich eine Funktion von z ist. Gilt außerdem nR > nL oder äquivalent kR > kL , so dreht sich E nach links, bei kL > kR dagegen nach rechts (beim Blick in Richtung der Quelle). Üblicherweise definiert man den Winkel β, um den sich E dreht, als positiv, wenn die Welle rechtsdrehend ist. Halten wir uns an diese Vorzeichenkonvention, so sollte aus Gleichung (8.43) hervorgehen, dass das Feld im Punkt z einen Winkel β = − (kR − kL ) z/2 zur Richtung

8.10 Optische Aktivität

717

EL

EL ER

EL E

E

E

ER

t=0

(a)

ER

(c)

(b)

Abb. 8.57: Die Überlagerung eines R- und eines L-Zustandes bei z = 0. E ER

kR

EL ER EL

E

EL

z ER

kL z 

E (c)

(b)

(a)

Abb. 8.58: Die Überlagerung eines R- und eines L-Zustandes bei z = z  (kL > kR ).

seiner ursprünglichen Orientierung bildet. Für ein Medium der Dicke d ist der Winkel, um den sich die Schwingungsebene dann dreht, β=

πd (nL − nR ) , λ0

(8.45)

wobei nL >nR eine Rechtsdrehung und nR >nL eine Linksdrehung ergibt (Abb. 8.59).

EL

−(kL d−ωt)

optische Achse für alle Teile

β ER

−(kR −kL )d/2

R

R

R L

L (kR d−ωt)

Abb. 8.59: Die Überlagerung eines Rund eines L-Zustandes bei z = d (kL > kR , λL < λR , vL < vR ).

L

R

Abb. 8.60: Das zusammengesetzte fresnelsche Prisma.

718

8 Polarisation

Fresnel konnte die einzelnen R- und L-Zustände eines linear polarisierten Strahlenbündels übrigens unter Verwendung des zusammengesetzten Prismas in Abbildung 8.60 trennen. Dieses Prisma besteht aus mehreren rechts- und linksdrehenden Quarzsegmenten, die bezüglich der optischen Achsen wie dargestellt geschnitten wurden. Der R-Zustand pflanzt sich im ersten Prisma schneller fort als im zweiten und wird deshalb zur Senkrechten der geneigten Grenzfläche hin gebrochen. Das Gegenteil gilt für den L-Zustand, und der Winkelabstand der beiden zirkular polarisierten Wellen nimmt an jeder Grenzfläche zu. In Natriumlicht beträgt das spezifische Drehvermögen β/d für Quarz 21,7◦ /mm. Daraus folgt, dass für Licht, das sich entlang der optischen Achse fortpflanzt, |nL − nR | = 7,1 × 10−5 ist. In dieser speziellen Richtung verschwindet natürlich die normale Doppelbrechung. Bei einfallendem Licht, das sich senkrecht zur optischen Achse ausbreitet (wie es oft in Polarisationsprismen, Phasenplättchen und Kompensatoren der Fall ist), verhält sich Quarz jedoch wie jeder optisch inaktive, einachsig positive Kristall. Es gibt auch andere doppelbrechende, optisch aktive Kristalle, sowohl einachsige als auch zweiachsige, z. B. Zinnober HgS (no = 2,854, ne = 3,201) mit einem Drehvermögen von 32,5◦ /mm. Natriumchlorat, NaClO3 , hingegen ist optisch aktiv (3,1◦ /mm), aber nicht doppelbrechend. Das Drehvermögen von Flüssigkeiten ist im Vergleich dazu so klein, dass es gewöhnlich auf eine Weglänge von 10 cm bezogen wird. Für Terpentin (C10 H6 ) beträgt es beispielsweise nur −37◦ /10 cm (10 ◦ C mit λ0 = 589,3 nm). Das Drehvermögen von Lösungen ist konzentrationsabhängig. Diese Tatsache ist in der Praxis insbesondere zur Bestimmung der Zuckerkonzentration (z. B. in einer Urinprobe oder einem Zuckersirup) hilfreich. Optische Aktivität kann man z. B. an handelsüblichem Glucosesirup beobachten. Man fülle etwas Sirup in einen Glasbehälter zwischen gekreuzten Polarisatoren und beleuchte ihn mit einer Taschenlampe. Die schönen Farben, die bei der Drehung des Analysators erscheinen, ergeben sich aus der Abhängigkeit von β von λ0 , ein Effekt, den man Rotationsdispersion nennt. Verwendet man ein Filter zur Erzeugung von annähernd monochromatischem Licht, kann man ohne weiteres das Drehvermögen des Sirups bestimmen.16 Der erste große wissenschaftliche Beitrag von Louis Pasteur (1822–1895) stand im Zusammenhang mit seinen Forschungsarbeiten zu seiner Promotion (1848). Er zeigte, dass die Traubensäure, eine optisch inaktive Form der Weinsäure, eigentlich eine Mischung gleicher Mengen links- und rechtsdrehender Bestandteile ist. Substanzen dieser Art, die dieselben Summenformeln haben, sich aber in ihrer Struktur unterscheiden, nennt man Isomere. Pasteur war in der Lage, die Traubensäure zu kristallisieren und die beiden verschiedenen Typen spiegelbildlicher Kristalle (Enantiomere) danach 16

Ein Gelatinefilter eignet sich sehr gut, aber ein Stück gefärbtes Cellophan erfüllt die Aufgabe ebenfalls. Wir erinnern uns daran, dass sich das Cellophan wie ein Phasenplättchen verhält (siehe Abschnitt 8.7.1). Richten Sie seine Hauptachsen entsprechend aus, bevor Sie es zwischen die Polaroidfilter bringen.

8.10 Optische Aktivität

719

unter dem Mikroskop mit der Pinzette zu trennen. Bei der getrennten Auflösung beider Häufchen entstanden rechts- und linksdrehende Lösungen. Dies ließ auf die Existenz von Molekülen schließen, die chemisch gleich, aber strukturell Spiegelbilder sind; solche Moleküle nennt man heute optische Isomere. Diese Vorstellungen waren die Grundlage für die Entwicklung der Stereochemie der organischen und anorganischen Verbindungen, die sich mit der räumlichen Verteilung der Atome innerhalb eines gegebenen Moleküls befasst.

8.10.1 Ein Modell Das Phänomen der optischen Aktivität ist äußerst kompliziert. Man kann es zwar im Rahmen der klassischen elektromagnetischen Theorie beschreiben, aber eigentlich erfordert es eine quantenmechanische Behandlung.17 Trotzdem werden wir ein vereinfachtes Modell betrachten, das lediglich eine qualitative, jedoch plausible Beschreibung des Prozesses liefert. Ein optisch isotropes Medium haben wir weiter vorne durch eine homogene Verteilung isotroper Elektronenoszillatoren dargestellt, die parallel zum E-Feld der einfallenden Welle schwingen. Analog dazu haben wir ein optisch anisotropes Medium als Verteilung anisotroper Oszillatoren behandelt, die in einem bestimmten Winkel zum anregenden E-Feld schwingen. Stellen wir uns nun vor, die Elektronen in optisch aktiven Substanzen seien gezwungen, sich entlang gewundener Bahnen zu bewegen, die wir der Einfachheit halber als schraubenförmig annehmen. Ein Molekül ist in diesem Bild eine Art leitende Helix. Von den Siliciumund Sauerstoffatomen eines Quarzkristalls weiß man, dass sie in entweder rechts- oder linksdrehenden Spiralen um die optische Achse angeordnet sind (Abb. 8.61). In unserem vereinfachten Modell entspricht ein solcher Kristall einer Anordnung paralleler Schraubenlinien. Eine optisch aktive Zuckerlösung kann man als Verteilung zufällig ausgerichteter Schraubenlinien derselben Drehrichtung (Händigkeit) auffassen.18 Wir können erwarten, dass die im Quarz ankommende Welle in verschiedener Weise mit der Probe in Wechselwirkung tritt, je nachdem, ob sie rechts- oder linksdrehende Schraubenlinien „sieht“. Folglich erwarten wir verschiedene Brechungsindizes für die R- und die L-Komponenten der Welle. Die ausführliche Behandlung des Prozesses, die zur zirkularen Doppelbrechung in Kristallen führt, ist keineswegs einfach, doch zumindest die notwendige Asymmetrie ist offensichtlich. Wie kann nun eine zufällige Anordnung von Schraubenlinien in einer Lösung eine optische Aktivität erzeugen? In einer vereinfachten Darstellung wollen wir ein Beispiel untersuchen, und zwar ein 17

18

In dem Übersichtsartikel „Optical Activity and Molecular Dissymmetry“ von S. F. Mason, Contemp. Phys. 9 (1968) 239 finden Sie eine umfangreiche Liste weiterführender Literatur. Neben Festkörpern und Flüssigkeiten gibt es noch eine dritte Zustandsform der Materie mit außergewöhnlichen optischen Eigenschaften, die Flüssigkristalle (siehe Abschn. 8.12). Dies sind organische Verbindungen, die fließen können und trotzdem ihre charakteristischen Molekülorientierungen beibehalten. In bestimmten cholesterischen Flüssigkeiten haben die Flüssigkristalle eine schraubenförmige Struktur und weisen daher (verglichen mit Quarz) extrem große Drehvermögen in der Größenordnung von 40 000◦ /mm auf.

8 Polarisation

720 O

O Si O

O optische Achse

Abb. 8.61: Rechtshändiger Quarz.

Molekül, dessen Achse parallel zum harmonischen E-Feld der elektromagnetischen Welle liegt. Das Feld bewegt die Ladungen längs des Moleküls auf und ab und erzeugt parallel zur Achse ein zeitlich veränderliches elektrisches Dipolmoment p (t). Außerdem fließt infolge der Spiralbewegung der Elektronen ein Strom, welcher wiederum ein oszillierendes magnetisches Dipolmoment m  (t) erzeugt, das ebenso entlang der Schraubenlinienachse gerichtet ist (Abb. 8.62). Liegt das Molekül dagegen parallel zum B-Feld der Welle, so entsteht ein zeitabhängiger Fluss und daher ein induzierter Elektronenstrom, der um das Molekül kreist. Dies ergibt wieder oszillierende, axiale elektrische und magnetische Dipolmomente. In beiden Fällen sind p (t) und m  (t) in Abhängigkeit von der Händigkeit der betrachteten Schraubenlinie zueinander parallel oder antiparallel. Zweifellos wird dem Feld Energie entnommen, und in beiden Fällen streuen die oszillierenden Dipole elektromagnetische Wellen. Das elektrische Feld Ep , das von einem elektrischen Dipol in eine bestimmte Richtung emittiert wird, steht senkrecht zu dem von einem magnetischen Dipol emittierten elektrischen Feld Em . Die Summe Es , das von einer Schraubenlinie gestreute resultierende Feld, ist dann nicht parallel zu dem in Fortpflanzungsrichtung einfallenden Feld Ei . (Analog gilt dies natürlich für die Magnetfelder.) Die Schwingungsebene des resultierenden transmittierten Lichts (Es + Ei ) wird daher in eine Richtung gedreht, die vom Drehsinn der Schraubenlinie bestimmt ist. Das Ausmaß dieser Drehung hängt von der Orientierung jedes Moleküls ab, doch erfolgt die Drehung für Schrauben gleicher Händigkeit stets in der gleichen Richtung. Auch wenn diese Diskussion optisch aktiver Moleküle als schraubenförmige Leiter nur die Oberfläche streift, ist es doch hilfreich, diese Analogie im Auge zu behalten. Richten wir ein linear polarisiertes 3-cm-Mikrowellenbündel auf einen Kasten, der mit einer großen Anzahl identischer schraubenförmiger Kupferleiter gefüllt ist (z. B. 1 cm lang, 0,2 cm Durchmesser, isoliert), so wird die Schwingungsebene der transmittierten Welle tatsächlich gedreht.19 19

I. Tinoco und M. P. Freeman, „The Optical Activity of Oriented Copper Helices“, J. Phys. Chem. 61 (1957) 1196.

8.10 Optische Aktivität

721

p m Ei

Bi

Ei

Em Ep Es

E Es

p Ei

Em

Bi Ep

Es

Ei

E

Es

m

Abb. 8.62: Die Strahlung schraubenförmiger Moleküle.

8.10.2 Optisch aktive Biomoleküle Einige der faszinierendsten Phänomene im Zusammenhang mit optischer Aktivität kann man in der Biologie beobachten. Bei einer Synthese einer Verbindung im Labor entstehen in der Regel gleichviele rechts- und linksdrehende Isomere und die Substanz ist optisch inaktiv. Man könnte daher erwarten, dass auch in Naturstoffen gleiche Mengen optischer Raumisomere enthalten sind. Dies ist aber keineswegs der Fall. Natürlicher Rohr- oder Rübenzucker (Saccharose, C12 H22 O11 ) ist immer rechtsdrehend. Überdies ist die einfache Dextrose (Traubenzucker) oder d-Glucose (C6 H12 O6 ), die rechtsdrehend ist, das wichtigste Kohlenhydrat im menschlichen Stoffwechsel. Offensichtlich sind Lebewesen in der Lage, zwischen Isomeren zu unterscheiden. Alle Proteine bestehen aus Bausteinen, den Aminosäuren, Verbindungen aus Kohlenstoff, Wasserstoff, Sauerstoff und Stickstoff. In der Natur treten im Wesentlichen 20 Aminosäuren auf und mit Ausnahme der einfachsten, des nicht enantiomorphen Glycins, sind sie alle linksdrehend. Die Aminosäuren eines zerlegten Proteinmoleküls sind also stets linksdrehend – gleichgültig, ob das Protein von einem Hühnerei, einer Eierfrucht, einem Käfer oder Ihrem Nachbarn stammt. Wichtige Ausnahmen sind die Antibiotika, zum Beispiel Penicillin, die einige rechtsdrehende Aminosäuren enthalten. Dies könnte die toxische Wirkung von Penicillin auf Bakterien erklären.

8 Polarisation

722

Es ist faszinierend, über die möglichen Ursprünge des Lebens auf diesem und anderen Planeten nachzudenken. Bestand das Leben auf der Erde ursprünglich aus beiden Spiegelbildformen? In einem Meteoriten, der am 28. September 1969 in Victoria/Australien einschlug, fand man fünf verschiedene Aminosäuren. Die Analyse ergab etwa gleiche Anteile rechts- und linksdrehender Formen. Dies steht in deutlichem Kontrast zu der überwältigenden Mehrzahl der linksdrehenden Form, die man in irdischem Gestein findet. Die Konsequenzen sind vielfältig und wunderbar.20

8.11 Erzwungene optische Effekte – Optische Modulatoren Eine Gemeinsamkeit verschiedener physikalischer Effekte im Zusammenhang mit polarisiertem Licht besteht darin, dass sie in irgendeiner Form von außen induziert werden. Dabei wirkt eine externe Kraft, z. B. eine mechanische Kraft, ein Magnetfeld oder ein elektrisches Feld, auf das optische Medium, wodurch sich die Art und Weise der Transmission von Licht ändert.

8.11.1 Photoelastizität Im Jahre 1816 entdeckte Sir David Brewster, dass normal transparente, isotrope Substanzen durch mechanische Belastung anisotrop gemacht werden können. Das Phänomen bezeichnet man als (akzidentielle) Spannungsdoppelbrechung oder Photoelastizität. Bei Druck oder Zug verhält sich der Stoff wie ein positiv bzw. negativ einachsiger Kristall. Die optische Achse liegt jeweils in Richtung der Belastung und die erzwungene Doppelbrechung ist proportional zur Belastung. Ist die Belastung über der Probe nicht gleichmäßig, so gilt dies auch für die Doppelbrechung und die Phasenverschiebung der transmittierten Welle.

Ein durchsichtiges Plastikdreieck zwischen Polaroidfiltern. (Foto E. H.)

Die Photoelastizität ist das Grundprinzip eines Verfahrens zur Untersuchung der Beanspruchung transparenter und lichtundurchlässiger mechanischer Strukturen (siehe Foto). Unsachgemäß abgekühltes oder nachlässig eingefasstes Glas, etwa eine Windschutzscheibe oder eine Teleskoplinse, entwickelt innere Spannungen, die leicht nach20

Eine weitere Erörterung und Literaturhinweise finden sich in Physics Today, Feb. 1971, S. 17.

8.11 Erzwungene optische Effekte – Optische Modulatoren

723

gewiesen werden können. Informationen über die Oberflächenspannung auf einem lichtundurchlässigen Objekt kann man durch Aufkleben photoelastischer Schichten auf die zu untersuchenden Teile erhalten. Häufiger stellt man ein maßstabsgetreues transparentes Modell des Teils aus einem spannungsoptisch empfindlichen Material (Epoxidharz, Glyptal, modifizierte Polyesterharze) her. Dieses Modell setzt man dann den Kräften aus, die das eigentliche Teil bei seiner Verwendung erfährt. Da sich die Doppelbrechung von Punkt zu Punkt an der Oberfläche des Modells unterscheidet, bringt ein kompliziertes buntfleckiges Streifenbild die inneren Spannungen zum Vorschein, wenn das Modell zwischen gekreuzte Polarisatoren gebracht wird. Sie können fast alle Arten klaren Kunststoffs oder sogar ein Blatt einfacher Gelatine zwischen gekreuzten Polarisatoren untersuchen; belasten Sie die Teile und beobachten Sie die Veränderung des Bildes (siehe die folgenden Fotos).

(a)

(b)

(a) Ein belastetes durchsichtiges Stück Plastik zwischen Polaroidfiltern. (b) Das Streifenmuster ändert sich beim Wechsel der Belastung. (Foto E. H.)

Die Phasenverschiebung auf der Probe ist in jedem Fall proportional zur Hauptspannungsdifferenz (σ1 − σ2 ), wobei σ1 und σ2 die orthogonalen Hauptspannungen sind. Ist die Probe beispielsweise eine Platte, die einem vertikalen Zug ausgesetzt ist, so ist σ1 die maximale Hauptspannung in vertikaler Richtung und σ2 die minimale Hauptspannung in horizontaler Richtung, die in diesem Fall null ist. In komplizierteren Situationen variieren die Hauptspannungen sowie deren Differenz. Bei Beleuchtung mit weißem Licht bezeichnet man die Orte aller Punkte gleicher Farbe auf dem Probestück als isochrome Gebiete, für die jeweils (σ1 − σ2 ) konstant ist. Diesen farbigen Mustern ist ein getrenntes System von schwarzen Bändern überlagert. In jedem Punkt, in dem das E-Feld des einfallenden linear polarisierten Lichts parallel zu einer der beiden lokalen Hauptspannungsachsen ist, läuft die Welle, unabhängig von der Wellenlänge, unbeeinflusst durch die Probe. Bei der Verwendung gekreuzter Polarisatoren wird dieses Licht vom Analysator absorbiert, und es entsteht ein schwarzes Gebiet, ein so genanntes Isoklinenband (Aufgabe 8.72). Abgesehen davon, dass die Muster schön anzuschauen sind, liefern sie eine qualitative Übersicht über die Spannungen und eine Grundlage für quantitative Berechnungen.

8 Polarisation

724

Die Heckscheiben der meisten Autos sind wärmebehandelt, sodass sie im Falle eines Bruchs in kleine, weniger gefährliche Stücke zerfallen. Dieses Foto wurde durch einen linearen Polarisator aufgenommen und zeigt das interne Spannungsmuster.

8.11.2 Der Faraday-Effekt Im Jahre 1845 entdeckte Michael Faraday, dass die Art und Weise, in der sich Licht in Materie ausbreitet, durch das Anlegen eines äußeren Magnetfeldes beeinflusst werden kann. Insbesondere fand er, dass sich die Schwingungsebene linear polarisierten Lichts, das durch ein Stück Glas fällt, dreht, wenn ein starkes Magnetfeld in Fortpflanzungsrichtung angelegt wird. Der Faraday-Effekt oder magnetooptische Effekt war einer der ersten Hinweise auf die Wechselbeziehung zwischen Elektromagnetismus und Licht. Obwohl der Faraday-Effekt an die optische Aktivität erinnert, gibt es, wie wir sehen werden, einen wichtigen Unterschied zwischen beiden Phänomenen. Der Winkel β (gemessen in Bogensekunden), um den sich die Schwingungsebene dreht, ist durch den empirisch ermittelten Ausdruck β = VBd

(8.46)

gegeben. Dabei ist B die statische magnetische Flussdichte (häufig in Gauß angegeben, 1 G = 10−4 T, Tesla), d die im Medium durchlaufene Wegstrecke (in cm) und V ein Proportionalitätsfaktor, die Verdet-Konstante. Die Verdet-Konstante hängt für ein bestimmtes Medium sowohl von der Frequenz (fällt schnell mit ν) als auch von der Temperatur ab. Sie liegt für Gase ungefähr in der Größenordnung von 10−5 Bogenminuten G−1 cm−1 , für Festkörper und Flüssigkeiten bei etwa 10−2 Bogenminuten G−1 cm−1 (siehe Tab. 8.2). Ein besseres Gefühl für die Bedeutung dieser Zahlen bekommt man, wenn man sich z. B. eine 1 cm dicke Probe H2 O im mäßig starken Feld von 104 G (1 T) vorstellt (das Feld der Erde beträgt etwa 0,5 G). In diesem speziellen Fall ergibt sich wegen V = 0,0131 eine Drehung von 2◦ 11 . Gemäß Konvention entspricht eine positive Verdet-Konstante einem (diamagnetischen) Stoff, für den der Faraday-Effekt linksdrehend wirkt, wenn sich das Licht parallel zum angelegten B-Feld bewegt, und rechtsdrehend, wenn es sich antiparallel zu B ausbreitet. Man beachte, dass bei natürlicher optischer Aktivität keine derartige Umkehrung der Drehrichtung auftritt. Als Gedächtnisstütze stellen wir uns vor, das B-Feld werde von einer um die Probe gewickelten Magnetspule erzeugt. Die Schwingungsebene dreht sich, wenn V positiv ist, unabhängig von der Fortpflanzungsrichtung des Strahls längs seiner Achse in dieselbe Richtung wie der Strom der Spule. Den Effekt kann

8.11 Erzwungene optische Effekte – Optische Modulatoren

725

Tabelle 8.2: Verdet-Konstanten ausgewählter Substanzen.

Substanz

Temperatur (◦ C)

Leichtflintglas Wasser NaCl Quarz NH4 Fe(SO4 )2 · 12H2 O Luft ∗ CO2 ∗

18 20 16 20 26 0 0



V (Bogenminuten Gauss−1 cm−1 ) 0,031 7 0,013 1 0,035 9 0,016 6 −0,000 58 6,27 × 10−6 9,39 × 10−6

λ = 578 nm, 1013 hPa. Ausführlichere Datensammlungen finden sich in einschlägigen Handbüchern.

man entsprechend verstärken, indem man das Licht einige Male in der Probe hin- und herreflektiert. Die theoretische Behandlung des Faraday-Effekts bezieht die quantenmechanische Dispersionstheorie einschließlich der Auswirkungen von B auf die atomaren oder molekularen Energieniveaus mit ein. Es soll hier genügen, die begrenzte klassische Argumentation für nichtmagnetische Stoffe kurz zu umreißen. Angenommen, das einfallende Licht ist zirkular polarisiert und monochromatisch. Ein elastisch gebundenes Elektron wird durch das sich drehende E-Feld der Welle (der Effekt des B-Feldes ist vernachlässigbar) angeregt und bewegt sich auf einer stationären kreisförmigen Umlaufbahn. Legt man ein starkes, konstantes Magnetfeld an, das senkrecht zur Ebene der Umlaufbahn gerichtet ist, so führt dies zu einer Radialkraft FM auf das Elektron. Diese Kraft kann entweder gegen den Kreismittelpunkt oder von ihm weg zeigen, was von der Drehrichtung des Lichts und der Richtung des konstanten B-Felds abhängt. Die gesamte Radialkraft (FM plus die elastische Rückstellkraft) kann deshalb, ebenso wie der Radius der Umlaufbahn, zwei verschiedene Werte haben. Folglich gehören zu einem bestimmten Magnetfeld jeweils zwei mögliche Werte des elektrischen Dipolmoments, der Polarisation und der Dielektrizitätskonstanten und schließlich auch zwei Brechungsindizes nR und nL . Die Diskussion kann analog zur fresnelschen Behandlung der optischen Aktivität weitergeführt werden. Auch hier spricht man von zwei Normalmoden der Ausbreitung elektromagnetischer Wellen durch das Medium, dem R- und dem LZustand. Für ferromagnetische Substanzen sind die Dinge etwas komplizierter. Im Falle eines magnetischen Stoffes ist β statt zur Komponente des angelegten Gleichstromfeldes proportional zur Magnetisierungskomponente in Richtung der Fortpflanzung. Es gibt eine Reihe von praktischen Anwendungen des Faraday-Effekts. Beispielsweise kann er ausgenutzt werden, um Mischungen von Kohlenwasserstoffen zu analysieren, da jeder Bestandteil eine charakteristische magnetische Drehung hat. Im Rahmen spektroskopischer Untersuchungen liefert er Informationen über die Eigenschaften der Energieniveaus oberhalb des Grundzustandes. Interessanterweise wurden unter Aus-

8 Polarisation

726

nutzung des Faraday-Effekts optische Modulatoren konstruiert. Ein Infrarotmodulator von R. C. LeCraw verwendet den synthetischen Magnetkristall Yttrium-Eisen-Granat (YIG von engl. yttrium-iron garnet), dem etwas Gallium zugesetzt wurde. Die Struktur des YIG ähnelt der des natürlichen Edelsteins Granat. Das Gerät ist schematisch in Abbildung 8.63 dargestellt. Ein linear polarisierter Infrarotstrahl tritt von links in den Kristall ein. Ein transversales Gleichstrommagnetfeld sättigt die Magnetisierung des YIG-Kristalls in dieser Richtung. Der Gesamtmagnetisierungsvektor, gebildet aus dem konstanten Feld und dem Spulenfeld, kann in seiner Richtung variieren, indem er um einen Betrag proportional zum Modulationsstrom der Spule gegen die Achse des Kristalls geneigt wird. Da die Faraday-Drehung von der axialen Komponente der Magnetisierung abhängt, regelt der Spulenstrom den Wert von β. Der Analysator wandelt dann diese Polarisationsmodulation über das malussche Gesetz in eine Amplitudenmodulation um [Gl. (8.24)]. Kurz gesagt wird das zu übertragende Signal als Modulationsspannung über die Spule eingeführt und vom austretenden Laserstrahl in Form von Amplitudenschwankungen übertragen. Modulationsmagnetfeld

Modulationsspannung

E

YIG Polarisator

E

konstantes Magnetfeld Polarisator

Abb. 8.63: Ein Modulator, der mit dem Faraday-Effekt arbeitet.

Es gibt noch einige andere magnetooptische Effekte. Zwei davon, den Voigt-Effekt und den Cotton-Mouton-Effekt, wollen wir kurz ansprechen. Beide treten auf, wenn ein konstantes Magnetfeld an ein transparentes Medium senkrecht zur Ausbreitungsrichtung des einfallenden Lichts angelegt wird. Der erstere Effekt tritt in Dämpfen auf, der zweite, viel schwächere, in Flüssigkeiten. In beiden Fällen wird das Medium doppelbrechend, ähnlich wie ein einachsiger Kristall, dessen optische Achse in der Richtung des Gleichstrommagnetfeldes, also senkrecht zum Lichtstrahlenbündel, liegt [Gl. (8.36)]. Die beiden Brechungsindizes entsprechen nun den Situationen, in denen die Schwingungsebene der Welle entweder senkrecht oder parallel zum konstanten Magnetfeld ist. Ihre Differenz Δn (also die Doppelbrechung) ist proportional

8.11 Erzwungene optische Effekte – Optische Modulatoren

727

zum Quadrat des angelegten Magnetfeldes. In Flüssigkeiten beruht der magnetooptische Effekt auf einer Ausrichtung der optisch und magnetisch anisotropen Moleküle des Mediums im Feld. Pflanzt sich das ankommende Licht mit einem Winkel zum statischen Feld fort, der ungleich 0 oder π/2 ist, so treten der Faraday- und der CottonMouton-Effekt gleichzeitig auf, wobei Ersterer in der Regel der weitaus stärkere ist. Der Cotton-Mouton-Effekt ist das magnetische Analogon des elektrooptischen KerrEffekts, der als Nächstes betrachtet wird.

8.11.3 Der Kerr-Effekt und der Pockels-Effekt Der erste elektrooptische Effekt wurde 1875 von John Kerr (1824 – 1907), einem schottischen Physiker, entdeckt. Kerr stellte fest, dass eine isotrope transparente Substanz doppelbrechend wird, wenn man sie in ein elektrisches Feld E bringt. Das Medium verhält sich dann wie ein einachsiger Kristall, dessen optische Achse der Richtung des angelegten Feldes entspricht. Die Indizes von n || und n⊥ zeigen an, dass die Schwingungsebene parallel bzw. senkrecht zum angelegten elektrischen Feld orientiert ist. Die Differenz Δn ist die Doppelbrechung Δn = λ0 KE 2 ,

(8.47)

wobei K die Kerr-Konstante ist. Wenn K, wie meist der Fall, positiv ist, so ist auch Δn (gleichbedeutend mit ne − no ) positiv und die Substanz verhält sich wie ein positiv einachsiger Kristall. Die Werte der Kerr-Konstante (Tab. 8.3) sind gewöhnlich in absoluten elektrostatischen Einheiten angegeben, weshalb man darauf achten muss, dass E in Gleichung (8.40) in st. Volt pro cm (1 st. Volt ≈ 300 V) einzusetzen ist. Der Kerr-Effekt ist wie auch der Cotton-Mouton-Effekt proportional zum Quadrat des Feldes und wird oft als quadratischer elektrooptischer Effekt bezeichnet. In Flüssigkeiten beruht das Phänomen auf einer teilweisen Ausrichtung der anisotropen Moleküle durch das E-Feld; in Festkörpern ist die Sache wesentlich komplizierter. Tabelle 8.3: Kerr-Konstanten ausgewählter Flüssigkeiten (20 ◦ C, λ0 = 589,3 nm).

Substanz Benzol Schwefelkohlenstoff Chloroform Wasser Nitrotoluol Nitrobenzol

C6 H6 CS2 CHCl3 H2 O C5 H7 NO2 C6 H5 NO2

K (in 10−7 cm (st. Volt)−2 ) 0,6 3,2 −3,5 4,7 123 220

Abbildung 8.64 zeigt einen so genannten Kerr-Zellen-Verschluss oder optischen Modulator. Er besteht aus einer Glasküvette, gefüllt mit einer polaren Flüssigkeit, und zwei Elektroden. Diese Kerr-Zelle befindet sich zwischen gekreuzten Polarisatoren, deren Durchlassachsen um ±45◦ gegen das angelegte E-Feld geneigt sind. Liegt keine

8 Polarisation

728

Spannung an den Elektroden an, wird kein Licht durchgelassen und der Verschluss ist geschlossen. Durch das Anlegen einer Modulationsspannung erzeugt man ein Feld, das die Zelle wie ein regelbares Phasenplättchen funktionieren lässt und so den Verschluss proportional öffnet. Ein solcher Verschluss ist sehr nützlich, da er effektiv auf sehr hohe Frequenzen (in der Größenordnung von 1010 Hz) reagieren kann. Seit etlichen Jahren benutzt man Kerr-Zellen, meist gefüllt mit Nitrobenzol oder Schwefelkohlenstoff, zu vielfältigen Zwecken, beispielsweise zur Messung der Lichtgeschwindigkeit. Sie dienen als Verschlüsse in der Hochfrequenzfotografie und als Lichtzerhacker (Chopper) als Alternative zu rotierenden Zahnkränzen. Häufig setzt man sie als Güteschalter in Impulslasersystemen ein. Plattenelektroden

Polarisator

Polarisator

Modulationsspannung

Abb. 8.64: Eine Kerr-Zelle.

Haben die Elektroden eine effektive Länge  und sind sie im Abstand d voneinander angeordnet, so ist die Phasenverschiebung durch Δϕ = 2πKV 2 /d2

(8.48)

gegeben, wobei V die angelegte Spannung ist. Daher benötigt eine Nitrobenzolzelle, in der d = 1 cm und  mehrere cm beträgt, eine ziemlich große Spannung von etwa 3 × 104 V, um als λ/2-Plättchen zu reagieren. (Diese Spannung ist eine charakteristische Größe, die so genannte λ/2-Spannung Vλ/2 .) Nitrobenzol ist außerdem sowohl giftig als auch explosiv. Man greift daher zunehmend auf transparente Feststoffe wie den Mischkristall Kaliumtantalniobat (KTa0,65 Nb0,35 O3 ), abgekürzt KTN, oder Bariumtitanat (BaTiO3 ) zurück, die ebenfalls einen Kerr-Effekt aufweisen. Es gibt noch einen weiteren sehr wichtigen elektrooptischen Effekt. Nach dem deutschen Physiker Friedrich Carl Alwin Pockels (1865–1913), der ihn 1893 ausführlich untersuchte, nennt man ihn Pockels-Effekt. Der Effekt ist linear elektrooptisch, da die induzierte Doppelbrechung proportional zur ersten Potenz des angelegten E-Feldes und daher zur angelegten Spannung ist. Der Pockels-Effekt existiert nur bei bestimmten Kristallen ohne Symmetriezentrum, also bei Kristallen, die keinen zentralen Punkt besitzen, durch den jedes Atom in ein identisches Atom gespiegelt werden kann. Von den 32 Symmetrieklassen der Kristalle kommen 20 für den Pockels-Effekt in Frage.

8.11 Erzwungene optische Effekte – Optische Modulatoren

729

Dieselben 20 Klassen sind übrigens auch piezoelektrisch. Viele gängige Kristalle und alle Flüssigkeiten zeigen keinen linearen elektrooptischen Effekt. Erst in den 1940er-Jahren gelang es, Kristalle herzustellen, die sich als Verschluss oder Modulator für Pockels-Zellen eignen. Das Funktionsprinzip haben wir bereits erläutert: Die Doppelbrechung wird elektronisch durch ein elektrisches Feld reguliert. Die Phasenverschiebung kann wie gewünscht verändert werden, wodurch sich auch der Polarisationszustand der einfallenden linear polarisierten Welle ändert. Auf diese Weise funktioniert das System wie ein Polarisationsmodulator. Ältere Geräte wurden aus Ammoniumdihydrogenphosphat (NH4 H2 PO4 oder ADP) und Kaliumdihydrogenphosphat (KH2 PO4 oder KDP) hergestellt; beide Substanzen werden noch verwendet. Eine große Verbesserung brachte die Einführung der Einkristalle des Kaliumdideuteriumphosphats (KD2 PO4 oder KD*P), das dieselbe Phasenverschiebung mit nicht einmal halb so großen Spannungen erzeugt, wie sie für KDP nötig sind. Diese Kristalle werden in einer Lösung von schwerem Wasser gezüchtet. Zellen mit KD*P oder CD*A (Cäsiumdideuteriumarsenat) werden seit einiger Zeit kommerziell hergestellt. Eine Pockels-Zelle besteht aus einem geeigneten nicht zentralsymmetrischen, orientierten Einkristall, der sich in einem regelbaren elektrischen Feld befindet. Normalerweise können derartige Geräte bei vergleichsweise kleinen Spannungen betrieben werden (etwa 5- bis 10-mal kleiner als eine äquivalente Kerr-Zelle); sie sind direkt proportional zu E, also linear, und außerdem gibt es keine Probleme mit giftigen Flüssigkeiten. Die Reaktionszeit des KDP ist sehr kurz, typischerweise kleiner als 10 ns, und der Kristall kann ein Lichtstrahlenbündel mit bis zu 25 GHz (25 × 109 Hz) modulieren.

transparente Elektrode Kristall

Polarisator

Modulationsspannung Polarisator

Abb. 8.65: Eine Pockels-Zelle.

Zwei Zellenanordnungen sind häufig anzutreffen. Man bezeichnet sie als transversal oder longitudinal, je nachdem, ob das angelegte E-Feld senkrecht oder parallel zur Ausbreitungsrichtung steht. Abbildung 8.65 zeigt den longitudinalen Typ in seiner einfachsten Form. Da der Strahl die Elektroden durchläuft, sind diese gewöhnlich

8 Polarisation

730

aus transparenten Metalloxidschichten (zum Beispiel SnO, InO oder CdO), dünnen Metallschichten, -gittern oder -ringen hergestellt. Liegt keine Spannung an, so ist der Kristall üblicherweise einachsig. Er ist so ausgerichtet, dass seine optische Achse längs der Fortpflanzungsrichtung des Strahls liegt. Für eine solche Anordnung ist die Phasenverschiebung durch Δϕ = 2πn3o r63 V /λ0

(8.49)

gegeben, wobei r63 die elektrooptische Konstante in m/V, no der ordentliche Brechungsindex, V die Potentialdifferenz in Volt und λ0 die Vakuumwellenlänge in Metern ist.21 Die Kristalle sind anisotrop und ihre Eigenschaften daher richtungsabhängig; sie müssen durch eine Gruppe von Ausdrücken beschrieben werden, die man gemeinsam als elektrooptischen Tensor zweiten Ranges rij bezeichnet. Glücklicherweise brauchen wir uns hier nur mit einer seiner Komponenten, nämlich r63 , zu beschäftigen, dessen Werte in Tabelle 8.4 gegeben sind. Die λ/2-Spannung entspricht einem Wert von Δϕ = π, und in diesem Fall gilt Δϕ = π

V . Vλ/2

(8.50)

Mit (8.49) folgt Vλ/2 =

λ0 . 2n3o r63

(8.51)

Für KDP ist beispielsweise r63 = 10,6 × 10−12 m/V und no = 1,51. Wir erhalten Vλ/2 ≈ 7,6 × 103 V für λ0 = 546,1 nm. Pockels-Zellen werden als extrem schnelle Verschlüsse, Güteschalter für Laser und Gleichstrom-Lichtmodulatoren bis zu 30 GHz (neuere Modulatoren auf Polymerbasis sogar bis zu 110 GHz) verwendet.22 Tabelle 8.4: Elektrooptische Konstanten (bei Raumtemperatur, λ0 = 546,1 nm).

Substanz

r63 (in 10−12 m/V)

no (ca.)

Vλ/2 (in kV)

ADP, NH4 H2 PO4 KDP, KH2 PO4 KDA, KH2 AsO4 KD*P, KD2 PO4

8,5 10,6 ≈ 13,0 ≈ 23,3

1,52 1,51 1,57 1,52

9,2 7,6 ≈ 6,2 ≈ 3,4

21

22

Diese Beziehung wird ebenso wie der analoge Ausdruck für die transversale Anordnung in A. Yariv, Quantum Electronics sehr anschaulich hergeleitet. Allerdings ist die Abhandlung anspruchsvoll und für flüchtiges Lesen nicht zu empfehlen. Weitere Informationen zur Lichtmodulation finden sich z. B. in D. F. Nelson, „The Modulation of Laser Light“, Scientific American (Juni 1968). Siehe auch Kapitel 14, Band II des Handbook of Optics (1995).

8.12 Flüssigkristalle

731

8.12 Flüssigkristalle Friedrich Reintzer, ein Botaniker aus Österreich, beobachtete 1888, dass es in Cholesterylbenzoat zwei Phasenübergänge gibt: An dem ersten kritischen Punkt wandelte sich der Kristall in eine trübe Flüssigkeit um und an dem zweiten wurde die Flüssigkeit durchsichtig. Reintzer hatte einen neuen Zustand der Materie entdeckt, dessen physikalische Eigenschaften zwischen denen gewöhnlicher Flüssigkeiten und denen von Kristallen liegen: den Flüssigkristall. Flüssigkristalle (LC von engl. liquid crystal) bestehen aus länglichen, zigarrenförmigen, beweglichen Molekülen; ihnen fehlt wie normalen Flüssigkeiten die Positionsfernordnung. Durch intensive Wechselwirkungen der Moleküle, wie man sie von Kristallen kennt, entsteht jedoch eine geordnete Orientierung des Systems im größeren Maßstab. Nach der Art der Ausrichtung der Moleküle unterscheidet man drei Typen von Flüssigkristallen. Wir konzentrieren uns hier auf die nematische Phase, in der die an zufälligen Positionen befindlichen Moleküle mehr oder weniger parallel zueinander ausgerichtet sind (Abb. 8.66).

Abb. 8.66: Die länglichen, zigarrenförmigen Moleküle eines nematischen Flüssigkristalls befinden sich an zufälligen Positionen, sind aber mehr oder weniger parallel zueinander ausgerichtet.

Beim Präparieren einer parallelen nematischen Zelle geht man folgendermaßen vor: Zwei ebene Glasscheiben werden auf je einer Seite mit einer transparenten, elektrisch leitenden metallischen Schicht versehen (z. B. mit Indiumzinnoxid, dessen Transmission im Bereich zwischen 450 nm und 1800 nm maximal ist). Diese beiden Fenster dienen als Begrenzung der Zelle und gleichzeitig als Elektroden, zwischen welchen wir eine Steuerspannung anlegen können. Die Moleküle des flüssigkristallinen Materials sollen sich, soweit sie in Kontakt mit den Fenstern kommen, parallel zu den Glasflächen und zueinander ausrichten. Um dies zu erreichen, müssen die Innenflächen der Fenster ein Muster paralleler Rillen erhalten, das man auf verschiedene Weise erzeugen kann. Die einfachste Methode besteht darin, die Indiumzinnoxid-Schicht (oder eine darüber liegende dielektrische Schicht) mit einer Art „Kamm“ sorgfältig abzukratzen, sodass parallele, mikrofeine Ritzen entstehen. Der schmale (im einstelligen Mikrometerbereich) Raum zwischen den beiden so präparierten Fenstern wird nun mit nematischen Flüssigkristallen gefüllt. Moleküle, die mit den Mikrorillen in Kontakt kommen, lagern sich parallel zu diesen an

8 Polarisation

732

und zwingen benachbarte Moleküle, sich ebenfalls auszurichten, bis die gesamte Flüssigkeit recht einheitlich orientiert ist (Abb. 8.67 a). Infolge ihrer länglichen Gestalt und geordneten Orientierung verhalten sich die Moleküle des Flüssigkristalls in ihrer Gesamtheit als anisotropes – positiv einachsig doppelbrechendes – Dielektrikum. Die Längsachse der Moleküle legt die Richtung des außerordentlichen Brechungsindex (oder der langsamen Achse) fest. Ein parallel zu den Molekülen linear polarisierter Lichtstrahl ist dann ein außerordentlicher Strahl, dessen Phase sich beim Durchlaufen der Zelle fortwährend ändert. Ein linear polarisierter Strahl, dessen Polarisationsebene um 45◦ gegen die Längsrichtung der Moleküle geneigt ist, erfährt hingegen eine Phasenverzögerung Δϕ, als ob er einen doppelbrechenden Kristall durchlaufen hätte.

(a)

(b)

Abb. 8.67: (a) Nematischer Flüssigkristall zwischen zwei transparenten Elektroden. Die länglichen Moleküle richten sich parallel zum Mikrorillenmuster auf den Innenflächen der beschichteten Glaswände (Elektroden) aus. (b) Liegt eine Spannung an, so drehen sich die Moleküle in Feldrichtung.

Die Flüssigkristallzelle als variabler Polarisationsrotator Nehmen wir nun an, wir legen eine Spannung V an die Zelle an (Abb. 8.67 b), wodurch sich senkrecht zu den Glasfenstern ein elektrisches Feld aufbaut. Elektrische Dipole sind entweder bereits vorhanden oder werden induziert; auf die Moleküle wirken daher Drehmomente, und die Teilchen versuchen sich am Feld auszurichten. Je höher die Spannung wird, desto mehr Moleküle (mit Ausnahme derer, die an den Innenwänden der Zelle fixiert sind) drehen sich in Feldrichtung. Ebenso wie die Phasendifferenz Δϕ nimmt die Doppelbrechung, Δn = ne − no , ab; Letztere liegt in der Regel zwischen 0,1 und 0,3 und ist eine Funktion der Spannung, der Temperatur (Zunahme pro ◦ C um rund 0,4 %) und der Wellenlänge (umgekehrt proportional zu λ0 ): Δϕ (V, T, λ0 ) =

2π d Δn (V, T, λ0 ) . λ0

Die Phasenverzögerung ist maximal, wenn keine Spannung anliegt, und erreicht für hohe Spannungen (etwa 20 V) bei ungefähr 30 nm ein Minimum (oder null, wenn die Restverzögerung durch die fixierten Schichten durch einen Kompensator ausgeglichen wird).

8.12 Flüssigkristalle

733

Ist das einfallende Licht parallel zur langsamen Achse polarisiert, so kann man die Anordnung als spannungsgesteuerten Phasenmodulator verwenden, der die Phasenverzögerung des Lichts beim Durchgang durch die Zelle auf einen gewünschten Wert reguliert. Besitzt das einfallende Licht Komponenten sowohl parallel als auch senkrecht zur langsamen Achse, so wirkt das Gerät als kontinuierlicher variabler Polarisationsrotator in einem breiten Frequenzbereich. Bringt man die Zelle zwischen gekreuzte Polarisatoren (±45◦ ), so erhält man einen spannungsgesteuerten Intensitätsoder Bestrahlungsstärkemodulator. Die Flüssigkristallanzeige (LCD) Stellen Sie sich vor, eine der beiden parallelen Glasplatten der in Abbildung 8.67 a gezeigten Flüssigkristallzelle wird in ihrer Ebene um 90◦ gedreht. Die Molekülschichten der nematischen Flüssigkeit werden entsprechend mitgezogen; an den Platten sind sie nun um eine Vierteldrehung bezüglich der Flächennormale gegeneinander verdrillt (denken Sie zum Beispiel an einen Stapel Spielkarten, den Sie zwischen Ihren beiden Händen verdrehen). Es entsteht eine so genannte verdrillte oder verdrehte nematische Zelle (Abb. 8.68 a). An einer der beiden Platten liegen die Moleküle vertikal an, an der anderen horizontal; dazwischen treten alle Zwischenstufen auf, Schritt für Schritt sind die einzelnen Schichten weiter gedreht. Eine solche Zelle dreht die Polarisationsebene von Licht wie ein optisch aktives Medium.23 Ein parallel zu den Molekülen an der linken Platte von Abbildung 8.68 a (waagerecht) linear polarisierter, senkrecht zur Glasfläche eintreffender Lichtstrahl zum Beispiel verlässt die Zelle mit um 90◦ gedrehter Polarisationsebene, also senkrecht polarisiert. (a)

(b)

Abb. 8.68: (a) Verdrillte nematische Zelle. Die Moleküle des Flüssigkristalls richten sich an der linken Glasplatte waagerecht und an der rechten senkrecht aus, dazwischen sind die Schichten schrittweise gegeneinander verdreht. (b) Liegt an der Zelle eine Spannung an, so drehen sich die Moleküle in Feldrichtung.

Legt man nun eine Spannung an die Zelle an, so baut sich im Flüssigkristall ein elektrisches Feld parallel zur Drehachse auf. Die Moleküle (ausgenommen die an den Wänden fixierten) richten sich am Feld aus (Abb. 8.68 b), und die verdrillte Struktur der Zelle verschwindet. Damit verliert die Zelle auch ihre Fähigkeit, die Polarisationsebene des einfallenden Lichts zu drehen. Schaltet man das E-Feld wieder ab, stellt sich die 23

Den Beweis hierfür finden Sie in B. E. A. Saleh und M. C. Teich, Fundamentals of Photonics, S. 228.

8 Polarisation

734

Verdrillung und damit die optische Aktivität wieder ein. Zwischen gekreuzten Linearpolarisatoren angeordnet, kann die Zelle deshalb als spannungsgesteuerter Schalter wirken, der einen einfallenden Lichtstrahl entweder absorbiert oder durchlässt. Flüssigkristallanzeigen des einfachsten Typs, wie man sie in Digitaluhren, Kameras, Taschenrechnern usw. findet, werden durch das Umgebungslicht beleuchtet. Dies bedeutet einen prinzipiellen Vorteil: Anzeigen dieser Art nehmen nur äußerst niedrige Leistungen auf, weil sie selbst nicht leuchten. Um ein LCD zu konstruieren, bringen wir einen ebenen Spiegel hinter den Polarisator ganz rechts in Abbildung 8.69. Von links fällt Licht aus der Umgebung ein, es wird sofort linear polarisiert, im gezeigten Fall waagerecht. Liegt an den Elektroden keine Spannung an, so tritt das Licht senkrecht polarisiert aus der verdrillten Flüssigkristallzelle aus, durchläuft den zweiten Polarisator unverändert, trifft auf den Spiegel und wird – immer noch senkrecht polarisiert – zurück nach links reflektiert. Der Strahl durchläuft die Anordnung nun rückwärts und tritt links waagerecht polarisiert aus. Beim Blick in den ersten Polarisator sehen wir ein relativ helles Feld. (a)

(b)

Abb. 8.69: (a) Verdrillte nematische Zelle zwischen zwei gekreuzten Polarisatoren. Senkrecht polarisiertes Licht verlässt die Anordnung. (b) Liegt an der Zelle eine Spannung an, so wird die Polarisationsebene nicht mehr gedreht; waagerecht polarisiertes Licht tritt in die Zelle ein und aus ihr aus. Anschließend wird es vom zweiten Polarisator vollständig absorbiert, kein Licht verlässt die Anordnung.

Nun legen wir an die Flüssigkristallzelle eine Spannung an. Die Moleküle ordnen sich um, und die Zelle kann die Polarisationsebene nicht mehr drehen. Waagerecht polarisiertes Licht tritt in die Zelle ein und wieder aus, um anschließend vollständig vom zweiten Polarisator absorbiert zu werden. Das Eintrittsfenster bleibt schwarz, es tritt kein Licht links aus der Anordnung aus. Der schwarze (nicht reflektierende) Bereich lässt sich leicht in Form einer Ziffer oder eines Buchstabens gestalten, indem man die vordere transparente Elektrode entsprechend auslegt. Die Zahlen auf einem Taschenrechner sind in der Regel aus sieben kleinen, streifenförmigen Elektroden aufgebaut (Abb. 8.70), welche unabhängig von-

8.13 Eine mathematische Beschreibung der Polarisation

735

Abb. 8.70: Siebensegment-Elektrodenanordnung zur Darstellung von Zahlen. Für die Ziffer 9 liegt an der großen rückseitigen Elektrode sowie an den Segmenten D, E, F, G, A, B eine Spannung an.

einander aktiviert werden können (durch den Decoder eines integrierten Schaltkreises), um die Zahlen von 0 bis 9 darzustellen. Die sieben Segmente sind voneinander isolierte Bereiche auf der vorderen Indiumzinnoxid-Schicht. Liegt eine Spannung an einem bestimmten Segment und an der großen, durchgehenden rückseitigen Elektrode an, so zerstört das E-Feld hinter dem Segment die Verdrillung in eben diesem kleinen Ausschnitt, der dann schwarz erscheint.

Wenn Sie einen Linearpolarisator vor einer LCD-Anzeige drehen, können Sie beobachten, wie die Ziffern verschwinden und wieder erscheinen. (Foto E. H.)

8.13 Eine mathematische Beschreibung der Polarisation Bisher haben wir polarisiertes Licht vom Standpunkt der elektrischen Feldkomponente der Welle aus betrachtet. Die allgemeinste Darstellung war das elliptisch polarisierte Licht. Dabei haben wir uns vorgestellt, dass der Endpunkt des Vektors E kontinuierlich eine elliptische Bahn durchläuft. Diese Ellipse hat eine bestimmte Form – der Kreis und die Gerade sind Spezialfälle. Die Periode, in der die Ellipse durchlaufen wird,

8 Polarisation

736

gleicht derjenigen der Lichtwelle (etwa 10−15 s) und ist daher für einen Nachweis viel zu kurz. In der Praxis liefern Messungen dagegen im Allgemeinen Mittelwerte über verhältnismäßig lange Zeitintervalle. Es wäre nun vorteilhaft, eine alternative Beschreibung der Polarisation anhand von leicht beobachtbaren Größen, nämlich den Bestrahlungsstärken, zu formulieren. Wir werden dies nicht nur aus didaktischen oder ästhetischen Motiven tun, sondern auch, weil der zu entwickelnde Formalismus in anderen Forschungsgebieten wie der Teilchenphysik und der Quantenmechanik von großer Bedeutung ist. Er dient in gewisser Hinsicht dazu, das klassische und das quantenmechanische Bild zu verbinden. Noch interessanter sind allerdings die beachtlichen praktischen Vorteile dieser Beschreibung. Wir werden ein elegantes Verfahren entwickeln, um die Effekte komplexer Systeme aus polarisierenden Elementen auf den Endzustand der austretenden Welle vorherzusagen. Die komprimierte Matrizenschreibweise erfordert lediglich einfachste Matrizenoperationen. Die komplizierte Logik, die mit Phasenverschiebungen, relativen Orientierungen usw. für eine Kombination aus Phasenplättchen und Polarisatoren verknüpft ist, ergibt sich ganz zwanglos. Man muss nur die geeigneten Matrizen auswählen und den Formalismus darauf anwenden.

8.13.1 Die stokesschen Parameter Die moderne Darstellung polarisierten Lichts geht auf Arbeiten von G. G. Stokes aus dem Jahre 1852 zurück. Er führte vier Größen ein, heute stokessche Parameter genannt, die ausschließlich Funktionen beobachtbarer Größen der elektromagnetischen Welle sind.24 Der Polarisationszustand eines Lichtstrahlenbündels (überhaupt nicht, vollkommen oder teilweise polarisiert) kann in Abhängigkeit von diesen Größen beschrieben werden. Zunächst wollen wir diese Parameter in geeigneter Form definieren, um sie dann zur elektromagnetischen Theorie in Beziehung zu setzen. Wir betrachten einen Satz von vier Filtern, wobei jeder von ihnen bei natürlicher Beleuchtung die Hälfte des einfallenden Lichts durchlässt und die andere Hälfte absorbiert. Die Auswahl ist nicht eindeutig, es existieren mehrere äquivalente Möglichkeiten. Der erste Filter sei einfach isotrop, sodass er alle Zustände gleichermaßen passieren lässt; der zweite und der dritte Filter arbeiten als Linearpolarisatoren, deren Durchlassachsen horizontal bzw. um 45◦ geneigt (diagonal längs des ersten und dritten Quadranten) sind. Der letzte Filter ist ein Zirkularpolarisator und für L-Zustände undurchlässig. Jeder dieser vier Filter wird einzeln in den Weg des zu untersuchenden Strahlenbündels gebracht und die durchgelassenen Bestrahlungsstärken I0 , I1 , I2 24

Vieles von dem Stoff in diesem Abschnitt wird ausführlicher in Polarized Light: Production and Use von Shurcliff behandelt, einem Klassiker auf diesem Spezialgebiet. Sie können sich auch M. J. Walker, „Matrix Calculus and the Stokes Parameters of Polarized Radiation“, Am. J. Phys. 22, 170 (1954) ansehen oder W. Bickel und W. Bailey, „Stokes Vectors, Mueller Matrices, and Polarized Scattered Light“, Am. J. Phys. 53, 468 (1985).

8.13 Eine mathematische Beschreibung der Polarisation

737

und I3 werden mit einem Messgerät gemessen, das für die Polarisation unempfindlich ist (was nicht für alle Messgeräte gilt). Die stokesschen Parameter sind dann definiert durch S0 S1 S2 S3

= 2I0 = 2I1 − 2I0 = 2I2 − 2I0 = 2I3 − 2I0 .

(8.52a) (8.52b) (8.52c) (8.52d)

S0 ist die einfallende Bestrahlungsstärke und die Parameter S1 , S2 und S3 geben den Polarisationszustand an. So kann man aus S1 ablesen, ob sich die Polarisation eher einem horizontalen (S1 > 0) oder einem vertikalen (S1 < 0) P-Zustand nähert. Zeigt das Strahlenbündel keine Vorzugsorientierung bezüglich dieser Achsen (S1 = 0), so kann es bei ±45◦ elliptisch polarisiert, zirkular polarisiert oder unpolarisiert sein. S2 gibt an, ob das Licht tendenziell einem P-Zustand gleicht, der entweder bei +45◦ (S2 > 0) oder bei −45◦ (wenn S2 < 0) oder in keiner der beiden Richtungen (S2 = 0) liegt. Aus S3 kann man die Drehrichtung des Strahlenbündels entnehmen: rechts (S3 > 0), links (S3 < 0) oder keines von beiden (S3 = 0). Für quasimonochromatisches Licht hatten wir formuliert    Ex (t) = ˆıE0x (t) cos kz − ωt + εx (t) und Ey (t) = ˆjE0y (t) cos



  kz − ωt + εy (t) ,

[8.41a] [8.41b]

wobei E (t) = Ex (t) + Ey (t) ist. Wenden wir diese Ausdrücke direkt an, so können die stokesschen Parameter zu  2   2 + E0y (8.53a) S0 = E0x T  2   2 T (8.53b) S1 = E0x T − E0y T S2 = 2E0x E0y cos ε T S3 = 2E0x E0y sin ε T

(8.53c) (8.53d)

umgeformt25 werden. Hier ist ε = εy − εx und die Konstante 0 c/2 wurde weggelassen, sodass die Parameter nun proportional zu den Bestrahlungsstärken sind. Für den hypothetischen Fall des vollkommen monochromatischen Lichts hängen E0x (t), E0y (t) und ε (t) nicht von der Zeit ab; man braucht lediglich die spitzen Klammern in Gleichung (8.53) zu streichen, um die anwendbaren stokesschen Parameter zu erhalten. Interessanterweise erhält man dieselben Ergebnisse durch zeitliche Mittelwertbildung der allgemeinen Gleichung (8.14) für elliptisch polarisiertes Licht.26 25

26

Für Einzelheiten siehe E. Hecht „Note on an Operational Definition of the Stokes Parameters“, Am. J. Phys 38 (1970) 1156. E. Collet, „The Description of Polarization in Classical Physics“, Am J. Phys. 36 (1968) 713.

8 Polarisation

738 Tabelle 8.5: Stokessche und jonessche Vektoren einiger Polarisationszustände.

stokessche jonessche Vektoren Vektoren ⎡ ⎤ 1  ⎢1⎥ 1 ⎥ ⎢ horizontaler P-Zustand ⎣ ⎦ 0 0 0 ⎤ ⎡ 1  ⎢ −1 ⎥ 0 ⎥ ⎢ vertikaler P-Zustand ⎣ 0⎦ 1 0 ⎡ ⎤ 1  ⎢ 1 1 0⎥ ◦ ⎥ ⎢ √ P-Zustand bei +45 ⎣1⎦ 2 1 0 Polarisationszustand

stokessche Polarisationszustand Vektoren ⎤ ⎡ 1 ⎢ 0⎥ ⎥ P-Zustand bei −45◦ ⎢ ⎣ −1 ⎦ 0 ⎡ ⎤ 1 ⎢0⎥ ⎢ ⎥ R-Zustand ⎣0⎦ 1 ⎤ ⎡ 1 ⎢ 0⎥ ⎥ ⎢ L-Zustand ⎣ 0⎦ −1

jonessche Vektoren  1 1 √ 2 −1  1 1 √ 2 −i  1 1 √ 2 i

 2   2 Wenn der Strahl unpolarisiert ist, so gilt E0x = E0y ; keiner der beiden MitT T telwerte wird null, da das Amplitudenquadrat immer positiv ist. Es ist dann S0 =  2   2  E0x T + E0y T , aber S1 = S2 = S3 = 0. Die letzten beiden Parameter gehen gegen null, da sowohl cos ε als auch sin ε unabhängig von den Amplituden den Mittelwert null hat. Es ist oft sehr zweckmäßig, die stokesschen Parameter durch Division durch S0 zu normieren. Man verwendet damit einen Einfallsstrahl von einer Bestrahlungsstärkeneinheit. Der Parametersatz (S0 , S1 , S2 , S3 ) ist dann für natürliches Licht in der normierten Darstellung (1, 0, 0, 0). Ist das Licht horizontal polarisiert, so hat es keine vertikale Komponente und die normierten Parameter sind (1, 1, 0, 0). Ähnlich erhalten wir für vertikal polarisiertes Licht (1, –1, 0, 0). Darstellungen einiger anderer Polarisationszustände sind in Tabelle 8.5 aufgeführt (die Parameter sind aus Gründen, die wir später erläutern werden, vertikal angeordnet). Für vollkommen polarisiertes Licht folgt aus Gleichung (8.53) S02 = S12 + S22 + S32 , .

(8.54)

Für teilweise polarisiertes Licht kann außerdem gezeigt werden, dass der Polarisationsgrad (8.29) durch 1/2  /S0 (8.55) V = S12 + S22 + S32 gegeben ist. Wir betrachten nun zwei quasimonochromatische Wellen, die durch (S0 , S1 , S2 , S3 ) und (S0 , S1 , S2 , S3 ) beschrieben sind und einander in einem bestimmten Raumbereich überlagern. Unter der Voraussetzung, dass die Wellen inkohärent sind, ist jeder stokessche Parameter der Resultierenden die Summe der korrespondierenden Parameter der Einzelwellen (die sämtlich proportional zur Bestrahlungsstärke sind). Mit anderen Worten, die Resultierende wird durch den Parametersatz (S0 + S0 ,

8.13 Eine mathematische Beschreibung der Polarisation

739

S1 + S1 , S2 + S2 , S3 + S3 ) beschrieben. Addiert man z. B. einen vertikalen P-Zustand (1, –1, 0, 0) mit Einheitsflussdichte zu einem inkohärenten L-Zustand (siehe Tab. 8.5) mit der Flussdichte (2, 0, 0, –2), so erhält man eine zusammengesetzte Welle mit den Parametern (3, –1, 0, –2). Sie ist elliptisch polarisiert, hat eine Flussdichte von 3, nähert sich stärker der Vertikalen als der√Horizontalen (S1 < 0), ist linksdrehend (S3 < 0) und hat einen Polarisationsgrad von 5/3. Für eine bestimmte Welle kann man sich den Satz stokesscher Parameter als Vektor vorstellen; wir haben bereits gesehen, wie man zwei derartige (inkohärente) Vektoren addiert.27 Es handelt sich dabei nicht um einen gewöhnlichen dreidimensionalen Vektor, doch diese Darstellung wird in der Physik beinahe überall verwendet. Die Parameter (S0 , S1 , S2 , S3 ) werden als Spaltenvektor angeordnet: ⎡ ⎤ S0 ⎢ S1 ⎥ ⎥ (8.56) S =⎢ ⎣ S2 ⎦ . S3

8.13.2 Die Jones-Vektoren Eine andere Darstellung des polarisierten Lichts, die die stokesschen Parameter ergänzt, wurde 1941 von dem amerikanischen Physiker R. Clark Jones eingeführt. Diese Methode hat den Vorteil, für kohärente Strahlenbündel anwendbar und gleichzeitig äußerst kompakt zu sein. Im Unterschied zum stokesschen Formalismus ist sie jedoch nur für polarisierte Wellen anwendbar. In diesem Fall scheint der natürliche Weg zu sein, den Strahl mithilfe des elektrischen Vektors selbst zu beschreiben. In Spaltenform lautet der Jones-Vektor  Ex (t) ! , (8.57) E= Ey (t) ! sind. Kennen wir wobei Ex (t) und Ey (t) die momentanen Skalarkomponenten von E ! so wissen wir offensichtlich alles über den Polarisationszustand. Bei BerücksichE, tigung der Phaseninformation können wir auch kohärente Wellen behandeln. Daher schreiben wir Gleichung (8.57) als  iϕx ! = E0x eiϕ , (8.58) E E0y e y wobei ϕx und ϕy die zugehörigen Phasen sind. Der horizontale und der vertikale PZustand ist daher durch   0 E0x eiϕx ! ! bzw. Ev = (8.59) Eh = 0 E0y eiϕy 27

Welche Voraussetzungen erfüllt sein müssen, damit eine Objektmenge einen Vektorraum bildet, in dem diese Objekte selbst Vektoren sind, wird z.B. in Davis, Introduction to Vector Analysis erörtert.

740

8 Polarisation

gegeben. Die Summe zweier kohärenter Strahlenbündel wird wie bei den stokesschen Vektoren durch eine Summe der korrespondierenden Komponenten gebildet. Wegen ! v ist ! =E !h + E E  E0x eiϕx ! , (8.60) E= E0x eiϕx ! durch wenn zum Beispiel E0x = E0y und ϕx = ϕy ist. Nach Ausklammern ist E  iϕx 1 ! (8.61) E = E0x e 1 gegeben, was ein P-Zustand unter +45◦ ist, denn die Amplituden sind gleich und der Phasenunterschied ist null. Es gibt viele Anwendungen, bei denen man die genauen Amplituden und Phasen nicht unbedingt kennen muss. Man kann dann die Bestrahlungsstärke auf 1 normieren, wodurch einige Informationen verloren gehen, man aber viel einfachere Ausdrücke erhält. Dies wird erreicht, indem man beide Elemente im Vektor durch dieselbe skalare Größe (reell oder komplex) teilt, sodass die Summe der Komponentenquadrate 1 ist. führt die Division beider Ausdrücke in Gleichung (8.60) durch √ Beispielsweise iϕ x 2E0x e zu  1 1 . (8.62) E45 = √ 2 1 Ähnlich ist in normierter Form   1 0 und Ev = . Eh = 0 1

(8.63)

Für rechtszirkular polarisiertes Licht ist E0x = E0y , und die y-Komponente eilt der x-Komponente um 90◦ voraus. Da wir die Form (kz − ωt) verwenden, müssen wir −π/2 zu ϕy addieren, und so folgt  E0x eiϕx ! . ER = E0x ei(ϕx −π/2) Dividieren wir beide Komponenten durch E0x eiϕx , so erhalten wir   1 1 = ; −i e−iπ/2

8.13 Eine mathematische Beschreibung der Polarisation also ist der normierte, komplexe Jones-Vektor28   1 1 1 1 ! ! und EL = √ . ER = √ 2 −i 2 i

741

(8.64)

! L ist !R + E Die Summe E   2 1 1 1+1 √ =√ . 2 −i + i 2 0 Dies ist ein horizontaler P-Zustand, dessen Amplitude doppelt so groß wie die jeder einzelnen Komponente ist. Das Ergebnis stimmt mit unseren früheren Berechnungen, Gleichung (8.10), überein. Den Jones-Vektor für elliptisch polarisiertes Licht kann ! L angewendet haben. ! R und E man durch dasselbe Verfahren erhalten, das wir für E E0x ist dann nicht gleich E0y , und der Phasenunterschied muss nicht notwendigerweise 90◦ sein. Um vertikale und horizontale E-Zustände zu berechnen, müssen wir im Prinzip nur eine der beiden Komponenten mit einem Skalar multiplizieren. Dabei wird der Kreis zu einer Ellipse gestreckt. Daher beschreibt  1 2 √ (8.65) −i 5 eine mögliche Form von horizontalem, rechtsdrehendem, elliptisch polarisiertem Licht. Zwei Vektoren A und B nennt man orthogonal, wenn A · B = 0 ist; entsprechend sind ! B ! ∗ = 0 ist. Polarisationszustände nennt zwei komplexe Vektoren orthogonal, wenn A· man orthogonal, wenn ihre Jones-Vektoren orthogonal sind. Beispielsweise gilt ! ∗ = 1 [(1) (1)∗ + (−i) (i)∗ ] = 0 !R · E E L 2 oder ! ∗ = [(1) (0)∗ + (0) (1)∗ ] = 0 , !h · E E v wobei die komplex Konjugierten reeller Größen offenbar mit diesen selbst übereinstimmen. Zu jedem Polarisationszustand gehört ein orthogonaler Zustand. Es ist !∗ = E !L · E !∗ = 1 !R · E E R L und !∗ = E !L · E !∗ = 0 . !R · E E L R 28

 R vertauscht. Die gegebene Hätten wir (ωt − kz) für die Phase verwendet, so wären die Terme in E Schreibweise taucht häufiger in modernen Werken auf, obwohl ihre konsequente Beibehaltung etwas größere Schwierigkeiten verursacht. Dies sollte man beim Literaturstudium (z.B. Shurcliff) beachten.

8 Polarisation

742

! h und E ! v . Wie wir gesehen Solche Vektoren bilden einen orthonormierten Satz wie E haben, kann jeder Polarisationszustand durch eine Linearkombination der Vektoren einer der beiden orthonormierten Sätze beschrieben werden. Dieselben Vorstellungen spielen in der Quantenmechanik eine wichtige Rolle, da man es auch dort mit orthonormierten Wellenfunktionen zu tun hat.

8.13.3 Die Jones-Matrizen und die Mueller-Matrizen Wir betrachten einen polarisiert einfallenden Strahl, dargestellt durch seinen Jones!t ! i . Der Strahl durchläuft ein optisches Element und tritt als neuer Vektor E Vektor E ! i in E ! t transformiert, ein Prozess, der mathewieder aus. Das optische Element hat E matisch mithilfe einer 2 × 2-Matrix beschrieben werden kann. Eine Matrix ist, wie wir wissen, eine Anordnung von Zahlen, für die die Addition und die Multiplikation erklärt sind. A soll die Transformationsmatrix des betrachteten optischen Elements sein. Dann gilt !i ! t = AE E mit



a a A = 11 12 a21 a22

(8.66) (8.67)

und die Spaltenvektoren werden wie jede andere Matrix behandelt. Als Gedankenstütze schreiben wir Gleichung (8.59) als    !ix !tx a11 a12 E E (8.68) !ty = a21 a22 !iy , E E was nach Ausmultiplizieren !ix + a12 E !iy , !tx = a11 E E !ix + a22 E !iy !ty = a21 E E liefert. Tabelle 8.6 enthält eine Auflistung von Jones-Matrizen für verschiedene Elemente. Um deren Anwendung zu verstehen, wollen wir einige Beispiele untersuchen. ! i sei ein P-Zustand unter +45◦ , der durch ein λ/4-Phasenplättchen mit vertikaler E nf -Achse (die in y-Richtung zeigt) läuft. Der Polarisationszustand der austretenden Welle wird wie folgt ermittelt, wobei wir die konstanten Amplitudenfaktoren der Bequemlichkeit halber weglassen:    !tx 1 0 1 E . = ! 0 −i 1 Ety

8.13 Eine mathematische Beschreibung der Polarisation

743

Tabelle 8.6: Jones- und Mueller-Matrizen. Lineares optisches Element

JonesMatrix

Horizontaler Linearpolarisator

Vertikaler Linearpolarisator

Linearpolarisator bei +45◦

Linearpolarisator bei −45◦

Daher ist !t = E



MuellerMatrix ⎡ ⎤ 1100   ⎥ 1⎢ 10 ⎢1 1 0 0⎥ 00 2⎣0 0 0 0⎦ 0000 ⎡ ⎤ 1 −1 0 0   ⎥ 1⎢ 00 ⎢ −1 1 0 0 ⎥ ⎣ ⎦ 0 0 0 0 01 2 0 000 ⎡ ⎤ 1010   ⎥ 1⎢ 11 ⎢0 0 0 0⎥ 11 2⎣1 0 1 0⎦ 0000 ⎡ ⎤ 1 0 −1 0   ⎥ 1 1 −1 1 ⎢ ⎢ 0 0 0 0⎥ ⎣ ⎦ −1 1 −1 0 1 0 2 2 00 00

Lineares opti- Jonessches Element Matrix λ/4-Plättchen, schnelle Achse vertikal λ/4-Plättchen, schnelle Achse horizontal Homogener Zirkularpolarisator rechts Homogener Zirkularpolarisator links

MuellerMatrix ⎡ ⎤   100 0 ⎥ 1 0 ⎢ ⎢0 1 0 0⎥ eiπ/4 0 −i ⎣ 0 0 0 −1 ⎦ 001 0 ⎡ ⎤ 10 00   ⎢0 1 0 0⎥ 10 ⎢ ⎥ eiπ/4 ⎣0 0 0 1⎦ 0 i 0 0 −1 0 ⎡ ⎤ 1001   ⎥ 1 1 i 1⎢ ⎢0 0 0 0⎥ 2 −i 1 2⎣ 0 0 0 0 ⎦ 1001 ⎡ ⎤ 1 0 0 −1   ⎥ 1 1 −i 1⎢ ⎢ 0 0 0 0⎥ ⎣ ⎦ i 1 0 0 0 0 2 2 −1 0 0 1

1 . −i

Wie wir bereits wissen, ist der Strahl rechtszirkular polarisiert. Läuft die Welle durch eine Reihe von optischen Elementen, die durch die Matrizen A1 , A2 , . . . , An dargestellt sind, so ist !i . ! t = An . . . A2 A1 E E Die Matrizen sind nicht kommutativ; sie müssen in der richtigen Reihenfolge ange! i . Nachdem wendet werden. Die Welle, die das erste optische Element verlässt, ist A1 E ! i usw. Um den Prozess zu sie das zweite Element durchlaufen hat, wird sie zu A2 A1 E illustrieren, kehren wir zum obigen Beispiel, einem P-Zustand unter +45◦ , zurück, doch lassen wir die Welle diesmal durch zwei λ/4-Plättchen mit vertikalen nf -Achsen laufen. Wiederum lassen wir die Amplitudenfaktoren weg, und so wird    1 0 1 0 1 ! , Et = 0 −i 0 −i 1 also

  1 0 1 ! Et = 0 −i −i

744

8 Polarisation

und schließlich  1 !t = . E −1 Der transmittierte Strahl befindet sich in einem P-Zustand unter −45◦ . Effektiv wurde der einfallende Strahl also durch ein λ/2-Plättchen um 90◦ gekippt. Wird die gleiche Folge von optischen Elementen verwendet, um verschiedene Zustände zu untersuchen, so ist es von Vorteil, das Produkt An . . . A2 A1 durch eine einzige 2 × 2-Systemmatrix zu ersetzen, die man durch die Multiplikation erhält (sie wird in der Reihenfolge A2 A1 , dann A3 A2 A1 usw. berechnet). Im Jahre 1943 entwickelte Hans Mueller, damals Professor der Physik am Massachusetts Institute of Technology, eine Matrixmethode zur Behandlung der stokesschen Vektoren. Wie bereits angemerkt, sind die stokesschen Vektoren sowohl für polarisiertes als auch für teilweise polarisiertes Licht anwendbar. Auf die Methode von Mueller trifft dies auch zu, weshalb sie die Methode von Jones ergänzt. Mit Letzterer kann man jedoch kohärente Wellen behandeln, mit Ersterer nicht. Die Mueller-4×4-Matrizen werden in genau der gleichen Weise angewendet wie die Jones-Matrizen. Wir müssen das Verfahren daher nicht ausführlich diskutieren; einige einfache Beispiele in Ergänzung zu Tabelle 8.6 sollten genügen. Betrachten wir eine unpolarisierte Welle mit der Einheitsbestrahlungsstärke, die durch einen horizontalen Polarisator läuft. Der stokessche Vektor St der austretenden Welle ist dann ⎡ ⎤⎡ ⎤ ⎡ ⎤ 1 1100 1 ⎢ ⎥ ⎢ ⎥ ⎢ 21 ⎥ ⎢ ⎥ ⎢ ⎥ 1 ⎢1 1 0 0⎥ ⎥⎢0⎥ = ⎢ 2 ⎥ . St = ⎢ ⎢ ⎥ ⎥ ⎢ ⎥ 2 ⎣0 0 0 0⎦⎢ ⎣0⎦ ⎣ 0 ⎦ 0 0000 0 Die transmittierte Welle hat eine Bestrahlungsstärke von 12 (S0 = 12 ) und ist horizontal linear polarisiert (S1 > 0). Als ein weiteres Beispiel betrachten wir eine teilweise elliptisch polarisierte Welle, deren stokessche Parameter zu (4, 2, 0, 3) berechnet worden sind. Ihre Bestrahlungsstärke ist 4, sie ist eher horizontal als vertikal polarisiert; (S1 > 0), sie ist rechtsdrehend (S3 > 0) und hat einen Polarisationsgrad von 90 Prozent. Da kein Parameter größer als S0 sein kann, ist ein Wert von S3 = 3 ziemlich groß und deutet darauf hin, dass die Ellipse einem Kreis ähnelt. Lassen wir die Welle nun ein λ/4-Phasenplättchen mit einer vertikalen nf -Achse durchqueren. Dann ist ⎡ ⎤⎡ ⎤ 100 0 4 ⎢0 1 0 0⎥⎢2⎥ ⎥⎢ ⎥ St = ⎢ ⎣ 0 0 0 −1 ⎦ ⎣ 0 ⎦ , 001 0 3

Aufgaben

745

woraus folgt ⎡

⎤ 4 ⎢ 2⎥ ⎥ St = ⎢ ⎣ −3 ⎦ . 0

Die austretende Welle hat dieselbe Bestrahlungsstärke und denselben Polarisationsgrad wie die einfallende, ist aber nun teilweise polarisiert. Wir haben nur einige der wichtigsten Aspekte der Matrixmethoden kurz berührt. Der Umfang dieses Themas geht weit über diese einführenden Bemerkungen hinaus.29

Aufgaben Lösungen zu den Aufgaben ohne ∗ finden Sie am Ende des Buches. 8.1* Zwei Lichtwellen Ex = E0 cos(kz − ωt) und Ey = −E0 cos(kz − ωt) überlappen sich im Raum. Zeigen Sie, dass es sich bei der resultierenden Welle um lineares Licht handelt und bestimmen Sie deren Amplitude sowie den Neigungswinkel θ. 8.2* Zwei Wellen Ez = 4 sin(ky − ωt) und Ex = 3 sin(ky − ωt) (beide gegeben in SIEinheiten) überlappen sich im Raum. Beschreiben Sie den Polarisationszustand der resultierenden Welle. 8.3* Betrachten Sie die beiden folgenden Wellen (beide gegeben in SI-Einheiten): Ex = 8 sin(ky − ωt + π/2) und Ez = 8 sin(ky − ωt). Welche Welle führt und um wie viel? Beschreiben Sie die resultierende Welle. 8.4

Beschreiben Sie vollständig den Polarisationszustand folgender Wellen: a) E = ˆıE0 cos (kz − ωt) − ˆjE0 cos (kz − ωt) b) E = ˆıE0 sin 2π (z/λ − νt) − ˆjE0 sin 2π (z/λ − νt) c) E = ˆıE0 sin (ωt − kz) + ˆjE0 sin (ωt − kz − π/4) d) E = ˆıE0 cos (ωt − kz) + ˆjE0 cos (ωt − kz + π/2)

8.5

Eine Welle sei gegeben durch E(z, t) = [ˆı cos ωt + ˆj cos (ωt − π/2)] E0 sin kz. Um welche Art von Welle handelt es sich? Zeichnen Sie eine grobe Skizze, die ihre wichtigsten Merkmale enthält.

8.6

Zeigen Sie analytisch, dass die Überlagerung von einem R- und einem L-Zustand mit unterschiedlichen Amplituden einen E-Zustand wie in Abbildung 8.11 ergibt. Wie groß muss in diesem Falle ε sein?

8.7

Schreiben Sie einen Ausdruck auf für eine Lichtquelle im P-Zustand mit der Winkelfrequenz ω und der Amplitude E0 , die sich entlang der x-Achse bewegt und deren

29

Eine ausführlichere und mathematisch zufriedenstellendere Entwicklung kann man mithilfe der so genannten Kohärenzmatrix formulieren. Eine weiterführende, aber anspruchsvolle Lektüre ist O’Neill, Introduction to Statistical Optics.

8 Polarisation

746

Schwingungsebene im Winkel von 25◦ zur xy-Ebene geneigt ist. Die Elongation ist bei t = 0 und x = 0 null. 8.8* Schreiben Sie einen Ausdruck auf für eine Lichtwelle im P-Zustand mit der Winkelfrequenz ω und der Amplitude E0 , die sich entlang einer Geraden in der xy-Ebene mit einem Winkel von 45◦ zur x-Achse ausbreitet und in der xy-Ebene schwingt. Bei t = 0 und x = 0 ist das Feld null. 8.9

Schreiben Sie einen Ausdruck auf für eine Lichtwelle im R-Zustand mit der Frequenz ω, die sich in positiver x-Richtung ausbreitet, sodass bei t = 0 und x = 0 das E-Feld in die negative z-Richtung zeigt.

8.10* Ein Strahl linear polarisierten Lichts mit vertikaler elektrischer Feldkomponente fällt senkrecht auf einen idealen Linearpolarisator mit vertikaler Durchlassachse. Wie groß ist die Bestrahlungsstärke des durchgelassenen Strahls, wenn die Bestrahlungsstärke des einfallenden Strahls 200 W/m2 beträgt? 8.11* 300 W/m2 Licht aus einer normalen Wolframlampe falle auf einen idealen linearen Polarisator. Wie groß ist die Flussdichte der Strahlung beim Austritt aus dem Polarisator? 8.12* Ein vertikal linear polarisierter Lichtstrahl fällt senkrecht auf einen idealen Linearpolarisator, dessen Durchlassachse mit der Vertikalen einen Winkel von 60◦ einschließt. Zeigen Sie, dass der Polarisator nur 25% der einfallenden Bestrahlungsstärke durchlässt. 8.13* Ein realer linearer Polarisator wird mit linearem Licht bestrahlt, das den Winkel θ mit der Durchlassachse bildet. Die Durchlässigkeit dieses Polarisors ist gegeben durch Tl = (T0 − T90 ) cos2 θ + T90 , wobei T0 der maximale und T90 der minimale Wert der Durchlässigkeit ist. Zeigen Sie, dass dieser Ausdruck äquivalent mit Gleichung (8.25) ist. 8.14* Angenommen, natürliches Licht von 1000 W/m2 fällt senkrecht auf eine HN-22-Folie. Beschreiben Sie das Licht, das den Filter verlässt. Wie groß ist die Bestrahlungsstärke? 8.15 Licht, das ursprünglich natürlich war und eine Flussdichte Ii hatte, passiere zwei HN32-Folien, deren Durchlassachsen parallel zueinander sind. Wie groß ist die Flussdichte des austretenden Strahlenbündels? 8.16* Wie groß ist die Bestrahlungsstärke des austretenden Strahlenbündels, wenn der Analysator der vorhergehenden Aufgabe um 30◦ gedreht wird? 8.17* Zwei lineare HN-38S-Folien sind so hintereinander angeordnet, dass ihre Durchlassachsen ausgerichtet sind. Die erste Folie wird mit natürlichem Licht von 1000 W/m2 bestrahlt. Bestimmen Sie näherungsweise die austretende Bestrahlungsstärke. Wie groß ist die aus beiden Polarisatoren resultierende Durchlässigkeit? 8.18* Die Bestrahlungsstärke eines natürlichen Lichtstrahls betrage 400 W/m2 . Der Strahl treffe auf den ersten von zwei hintereinander geschalteten idealen linearen Polarisatoren, deren Durchlassachsen um 40◦ gegeneinander geneigt sind. Wie viel Licht tritt aus dem zweiten Polarisator aus?

Aufgaben

747

8.19* Vier HN-32-Polaroids seien so hintereinander angeordnet, dass ihre Durchlassachsen alle parallel sind. Die Bestrahlungsstärke des auf das erste Polaroid fallenden natürlichen Lichts sei Ii . Wie groß ist die aus dem Stapel austretende Bestrahlungsstärke? 8.20* Natürliches Licht der Bestrahlungsstärke Ii fällt normal auf einen HN-32-Polarisator. (a) Wie viel Licht tritt aus diesem aus? (b) Nehmen Sie nun an, dass hinter dem ersten Polarisator und parallel zu diesem ein identischer zweiter Polarisator platziert wird. Wie viel Licht tritt aus der Kombination aus, wenn die beiden Durchlassachsen einen Winkel von 45◦ bilden? 8.21* Natürliches Licht der Bestrahlungsstärke Ii fällt normal auf drei identische lineare Polarisatoren, die so angeordnet sind, dass ihre Durchlassachsen alle parallel zueinander sind. Nehmen Sie an, dass jeder der Polarisatoren eine Hauptdurchlässigkeit von 64 % und ein hohes Auslöschungsverhältnis hat, und zeigen Sie, dass die durchgelassene Bestrahlungsstärke ungefähr bei 13 % von Ii liegt. 8.22* Aus Abschnitt 8.10 wissen wir, dass Substanzen wie Zucker und Insulin optisch aktiv sind: Sie drehen die Polarisationsebene eines einfallenden Lichtstrahls proportional zur Weglänge und zur Konzentration der Lösung. Eine Glasküvette wird zwischen zwei gekreuzte lineare Polarisatoren des Typs HN-50 gestellt; 50% des auf den ersten Polarisator treffenden natürlichen Lichts treten aus dem zweiten Polarisator wieder aus. Um welchen Winkel hat die Zuckerlösung in der Küvette die Polarisationsebene des Lichts gedreht, das aus dem ersten Polarisator austrat? 8.23* Das Licht einer Taschenlampe passiert einen Linearpolarisator mit senkrechter Transmissionsachse. Der resultierende Strahl mit einer Bestrahlungsstärke von 200 W/m2 trifft senkrecht auf einen vertikalen Linearpolarisator des Typs HN-50, dessen Transmissionsachse um 30◦ gegen die Horizontale geneigt ist. Wie viel Licht wird durchgelassen? 8.24* Linear polarisiertes Licht mit einer Bestrahlungsstärke von 200 W/m2 , dessen elektrische Feldkomponente um +55◦ gegen die Senkrechte geneigt ist, fällt senkrecht auf eine ideale Polarisationsfolie, deren Transmissionsachse um +10◦ gegen die Senkrechte geneigt ist. Welcher Anteil des einfallenden Lichts tritt wieder aus? 8.25* Zwei ideal linear polarisierende Folien werden so angeordnet, dass ihre Transmissionsachsen um 10◦ bzw. 60◦ gegen die Senkrechte geneigt sind. Lineares Licht mit einer um 40◦ geneigten elektrischen Feldkomponente fällt auf den ersten Polarisator. Welcher Anteil des einfallenden Lichts tritt aus dem zweiten Polarisator aus? 8.26* Wir betrachten ein Paar gekreuzter Polarisatoren mit vertikaler bzw. horizontaler Durchlassachse. Das Strahlenbündel, das aus dem ersten Polarisator austritt, hat eine Flussdichte I1 ; der Analysator lässt kein Licht hindurch, I2 = 0. Nun bringen wir einen idealen Linearpolarisator (HN-50), dessen Durchlassachse um 45◦ zur Senkrechten geneigt sei, zwischen die beiden Elemente. Berechnen Sie I2 . Was können Sie über die Bewegung der Elektronen in den Polarisatoren sagen?

8 Polarisation

748

8.27* Betrachten Sie zwei identische ideale Linearpolarisatoren und eine natürliche Lichtquelle. Stellen Sie die Polarisatoren in Gedanken hintereinander auf, wobei die Durchlassachsen auf 0◦ beziehungsweise 50◦ ausgerichtet werden. Stellen Sie dazwischen einen dritten Linearpolarisator, dessen Durchlassachse auf 25◦ augerichtet ist. Das Licht fällt mit 1000 W/m2 ein. Wie groß ist die Flussdichte beim Austritt des Lichts mit oder ohne mittleren Polarisator? 8.28* Angenommen, 200 W/m2 unpolarisierten Lichts fallen senkrecht auf vier übereinander gestapelte Linearpolarisatoren, wobei die Transmissionsachse des ersten Polarisators senkrecht, die des zweiten um 30◦ , die des dritten um 60◦ und die des vierten um 90◦ geneigt ist. Wie viel Licht tritt aus? 8.29* Zwei ideale lineare Polarisatoren HN-50 werden hintereinander angeordnet. Welchen Winkel müssen ihre Transmissionsachsen bilden, wenn ein eintreffender unpolarisierter Strahl durch das Polarisatorpaar von 100 W/m2 auf 30 W/m2 abgeschwächt werden soll? 8.30 Ein idealer Polarisator wird mit einer Kreisfrequenz ω zwischen einem Paar ungefähr gleicher, ruhender gekreuzter Polarisatoren gedreht. Zeigen Sie, dass die Modulation der austretende Flussdichte das Vierfache der Kreisfrequenz beträgt, dass also I=

I1 (1 − cos 4ωt) , 8

ist. I1 ist die Flussdichte, die aus dem ersten Polarisator austritt, und I ist die resultierende Flussdichte. 8.31 Abbildung A.8.31 zeigt einen Strahl, der einen Kalkspatkristall bei fast senkrechtem Einfall durchläuft, am Spiegel reflektiert wird und wieder durch den Kristall läuft. Sieht der Beobachter ein Doppelbild von dem Punkt auf Σ?

Σ

Kalkspat Spiegel

Abb. A.8.31

8.32* Eine Bleistiftmarkierung auf einem Blatt Papier wird mit einem Kalkspatkristall überdeckt. Ist das Licht, das bei Beleuchtung von oben auf das Papier trifft, nicht bereits polarisiert, nachdem es durch den Kristall gelaufen ist? Warum sehen wir dann zwei Bilder? Testen Sie Ihre Lösung durch Polarisierung des Lichts einer Taschenlampe und

Aufgaben

749

anschließender Reflexion an einem Blatt Papier. Versuchen Sie eine Spiegelung an Glas; ist das reflektierte Licht polarisiert? 8.33 Diskutieren Sie im Detail, was Sie in Abbildung A.8.33 sehen. Der Kristall ist Kalkspat, und er hat eine stumpfe Ecke an der linken oberen Seite. Die Durchlassachsen der beiden Polaroidfilter liegen parallel zu den kurzen Seiten.

Abb. A.8.33

8.34 Abbildung A.8.34 zeigt einen Kalkspatkristall in drei verschiedenen Orientierungen: Seine stumpfe Ecke ist (a) links, (b) unten links und (c) am unteren Ende. Die Durchlassachse des Polaroids ist horizontal. Erklären Sie jedes Foto, insbesondere (b).

(a)

(c)

(b)

Abb. A.8.34

8.35 Wie im Text erläutert, ist die starke Doppelbrechung des Kalkspats darauf zurückzuführen, dass die Carbonatgruppen in parallelen Ebenen (senkrecht zur optischen Achse) liegen. Zeigen Sie anhand einer Skizze und erklären Sie, warum die Polarisation durch die Gruppe kleiner ist, wenn E senkrecht zur CO3 -Ebene liegt, als wenn E parallel

8 Polarisation

750

zu ihr wäre. Was bedeutet dies im Hinblick auf die Geschwindigkeiten v⊥ und v || der Welle, wenn E senkrecht oder parallel zur optischen Achse linear polarisiert ist? 8.36 Ein Lichtstrahl trete von links in ein Kalkspatprisma ein (Abb. A.8.36). Drei mögliche Orientierungen der optischen Achse sind von besonderem Interesse, nämlich diejenigen, die den x-, y- und z-Achsen entsprechen. Stellen Sie sich drei solche Prismen vor. Skizzieren Sie jeweils einfallende und austretende Strahlen und kennzeichnen Sie den Polarisationszustand. Wie kann man mithilfe dieser Strahlen no und ne bestimmen?

z

y

x

Abb. A.8.36

8.37 Berechnen Sie den Grenzwinkel der inneren Totalreflexion an der Kalkspat-BalsamGrenzfläche eines Nicol-Prismas für den ordentlichen Strahl. 8.38* Zeichnen Sie ein Wollaston-Prisma aus Quarz mit allen relevanten Strahlen und ihren Polarisationszuständen. 8.39* Betrachten Sie ein Wollaston-Prisma, das aus zwei 45◦ -Quarzprismen, ähnlich wie in Abbildung 8.34, besteht. Gegeben sei λ0 = 589,3 nm. Bestimmen Sie den Winkel, den die beiden austretenden Strahlen bilden. [Hinweis: Gegenüber einem Wollaston-Prisma aus Kalkspat sind hier der ordentliche und der außerordentliche Strahl vertauscht.] 8.40 Das Prisma in Abbildung A.8.40 nennt man RochonPolarisator. Zeichnen Sie alle relevanten Strahlen unter folgenden Voraussetzungen: a) Das Prisma besteht aus Kalkspat. b) Das Prisma besteht aus Quarz. c) Welche Vorteile könnte ein solches Gerät im Vergleich zu einem dichroitischen Polarisator bieten, wenn man mit Laserlicht hoher Flussdichte arbeitet? d) Welches wertvolle Merkmal des Rochon-Polarisators fehlt dem Wollaston-Polarisator? Abb. A.8.40

8.41* Ein Mikrowellensender strahlt eine linear polarisierte Welle ab, deren E-Feld parallel zur Dipolrichtung ist. Wir möchten so viel Energie wie möglich an der Oberfläche eines Teiches reflektieren, der einen Brechungsindex von 9,0 hat. Bestimmen Sie die erforderliche Feldorientierung des Strahls und seinen Einfallswinkel. 8.42* Bei welchem Winkel verschwindet Himmelslicht, das von der Oberfläche eines Teiches (n = 1,33) reflektiert wird, wenn man durch ein Polarisationsfilter blickt? 8.43* Wie groß ist der Brewster-Winkel für die Reflexion von Licht an der Oberfläche eines Glasstücks (n = 1,65) in Wasser (n = 1,33)? 8.44* Der kritische Winkel eines transparenten Materials in Luft sei 41,0◦ . Bestimmen Sie den Polarisationswinkel. 8.45* Ein Lichtstrahl wird von der Oberfläche einer unbekannten Flüssigkeit reflektiert und das Licht wird mit einem linearen Folienpolarisator analysiert. Wenn die Achse des

Aufgaben

751

Polarisators (die senkrecht auf demselben steht) um einen Winkel von 54,30◦ gegen die Vertikale geneigt ist, wird das reflektierte Licht vollständig durchgelassen, vorausgesetzt, die Transmissionsachse ist parallel zur Ebene der Grenzfläche. Berechnen Sie den Brechungsindex der Flüssigkeit mithilfe dieser Informationen. 8.46* Licht, das von einer Glasplatte (ng = 1,65) in Ethylalkohol (ne = 1,36) reflektiert wird, werde vollständig linear polarisiert. Unter welchem Winkel tritt der teilweise polarisierte Strahl in die Platte ein? 8.47* Ein Strahl natürlichen Lichts trifft unter einem Winkel von 40◦ auf eine Luft-GlasGrenzfläche (nti = 1,5). Berechnen Sie den Polarisationsgrad des reflektierten Lichts. 8.48* Zeigen Sie, dass der Polarisationsgrad Vr von reflektiertem Licht durch Vr =

R⊥ − R || R⊥ + R ||

ausgedrückt werden kann. [Hinweis: Für unpolarisiertes reflektiertes Licht gilt Ir || = Ir⊥ , für polarisiertes reflektiertes Licht dagegen Ip = Ir⊥ − Ir || .] 8.49* Ein Strahl natürlichen Lichts, der unter einem Winkel von 70◦ aus der Luft auf eine Glasoberfläche (n = 1,5) trifft, wird teilweise reflektiert. Berechnen Sie das Reflexionsvermögen. Was passiert bei einem Eintrittswinkel von 56,3◦ ? Erklären Sie dies. 8.50* Ein schmaler Strahl von natürlichem Licht fällt im Winkel von 56,0◦ auf eine Glasplatte, die von Luft umgeben ist. Das reflektierte Licht ist teilweise polarisiert. Bestimmen Sie den Polarisationsgrad. [Hinweis: Schauen Sie sich noch einmal Aufgabe 8.48 an.] 8.51* Ein schmaler Lichtstrahl trifft auf die Oberfläche eines klaren Materials. Wie sich zeigt, ist das reflektierte Licht vollständig polarisiert. Nehmen Sie an, dass der Anteil der Totalreflexion 10 % ist und bestimmen Sie die Durchlässigkeit der Grenzfläche. 8.52 Ein Strahl gelben Lichts trifft unter einem Winkel von 50◦ auf eine Kalkspatplatte. Die Platte ist so geschnitten, dass die optische Achse parallel zur Oberfläche und senkrecht zur Einfallsebene ist. Bestimmen Sie den Winkel zwischen den beiden austretenden Strahlen. 8.53* Ein Lichtstrahl trifft senkrecht auf eine Quarzplatte, deren optische Achse senkrecht zum Strahl verläuft. Berechnen Sie die Wellenlänge des ordentlichen und des außerordentlichen Strahls, wenn λ0 = 589,3 nm beträgt. Wie groß sind die Frequenzen der beiden Strahlen? 8.54 Der elektrische Feldvektor eines eintreffenden P-Strahls ist um 30◦ gegen die schnelle Achse einer λ/4-Platte geneigt. Beschreiben Sie den Polarisationszustand der austretenden Welle. 8.55* Stellen Sie sich vor, Sie fügten zwischen zwei ideale Polaroidfolien (die erste mit vertikaler Achse, die zweite mit horizontaler Achse) einen Stapel von zehn λ/2-Plättchen ein. Die schnelle Achse eines Plättchens sei jeweils um π/40 gegen die seines Vorgängers (im Falle des ersten Plättchens gegen die Vertikale) geneigt. Bestimmen Sie das Verhältnis zwischen austretender und eintreffender Bestrahlungsstärke und erläutern Sie, wie Sie zu diesem Ergebnis gekommen sind.

752

8 Polarisation

8.56* Angenommen, Sie haben einen linearen Polarisator und ein λ/4-Plättchen. Wie können Sie beide auseinander halten, wenn Ihnen außerdem eine natürliche Lichtquelle zur Verfügung steht? 8.57* Linear polarisiertes Licht mit einem Neigungswinkel von 135◦ zur Horizontalen, das im zweiten und vierten Quadranten schwingt, geht durch ein π/2-Plättchen, dessen schnelle Achse vertikal ausgerichtet ist. Beschreiben Sie den Polarisationszustand des austretenden Lichts. Wie muss das lineare Licht gedreht werden (im oder gegen den Uhrzeigersinn), damit es entlang der langsamen Achse ausgerichtet ist? 8.58* Rechtszirkular polarisiertes Licht geht durch ein λ/4-Plättchen, dessen schnelle Achse vertikal ausgerichtet ist. Beschreiben Sie den Polarisationszustand des austretenden Lichts. Hat sich der Polarisationszustand nach einem Viertel des Weges in dem Kreis in Abbildung 8.42 verschoben? 8.59* Rechtszirkular polarisiertes Licht geht durch ein Viertelwellenplättchen, dessen schnelle Achse horizontal ausgerichtet ist. Erläutern Sie, warum man erwarten kann, dass das austretende Licht linear polarisiert mit 45◦ im ersten und dritten Quadranten ist. 8.60* Linear polarisiertes Licht, das bei 135◦ im zweiten und vierten Quadranten schwingt, geht durch ein λ/2-Plättchen, dessen schnelle Achse vertikal ausgerichtet ist. Erläutern Sie, warum man erwarten kann, dass das austretende Licht linear im ersten und zweiten Quadranten ist. 8.61* Rechtszirkular polarisiertes Licht geht durch ein λ/2-Plättchen, dessen schnelle Achse vertikal ausgerichtet ist. Beschreiben Sie den Polarisationszustand des austretenden Lichts. 8.62* Linear polarisiertes Licht, das bei 60◦ über der horizontalen Achse im ersten und dritten Quadranten schwingt, geht durch ein λ/4-Plättchen, dessen schnelle Achse horizontal ausgerichtet ist. Erläutern Sie, warum das Licht linkselliptisch polarisiert mit vertikaler Hauptachse ist. 8.63* Linear polarisiertes Licht, das entlang der x-Achse schwingt, geht durch ein λ/4Plättchen, dessen schnelle Achse 45◦ über der x-Achse liegt. Zeigen Sie grafisch mithilfe der Zeigermethode, dass das austretende Licht rechtszirkular ist. [Hinweis: Zeichnen Sie zunächst die 45◦ über der x-Achse liegende x -Achse; die O-Position für den Zeiger Ey weist nach unten in die negative y  -Richtung.] 8.64* Lineares, horizontal polarisiertes Licht geht durch ein λ/4-Plättchen, dessen schnelle Achse π/8 rad über der horizontalen Achse liegt. Verwenden Sie die Zeigermethode, um den Polarisationszustand des austretenden Lichts grafisch zu bestimmen. [Hinweis: E hat die Richtung der x-Achse und liegt unterhalb der x -Achse; daher zeigt der Zeiger Ey am Anfang nach unten.] 8.65* Linkszirkular polarisiertes Licht der Wellenlänge 590 nm, dass sich in die z-Richtung fortpflanzt, soll in rechtszirkular polarisiertes Licht umgewandelt werden, indem man es senkrecht durch eine Quarzplatte gehen lässt. Das Material ist so geschnitten und poliert, dass die optische Achse in y-Richtung liegt (no = 1,5443, ne = 1,5534), und die Vorderseite der Platte lieg in der xy-Ebene. (a) Welche Richtung hat die schnelle Achse? (b) Wie dick muss die Platte mindestens sein? Geben Sie eine ausführliche Begründung und fertigen Sie eine Skizze an.

Aufgaben

753

8.66* Licht im L-Zustand passiert ein λ/8-Plättchen mit einer horizontalen schnellen Achse. Wie ist der Polarisationszustand des austretenden Strahls? 8.67* Abbildung A.8.67 zeigt zwei lineare Polaroid-Polarisatoren, zwischen denen sich ein Objektträger befindet, auf dem ein Stück Cellophanband angebracht ist. Erklären Sie, was Sie sehen.

Abb. A.8.67

8.68 Unpolarisiertes Tageslicht falle fast senkrecht auf die Glasoberfläche eines Radarbildschirms. Ein Anteil wird zum Betrachter reflektiert, wodurch sich die Anzeige des Bildschirms verschlechtert. Angenommen, wir decken einen rechtszirkularen Polarisator über den Schirm (Abb. A.8.68). Verfolgen Sie den einfallenden und den reflektierten Strahl und betrachten Sie ihren Polarisationszustand. Was geschieht mit dem reflektierten Strahl? Glasschirm Rechtszirkularpolarisator λ 4

Plättchen

Polarisator

Abb. A.8.68

8.69 Ein Babinet-Kompensator wird unter einem Winkel von 45◦ zwischen gekreuzte lineare Polarisatoren gebracht und mit Natriumlicht beleuchtet. Wird ein dünnes Glimmerplättchen (Indizes 1,599 und 1,594) auf den Kompensator gebracht, so verschieben sich die schwarzen Bänder um 14 ihres gegenseitigen Abstands. Bestimmen Sie die Phasenverschiebung und die Dicke des Plättchens. 8.70 Kann ein Strahl aus zwei orthogonalen inkohärenten P-Zuständen bestehen, wenn es sich nicht um natürliches Licht handelt? Erklären Sie Ihre Antwort. Wie würden Sie einen solchen Strahl erzeugen?

8 Polarisation

754

8.71* Das spezifische Drehvermögen (λ0 = 589,3 nm) für in Wasser bei 20◦ aufgelöste Saccharose beträgt +66,45◦ pro 10 cm Weglänge des Strahls in einer Lösung, die 1 g der aktiven Substanz pro cm3 enthält. Vertikal polarisiertes Natriumlicht im P-Zustand tritt in eine 1 m lange Röhre ein, die mit 1000 cm3 Lösung gefüllt ist, wovon 10 g Saccharose sind. Mit welcher Orientierung verlässt der Strahl das andere Ende der Röhre? 8.72 Bei der Untersuchung eines Stücks gespannten photoelastischen Materials zwischen gekreuzten Linearpolarisatoren sehen wir farbige Streifen (Isochromaten) und, diesen überlagert, dunkle Bänder (Isoklinen). Wie können wir die Isoklinen selektiv ausblenden? Erklären Sie Ihre Lösung. Übrigens ist die richtige Anordnung unabhängig von der Orientierung der photoelastischen Probe. 8.73* Wir betrachten eine Kerr-Zelle, deren Platten durch einen Abstand d voneinander getrennt sind.  sei die effektive Länge dieser Platten (die sich von der tatsächlichen Länge wegen des nichtidealen Charakters des Feldes geringfügig unterscheidet). Zeigen Sie, dass Δϕ = 2πKV 2 /d2

[8.48]

ist. 8.74 Berechnen Sie die Halbwellenspannung einer longitudinalen Pockels-Zelle aus ADA (Ammoniumdihydrogenarsenat) bei λ0 ≈ 550 nm, wobei r63 = 5,5 × 10−12 und n0 = 1,58 ist. 8.75* Der Jones-Vektor eines beliebigen linear polarisierten Zustands mit einem Winkel θ bezüglich der Waagerechten ist gegeben durch  cos θ . sin θ Beweisen Sie, dass diese Matrix mit der in Tabelle 8.5 gegebenen Matrix für einen P-Zustand bei +45◦ in Einklang ist. ! 2 , der einen Polarisationszustand orthogonal zu 8.76 Bestimmen Sie den Jones-Vektor E  1 !1 = E −2i darstellt. Skizzieren Sie beide Vektoren. 8.77* Zwei inkohärente Lichtstrahlen, die durch (1, 1, 0, 0) und (3, 0, 0, 3) repräsentiert sind, werden überlagert. a) Beschreiben Sie detailliert beide Polarisationszustände. b) Bestimmen Sie die resultierenden stokesschen Parameter des kombinierten Strahls und beschreiben Sie seinen Polarisationszustand. c) Wie groß ist sein Polarisationsgrad? d) Welches Licht ergibt sich durch die Überlagerung der inkohärenten Strahlen (1, 1, 0, 0) und (1, –1, 0, 0)? 8.78* Zeigen Sie durch direkte Berechnung unter Benutzung der Mueller-Matrizen, dass ein Strahl natürlichen Lichts mit der Einheitsbestrahlungsstärke beim Durchqueren eines vertikalen Linearpolarisators in einen vertikalen P-Zustand umgewandelt wird. Bestimmen Sie die relative Bestrahlungsstärke und den Polarisationsgrad des Strahls.

Aufgaben

755

8.79* Zeigen Sie durch direkte Berechnung unter Benutzung der Mueller-Matrizen, dass ein Strahl natürlichen Lichts mit der Einheitsbestrahlungsstärke, der einen Linearpolarisator mit einer Transmissionsachse bei 45◦ passiert, in einen P-Zustand bei 45◦ umgewandelt wird. Bestimmen Sie die relative Bestrahlungsstärke und den Polarisationsgrad des Strahls. 8.80* Zeigen Sie durch direkte Berechnung mithilfe der Mueller-Matrizen, dass ein Strahl im horizontalen P-Zustand, der ein λ/4-Plättchen mit horizontaler schneller Achse passiert, unverändert bleibt. 8.81* Überprüfen Sie, dass die Matrix ⎤ ⎡ 100 0 ⎢ 0 0 0 −1 ⎥ ⎥ ⎢ ⎥ ⎢ ⎣0 0 1 0⎦ 010 0 die Mueller-Matrix eines λ/4-Plättchens mit der schnellen Achse bei 45◦ darstellt. Lassen Sie bei 45◦ linear polarisiertes Licht durch das Plättchen hindurchtreten. Was passiert? Was entsteht, wenn Licht im horizontalen P-Zustand auf das Gerät trifft? 8.82* Die Mueller-Matrix ⎤ ⎡ 1 0 0 0 ⎢ 0 C 2 + S 2 cos Δϕ CS (1 − cos Δϕ) −S sin Δϕ ⎥ ⎥ ⎢ ⎥ ⎢ ⎣ 0 CS (1 − cos Δϕ) S 2 + C 2 cos Δϕ C sin Δϕ ⎦ 0 S sin Δϕ −C sin Δϕ cos Δϕ mit C = cos 2α und S = sin 2α bezeichnet ein beliebiges Phasenplättchen mit einer Verzögerung Δϕ und einer schnellen Achse, welche einen Winkel α mit der Waagerechten einschließt. Leiten Sie mithilfe dieser Matrix die in Aufgabe 8.81 gegebene Matrix her. 8.83* Zeigen Sie, dass die in Aufgabe 8.82 gegebene Mueller-Matrix für ein beliebiges Phasenplättchen mit der in Tabelle 8.6 gegebenen Matrix für ein λ/4-Plättchen mit senkrechter schneller Achse in Einklang steht. 8.84 Leiten Sie die Mueller-Matrix für ein λ/4-Plättchen mit der schnellen Achse bei −45◦ ab. Zeigen Sie, dass diese Matrix die vorangegangene effektiv neutralisiert, sodass ein Strahl, der die beiden Plättchen nacheinander durchläuft, unverändert wieder austritt. 8.85* Lassen Sie einen Strahl horizontal linear polarisierten Lichts durch jedes der beiden λ/4-Plättchen der beiden vorangegangenen Aufgaben laufen und beschreiben Sie die Zustände des resultierenden Lichts. Erklären Sie, welche Feldkomponente welcher vorausläuft und wie dies mit der Abbildung 8.9 in Beziehung zu bringen ist. 8.86 Leiten Sie mithilfe von Tabelle 8.6 eine Mueller-Matrix für ein λ/2-Plättchen mit vertikaler schneller Achse ab. Verwenden Sie das Ergebnis zur Umwandlung eines RZustands in einen L-Zustand. Prüfen Sie nach, dass dasselbe Plättchen einen L-Zustand in einen R-Zustand umwandelt. Das Verschieben der relativen Phase um π/2 nach vorn oder hinten sollte den gleichen Effekt haben. Prüfen Sie dies, indem Sie die Matrix für ein λ/2-Plättchen mit horizontaler schneller Achse ableiten.

8 Polarisation

756

8.87 Konstruieren Sie eine mögliche Mueller-Matrix für einen rechtszirkularen Polarisator, der aus einem Linearpolarisator und einem λ/4-Plättchen aufgebaut ist. Eine solche Anordnung ist offensichtlich eine inhomogene Kombination zweier Elemente und unterscheidet sich von einem homogenen zirkularen Polarisator (siehe Tab. 8.6). Testen Sie Ihre Matrix, indem Sie nachprüfen, dass sie natürliches Licht in einen R-Zustand überführt. Zeigen Sie, dass sie wie die homogene Matrix R-Zustände durchlässt. Ihre Matrix sollte L-Zustände, die von der Ausgangsseite her eintreten, in R-Zustände überführen, während der homogene Polarisator diese völlig absorbiert. Überprüfen Sie dies. 8.88* Wird die Pockels-Zelle in Abbildung 8.65 mit Licht der Bestrahlungsstärke Ii beleuchtet, lässt er einen Strahl der Stärke It hindurch, sodass It = Ii sin2 (Δϕ/2) ist. Zeichnen Sie It /Ii als Funktion der angelegten Spannung. Welche Bedeutung hat die Spannung, bei der die Transmission maximal wird? Was ist die niedrigste von null verschiedene Spannung, die für ADP It null werden lässt (λ0 = 546,1 nm)? Wie kann man einen maximalen Wert für It /Ii am Nullpunkt der Spannung erreichen? Welche Bestrahlungsstärke entsteht bei dieser neuen Konfiguration, wenn V = Vλ/2 ist? 8.89 Konstruieren Sie eine Jones-Matrix für eine isotrope Platte absorbierenden Materials, dessen Amplituden-Transmissionskoeffizient gleich t ist. Manchmal ist es sinnvoll, die Phase zu untersuchen, weil die Platte als isotroper Phasenverzögerer wirkt (auch wenn t = 1 ist). Wie lauten die Jones-Matrizen für Vakuum und für einen ideal absorbierenden Stoff? 8.90 Konstruieren Sie eine Mueller-Matrix für eine isotrope Platte absorbierenden Materials, dessen Amplituden-Transmissionskoeffizient gleich t ist. Welche Mueller-Matrix depolarisiert jede beliebige Welle vollständig, ohne ihre Bestrahlungsstärke zu beeinflussen? (Es gibt in Wirklichkeit kein Gerät mit solch einer Matrix.) 8.91 Schreiben Sie unter Zuhilfenahme von Gleichung (8.29) einen Ausdruck für die unpolarisierte Flussdichtenkomponente (In ) eines teilweise polarisierten Strahls als Funktion der stokesschen Parameter auf. Zur Überprüfung Ihres Resultats addieren Sie einen unpolarisierten stokesschen Vektor der Flussdichte 4 zu einem R-Zustand der Flussdichte 1. Erhalten Sie In = 4 für die resultierende Welle? 8.92* Ein optisches Filter könne mithilfe der Jones-Matrix  cos α sin α − sin α cos α beschrieben werden. Beschreiben Sie die Form des austretenden Lichts, wenn folgende Strahlen in das Filter eintreten: a) ein linear polarisierter Strahl, dessen Polarisationsebene den Winkel θ mit der Waagerechten einschließt (siehe Aufgabe 8.75), b) ein linkszirkular polarisierter Strahl, c) ein rechtszirkular polarisierter Strahl. d) Um was für ein Filter handelt es sich? Wie könnte man es anfertigen?

Aufgaben

757

8.93 Ein optisches Filter werde durch die Jones-Matrix  cos2 α cos α sin α cos α sin α sin2 α beschrieben. a) Der einfallende Strahl sei unter einem Winkel θ bezüglich der Waagerechten linear polarisiert (siehe Aufgabe 8.75). Beschreiben Sie den austretenden Strahl. b) Schließen Sie aus dem Resultat von a) auf die Art des Filters. c) Bestätigen Sie Ihre Folgerung durch mindestens einen weiteren Test. 8.94* Zwei lineare optische Filter werden durch folgende Jones-Matrizen beschrieben:   1 −iπ/4 1 i 1 iπ/4 1 −i A1 = √ e und A2 = √ e . i 1 −i 1 2 2 Um was für Filter handelt es sich? 8.95* Die Jones-Matrix einer Küvette, die eine optisch aktive Zuckerlösung enthält, sei gegeben durch √ √  1 1 + √3 −1 +√ 3 √ . 2 2 1− 3 1+ 3 a) Der einfallende Strahl befinde sich im horizontalen P-Zustand. Wie ist der austretende Strahl polarisiert? b) Der einfallende Strahl befinde sich im vertikalen P-Zustand. Wie ist der austretende Strahl polarisiert? c) Um welchen Winkel dreht das optisch aktive Medium die Polarisationsebene?

9

Interferenz

Die beeindruckenden Farbmuster eines Ölfilms auf nassem Asphalt sind ein bekanntes Phänomen der Interferenz.1 Als eher makroskopische Erscheinung können wir die Wechselwirkung von Oberflächenwellen in einem Wasserbecken betrachten. Auch kompliziertere Verteilungen von Wellen, wie in Abbildung 9.1 gezeigt, gehören zu unserer alltäglichen Erfahrung. Durch die Überlagerung können Gebiete entstehen, in denen zwei (oder mehr) Wellen überlappen und einander dabei teilweise oder sogar vollständig auslöschen. In anderen Gebieten können die Täler und Berge dagegen deutlicher zutage treten als die der einzelnen Wellen. Nach der Überlagerung können sich die Wellen trennen und weiter ausbreiten, ohne von der vorausgegangenen Begegnung beeinflusst worden zu sein. Max

Min

Max

Min

Max

Min Min Max Max Min

Abb. 9.1: Wasserwellen, die phasengleich von zwei Punktquellen ausgehen. In der Mitte des Musters erkennt man Wellenberge (weiße dünne Linien) und Wellentäler (schwarze dünne Linien), voneinander getrennt durch schmale, dunkle, unbewegte Gebiete (Minima). Die optische Entsprechung hierzu ist die Verteilung des elektrischen Feldes, wie sie in Abbildung 9.3 c gezeigt ist. (Mit frdl. Erlaubnis von PSSC College Physics, 1968; 1965 Educational Development Center, Inc.)

Obwohl das Phänomen aus der Perspektive der Quantenelektrodynamik betrachtet werden könnte, werden wir einen viel einfacheren Zugang wählen. Die Wellentheorie der elektromagnetischen Natur des Lichts liefert uns eine natürliche Grundlage dafür. Wir erinnern uns, dass der Ausdruck, der die optischen Schwingungen beschreibt, eine homogene lineare partielle Differentialgleichung zweiter Ordnung ist [Gl. (3.22)]. Wie wir bereits gelernt haben, genügt sie damit dem wichtigen Superpositionsprin1

Die Wasserschicht auf dem Asphalt lässt den Ölfilm die Gestalt der glatten Wasseroberfläche annehmen. Der schwarze Asphalt absorbiert transmittiertes Licht und verhindert somit seine Reflexion, die die Farbmuster sonst verdecken würde.

https://doi.org/10.1515/9783111025599-009

9 Interferenz

760

Diese näherungsweise ringförmigen Interferenzstreifen entstanden an einem Ölfilm auf einem nassen Fußweg. Es handelt sich um Streifen gleicher Dicke (siehe Abschn. 9.4.1) – sie bleiben unverändert, egal unter welchem Winkel Sie darauf blicken. Natürlich leuchten sie in allen Regenbogenfarben. (Foto E. H.)

zip. Dementsprechend ist die resultierende elektrische Feldstärke E an einem Punkt im Raum, wo zwei oder mehr Lichtwellen überlappen, gleich der vektoriellen Summe der Einzelwellen. Kurz gesagt versteht man unter optischer Interferenz die Wechselwirkung zweier oder mehrerer Lichtquellen, die eine resultierende Bestrahlungsstärke ergeben, die sich von der Summe der einzelnen Bestrahlungsstärken unterscheidet. Aus der Vielzahl optischer Systeme, die Interferenz erzeugen, wählen wir einige wenige wichtige zur Untersuchung aus. Interferometer werden zum Zweck der Diskussion in zwei Gruppen unterteilt: wellenfrontspaltende und amplitudenspaltende. Die erste Kategorie benutzt Teile der primären Wellenfront entweder direkt als Quellen zur Emission sekundärer Wellen oder in Verbindung mit optischen Geräten, um virtuelle Quellen von Sekundärwellen zu erzeugen. Diese sekundären Wellen werden dann miteinander zur Interferenz gebracht. Im Falle amplitudenspaltender Geräte wird die primäre Welle selbst in zwei Segmente unterteilt, die unterschiedliche Wege nehmen, bevor sie wieder zusammenlaufen und interferieren.

9.1

Allgemeine Betrachtungen

Das Problem der Überlagerung zweier skalarer Wellen haben wir bereits behandelt (Abschn. 7.1) und die Ergebnisse sind in vielerlei Hinsicht wieder anwendbar. Doch Licht ist natürlich ein vektorielles Phänomen, denn das elektrische und das magnetische Feld sind Vektorfelder. Sich diese Tatsache bewusst zu machen, ist für ein intuitives Verständnis der Interferenz sehr wichtig. In vielen Situationen sind optische Systeme so aufgebaut, dass die Vektornatur des Lichts nur von geringer Bedeutung ist. Wir werden die grundlegenden Interferenzgleichungen im Kontext des Vektormodells ableiten und danach die Bedingungen angeben, unter denen die skalare Behandlung zulässig ist. In Übereinstimmung mit dem Superpositionsprinzip ist die elektrische Feldstärke E an einem Punkt im Raum, die sich aus den einzelnen Komponenten E1 , E2 ,. . . verschiedener beitragender Quellen ergibt, gegeben durch E = E1 + E2 + . . . .

(9.1)

Die optische Schwingung oder das Lichtfeld E variiert zeitlich mit einer extrem großen Geschwindigkeit, etwa 4,3 × 1014 bis 7,5 × 1014 Hz, was die Feldstärke selbst

9.1 Allgemeine Betrachtungen

761

zu einer für die direkte Messung ungeeigneten Größe macht. Andererseits kann die Bestrahlungsstärke I mit verschiedensten Sensoren direkt gemessen werden (z. B. mit Fotozellen, Bolometern, fotografischen Emulsionen oder einfach mit dem Auge). Die Untersuchung der Interferenz ist somit am besten über die Bestimmung von Bestrahlungsstärken möglich. Ein großer Teil der Analyse kann ausgeführt werden, ohne die konkrete Gestalt der Wellenfronten zu berücksichtigen, und die Ergebnisse sind deshalb ziemlich allgemein (Aufgabe 9.1). Aus Gründen der Einfachheit betrachten wir jedoch zwei Punktquellen S1 und S2 , die monochromatische Wellen derselben Frequenz in einem homogenen Medium ausstrahlen. Ferner nehmen wir den Abstand a als groß gegen die Wellenlänge λ an. Wir lokalisieren den Beobachtungspunkt P weit genug von den Quellen entfernt, sodass die Wellenfronten in P Ebenen sind (Abb. 9.2). Im Augenblick wollen wir nur linear polarisierte Wellen der Form E1 (r, t) = E01 cos (k1 · r − ωt + ε1 )

(9.2a)

E2 (r, t) = E02 cos (k2 · r − ωt + ε2 )

(9.2b)

und betrachten.

/

/

(a)

n vo ne be

se ng

u ng

wi

h Sc

Schw

Wellenfronten

ingun

gseb

ene v

on

Abb. 9.2: Wellen, die von zwei Punkten ausgehen und im Raum überlappen.

9 Interferenz

762

Aus Kapitel 3 wissen wir, dass die Bestrahlungsstärke in P gegeben ist durch   I = v E2 T . Da in unserem Zusammenhang nur relative Bestrahlungsstärken innerhalb desselben Mediums auftreten, wollen wir die Konstanten vorläufig vernachlässigen und setzen   I = E2 T .   Unter E2 T verstehen wir dabei natürlich den zeitlichen Mittelwert des Quadrats der elektrischen Feldstärke, E · E T . Entsprechend ist E2 = E · E , was nun bedeutet E2 = (E1 + E2 ) · (E1 + E2 ) und daher E2 = E21 + E22 + 2E1 · E2 .

(9.3)

Bilden wir auf beiden Seiten den zeitlichen Mittelwert, so ergibt sich für die Bestrahlungsstärke I = I1 + I2 + I12 , wobei

  I1 = E21 T ,   I2 = E22 T

(9.4)

(9.5) (9.6)

und I12 = 2 E1 · E2 T

(9.7)

ist. Den letzten Ausdruck bezeichnet man als Interferenzterm. Um diesen für unseren speziellen Fall auszuwerten, bilden wir E1 · E2 = E01 · E02 cos (k1 · r − ωt + ε1 ) × cos (k2 · r − ωt + ε2 )

(9.8)

oder, äquivalent, E1 · E2 = E01 · E02 [cos (k1 · r + ε1 ) cos ωt + sin (k1 · r + ε1 ) sin ωt] × [cos (k2 · r + ε2 ) cos ωt + sin (k2 · r + ε2 ) sin ωt] .

(9.9)

Wir erinnern uns, dass der zeitliche Mittelwert einer Funktion f (t) in einem Intervall T gegeben ist durch ˆ 1 t+T     f t dt . (9.10) f (t) T = T t

9.1 Allgemeine Betrachtungen

763

Die Periode τ harmonischer Funktionen beträgt 2π/ω und in dem hier betrachteten Fall ist T  τ . Der Koeffizient 1/T vor dem Integral hat dann den dominierenden Effekt. Ausmultiplizieren und Mitteln von Gleichung (9.9) liefert 1 E1 · E2 T = E01 · E02 cos (k1 · r + ε1 − k2 · r − ε2 ) , 2

  wobei wir uns zunutze gemacht haben (siehe Abschn. 3.3.1), dass cos2 ωt T = 12 ,  2  sin ωt T = 12 und cos ωt sin ωt T = 0 ist. Der Interferenzterm wird dann zu I12 = E01 · E02 cos δ ,

(9.11)

wobei δ = (k1 · r − k2 · r + ε1 − ε2 ) die Phasendifferenz ist, die sich aus der kombinierten Weglänge und der Anfangsdifferenz der Phasenwinkel ergibt. Sind E01 und E02 (und daher auch E1 und E2 ) zueinander senkrecht, so gilt I12 = 0 und I = I1 +I2 . Zwei solche orthogonalen P-Zustände überlagern einander zu einem R-, L-, P- oder E-Zustand, ohne dass sich die Flussdichteverteilung ändert. Die häufigste Situation, die wir im Folgenden betrachten, ist, dass E01 parallel zu E02 ist. Die Bestrahlungsstärke nimmt dann den Wert an, den wir bereits in der skalaren Behandlung (Abschn. 7.1) gefunden hatten. Unter diesen Bedingungen ist I12 = E01 E02 cos δ . Dies kann etwas bequemer formuliert werden, wenn wir berücksichtigen, dass   E2 I1 = E21 T = 01 2

(9.12)

und

  E2 I2 = E22 T = 02 2 ist. Der Interferenzterm wird dann zu I12 = 2 I1 I2 cos δ und für die Gesamtbestrahlungsstärke ergibt sich I = I1 + I2 + 2 I1 I2 cos δ .

(9.13)

(9.14)

In verschiedenen Punkten des Raumes kann die Bestrahlungsstärke in Abhängigkeit vom Wert von I12 (also in Abhängigkeit von δ) größer, kleiner oder gleich I1 + I2 sein. Bei cos δ = 1 ist eine maximale Bestrahlungsstärke erreicht: für δ = 0, ±2π, ±4π, . . . . (9.15) Imax = I1 + I2 + 2 I1 I2 In diesem Fall spricht man von vollständig konstruktiver Interferenz und der Phasenunterschied der beiden Wellen ist ein ganzzahliges Vielfaches von 2π. Die beiden Wellen

9 Interferenz

764

sind phasengleich. Bei 0 < cos δ < 1 sind die Wellen außer Phase, I1 +I2 < I < Imax , und es kommt zur konstruktiven Interferenz (Verstärkung). Ist δ = π/2, also cos δ = 0, so beträgt die Phasendifferenz der Wellen 90◦ , und es ist I = I1 + I2 . Bei 0 > cos δ > −1 spricht man von destruktiver Interferenz (Auslöschung), I1 + I2 > I > Imin . Eine minimale Bestrahlungsstärke ergibt sich bei einem Phasenunterschied von 180◦ (Berge und Täler überlagern einander), cos δ = −1 und (9.16) Imin = I1 + I2 − 2 I1 I2 . Diese vollständig destruktive Interferenz tritt auf bei δ = ±π, ±3π, ±5π, . . . . Ein weiterer, etwas spezieller, aber sehr wichtiger Fall tritt ein, wenn die Amplituden der beiden Wellen, die P in Abbildung 9.2 erreichen, gleich sind (also E01 = E02 ). Beide Quellen liefern dann denselben Beitrag zur Bestrahlungsstärke; wir setzen daher I1 = I2 = I0 . Gleichung (9.14) können wir nun wie folgt formulieren: δ . (9.17) 2 Daraus folgt unmittelbar Imin = 0 und Imax = 4I0 . Eine analoge Betrachtung hinsichtlich der Winkel zwischen den beiden Strahlenbündeln soll in Aufgabe 9.3 vorgenommen werden. I = 2I0 (1 + cos δ) = 4I0 cos2

Gleichung (9.14) gilt auch für Kugelwellen, die von S1 und S2 emittiert werden. Derartige Wellen kann man in der Form E1 (r1 , t) = E01 (r1 ) exp [i (kr1 − ωt + ε1 )]

(9.18a)

E2 (r2 , t) = E02 (r2 ) exp [i (kr2 − ωt + ε2 )]

(9.18b)

und

aufschreiben. Hier sind r1 und r2 die Radien der Kugelwellenfronten, die einander in P überlagern, und sie geben den jeweiligen Abstand der Quellen von P an. Es gilt dann δ = k (r1 − r2 ) + (ε1 − ε2 ) .

(9.19)

Die Flussdichte in der Umgebung von S1 und S2 ist sicherlich von Punkt zu Punkt verschieden, da sich (r1 − r2 ) ändert. Trotzdem ist gemäß dem Energieerhaltungssatz zu erwarten, dass der räumliche Mittelwert von I konstant und gleich dem Mittel von I1 + I2 bleibt. Folglich muss der räumliche Mittelwert von I12 null sein, wie es durch Gleichung (9.11) auch zum Ausdruck kommt, denn das Mittel der Kosinusfunktion ist tatsächlich null. (Für eine ausführlichere Diskussion dieses Themas sei auf Aufgabe 9.2 verwiesen.) Gleichung (9.17) darf angewendet werden, wenn der Abstand zwischen S1 und S2 klein ist im Vergleich zu r1 und r2 und wenn auch das Interferenzgebiet in diesem Sinne als klein angesehen werden kann. Man darf dann davon ausgehen, dass E01 und

9.1 Allgemeine Betrachtungen

765

E02 ortsunabhängig (konstant in dem kleinen betrachteten Gebiet) sind. Emittieren beide Quellen gleich stark, also E01 = E02 und I1 = I2 = I0 , so haben wir 1 [k (r1 − r2 ) + (ε1 − ε2 )] . 2 Maxima der Bestrahlungsstärke treten auf bei I = 4I0 cos2

δ = 2πm mit m = 0, ±1, ±2, . . . . Minima mit I = 0 findet man analog bei δ = πm mit m = ±1, ±3, ±5, . . . oder, anders geschrieben, m = 2m + 1. Mithilfe von Gleichung (9.19) lassen sich die beiden Ausdrücke für δ umschreiben. Für die Maxima ergibt sich dann (r1 − r2 ) = [2πm + (ε2 − ε1 )] /k ,

(9.20a)

und für die Minima   (r1 − r2 ) = πm + (ε2 − ε1 ) /k .

(9.20b)

Jede dieser Gleichungen definiert eine Schar von Flächen, von denen jede ein Rotationshyperboloid ist. Die Entfernungen zwischen den Scheitelpunkten der Hyperboloide sind durch die rechten Seiten der Gleichungen (9.20) gegeben. Die Brennpunkte liegen in S1 und S2 . Werden die Wellen phasengleich emittiert, so ist ε1 − ε2 = 0 und die Gleichungen (9.20) lassen sich wie folgt vereinfachen: (r1 − r2 ) = 2πm/k = mλ

(Maxima)

(9.21a)

und

1 (9.21b) (r1 − r2 ) = πm /k = m λ (Minima). 2 In Abbildung 9.3 a sind einige Flächen gezeigt, auf denen Maxima der Bestrahlungsstärke liegen. Die hellen und dunklen Streifen, die man auf einem Schirm sieht, der im Interferenzgebiet aufgestellt ist, heißen Interferenzstreifen (Abb. 9.3 b). Wenn der Schirm in Richung seiner Normalen weit weg von den Punktquellen verschoben wird (wobei seine Ebene parallel zur ursprünglichen Position bleibt), dann werden die Streifen viel gerader erscheinen. Das auf halbem Wege zwischen den Quellen gelegene helle Band nennt man Streifen nullter Ordnung (m = 0); es wird eingeschlossen von den Minima mit m = ±1, es folgen Maxima erster Ordnung (m = ±1), die ihrerseits von den Minima mit m = ±3 eingeschlossen werden usw. Da die Wellenlänge von sichtbarem Licht sehr klein ist, existieren auf beiden Seiten und in unmittelbarer Umgebung der Ebene mit m = 0 sehr viele Flächen, zu denen die kleinen Werte von m gehören. Bringt man einen Schirm senkrecht zur und in die

9 Interferenz

766

Nähe der genannten Ebene (m = 0), so erscheinen darauf zahlreiche nahezu parallele Streifen. In diesem Fall gilt die Näherung r1 ≈ r2 . Verschiebt man dann S1 und S2 in der vertikalen Ebene von Abbildung 9.3 b, also senkrecht zur Verbindungslinie S1 S2 , so werden die Streifen im Prinzip parallel zueinander verschoben. Zwei enge Spalte erzeugen eine große Anzahl einander exakt überlagernder Streifen, wodurch die Bestrahlungsstärke steigt, das mittlere Gebiet des von zwei Punktquellen erzeugten Musters ansonsten jedoch im Wesentlichen unverändert bleibt.

P

r1 r2

S1 m = –1

S2 m=2 m=0 m=1 (a)

S1

r1

P r2 S2

(b)

(c)

Abb. 9.3: (a) Hyperboloidflächen maximaler Bestrahlungsstärke für zwei Punktquellen. Bei r1 > r2 ist m positiv. (b) Die Verteilung der Maxima der Bestrahlungsstärke auf einer Ebene, die S1 und S2 enthält. (c) Die Verteilung des elektrischen Feldes in der in (b) gezeigten Ebene. Die hohen Spitzen gehören zu den Punktquellen S1 bzw. S2 . Beachten Sie, dass die Quellen in (b) und (c) unterschiedlich weit voneinander entfernt sind. (Foto mit frdl. Genehmigung von The Optics Project, Mississippi State University.)

9.1.1 Nahfeld / Fernfeld Um die Rechnung möglichst einfach zu halten, wird die Analyse des Streifenmusters gewöhnlich für eine Position durchgeführt, die hinreichend weit von den beiden Punktquellen entfernt ist. In diesem Gebiet können die interferierenden Wellen als eben angenommen werden. Dort herrscht die cos2 -Verteilung der Bestrahlungsstärke, und man sieht eine Reihe von ziemlich geraden, parallelen, hellen und dunklen Streifen (Abb. 9.4). Das Gesamtmuster behält seine Form und expandiert einfach, wenn der Schirm an eine noch weiter von den Punktquellen entfernte Position verschoben wird. Dieses Gebiet ist das so genannte Fernfeld.

9.2 Interferenzbedingungen

767 Abb. 9.4: cos2 -Streifen, die mit der DoppelstrahlInterferenz im Fernfeld verbunden sind. Die oszillierende Kurve stellt eine gewisse Idealisierung dar, denn die Streifen verlieren am rechten und linken Rand an Kontrast.

Die beiden Wellen waren ursprünglich sphärisch und erinnern nur in großen Entfernungen von ihren Quellen an ebene Wellen. Natürlich nehmen die Amplituden der sphärischen Wellen mit der zurückgelegten Distanz ab. Nachdem sie das Fernfeld erreicht haben, haben sich die Wellen weit genug fortgepflanzt, sodass kleine Differenzen (r1 −r2 ) in ihren zurückgelegten Wegen keine Auswirkungen auf ihre Amplituden haben. Mit anderen Worten, wenn P weit weg ist, kommen die beiden Wellen dort mit nahezu der gleichen Amplitude an. Wenn eine Welle die Entfernung 1 000 000 × λ zurückgelegt hat und die andere die Entfernung 1 000 000,5 × λ, dann werden sich ihre Amplituden kaum unterscheiden, obwohl die Wellen um π rad phasenverschoben sind. Es ist also ausschließlich die relative Phase der beiden Wellen, was das Interferenzmuster im Fernfeld bestimmt [Gl. (9.21)], und daher nehmen wir die Amplituden als gleich an. Dies ist in dem näher an den Quellen liegenden Gebiet nicht mehr der Fall. In diesem Nahfeld können die beiden Wellen, wenn sie an einem bestimmten Punkt ankommen, sowohl eine Phasendifferenz als auch eine beträchtliche Amplitudendifferenz haben. Das hat zur Folge, dass die Analyse komplizierter und das Interferenzmuster detailreicher wird (Abb. 9.5). Die Abbildung zeigt die Bestrahlungsstärke, die einen kleinen räumlichen Bereich im Abstand a = 4λ hinter den Punktquellen füllt. Wie Sie sehen, haben die Muster in den Abständen 2λ und 4λ, was ganz dicht hinter den Quellen ist, ein völlig anderes Aussehen als die cos2 -Verteilung im Fernfeld. Wir werden auf dieses Thema zurückkommen, wenn wir das Experiment von Young behandeln.

9.2

Interferenzbedingungen

Wenn zwei Strahlen interferieren und dabei ein stabiles Muster erzeugen sollen, müssen sie nahezu dieselbe Frequenz haben. Ein signifikanter Unterschied der Frequenzen würde zu schnell veränderlichen, zeitabhängigen Phasenunterschieden führen, wodurch sich wiederum I12 über dem Erfassungszeitraum zu null ausmitteln würde (Abschn. 7.1). Emittieren jedoch beide Quellen weißes Licht, so interferieren die roten Komponenten mit den roten, die blauen Komponenten mit den blauen usw. Eine Vielzahl ähnlicher, leicht gegeneinander verschobener, überlappender monochromatischer Muster ergibt dann ein insgesamt weißes Lichtmuster. Es ist nicht so scharf und ausgeprägt wie ein quasimonochromatisches Muster, aber weißes Licht erzeugt durchaus beobachtbare Interferenzen.

9 Interferenz

768

S1

S2

Abb. 9.5: Eine schematische Darstellung von Streifenmustern (Abbildungen der Bestrahlungsstärke) in der Nähe zweier Punktquellen S1 und S2 , die den Abstand a = 4λ voneinander haben. Die Kurven entsprechen den Abständen a/2, a, 2a, 4a und 8a von der vertikalen Aperturebene.

Die deutlichsten Muster entstehen, wenn die interferierenden Wellen gleiche oder nahezu gleiche Amplituden haben. Die mittleren Gebiete der dunklen und hellen Zonen gehören dann zur vollständig destruktiven bzw. konstruktiven Interferenz, wodurch ein maximaler Kontrast entsteht. Damit ein Muster aus solchen Zonen beobachtet werden kann, müssen die beiden Quellen nicht unbedingt phasengleich emittieren. Ein etwas verschobenes, aber sonst identisches Interferenzmuster entsteht, wenn eine Phasendifferenz zwischen den Quellen besteht, die allerdings konstant sein muss. Solche Quellen sind kohärent.2

9.2.1 Zeitliche und räumliche Kohärenz Wir erinnern uns, dass konventionelle quasimonochromatische Quellen aufgrund der diskontinuierlichen Natur des Emissionsprozesses ein Gemisch aus Photonen-Wellenzügen emittieren. An jedem beleuchteten Ort im Raum wirkt ein Feld, das regelmäßig oszilliert (etwa eine Million Zyklen innerhalb von weniger als 10 ns), bevor es in zufälliger Weise die Phase ändert. Dieses Intervall, in dem die Lichtwelle einer Sinusschwingung ähnelt, ist ein Maß für ihre zeitliche Kohärenz. Die durchschnittliche Zeitdauer, in der die Lichtwelle in einer vorhersagbaren Weise schwingt, haben wir bereits als die Kohärenzzeit der Strahlung eingeführt. Je länger die Kohärenzzeit, desto größer ist die zeitliche Kohärenz der Quelle. 2

Kapitel 12 befasst sich mit der Untersuchung der Kohärenz, sodass wir hier nur die Aspekte kurz erläutern, die von unmittelbarer Bedeutung sind.

9.2 Interferenzbedingungen

769

An einem festen Punkt im Raum erscheint die vorbeilaufende Lichtwelle zwischen zwei abrupten Phasenänderungen jeweils eine kurze Zeit lang sinusförmig. Die korrespondierende räumliche Ausdehnung, über die die Lichtwelle in einer regelmäßigen, vorhersagbaren Weise oszilliert, ist die Kohärenzlänge [Gl. (7.64)]. Es ist, wie bereits betont, zweckmäßig, sich Licht als mehr oder weniger sinusförmige, hinsichtlich der Phase unkorrelierte Wellenzüge der durchschnittlichen Länge Δlc vorzustellen. Wie Sie wissen, ist die zeitliche Kohärenz ein Maß für die spektrale Reinheit. Wäre das Licht ideal monochromatisch, so wäre die Welle exakt sinusförmig und ihre Kohärenzlänge unendlich. Reale Quellen erfüllen dieses Kriterium nicht, sie emittieren stets einen Bereich an Frequenzen, der allerdings recht schmal sein kann. Eine gewöhnliche Gasentladungslampe in einem Labor beispielsweise besitzt eine Kohärenzlänge von einigen Millimetern, während bestimmte Laser Kohärenzlängen im zweistelligen Kilometerbereich erzielen. Abbildung 9.6 fasst einige dieser Ideen zusammen. In (a) ist die von einer Punktquelle ausgehende Welle monochromatisch und weist vollständige zeitliche Kohärenz auf. Was im Punkt P1 geschieht, passiert einen Moment später auch in P2 und noch später auch in P3 – alles ist genau vorhersagbar. Wir können durch Beobachtung von P4 bestimmen, was zur selben Zeit in P1 geschieht. Jeder Punkt der Welle ist korreliert; die Kohärenzzeit ist unendlich. Im Gegensatz dazu zeigt Abbildung 9.6 b eine Punktquelle, die ihre Frequenz von einem Moment zum anderen ändert. Nun besteht keine Korrelation mehr zwischen Punkten, die wie P1 und P4 weit voneinander entfernt sind. Den Wellen fehlt die völlige zeitliche Kohärenz, die in (a) dargestellt ist, doch sie sind nicht völlig unvorhersagbar; das Verhalten an Punkten, die einander benachbart sind wie P2 und P3 , ist etwas korreliert. Dies ist ein Beispiel für teilweise zeitliche Kohärenz, und ein Maß für diese ist die Kohärenzlänge – die kürzeste Entfernung, über die die Schwingung sinusförmig ist, d. h. als Entfernung, über die die Phase vorhersagbar ist.

(a)

(b)

Abb. 9.6: (a) Die Wellen sind zeitlich und räumlich vollständig kohärent. (b) Die Wellen sind räumlich vollständig, zeitlich hingegen nur teilweise kohärent.

9 Interferenz

770

Beachten Sie, dass in beiden Teilen der Abbildung 9.6 das Verhalten der Wellen in den Punkten P1 , P2 und P3 vollständig korreliert ist. Jeder der beiden Wellenströme entsteht in einer einzelnen Punktquelle und P1 , P2 und P3 liegen in beiden Fällen auf derselben Wellenfront; die Schwingung in jedem dieser lateral getrennten Punkte ist in Phase und bleibt in Phase. Beide Wellen weisen deshalb vollständige räumliche Kohärenz auf. Im Unterschied dazu stellen wir uns nun eine Quelle vor, die räumlich ausgedehnt ist, das heißt, aus vielen räumlich verteilten Punktquellen (monochromatisch mit der Periode τ ) aufgebaut ist, wie in Abbildung 9.7 dargestellt. Könnten wir das Wellenmuster alle τ Sekunden aufnehmen, wären die Bilder identisch; jede Wellenfront wäre durch eine identische ersetzt, die eine Wellenlänge zurückliegt. Die Schwingungen in P1 , P2 und P3 sind korreliert, und die Welle ist zeitlich kohärent.

P1

P1

P2

P3

P2

Abb. 9.7: Sind mehrere (hier vier) Punktquellen weit voneinander entfernt, so ist die resultierende Welle trotzdem kohärent. Ändern die Quellen jedoch ihre Phase rasch und zufällig, so geht entsprechend auch die zeitliche und räumliche Kohärenz verloren.

Um nun der Wirklichkeit etwas näher zu kommen, stellen wir uns vor, jede Punktquelle ändere ihre Phase schnell und willkürlich und sende dabei 10 ns lange sinusförmige Wellenzüge aus. Die Wellen in Abbildung 9.7 ändern dann in völlig chaotischer Weise ihre Phase, verschieben und vereinigen sich, und die Schwingungen in P1 , P2 und P3 sind nur weniger als 10 ns lang korreliert. Das Wellenfeld in zwei auch nur wenig von einander entfernten lateralen Punkten wie P1 und P2 ist fast vollständig unkorreliert (in Abhängigkeit von der Größe der Quelle). Beispiele für ein solches Chaos sind das Licht einer Kerzenflamme und das Sonnenlicht. Zwei gewöhnliche Quellen (Glühlampen) liefern weniger als Δtc lang eine konstante relative Phase, sodass sich die Interferenzmuster räumlich in einer extrem großen Geschwindigkeit und in zufälliger Weise verschieben und sich dadurch ausmitteln, was sie praktisch unbeobachtbar macht. Vor der Erfindung des Lasers galt die Regel, dass zwei voneinander unabhängige Lichtquellen niemals ein beobachtbares Interferenzmuster liefern können. Die Kohärenzzeit von Lasern kann jedoch beträchtlich sein,

9.2 Interferenzbedingungen

771

und die Interferenz unabhängiger Laser ist beobachtet und fotografiert worden.3 Die verbreitetste Lösung dieses Problems mit gewöhnlichen thermischen Quellen besteht darin, aus einer Quelle zwei kohärente Sekundärquellen zu erzeugen (z. B. mithilfe eines Doppelspalts.)

9.2.2 Die Fresnel-Arago-Gesetze In Abschnitt 9.1 gingen wir davon aus, dass die beiden einander überlagernden Wellen linear polarisiert und parallel sind. Die abgeleiteten Formeln lassen sich jedoch auch auf kompliziertere Situationen anwenden und die Behandlung ist vollkommen unabhängig vom Polarisationszustand der Wellen. Um uns dies vor Augen zu führen, erinnern wir uns, dass sich jeder Polarisationszustand aus zwei orthogonalen PZuständen zusammensetzen lässt. Im Falle natürlichen Lichts sind diese Zustände inkohärent, aber dies bringt keine besondere Schwierigkeit mit sich. E1

E⊥1

k1

k1 E1

E⊥2

E2

k2

k2

E2 (b)

(a) k1 E1 E2

k2

(c) Abb. 9.8: Interferenz von polarisiertem Licht.

Nehmen wir an, dass die Ausbreitungsvektoren aller Wellen in einer Ebene liegen. Die beiden P-Komponenten können wir dann, je nach ihrer Lage bezüglich dieser Ebene, mit E || und E⊥ bezeichnen (Abb. 9.8 a). Jede ebene Welle, ob polarisiert oder 3

G. Magyar und L. Mandel, „Interference fringes produced by superposition of two independent maser light beams“, Nature 198 (1963) 255; F. Louradour, F. Reynaud, B. Colombeau und C. Froehly, „Interference fringes between two separate lasers“, Am. J. Phys. 61 (1993) 242; L. Basano und P. Ottonello, „Interference fringes from stabilized diode lasers“, Am. J. Phys. 68 (2000) 245; E. C. G. Sudarshan und T. Rothman, „The two-slit interferometer reexamined“, Am. J. Phys. 59 (1991) 592.

772

9 Interferenz

nicht, lässt sich somit in der Form (E || + E⊥ ) aufschreiben. Die Wellen (E || 1 + E⊥1 ) und (E || 2 + E⊥2 ), ausgesendet von zwei identischen, kohärenten Quellen, sollen einander nun in einem bestimmten Gebiet des Raumes überlagern. Die entstehende Flussdichteverteilung besteht dann aus zwei unabhängigen oder,  genauer gesagt,   einander überlagerten Interferenzmustern (E || 1 + E || 2 )2 T und (E⊥1 + E⊥2 )2 T . Die Gleichungen, die wir im vorangegangenen Abschnitt speziell für linear polarisiertes Licht entwickelt haben, sind demnach für Licht in beliebigem Polarisationszustand einschließlich natürlichem Licht anwendbar. E⊥1 und E⊥2 sind stets parallel zueinander, E || 1 und E || 2 , die beide in der Bezugsebene liegen, dagegen nicht. Letztere sind nur dann parallel, wenn die beiden Strahlenbündel selbst parallel sind (d. h. k1 = k2 ). Die dem Interferenzprozess eigene vektorielle Natur, die durch die Skalarprodukt-Darstellung von I12 in Gleichung (9.11) zum Ausdruck kommt, kann nicht ignoriert werden. In vielen praktischen Situationen verlaufen die Strahlen nahezu parallel zueinander, sodass die skalare Theorie vollkommen ausreicht. Selbst dann ist jedoch eine gewisse Vorsicht geboten, und man sollte man die Abbildungen 9.8 b und 9.8 c nicht außer Acht lassen. Sie zeigen Momentaufnahmen kurz vor der Überlagerung zweier kohärenter, linear polarisierter Wellen. In Abbildung 9.8 b sind die Strahlenbündel nicht parallel, die optischen Vektoren dagegen sind es, weshalb sich trotzdem eine Interferenz ergibt. In Abbildung 9.8 c stehen die optischen Vektoren aufeinander senkrecht, und I12 wird null – in diesem Fall selbst dann, wenn die Strahlenbündel parallel wären. Die Bedingungen, unter denen es zur Interferenz polarisierter Lichtstrahlen kommt, wurden ausführlich von Fresnel und Arago untersucht. Deren Ergebnisse, zusammengefasst in den folgenden Fresnel-Arago-Gesetzen, fassen einige der obigen Betrachtungen zusammen: 1. Zwei orthogonale, kohärente P-Zustände können nicht interferieren: I12 ist stets null, und es treten keine Interferenzstreifen auf. 2. Zwei parallele, kohärente P-Zustände interferieren in derselben Weise wie natürliches Licht. 3. Die beiden orthogonalen P-Komponenten von natürlichem Licht können nicht unter Bildung eines beobachtbaren Streifenmusters interferieren, selbst dann nicht, wenn sie durch Drehung gleich ausgerichtet werden. Dies ist verständlich, da die P-Zustände inkohärent sind.

9.3

Interferometer mit Wellenfrontaufspaltung

Das Hauptproblem bei der Erzeugung von Interferenzen sind die Lichtquellen: Sie müssen kohärent sein. Aber voneinander getrennte, unabhängige, hinreichend kohärente Lichtquellen gibt es (abgesehen vom modernen Laser) nicht! Einen Ausweg aus diesem Dilemma fand erstmals Thomas Young vor 200 Jahren mit seinem klassischen

9.3 Interferometer mit Wellenfrontaufspaltung

773

Doppelspaltexperiment: Young trennte eine einzige Wellenfront in zwei kohärente Teile, die er miteinander zur Interferenz brachte.

9.3.1 Das youngsche Doppelspaltexperiment 1665 beschrieb Grimaldi ein Experiment, mit dem er die Wechselwirkung zweier Lichtstrahlen untersucht hatte. Dazu hatte er Sonnenlicht durch zwei eng beieinander liegende Löcher in einem undurchsichtigen Schirm in einen abgedunkelten Raum fallen lassen. Wie bei einer Camera obscura (Abschn. 5.7.6) erzeugte jedes Loch ein Abbild der Sonne auf einer entfernten weißen Fläche. Grimaldi wollte zeigen, dass dort, wo die beiden Lichtkreise einander überlappen, dunkle Zonen entstehen können. Der Forscher konnte zu dieser Zeit noch nicht verstehen warum, doch sein Experiment musste scheitern, weil der Durchmesser der primären Lichtquelle, der Sonne, mit 32 Bogenminuten so groß ist, dass die räumliche Kohärenz des Lichts niemals ausreicht, um die beiden Löcher simultan völlig gleichmäßig zu beleuchten. Um dies zu erreichen, dürfte der Sonnendurchmesser höchstens einige Bogensekunden betragen.

Abb. 9.9: Am Loch wird eine räumlich, aber nicht zeitlich kohärente Welle gestreut.

Hundertvierzig Jahre später nahm Thomas Young die Versuche, die Wellennatur des Lichts nachzuweisen, wieder auf. Geleitet wurde er dabei vom Phänomen der Schwebung, das man als Überlagerung zweier Schallwellen erklärte. Young wiederholte Grimaldis Experiment, ließ aber diesmal das Licht zunächst durch ein einzelnes Loch fallen, das er als primäre Lichtquelle benutzte (Abb. 9.9). So erzeugte er ein räumlich kohärentes Strahlenbündel, mit dem er beide Öffnungen in gleicher Weise beleuchten konnte. Die Anordnung ist in Abbildung 9.10 schematisch dargestellt. Hier trifft Sonnenlicht auf den ersten undurchsichtigen Schirm und ein Lichtkegel tritt aus dem kreisrunden Loch aus. Je kleiner das Loch, umso stärker wird das Licht aufgespreizt und umso größer ist die beleuchtete Scheibe, die die Grundfläche des Kegels bildet. Außerdem ist die räumliche Kohärenz des auf den zweiten Schirm (den Blendenschirm) fallenden Lichts umso größer, je kleiner das Loch ist. Diese Lichtscheibe wird so groß gemacht, dass die sich ausbreitenden Segmente sphärischer Wellen

9 Interferenz

774

Beo sch bachtu irm ng sBl e sch nden irm -

Abb. 9.10: Der youngsche Doppelspaltversuch, bei dem die aus zwei kleinen, kreisrunden Löcher tretenden Lichtkegel untersucht werden. Die Wellen fallen von links auf einen Schirm, der ein einzelnes Loch hat.

gleichzeitig beide kreisförmige Löcher beleuchten. Aus diesen Löchern strömen dann zwei kohärente Lichtkegel in Richtung des Beobachtungsschirms. Je näher die beiden Blenden beieinander liegen, umso stärker überlappen sich die Lichtkegel auf dem Beobachtungsschirm. In diesem Überlappungsbereich interferieren die beiden Wellen und erzeugen ein Muster aus dunklen und hellen Streifen. Die Energie bleibt dabei selbstverständlich erhalten – sie konzentriert sich in den hellen Gebieten. Heute kennen wir die zugrundeliegenden physikalischen Prinzipien und verwenden statt runden Löchern schmale Spaltöffnungen, durch die wesentlich mehr Licht fällt (Abb. 9.11 a). Wir betrachten eine hypothetische monochromatische, ebene Welle, die auf einen langen, schmalen Spalt fällt. An diesem Primärspalt wird das Licht unter allen Winkeln in Vorwärtsrichtung gebeugt, sodass eine Zylinderwelle entsteht. Diese wiederum fällt auf zwei parallele, schmale, nah beieinander liegende Spalte S1 und S2 , eine Situation, die dreidimensional in Abbildung 9.11 a gezeigt ist. Wenn Symmetrie vorliegt, so sind die Segmente der Primärwellenfront, die an den beiden Spalten ankommen, exakt phasengleich und die Spalte werden zu zwei kohärenten Sekundärquellen. Wir können dann davon ausgehen, dass es stets zur Interferenz kommt, wenn die von S1 und S2 ausgehenden Wellen einander überlagern (vorausgesetzt, die Differenz der optischen Weglängen ist geringer als die Kohärenzlänge cΔtc ). Die Abbildungen 9.11 a – c entsprechen der klassischen Versuchsanordnung von Young, auch wenn es davon noch andere Varianten gibt. Heutzutage kommt man meist ohne den ersten Schirm aus und die Öffnungen werden in der Regel direkt mit ebenen Wellen aus einem Laser beleuchtet (Abb. 9.11 f). In einer realen Situation ist der Abstand zwischen den Schirmen Σa und Σo in Abbildung 9.11 c sehr groß gegen den Abstand a zwischen den beiden Spaltöffnungen (der Faktor beträgt einige Tau-

9.3 Interferometer mit Wellenfrontaufspaltung

775

max min max min max min max min max (a)

(b)

(c)

Abb. 9.11: Das youngsche Doppelspaltexperiment. (a) Zylinderwellen überlagern einander hinter dem Blendenschirm. (b) Überlappende Wellen mit Bergen und Tälern. Die Maxima und Minima liegen entlang nahezu gerader Hyperbeln. (c) Die Geometrie der youngschen Versuchsanordnung. (Fortsetzung auf S. 776)

send), und sämtliche Streifen entstehen in unmittelbarer Umgebung des Mittelpunkts O des Schirms. Die optische Weglängendifferenz zwischen den Strahlen entlang S1 P und S2 P kann in guter Näherung bestimmt werden, indem man das Lot von S2 auf S1 P fällt. Diese Differenz ist gegeben durch       S1 B = S1 P − S2 P (9.22) oder   S1 B = r1 − r2 .

9 Interferenz

776

(d)

(e)

Abb. 9.11: (Fortsetzung) (d) Ein Weglängenunterschied von einer Wellenlänge entspricht m = ±1 und dem Maximum erster Ordnung. (e) (Foto mit frdl. Genehmigung von M. Cagnet, M. Francon und J. C. Thierr: Atlas optischer Erscheinungen, Springer Verlag, Berlin-Heidelberg-New York 1962.)

Wir fahren mit dieser Näherung fort, setzen (r1 − r2 ) = a sin θ (siehe Aufgabe 9.21) und erhalten r1 − r2 ≈ aθ

(9.23)

wegen θ ≈ sin θ. Beachten Sie, dass θ≈

y s

(9.24)

ist, daher gilt r1 − r2 ≈

a y. s

(9.25)

Gemäß Abschnitt 9.1 tritt konstruktive Interferenz auf, wenn r1 − r2 = mλ

(9.26)

ist. Aus den beiden letzten Ausdrücken ergibt sich ym ≈

s mλ , a

m = 0, ±1, ±2, . . . ,

(9.27)

für die Position des m-ten hellen Streifens auf dem Schirm, wenn wir das Maximum in 0 als nullten Streifen zählen. Die Winkelposition erhält man durch Einsetzen von Gleichung (9.27) in Gleichung (9.24), θm =

mλ . a

(9.28)

9.3 Interferometer mit Wellenfrontaufspaltung

777

Diese Beziehung ergibt sich auch unmittelbar aus Abbildung 9.11 c. Für das Interferenzmaximum m-ter Ordnung sollte der Abstand r1 − r2 genau m volle Wellenlängen betragen. Aus dem Dreieck S1 S2 B folgt daher a sin θm = mλ

(9.29)

oder θm ≈ mλ/a . Der Abstand der Streifen auf dem Schirm kann direkt aus Gleichung (9.27) abgeleitet werden. Zwei aufeinander folgende Maxima haben voneinander die Entfernung ym+1 − ym ≈ oder Δy ≈

s s (m + 1) λ − mλ a a s λ. a

(9.30)

Offensichtlich sind rote Streifen breiter als blaue. Da das Muster jenem entspricht, das sich bei der Überlagerung zweier Kugelwellen ergibt (zumindest im Bereich mit r1 ≈ r2 ), können wir Gleichung (9.17) anwenden. Unter Verwendung der Phasendifferenz δ = k (r1 − r2 ) lässt sich Gleichung (9.17) wie folgt umschreiben: I = 4I0 cos2

k (r1 − r2 ) . 2

Voraussetzung dabei ist natürlich, dass die Wellen kohärent sind und die Bestrahlungsstärken I0 übereinstimmen. Mit r1 − r2 ≈ ya/s erhalten wir für die resultierende Bestrahlungsstärke I = 4I0 cos2

yaπ . sλ

(9.31)

Wie aus Abbildung 9.12 ersichtlich, ist der Abstand zwischen aufeinanderfolgenden Maxima gleich dem durch Gleichung (9.30) gegebenen Δy.

9 Interferenz

778

0

kleines a

Ab st de and n S zw pa isc lte he n, n

Bestrahlungsst¨arke

(a)

0 0 Absta

nd vom

(b)

zentra

len M

aximu

m,

großes a

(c)

Abb. 9.12: (a) Die idealisierte Bestrahlungsstärke in Abhängigkeit vom Abstand. (b) Der Abstand der Streifen, Δy, ist umgekehrt proportional zum Abstand der Spalte, wie man aus den Prinzipien der Fourier-Analyse auch erwarten sollte; erinnern Sie sich an die inverse Natur der räumlichen Intervalle und der Raumfrequenzintervalle. (c) Mit zunehmendem Spaltabstand werden die Streifen schmaler. Mit wachsender Wellenlänge werden die Streifen breiter. (Quelle: A. B. Bartlett, University of Colorado, und B. Mechtly, Northeast Missouri State University. Genehmigter Nachdruck aus Am. J. Phys. 62 (1994) 6, American Association of Physics Teachers.)

Beispiel 9.1 Zwei parallele, schmale horizontale Spalte in einem lichtundurchlässigen vertikalen Schirm haben einen Abstand von 2,644 mm voneinander. Die Spalte werden direkt mit gelben ebenen Wellen aus einer gefilterten Entladungslampe beleuchtet. Auf einem im Abstand von 4,5 m vom Blendenschirm aufgestellten Beobachtungsschirm bilden sich horizontale Streifen. Das Zentrum des fünften hellen Bandes liegt 5,0 mm über dem Zentrum des zentralen hellen Bandes (nullte Ordnung). (a) Bestimmen Sie die Wellenlänge des Lichts in Luft. (b) Wo würde der fünfte Streifen erscheinen, wenn der gesamte Raum mit klarem Sojaöl (n = 1,4729) gefüllt wäre?

9.3 Interferometer mit Wellenfrontaufspaltung

779

Lösung (a) Gegeben ist y5 = 5,0 mm und gemäß Gleichung (9.27) ist s ym ≈ mλ0 , a wobei die Werte s = 4,5 m und a = 2,644 mm gegeben sind, während λ0 gesucht ist. Wir erhalten λ0 =

(2,644 × 10−3 m)(5,0 × 10−3 m) ay5 = = 587,56 nm . s5 (4,5 m)5

(b) Wenn der Raum mit Öl gefüllt ist, nimmt die Wellenlänge ab, was zur Folge  , näher zum Zentrum der Anordnung hat, dass die neue Position des Streifens, ym rückt. Es gilt   λ0 ym s  = ym = m a n n und 5,0 × 10−3 m = 3,395 mm . y5 = 1,4729 Eine praktische Frage tritt auf, wenn das Experiment tatsächlich durchgeführt wird. Wenn ein Laser direkt auf die Spalte gerichtet wird, ist der Strahl sehr schmal, und das resultierende Muster ist eher eine Reihe von hellen cos2 -Flecken als ein System von ausgedehnten Streifen. Das kann noch verbessert werden, wenn man dem Strahl gestattet, sich natürlich über eine Distanz von vielen Metern auszubreiten, bevor die Spalte voll beleuchtet werden. In einem kleineren Raum kann man zwei Linsen verwenden, um einen Laserstrahlaufweiter (ein umgekehrtes galileisches Fernrohr) zu bilden (Abb. 9.13). Blendenschirm

Laserstrahl

Abb. 9.13: Ein Laserstrahlaufweiter. Diese Anordnung kann zur Beleuchtung von jeder Art von Blenden verwendet werden, um die Phänomene Interferenz und Beugung in einem begrenzten Raum zu demonstrieren.

Laserlicht ist so fantastisch kohärent, dass jeder Fingerabdruck und jedes Staubkorn auf einer Linse störende Streifen erzeugen kann. Vermeiden lässt sich dies, indem

9 Interferenz

780

man die in Abbildung 9.14 gezeigte, bewährte Anordnung benutzt. Dies ist wahrscheinlich die beste Vorgehensweise, wenn Sie nahezu perfekte Streifen wie jene in Abbildung 9.11 e sehen wollen.

L1

Entladungslampe Filter

Linse 1

L2

Blendenschirm

Linse 2

Beobachtungsschirm

Abb. 9.14: Geeigneter Aufbau für die Beobachtung von Interferenzstreifen mit einer Nicht-Laserquelle.

Amplitude des elektrischen Feldes und Zeiger Wir wollen nun untersuchen, wie die elektromagnetischen Elementarwellen sich zu einem resultierenden elektrischen Feld summieren, das auf dem Beobachtungsschirm von Punkt zu Punkt variiert. Abbildung 9.15 a zeigt Elementarwellen/Strahlen, die die beiden Spalte unter einem bestimmten Winkel θ verlassen. Anschließend gehen sie entweder durch eine große Sammellinse und laufen auf einem Schirm in der Brennebene zusammen, oder sie treffen sich in einem Punkt P auf einem weit entfernten Beobachtungsschirm. In jedem Fall nehmen wir an, dass die Elementarwellen, nachdem sie die gleiche optische Weglänge zurückgelegt haben, zusammen am Punkt P ankommen, wo sie eine vernachlässigbar kleine Amplitudendifferenz haben. Das heißt, ihre Amplituden E01 und E02 sind im Wesentlichen gleich. Die Resultierende ist daher allein durch die Differenz der Phasen der überlagerten Elementarwellen bestimmt. Die Wegdifferenz zwischen den beiden Elementarwellen (wie in Abb. 9.11 c ist a sin θ, und das entspricht einer Wellenlängendifferenz von a sin θ/λ und einer Doppelspalt-Phasendifferenz von δ2 = 2π(a sin θ)/λ. Dies ist die Phasendifferenz zwischen den beiden Zeigern. Es sei daran erinnert, dass auch bei kleinem θ die Phasendifferenz zwischen den Elementarwellen groß sein kann. Um die Feldamplitude zu zeichnen, müssen wir den Betrag des E-Feldes bestimmen und herausfinden, ob das Feld positiv oder negativ ist. Dazu nehmen wir die optische Weglänge vom Zentrum des Blendenschirms bis P als Referenz. Würde eine

9.3 Interferometer mit Wellenfrontaufspaltung (a)

781

(b)

= 2 p l a

sin

q

E0(q) 2E01 1.41E01 90°

/2

d

2

a

2 le el enz 1 .-w er lle El Ref we .l E q

d

2

0

45° d

c

180° 135° d2 /2 f g

e

1.41E01 2E01

(c)

E0 = +2E01 1

2

E01 E01

(d)

d2 /2 = 0

2

Referenz

d2 /2

1

90°

d2 /2

2

(e) E0 = 0 1

E0

d2 /2

1

2

(f)

135°

p/4

(g) 2 180°

E0 2

2 d2

E0 = –2E01

1

d2 /2 1

1

p

d2 /2 = 180°

Abb. 9.15: Das bei der Doppelspaltinterferenz generierte elektrische Feld. (a) Doppelspaltgeometrie. (b) Elektrisches Feld. In (c) bis (g) ist die Zeigeraddition illustriert.

Elementarwelle diese optische Weglänge zurücklegen, wäre ihr Zeiger positiv. In der Vorwärtsrichtung (θ = 0) kommen die beiden Elementarwellen am Schirm in Phase an und haben die gleiche optische Weglänge zurückgelegt. Die beiden zugehörigen Zeiger haben die gleiche Richtung (Abb. 9.15 c), sodass ihre Summe ein Maximum für die Amplitude, 2E01 ergibt (Abb. 9.15 b). Dies ist der größte mögliche Wert für die Amplitude und er ist positiv. Betrachten wir nun den nichtaxialen Strahl, der unter einem kleinen Winkel θ auftrifft (Abb. 9.15 a). Die Elementarwelle 1 legt einen längeren optischen Weg zurück als den Referenzpfad; sie liegt gegenüber der Referenzwelle um δ2 /2 zurück, d. h., ihr Zeiger wird im Uhrzeigersinn aus der positiven Referenzrichtung gedreht. Inzwischen nimmt die Elementarwelle 2 mit dem Winkel θ einen kürzeren optischen Weg zum Schirm als den Referenzpfad, sodass der Zeiger 2 um δ2 voraus ist. Mit anderen Worten, Zeiger 2 wird gegen den Uhrzeigersinn (bezüglich der Referenzrichtung) um δ2 gedreht, während Zeiger 1 im Uhrzeigersinn (bezüglich der Referenzrichtung) um δ2 gedreht wird. Die Folge ist eine Phasenverschiebung von δ2 /2 = π(a sin θ)/λ gegenüber der Referenzrichtung für jeden der beiden Zeiger. Diese Zeiger werden dann direkt addiert. Aus Symmetriegründen zeigt die resultierende Zeigeramplitude (E0 , grau gezeichnet) immer entweder nacht rechts (+) oder nach links (−). Es

9 Interferenz

782

ist üblich, von einer „negativen Amplitude“ zu sprechen, wenn ein Zeiger in die der positiven Referenzrichtung entgegengesetzte Richtung zeigt, obwohl der Begriff „Amplitude“ normalerweise als eine positive Größe definiert ist. In Abbildung 9.15 b ist δ2 /2 = π/4, und daher wird Zeiger 1 gegenüber der Referenzrichtung um π/4 im Uhrzeigersinn gedreht, und Zeiger 2 wird gegenüber der Referenzrichtung um π/4 entgegen dem Uhrzeigersinn gedreht. Der resultierende Zeiger ist dann positiv und gleich 1,414E01 . Er ist in Abbildung 9.15 b im Winkel von 45◦ eingezeichnet. Wenn die Zeiger nicht kolinear sind, dann bilden sie gleichschenklige Dreiecke, und es gilt E0 = E01 cos δ2 /2 + E02 cos δ2 /2 sowie wegen E01 = E02 allgemein E0 = 2E01 cos δ2 /2 . Mit δ2 /2 = π(a sin θ)/λ haben wir für kleine θ ≈ sin θ, wobei nach Gleichung (9.24) θ = y/s gilt, δ/2 = yaπ/sλ und E0 = 2E01 cos(yaπ/sλ) . Da die Bestrahlungsstärke proportional zum Quadrat der Amplitude des elektrischen Feldes ist, führt das Quadrieren dieses Ausdrucks für E0 auf Gleichung (9.31); siehe auch Abbildung 9.12. In Abbildung 9.15 e ist der Winkel θ so, dass die Phasenverschiebung gegenüber dem Referenzwert δ2 /2 für jeden Zeiger ±π/2 ist. Das bedeutet, dass die aus dem oberen Spalt kommende Elementarwelle der aus dem unteren Spalt kommenden um δ2 = π voraus ist. Die Zeiger sind folglich entgegengesetzt; Elementarwelle 1 liegt gegenüber der Referenzwelle eine viertel Wellenlänge zurück, während Elementarwelle 2 eine viertel Wellenlänge voraus ist, und die resultierende Feldamplitude ist nun null. Die Elementarwellen sind um π gegeneinander phasenverschoben und löschen sich aus. In Abbildung 9.15 f, wo θ noch größer ist, gilt δ2 /2 = 3π/4 = 135◦ , der resultierende Zeiger ist 1,414E01 und er ist negativ. Wenn die Differenz der Weglängen zwischen Elementarwelle 1 und Elementarwelle 2 eine Wellenlänge beträgt (d. h. δ2 = 2π), dann wird jeder Zeiger um δ2 /2 = π bezüglich der Referenzrichtung gedreht (Abb. 9.15 g); die Resultierende ist negativ und wieder maximal (2E01 ). In dieser Weise oszilliert die Amplitude des elektrischen Feldes kosinusförmig, wenn der Beobachtungspunkt auf dem Schirm weiter weg von der zentralen Achse gebracht wird. Das Quadrat der Amplitude, das in Abbildung 9.15 b gezeigt ist, ist proportional zur Bestrahlungsstärke in Abbildung 9.12. Es sei daran erinnert, dass die quadrierte Amplitude (2E01 )2 , abgesehen von Konstanten, gleich dem Maximum der Bestrahlungsstärke, 4I0 , ist, wobei I0 die Bestrahlungsstärke für den einzelnen Spalt ist (d. h. die Bestrahlungsstärke aufgrund der einzelnen Elementarwelle).

9.3 Interferometer mit Wellenfrontaufspaltung

783

Es sei daran erinnert, dass wir die Spalte alle als infinitesimal breit angenommen haben. Daher sind die cos2 -Streifen in Abbildung 9.12 eine in Wirklichkeit nicht zu erreichende Idealisierung.4 Das tatsächliche Muster (Abb. 9.11 e) fällt wegen der Beugung zu den Rändern hin ab. Im ersten Fall werden Beugungseffekte signifikant. Wie wir weiter vorn bereits erörtert hatten (Abb. 9.5), ist das Streifenmuster im Nahfeld komplizierter als eine einfache cos2 -Verteilung. Damit stellt sich die Frage nach der Anwendbarkeit der Näherung (r1 − r2 ) = a sin θ in der Nähe der Quellen. Wie sich zeigt5 , ist die Näherung tatsächlich sehr gut. Sie gilt unter der Voraussetzung r  0,354a (siehe Abb. 9.11) und hat für r > 0,354a eine Abweichung von weniger als 1 %. Die Hyperbeln in Abbildung 9.3 nähern sich asymptotisch geraden Linien. Dies lässt sich auch bei den Wasserwellen in Abbildung 9.1 beobachten. Beugungserscheinungen Abbildung 9.10 zeigt zwei Kegel für die Strahlungsenergie, die aus den runden Blenden in einem lichtundurchlässigen Schirm austritt. Diese Art von geradliniger Projektion ist eine Vereinfachung dessen, was tatsächlich hinter einem kohärent bestrahlten Objekt passiert. Die tatsächliche Verteilung des Lichts wird Beugungsmuster genannt. Wir werden verschiedene solcher Muster im nächsten Kapitel im Detail betrachten. Hier sei nur erwähnt, dass, während jede einzelne runde Blende einen hellen, runden Fleck auf dem Schirm ergibt, dieser Fleck in der Mitte am hellsten ist und zum Rand hin allmählich auf eine Bestrahlungsstärke von null abfällt. Außerdem ist der Fleck von schmalen, konzentrischen Ringen umgeben, die nach außen hin immer blasser werden und von denen vielleicht nur der erste oder die ersten beiden sichtbar sind. Wenn die Quelle im Experiment von Young aus zwei schmalen, dicht benachbarten kreisrunden Öffnungen besteht (oder wenn eine Linse wie in Abbildung 9.14 benutzt wird, die bewirkt, dass sich die Flecken auf dem Schirm überlappen), dann erscheint das cos2 -Muster innerhalb der Beugungseinhüllenden (Abb. 9.16).

Abb. 9.16: Doppelstrahl-Interferenzstreifen, erzeugt von einem Paar kreisförmiger Blenden. (Foto E. H.) 4

5

Modifikationen dieses Musters, die bei zunehmender Breite entweder eines primären oder eines sekundären Spalts auftreten, werden später noch genauer betrachtet (Kapitel 10 und 12). Im letzteren Fall wird der Streifenkontrast als Maß für den Kohärenzgrad verwendet (Abschn. 12.1). D. C. H. Poon, „How good is the approximation ‚path difference ≈ d sin θ‘?“ Phys. Teach. 40, 460– 462 (2002).

9 Interferenz

784

In ähnlicher Weise projiziert ein kohärent bestrahlter, langer, schmaler, vertikaler Spalt ein vertikales, rechteckiges Lichtband auf dem Beobachtungsschirm. Je schmaler der Spalt, umso breiter wird das resultierende Band. Das Rechteck aus Licht, das den größten Teil der gebeugten Energie enthält, ist in der Mitte am hellsten und fällt zu seinen vertikalen Rändern hin auf eine Bestrahlungsstärke von null ab. Es wird außerdem begleitet von einer Reihe zunehmend blasser, schmaler, vertikaler Bänder, die links und rechts neben dem Rechteck zu beobachten sind (Abb. 10.15 b). Wenn die beiden rechteckigen Spalte im youngschen Versuch sehr schmal gemacht werden, dann wird das zentrale Band von jedem der beiden EinzelspaltBeugungsmuster sehr breit. Indem wir die Spalte sehr dicht nebeneinander positionieren (oder eine Linse benutzen), können diese breiten, zentralen Bänder dazu gebracht werden, sich zu überlappen und zu interferieren. Das resultierende cos2 -Streifenmuster wird durch die Einhüllende des breiten zentralen Bandes moduliert, das durch den Einzelspalt entsteht (Abb. 9.17). Mit anderen Worten, durch die Verwendung von Spalten erhalten wir ein Muster, das an cos2 -Streifen erinnert; abweichend davon fällt hier aber die Bestrahlungsstärke zu beiden Seiten des zentralen Maximums ab (Abb. 9.11 e). I

x

Abb. 9.17: Doppelspaltstreifen, die vom zentralen Maximum nach beiden Seiten hin immer blasser werden. Das cos2 -Muster wird durch die Einhüllende des Beugungsmusters moduliert.

Die Auswirkungen endlicher Kohärenzlängen Befindet sich P in Abbildung 9.1 c weiter unterhalb oder weiter oberhalb der Achse, wächst S1 B (was kleiner oder gleich S1 S2 ist). Hat die Primärquelle eine kurze Kohärenzlänge, können die zusammengehörigen Wellengruppenpaare nicht mehr gemeinsam in P eintreffen, wenn die optische Weglängendifferenz wächst – Überlappungen unkorrelierter Wellengruppen nehmen zu, und die Zonen verwischen. Es kann auch Δlc kleiner als S1 B sein. In diesem Fall treffen keine korrelierten Wellengruppen mehr in P ein, es überlappen nur noch Segmente unterschiedlicher Wellengruppen, und die Zonen verschwinden. Wie in Abbildung 9.18 a dargestellt, kommt die Wellengruppe E1 der Quelle S1 im Punkt P zusammen mit der Wellengruppe D2 von S2 an, wenn die optische

9.3 Interferometer mit Wellenfrontaufspaltung

785

Weglängendifferenz die Kohärenzlänge überschreitet. Die Interferenz hält nur für kurze Zeit an, bevor das Muster sich verschiebt, wenn die Wellengruppe D1 sich mit der Wellengruppe C2 zu überlagern beginnt, da die relativen Phasen unterschiedlich sind. Wäre die Kohärenzlänge größer oder die Wegdifferenz kleiner, könnte die Wellengruppe D1 mit der korrespondierenden Wellengruppe D2 wechselwirken usw. für jedes Paar. Die Phasen wären dann korreliert und das Interferenzmuster wäre stabil (Abb. 9.18 b). Da eine weiße Lichtquelle eine Kohärenzlänge von weniger als etwa drei Wellenlängen hat, folgt aus Gleichung (9.27), dass nur etwa drei Zonen auf jeder Seite des zentralen Maximums zu sehen sind.

A2

C2

B2

H2

E2 F2

D2

P I1

H1

S2

A2

B2

C2

D2

E2 F2

G2

H2 P

F1 E1

r1

r2

lc

D1 C1 B1 S1

A1

B1

C1

D1

E1

F1

G1

r1 r 2

H1

lc

A1 (r1

lc

r2 )

(a)

(b)

Abb. 9.18: Schematische Darstellung der Interferenz von Licht, das aus Wellengruppen mit einer Kohärenzlänge Δlc besteht, In Teil (a) ist die Weglängendifferenz größer als Δlc und in (b) ist sie kleiner als Δlc .

Unter weißem Licht (oder breitbandiger Beleuchtung) kommen alle Farben, aus denen das Licht zusammengesetzt ist, phasengleich in y = 0 an, denn sie haben von jeder Öffnung aus die gleiche Entfernung zurückgelegt (Abb. 9.19). Die Zone nullter Ordnung ist im Wesentlichen weiß, doch alle Maxima höherer Ordnung sind spektral aufgespalten, da ym gemäß Gleichung (9.27) eine Funktion von λ ist. In weißem Licht können wir uns das m-te Maximum als das m-te Band von Wellenlängen vorstellen, was uns direkt zum Beugungsgitter des nächsten Kapitels führt. rot

m = –1 2

weiß

grün blau

m=0

m = +1

Abb. 9.19: Die cos -Verteilung der Bestrahlungsstärke für den youngschen Doppelspaltversuch in weißem Licht. Beachten Sie, dass die roten Streifen breiter sind als die grünen, die ihrerseits breiter sind als die blauen. In der Mitte überlappen sie sich alle und erzeugen ein weißes Band. Streifen höherer Ordnung sind mehrfarbig.

9 Interferenz

786

Das Streifenmuster kann man beobachten, wenn man mit einer Nadel zwei kleine Löcher in ein dünnes Stück Karton sticht. Diese Löcher sollten etwa so groß wie ein gedruckter Satzpunkt in diesem Buch sein, und der Abstand der Mittelpunkte sollte etwa drei Radien entsprechen. Eine Straßenleuchte, ein Autoscheinwerfer oder eine Verkehrsampel während der dunklen Tageszeit, etwa einhundert Meter entfernt, dienen uns als Quelle ebener Wellen. Das Stück Karton sollte in sehr kurzer Entfernung direkt vor das Auge gehalten werden. Die Streifen erscheinen dann senkrecht zur Verbindungslinie der beiden Mittelpunkte. Das Muster tritt viel deutlicher zutage, wenn wir Spalte verwenden, wie wir noch in Abschnitt 10.2.2 sehen werden, doch sollten Sie zunächst mit feinen Löchern experimentieren. Mikrowellen eignen sich wegen ihrer vergleichsweise großen Wellenlänge gut zur Beobachtung der Interferenz am Doppelspalt. Zwei Spalte (beispielsweise λ/2 breit und λ lang), in ein Metallblech oder eine Metallfolie geschnitten, können sehr gut als sekundäre Quellen dienen (Abb. 9.20).



λ

Sender λ 2

Detektor

Abb. 9.20: Mikrowellen-Interferometer.

Fourier-Perspektive Wenn die ebenen Wellen in Abbildung 9.11 b auf den ersten schmalen Spalt fallen, treten sie auf der Rückseite des Schirms (d. h. nach der Beugung) in Form einer Art Zylinderwelle aus. Je schmaler der Spalt ist, desto mehr nähert sich die Wellenform dem Zylinder an. Hinter dem Schirm breitet sich das Licht unter sehr vielen Winkeln oder anders ausgedrückt, mit vielen Raumfrequenzen aus. Aus der Fourier-Perspektive liegt die Erklärung für dieses Phänomen darin, dass eine (räumlich gesehen) unendlich schmale Quelle ein (bezüglich der Raumfrequenzen) unendlich breites Lichtfeld erzeugt. Die Fourier-Transformierte einer Punktquelle, eines ideal eindimensionalen Signals (einer diracschen Delta-Funktion, siehe Abschn. 11.2.3), ist ein konstantes Kontinuum, das alle Raumfrequenzen enthält, also eine Kugelwelle. Analog ist die Transformierte einer idealen Linienquelle eine Zylinderwelle. In der Praxis besteht die Anordnung des youngschen Doppelspaltversuchs in der Regel aus zwei schlitzförmigen, phasengleichen Quellen, die so aufgebaut werden, dass s  a ist. Normalerweise ist dabei s so groß, dass das entstehende Interferenzmuster einem fraunhoferschen Beugungsmuster entspricht (siehe Abschn. 10.2.2). Die beiden sehr schmalen Schlitze ähneln zwei Linienquellen, zwei ideal schmalen Signalen,

9.3 Interferometer mit Wellenfrontaufspaltung

787

und die Transformierte zweier Delta-Funktionen ist eine Kosinusfunktion, wie wir in Abbildung 7.51 bereits gesehen haben. Insoweit man die Schlitze als unendlich schmal betrachten kann, nähert sich die Form der Amplitude des elektrischen Feldes im Beugungsmuster der Kosinusfunktion und die Verteilung der Bestrahlungsstärke variiert dann wie cos2 (siehe Abb. 9.12). Teilcheninterferenz Viele Physiker betrachten Licht, ebenso wie Einstein, als einen Strom von Photonen, obwohl nicht ganz klar ist, was Photonen sind. Mit Sicherheit lässt sich sagen, dass Licht von seinem Wesen her elektromagnetisch und oszillatorisch ist und dass ein gewöhnlicher Lichtstrahl wellenartiges Verhalten zeigt. Es ist daher natürlich, von den Wellenlängen des Lichts zu sprechen und damit zwangsläufig auch von den Wellenlängen von Photonen. Ebenso wissen wir, dass alle materiellen Objekte – Elektronen, Neutronen, Atome und sogar Feuerwehrautos de-Broglie-Wellenlängen haben, die umgekehrt proportional zu den jeweiligen Impulsen sind. Es sollte daher nicht allzu sehr überraschen, dass Elektronen, die durch ein Spaltpaar von nur 90 nm Breite gehen, Interferenzstreifen erzeugen (Abb. 9.21).

Abb. 9.21: Youngsche Doppelspaltstreifen, die von einem schmalen Elektronenstrahl erzeugt wurden. Die Spalte waren 90 nm breit, 1540 nm lang und 450 nm voneinander entfernt. Die cos2 -Streifen sind durch die Einhüllende der Einzelspalt-Beugungsmuster moduliert. Die undeutlichen Streifen über und unter der zentralen Linie entstehen durch Beugung an den Kanten der Spalte. (S. Frabboni, C. Frigeri, G. C. Gazzadi und G. Pozzi. Am. J. Phys. 79, 615–618 (2011). American Association of Physics Teachers.)

Umgekehrt kann ein Lichtstrahl so stark abgeschwächt werden, dass nur ein einziges Photon pro Zeiteinheit auf den Blendenschirm trifft. Auch unter diesen Umständen erscheint nach einer gewissen Zeit das modulierte cos2 -Muster. Wenn eine – und nur eine – der beiden Blenden geöffnet wird, erscheint der breite Peak des Beugungsmusters für einen Einzelspalt. Beide Peaks, jeder um seinen zugehörigen Spalt zentriert, sind in Abbildung 9.22 zu sehen. Wenn beide Spalte gleichzeitig geöffnet sind, bilden die einzeln durch die Öffnungen tretenden Photonen allmählich die hellen und dunklen Bänder des klassischen Doppelspaltmusters. Diese bemerkenswerte Beobachtung hat alle möglichen Fragen zu Photonen (und anderen Teilchen) aufgeworfen, die scheinbar durch beide Spalte gleichzeitig gehen und miteinander interferieren. Zur Konfusion, die Natur der Photonen betreffend, hat auch ein etwas vereinfachender Kommentar des berühmten Physikers Paul Dirac aus dem Jahr 1930 beigetragen: „Jedes Photon interferiert also mit sich selbst. Interferenz zwischen zwei verschiedenen Photonen kann niemals auftreten.“ Was immer das bedeuten mag, es wird problematisch, wenn zwei separate Laserstrahlen Interferenzmuster erzeugen. Es macht wenig oder keinen Sinn, von einem Natriumatom zu sprechen, das mit einem anderen oder sich selbst „interferiert“. Daher scheint es besser, die Formulierung „interferierende

9 Interferenz

788

Photonenzählrate (Photonen/Sekunde)

2800 Beugung, links Beugung, rechts Interferenzmodell beide Spalte offen ein Spalt offen anderer Spalt offen

2400 2000 1600 1200 800 400 0

3

4

5

6

Detektorposition

7

8

Abb. 9.22: Das youngsche Experiment mit einzelnen Photonen. (Quelle: TEACHSPIN, Inc.)

Photonen“ nicht wörtlich zu nehmen. Am besten auf den Punkt gebracht hat dies Roy J. Glauber, Nobelpreisträger 2005: „Die Dinge, die in der Quantenmechanik interferieren, sind keine Teilchen. Es sind die Wahrscheinlichkeitsamplituden für bestimmte Ereignisse. Es ist die Tatsache, das sich Wahrscheinlichkeitsamplituden addieren wie komplexe Zahlen, was für die quantenmechanischen Interferenzen verantwortlich ist.“6 Zwar kann der Prozess quantenmechanisch formal beschrieben werden, doch ist seine wahre Natur noch immer eines der größten Wunder der Physik. Sie müssen aber nicht auf die klassische Interpretation des Experiments durch elektromagnetische Wellen verzichten; auch sie hat ihre magischen Momente. Erinnern Sie sich, dass zwei kontinuierliche elektromagnetische Wellen, die beide Träger von Energie sind, zu einem entfernten Punkt P propagieren, wo sie sich gegenseitig auslöschen müssen. Was passiert dann mit der Energie, die diese Wellen mit sich geführt haben? Wie gelangt sie in die benachbarten Maxima? Vielleicht hätte Gleichung (9.31) von Anfang an als Photon-Wahrscheinlichkeitsverteilung interpretiert werden müssen. Einige andere Interferometer Die physikalischen und mathematischen Betrachtungen, mit deren Hilfe wir den youngschen Doppelspaltversuch erklärt haben, lassen sich gleichermaßen auf eine Reihe anderer Interferometer mit Wellenfrontaufspaltung anwenden. Die bekanntesten 6

Es sei daran erinnert, dass für manche Physiker das Photon nicht mehr ist als das Quantum des Strahlungsfeldes, also kein eigenständig existierendes Teilchen. Siehe R. J. Glauber, „Dirac’s famous dictum on interference: one photon or two,“ Am. J. Phys. 63 (1), 12 (1995). Eine faszinierende Darstellung ist S. Kocsis, B. Braverman, S. Ravets, M. Stevens, R. Mirin, L. Krister Shalm und A. Steinberg, „Observing the average trajectories of single photons in a two-slit interferometer,“ Science 332 (6034), 1170–1173 (2011).

9.3 Interferometer mit Wellenfrontaufspaltung

789

dieser Instrumente sind der fresnelsche Spiegel, das fresnelsche Doppelprisma und der lloydsche Spiegel. Der fresnelsche Spiegel Der fresnelsche Spiegel besteht aus zwei vorderseitig versilberten Planspiegeln, die mit einem sehr kleinen Winkel zueinander geneigt sind (Abb. 9.23). Ein Teil der vom Spalt S kommenden zylindrischen Wellenfront wird vom ersten Spiegel, der andere Teil vom zweiten Spiegel reflektiert. Wo sich die beiden reflektierten Wellen im Raum überlagern, kommt es zur Interferenz. Die Bilder S1 und S2 des Spaltes S auf den beiden Spiegeln kann man als voneinander unabhängige, kohärente Quellen im gegenseitigen Abstand a betrachten. Aus den Reflexionsgesetzen folgt dann (Abb. 9.23 a) SA = S1 A und SB = S2 B, sodass SA + AP = r1 und SB + BP = r2 ist. Der optische Weglängenunterschied zwischen den beiden Strahlen beträgt dann r1 − r2 . Maxima entstehen jeweils in r1 − r2 = mλ, wie es auch beim youngschen Interferometer der Fall ist. Die Entfernung zwischen je zwei Streifen ist wieder gegeben durch s Δy ≈ λ a mit s als Abstand zwischen der Ebene der beiden virtuellen Quellen (S1 , S2 ) und dem Schirm. Die Anordnung in Abbildung 9.23 wurde absichtlich übertrieben gezeichnet, Abschirmung

(a)

Schirm

S

P

R A r1 R S1 D

d C B

2 R r2

a S2

(c) Abb. 9.23: (a) Fresnelscher Doppelspiegel. Der Winkel θ zwischen den beiden Spiegeln ist hier stark übertrieben. (b) Zwei Wellen, von beiden Spiegeln je eine reflektiert, interferieren. (c) Dieses Streifenmuster wurde bei einer Wellenlänge von nur 13,9 nm mit Strahlung vom LURE-Synchrotron in Orsay, Frankreich, erhalten. (Foto mit frdl. Genehmigung von D. Joyeux, Institut d’Optique.)

(b)

Abschirmung

9 Interferenz

790

um die Geometrie deutlich zu machen. Der Winkel θ zwischen den Spiegeln muss sehr klein sein, damit die elektrischen Feldvektoren der beiden Strahlen parallel (oder wenigstens nahezu parallel) sind. E1 und E2 seien die von den kohärenten virtuellen Quellen S1 und S2 ausgesendeten Lichtwellen. Zu jedem Zeitpunkt kann man im Raumpunkt P jeden dieser Vektoren in Komponenten parallel und senkrecht zur Abbildungsebene zerlegen. Da k1 und k2 parallel zu AP und BP sind, sollte klar sein, dass die Komponenten von E1 und E2 in der Abbildungsebene nur für kleine θ näherungsweise parallel sind. Mit abnehmendem θ nimmt auch a ab, und die Streifen werden breiter. Beispiel 9.2 Betrachten Sie den Doppelspiegel in Abbildung 9.23 a und zeigen Sie (a), dass der Streifenabstand durch Δy ≈

(R + d)λ a

gegeben ist, wobei λ die Wellenlänge der Strahlung im umgebenden Medium ist. (b) Beweisen Sie, dass Δy ≈

(R + d)λ . 2Rθ

Lösung (a) Der youngsche Doppelspaltversuch ergab s Δy ≈ λ , a und das Gleiche gilt auch hier, wobei s = DP ≈ R + d. Damit haben wir Δy ≈

(R + d)λ . a

(b) Um θ ins Spiel zu bringen, bemerken wir, dass in dem Dreieck S1 CD gilt a = R sin θ ≈ Rθ , 2 sodass (R + d)λ . Δy ≈ 2Rθ Das fresnelsche Doppelprisma Das fresnelsche Doppelprisma (Biprisma) besteht aus zwei dünnen, an der Basis verbundenen Prismen (Abb. 9.24). Auf beide Prismen trifft eine einzelne zylindrische Wellenfront. Der obere Teil dieser Front wird nach unten gebrochen, der untere Teil nach oben. Im Überlagerungsbereich kommt es zur

9.3 Interferometer mit Wellenfrontaufspaltung

791

(a)

(b)

(c) Abb. 9.24: Das fresnelsche Doppelprisma. (a) Das Biprisma erzeugt zwei Abbildungsquellen. (b) Bei einer schlitzförmigen Quelle besteht das Muster aus breiten Bändern. (c) Interferenzstreifen, die von G. Möllenstedt an einer Biprismenanordnung für Elektronen beobachtet wurden. Wieder verhalten sich die Elektronen wie Photonen. (Fotos aus Handbuch der Physik von S. Flügge (Hrsg.), Springer, Heidelberg.)

Interferenz. Wieder existieren zwei virtuelle Quellen S1 und S2 , deren gegenseitiger Abstand a sich als Funktion des Prismenwinkels α ausdrücken lässt (Aufgabe 9.27), wobei s  a ist. Der Ausdruck für den Abstand der Interferenzstreifen ist derselbe wie oben. Der lloydsche Spiegel Abschließend wollen wir den lloydschen Spiegel (Abb. 9.25) betrachten. Er besteht aus einer flachen Schicht eines Dielektrikums oder eines Metalls, die als Spiegel dient und einen Teil der vom Spalt S kommenden zylindrischen Wellenfront reflektiert. Der andere Teil der Wellenfront gelangt vom Spalt direkt auf den Schirm. Als Abstand a zwischen den beiden kohärenten Quellen setzen wir nun die Entfernung zwischen dem Spalt selbst und seinem Bild S1 auf dem Spiegel an. Der

min S

max

a

S1

min

S

Abb. 9.25: Der lloydsche Spiegel.

9 Interferenz

792

Abstand zwischen den Streifen ist wieder durch (s/a) λ gegeben. Charakteristisch für dieses Gerät ist, dass der reflektierte Strahl bei streifendem Einfall (θi = π/2) um 180◦ phasenverschoben wird. (Wie wir wissen, sind dann beide Amplituden-Reflexionskoeffizienten gleich −1.) Mit einer zusätzlichen Phasenverschiebung von ±π ist δ = k (r1 − r2 ) ± π und für die Bestrahlungsstärke erhalten wir

πay  . I = 4I0 sin2 sλ Das Streifenmuster des lloydschen Spiegels ist komplementär zu dem des youngschen Interferometers: Die Maxima des einen Musters treten bei Werten von y auf, bei denen das andere Muster Minima aufweist. Die obere Kante des Spiegels entspricht y = 0 und bildet die Mitte eines dunklen Streifens; beim youngschen Gerät bildet sie die Mitte eines hellen Streifens. Die untere Hälfte des Musters wird durch den Spiegel verdeckt. Überlegen wir, was passieren würde, wenn man eine dünne Folie eines transparenten Materials in den Weg der Strahlen bringt, die direkt zum Schirm verlaufen. Der Effekt der Folie besteht in einer Erhöhung der Anzahl der Wellenlängen in jedem direkten Strahl. Dadurch wird das gesamte Muster nach oben verschoben, und die reflektierten Strahlen müssten bis zur Interferenz ein wenig weiter laufen. Der lloydsche Spiegel ist offensichtlich sehr einfach aufgebaut. Man verwendet ihn daher in einem sehr weiten Spektralbereich. Als reflektierende Flächen benutzt man Kristalle (für Röntgenstrahlen), gewöhnliches Glas (für sichtbares Licht), Drahtnetzschirme für Mikrowellen und einen See oder sogar die Ionosphäre der Erde für Radiowellen.7 Beispiel 9.3 Eine Linienquelle von 600 nm-Licht befindet sich 5,0 mm über und parallel zu einem lloydschen Spiegel (in Luft). Auf einem 5 m von der Quelle entfernten Schirm werden Streifen beobachtet. Lokalisieren Sie das erste Maximum der Bestrahlungsstärke über der Spiegeloberfläche. Lösung Die Spiegeloberfläche halbiert den zentralen dunklen Streifen. Damit liegt das Zentrum des ersten hellen Streifens um Δy/2 über dem Spiegel. Wegen Δy =

(5,0 m) s λ= 600 × 10−9 m = 3,0 × 10−4 m a 2(5,0 × 10−3 m)

liegt das erste Maximum 0,15 mm über dem Spiegel.

7

Der Einfluss einer endlichen Spaltbreite und einer endlichen Frequenzbandbreite wird z. B. erörtert in R. N. Wolfe und F. C. Eisen, „Irradiance Distribution in a Lloyd Mirror Interference Pattern“, J. Opt. Soc. Am. 38 (1948) 706.

9.3 Interferometer mit Wellenfrontaufspaltung

793

Etablierung der Wellentheorie des Lichts Nachdem wir nun den youngschen Doppelspaltversuch und den fresnelschen Doppelspiegel untersucht haben, sind wir in der Lage, ein interessantes Stück Geschichte zu würdigen. Als Thomas Young seine Arbeit 1804 veröffentlichte, war die vorherrschende Theorie über das Wesen des Lichts die newtonsche Korpuskulartheorie: Licht ist demnach ein Strom von Teilchen, die den Äther anregen können und ihrerseits von den Wellen beeinflusst werden, die sich in diesem alles ausfüllenden Medium ausbreiten. Man stellte sich vor, dass diese Lichtteilchen mit materiellen Objekten über anziehende und abstoßende Kräfte wechselwirken. Zur damaligen Zeit folgten alle, die sich für Optik interessierten, den Vorstellungen Newtons, einschließlich der Emissionstheorie, wie die Korpuskulartheorie auch genannt wurde. Nur einige wenige Visionäre wie Young in England oder D. F. J. Arago und sein Schüler Augustin-Jean Fresnel in Frankreich vertraten die Wellentheorie. Für sie war Licht eine elastische Welle im Äther. Da der Versuch von Young von so zwingender Logik war, sollte man meinen, dass er die Anhänger der Korpuskulartheorie sofort von der Wellentheorie des Lichts hätte überzeugen müssen. Doch so war es nicht. Young hatte nur geringe formale mathematische Kenntnisse, seine Schriften waren stilistisch ziemlich obskur und nicht sehr weit verbreitet. Außerdem ging das Licht in seiner Versuchsanordnung durch zwei schmale Spalte, sodass man argumentieren konnte, die Lichtteilchen hätten an den Kanten des Spalts mechanisch mit dem Material des Schirms interagiert, wodurch sie aus ihrer ursprünglichen Richtung abgelenkt (gebeugt) worden seien. Ohne Kenntnis von Youngs Arbeiten entwickelte Fresnel, ein früherer Ingenieur, um 1816 sein Doppelspiegelexperiment. Es war von großem Wert für das Verständnis von Beugungsphänomenen allgemein. Fresnel formulierte 1819: „Wenn wir einen Interferenzstreifen erzeugendes System Einzelspalt wassergefüllte Filter Küvette Bogenlampe mit Linse

Schirm Kondensor

Abb. 9.26: Aufbau einer optischen Bank zur Untersuchung von Anordnungen mit Wellenfrontaufspaltung. Die Lichtquelle ist eine Bogenlampe, die Wasserzelle dient zur Kühlung.

9 Interferenz

794

der Spiegel anheben oder das von ihm reflektierte Licht entweder vor oder nach der Reflexion abfangen, dann verschwinden die Streifen. [..] Dies liefert weitere Hinweise dafür, dass die Streifen nicht durch die Wirkung der Kanten des Spiegels hervorgerufen werden, sondern durch das Zusammentreffen von zwei Lichtbündeln.“ Gestützt durch die herausragenden theoretischen und experimentellen Arbeiten von Fresnel gewann die Wellentheorie des Lichts mehr und mehr Anerkennung, und um 1830 wurde sie schließlich als die mächtigere der beiden Theorien angesehen. Alle besprochenen Interferometer lassen sich leicht nachbauen. Als Lichtquelle verwende man einen Laser oder, für weißes Licht, etwas Altmodischeres wie zum Beispiel eine Entladungslampe oder eine Bogenlampe mit Kohleelektroden (Abb. 9.26).

9.4

Interferometer mit Amplitudenaufspaltung

Wir betrachten eine Lichtwelle, die auf einen halbdurchlässigen Spiegel8 oder einfach auf ein Stück Glas trifft. Ein Teil der Welle wird durchgelassen und der andere Teil wird reflektiert. Sowohl die durchgelassene als auch die reflektierte Welle hat eine kleinere Amplitude als die ursprüngliche Welle. Man kann zur Veranschaulichung sagen, dass die Amplitude „geteilt“ wurde. Wenn die beiden getrennten Wellen an einem Detektor wieder zusammengebracht werden, so interferieren sie, falls ihre Kohärenz erhalten geblieben ist. Ist die Weglängendifferenz aber größer als die Länge der Wellengruppe (also die Kohärenzlänge), so gehören die Anteile, die am Detektor wieder vereinigt werden, zu unterschiedlichen Wellengruppen. Deshalb besteht zwischen ihnen keine eindeutige Phasenbeziehung, und das Interferenzmuster ist instabil, also nicht beobachtbar. Wir werden auf dieses Problem zurückkommen, wenn wir die Kohärenztheorie eingehend behandeln. An dieser Stelle werden wir uns auf Fälle beschränken, für die die Weglängendifferenz kleiner als die Kohärenzlänge ist.

9.4.1 Dielektrische Schichten – Zweistrahlinterferenz Interferenzeffekte kann man in transparenten Stoffen beobachten, deren Schichtdicke über einen sehr weiten Bereich variiert, von Dicken kleiner als die Lichtwellenlänge (für grünes Licht ist λ0 etwa 150-mal kleiner, als diese Buchseite dick ist) bis zu mehreren Zentimetern. Für eine gegebene Wellenlänge wird eine Schicht als dünn bezeichnet, wenn die Schichtdicke in der Größenordnung der Wellenlänge liegt. Vor den frühen 1940er-Jahren waren Interferenzeffekte an dünnen dielektrischen Schichten 8

Die Metallbeschichtung eines halbdurchlässigen Spiegels ist zu dünn, um undurchlässig zu sein. Sie können durch ihn hindurchsehen und gleichzeitig Ihr Spiegelbild erblicken. Solche so genannten Strahlteiler können auch aus dünnen gespannten Plastikfolien oder sogar aus unbeschichteten Glasplatten hergestellt werden.

9.4 Interferometer mit Amplitudenaufspaltung

795

zwar bekannt, aber von ziemlich begrenztem praktischem Wert. Das eindrucksvolle Farbspiel, das Ölfilme und Seifenhäutchen bieten, war lediglich von ästhetischer und theoretischer Bedeutung. Mittels geeigneter Vakuumbedampfungstechniken, die in den 1930er-Jahren verfügbar wurden, konnten präzise steuerbare Beschichtungen für kommerzielle Zwecke erzeugt werden, was zu einer Wiederbelebung des Interesses an dielektrischen Schichten führte. Schon im Zweiten Weltkrieg benutzte das Militär vergütete optische Geräte, und bereits seit den 1960er-Jahren sind mehrschichtige Vergütungen verbreitet im Einsatz. Interferenzen gleicher Neigung Wir betrachten den einfachen Fall einer durchsichtigen Platte der Dicke d aus dielektrischem Material (Abb. 9.27). Wir nehmen an, dass die Schicht nicht absorbiert und dass die Amplituden-Reflexionskoeffizienten der Grenzflächen auf beiden Seiten so klein sind, dass nur die ersten beiden reflektierten Strahlen E1r und E2r (die jeweils nur einmal reflektiert worden sind) betrachtet werden müssen (Abb. 9.28). In der Praxis fallen die Amplituden der reflektierten Strahlen höherer Ordnung (E3r usw.) sehr schnell ab, wie es für Luft-Wasser- oder Luft-Glas-Grenzflächen gezeigt werden kann (Aufgabe 9.33). Wir beschränken uns zunächst auf den Fall, dass S eine monochromatische Punktquelle ist.

Dünnschicht

Dünnschicht

Abb. 9.27: Interferenz an dünnen Schichten im Wellen- und Strahlenbild. Das Interferenzmuster entsteht durch die Überlagerung von Licht, das an der Ober- bzw. Unterseite der Schicht reflektiert wird.

9 Interferenz

796

Die Schicht dient als amplitudenspaltendes Gerät, sodass man sich E1r und E2r als aus zwei kohärenten, virtuellen Quellen entstanden denken kann, welche hinter der Schicht liegen. Dies sind die beiden Bilder von S, die durch Reflexion an der ersten und an der zweiten Grenzfläche erzeugt wurden. Die reflektierten Strahlen sind beim Verlassen der Schicht parallel und können im Punkt P auf der Brennebene eines Fernrohrobjektivs oder auf der Netzhaut des Auges (wenn dieses auf Unendlich eingestellt ist) fokussiert werden. Gemäß Abbildung 9.28 ist die optische Weglängendifferenz für die ersten beiden reflektierten Strahlen gegeben durch       Λ = nf AB + BC − n1 AD ,     und wegen AB = BC = d/ cos θt ist   2nf d − n1 AD . cos θt   Um einen Ausdruck für AD zu finden, schreiben wir     AD = AC sin θi . Λ=

Mithilfe des snelliusschen Gesetzes wird daraus    nf  AD = AC sin θt , n1 wobei



 AC = 2d tan θt

(9.32)

ist. Der Ausdruck für Λ wird nun zu  2nf d  1 − sin2 θt Λ= cos θt oder schließlich zu Λ = 2nf d cos θt .

(9.33)

Die zugehörige Phasendifferenz, die mit der optischen Weglängendifferenz verknüpft ist, ist dann gerade das Produkt aus der Vakuumwellenzahl und Λ, also k0 Λ. Wird die Schicht in ein einzelnes Medium gebracht, kann der Brechungsindex einfach n1 = n2 = n geschrieben werden. Dabei kann n sowohl kleiner als nf sein, wie bei einer Seifenhaut in Luft, oder größer, wie bei einer dünnen Luftschicht zwischen zwei Glasscheiben. In beiden Fällen kommt allerdings noch eine zusätzliche Phasenverschiebung durch die Reflexionen selbst hinzu. Wir erinnern uns, dass bei Einfallswinkeln ab etwa 30◦ , unabhängig von Polarisationszustand des einfallenden Lichts, die beiden Strahlen (der eine innen und der andere außen reflektiert) eine relati-

9.4 Interferometer mit Amplitudenaufspaltung

S

Punktquelle

B

θt θt

797

A D C

θt A

θt D

B C

E1r E1t E2t

E2r E3r d

n2

nf

n1 P

Abb. 9.28: Interferenzen gleicher Neigung.

ve Phasenverschiebung von π erfahren (Abb. 4.52 und Abschn. 4.3). Dementsprechend ist δ = k0 Λ ± π oder etwas ausführlicher 4πnf d cos θt ± π δ= λ0 bzw. 1/2 4πd  2 ±π. nf − n2 sin2 θi δ= λ0

(9.34)

(9.35)

Das Vorzeichen der Phasenverschiebung ist unerheblich, deshalb wählen wir das negative Vorzeichen aus, um die Gleichungen etwas zu vereinfachen. In reflektiertem Licht erscheint ein Interferenzmaximum, also ein heller Fleck, im Punkt P , wenn δ = 2mπ ist, also bei geraden Vielfachen von π. In diesem Fall kann Gleichung (9.34) folgendermaßen umgeformt werden: d cos θt = (2m + 1)

λf 4

m = 0, 1, 2, . . .

(Maxima) ,

(9.36)

wobei wir die Beziehung λf = λ0 /nf ausgenutzt haben. Dies korrespondiert gleichzeitig mit den Minima im durchgelassenen Licht.

9 Interferenz

798

Beispiel 9.4 Die gelbe D1 -Linie einer Natriumdampflampe hat eine Vakuumwellenlänge von 5895,923 Å. Nehmen Sie an, dass solches Licht unter einem Winkel von 30◦ auf einen Film aus Sojaöl (n = 1,4729) fällt, der (innerhalb eines Drahtgitters) von Luft umgeben ist. Welche Dicke sollte der Film in einem Bereich mindestens haben, damit das Licht dort stark reflektiert wird? Lösung Gleichung (9.36) gilt für reflektierte Maxima: λf . 4 Hier wollen wir die minimale Dicke bestimmen, die dem minimalen Wert von m entspricht, nämlich null. Die Gleichung lautet also d cos θt = (2m + 1)

d cos θt =

λf . 4

Wir wollen sowohl λf als auch θt berechnen. Dazu verwenden wir zusätzlich das snelliussche Gesetz ni sin θi = nt sin θt , aus dem folgt sin θt =

sin 30◦ = 0,3395 , 1,4729

und somit θt = 19,844◦ . Damit erhalten wir für d d=

λf 1 . 4 cos 19,844◦

An dieser Stelle nutzen wir die Tatsache aus, dass λf = λ0 /nf . Die letzte Gleichung wird damit zu d=

1 λ0 . 4nf cos 19,844◦

Einsetzen der Zahlenwerte ergibt d=

1 589,59 × 10−9 = 1,064 × 10−7 m . 4(1,4729) 0,94062

Die minimale Dicke beträgt winzige 106,4 nm.

9.4 Interferometer mit Amplitudenaufspaltung

799

Interferenzminima im reflektierten Licht (und Maxima im transmittierten Licht) treten bei δ = (2m ± 1) π auf, wenn δ ein ungerades Vielfaches von π ist. Für solche Fälle liefert Gleichung (9.34) d cos θt = 2m

λf 4

(Minima) .

(9.37)

Das Auftreten von ungeraden und geraden Vielfachen von λf /4 in den Gleichungen (9.36) und (9.37) ist signifikant, wie wir bald sehen werden. Es könnte beispielsweise n1 > nf > n2 oder n1 < nf < n2 sein, wie bei einer Fluoridschicht, die auf Glas aufgebracht wurde, das sich in Luft befindet. Die Phasenverschiebung von π wäre dann nicht vorhanden, und die obigen Gleichungen müsste man entsprechend anpassen. Beispiel 9.5 In einem Becher befindet sich Monochlorbenzol (n = 1,5248) und auf der Oberfläche der Substanz schwimmt ein dünner Wasserfilm (n = 1,333). Die Anordnung wird senkrecht mit 647 nm-Licht beleuchtet, wobei ein großes Gebiet auf dem Film rot erscheint. Wie dick muss der Film mindestens sein? Lösung Weil die Reflexionen an beiden Grenzflächen extern sind, gibt es keine zusätzliche Phasenverschiebung. Folglich gilt gemäß Gleichung (9.34) δ=

4πnf d cos θt . λ0

In unserem Fall ist θt = 0 und deshalb δ=

4πnf d. λ0

Wir wollen aber konstruktive Interferenz haben, was δ = 2π bedeutet und daher d=

647 × 10−9 m λ0 ≈ 243 nm . = 2nf 2(1,333)

Dies ist die minimale Dicke. Wenn sie um ein ganzzahliges Vielfaches von λf /2 erhöht wird, entstehen weitere Maxima.

Hat die zur Strahlfokussierung benutzte Linse eine kleine Blende, so erscheint das Interferenzmuster auf einem kleinen Teil der Schicht. Nur diejenigen Strahlen, die von der Punktquelle ausgehend direkt in die Linse reflektiert werden, sind sichtbar (Abb. 9.29). Im Falle einer ausgedehnteren Quelle trifft Licht aus vielen Richtungen auf die Linse, und die Interferenzstreifen erscheinen auf einem größeren Bereich der Schicht (Abb. 9.30).

9 Interferenz

800 Lochblende

Hg-Lampe Linse Filter E

E2r

E1r

Abb. 9.29: Interferenzmuster auf einem kleinen Teil der Schicht.

n2 nf n1

ausgedehnte Lichtquelle

E

E1r E2r

P1 n2 nf n1

P2

P3

Abb. 9.30: Interferenzmuster auf einem größeren Bereich der Schicht.

Der Winkel θi oder äquivalent θt , der durch die Position von P festgelegt ist, bestimmt seinerseits δ. Die Interferenzmuster in den Punkten P1 und P2 (Abb. 9.31) heißen Interferenzen gleicher Neigung. (In Aufgabe 9.39 wird eine einfache Möglichkeit zur Beobachtung dieser Streifen erörtert.) Denken Sie daran, dass jede einzelne Punktquelle auf der ausgedehnten Lichtquelle mit allen anderen Punkten inkohärent

9.4 Interferometer mit Amplitudenaufspaltung

E E2r

801

ausgedehnte Lichtquelle

E1r

θi

P1

n2 nf n1

P2

Abb. 9.31: Alle um einen bestimmten Winkel geneigten Strahlen treffen im selben Punkt ein.

ist. Spiegelt sich die Quelle in der Oberfläche, so wird das Bild von hellen und dunklen Streifen umgeben, deren jeder ein Kreisbogen mit dem Mittelpunkt im Fußpunkt des Lotes vom Auge auf die Schicht ist. Wird die Schicht dicker, so nimmt auch der Abstand AC zwischen E1r und E2r zu wegen AC = 2d tan θt .

[9.32]

Kann nur einer der beiden Strahlen in die Pupille des Auges eintreten, so verschwindet das Interferenzmuster. Mithilfe der größeren Linse eines Teleskops kann man die beiden Strahlen einfangen, wodurch das Muster wieder sichtbar wird. Man kann den Abstand auch durch Verkleinerung von θt und damit θi verringern, also indem man fast senkrecht auf die Schicht blickt. Auf diese Weise sieht man an dicken Platten Interferenzen gleicher Neigung, die so genannten Haidinger-Ringe, benannt nach dem österreichischen Physiker Wilhelm Karl Haidinger (1795–1871). Bei einer ausgedehnten Lichtquelle erfordert die Symmetrie der Anordnung, dass das Interferenzmuster aus einer Reihe konzentrischer, kreisförmiger Streifen besteht, deren Mittelpunkt auf dem Lot vom Auge auf die Schicht liegt (Abb. 9.32). Das Muster folgt der Bewegung des Betrachters. Haidinger-Ringe kann man auch in gewöhnlichen Schaufensterscheiben beobachten. Suchen Sie sich ein Schaufenster mit einer Leuchtstoffröhre und schauen Sie nah bei der Röhre nachts auf die Straße. Sie werden kreisförmige Streifen, zentriert in Ihrem Auge, sehen, die in der Ferne verschwinden.

9 Interferenz

802 Interferenzringe

Betrachtungsschirm (Netzhaut, Mattglas) Linse

Strahlteiler

ausgedehnte Lichtquelle

dielektrische Schicht

schwarzer Hintergrund

Abb. 9.32: Kreisförmige Haidinger-Ringe, deren Mittelpunkt auf der Achse der Linse liegt.

Interferenzen gleicher Dicke Es gibt eine Klasse von Interferenzmustern, für die der bestimmende Parameter nicht θi , sondern die optische Dicke nf d ist. Man bezeichnet diese Streifen als Interferenzen gleicher Dicke. Das Schillern von Seifenblasen, wenige Wellenlängen starken Ölfilmen und auch oxidierten Metalloberflächen in weißem Licht entsteht durch Variationen der Schichtdicke. Solche Interferenzbänder sind analog zu den Höhenlinien auf topographischen Karten: Jeder Streifen ist der geometrische Ort aller Punkte auf der Schicht mit gleicher optischer Dicke. Im Allgemeinen ist nf dabei konstant, sodass die Streifen Gebieten mit gleicher Schichtdicke entsprechen. Man macht sich die Erscheinung beispielsweise bei der Untersuchung von Oberflächen optischer Elemente (Linsen, Prismen) zunutze. Die betrachtete Oberfläche bringt man dazu mit einer optisch ebenen Fläche9 in Berührung. Der Luftspalt zwischen den beiden Flächen erzeugt ein Dünnschicht-Interferenzmuster. Ist die untersuchte Oberfläche eben, so 9

Eine Fläche heißt optisch eben, wenn sie um nicht mehr als etwa λ/4 von einer idealen Ebene abweicht. Früher wurden die besten Ebenen aus klarem Quarzglas hergestellt. Heute stehen glaskeramische Werkstoffe (z. B. CERVIT) mit äußerst geringen thermischen Ausdehnungkoeffizienten (nur rund ein Sechstel dessen von Quarz) zur Verfügung. Einzelne Flächen haben Abweichungen von λ/200 oder noch weniger.

9.4 Interferometer mit Amplitudenaufspaltung

803

ausgedehnte Lichtquelle

Strahlteiler

Abstandhalter

Abb. 9.33: Bildung eines Interferenzmusters an einer keilförmigen Schicht.

sieht man gerade Bänder mit gleichem Abstand voneinander. Sie entstehen durch eine keilförmige, gewöhnlich von Staub herrührende Luftschicht. Eine solche keilförmige Schicht kann man durch zwei ebene Glasscheiben erzeugen, zwischen die an einer Seite ein Papierstreifen gebracht wird. Man erkennt die beschriebenen Bänder. Betrachtet man die Konturen, die bei einer ungleichförmigen Luftschicht entstehen, nahezu senkrecht wie in Abbildung 9.33, so sieht man Fizeau-Streifen. Für einen dünnen Keil mit kleinem Öffnungswinkel α lässt sich die optische Weglängendifferenz der beiden reflektierten Strahlen durch Gleichung (9.33) annähern, wobei d der Dicke in einem bestimmten Punkt ist, d. h.: d = xα .

(9.38)

Bei kleinen Werten von θi wird die Bedingung für Interferenzmaxima zu   1 λ0 = 2nf dm m+ 2 oder   1 λ0 = 2αxm nf . m+ 2 Hierbei ist m = 0, 1, 2, 3, . . . und der erste helle Streifen ist das nullte Maximum (m = 0). Es liegt in der Nähe des dunklen Streifens am Scheitel, wo ein Film

9 Interferenz

804

der Dicke null kein Licht reflektiert. Wir können die letzte Gleichung auch in der Form (m − 12 )λ0 = 2αxm nf mit m = 1, 2, 3, . . . schreiben. Dies ist zwar nicht die traditionelle Form, doch sie hat den Vorteil, dass wir den zweihundertsten Streifen für m = 200 haben anstatt für m = 199. Wegen nf = λ0 /λf kann man xm auch in der Form   m + 12 λf xm = 2α

(9.39)

schreiben. Maxima, die jeweils in den Zentren der hellen Streifen liegen, treten bei Abständen von der Keilspitze gleich λf /4α, 3λf /4α usw. auf, und der Abstand zwischen aufeinanderfolgenden Streifen beträgt Δx = λf /2α .

(9.40)

Je größer α ist, umso feiner sind die Streifen (Abb. 9.34). ∆x

a

Abb. 9.34: Diese Streifenmuster entstehen durch einen keilförmigen Film zwischen zwei Glasplatten, die den Winkel α einschließen. Der Abstand zwischen aufeinanderfolgenden Maxima ist Δx = λf /2α. Für α → 0 gibt es immer weniger Streifen, die immer breiter werden und schließlich alle zusammen verschwinden.

Der Unterschied der Schichtdicken zwischen benachbarten Maxima ist demnach einfach λf /2. Da der von der unteren Fläche reflektierte Strahl die Schicht zweimal durchläuft (θi ≈ θt ≈ 0), unterscheiden sich die optischen Weglängen zweier benachbarter Maxima um λf . Die Schichtdicke bei den einzelnen Maxima ist gegeben durch   1 λf , (9.41) dm = m + 2 2 ein ungeradzahliges Vielfaches einer viertel Wellenlänge. Durch das zweimalige Durchlaufen der Schicht ergibt sich eine Phasenverschiebung von π, die zu der aus der Reflexion entstehenden Verschiebung von ebenfalls π addiert wird. Die beiden Strahlen sind dann wieder phasengleich.

9.4 Interferometer mit Amplitudenaufspaltung

805

Beispiel 9.6 Eine keilförmige Luftschicht wie in Abbildung 9.33 wird mit gelbem Natriumlicht (λ0 = 589,3 nm, Mitte des Dubletts) bestrahlt. Wie weit ist das Zentrum des 173. Maximums vom Scheitel entfernt, wenn der Keil einen Winkel von 0,5◦ bildet? Lösung Wir können entweder xm =

(m + 12 )λf , 2α

mit m = 0, 1, 2, . . .

oder

(m − 12 )λf , mit m = 1, 2, 3, . . . . 2α verwenden. In beiden Fällen benötigen wir α in Radiant:   π rad 0,5◦ = 8,727 × 10−3 rad . α= 180◦ xm =

Damit erhalten wir xm = x172 =

(172 + 12 )589,3 × 10−9 = 5,8 mm 2(8,727 × 10−3 )

xm = x173 =

(173 − 12 )589,3 × 10−9 = 5,8 mm . 2(8,727 × 10−3 )

oder

Das Foto unten zeigt eine vertikal gehaltene, infolge der Schwerkraft keilförmige Seifenhaut. In weißem Licht haben die Bänder unterschiedliche Farben. Im schwarzen Bereich (oben) ist die Haut dünner als λf /4. Das Doppelte davon, plus eine zusätzliche Verschiebung von λf /2 infolge der Reflexion, ist kleiner als eine ganze Wellenlänge. Die reflektierten Strahlen sind deshalb außer Phase. Nimmt die Schichtdicke noch

Keilförmiger Film aus Spülmittel. (Foto E. H.)

9 Interferenz

806

weiter ab, so nähert sich der Gesamtphasenunterschied dem Wert π. Die Bestrahlungsstärke am Ort des Beobachters wird minimal, und die Schicht erscheint in reflektiertem Licht schwarz.10 Drücken Sie zwei gut gesäuberte Objektträger gegeneinander. In der Regel ist die eingeschlossene Luftschicht nicht gleichmäßig dick. Bei normaler Zimmerbeleuchtung erkennen Sie auf der Oberfläche eine Reihe unregelmäßiger, farbiger Streifen (Interferenzstreifen gleicher Dicke). Unter Druck verformen sich die dünnen Glasscheiben, und gleichzeitig bewegen und verändern sich die Streifen. Sie können die beiden Gläser auch mit mattiertem Klebeband aneinander befestigen – der Klebestreifen streut das Licht, und Sie können die Interferenzmuster besser sehen.

Bildung von Interferenzstreifen an einem Luftfilm zwischen zwei Objektträgern. (Foto E. H.)

Newtonsche Ringe an zwei Objektträgern. Das Interferenzmuster entsteht durch den dünnen Luftfilm. (Foto E. H.)

Drückt man zwei Glasscheiben an einem Punkt zusammen, z. B. mit der Spitze eines Stifts, so entstehen um diesen Punkt konzentrische, nahezu kreisförmige Ringe. Diese so genannten newtonschen Ringe11 lassen sich besser mit der in Abbildung 9.35 gezeigten Anordnung untersuchen. Hier wurde eine Linse auf eine optische Ebene gelegt und senkrecht mit quasimonochromatischem Licht beleuchtet. Je regelmäßiger 10

11

Die relative Phasenverschiebung von π zwischen innerer und äußerer Reflexion ist erforderlich, wenn die reflektierte Flussdichte gleichförmig gegen null gehen soll, sobald die Schicht dünner wird und schließlich verschwindet. Unabhängig voneinander untersuchten Robert Hooke (1635–1703) und Isaac Newton eine ganze Reihe von Dünnschichtphänomenen, von der Seifenblase bis zum Luftspalt zwischen Linsen. In Newtons Opticks lesen wir: Ich nahm zwei Fernrohr-Objektive, ein plankonvexes für ein 14-FußTeleskop und ein großes bikonvexes für eines von etwa 50 Fuß. Ich legte sie aufeinander, mit der ebenen Seite nach unten, und drückte sie langsam zusammen, woraufhin die Farben in der Mitte der Kreise hervortraten.

9.4 Interferometer mit Amplitudenaufspaltung

807

(b)

(a)

quasimonochromatische Punktquelle

Strahlteiler (Glasplatte)

Kollimatorlinse (R – d )

Abb. 9.35: (a) Newtonsche Ringe in reflektiertem Licht. (b) Standardanordnung zur Beobachtung newtonscher Ringe.

R E1r

E2r

E

optische Ebene

nf

x

d

schwarze Fläche

das entstehende Ringmuster ist, umso perfekter ist die Linsenform. Mit R als dem Krümmungsradius der Konvexlinse lautet die Beziehung zwischen dem Abstand x und der Schichtdicke d x2 = R2 − (R − d)2 oder einfacher x2 = 2Rd − d2 . Wegen R  d wird dies zu x2 = 2Rd . Wir wollen nur die ersten beiden reflektierten Strahlenbündel, E1r und E2r , untersuchen. Das Interferenzmaximum m-ter Ordnung tritt in der Schicht auf, wenn deren Dicke die Beziehung   1 λ0 2nf dm = m + 2

9 Interferenz

808

erfüllt. Der Radius des m-ten hellen Streifens ergibt sich demnach durch Kombination der letzten beiden Ausdrücke:   1/2 1 λf R m+ . (9.42) xm = 2 Hierbei ist m = 0, 1, 2, 3, . . . und der erste (innerste), helle Ring gehört zu m = 0. Wenn wir möchten, dass das erste Maximum bei m = 1 liegt, dann können wir Gleichung (9.42) umschreiben in  1/2  . xm = m − 12 λf R Analog ist der Radius des m-ten dunkeln Streifens gleich xm = (mλf R)1/2

(9.43)

mit m = 0, 1, 2, . . . , und der zentrale dunkle Kreis (in reflektiertem Licht) gehört zu m = 0. Der erste dunkle Ring entspricht dann m = 1, der zweite m = 2 usw. Befinden sich die beiden Glasstücke in gutem Kontakt (kein Staub dazwischen!), so entspricht dem zentralen Ring in x0 = 0 eindeutig ein Minimum der Bestrahlungsstärke; dies ist verständlich, weil d in diesem Punkt gegen null geht. Das Interferenzbild im Durchlicht ist komplementär zum oben diskutierten Muster im reflektierten Licht, das heißt, der mittlere Ring ist nun hell (siehe das nachfolgende Foto).

Dieses Ringmuster entstand durch Interferenz an der dünnen Luftschicht zwischen einer Konvexlinse und ihrer gläsernen Unterlage bei quasimonochromatischer Beleuchtung. Newton war der Erste, der dieses heute nach ihm benannte Phänomen ausführlich untersuchte. (Foto E. H.)

9.4 Interferometer mit Amplitudenaufspaltung

809

Wenn die Kreise größer werden – d. h., wenn xm größer wird –, dann werden sie schmaler und rücken enger zusammen. Um das zu sehen, bilden wir dxm /dm: 2xm

dxm = Rλf dm

oder

Rλf dxm = . dm 2xm

Je größer xm ist, umso schneller ändert es sich mit m. Die newtonschen Ringe sind Fizeau-Streifen. Sie unterscheiden sich von den kreisförmigen Haidinger-Ringen durch die Art, wie ihre Durchmesser von der Ordnung m abhängen. Der mittlere Bereich des Haidinger-Musters entspricht dem maximalen Wert von m (Aufgabe 9.38), während auf die newtonschen Ringe das Gegenteil zutrifft. Beispiel 9.7 Eine konvexe Linse ruht auf einem Stück Planglas in einer staubfreien Anordnung in Luft. Sie wird mit grünem Licht (546,07 nm) aus einer Quecksilberentladungslampe bestrahlt. Der Krümmungsradius der Linse sei 20,0 cm. In welchem Abstand vom Zentrum des Musters wird dann der zehnte helle Streifen zu finden sein? Lösung Wir wissen, dass  1/2  xm = m + 12 λf R bzw.  1/2  , xm = m − 12 λf R und in unserem Fall ist m = 10. Wir erhalten also  1/2 = 1,02 mm . xm = (10 − 12 )(546,07 × 10−9 )(20,0 × 10−2 ) Eine Optikerwerkstatt, in der Linsen hergestellt werden, verfügt über eine Reihe sphärischer Präzisionsprüfplatten oder Messgeräte. Die Oberflächengenauigkeit einer neuen Linse lässt sich anhand der Anzahl und Regelmäßigkeit der newtonschen Ringe beurteilen, die in einem speziellen Messgerät sichtbar werden. Die Prüfplatten werden allerdings zunehmend durch fortgeschrittenere Techniken mithilfe von Laserinterferometern (Abschn. 9.8.2) ersetzt. Vor allem für sphärische Linsen setzt man neuerdings auch verstärkt die mechanische Abtastung mit Piezoelementen ein. Eine reflexmindernde Einfachvergütung Heute sind die meisten Linsen, seien es Kameralinsen oder Brillengläser, mit einer oder mehreren Schichten eines dünnen, transparenten Dielektrikums überzogen, um die Oberflächenreflexionen zu kontrollieren. Ein solcher Film wird üblicherweise als

9 Interferenz

810

Antireflexbeschichtung oder „Entspiegelung“ bezeichnet. Erfunden wurden Antireflexbeschichtungen 1935 bei der Firma Carl Zeiss, und sie waren so erfolgreich bei der Verbesserung der Effizienz von mehrkomponentigen optischen Geräten, dass das deutsche Militär versuchte, die Technologie so lange wie möglich geheim zu halten. Wir werden das Thema in Abschnitt 9.7.2 recht ausführlich behandeln. Für diejenigen unter den Lesern, die diese eher mathematische Abhandlung möglicherweise überspringen werden, wollen wir hier den einfacheren Fall einer Einfachvergütung untersuchen. Wir betrachten einen dielektrischen Film mit dem Brechungsindex nf , der auf ein Substrat (Glas oder ein anderes optisches Material) mit dem Brechungsindex ns aufgetragen ist. Außerdem nehmen wir an, dass das umgebende Medium (gewöhnlich Luft) einen Brechungsindex n0 hat und beschränken die Betrachtung auf den gewöhnlichen Fall, dass das Licht annähernd normal einfällt. Aus den fresnelschen Gleichungen und insbesondere aus Gleichung (4.47) folgt, dass die Menge des an der unbedeckten LuftGlas-Grenze reflektierten Lichts umso größer ist, je größer der Substratindex (relativ zum Brechungsindex von Luft) ist. Deshalb besteht besonders für Linsen mit hohem Index die Notwendigkeit einer Beschichtung. Wie in den Abbildungen 9.26 b und 9.31 zu sehen ist, werden Strahlen an der Oberseite und an der Unterseite des Films reflektiert, und da dies verschwendetes Licht ist, wäre es gut, wenn diese Strahlen um 180◦ gegeneinander phasenverschoben sind und sich auslöschen. Die einfachste Möglichkeit hierfür ist, dafür zu sorgen, dass ns > nf > n0 . Dann sind alle Reflexionen extern und es gibt keine zusätzlichen Phasenverschiebungen. Wir machen den Film eine viertel Wellenlänge dick (h = λf /4), und die beiden reflektierten Wellen werden sich dann zu einem gewissen Grad auslöschen. Natürlich werden wir nur dann in die Nähe einer vollständigen Auslöschung kommen, wenn die Amplituden der reflektierten Welle ungefähr gleich sind. Damit das der Fall ist, muss, wie uns Gleichung (4.47) sagt, (nf − n0 )/(nf + n0 ) gleich (ns − nf )/(ns + nf ) sein (wobei wir angenommen haben, dass das Licht in dem Film nicht mehrfach reflektiert wird). Daraus erhalten wir die zweite Bedingung, welche unsere reflexmindernde Schicht erfüllen muss: nf = (n0 ns )1/2 . [Dies entspricht Gleichung (9.102).] Somit sollte der Film für ein Glassubstrat (ns = 1,50) in Luft (n0 = 1,00) einen Brechungsindex von nf = 1,22 haben. Nach Gleichung (4.47) wird das Reflexionsvermögen an jeder Grenzfläche des Films dann ≈ 0,98 % sein, also insgesamt rund 2 %, was mit einem Reflexionsvermögen von etwa 4 % bei einer reinen Glasoberfläche zu vergleichen ist. Leider gibt es kein geeignetes Dielektrikum mit einem Index von genau 1,22, weshalb meist Magnesiumfluorid – ein verschleißfestes, gut aufdampfbares Material mit dem Index 1,38 – verwendet wird.

9.4 Interferometer mit Amplitudenaufspaltung

811

Beispiel 9.8 Ein Brillenglas habe einen Brechungsindex von 1,532 in gelb-grünem Licht (555 nm). Die Vorderseite soll mit einer einzelnen Schicht Magnesiumfluorid (Brechungsindex 1,38) vergütet werden, sodass das Glas diese Wellenlänge effizient passieren lässt. Welche minimale Dicke muss der Film haben? In welcher Farbe wird das Glas reflektieren, wenn es mit weißem Licht bestrahlt wird? Lösung Die Dicke h des Films ist gegeben durch h = λf /4 mit λf = λ0 /nf . Damit erhalten wir h = λ0 /4nf = (555 nm)/4(1,38) = 101 nm . Der Film reflektiert die zu der durchgelassenen Farbe komplementäre Farbe, und das ist ein Magenta mit hohem Blauanteil.

9.4.2 Spiegel-Interferometer Das Michelson-Interferometer In vielen Interferometern mit Amplitudenaufspaltung werden Spiegel und Strahlteiler verwendet. Die bekannteste und historisch wichtigste Anordnung ist das MichelsonInterferometer (Abb. 9.36). Eine ausgedehnte Lichtquelle (z. B. eine diffus strahlende, von einer Entladungslampe beleuchtete Mattscheibe) emittiert eine Welle, von der sich ein Teil nach rechts bewegt. Der Strahlteiler im Punkt O spaltet die Welle in zwei Teile; einer davon wandert nach rechts, der andere nach oben. Von den Spiegeln M1 und M2 werden die Teilstrahlen zurück zum Strahlteiler reflektiert. Ein Teil der von M2 kommenden Welle gelangt durch den Strahlteiler nach unten, und ein Teil der von M1 kommenden Welle wird vom Strahlteiler zum Detektor hin abgelenkt. Dort vereinigen sich die beiden Wellen, und eine Interferenz ist zu erwarten. Beachten Sie, dass einer der Strahlen dreimal durch O läuft, der andere dagegen nur einmal. Damit beide Strahlen gleiche Glasdicken passieren, muss man daher eine Kompensatorplatte C in den Weg OM1 bringen. Dieser Kompensator ist bis auf ein Detail ein exaktes Duplikat des Strahlteilers: Im Unterschied zu diesem fehlt ihm jegliche Verspiegelung oder anderweitige oberflächlich aufgebrachte Schicht. C wird parallel zu O angeordnet (also unter einem Winkel von 45◦ ). Der optische Wegunterschied, der sich mit dem Kompensator ergibt, entspricht genau dem tatsächlichen Weglängenunterschied. Aufgrund der Dispersion des Strahlteilers ist der optische Weg eines Strahls außerdem eine Funktion von λ. Will man quantitativ arbeiten, darf man das Interferometer ohne Kompensator nur mit quasimonochromatischem Licht benutzen. Der

9 Interferenz

812

Lichtquelle

Geisterreflexion

Detektor

(a)

Abb. 9.36: Das Michelson-Interferometer. (a) Kreisförmige Ringe, zentriert auf der Linse. (b) Draufsicht auf das Interferometer, um den Strahlenverlauf darzustellen. (c) Ein an einer keilförmigen Schicht entstandenes Interferenzmuster wurde gestört, indem eine heiße Lötnadel in einen Arm des Interferometers gebracht wurde. Interessanterweise wird die Region, die der Lötspitze entspricht, als schwach gelblich wahrgenommen. (Foto E. H.)

(b)

(c)

Einsatz des Kompensators wirkt dem Dispersionseffekt entgegen, sodass nun selbst eine Quelle mit sehr großer Bandbreite erkennbare Interferenzstreifen erzeugt. Um zu verstehen, wie sich die Interferenzstreifen bilden, betrachten wir Abbildung 9.37. Die physischen Bauteile sind hier als mathematische Flächen dargestellt. Ein Beobachter am Ort des Detektors sieht im Strahlteiler gleichzeitig beide Spiegel M1 und M2 sowie die Lichtquelle Σ. Wir können das Interferometer auch so zeichnen, als ob sich alle Elemente auf einer Gerade befänden. Nun entspricht M1 dem Bild von M1 im Strahlteiler und Σ wurde in eine Linie mit O und M2 hinübergeschwenkt. Die Position der Elemente in der Zeichnung hängt von ihrem relativen Abstand zu O ab. (M1 kann vor, hinter oder auf M2 liegen und sogar durch M2 hindurchtreten.) Die Flächen Σ1 und Σ2 entsprechen den Bildern der Quelle Σ in den Spiegeln M1 und M2 . Betrachten wir nun einen einzelnen Punkt S auf der Lichtquelle, der in alle Richtungen strahlt, und verfolgen wir einen bestimmten Strahl. In Wirklichkeit wird eine von S kommende Welle in O gespalten, und die Teile werden von M1 und M2 reflektiert. In unserem Schema deuten wir dies an, indem wir den Strahl sowohl von M2 als auch von M1 reflektieren lassen. Für einen Beobachter in D scheinen die beiden Strahlen von den Bildpunkten S1 und S2 zu kommen (beachten Sie, dass alle Strahlen in Abb. 9.37 in derselben Einfallsebene liegen). In der Praxis sind S1 und S2 kohärente Punktquellen und wir können erwarten, dass die Flussdichteverteilung Gleichung (9.14) entspricht.

9.4 Interferometer mit Amplitudenaufspaltung

813

(a)

Abb. 9.37: Umordnung des Michelson-Interferometers zur Veranschaulichung der Strahlenverläufe.

S1 S2 S O M1

M2

Σ

Σ1

Σ2

D 2d

Detektor S2

S O

Detektor

θ

Σ

(b)

M2 so

so

d

M1 si

θ sθ 2d co

Σ2

S1

Σ1

si

Wie die Abbildung zeigt, beträgt der optische Weglängenunterschied für diese Strahlen fast 2d cos θ, was einem Phasenunterschied von k0 2d cos θ entspricht. Ein zusätzlicher Phasenterm entsteht dadurch, dass die entlang OM2 verlaufende Welle im Strahlteiler innen reflektiert wird, die entlang OM1 verlaufende Welle dagegen außen (in O). Besteht der Strahlteiler einfach aus einer unbeschichteten Glasplatte, so bewirken die beiden Reflexionen eine Phasenverschiebung von π rad. Für 2d cos θm = mλ0

(9.44)

mit einer ganzen Zahl m kommt es statt zu konstruktiver zu destruktiver Interferenz. Ist diese Bedingung für den Punkt S erfüllt, so ist sie gleichermaßen erfüllt für jeden Punkt auf Σ, der auf einem Kreis mit dem Radius O  S liegt, wobei sich O auf der Achse des Detektors befindet. Wenn das einbettende Medium kein Vakuum ist, dann muss das λ0 in Gleichung (9.44) durch das für das Material geltende λ ersetzt werden. Wie in Abbildung 9.38 dargestellt, sieht man ein konzentrisches System von Interferenzringen, dessen Mittelpunkt sich auf der optischen Achse des Auges des Beobachters befindet. Wegen der kleinen Öffnung des Auges ist der Beobachter ohne eine große Linse in der Nähe des Strahlteilers (die den größten Teil des Lichts einfängt) nicht in der Lage, das gesamte Ringmuster zu sehen. Wenn wir eine Quelle verwenden, die mehrere Frequenzkomponenten emittiert (wie beispielsweise eine Quecksilberentladungslampe), bedingt die Abhängigkeit von θm

9 Interferenz

814

S2

S1

O

Σ2 Σ1

Abb. 9.38: Bildung von Interferenzringen.

von λ0 in Gleichung (9.44), dass jede dieser Komponenten ein eigenes System von Interferenzringen erzeugt. Beachten Sie auch, dass aus der Tatsache, dass 2d cos θm kleiner als die Kohärenzlänge der Quelle sein muss, folgt, dass Laserlicht besonders leicht zur Demonstration des Interferometers verwendet werden kann (siehe Abschn. 9.5). Dies wird offensichtlich, wenn wir von Lasern erzeugte Interferenzmuster mit jenen vergleichen, die von normalen Lichtquellen wie einer Kerze oder einer Glühlampe stammen. In letzterem Fall muss die Weglängendifferenz nahe null sein, um überhaupt Ringe zu sehen, während in ersterem Fall selbst eine Weglängendifferenz von 10 cm wenig ausmacht. Ein Interferenzmuster in quasimonochromatischem Licht besteht typischerweise aus einer großen Anzahl abwechselnd heller und dunkler Ringe. Ein bestimmter Ring gehört zu einer bestimmten Ordnung m. Bewegt sich M2 auf M1 zu, nimmt d ab und gemäß Gleichung (9.44) wird cos θm größer, θm folglich kleiner. Die Ringe schrumpfen zusammen und der Ring der höchsten Ordnung verschwindet jeweils, wenn d um λ0 /2 abnimmt. Jeder verbleibende Ring verbreitert sich, während mehr und mehr Ringe im Mittelpunkt verschwinden, bis schließlich der gesamte Schirm nur noch von wenigen Ringen eingenommen wird. Wenn d = 0 erreicht ist, hat sich der zentrale Ring über das gesamte Bildfeld ausgebreitet. Mit einer Phasenverschiebung von π, die aus der Reflexion am Strahlteiler resultiert, besteht über den gesamten Schirm hinweg ein Interferenzminimum. (Unzulänglichkeiten der optischen Elemente können die Beobachtbarkeit dieses Zustandes allerdings verhindern.) Wird M2 noch weiter bewegt, erscheinen die Ringe wieder am Mittelpunkt und bewegen sich nach außen. Der zentrale dunkle Ring, für den in Gleichung (9.44) θm = 0 ist, kann dargestellt werden durch 2d = m0 λ0 .

(9.45)

(Dies ist allerdings ein Spezialfall. Es kann auch sein, dass der zentrale Bereich weder einem Maximum noch einem Minimum entspricht.) Selbst, wenn d = 10 cm ist, was für Laserlicht noch ziemlich bescheiden ist, und λ0 = 500 nm, wird m0 recht

9.4 Interferometer mit Amplitudenaufspaltung

815

groß, nämlich 400 000. Bei einem festen Wert von d erfüllen die dunklen Ringe die Gleichungen 2d cos θ1 = (m0 − 1) λ0 2d cos θ2 = (m0 − 2) λ0 ... 2d cos θp = (m0 − p) λ0 .

(9.46)

Die Winkelposition für jeden Ring, beispielsweise den p-ten, ist durch die Kombination der Gleichungen (9.45) und (9.46) bestimmt: 2d (1 − cos θp ) = pλ0 .

(9.47)

Wegen θm ≡ θp sind beide Winkel genau halb so groß wie der Winkel, der am Detektor von dem betreffenden Ring aufgespannt wird, und wegen m = m0 − p ist Gleichung (9.47) äquivalent zu Gleichung (9.44). Die neue Form ist etwas zweckmäßiger, da (um das Beispiel von oben noch einmal zu verwenden) bei d = 10 cm der sechste dunkle Ring mit p = 6 oder, durch die Ordnung ausgedrückt, mit m = 399 994 bezeichnet werden kann. Ist θp klein, wird θp2 , cos θp = 1 − 2 und Gleichung (9.47) liefert   pλ0 1/2 θp = d

(9.48)

für den Winkelradius des p-ten Ringes.

Kreisringe, die durch ein Michelson-Interferometer mithilfe von Laserlicht erzeugt wurden. (J. Mavroudes, S. Ho, Dr. A. Karpf und G. N. Rao, Physics Department, Adelphi University.)

Die Konstruktion in Abbildung 9.37 entspricht einer möglichen Konfiguration, nämlich derjenigen, in der wir ausschließlich Paare von parallelen Strahlen betrachten. Da sich diese Strahlen nirgends begegnen, kann ohne Kondensorlinse kein Bild entstehen. Tatsächlich wird diese Linse meist durch das Auge des Beobachters geliefert,

9 Interferenz

816

das auf Unendlich eingestellt ist. Die resultierenden Interferenzringe gleicher Neigung (θm = konstant) im Unendlichen sind Haidinger-Ringe. Ein Vergleich der Abbildungen 9.37 b und 9.3 a, die beide kohärente Punktquellen zeigen, legt nahe, dass zusätzlich zu diesen (virtuellen) Ringen im Unendlichen auch (reelle) Ringe existieren, die durch konvergierende Strahlen erzeugt werden. In der Tat: Wird das Interferometer mit einer ausgedehnten Quelle beleuchtet und alles Umgebungslicht abgeschirmt, kann man das projizierte Muster leicht auf einem Schirm in einem abgedunkelten Raum beobachten (siehe Abschn. 9.5). Diese Ringe erscheinen im Raum vor dem Interferometer (wo der Detektor dargestellt ist), und sie werden mit zunehmender Entfernung vom Strahlteiler größer. Wir werden uns im Weiteren noch mit den (reellen) Ringen befassen, die von punktförmigen Quellen erzeugt werden. Sind die Spiegel des Interferometers um einen kleinen Winkel relativ zueinander gedreht (d. h., sind M1 und M2 nicht vollkommen senkrecht zueinander), so beobachtet man Fizeau-Streifen. Die keilförmige Luftschicht zwischen M2 und M1 erzeugt ein Muster von geraden, parallelen Interferenzstreifen. Die interferierenden Strahlen scheinen von einem Punkt hinter den Spiegeln aus zu divergieren. Um diese lokalisierten Interferenzstreifen zu erkennen, muss sich das Auge auf diesen Punkt scharf einstellen. Man kann analytisch zeigen12 , dass sich bei entsprechender Orientierung der Spiegel M1 und M2 geradlinige, kreisförmige, elliptische, parabolische oder hyperbolische Streifen erzeugen lassen. Dies gilt sowohl für virtuelle als auch für reelle Muster. Mithilfe des Michelson-Interferometers lassen sich extrem genaue Längenmessungen vornehmen. Verschiebt man den beweglichen Spiegel um λ/2, so wandert jeder Streifen an die Position, die vorher vom benachbarten Streifen eingenommen worden war. Man verwendet eine Mikroskopanordnung und bestimmt die vom Spiegel zurückgelegte Entfernung Δd einfach durch Zählung der Streifen, die sich dabei an einem Referenzpunkt vorbeibewegt haben: Δd = N (λ0 /2) . Heute kann man dies einfacher mit elektronischen Mitteln bewerkstelligen. Michelson bestimmte mit dieser Methode die Anzahl der Wellenlängen der roten Cadmium-Linie, die dem Standard-Meterstab entsprechen, der in Sèvres bei Paris aufbewahrt wird.13 Beispiel 9.9 Angenommen eine 0,05 mm dünne Glasscheibe, die in einen Arm eines Michelson-Interferometers eingesetzt ist, wird mit gelbem Heliumlicht (λ0 = 587,56 nm) bestrahlt. Wie viele Streifenpaare werden dadurch verschoben?

12 13

Siehe zum Beispiel Valasek, Optics, S. 135. Michelson zählte die 3 106 327 Ringe nicht direkt ab. Sein Verfahren kann man in Strong, Concepts of Classical Optics, S. 238 oder in Williams, Applications of Interferometry, S. 51 nachlesen.

9.4 Interferometer mit Amplitudenaufspaltung

817

Lösung Eine Verschiebung des Pfades um λ0 /2 entspricht, da sich der Apparat in Luft befindet, einer Verschiebung der optischen Weglänge um λ0 /2 und einer Verschiebung eines Streifenpaars. Durch Einsetzen einer Glasscheibe der Dicke D – wodurch gleichzeitig eine „Luftscheibe“ ersetzt wird – ändern wir die optische Weglänge um den Betrag Dng − DnLuft = D(ng − 1). Dieses Stück wird zweimal durchlaufen, und es entspricht einer Distanz N λ0 , wobei N die Anzahl der Streifenpaare ist. Damit ist 2D(ng − 1) = N λ0 und N = 2D(ng −1)/λ0 = 2(0,05 × 10−3 )(0,52)/(587,56 × 10−9 ) = 88,5. Mit einem Michelson-Interferometer und einigen Polaroid-Filtern kann man die Fresnel-Arago-Gesetze nachprüfen. Setzt man in jeden Zweig des Interferometers einen Polarisator, so bleibt der optische Weglängenunterschied relativ konstant, während sich die Vektorfeldrichtungen der beiden Strahlenbündel leicht verändern lassen. Ein Michelson-Interferometer für Mikrowellen kann aus Metallfoliespiegeln und einem Drahtnetz-Strahlteiler aufgebaut werden. Befindet sich der Detektor im mittleren Ring, so lassen sich bei Bewegung eines Spiegels leicht Verschiebungen von Maxima zu Minima beobachten; auf diese Weise kann man λ bestimmen. Einige Platten Sperrholz, Kunststoff oder Glas, die in einen Arm eingesetzt werden, verändern den mittleren Ring. Durch Abzählen der Ringverschiebungen erhält man den Brechungsindex, aus dem sich die Dielektrizitätskonstante des Materials berechnen lässt. Atominterferometer In den frühen 1990er-Jahren entwickelten Forscher in Deutschland und den USA die ersten Atominterferometer. Atomstrahlen können mithilfe eines Lasers geteilt werden. Nachdem sie unterschiedlichen Wegen gefolgt sind, werden diese Strahlen dazu gebracht zu konvergieren, sich zu überlappen und dabei Interferenzstreifen zu bilden. Das Foto auf der nächsten Seite zeigt Streifen, die von interferierenden Natriumatomen erzeugt wurden, die zuvor auf weniger als ein Millionstel Kelvin über dem absoluten Nullpunkt gekühlt wurden. Da die de-Broglie-Wellenlänge eines Atoms nur ein Hundertstel eines Nanometers beträgt, können winzigste Pfadlängendifferenzen (im Pikometerbereich) detektiert werden. Messung der Kohärenzlänge Das Michelson-Interferometer kann auch verwendet werden, um die Kohärenzlänge einer Lichtquelle zu bestimmen. Betrachten wir Abbildung 9.39, in der sich drei aufeinanderfolgende Wellenzüge auf einen Strahlteiler zubewegen. (Die drei gezeigten Wellenzüge führen eine lange Reihe solcher Wellenzüge an, die nicht dargestellt

9 Interferenz

818

Die hier gezeigten Streifen werden durch zwei sich überlappende Ströme von Natriumatomen gebildet. (National Institute of Standards and Technology.)

sind.) Jeder Wellenzug hat eine Kohärenzlänge von etwa Δlc , doch sie sind gegeneinander um einen beliebigen Betrag phasenverschoben. Die drei Wellenzüge werden geteilt (gekennzeichnet durch einen Strich bzw. Doppelstrich), wobei die eine Hälfte der Energie in Richtung M1 und die andere Hälfte in Richtung M2 geht. An den Spiegeln werden die Strahlen zurück zum Strahlteiler reflektiert und dann zum Beobachter gesendet. Wenn beide Spiegel etwa den gleichen Abstand vom Strahlteiler haben, ist d ≈ 0. Wenn die beiden Lichtströme beim Beobachter eintreffen, wird der Wellenzug A mehr oder weniger vollständig den Wellenzug A überlappen, B  wird B  überlappen usw. Jedes Paar von Wellenzügen hält seine jeweilige Phasenbeziehung aufrecht, und folglich wird Wellenzug A sehr effektiv mit Wellenzug A interferieren, B  mit B  usw. Das Ergebnis ist ein helles, kontrastreiches und dauerhaftes Streifenmuster. M⬘1

d

C

B

M2

A

∆lc

M1 C⬙ C⬘ B⬙ B⬘ A⬙ A⬘

Abb. 9.39: Anordnung zur Messung der Kohärenzlänge (Δlc ) mit einem Michelson-Interferometer.

9.4 Interferometer mit Amplitudenaufspaltung

819

Wenn d vergrößert wird, fällt Wellenzug A hinter A zurück und beginnt, teilweise B  zu überlappen. Ebenso kommt es zur partiellen Überlagerung von C  durch B  usw. für die gesamte Reihe von Wellenzügen bis zur Quelle. Die überlappenden Wellenzüge (zum Beispiel A und B  ) können interferieren, doch da ihre relative Phasendifferenz beliebig und verschieden von der zwischen A und A ist, wird das durch diese Interferenz entstehende Streifenmuster anders aussehen, und die gesamte Verteilung der Bestrahlungsstärke wird verschwimmen und an Kontrast verlieren. Wenn 2d gleich Δlc , der mittleren Wellenzuglänge, ist, verschwindet das Interferenzmuster ganz. Mach-Zehnder-Interferometer Strahlleiter

Spiegel

Detektor

ausgedehnte Lichtquelle

Strahlleiter

Spiegel

Abb. 9.40: Das Mach-Zehnder-Interferometer.

Ein weiteres Gerät mit Amplitudenaufspaltung ist das Mach-Zehnder-Interferometer (Abb. 9.40). Es besteht aus zwei Strahlteilern und zwei vollständig reflektierenden Spiegeln. Die beiden Strahlen legen innerhalb der Anordnung getrennte Wege zurück. Durch leichte Neigung eines der beiden Strahlteiler kann man einen Unterschied der optischen Wege einführen. Da die Wege getrennt voneinander verlaufen, ist das Interferometer nicht leicht zu justieren. Aus dem gleichen Grund findet es jedoch sehr viele Anwendungen. In einer etwas anderen, grundsätzlich jedoch ähnlichen Form verwendet man das Interferometer zur Erzeugung von Elektronen-Interferenzmustern.14

Scylla IV, eine frühe Anordnung zur Untersuchung von Plasma. (Foto mit frdl. Genehmigung der University of California, Lawrence Livermore National Laboratory und Department of Energy.) 14

L. Morton, J.A. Simpson, J.A. Suddeth, Rev. Sci. Instr. 25 (1954) 1099; Phys. Rev. 90 (1953) 490.

9 Interferenz

820 Interferenzfilter

Ventil

Quarzfenster

Entladungsr¨ohre

Linse

zur Streakkamera

Kompressionsspule

Ventil

Blende Filmebene Ort der Plasma Interferenzstreifen

Vakuumpumpe Laserstrahl

Kompensationskammer

Quarzfenster

Maßstab (cm)

0

25

50

Justierspiegel

Abb. 9.41: Funktionsschema von Scylla IV.

Stellt man ein Objekt in einen Strahlengang, so verändert sich die optische Weglängendifferenz und damit das Interferenzmuster. Häufig verwendet man das Gerät, um Dichteschwankungen in Gasströmungen in Versuchskammern (Windkanäle, Stoßrohre) zu verfolgen. Ein Strahl dringt durch die optisch ebenen Fenster der Versuchskammer, der andere durch geeignete Kompensatorplatten. Innerhalb der Kammer läuft der Strahl durch Gebiete mit räumlich variierendem Brechungsindex. Die resultierenden Störungen der Wellenfront erzeugen das Streifenmuster. Eine besonders hübsche Anwendung ist in Abbildung 9.41 zu sehen. Dargestellt ist das Funktionsschema von Scylla IV, einem Gerät zur magnetischen Kompression, mit dem in Los Alamos kontrollierte thermonukleare Reaktionen untersucht wurden. Das Mach-Zehnder-Interferometer hat hier die Form eines Parallelogramms. Auf den beiden Rubinlaser-Interferogrammen sieht man das Hintergrundmuster ohne Plasma in der Röhre und die Dichtekonturen des Plasmas während der Reaktion.

Interferogramm ohne Plasma. (University of California, Los Alamos National Security, LLC.)

Interferogramm mit Plasma. (University of California, Los Alamos National Security, LLC.)

9.4 Interferometer mit Amplitudenaufspaltung

821

Sagnac-Interferometer Ein in vielerlei Hinsicht anders geartetes Gerät mit Amplitudenaufspaltung ist das Sagnac-Interferometer. Es ist schnell zu justieren und arbeitet stabil. Eine interessante Anwendung dieses Interferometers wird im letzten Abschnitt dieses Kapitels diskutiert: das Gyroskop. In den Abbildungen 9.42 a und 9.42 b sieht man zwei von mehreren möglichen Formen des Sagnac-Interferometers. Das wichtigste Merkmal dieses Gerätes ist, dass die beiden Strahlen identische, aber entgegengesetzt gerichtete Wege nehmen und geschlossene Schleifen bilden, bevor sie interferieren. Eine kleine Veränderung der Orientierung eines Spiegels erzeugt einen Weglängenunterschied und ein entsprechendes Interferenzbild. Da die beiden Strahlen einander überlagert sind und daher nicht getrennt werden können, kann man das Interferometer nicht im herkömmlichen Sinn verwenden, denn alle konventionellen Anwendungen beruhen auf der Modifikation nur eines der beiden interferierenden Strahlen.

Spiegel

Strahlteiler Spiegel

Lichtquelle

Detektor

Detektor (a)

(b)

Abb. 9.42: (a) Sagnac-Interferometer. (b) Eine andere Variante des Sagnac-Interferometers.

Reelle Interferenzstreifen Bevor wir die Entstehung von reellen im Gegensatz zu virtuellen Interferenzringen diskutieren, wollen wir ein weiteres Gerät mit Amplitudenaufspaltung betrachten – das Pohl-Interferometer (Abb. 9.43). Es besteht einfach aus einer dünnen, durchsichtigen Schicht, die von einer Punktquelle aus beleuchtet wird. In diesem Fall entstehen reelle Ringe, die sich auf einem Schirm auffangen lassen, der ohne Verwendung eines Kondensor-Linsensystems in die Nähe des Interferometers gebracht wird. Eine geeignete Lichtquelle ist eine Quecksilberdampflampe, vor die man einen Schirm mit einem kleinen Loch (rund 5 mm Durchmesser) montiert. Als dünne Schicht kann man z. B. ein gewöhnliches Glimmerplättchen verwenden, geklebt auf einen schwarzen Bucheinband, der als undurchsichtiger Hintergrund dient. Steht Ihnen ein

9 Interferenz

822

Glimmer Glimmer

Schirm

fast senkrechter Einfall kleine, divergierende quasimonochromatische Lichtquelle

Abb. 9.43: Pohl-Interferometer.

Laser zur Verfügung, so können Sie aufgrund dessen großer Kohärenzlänge und hoher Flussdichte praktisch jedes glatte, transparente Material verwenden. Verbreitern Sie den Strahl mittels einer Linse mit einer Brennweite von 50 oder 100 mm auf einen Durchmesser von einigen Zentimetern. Reflektieren Sie ihn dann an der Oberfläche einer Glasplatte (z. B. eines Objektträgers), und Sie können die Interferenzstreifen innerhalb der beleuchteten Scheibe deutlich erkennen, wo auch immer der Leuchtfleck auf einen Schirm trifft. Das zugrundeliegende physikalische Prinzip, das in allen vier beschriebenen Interferometern mit der Beleuchtung durch eine Punktquelle verbunden ist, können wir uns mithilfe einer Konstruktion vor Augen führen, die in zwei Varianten in den Abbildungen 9.44 und 9.45 dargestellt ist.15 Die beiden vertikalen bzw. gegeneinander geneigten Linien (Abb. 9.44 bzw. 9.45) geben entweder die Positionen der Spiegel oder die der beiden Seiten der dünnen Folie im Pohl-Interferometer an. Im Punkt P im umgebenden Medium trete konstruktive Interferenz auf. Ein in diesen Punkt gestellter Schirm kann dann dieses Maximum und ein ganzes Streifenmuster ohne jegliches Kondensorsystem auffangen. Als kohärente, virtuelle Lichtquellen, welche die interferierenden Strahlen aussenden, wirken die Spiegelbilder S1 und S2 der reellen Punktquelle S. Diese Art reeller Interferenzmuster kann man sowohl mit dem MichelP

B θ S2

15

2d

S1

S d

Abb. 9.44: Beleuchtung paralleler Flächen mit einer Punktlichtquelle.

A. Zajac, H. Sadowski und S. Licht, „The Real Fringes in the Sagnac and the Michelson Interferometers“, Am. J. Phys. 29 (1961) 669.

9.5 Typen und Lokalisierung von Interferenzmustern

823

P B S2

S1

S

Abb. 9.45: Beleuchtung gegeneinander geneigter Flächen mit einer Punktlichtquelle.

Reelle Michelson-Streifen im He-NeLaserlicht. (Foto E. H.)

son- als auch mit dem Sagnac-Interferometer beobachten. Beleuchtet man eines dieser Geräte mit einem verbreiterten Laserstrahl, so erzeugen die heraustretenden Wellen direkt ein reelles Streifenmuster. Dieses Experiment ist einfach und schön.

9.5

Typen und Lokalisierung von Interferenzmustern

Oft ist es wichtig zu wissen, wo in einem Interferometersystem die Muster entstehen, weil wir unseren Detektor (Auge, Kamera, Fernrohr) auf diesen Bereich scharf einstellen müssen. Das Problem der Lokalisierung ist charakteristisch für ein bestimmtes Interferometer – es muss für jedes Gerät individuell gelöst werden. Interferenzstreifen lassen sich erstens in reelle und virtuelle, zweitens in lokalisierte und nicht lokalisierte Muster einteilen. Reelle Muster sieht man auf einem Schirm, ohne ein zusätzliches Fokussierungssystem benutzen zu müssen. Die Strahlen, die das Muster bilden, konvergieren von selbst im Beobachtungspunkt. Virtuelle Muster kann man nur mithilfe eines fokussierenden Systems auf einen Schirm projizieren. In diesem Fall konvergieren die Strahlen offensichtlich nicht. Nicht lokalisierte Streifen sind reell und existieren überall innerhalb eines ausgedehnten (dreidimensionalen) Raumbereichs. Das Bild ist nicht lokalisiert, d. h., es existiert nicht nur in einem kleinen Gebiet. Im youngschen Doppelspaltversuch (Abb. 9.11) ist der Raum hinter den Sekundärquellen mit einer Reihe reeller Streifen ausgefüllt. Nichtlokalisierte Ringe dieser Art entstehen im Allgemeinen bei der Verwendung kleiner (vor allem punkt- oder linienförmiger) Lichtquellen, die selbst reell oder virtuell sein können. Lokalisierte Ringe dagegen sind nur auf einer bestimmten Fläche deutlich sichbar. Das Muster bildet sich an einem definierten Ort, der ebenso in der Nähe einer dünnen Schicht wie im Unendlichen liegen kann. Bei Verwendung ausgedehn-

9 Interferenz

824

ter Quellen erhält man stets lokalisierte Streifen, die sich aber auch mit Punktquellen erzeugen lassen. Zur Veranschaulichung dieser Prinzipien ist das Pohl-Interferometer (Abb. 9.43) besonders gut geeignet, da hier mittels einer Punktquelle sowohl reelle, nicht lokalisierte als auch virtuelle, lokalisierte Muster erzeugt werden. Die reellen, nicht lokalisierten Muster (Abb. 9.46 oben) lassen sich fast überall vor der Glimmerschicht auf einem Schirm auffangen. P

P

S2

S

S

Abb. 9.46: Planparallele Schicht. Die Strahlen wurden ohne Berücksichtigung der Brechung gezeichnet.

Die relativ kleine Augenöffnung fängt nur diejenigen nichtkonvergierenden Strahlen ein, die nahezu direkt auf sie gerichtet sind. Da das Strahlenbündel sehr klein ist, sieht das Auge in einer bestimmten Position nicht viel mehr als einen hellen oder dunklen Fleck. Um ein ausgedehntes Interferenzbild wahrzunehmen, das von parallelen Strahlen des Typs wie in Abbildung 9.46 unten gebildet wird, muss man eine große Linse verwenden, die auch Licht einfängt, das aus anderen Richtungen eintritt. In der Praxis hat jedoch jede Lichtquelle eine gewisse Ausdehnung, und man kann die Muster normalerweise sehen, wenn man mit auf Unendlich eingestellten Augen auf die Schicht blickt. Diese virtuellen Streifen sind im Unendlichen lokalisiert und äquivalent mit den Interferenzen gleicher Neigung, die wir in Abschnitt 9.4 besprochen

9.5 Typen und Lokalisierung von Interferenzmustern

825

hatten. Sind die Spiegel M1 und M2 im Michelson-Interferometer parallel zueinander ausgerichtet, so sieht man die üblichen kreisförmigen, virtuellen, im Unendlichen lokalisierten Interferenzstreifen gleicher Neigung. Man kann sich vorstellen, dass eine dünne Luftschicht zwischen den Oberflächen der Spiegel M1 und M2 die Entstehung dieser Streifen bewirkt. Wie in der pohlschen Anordnung (Abb. 9.43) existieren auch hier reelle, nicht lokalisierte Streifen.

Lokalisierungsbereich (reelle Interferenzstreifen)

S

P

α LokalisierungsP bereich (virtuelle Interferenzstreifen)

Abb. 9.47: Interferenzmuster an einer keilförmigen Schicht.

Die Geometrie des Interferenzmusters im reflektierten Licht, das an einem transparenten Keil mit kleinem Öffnungswinkel α erzeugt wird, ist in Abbildung 9.47 gezeigt. Der Entstehungsort P der Streifen wird von der Einfallsrichtung des ankommenden Strahls festgelegt. Dieselbe Lokalisierung gilt für newtonsche Ringe wie auch für das Michelson-, Sagnac- und andere Interferometer, deren Interferenzsystem ebenfalls aus zwei reflektierenden, geringfügig gegeneinander geneigten Ebenen besteht. Die Keilanordnung des Mach-Zehnder-Interferometers unterscheidet sich von den anderen Anordnungen dadurch, dass sich die virtuellen Streifen durch Drehung des Spiegels in jeder Ebene des im Allgemeinen von der Messkammer eingenommenen Raumes lokalisieren lassen (Abb. 9.48).

Lokalisierungsbereich

Abb. 9.48: Interferenzmuster im Mach-Zehnder-Interferometer.

9 Interferenz

826

9.6

Mehrstrahlinterferenz

Bisher haben wir eine Reihe von Situationen besprochen, in denen zwei Strahlenbündel miteinander zur Interferenz gebracht werden. Interferenzerscheinungen entstehen jedoch auch bei geeigneter Überlagerung sehr vieler kohärenter Strahlen. Immer dann, wenn die Amplituden-Reflexionskoeffizienten r der in Abbildung 9.28 gezeigten planparallelen Platte nicht (wie bisher angenommen) klein sind, werden die reflektierten Wellen höherer Ordnung, E3r , E4r usw., ziemlich wichtig. An einer leicht verspiegelten Glasplatte mit r-Werten nahe eins wird eine große Anzahl mehrfach innen reflektierter Strahlen erzeugt. Zunächst wollen wir nur Fälle betrachten, in denen die dünne Schicht, deren Unterlage und das umgebende Medium transparente Dielektrika sind. So vermeiden wir die komplizierteren Phasenverschiebungen, die sich an metallbeschichteten Oberflächen ergeben. Wir beginnen unsere Analyse mit dem einfachsten möglichen Fall: Die dünne Schicht absorbiere kein Licht, und es sei n1 = n2 . Die Notation stimmt mit derjenigen in Abschnitt 4.10 überein; die Amplituden-Transmissionskoeffizienten werden dargestellt durch t (den Bruchteil der Amplitude, der beim Eintritt in die Schicht durchgelassen wird) und t (den Bruchteil der Amplitude, der beim Austritt aus der Schicht durchgelassen wird). Den Strahlenbündeln entsprechen Geraden senkrecht zu den Wellenfronten und auch senkrecht zu den optischen Feldern E1 , E2 usw. Da die Strahlen nahezu parallel bleiben, reicht zur Behandlung die skalare Theorie aus – vorausgesetzt, wir berücksichtigen alle möglichen Phasenverschiebungen. Wie Abbildung 9.49 zeigt, sind die skalaren Amplituden der reflektierten Wellen E1r , E2r , E3r gleich E0 r, E0 tr  t , E0 tr 3 t , . . . , wobei E0 die Amplitude der einfallenden Anfangswelle und r = −r  ist [siehe Gl. (4.89)]. Das Minuszeichen weist auf eine Phasenverschiebung hin, die wir später diskutieren werden. Analog sind die Amplituden der durchgelassenen Wellen E1t , E2t , E3t , . . . gleich E0 tt , E0 tr 2 t , E0 tr 4 t , . . . . Betrachten wir die parallelen reflektierten Strahlen: Jeder von ihnen hat eine feste Phasenbeziehung zu allen anderen reflektierten Strahlen. Der Phasenunterschied kommt durch die Kombination optischer Weglängendifferenzen und Phasenverschiebungen zustande, die mit den Reflexionen einhergehen. Trotzdem sind die Wellen untereinander kohärent; fokussiert man sie mithilfe einer Linse im Punkt P , interferieren sie alle. In zwei Spezialfällen nimmt der Ausdruck für die Bestrahlungsstärke dann eine besonders einfache Form an. Der optische Weglängenunterschied zweier benachbarter Strahlen ist gegeben durch Λ = 2nf d cos θt .

[9.33]

Die Anzahl der Reflexionen aller Wellen außer der ersten, E1r , innerhalb der Schicht ist ungerade. Aus Abbildung 4.49 folgt eine Phasenänderung von 0 oder π (in Abhängigkeit vom inneren Einfallwinkel θi < θc ) für die Feldkomponente parallel zur Einfallsebene bei jeder inneren Reflexion. Die Feldkomponente senkrecht zur

9.6 Mehrstrahlinterferenz

827

Abb. 9.49: Mehrstrahlinterferenz an einer parallelen Schicht.

Einfallsebene wird bei der inneren Reflexion nicht phasenverschoben, wenn θi < θc ist. Aus einer ungeraden Anzahl von Reflexionen ergibt sich für diese Wellen dann keine relative Änderung der Phase (Abb. 9.50). Im ersten Spezialfall ist Λ = mλ, und die zweite, dritte, vierte sowie alle folgenden Wellen sind in P phasengleich. Die Welle

E

E

E⊥ k Einfallsebene

dünne Schicht

k1r E1r E1r E1r⊥ k2r k3r E2r E2r⊥ E2r E3r⊥ E3r E3r

nf

Abb. 9.50: Phasenverschiebungen, die ausschließlich durch innere (θi < θp ) Reflexion entstehen.

9 Interferenz

828

E1r hingegen wird an der äußeren (oberen) Fläche der Schicht relativ zu allen anderen Wellen um 180◦ phasenverschoben. Der Grund für diese Verschiebung liegt darin, dass r = −r  ist und r  nur in ungeradzahligen Potenzen auftritt. Die Summe der skalaren Amplituden, also die gesamte reflektierte Amplitude im Punkt P , ist dann   E0r = E0 r − E0 trt + E0 tr 3 t + E0 tr 5 t + · · · oder   E0r = E0 r − E0 trt 1 + r 2 + r 4 + · · · . Wegen Λ = mλ haben wir hier r  einfach durch −r ersetzt. Die geometrische   Reihe in 2 2 der Klammer konvergiert bei r < 1 gegen die endliche Summe 1/ 1 − r , sodass E0r = E0 r −

E0 trt (1 − r 2 )

(9.49)

ist. In Abschnitt 4.10 wurde im Rahmen der stokesschen Behandlung des Umkehrungsprinzips [Gl. (4.86)] gezeigt, dass tt = 1 − r 2 ist. Damit folgt E0r = 0 . Bei Λ = mλ löschen die zweite, dritte und die nachfolgenden Wellen die erste reflektierte Welle also exakt aus (Abb. 9.51). In diesem Fall wird kein Licht zurückgeworfen, sämtliche ankommende Energie wird durchgelassen. 1 2 3 4 5 6 E0r = 0 (resultierende Amplitude)

Abb. 9.51: Zeigerdiagramm.

  Im zweiten Spezialfall ist Λ = m + 12 λ. Die ersten beiden Strahlen sind dann phasengleich, alle nachfolgenden sind jeweils um λ/2 phasenverschoben; d. h., die zweite Welle ist außer Phase bezüglich der dritten, die dritte bezüglich der vierten und so weiter. Die resultierende skalare Amplitude ist dann E0r = E0 r + E0 trt − E0 tr 3 t + E0 tr 5 t − · · · oder

  E0r = E0 r + E0 rtt 1 − r 2 + r 4 − · · · .

9.6 Mehrstrahlinterferenz

829 1 2 3 4 5 6 7 (resultierende Amplitude)

E0r

Abb. 9.52: Zeigerdiagramm.

  Die Reihe in der Klammer ist gleich 1/ 1 + r 2 und damit wird  tt . E0r = E0 r 1 + (1 + r 2 ) Wieder ist tt = 1 − r 2 ; deswegen können wir, wie in Abbildung 9.52 veranschaulicht, schreiben 2r E0 . E0r = (1 + r 2 ) Da diese spezielle Anordnung zu einer Addition der ersten beiden Wellen führt, die relativ hohe Amplituden aufweisen, sollte die reflektierte Flussdichte groß sein. Die 2 /2, und so folgt aus Gleichung (3.44) Bestrahlungsstärke ist proportional zu E0r  2 4r 2 E0 . (9.50) Ir = 2 2 2 (1 + r ) Später wollen wir zeigen, dass dies tatsächlich einem Maximum (Ir )max entspricht. Betrachten wir das Problem der Mehrstrahlinterferenz nun etwas allgemeiner unter Heranziehung der komplexen Darstellung. Wieder sei n1 = n2 , womit wir vermeiden, für jede Oberfläche spezielle Reflexions- und Transmissionskoeffizienten einführen zu müssen. Die optischen Felder im Punkt P sind gegeben durch !1r = E0 reiωt E !2r = E0 tr  t ei(ωt−δ) E !3r = E0 tr 3 t ei(ωt−2δ) E .. . !N r = E0 tr (2N −3) t ei[ωt−(N −1)δ] , E wobei E0 eiωt die einfallende Welle ist. Die Terme δ, 2δ, . . . , (N − 1) δ stehen für die Phasenbeiträge, die sich aus dem optischen Weglängenunterschied zweier benachbarter Strahlen ergeben (δ = k0 Λ). Ein

9 Interferenz

830 E0r δ E0 tr  t Er

δ E0 tr 3 t δ δ

Abb. 9.53: Zeigerdiagramm.

zusätzlicher Phasenbeitrag entsteht durch das Durchlaufen des optischen Weges bis zum Punkt P , der jedoch für alle Strahlen hinzukommt und daher weggelassen wurde. Die relative Phasenverschiebung, die der erste Strahl durch die Reflexion erfährt, ist in der Größe r  enthalten. Die resultierende reflektierte skalare Welle ist dann !1r + E !2r + E !3r + · · · + E !N r !r = E E oder mit der Substitution (Abb. 9.53) !r = E0 reiωt + E0 tr  t ei(ωt−δ) + · · · + E0 tr (2N −3) t ei[ωt−(N −1)δ] . E Dies lässt sich auch anders aufschreiben: % 

 2 N −2 ' iωt   −iδ 2 −iδ 2 −iδ 2 −iδ ! +···+ r e + r e r+r tt e 1+ r e . Er = E0 e   Die Reihe konvergiert, falls r 2 e−iδ  < 1 und wenn die Anzahl der Glieder gegen unendlich geht. Als resultierende Welle erhält man  r  tt e−iδ iωt ! r+ . (9.51) Er = E0 e 1 − r 2 e−iδ Findet keine Absorption statt, so wird der Welle keine Energie entzogen und wir können Gleichung (9.51) mithilfe der Beziehungen r = −r  und tt = 1 − r 2 wie folgt umformulieren:    −iδ r 1 − e !r = E0 eiωt . E 1 − r 2 e−iδ !r E !r∗ /2, d. h. Die reflektierte Flussdichte in P beträgt dann Ir = E    E02 r 2 1 − e−iδ 1 − e+iδ , Ir = 2 (1 − r 2 e−iδ ) (1 − r 2 e+iδ )

9.6 Mehrstrahlinterferenz

831

was umgeformt werden kann zu Ir = Ii

2r 2 (1 − cos δ) . (1 + r 4 ) − 2r 2 cos δ

(9.52)

Das Symbol Ii = E02 /2 bezeichnet die einfallende Flussdichte, da natürlich E0 die Amplitude der einfallenden Welle ist. Die Amplituden der durchgelassenen Welle sind analog gegeben durch !1t = E0 tt eiωt E !2t = E0 tt r 2 ei(ωt−δ) E !3t = E0 tt r 4 ei(ωt−2δ) E .. . !N t = E0 tt r 2(N −1) ei[ωt−(N −1)δ] , E und ihre Addition liefert  tt iωt ! . Et = E0 e 1 − r 2 e−iδ

(9.53)

(Da wir hier die Bestrahlungsstärke betrachten wollen, wurde ein überall auftretender Faktor von e−iδ/2 , der von der Transmission durch die Schicht herrührt, weggelassen. Der Faktor trägt dazu bei, dass der Phasenunterschied zwischen reflektierter und durchgelassener Welle π/2 beträgt, aber dies ist im Moment nicht von Belang.) Durch Multiplikation von Gleichung (9.53) mit ihrem konjugiert Komplexen (Aufgabe 9.53) erhält man die Bestrahlungsstärke des durchgelassenen Strahls, It =

Ii (tt )2 . (1 + r 4 ) − 2r 2 cos δ

(9.54)

Mithilfe der trigonometrischen Beziehung cos δ = 1 − 2 sin2 (δ/2) formen wir die Gleichungen (9.52) und (9.54) um:   2 2 sin (δ/2) 2r/ 1 − r 2 (9.55) Ir = Ii 2 1 + [2r/ (1 − r )]2 sin2 (δ/2) und It = Ii

1 1 + [2r/ (1 − r 2 )]2 sin2 (δ/2)

.

(9.56)

Hierbei wird keine Energie absorbiert, also tt + r 2 = 1. Wenn dem tatsächlich so ist, dann sollte sich die Flussdichte der ankommenden Welle exakt als Summe der von der

9 Interferenz

832

Schicht reflektierten und der insgesamt durchgelassenen Flussdichte ergeben. Aus den Gleichungen (9.55) und (9.56) folgt dies in der Tat, nämlich Ii = Ir + It .

(9.57)

Dies trifft natürlich nicht zu, wenn die dielektrische Schicht mit einer dünnen Lage eines halbdurchlässigen Materials beschichtet ist. Die in dem Metall induzierten Oberflächenströme verbrauchen einen Teil der einfallenden elektromagnetischen Energie. Betrachten wir die durchgelassenen, durch Gleichung (9.54) beschriebenen Wellen. Wird der Nenner so klein wie möglich, also cos δ = 1 und damit δ = 2πm, so entsteht ein Maximum: (It )max = Ii . Unter diesen Bedingungen folgt aus Gleichung (9.52) (Ir )min = 0 , wie wir aus Gleichung (9.57) auch erwarten. Gleichung (9.54) sagt außerdem aus, dass ein Minimum der durchgelassenen Flussdichte existiert, wenn der Nenner maximal wird, also cos δ = −1. Dann wird δ = (2m + 1) π und  2 1 − r2 . (9.58) (It )min = Ii (1 + r 2 )2 Das zugehörige Maximum der reflektierten Flussdichte ist (Ir )max = Ii

4r 2 (1 + r 2 )2

.

(9.59)

Beachten Sie, dass die Maxima der Interferenzen gleicher Neigung bei δ = (2m + 1) π oder 4πnf d cos θt = (2m + 1) π λ0 auftreten. Dies entspricht dem bereits in Gleichung (9.36) unter Berücksichtigung lediglich der ersten beiden Wellen erhaltenen Resultat. Außerdem beweist Gleichung (9.59), dass (9.50) tatsächlich einem Maximum entspricht. Die Form der Gleichungen (9.55) und (9.56) legt die Einführung einer neuen Größe nahe. Wir nennen sie den Finessefaktor F und definieren sie als 2  2r . (9.60) F ≡ 1 − r2

9.6 Mehrstrahlinterferenz

833

It /Ii

1 F =0.2

r 2 = 0.046

F =1

r 2 = 0.18

0.5

r 2 = 0.87 F =200

F = 200

0 −2π

−π

0

π





δ



Abb. 9.54: Die Airy-Funktion.

Die obigen Gleichungen lassen sich damit wie folgt aufschreiben: F sin2 (δ/2) Ir = Ii 1 + F sin2 (δ/2)

(9.61)

und 1 It . (9.62) = Ii 1 + F sin2 (δ/2) −1  ≡ A (θ) heißt Airy-Funktion. Sie entspricht der Der Term 1 + F sin2 (δ/2) durchgelassenen Flussdichteverteilung und ist in Abbildung 9.54 grafisch dargestellt. Abbildung 9.55 zeigt die komplementäre Funktion [1 − A (θ)], also Gleichung (9.61). Bei δ/2 = mπ ist die Airy-Funktion für alle Werte von F und daher von r gleich eins. Geht r gegen eins, so wird die durchgelassene Flussdichte sehr klein mit Ausnahme der scharfen, um die Punkte δ/2 = mπ zentrierten Spitzen. Die Mehrstrahlinterferenz führt also zu einer Umverteilung der Energiedichte verglichen mit dem sinusförmigen Zweistrahl-Muster (an das die Kurven für einen geringen Reflexionsgrad erinnern). 1

Ir /Ii

F =200

r 2 = 0.87

0.5

r 2 = 0.18 F =1 r 2 = 0.046

F =0.2 0 −2π

−π

Abb. 9.55: Eins minus die Airy-Funktion.

0

π







δ

834

9 Interferenz

Diesen Effekt werden wir bei der Behandlung des Beugungsgitters ausführlicher besprechen. Wir werden dann sehen, dass die Spitzen umso deutlicher sichtbar werden, je mehr kohärente Quellen zu einem Interferenzmuster beitragen. Bedenken Sie stets, dass die Airy-Funktion eigentlich eine Funktion von θt oder θi [über ihre Abhängigkeit von δ, siehe die Gleichungen (9.34) und (9.35)] ist; daher die Notation A (θ). Jede Spitze in der Flussdichteverteilung gehört zu einem bestimmten δ und damit auch zu einem bestimmten θi . Im Falle einer planparallelen Platte besteht das Muster im durchgelassenen Licht aus schmalen, hellen Ringen auf einem fast völlig dunklen Hintergrund. Im reflektierten Licht dagegen erscheinen die Ringe schmal und dunkel auf einem fast gleichmäßig hellen Hintergrund. Um scharfe, schmale Ringe konstanter Dicke zu erhalten, kann man auf die zur Mehrstrahlinterferenz verwendeten reflektierenden Flächen eine dünne Versilberung auftragen.

9.6.1 Das Fabry-Perot-Interferometer Das von Charles Fabry und Alfred Perot gegen Ende des 19. Jahrhunderts erstmals konstruierte Mehrstrahl-Interferometer ist noch heute von beträchtlichem Interesse. Es dient nicht nur als Spektrometer mit besonders hoher Auflösung, sondern ist auch der Prototyp des Laserresonators. Im Prinzip besteht das Interferometer aus zwei ebenen, parallelen, stark reflektierenden Flächen, die den Abstand d voneinander haben. Neben diesem einfachsten Aufbau gibt es, wie wir sehen werden, eine Reihe weiterer, vielfach benutzter Anordnungen. Als reflektierende Flächen verwendet man in der Praxis halbversilberte oder aluminierte Glasplatten. Der Luftspalt zwischen ihnen beträgt bei interferometrischem Einsatz des Gerätes einige Millimeter bis zu mehreren Zentimetern. Verwendet man die Anordnung als Laserresonator, ist der Spalt oft bedeutend dicker. Lässt sich die Spaltbreite mechanisch durch Verschiebung eines Spiegels variieren, so spricht man von einem Interferometer (im eigentlichen Sinn). Sind die Spiegel dagegen unbeweglich und können nur durch einen Abstandshalter (meist Invar oder Quarz) parallel justiert werden, so nennt man das Gerät ein Etalon (was im weiteren Sinne natürlich auch ein Interferometer ist). Auch wenn man die beiden Oberflächen einer einzigen Quarzplatte geeignet poliert und verspiegelt, erhält man ein Etalon – der Zwischenraum zwischen den reflektierenden Flächen muss also nicht mit Luft ausgefüllt sein. Die unverspiegelten Seiten der Platten haben eine leichte Keilform mit einem Öffnungswinkel von wenigen Bogenminuten. So wird das Interferenzmuster, das durch Reflexion an diesen Seiten entsteht, weitgehend abgeschwächt. Das Etalon in Abbildung 9.56 wird von einer ausgedehnten Lichtquelle beleuchtet, etwa einer Quecksilber-Bogenlampe oder einem He-Ne-Laserstrahl, der auf einige Zentimeter Durchmesser verbreitert wurde. Letzteres erreicht man auf einfache Weise dadurch, dass man den Strahl in das rückseitige Ende eines Fernrohrs schickt, das auf Unendlich eingestellt ist. Indem man es anschließend durch eine Scheibe Mattglas

9.6 Mehrstrahlinterferenz

835

P

S2 S1 flächige Lichtquelle

Schirm

Linse d

fokussierende Linse

Abb. 9.56: Das Fabry-Perot-Etalon.

leitet, macht man das Strahlenbündel diffus. Nur der Verlauf eines von einem Punkt S1 auf der Quelle ausgehenden Strahls wurde in die Abbildung eingezeichnet. Der Strahl tritt durch die teilverspiegelte Platte ein und wird innerhalb des Spalts mehrfach reflektiert. Die durchgelassenen Strahlen werden von einer Linse auf einen Schirm fokussiert, wobei sich durch Interferenz entweder ein heller oder ein dunkler Fleck bildet. Betrachten wir die besondere Einfallsebene, die alle reflektierten Strahlen enthält. Jeder andere, von einem anderen Punkt S2 ausgehende und parallel zum ursprünglichen Strahl in dieser Einfallsebene liegende Strahl bildet im gleichen Punkt P auf dem Schirm einen Lichtfleck. Wie wir noch sehen werden, ist dann die Diskussion des vorangegangenen Abschnitts wieder anwendbar, und Gleichung (9.54) bestimmt die durchgelassene Flussdichte It . Die zahlreichen im Resonator erzeugten Wellen, die entweder von S1 oder von S2 ausgehend in P ankommen, sind jeweils untereinander kohärent. Dagegen sind die von S1 kommenden Wellen vollständig inkohärent mit den von S2 kommenden, sodass beide Strahlengruppen nicht miteinander interferieren. Der Beitrag zur Bestrahlungsstärke It im Punkt P ist einfach die Summe der beiden einzelnen Beiträge. Alle Strahlen, die unter einem bestimmten Winkel auf den Spalt fallen, führen zu einem einzigen Interferenzring mit gleichmäßiger Bestrahlungsstärke (Abb. 9.57). Bei Verwendung einer ausgedehnten, diffusen Lichtquelle haben die Interferenzstreifen die Form schmaler, konzentrischer Ringe, was dem Transmissionsmuster im Falle der Mehrstrahlinterferenz entspricht. Man kann das Ringsystem beobachten, wenn man mit auf Unendlich eingestelltem Auge direkt in das Etalon blickt. Die Aufgabe der fokussierenden Linse übernimmt hier das Auge. Bei großen Werten von d liegen die Ringe eng beieinander, und man muss möglicherweise ein Fernrohr verwenden, um das Bild zu vergrößern. Ein relativ billiger Teleskopvorsatz erfüllt denselben Zweck, und man kann damit die im Unendlichen lokalisierten Ringe fotografieren. Wie man aus den Ausführungen in Abschnitt 9.5 erwarten kann, lassen sich mit einer hellen Punktquelle reelle, nicht lokalisierte Streifen erzeugen.

9 Interferenz

836

Lichtquelle Linse Etalon Linse Schirm

(a)

(b)

Abb. 9.57: (a) Das Fabry-Perot-Etalon. (b) Axialsymmetrische Ringe, die man beim Blick in das Etalon erkennt (Foto E. H.).

Um den Reflexionsgrad (R = r 2 ) zu erhöhen, verwendet man häufig teildurchlässige Metallschichten. Diese absorbieren einen Anteil A der Flussdichte, der als Absorptionsgrad bezeichnet wird. Der Ausdruck tt + r 2 = 1 oder T +R=1

[4.60]

mit T als Durchlässigkeit muss nun umgeschrieben werden zu T + R + A = 1.

(9.63)

Eine weitere, durch die Metallschichten eingeführte Komplikation besteht in einer zusätzlichen Phasenverschiebung φ (θi ), die von null oder von π abweichen kann. Der Phasenunterschied zwischen zwei aufeinanderfolgenden durchgelassenen Wellen ist dann 4πnf d cos θt + 2φ . (9.64) δ= λ0 Unter den hier diskutierten Bedingungen ist θi klein, und φ kann als konstant angesehen werden. Allgemein ist d so groß und λ0 so klein, dass man φ vernachlässigen darf. Gleichung (9.54) lässt sich dann wie folgt formulieren: T2 It = Ii 1 + R2 − 2R cos δ oder, äquivalent, 2  T 1 It

. = Ii 1−R 1 + 4R/ (1 − R)2 sin2 (δ/2)

(9.65)

9.6 Mehrstrahlinterferenz

837

Unter Verwendung von Gleichung (9.63) und der Definition der Airy-Funktion erhalten wir  2 A It = 1− A (θ) ; (9.66) Ii (1 − R) für eine Absorption von null erhielten wir zum Vergleich It = A (θ) . Ii

[9.62]

Da der absorbierte Anteil A niemals null wird, liegen die Maxima der durchgelassenen Flussdichte, (It )max , immer etwas niedriger als Ii . (Sie erinnern sich, dass für (It )max gilt A (θ) = 1.) Entsprechend definiert ist das Durchlassmaximum, (It /Ii )max : 2  (It )max A = 1− . Ii (1 − R)

(9.67)

Eine 50 nm dicke Silberschicht kann sich dem Maximalwert von R (etwa 0,94) nähern, wobei T und A gleich 0,01 bzw. 0,05 sind. In diesem Fall ist das Durchlassmaximum 1 sehr klein. Die relative Bestrahlungsstärke des Streifenmusters ist trotzdem mit 36 durch die Airy-Funktion bestimmt, da It = A (θ) (It )max

(9.68)

ist. Ein Maß für die Schärfe der Ringe (dafür, wie schnell die Bestrahlungsstärke auf beiden Seiten des Maximums abfällt) ist gegeben durch die Breite in halber Höhe („Halbwertsbreite“) γ, die Signalbreite in Radiant bei It = (It )max /2 (Abb. 9.58).

1.0

0.5

0

Abb. 9.58: Fabry-Perot-Interferenzmuster.

9 Interferenz

838

Bei der Transmission treten Maxima bei bestimmten Werten der Phasendifferenz, δmax = 2πm, auf. Entsprechend ist die Bestrahlungsstärke auf die Hälfte ihres Maximalwerts abgesunken, also A (θ) = 12 , wenn δ = δmax ± δ1/2 ist. Wegen −1  A (θ) = 1 + F sin2 (δ/2) folgt dann bei −1 1   = 1 + F sin2 δ1/2 /2 2 unmittelbar

√  δ1/2 = 2 sin−1 1/ F .

√  √ Weil F im Allgemeinen groß ist, gilt sin−1 1/ F ≈ 1/ F . Für die Halbwertsbreite γ = 2δ1/2 erhält man dann √ (9.69) γ = 4/ F . Wie Sie wissen, ist F = 4R/ (1 − R)2 ; das Signal wird deshalb umso schärfer, je größer R ist. Eine weitere interessante Größe ist das Verhältnis des Abstands von benachbarten Maxima zur Halbwertsbreite, die so genannte Finesse F ≡ 2π/γ. Aus Gleichung (9.69) folgt √ π F . (9.70) F= 2 Im sichtbaren Spektralbereich beträgt die Finesse der einfachsten Fabry-Perot-Geräte ungefähr 30. Die physikalische Grenze von F ist durch die Abweichung der Spiegel von der Planparallelität bestimmt. Nimmt die Finesse zu, so wird die Halbwertsbreite, aber auch das Durchlassmaximum geringer. Übrigens kann man mit Systemen gekrümmter Spiegel unter Verwendung dielektrischer Dünnschichtbeläge eine Finesse von rund 1000 erreichen.16 Fabry-Perot-Spektroskopie Mithilfe des Fabry-Perot-Interferometers untersucht man häufig die Detailstruktur von Spektrallinien. An dieser Stelle soll die Interferenzspektroskopie nicht umfassend behandelt werden, sondern wir wollen lediglich die Terminologie einführen und die entsprechenden Herleitungen kurz umreißen.17 16

17

Siehe „Multiple Beam Interferometry“ von H. D. Polster in Appl. Opt. 8 (1969) 522 oder „The Optical Computer“, E. Abraham, C. Seaton und S. Smith, Sci. Am., Feb. 1983, S. 85 für eine Diskussion des Fabry-Perot-Interferometers als Optotransistor. Eine vollständigere Abhandlung findet sich unter anderem in Born und Wolf, Principles of Optics, und in W. E. Williams, Applications of Interferometry.

9.6 Mehrstrahlinterferenz

839 2π

It /(It )max

1 8/π 2

(Ia )max

(Ib )max

4/π 2 I 0 Δδ

δ

δa δb

Abb. 9.59: Einander überlagernde Streifen.

Wie wir gesehen haben, erzeugt eine hypothetische, ideal monochromatische Lichtwelle ein bestimmtes System von Interferenzringen. δ ist jedoch eine Funktion von λ0 , sodass sich zwei einander überlagerte Muster ergeben, wenn die Lichtquelle zwei monochromatische Komponenten aussendet. Überlagern die Ringe einander teilweise, so kann man nicht exakt sagen, wann die beiden Systeme einzeln erkennbar sind, wann man sie also als aufgelöst bezeichnen kann. Lord Rayleighs Kriterium18 zur Auflösung zweier einander überdeckender Spaltbilder mit gleicher Bestrahlungsstärke ist zwar etwas willkürlich, aber allgemein anerkannt, und es lässt zumindest einen Vergleich mit Prismen- oder Gittergeräten zu. Die wesentliche Aussage des Kriteriums besteht darin, dass zwei Ringe als gerade noch auflösbar behandelt werden, wenn die zusammengesetzte Bestrahlungsstärke beider Ringe im Mittelpunkt oder Sattelpunkt des resultierenden breiten Ringes das 8/π 2 -Fache der maximalen Bestrahlungsstärke ist. Dies bedeutet einfach, dass man einen breiten hellen Ring mit einem grauen Zentralbereich sieht. Für eine etwas genauere Analyse betrachten wir Abbildung 9.59, wobei wir an die obige Herleitung der Halbwertsbreite denken. Untersuchen wir zunächst den Fall gleicher Bestrahlungsstärken der einzelnen Ringe, (Ia )max = (Ib )max . Die Maxima der resultierenden Ringe treten auf bei δ = δa und δ = δb und haben gleiche Bestrahlungsstärken: (It )max = (Ia )max + I  .

(9.71)   Am Sattelpunkt ist die Bestrahlungsstärke 8/π 2 (It )max gleich der Summe der beiden einzelnen Bestrahlungsstärken. Unter Berücksichtigung von Gleichung (9.68) erhalten wir dann  (It )max  = [A (θ)]δ=δa +Δδ/2 + [A (θ)]δ=δb +Δδ/2 . (9.72) 8/π 2 (Ia )max 18

Das Kriterium wird im nächsten Kapitel im Zusammenhang mit der Beugung noch einmal aufgegriffen (siehe Abschn. 10.2.7).

9 Interferenz

840

Unter Verwendung von (It )max , gegeben durch Gleichung (9.71), und der Beziehung I = [A (θ)]δ=δa +Δδ (Ia )max können wir Gleichung (9.72) nach Δδ auflösen. Für große Werte von F ist 4,2 Δδ ≈ √ . F

(9.73)

Dies entspricht dem kleinstmöglichen Phaseninkrement (Δδ)min , das zwei auflösbare Streifen trennt. Man kann es zu den zugehörigen minimalen Inkrementen der Wellenlänge (Δλ0 )min , der Frequenz (Δν)min und der Wellenzahl (Δk)min in Beziehung setzen. Aus Gleichung (9.64) folgt für δ = 2πm mλ0 = 2nf d cos θt +

φλ0 . π

(9.74)

Den offensichtlich zu vernachlässigenden Term φλ0 /π lassen wir weg und differenzieren; so ergibt sich m (Δλ0 ) + λ0 (Δm) = 0 oder m λ0 =− . (Δλ0 ) (Δm) Das Minuszeichen lassen wir ebenfalls weg; es sagt lediglich aus, dass die Ordnung zunimmt, wenn λ0 abnimmt. Wenn δ sich um 2π ändert, ändert sich m um 1, 1 2π = , (Δδ) (Δm) und damit 2πm λ0 = . (Δλ0 ) (Δδ)

(9.75)

Der Quotient aus λ0 und dem kleinsten auflösbaren Wellenlängenunterschied (Δλ0 )min heißt chromatisches Auflösungsvermögen R eines Spektroskops. Bei nahezu senkrechtem Einfall ist R≡

2nf d λ0 ≈F (Δλ0 )min λ0

(9.76)

oder R ≈ Fm . Für eine Wellenlänge von 500 nm, nf d = 10 mm und R = 90% liegt das Auflösungsvermögen weit über einer Million, einem Wert, der durch die feinsten Beugungsgitter

9.6 Mehrstrahlinterferenz

841

erreicht wird. In diesem Beispiel ist außerdem (Δλ0 )min kleiner als 10−6 λ0 . Vom Frequenzstandpunkt aus gesehen ist die kleinste auflösbare Bandbreite gleich c (9.77) (Δν)min = F2nf d   wegen |Δν| = cΔλ0 /λ20 . Mit zunehmender Differenz der Wellenlängen der beiden von der Quelle abgestrahlten Komponenten wächst auch der Abstand der in Abbildung 9.59 gezeigten überlagerten Maxima. Wächst der Wellenlängenunterschied, so nähert sich der Streifen m-ter Ordnung für eine Wellenlänge λ0 dem Streifen (m + 1)-ter Ordnung für die andere Wellenlänge (λ0 − Δλ0 ). Die Wellenlänge (Δλ0 )FSB , bei der es zur Überlappung kommt, heißt freier Spektralbereich. Wie aus Gleichung (9.75) hervorgeht, entspricht eine Änderung von δ um 2π gerade (Δλ0 )FSB = λ0 /m oder, bei nahezu senkrechtem Einfall, (Δλ0 )FSB ≈ λ20 /2nf d

(9.78)

und analog (Δν)FSB ≈ c/2nf d .

(9.79)

Wenn wir beim obigen Beispiel bleiben (λ0 = 500 nm und nf d = 10 mm), so ist (Δλ0 )FSB = 0,0125 mm. Versuchen wir, das Auflösungsvermögen allein durch eine Vergrößerung von d zu steigern, so nimmt der freie Spektralbereich ab, womit eine Unschärfe durch Überlagerung der Ordnungen einhergeht. Man muss also gleichzeitig (Δλ0 )min so klein wie möglich und (Δλ0 )FSB so groß wie möglich machen. Und, siehe da: (Δλ0 )FSB =F. (Δλ0 )min

(9.80)

In Anbetracht der ursprünglichen Definition von F sollte dieses Resultat nicht sonderlich überraschen. Sowohl die Varianten als auch die Anwendungsmöglichkeiten des Fabry-Perot-Interferometers sind zahlreich. Etalons wurden mit anderen Etalons oder auch Gitter- und Prismenspektrographen hintereinander geschaltet, und dielektrische Mehrschichtbeläge wurden anstelle der metallischen Spiegelbeschichtungen verwendet. Heute sind Abtast- oder Scanningtechniken weit verbreitet. Misst man mit ihrer Hilfe Flussdichten, dann profitiert man davon, dass fotoelektrische Detektoren linearer arbeiten als fotografische Platten. Der Grundaufbau für eine Abtastung des Zentralflecks ist in Abbildung 9.60 gezeigt. Die Abtastung erreicht man durch Variation von δ, durch Änderung von nf oder d anstatt von cos θt . Bei einigen Anordnungen variiert man nf stetig durch Beeinflussung des Luftdrucks innerhalb des Etalons. Auch ein mechanisch schwingender Spiegel mit einer Verschiebung von λ0 /2 reicht aus, um

9 Interferenz

842

Detektor Lichtquelle Etalon Lochblende

Lochblende

Abb. 9.60: Abtastung des Zentralflecks.

den freien Spektralbereich abzutasten, entsprechend Δδ = 2π. Eine verbreitete Technik, mit der man dies erreichen kann, verwendet eine piezoelektrische Spiegelfassung. Diese Art von Material ändert seine Länge und damit d, wenn eine Spannung angelegt wird, und die Bewegung des Spiegels wird durch das Spannungsprofil bestimmt. Hier zeichnet man nicht die Bestrahlungsstärke in einem großen Raumbereich zu einem bestimmten Zeitpunkt fotografisch auf, sondern man verfolgt die Bestrahlungsstärke in einem einzelnen Raumpunkt über einen längeren Zeitraum hinweg. Der Aufbau des Etalons selbst wurde mittlerweile ebenfalls signifikant verändert. Pierre Connes beschrieb 1956 als Erster ein Fabry-Perot-Interferometer mit Kugelspiegel. Seitdem gewannen Systeme mit gekrümmten Spiegeln als Laser-Resonatoren an Bedeutung und sie werden zunehmend zur Spektralanalyse eingesetzt.

9.7

Anwendungen von Ein- und Mehrschichtfilmen

Die optischen Anwendungen, die dünne dielektrische Schichten in neuerer Zeit gefunden haben, sind von beachtlicher Vielfalt. Antireflexbeschichtungen von Oberflächen, sei es von Schaufensterglas oder von Qualitätslinsen für Kameras, gehören zum Alltag (Foto unten). Nicht absorbierende Mehrschicht-Strahlteiler und dichroitische Spiegel (farbselektive Strahlteiler, die bestimmte Wellenlängen durchlassen und reflektieren) können im Handel erworben werden.

Die Glasscheibe ist auf beiden Seiten mit einer kreisförmigen reflexmindernden Schicht ausgerüstet. (Foto E. H.)

9.7 Anwendungen von Ein- und Mehrschichtfilmen

sichtbare und IR-Strahlung

Strahlungsquelle sichtbare und IR-Strahlung

sichtbare Strahlung

843

rückseitig versilberter Spiegel Kaltlichtspiegel

IRStrahlung IR-Strahlung

Wärmereflexionsfilter

Abb. 9.61: Die obere Hälfte zeigt ein gewöhnliches System, die untere dagegen ein beschichtetes.

Abbildung 9.61 ist geteilt, um die Verwendung eines Kaltlichtspiegels in Verbindung mit einem Wärmereflexionsfilter zu zeigen. Mithilfe solcher Anordnungen leitet man z. B. die Infrarotstrahlung zur Rückseite eines Filmprojektors. Die intensive, unerwünschte Infrarotstrahlung, die von der Quelle ausgesendet wird, wird aus dem Strahl entfernt, um ein Überhitzen des Filmmaterials zu vermeiden. In der oberen Hälfte ist zum Vergleich ein gewöhnlicher, rückseitig versilberter Spiegel dargestellt. Solarzellen, eine der wichtigsten Energiequellen für Raumfahrzeuge, und sogar die Helme und Visiere der Astronauten sind mit ähnlichen hitzeabweisenden Beschichtungen versehen. Mit breiten und schmalen Bandfiltern, die jeweils nur einen speziellen Bereich des Spektrums durchlassen, kann man den gesamten Bereich vom Infraroten bis zum Ultravioletten abdecken. Solche Filter für den sichtbaren Bereich spielen z. B. in Fernsehkameras bei der Zerlegung des Bildes in seine Farbanteile eine Rolle; Infrarotfilter dieser Art findet man in Raketenlenksystemen, CO2 -Lasern und Horizontsensoren für die Steuerung von Satelliten. Die Anwendungen dünner Schichten sind ebenso zahlreich wie die Strukturvarianten, die von der einfachen Einzelschicht bis hin zu ausgeklügelten Anordnungen von hundert oder mehr Schichten reichen. Unsere Behandlung der Mehrschichtfilmtheorie umfasst die gesamten elektrischen und magnetischen Felder sowie deren Randbedingungen in den verschiedenen Bereichen. Dies ist deutlich praktikabler als die früher verwendete Mehrwellentheorie.19

9.7.1 Mathematische Behandlung Wir betrachten die in Abbildung 9.62 gezeigte linear polarisierte Welle, die auf eine dünne dielektrische Schicht zwischen zwei transparenten Medien trifft. In der Praxis könnte dies einer dielektrischen, einen Bruchteil einer Wellenlänge dicken 19

Eine sehr verständlich geschriebene, nichtmathematische Diskussion findet sich in P. Baumeister und G. Pincus, „Optical Interference Coatings“, Sci. Am. 223 (1970) 59.

9 Interferenz

844

iI

H

rI

EiI

ErI kiI

I

krI

H

n0

θiI EtI ErII n1

d

θiII EiII ErII

II

ns EtII

HtII

θtII

Abb. 9.62: Felder an den Grenzflächen.

ktII

Schicht entsprechen, die auf die Oberfläche einer Linse, eines Spiegels oder eines Prismas aufgebracht ist. Eines wollen wir von Anfang an klarstellen: Jede Welle  , E ErI , ErII tII usw. entspricht der Resultierenden aller möglichen in diese Richtung laufenden Wellen in dem betrachteten Punkt des Mediums. Der Summationsprozess ist daher in unserer Herleitung enthalten. Wie in Abschnitt 4.6.2 erläutert, fordern die Randbedingungen, dass die tangentialen Komponenten sowohl des elektrischen (E) als auch des magnetischen (H = B/μ) Feldes durch die Grenzflächen stetig (d. h. auf beiden Seiten gleich) sind. An der Grenzfläche I ist  EI = EiI + ErI = EtI + ErII

und

(9.81)



0 (EiI − ErI )n0 cos θiI μ0  0  = (EtI − ErII )n1 cos θiII . μ0

HI =

(9.82)

Dabei haben wir uns zunutze gemacht, dass E und H in nicht magnetischen Medien durch den Brechungsindex und den Einheitsvektor der Ausbreitung verknüpft sind:  0 ˆ nk × E . H= μ0

9.7 Anwendungen von Ein- und Mehrschichtfilmen

845

An der Grenzfläche II ist EII = EiII + ErII = EtII und

 HII =

0 (EiII − ErII ) n1 cos θiII = μ0

(9.83) 

0 EtII ns cos θtII , μ0

(9.84)

wobei ns der Brechungsindex des Substrats ist. In Übereinstimmung mit Gleichung (9.33) erfährt eine Welle beim Durchgang durch die Schicht eine Phasenverschiebung von k0 (2n1 d cos θiII )/2, die wir mit k0 h bezeichnen wollen, sodass EiII = EtI e−ik0 h

(9.85)

 e+ik0 h ErII = ErII

(9.86)

und ist. Die Gleichungen (9.83) und (9.84) können dann wie folgt geschrieben werden:  e+ik0 h EII = EtI e−ik0 h + ErII

und

 0  e+ik0 h n1 cos θiII . HII = EtI e−ik0 h − ErII μ0

(9.87) (9.88)

 auflösen. Setzt man die Die letzten beiden Gleichungen kann man nach EtI und ErII entsprechenden Ausdrücke in Gleichung (9.81) bzw. (9.82) ein, so erhält man

EI = EII cos k0 h + HII (i sin k0 h) /Υ1

(9.89)

HI = EII Υ1 i sin k0 h + HII cos k0 h

(9.90)

und mit

 Υ1 ≡

0 n1 cos θiII . μ0

Liegt E in der Einfallsebene, so erhält man ähnliche Beziehungen, jedoch ist nun  0 n1 / cos θiII . Υ1 ≡ μ0 In Matrixschreibweise nehmen die oben gegebenen linearen Beziehungen die Form    EII cos k0 h (i sin k0 h) /Υ1 EI = (9.91) HI Υ1 i sin k0 h cos k0 h HII oder



 EII EI = MI HI HII

(9.92)

9 Interferenz

846

an. Die charakteristische Matrix MI verknüpft die Felder an den jeweils benachbarten Grenzflächen. Sind auf eine Unterlage übereinander zwei Schichten aufgebracht, dann gibt es drei Grenzflächen:   EIII EII = MII . (9.93) HII HIII Multiplizieren wir beide Seiten dieses Ausdrucks mit MI , so erhalten wir   EIII EI = MI MII . HI HIII

(9.94)

Gibt allgemein p die Anzahl der Schichten an, zu denen jeweils bestimmte Werte von n und h gehören, so lautet die Beziehung zwischen der ersten und der letzten Grenzfläche   E(p+1) EI = MI MII · · · Mp . (9.95) HI H(p+1) Die charakteristische Matrix des Gesamtsystems ergibt sich als Produkt (in der richtigen Reihenfolge) der einzelnen 2×2-Matrizen, nämlich  m11 m12 . (9.96) M = MI MII · · · Mp = m21 m22 Um dies alles in einen Zusammenhang zu bringen, wollen wir mit dem oben hergeleiteten Schema Ausdrücke für die Amplitudenkoeffizienten der Reflexion und der Transmission entwickeln. Wir formulieren Gleichung (9.92) mithilfe der Randbedingungen (9.81), (9.82) und (9.84) um und setzen   0 0 n0 cos θiI sowie Υs = ns cos θtII . Υ0 = μ0 μ0 Damit erhalten wir   EtII (EiI + ErI ) = M1 . EtII Υs (EiI − ErI ) Υ0 Beim Ausrechnen der Matrizen wird die letzte Gleichung zu 1 + r = m11 t + m12 Υs t und (1 − r) Υ0 = m21 t + m22 Υs t wegen r=

ErI EiI

und

t=

EtII . EiI

9.7 Anwendungen von Ein- und Mehrschichtfilmen

847

Folglich ist r=

Υ0 m11 + Υ0 Υs m12 − m21 − Υs m22 Υ0 m11 + Υ0 Υs m12 + m21 + Υs m22

(9.97)

t=

2Υ0 . Υ0 m11 + Υ0 Υs m12 + m21 + Υs m22

(9.98)

und

Um für eine bestimmte Anordnung von Schichten r oder t zu bestimmen, müssen wir lediglich die charakteristische Matrix jeder Schicht berechnen, alle Matrizen multiplizieren und die sich ergebenden Matrixelemente in die obigen Gleichungen einsetzen.

9.7.2 Reflexmindernde Schichten Betrachten wir nun den sehr wichtigen Spezialfall des senkrechten Einfalls, also θiI = θiII = θtII = 0 . Dieser Fall ist nicht nur der einfachste, sondern er wird in realen Systemen auch oft (nahezu) erreicht. Wenn wir r einen Index hinzufügen, der die Anzahl der Schichten angibt, dann wird der Reflexionskoeffizient einer einzelnen Schicht zu   n1 (n0 − ns ) cos k0 h + i n0 ns − n21 sin k0 h   . (9.99) r1 = n1 (n0 + ns ) cos k0 h + i n0 ns + n21 sin k0 h Die Multiplikation von r1 mit seinem konjugiert Komplexen führt zum Reflexionsgrad  2 n21 (n0 − ns )2 cos2 k0 h + n0 ns − n21 sin2 k0 h . (9.100) R1 =  2 n21 (n0 + ns )2 cos2 k0 h + n0 ns + n21 sin2 k0 h Dieser Ausdruck wird besonders einfach für k0 h = 12 π, also für den Fall, dass die optische Dicke h der Schicht ein ungeradzahliges Vielfaches von 14 λ0 ist. Dann wird d = 14 λf und  2 n0 ns − n21 (9.101) R1 =  2 , n0 ns + n21 was interessanterweise gleich null ist für n21 = n0 ns .

(9.102)

Im Allgemeinen wird d so gewählt, dass h gleich 14 λ0 im gelbgrünen Bereich des sichtbaren Spektrums liegt, wo das menschliche Auge am empfindlichsten ist. Zur Beschichtung mit niedrigem Brechungsindex verwendet man oft Kryolith, ein Natrium-Aluminium-Fluorid (n = 1,35), und Magnesiumfluorid (n = 1,38) – Letzteres bedeutend häufiger, da die Verbindung erheblich widerstandsfähiger ist. Auf einem

9 Interferenz

848 Tabelle 9.1: Brechungsindizes einiger Antireflexbeschichtungen.

Material Na3 AlF6 MgF2 SiO2 Brillenglas ThF4 MgO Al2 O3 SiO Si3 N4

Brechungsindex 1,35 1,3–1,4 1,46 1,5–1,7 1,52 1,74 1,8–1,9 1,8–1,9 1,9

Material ZrO2 Ta2 O5 TiO2 CeO2 ZnS CdTe Si Ge PbTe

Brechungsindex 2,0 2,1–2,3 2,3 2,3–2,4 2,32 2,69 3,85 4,05 5,1

Glassubstrat (ns ≈ 1,5) sind die Brechungsindizes beider Substanzen noch etwas zu hoch, um Gleichung (9.102) zu erfüllen. Trotzdem reduziert eine einzelne 14 λ0 -Schicht von MgF2 den Reflexionsgrad von Glas im sichtbaren Spektrum von etwa 4 % auf etwas mehr als 1 %. Heutzutage werden nahezu alle Elemente optischer Instrumente mit reflexmindernden Schichten versehen. Geeignete Beschichtungen auf Kameralinsen bewirken sowohl eine Abnahme der Unschärfe durch Streulicht im Inneren als auch eine merkliche Zunahme der Bildhelligkeit. Bei Wellenlängen auf beiden Seiten des mittleren, gelbgrünen Gebietes nimmt R zu, und die Linsenoberfläche erscheint im reflektierten Licht blaurot. Für eine reflexmindernde 14 λ0 -Doppelschicht ist M = MI MII oder, spezieller,   0 i/Υ2 0 i/Υ1 . M= iΥ1 0 iΥ2 0 Bei senkrechtem Einfall wird dies zu  0 −n2 /n1 . M= 0 −n1 /n2

(9.103)

(9.104)

Setzen wir die geeigneten Matrixelemente in Gleichung (9.97) ein, so erhalten wir r2 und daraus durch Quadrieren den Reflexionsgrad  2 2 n2 n0 − ns n21 . (9.105) R2 = n22 n0 + ns n21 Soll R2 bei einer bestimmten Wellenlänge exakt null werden, so muss  2 ns n2 = n1 n0

(9.106)

9.7 Anwendungen von Ein- und Mehrschichtfilmen

849

sein. Diese Art Schicht wird als λ/4-Doppelschichtbelag mit einzelnem Minimum bezeichnet. Werden n1 und n2 so klein wie möglich, dann liegt das einzelne breiteste Minimum von R bei der gewählten Frequenz bei null. Aus Gleichung (9.106) geht hervor, dass dann n2 > n1 ist; ein System aus (Glas)-(hochbrechender Schicht)(niedrigbrechender Schicht)-(Luft) bezeichnet man auch als gHLa. Zirconiumdioxid (n = 2,1), Titandioxid (n = 2,40) und Zinksulfid (n = 2,32) werden allgemein als HSchicht verwendet, Magnesiumfluorid (n = 1,38) und Cerfluorid (n = 1,63) dagegen als L-Schicht.

Bei dieser Aufnahme waren die Linsenelemente mit einer einzelnen MgF2 -Schicht ausgerüstet. (Foto mit frdl. Erlaubnis des Optical Coating Laboratory, Inc., Santa Rosa, California.)

Bei dieser Aufnahme waren die Linsenelemente mit einer Mehrfachbeschichtung ausgerüstet. (Foto mit frdl. Erlaubnis des Optical Coating Laboratory, Inc., Santa Rosa, California.)

Speziellen Anforderungen an die spektrale Empfindlichkeit, den Einfallswinkel, die Kosten usw. kann man mit anderen Doppel- und Dreischichtsystemen entsprechen. Das linke Foto wurde mit einem aus 15 Elementen bestehenden Zoom-Objektiv direkt im Gegenlicht einer 150W-Lampe aufgenommen. Die Elemente waren mit einer einzelnen MgF2 -Schicht überzogen. Für das rechte Foto wurde ein reflexmindernder Dreischichtbelag verwendet. Der verbesserte Kontrast und die Verringerung des Blendlichts sind unübersehbar.

9.7.3 Periodische Mehrschichtsysteme Das einfachste periodische System ist ein Satz von λ/4-Schichten. Die in Abbildung 9.63 gezeigte periodische Anordnung von Schichten mit abwechselnd hohem und niedrigem Brechungsindex wird bezeichnet mit g (HL)3 a . Die allgemeine Form eines Teils des spektralen Reflexionsgrades einiger Mehrschichtfilter ist in Abbildung 9.64 dargestellt. Die Breite der mittleren Zone mit hohem Reflexionsgrad nimmt mit wachsenden Werten des Quotienten nH /nL zu, die Höhe mit der Anzahl der Schichten. Der maximale Reflexionsgrad einer periodischen Struktur wie beispielsweise g (HL)m a kann durch Hinzufügen einer weiteren H-Schicht weiter gesteigert werden. Das neue System hat dann die Form g (HL)m Ha. Auf diese Weise lassen sich Spiegelanordnungen mit sehr hohem Reflexionsgrad herstellen.

9 Interferenz

850 Luft

Luft

Glassubstrat

Reflexionsgrad

-Doppelschicht

Satz von

Abb. 9.63: Periodische Struktur. Zur Vereinfachung wurden die Brechungseffekte weggelassen.

-Schichten

1.0

0

0.8

0.2

0.6

0.4

0.4

0.6

0.2

0.8

0

Durchl¨assigkeit

Glassubstrat

1.0 330

550

770

Wellenl¨ange (nm)

Abb. 9.64: Reflexionsvermögen und Durchlässigkeit einiger periodischer Strukturen.

Das kleine Maximum auf der Seite kurzer Wellenlängen kann man durch Addition je einer niedrig brechenden λ/8-Schicht auf beiden Seiten des Systems vermindern. Die ganze Anordnung wird dann mit g (0,5L) (HL)m H (0,5L) a bezeichnet. Dadurch wird die Durchlässigkeit für den kurzwelligen (hochfrequenten) Spektralbereich vergrößert, weshalb man das System auch Hochpassfilter nennt. Analog dazu entspricht die Struktur g(0,5H)L(HL)m (0,5H)a dem Fall, dass die abschließenden H-Schichten λ/8 dick sind. Diese Anordnung ist im langwelligen, niederfrequenten Spektralbereich besonders gut durchlässig und heißt daher Tiefpassfilter. Bei nicht senkrechtem Einfall (bis etwa 30◦ ) ist die Wirkung von Dünnschichtbelägen häufig nur geringfügig beeinträchtigt. Allgemein bewirkt die Vergrößerung des Einfallswinkels eine Verschiebung der Kurve des Reflexionsgrades nach unten zu etwas

9.7 Anwendungen von Ein- und Mehrschichtfilmen

851

kleineren Wellenlängen. Dieses Verhalten zeigen auch einige natürlich vorkommende periodische Strukturen wie Pfauen- und Kolibrifedern, Schmetterlingsflügel und Deckflügel einiger Käferarten. Das letzte hier behandelte Mehrschichtsystem soll das Interferenz- oder, genauer gesagt, das Fabry-Perot-Filter sein. Liegt der Abstand zwischen den Platten eines Etalons in der Größenordnung von λ, so liegen die zu den Durchlässigkeitsmaxima gehörenden Wellenlängen weit auseinander. Mithilfe von Farbglas- oder Gelatinefiltern lassen sich dann alle Maxima außer einem ausblenden. Das Spektrum des durchgelassenen Lichts ist somit sehr schmal, und das Etalon dient als so genanntes Schmalbandfilter. Um ein solches Gerät herzustellen, bringt man eine halbdurchlässige Metallschicht gefolgt von einer Zwischenschicht aus MgF2 und einer weiteren Metallschicht auf ein Glassubstrat auf. Die nur aus dielektrischen Schichten bestehenden, im Wesentlichen nichtabsorbierenden Fabry-Perot-Filter sind analog dazu aufgebaut; zwei Strukturbeispiele sind g HLH LL HLH a und g HLHL HH LHLH a . Die charakteristische Matrix ist im ersten Fall M = MH ML MH ML ML MH ML MH , aber aus Gleichung (9.104) folgt  −1 0 ML ML = 0 −1 oder ML ML = −J , wobei J die Einheitsmatrix ist. Die mittlere Doppelschicht, die einem Fabry-PerotResonator entspricht, ist eine halbe Wellenlänge dick (d = 12 λf ). Sie hat deshalb keine Auswirkungen auf den Reflexionsgrad bei der speziellen, hier betrachteten Wellenlänge, und man nennt sie reflexionsfreie Schicht. Folglich ist M = −MH ML MH MH ML MH . Dieselben Bedingungen treten in der Mitte der Anordnung immer wieder auf, und schließlich wird  10 M= . 01

9 Interferenz

852

In Abbildung 9.27 hängt der optische Wegunterschied von λ (der Farbe des Lichts) und vom Blickwinkel ab. Die Tinte, die zum Drucken der Notenwerte auf US-amerikanischen Banknoten verwendet wird, enthält strukturierte Partikel – winzige, schuppenartige mehrschichtige Interferenzfilter, die alle in gleicher Richtung angeordnet sind. Sie erzeugen auf ähnliche Weise Interferenzfarben: Auf dem gezeigten Geldschein erscheint die Zahl 20 je nach Blickwinkel schwarz oder grün. (Foto E. H.)

Bei der Frequenz, für die das Filter konstruiert wird, reduziert sich r bei senkrechtem Einfall gemäß Gleichung (9.97) auf den Wert für eine unbeschichtete Unterlage, r=

n0 − ns . n0 + ns

Insbesondere beträgt für Glas (ns = 1,5) in Luft (n0 = 1) die maximale Durchlässigkeit 96%, wobei allerdings Reflexionen von der Rückseite des Substrats sowie Verluste im Sperrfilter und in den Schichten selbst vernachlässigt wurden.

9.8

Anwendungen der Interferometrie

Die Prinzipien der Interferometrie fanden vielfältige Anwendungen. Einige davon sind mittlerweile nur noch von historischer oder didaktischer Bedeutung, anderen dagegen begegnet man verbreitet in der Praxis. Die Erfindung des Lasers und die daraus folgende Verfügbarkeit von hochgradig kohärentem, quasimonochromatischem Licht hat die Konstruktion neuer Interferometer beträchtlich erleichtert.

9.8.1 Streulichtinterferenz Der wahrscheinlich früheste Bericht über die Beobachtung von Interferenzmustern, die von Streulicht herrühren, findet sich in Sir Isaac Newtons Werk Opticks (1704, Buch 2, Teil IV). Für uns ist das Phänomen aus zwei Gründen interessant: Erstens bietet es eine einfache Möglichkeit, schöne bunte Interferenzringe zu sehen; zweitens bildet es die Grundlage eines bemerkenswert einfachen, höchst nützlichen Interferometers. Um die Erscheinung zu beobachten, genügt es, eine dünne Schicht Talkumpuder auf die Oberfläche eines gewöhnlichen, rückseitig versilberten Spiegels zu bringen

9.8 Anwendungen der Interferometrie

853

Punktquelle

verspiegelte Fläche

Streuzentren

Spiegel

Abb. 9.65: Interferenz von Streulicht.

(mit einem beschlagenen Spiegel funktioniert es ebenfalls). Weder die Dicke noch die Gleichmäßigkeit der Schicht ist von entscheidender Bedeutung; wichtig dagegen ist die Verwendung einer hellen Punktlichtquelle. Diese lässt sich beispielsweise herstellen, indem man ein dickes Stück Pappe, versehen mit einem Loch von ungefähr 5 mm Durchmesser, auf eine gute Taschenlampe klebt. Stellen Sie sich zunächst rund einen Meter vom Spiegel entfernt auf. Kommen Sie dann wesentlich näher, so können Sie die Ringe schlecht sehen, denn sie sind dann sehr dünn und liegen eng beieinander. Halten Sie die Taschenlampe neben Ihr Gesicht und beleuchten Sie den Spiegel so, dass die sichtbare Reflexion der Taschenlampe möglichst hell erscheint. Sie sehen nun deutlich eine Reihe abwechselnd heller und dunkler Bänder. In Abbildung 9.65 sind zwei kohärente, von der Punktquelle ausgehende Strahlen gezeigt, die auf verschiedenen Wegen zu P gelangt sind. Ein Strahl wird vom Spiegel reflektiert und dann an einem einzelnen Talkumkörnchen in Richtung P gestreut. Der zweite Strahl wird zunächst von dem Körnchen nach unten gestreut, durchquert dann den Spiegel und wird nach P reflektiert. Der resultierende optische Weglängenunterschied bestimmt die Interferenz in P . Bei senkrechtem Einfall besteht das Muster aus einer Reihe konzentrischer Ringe mit dem Radius20 1/2  nmλa2 b2 ρ≈ . d (a2 − b2 ) Betrachten wir nun ein verwandtes Gerät, das v. a. bei der Prüfung optischer Systeme nützlich ist. Diese so genannte Streuplatte besteht im Wesentlichen aus einer transparenten Platte mit leicht angerauter Oberfläche. In einer Anordnung wie in Ab20

Für Einzelheiten siehe A. J. deWitte, „Interference in Scattered Light“, Am. J. Phys. 35 (1967) 301.

9 Interferenz

854 Quasimonochromatische Punktquelle

Kameraobjektiv

Bildebene

Streuplatte

Strahlleiter Testspiegel

Abb. 9.66: Funktionsschema einer Streuplatte. Nach R. M. Scott, Appl. Opt. 8 (1969) 531.

bildung 9.66 dient die Platte als amplitudenspaltendes Element. Dazu muss die Platte ein Symmetriezentrum haben, d. h., zu jedem Streuzentrum muss es einen Partner geben, der symmetrisch bezüglich eines zentralen Punktes angeordnet ist. Im hier betrachteten System wird eine Punktquelle S, die quasimonochromatisches Licht aussendet, durch die Linse L1 auf der zu prüfenden Spiegelfläche im Punkt A abgebildet. Ein Teil des von der Quelle ausgehenden Lichts wird von der Streuplatte gestreut und beleuchtet danach die gesamte Spiegeloberfläche. Der Spiegel reflektiert seinerseits Licht zur Streuplatte. Wie das Licht, welches das Bild der Blende im Punkt A erzeugt, gelangt auch dieses reflektierte Licht noch einmal durch die Streuplatte, bevor es die Bildebene (einen Schirm oder eine Kamera) erreicht, auf der das Interferenzbild erscheint. Die Ursache für den zugrundeliegenden Interferenzprozess besteht darin, dass jeder Punkt der Bildebene mit Licht beleuchtet wird, das zwei verschiedene Wege zurückgelegt hat: Einer geht von A aus, der andere von einem Streulicht reflektierenden Punkt B. So seltsam es auf den ersten Blick auch erscheinen mag, es ergeben sich deutlich voneinander abgegrenzte Ringe, wie man auf dem Foto auf S. 855 sieht. Um den Strahlenverlauf durch das System genauer zu untersuchen, betrachten wir das ursprünglich auf die Streuplatte fallende Licht unter der Annahme, dass es sich dabei um eine ebene Welle handelt (Abb. 9.67). Nach dem Durchgang durch die Streuplatte hat sich die einfallende ebene Wellenfront Ei in die durchgelassene Wellenfront ET verwandelt. Letztere zerlegen wir in Fourier-Komponenten, die ihrerseits ebene Wellen sind: ET = E1 + E2 + · · · .

(9.107)

9.8 Anwendungen der Interferometrie

855

E

E

(a)

E

E

E

Streuplatte

Streuplatte

Streuplatte

Interferenzmuster im Streulicht. (Foto E. H.)

E E

E

(b)

E

E

(c)

Abb. 9.67: Wellenfronten beim Durchgang durch die Streuplatte.

Zwei dieser Komponenten sind in Abbildung 9.67 a dargestellt. Nun wollen wir den Komponenten jeweils eine spezielle Bedeutung zuordnen: E1 sei das Licht, das sich in Abbildung 9.66 zum Punkt A bewegt, und E2 bewege sich zum Punkt B. Die Analyse der folgenden Schritte verläuft in analoger Weise. Dem Anteil der Wellenfront, der von A zurückkehrt, entspreche die Wellenfront EA in Abbildung 9.67 b. Die Streuplatte transformiert diese Front in eine unregelmäßige Brechungswelle EAT (Abb. 9.67 b). Auch diese komplizierte Konfiguration lässt sich, wie oben beschrieben, in ebene Wellen als Fourier-Komponenten zerlegen. In Abbildung 9.67 b wurden zwei dieser Komponenten eingezeichnet; eine bewegt sich nach rechts, die andere ist um einen Winkel θ geneigt. Letztere Wellenfront, mit EAθ bezeichnet, wird von der Linse L2 auf den Punkt P des Schirms fokussiert (Abb. 9.66). Die vom Punkt B zur Streuplatte zurückkehrende Wellenfront ist in Abbildung 9.67 c mit EB gekennzeichnet. Beim Durchgang durch die Streuplatte wird sie in die Welle EBT umgeformt. Eine der Fourier-Komponenten dieser Wellenfront, EBθ , ist um den Winkel θ geneigt und wird daher in demselben Punkt P auf dem Schirm fokussiert. Einige der in P ankommenden Wellen sind kohärent in dem Sinne, dass Interferenz auftritt. Um die resultierende Bestrahlungsstärke Ip zu erhalten, addiert man zunächst

9 Interferenz

856

die Amplituden aller in P eintreffenden Wellen zu Ep , welches man dann quadriert und den zeitlichen Mittelwert bildet. Bisher wurden nur zwei Punktquellen auf dem Spiegel berücksichtigt. In Wirklichkeit wird natürlich die gesamte Spiegelfläche beleuchtet, und jeder Punkt dieser Fläche dient als Sekundärquelle zurückkehrender Wellen. Alle diese Wellen werden durch die Streuplatte deformiert und lassen sich wie beschrieben in ebene Wellen zerlegen. In jedem Satz von Wellenkomponenten gibt es eine, die exakt im Winkel θ geneigt ist und die im Punkt P auf dem Schirm fokussiert wird. Die resultierende Amplitude hat dann die Form Ep = EAθ + EBθ + · · · . Das Licht, welches die Bildebene erreicht, kann man sich als aus optischen Teilfeldern zusammengesetzt vorstellen, wovon zwei von besonderem Interesse sind. Das eine ergibt sich aus dem Licht, das nur beim Durchgang durch die Platte auf dem Weg zum Spiegel gestreut wurde, das andere aus dem Licht, das nur auf dem Weg zur Bildebene gestreut wurde. Ersteres beleuchtet großflächig den Testspiegel und bewirkt eine Abbildung des Spiegels auf dem Schirm. Letzteres wurde anfangs in dem Gebiet um A fokussiert und erzeugt einen diffusen Streulichtschleier auf dem Schirm. Punkt A wird so gewählt, dass seine unmittelbare Umgebung möglichst frei von Aberrationen ist. In diesem Fall dient die von diesem Punkt reflektierte Welle als Bezugswelle, mit der man die der ganzen Spiegeloberfläche entsprechende Wellenfront vergleichen kann. Im Interferenzmuster machen sich etwaige Abweichungen der Spiegeloberfläche von der Idealform als Fizeau-Streifen bemerkbar.21

9.8.2 Das Twyman-Green-Interferometer Das Twyman-Green=Interferometer, im Prinzip eine Variante des Michelson-Interferometers, ist auf dem Gebiet der modernen optischen Prüfverfahren von großer Bedeutung. Zu seinen speziellen Merkmalen (siehe Abb. 9.68) gehört eine quasimonochromatische Punktquelle und eine Linse L1 zur Erzeugung ankommender ebener Wellen sowie eine Linse L2 , mit deren Hilfe alles Licht von der Blende ins Auge fällt, sodass man das gesamte Feld – alle Teile von M1 und M2 – sehen kann. Als Lichtquelle hervorragender Qualität dienen kontinuierliche Laser, die sowohl große Weglängenunterschiede als auch kurze Belichtungszeiten des fotografischen Systems ermöglichen. Dadurch werden unerwünschte Vibrationseffekte vermindert. Der Twyman-Green-Laser in seinen verschiedenen Ausführungen gehört zu den effektivsten Prüfwerkzeugen der Optik. Die Abbildung zeigt die Untersuchung einer 21

Eine vertiefende, aber knappe Diskussion der Streuplatte findet sich in J. M. Burch, Nature 171 (1953) 889 und J. Opt. Soc. Am. 52 (1962) 600. Hingewiesen werden soll auch auf J. Strong, Concepts of Classical Optics, S. 383. Siehe auch R. M. Scott, „Scatter Plate Interferometry“, Appl. Opt. 8 (1969) 531 und J. B. Houston jr., „How to Make and Use a Scatter Plate Interferometer“, Optical Spectra (Juni 1970) S. 32.

9.8 Anwendungen der Interferometrie

857

Planspiegel Kugelspiegel

Strahlteiler Wellenfronten

Testlinse

Lochblende

Abb. 9.68: Das Twyman-Green-Interferometer. (Foto E. H.)

Linse mit einer solchen Vorrichtung. Der Krümmungsmittelpunkt des Kugelspiegels fällt mit dem Brennpunkt der Linse zusammen. Ist die untersuchte Linse frei von Aberrationen, so ist das austretende, zum Strahlteiler zurückkehrende Licht wieder eine ebene Welle. Wird die Wellenfront dagegen von Astigmatismus, Koma oder sphärischer Aberration verformt, so kann man ein entsprechendes Interferenzmuster deutlich sehen und fotografieren. Ersetzt man M2 durch einen Planspiegel, so lassen sich auch andere optische Bauelemente (Prismen, planparallele Platten usw.) untersuchen. Bei der Auswertung des Interferenzbildes markiert der Optiker die Oberfläche dort, wo zu hohe oder zu niedrige Stellen ausgeglichen werden müssen. Während der Herstellung von optischen Präzisionssystemen, Fernrohren oder Kameras für große Höhen werden die Interferogramme teilweise elektronisch aufgezeichnet und computergestützt ausgewertet. Anschließend lassen sich Konturenkarten der Oberflächen oder perspektivische, „dreidimensionale“ Darstellungen der vom untersuchten Element gestörten Wellenfront ausdrucken. Geht man während des gesamten Produktionsprozesses in dieser Weise vor, so erhält man optische Instrumente hoher Qualität – Systeme mit Wellenfrontaberrationen in der Größenordnung von Bruchteilen einer Wellenlänge.

9.8.3 Das rotierende Sagnac-Interferometer Mithilfe des Sagnac-Interferometers misst man Rotationsgeschwindigkeiten. Speziell zu diesem Zweck konstruiert wurde der Ringlaser, vom Prinzip her ein SagnacInterferometer, das in einem oder mehreren Armen einen Laser enthält. Das erste Ringlaser-Gyroskop wurde 1963 gebaut; an verschiedenen Varianten des Geräts wird noch gearbeitet (siehe Foto S. 858). Die ersten Experimente, die den Anstoß zu diesen Bemühungen gaben, wurden 1911 von Sagnac durchgeführt. Dieser ließ das gesamte Interferometer, die Spiegel, die Lichtquelle und den Detektor um eine Achse senkrecht zum Mittelpunkt des Systems rotieren (Abb. 9.69). Aus Abschnitt 9.4.2 wissen wir, dass das Sagnac-Interferometer von zwei einander überlagernden Strahlen durchlaufen wird; ein Strahl läuft im Uhrzeigersinn, einer entgegen dem Uhrzeigersinn. Durch

9 Interferenz

858

Ringlaser-Gyroskop. (Mit frdl. Erlaubnis von Autonetics, einer Abteilung der Boeing North America Inc.)

Abb. 9.69: Rotierendes Sagnac-Interferometer. Das ursprüngliche Modell hatte Seitenlängen von einem Meter, die Rotationsgeschwindigkeit betrug 120 U/min.

die Rotation wird der Weg eines der beiden Strahlen im Vergleich zu dem des anderen verkürzt. Dadurch werden die Streifen des Interferenzmusters proportional zur Winkelgeschwindigkeit ω verschoben. Im Ringlaser entspricht dem eine relative Frequenzverschiebung der beiden Strahlen, die zu ω proportional ist. Betrachten wir die Anordnung in Abbildung 9.69. Die Ecke A bewegt sich (ebenso wie alle anderen Ecken) mit einer linearen Geschwindigkeit von v = Rω; R ist die Hälfte der Diagonale des Quadrats. Bei klassischer (nichtrelativistischer) Argumentation beträgt die Laufzeit des Lichts entlang AB √ R 2 √ tAB = c−v 2 oder 2R . tAB = √ 2c − ωR Die Laufzeit von A nach D beträgt tAD = √

2R . 2c + ωR

Die Gesamtzeit für den links- bzw. rechtsdrehenden Umlauf ist gegeben durch tlinks = √

8R 2c + ωR

9.8 Anwendungen der Interferometrie

859

und trechts = √

8R . 2c − ωR

Für ωR  c ist die Differenz zwischen den beiden Intervallen gleich Δt = trechts − tlinks oder, bei Verwendung der binomischen Reihe, Δt =

8R2 ω . c2

Die Fläche des von den Lichtstrahlen gebildeten Quadrats beträgt A = 2R2 ; damit wird 4Aω Δt = 2 . c Die Periode des verwendeten monochromatischen Lichts sei τ = λ/c. Dann ist die anteilige Verschiebung der Streifen, gegeben durch ΔN = Δt/τ , gleich 4Aω , cλ was bereits experimentell bestätigt wurde. Insbesondere benutzten Michelson und Gale22 diese Methode zur Bestimmung der Winkelgeschwindigkeit der Erde. ΔN =

Diese klassische Behandlung ist offensichtlich mangelhaft, da sie über c hinausgehende Geschwindigkeiten zulässt und damit der speziellen Relativitätstheorie widerspricht. Eigentlich müsste man sogar die allgemeine Relativitätstheorie heranziehen, da es sich um ein beschleunigtes System handelt. Alle diese Ansätze führen allerdings zum gleichen Ergebnis.

9.8.4 Radarinterferometrie Im Februar 2000 beendete die Raumfähre Endeavour eine Mission, während der eine „dreidimensionale“, 119 Millionen Quadratkilometer erfassende Karte der Erde erstellt wurde. Diese Meisterleistung gelang mit einem so genannten SAR (Radar mit synthetischer Apertur). Allgemein gilt: Je größer die Apertur eines optischen Systems ist, desto besser ist dessen Auflösung (Abschn. 10.2.6) und desto detailreicher sind folglich die gelieferten Bilder. Das SAR-Verfahren nutzt die Bewegung eines Flugzeugs oder Raumfahrzeugs im Kombination mit Methoden der Signalverarbeitung, um eine ausgedehnte Antenne zu simulieren. Mithilfe einer phasengesteuerten Gruppenantenne (siehe Foto auf S. 201) ließ man einen Radarstrahl von der Raumfähre aus vorwärts und rückwärts, senkrecht zu 22

Michelson und Gale, Astrophys. J. 61 (1925) 140.

9 Interferenz

860

C-B and -St rei fen

hoch aufgelöste r X-Band-Streife n

Abb. 9.70: Während das Shuttle die Erde umkreiste, tasteten seine beiden Radarsysteme die Erdoberfläche Streifen für Streifen ab.

seiner Ausbreitungsrichtung, in einem 225 km breiten Streifen über die Erde streichen (siehe Abb. 9.70). Mit nach oben gerichteter Unterseite fliegend, fuhr das Shuttle einen 60 m hohen Mast aus, an dessen Ende zwei Empfangsantennen befestigt waren (Abb. 9.71). Das SAR sendete dann einen Strom von rund 1700 elektromagnetischen Hochleistungspulsen pro Sekunde von der Hauptantenne im Laderaum aus, welche sowohl als Sender als auch als Empfänger fungierte. Dabei verwendete die Mission zwei verschiedene Radare, ein C-Band-System mit einer Wellenlänge von 5,6 cm zur weiträumigen Erfassung des Streifens und ein höher auflösendes 3 cm-X-BandSystem, das detailliertere Bilder von 50 km breiten Teilstreifen lieferte (Abb. 9.70). Ein Radarbild besteht aus unzähligen winzigen, einheitlichen Punkten, den so genannten Pixeln (siehe Abschn. 10.2.6). Ein Pixel ist die kleinste Informationseinheit des Bildes; X-Band AußenAntenne C-Band AußenAntenne

Mast MastKanister

X-Band Hauptantenne

C-Band Hauptantenne

Abb. 9.71: Im Laderaum der Raumfähre Endeavour befand sich die HauptSende- und Empfangsantenne (C-BandRadar). Ein zweiter Empfänger war an der Spitze eines 60 m langen Außenmastes befestigt.

9.8 Anwendungen der Interferometrie

861

P2 z α P1 90 − θ θ

h

r2 r1

S

0

Abb. 9.72: Ein vom Shuttle gesendeter Radarpuls trifft auf die Erdoberfläche und wird zurück nach oben reflektiert. Das Echo wird von der Innen- und der Außenantenne empfangen.

z(x)

x

Abb. 9.73: Prinzipskizze der Geometrie des SAR-Interferometers. In Punkt S am Boden wird der Radarpuls reflektiert; P1 und P2 sind die beiden Empfänger im Laderaum des Shuttles bzw. am Außenmast.

Details, die kleiner sind als ein Pixel, sind nicht sichtbar. Für das C-Band-Hauptsystem betrug der Durchmesser eines Pixels rund 12,5 m; auflösbar sind damit Objekte mit Durchmessern von mindestens 30 m. Normalerweise sendet ein Radarsystem einen etwa 10 bis 50 µs langen Puls aus, empfängt die zurückgestreute Welle und zeichnet deren Amplitude sowie die Gesamtlaufzeit des Pulses auf. Daraus lassen sich die Größe und die Position des Zielobjekts ungefähr bestimmen. Bei der Radar-Topographiemission des Shuttles sollten jedoch auch Daten über die Höhenlage von Oberflächenstrukturen der Erde gesammelt werden. Dies gelang mithilfe der Interferometrie, mit einem Verfahren, das an einen rückwärts ablaufenden youngschen Interferenzversuch erinnert (siehe Abschn. 9.3). Ähnliche interferometrische Methoden gewinnen gegenwärtig in der optischen und der Radioastronomie an Bedeutung. SAR ist ein kohärentes bildgebendes System, das während der Datenaufnahme und -verarbeitung Informationen über die Amplitude und die Phase des Radarechos speichert. Das Shuttle sendet ein Radarsignal aus (ähnlich einem Blitz eines gewöhnlichen Fotoapparats, aber mit gesteuerter spektraler Zusammensetzung). Das Signal trifft auf

9 Interferenz

862

Dieses Interferogramm eines Erdbebengebiets in Landers, Kalifornien (1992), wurde mit einem SAR-System erstellt. Dazu wurden Bilder, die der Satellit ERS-1 vor dem Beben aufgezeichnet hatte, mit entsprechenden Bildern nach dem Beben kombiniert; das Streifenmuster zeigt die Veränderungen in der Oberflächenkontur. Das Bild erfasst ein Gebiet von rund 125 × 175 km. (Centre National d’Etudes Spatiales, France.)

Radaraufnahmen von San Andreas in Kalifornien, angefertigt während der Endeavour-Mission 2000. Das Bild links (farbig sieht es noch eindrucksvoller aus) zeigt das Interferogramm des Gebiets, rechts sehen Sie die zugehörige „dreidimensionale“ Karte, die aus den Daten errechnet wurde. (NASA)

den Boden (Abb. 9.72) und kehrt zu den beiden Antennen zurück – die eine (P1 ) befindet sich, wie bereits erläutert, im Laderaum, die andere (P2 ) außen an der Mastspitze. Der Abstand zwischen den Antennen beträgt 60 m (Grundlinie a). Beide Radarechos werden in digitaler Form für die spätere Verarbeitung und Bilderzeugung gespeichert. In Aufgabe 9.62 sollen Sie zeigen (siehe Abb. 9.73), dass die Topographie als Funktion z (x) mithilfe folgender Größen ausgedrückt werden kann: der Flughöhe h des Shuttles, dem Sichtwinkel θ des Radars sowie der gemessenen Phasenwinkeldifferenz (der interferometrischen Phase) φ der Signale, nämlich z(x) = h −

(λφ/2π) − a2 cos θ . 2a sin (α − θ) − (λφ/2π)

(9.108)

Aufgaben

863

Ein derartiges Interferometer misst φ, die Phasendifferenz der Signale, die an beiden Enden der Grundlinie ankommen. Dazu werden die Signale analytisch zur Interferenz gebracht. Das hierzu verwendete Verfahren ist die Kreuzkorrelation (Abschn. 11.3.4). Am Boden werden die beiden separaten Datensätze – einer je Antenne – zunächst zu einem Interferogramm kombiniert, in dem die Topographie verschlüsselt ist. Das Interferogramm besteht aus „Streifen gleicher Höhe“ oder Konturen gleicher Höhe. Die Information muss jedoch weiter verfeinert werden, da die Höhenlage der einzelnen Konturen noch unbekannt ist. Auf der Grundlage exakter Werte für die Länge und die Orientierung des Mastes wird die Höhe z(x) der Konturen im Wesentlichen trigonometrisch berechnet. Über den Ozeanen aufgezeichnete Daten liefern die Höhe des Meeresspiegels als Bezugsgröße. Nach sehr vielen Rechenschritten entsteht Pixel für Pixel eine dreidimensionale topographische Karte (siehe Fotos S. 862).

Aufgaben Lösungen zu den Aufgaben ohne ∗ finden Sie am Ende des Buches. 9.1

Wir kehren noch einmal zu Abschnitt 9.1 zurück. Es sei ! 1 (r) e−iωt , ! 1 (r, t) = E E ! 2 (r) e−iωt , ! 2 (r, t) = E E ! 2 sind ! 1 und E wobei die Gestalt der Wellenfronten nicht explizit angegeben ist. E komplexe Vektoren, die vom Abstand und von der Phasenkonstante abhängen. Zeigen Sie, dass der Interferenzterm durch 1 ! !∗ !∗ !  I12 = E1 · E2 + E1 · E2 (9.109) 2 gegeben ist. Sie müssen dazu Terme der Form ˆ t+T ( )  !1 · E ! 2 e−2iωt = E !1 · E ! 2 /T E e−2iωt dt T

t

für T  τ auswerten (greifen Sie auf Aufgabe 3.10 zurück). Zeigen Sie, dass Gleichung (9.108) für ebene Wellen zu Gleichung (9.11) führt. 9.2

In Abschnitt 9.1 betrachteten wir die räumliche Energieverteilung für zwei Punktquellen. Dabei wurde erwähnt, dass der räumliche Mittelwert von I12 null wird, wenn der Abstand a groß gegen λ ist. Warum ist dies richtig? Was passiert, wenn a viel kleiner ist als λ?

9.3* Beweisen Sie unter Zuhilfenahme von Abbildung 2.22: Für zwei ebene elektromagnetische Wellen gleicher Amplitude Eθ , die miteinander einen Winkel θ bilden, entspricht das Interferenzmuster auf der yx-Ebene einer Bestrahlungsstärkenverteilung mit einem Kosinusquadrat-Term:

π  I (y) = 4E02 cos2 y sin θ . λ

864

9 Interferenz Wo wird die Bestrahlungsstärke null? Wie weit sind die einzelnen Streifen voneinander entfernt? Wie verändert sich dieser Abstand, wenn θ zunimmt? Vergleichen Sie Ihre Analyse mit der Herleitung von Gleichung (9.17). [Hinweis: Gehen Sie von den in Abschnitt 2.7 gegebenen Wellenausdrücken aus, die bereits mit den geeigneten Phasen aufgeschrieben wurden, und formulieren Sie diese als Exponentialterme.]

9.4

Erhält man im youngschen Doppelspaltversuch (Abb. 9.8) ein Interferenzmuster, wenn man den Eintrittsspalt S durch eine Glühlampe mit langem Glühdraht ersetzt? Was passiert, wenn man die Spalte S1 und S2 durch solche Lampen ersetzt?

9.5* Abbildung A.9.5 zeigt Messdaten, die mit einem winzigen Mikrofon aufgenommen wurden, auf das zwei 15 cm voneinander entfernte piezoelektrische Lautsprecher gerichtet waren. Der Abstand zwischen den Lautsprechern und dem Mikrofon betrug 1,5 m. Gegeben sei die Schallgeschwindigkeit in Luft bei 20 ◦ C mit 343 m/s. Berechnen Sie die Frequenz, mit der die Lautsprecher ungefähr betrieben wurden. Diskutieren Sie die Form des Musters und begründen Sie, dass es in der Mitte ein Minimum aufweist.

Abb. A.9.5 Daten von CENCO.

9.6* Zwei 1,0-MHz-Radioantennen, die phasengleich abstrahlen, liegen längs einer NordSüd-Linie um 600 m voneinander entfernt. Ein Radioempfänger wird 2,0 km östlich davon so aufgestellt, dass er von beiden Sendern gleich weit entfernt ist. Er empfängt ein relativ starkes Signal. Wie weit muss man den Empfänger nach Norden verschieben, um ein ähnlich starkes Signal empfangen zu können? 9.7* Zwei parallele, schmale Spalte in einem lichtundurchlässigen Schirm haben einen Abstand von 0,100 mm voneinander. Sie werden mit ebenen Wellen der Wellenlänge 589 nm bestrahlt. Auf einem Beobahtungsschirm erscheint ein cos2 -Muster von Interferenzstreifen, in dem der Abstand zwischen benachbarten Maxima jeweils 3,0 mm beträgt. Wie weit ist der Beobachtungsschirm vom Blendenschirm entfernt? 9.8* Nehmen Sie an, dass der Abstand der schmalen Spalte im Versuch von Young 1,000 mm beträgt und der Beobachtungsschirm 5,000 m entfernt ist. Die Spalte werden mit ebenen Wellen von monochromatischem 589,3-nm-Licht bestrahlt, und die gesamte Versuchsanordnung befindet sich in Luft, wo n = 1,00029 ist. Was würde mit dem Streifenabstand passieren, wenn die gesamte Luft herausgepumpt würde?

Aufgaben 9.9

865

Ein ausgedehntes Strahlenbündel von rotem Licht aus einem He-Ne-Laser (λ0 = 632,8 nm) fällt auf einen Schirm, der zwei sehr schmale, 0,2 mm voneinander entfernte horizontale Spalte hat. Auf einem weißen Schirm in 1 m Entfernung sieht man ein Interferenzmuster. (a) Wie weit (in Radiant und Millimetern) nach oben und unten von der mittleren Achse entfernt befinden sich die ersten Nullstellen der Bestrahlungsstärke? (b) Wie weit (in Millimetern) von der Achse entfernt befindet sich der fünfte helle Streifen? (c) Vergleichen Sie die beiden Ergebnisse.

9.10* Zwei kleine Löcher in einem dünnen Aluminiumblatt sind 1,00 mm voneinander entfernt und in einen großen Wassertank (n = 1,33) eingetaucht. Die Löcher werden mit ebenen Wellen der Wellenlänge λ0 = 589,3 nm bestrahlt, und das entstehende Streifenmuster wird, 3,00 m von den Löchern entfernt, auf einem Schirm im Wasser beobachtet. Bestimmen Sie für die beiden der zentralen Achse der Versuchsanordnung am nächsten liegenden Maxima die Positionen der Zentren. 9.11* Ebene Wellen des roten Spektralbereichs (λ0 = 694,3 nm) aus einem Rubinlaser treffen in Luft auf zwei parallele Spalte, die in einen undurchsichtigen Schirm eingearbeitet sind. Auf einer entfernten Wand erscheint ein Interferenzmuster, dessen vierten hellen Streifen man 1,0◦ oberhalb der mittleren Achse erkennen kann. Wie groß ist der Abstand zwischen den Spalten? 9.12* Eine 3 × 5 cm große Karte enthalte zwei Löcher mit einem Durchmesser von jeweils 0,08 mm, deren Mittelpunkte 0,10 mm voneinander entfernt sind. Die Karte werde mithilfe eines Argon-Ionenlasers mit parallelen blauen Lichtstrahlen (λ0 = 487,99 nm) beleuchtet. Wie weit sollte ein Schirm von der Karte entfernt aufgestellt werden, wenn die Streifen des Interferenzmusters darauf 10 mm weit auseinander liegen sollen? 9.13* Weißes Licht trifft auf zwei lange, schmale Spalte und wird auf einem weit entfernten Schirm beobachtet. Der rote Anteil (λ0 = 780 nm) des Interferenzstreifens erster Ordnung überlappt mit dem violetten Anteil des Streifens zweiter Ordnung. Welche Wellenlänge hat dieses violette Licht? 9.14* Betrachten Sie die Versuchsanordnung in Abbildung 9.14. Nehmen Sie an, dass die Brennweite der zweiten Linse f ist, und beweisen Sie, dass die Maxima bei ym = mf λa liegen. [Hinweis: Zeichnen Sie eine Linie vom Zentrum der Linse 2 zu dem Punkt, der in der Höhe ym senkrecht über der zentralen Achse liegt. Diese Linie bildet mit der Achse einen Winkel θ, für den θ ≈ ym /s gilt.] 9.15* Betrachten Sie noch einmal die Versuchsanordnung in Abbildung 9.14, wobei die zweite Linse wieder die Brennweite f hat. Drücken Sie den Abstand zwischen den Zentren der ersten beiden Minima (über und unter der zentralen Achsen liegend) durch die Größen f , λ und a aus. 9.16* Wir betrachten den Doppelspaltversuch. Leiten Sie einen Ausdruck für den Abstand ym zwischen der mittleren Achse und dem m -ten Minimum der Bestrahlungsstärke her, wobei der jeweils erste dunkle Streifen auf beiden Seiten des zentralen Maximums zu m = ±1 gehören soll. Welche Näherungen sind notwendig und warum?

9 Interferenz

866

9.17* Zwei schmale Spalte in einer dünnen Metallfolie sind 2,70 mm voneinander entfernt (gemessen von Zentrum zu Zentrum). Wenn sie direkt mit ebenen Wellen (in Luft) bestrahlt werden, erscheint auf einem 4,60 m entfernten Schirm ein Streifenmuster. Der gemessene Abstand von der Mitte eines beliebigen dunklen Streifens bis zu dem fünf dunkle Streifen weiter liegenden Minimum beträgt 5,00 mm. Bestimmen Sie die Wellenlänge des für die Bestrahlung verwendeten Lichts. 9.18* Wir betrachten wieder den Doppelspaltversuch. Leiten Sie eine allgemeine Beziehung für die vertikale Verschiebung des m-ten Maximums her, die aus der Anbringung einer dünnen planparallelen Glasplatte mit dem Brechungsindex n und der Dicke d direkt vor einem Spalt resultiert. Welche Annahmen sind notwendig? 9.19* Ebene Wellen monochromatischen Lichts treffen unter einem Winkel θi auf einen Schirm, der zwei schmale, um einen Abstand a voneinander entfernte Spalte enthält. In welchem Winkel, gemessen bezüglich der mittleren Achse, findet man das m-te Maximum? Leiten Sie eine entsprechende Gleichung her. 9.20* Sonnenlicht falle auf einen Schirm, der zwei lange, schmale Spalte im gegenseitigen Abstand von 0,2 mm enthält. Auf einem 2,0 m dahinter angebrachten Blatt Papier sieht man ein Streifenmuster. Wie groß ist der Abstand zwischen dem violetten (λ0 = 400 nm) Anteil des Streifens erster Ordnung und dem roten (λ0 = 600 nm) Anteil des Streifens zweiter Ordnung? 9.21 In dieser Aufgabe sollen die Bedingungen untersucht werden, unter denen die Näherungen in Gleichung (9.23) zulässig sind. (a) Wenden Sie den Kosinussatz auf das Dreieck S1 S2 P in Abbildung 9.8 c an, um zu der Beziehung  2 1/2    r2 a a sin θ + = 1−2 r1 r1 r1 zu gelangen. (b) Entwickeln Sie diesen Ausdruck in eine MacLaurin-Reihe, sodass Sie r2 = r1 − a sin θ +

a2 cos2 θ + · · · 2r1

erhalten. (c) Zeigen Sie unter Zuhilfenahme von Gleichung (9.17), dass (r1 − r2 ) nur dann gleich a sin θ sein kann, wenn r1  a2 /λ ist. 9.22 Ein Elektronenstrahl mit einer Energie von 0,5 eV je Teilchen trifft auf zwei extrem schmale, 10−2 mm voneinander entfernte Spalte. Wie groß ist der Abstand zweier benachbarter Minima auf einem 20 m hinter dem Spalt aufgestellten Schirm? (me = 9,108 × 10−31 kg, 1 eV = 1,602 × 10−19 J) 9.23* Wir wollen durch Beleuchtung irgendeiner Anordnung (youngscher Doppelspaltversuch, dünne Schicht, Michelson-Interferometer o. ä.) mit Licht bei der mittleren Wellenlänge von 500 nm Interferenzstreifen erzeugen; die Linienbreite betrage 2,5 × 10−3 nm.

Aufgaben

867

Bei (ungefähr) welchem optischen Wegunterschied erwarten Sie, dass die Streifen verschwinden? [Hinweis: Denken Sie an die Kohärenzlänge; schauen Sie noch einmal zu Aufgabe 7.55.] 9.24* Stellen Sie sich einen undurchsichtigen Schirm mit drei waagerechten, parallelen, sehr schmalen Spalten vor. Der Abstand des ersten Spalts vom zweiten (Mitte zu Mitte), nach unten gemessen, sei a, der Abstand des ersten Spalts vom dritten 5a/2. Schreiben Sie einen komplexen Exponentialausdruck von δ für die Amplitude des elektrischen Felds in einem Punkt P in einer Höhe θ auf einem entfernten Schirm auf; es gelte δ = ka sin θ. Beweisen Sie: I(θ) = I(0)/3 + 2I(0)/9 (cos δ + cos 3δ/2 + cos 5δ/2) . Überzeugen Sie sich davon, dass bei θ = 0 gilt I (θ) = I(0). 9.25* Betrachten Sie einen fresnelschen Doppelspiegel (in Luft), der mit monochromatischem Licht der Wellenlänge 600,0 nm bestrahlt wird. Der Quellspalt ist parallel zur Schnittlinie der Spiegel und 1,00 m von ihr entfernt. Nehmen Sie an, dass die hellen Streifen auf einem 3,90 m von der Schnittlinie entfernten Beobachtungsschirm einen Abstand von 2,0 mm haben und bestimmen Sie einen Näherungswert für den Neigungswinkel θ (in Grad) der Spiegel. 9.26* Gegeben sei ein fresnelscher Doppelspiegel mit s = 2 m und λ0 = 589 nm. Der gemessene Streifenabstand sei 0,5 mm. Wie groß ist der Neigungswinkel der Spiegel, wenn der senkrechte Abstand der tatsächlichen Punktquelle zur Schnittlinie der Spiegel 1 m beträgt? 9.27* Zeigen Sie, dass der Abstand a im fresnelschen Doppelprisma (Abb. 9.13) gegeben ist durch a = 2d (n − 1) α. 9.28* Mithilfe eines fresnelschen Doppelprismas erhält man Interferenzstreifen von einer Punktquelle auf einem 2 m davon entfernten Schirm; das Prisma befindet sich auf halbem Wege zwischen Quelle und Schirm. Die Wellenlänge des verwendeten Lichts betrage λ0 = 500 nm, der Brechungsindex des Glases sei n = 1,5. Wie groß ist der Öffnungswinkel des Prismas, wenn die Streifen 0,5 mm voneinander entfernt sind? 9.29 Schreiben Sie einen allgemeinen Ausdruck für den Abstand der Streifen bei einem fresnelschen Doppelprisma mit dem Brechungsindex n auf, das sich in einem Medium mit dem Brechungsindex n befindet. 9.30* Eine Linienquelle von Natriumlicht (λ0 = 589,3 nm) bestrahlt einen lloydschen Spiegel 10,0 mm über seiner Oberfläche. In 5,0 m Entfernung von der Linienquelle befindet sich ein Beobachtungsschirm, und der gesamte Versuchsaufbau befindet sich in Luft. Wie groß ist der Abstand zwischen erstem und dritten Maximum? 9.31 Mithilfe des lloydschen Spiegels wurden Interferenzmuster von Röntgenstrahlen (λ = 8,33 Å) beobachtet. Der gegenseitige Abstand der Streifen betrug 0,0025 cm. Der Abstand zwischen Quelle und Schirm war 3 m. Wie hoch über der Spiegelebene befand sich die Punktquelle?

9 Interferenz

868 9.32 Eine Antenne am Ufer eines Sees empfange ein Signal von einem weit entfernten Radiostern (Abb. A.9.32), der gerade über dem Horizont aufgeht. Schreiben Sie Ausdrücke für δ und für die Winkelposition auf, bei denen die Antenne das erste Maximum findet.

a 2

α See

Abb. A.9.32

9.33* Angenommen, die Platte in Abbildung 9.27 bestehe aus Glas und befinde sich in Luft. Zeigen Sie, dass die Amplituden von E1r , E2r und E3r gleich 0,2E0i , 0,192E0i und 0,008E0i sind, wobei E0i die einfallende Amplitude ist. Verwenden Sie die Amplituden-Reflexionskoeffizienten bei senkrechtem Einfall; es soll keine Absorption stattfinden. Wiederholen Sie die Berechnung für eine Wasserschicht in Luft. 9.34 Ein von Luft umgebener Seifenfilm hat einen Brechungsindex von 1,34. Ein Bereich der Schicht erscheint im senkrecht reflektierten Licht hellrot (λ0 = 633 nm). Wie dick ist die Schicht dort mindestens? 9.35* Eine dünner Film von Ethylalkohol (n = 1,36) wird auf eine Glasplatte gebracht und mit weißem Licht beleuchtet. Im reflektierten Licht sieht man ein farbiges Muster. Ein Bereich des Films reflektiere nur grünes Licht (500 nm) stark. Wie dick ist dieser? 9.36* Ein Seifenfilm mit einem Brechungsindex von 1,34 sei in einem bestimmten Gebiet 550 nm dick. Welche Wellenlänge (im Vakuum) hat die Strahlung, die bei einer Beleuchtung der Schicht von oben mit Sonnenlicht nicht reflektiert wird? 9.37* Eine dünne, gleichmäßige Wasserschicht (n = 1,333) mit einer Dicke von 25,0 nm befindet sich auf der Oberseite eines klaren Stücks Kunststoff (n = 1,59). Bei welchem Einfallswinkel wird das Wasser blaues Licht (λ0 = 460 nm) stark reflektieren? [Hinweis: Modifizieren Sie Gl. (9.34).] 9.38 An einer 2 mm dicken Schicht mit einem Brechungsindex von 1,5 entstehen HaidingerRinge. Berechnen Sie bei monochromatischer Beleuchtung (λ0 = 600 nm) den Wert m für den mittleren Ring (θt = 0). Erscheint dieser hell oder dunkel? 9.39 Beleuchten Sie einen Objektträger (oder besser ein Deckgläschen). Farbige Interferenzstreifen können Sie leicht mit einer Leuchtstofflampe als großflächiger Quelle oder einer Quecksilberdampflampe (Straßenbeleuchtung) als Punktquelle sehen. Beschreiben Sie die Muster. Drehen Sie nun das Glas. Verändert sich das Muster? Vollziehen Sie die Situationen in den Abbildungen 9.18 und 9.19 nach. Wiederholen Sie den Versuch mit einem Stück dünner, über eine Tasse gespannter Frischhaltefolie. 9.40 Ein paralleler Strahl von Licht der Wellenlänge 500 nm fällt senkrecht auf einen keilförmigen Film, der einen Brechungsindex von 1,5 hat. Wir groß ist der Winkel des Keils, wenn der Streifenabstand 13 cm beträgt? 9.41* Betrachten Sie einen keilförmigen Luftfilm, der sich zwischen zwei Glasplatten befindet, wobei ein 7,618 × 10−5 m dickes Stück Papier als Abstandshalter zwischen den Enden der Glasplatten platziert ist. Nehmen Sie an, dass Licht mit einer Wellenlänge von 500 nm senkrecht von oben einfällt, und bestimmen Sie die Anzahl der hellen Streifen, die in dem Keil zu sehen sind.

Aufgaben

869

9.42* Ein keilförmiger Luftfilm zwischen zwei Glasplatten wird von oben mit Natriumlicht der Wellenlänge λ0 = 589,3 nm bestrahlt. Wie dick ist der Film in der Mitte des 173. hellen Streifens (gezählt von der Berührungslinie der beiden Glasplatten an)? 9.43 Abbildung A.9.43 zeigt eine Prüfanordnung für Linsen. Zeigen Sie, dass d = x2 (R2 − R1 )/2R1 R2 ist, wenn man d1 und d2 gegenüber 2R1 und 2R2 vernachlässigen darf. (Denken Sie an den Sehnen-Halbsehnen-Satz der ebenen Geometrie, der die Produkte der Abschnitte einander schneidender Sehnen verknüpft.) Beweisen Sie, dass der Radius des m-ten dunkeln Streifens dann

d 2 d1 Linse

x

Pr¨ufplatte

d

R1 R2

xm = [R1 R2 mλf /(R2 − R1 )]1/2 ist. Setzen Sie dies zu Gleichung (9.43) in Beziehung.

Abb. A.9.43

9.44* An einer mit quasimonochromatischem Licht (λ = 500 nm) beleuchteten Schicht beobachtet man newtonsche Ringe. Der 20. helle Ring habe einen Radius von 1 cm. Wie groß ist der Krümmungsradius der Linse, die zum Interferenz erzeugenden System gehört? 9.45* Wenn Staub zwischen die Glaselemente der Versuchsanordnung für newtonsche Ringe gelangt, kann dieser eine unbekannte Änderung der Filmdicke Δd verursachen, was wiederum eine entsprechende Änderung des Streifenmusters hervorrufen kann. Der Wegunterschied ist dann 2(d + δd) = mλf , und wegen der zusätzlichen Phasenverschiebung bei der Reflexion entspricht das einem dunklen Band. Beweisen Sie, dass der durch R=

x2m − x2m−1 (mm − mm−1 )λf

gegebene Krümmungsradius R der Linse im Labor (anhand von benachbarten dunklen Streifen) unabhängig von Δd bestimmt werden kann. 9.46* Die genaue Betrachtung von Fotos newtonscher Ringe ergibt, dass die Streifen für große m anscheinend alle den gleichen Abstand voneinander haben. Zeigen Sie, um diese Beobachtung analytisch zu stützen, dass (xm+1 − xm ) 1 ≈1+ . (xm+2 − xm+1 ) 2m 9.47 Ein Michelson-Interferometer wird mit monochromatischem Licht beleuchtet. Einer der Spiegel wird dann um 2,53 × 10−5 m verschoben, wobei 92 Paare heller und dunkler Streifen vorbeilaufen. Wie groß ist die Wellenlänge des einfallenden Lichts? 9.48* Einer der Spiegel eines Michelson-Interferometers wird verschoben; währenddessen laufen 1000 Streifenpaare am Faden eines Betrachtungsfernrohrs vorbei. Die Wellenlänge des einfallenden Lichts betrage 500 nm. Wie weit wurde der Spiegel bewegt?

9 Interferenz

870

9.49* Quasimonochromatisches Licht mit einer mittleren Wellenlänge von 500 nm bestrahlt ein Michelson-Interferometer. Der bewegliche Spiegel M1 ist um die Distanz d weiter von dem Strahlteiler entfernt als der feste Spiegel M2 . Die Verringerung von d um 0,10 mm führt dazu, dass eine Reihe von Streifenpaaren über den Beobachtungsschirm rauscht. Bestimmen Sie deren Anzahl. 9.50* Wir stellen uns vor, eine 10 cm lange Kammer mit ebenen, parallelen Fenstern werde in einen Arm eines Michelson-Interferometers gebracht, welches mit Licht von 600 nm Wellenläge beleuchtet wird. Der Brechungsindex von Luft ist 1,000 29. Wie viele Streifenpaare verschieben sich, wenn man die Luft aus der Kammer herauspumpt? 9.51* Rotes Cadmiumlicht hat eine mittlere Wellenlänge von λ0 = 643,847 nm (siehe Abb. 7.45) und eine Linienbreite von 0,0013 nm. Wenn ein Michelson-Interferometer mit diesem Licht bestrahlt wird, stellt man fest, dass die Erhöhung des Spiegelabstands von null auf einen Wert D die Streifen zum Verschwinden bringt. Zeigen Sie, dass 2

Δλ0 =

λ0 Δlc

und bestimmen Sie dann D für die Cadmiumlinie. 9.52* Abbildung A.9.52 zeigt eine Variante des Jamin-Interferometers. Wie funktioniert es? Wozu könnte man es verwenden?

Abb. A.9.52

9.53 Berechnen Sie ausgehend von Gleichung (9.53) für die durchgelassene Welle die Flussdichte, die durch Gleichung (9.54) gegeben ist. 9.54 Die Spiegel eines Fabry-Perot-Interferometers sollen einen Amplituden-Reflexionskoeffizienten von r = 0,8944 haben. Berechnen Sie (a) den Finessefaktor, (b) die Halbwertsbreite, (c) die Finesse und (d) den Kontrastfaktor, definiert als C≡

(It /Ii )max . (It /Ii )min

Aufgaben

871

9.55 Wir wollen die Herleitung des kleinsten Phaseninkrements, das zwei auflösbare FabryPerot-Interferenzstreifen trennt, nämlich √ (Δδ) ≈ 4,2/ F , [9.73] um einige Einzelheiten ergänzen. Überzeugen Sie sich, dass [A (θ)]δ=δα ±Δδ/2 = [A (θ)]δ=Δδ/2 ist. Zeigen Sie, dass Gleichung (9.72) wie folgt umgeschrieben werden kann: 2 [A (θ)]δ=Δδ/2 = 0,81 {1 + [A (θ)]δ=Δδ } . Ist F groß, so wird γ klein, und sin (Δδ) = Δδ. Zeigen Sie, dass dann Gleichung (9.73) folgt. 9.56 Betrachten Sie das Interferenzmuster eines Michelson-Interferometers, das aus zwei Strahlen gleicher Flussdichte entsteht. Berechnen Sie mithilfe von Gleichung (9.17) die Halbwertsbreite. Wie groß ist der Abstand (in δ) zwischen benachbarten Maxima? Wie groß ist die Finesse? 9.57* Überzeugen Sie sich davon, dass eine Schicht mit der Dicke λf /4 und dem Brechungsindex n1 stets den Reflexionsgrad ihres Substrats herabsetzt, wenn ns > n1 > n0 ist. Betrachten Sie den einfachsten Fall (senkrechter Einfall, n0 = 1). Zeigen Sie, dass dies gleichbedeutend mit der Aussage ist, dass Wellen, die von den beiden Grenzflächen reflektiert werden, einander auslöschen. 9.58 Prüfen Sie nach, dass der Reflexionsgrad einer Unterlage durch die Beschichtung mit einer λ/4-Schicht mit hohem Brechungsindex (also n1 > ns ) erhöht werden kann. Zeigen Sie, dass die reflektierten Wellen konstruktiv interferieren. Den Satz von λ/4m Schichten g (HL) Ha kann man sich als eine Reihe solcher Strukturen vorstellen. 9.59 Berechnen Sie den Brechungsindex und die Dicke einer Schicht, die so auf eine Glasoberfläche (ng = 1,54) aufgebracht wird, dass kein senkrecht einfallendes Licht mit einer Wellenlänge von 540 nm reflektiert wird. 9.60 Eine Mikroskoplinse aus Glas mit einem Brechungsindex von 1,55 soll mit Magnesiumfluorid beschichtet werden, um die Durchlässigkeit für senkrecht einfallendes gelbes Licht (λ0 = 550 nm) zu verbessern. Wie dick sollte die Schicht mindestens sein? 9.61* Eine Kameralinse aus Glas mit einem Brechungsindex von 1,55 soll mit Kryolith (n ≈ 1,30) beschichtet werden, um die Reflexion von senkrecht einfallendem grünen Licht (λ0 = 500 nm) zu mindern. Wie dick sollte die Schicht sein? 9.62* Entnehmen Sie Abbildung 9.73 die Geometrie des Radarinterferometers an Bord des Space Shuttles und zeigen Sie: z(x) = h − r1 cos θ . Prüfen Sie dann mithilfe des Kosinussatzes nach, dass Gleichung (9.108) korrekt ist.

10 Beugung 10.1 Einleitende Betrachtungen Bringt man zwischen eine Punktlichtquelle und eine Wand einen undurchsichtigen Gegenstand, so wirft dieser bekanntlich einen Schatten. Der Schatten sieht jedoch viel komplizierter aus, als man ausgehend von den Prinzipien der geometrischen Optik erwarten würde (siehe Fotos)1 .

Links der Schatten einer Hand, die zwischen Daumen und Zeigefinger ein Geldstück hält, direkt auf einen 10×13-cm-Polaroid-Film (3000 ASA) geworfen. Zur Beleuchtung diente ein He-Ne-Laser, es wurde keine Linse verwendet. Das rechte Bild zeigt die Fresnelbeugung von Elektronen an Zinkoxidkristallen. (Nach H. Boersch aus Handbuch der Physik, Hg. S. Flügge, Springer-Verlag Heidelberg.)

Diese Abweichung von der geradlinigen Ausbreitung des Lichts wurde zuerst im siebzehnten Jahrhundert von Francesco Grimaldi genauer untersucht. Grimaldi bezeichnete den Effekt als diffractio. Die Erscheinung beobachtet man bei allen Wellen, ob Schall-, Licht- oder Materiewellen. Sie tritt immer dann auf, wenn ein Teil einer Wellenfront bei der Ausbreitung behindert wird. Trifft Licht auf ein Hindernis, sei es undurchsichtig oder transparent, und ändert sich dabei die Amplitude oder Phase ei1

Um diesen Effekt zu beobachten, benötigen Sie eine ziemlich starke Lichtquelle. Lassen Sie z. B. das Licht einer Hochleistungslampe durch ein kleines Loch fallen und beleuchten Sie damit einen Bleistift. Sie sehen dann einen ungewöhnlich hellen Streifen, der das Schattenbild umgibt, und sogar ein leicht aufgehelltes Band in der Mitte des Schattens. Betrachten Sie den Schatten Ihrer Hand im hellen Sonnenlicht!

https://doi.org/10.1515/9783111025599-010

10 Beugung

874

nes Teils der Wellenfront, so tritt Beugung auf.2 Hinter dem Hindernis interferieren die verschiedenen Abschnitte der Wellenfront, wodurch sich die als Beugungsmuster bekannte Verteilung der Energiedichte ergibt. Zwischen Interferenz und Beugung besteht kein prinzipieller physikalischer Unterschied. Es hat sich eingebürgert, von Interferenz zu sprechen, wenn man die Superposition einiger weniger Wellen betrachtet, von Beugung hingegen, wenn es um sehr viele Wellen geht. Diese Bezeichnungsweise ist allerdings nicht immer eindeutig und sie wird auch nicht konsequent angewendet. So spricht man zum Beispiel von Mehrstrahlinterferenz und von Beugung am Gitter. Sicher wäre es interessant, das Phänomen der Beugung im Rahmen der modernsten Theorie des Lichts, der Quantenelektrodynamik (QED), zu diskutieren. Leider ist diese Analyse jedoch äußerst kompliziert und liefert auch keine wesentlichen neuen Erkenntnisse. Die Anwendung der QED auf einige ausgewählte Fälle können wir qualitativ erläutern, aber grundsätzlich soll uns die klassische Wellentheorie genügen, denn sie stellt den einfachsten funktionierenden Formalismus zur Verfügung. Wenn es angebracht ist, werden wir die Ausführungen um Aspekte aus der Fourier-Analyse ergänzen. Die Einzelheiten dieser Methode sind Gegenstand von Kapitel 11. Das Fresnel-Huygens-Prinzip Kommen wir zu Beginn noch einmal auf das huygenssche Prinzip (Abschn. 4.4.2) zurück. Ihm zufolge kann jeder Punkt einer Wellenfront als Quelle sekundärer Elementarwellen betrachtet werden. Daraus kann die Fortpflanzung der Wellenfront (oder eines Teils von ihr) durch den Raum vorhergesagt werden, da wir annehmen, dass die Form der Wellenfront zu jedem beliebigen Zeitpunkt durch die Hüllkurve der sekundären Elementarwellen gegeben ist (siehe Abb. 4.32). Im Laufe der weiteren Analyse wird allerdings der größte Teil jeder Elementarwelle vernachlässigt, lediglich die Beiträge zur Einhüllenden werden berücksichtigt. Wegen dieser unzulässigen Vereinfachung kann das huygenssche Prinzip das Phänomen der Beugung nicht erklären, wie schon die tägliche Erfahrung zeigt: Schallwellen (z. B. mit ν = 500 Hz und λ ≈ 68 cm) „umkurven“ ohne weiteres große Objekte wie Telefonmasten und Bäume, die für Lichtwellen offensichtliche Hindernisse bilden, denn sie werfen scharfe Schatten. Das huygenssche Prinzip behandelt alle Wellenlängen gleich. Mit seiner Hilfe lässt sich das unterschiedliche Verhalten der Wellenfronten nicht begründen. Dieses Problem löste Fresnel durch die Hinzunahme des Begriffs der Interferenz. Das Fresnel-Huygens-Prinzip besagt: Jeder nicht abgeschirmte Punkt einer Wellenfront bildet zu einem bestimmten Zeitpunkt eine Quelle sekundärer Elementarwellen, deren Frequenz mit jener der Primärwelle übereinstimmt. In jedem nachfolgenden Punkt ist 2

Die Beugung an transparenten Hindernissen wird meist weniger beachtet. Vielleicht haben Sie schon einmal nachts mit Regentropfen auf der Brille ein Auto gesteuert. Dann sind Sie mit dem Effekt wahrscheinlich vertraut. Wenn nicht, so bringen Sie einfach einige Wassertropfen auf eine Glasplatte, halten diese dicht vor Ihre Augen und betrachten eine Punktquelle. Sie sehen helle und dunkle Ringe.

10.1 Einleitende Betrachtungen

875

c

Beugung an einem Spalt in der Wellenwanne für verschiedene Wellenlängen λ. (Mit frdl. Genehmigung von PSSC Physics, D. C. Heath, Boston 1960.)

P

P2

A A B

S

P0

B

P1

(a)

(b)

(b)

(c)

Abb. 10.1: Beugung an einem engen Spalt. (a) Huygenssche Elementarwellen. (b) Klassisches Wellenbild. (c) Bild mit Wahrscheinlichkeitsamplituden im Rahmen der Quantenelektrodynamik.

die Amplitude des optischen Feldes durch die Überlagerung aller dieser Elementarwellen (unter Berücksichtigung der Amplituden und relativen Phasen) gegeben. Wenden wir diese Gedanken nun auf den qualitativ einfachsten Fall, Wasserwellen in einer Wanne, an (Abb. 10.1 und Fotos oben). Verhält sich jeder nicht abgeschirmte Punkt der ankommenden ebenen Wellenfront wie eine kohärente Quelle von Elementarwellen, so ist der maximale optische Weglängenunterschied zwischen diesen Wellen Λmax = |AP − BP |, was je einem Quellenpunkt an beiden Enden der Öffnung entspricht (Abb. 10.1 a). Λmax ist aber kleiner als AB (höchstens gleich AB, wenn nämlich P auf dem Schirm liegt). Aus λ > AB (Abb. 10.1 b) folgt λ > Λmax , und da alle Wellen zu Beginn phasengleich waren, interferieren sie konstruktiv (wenn auch in verschiedenem Ausmaß), ungeachtet der Lage von P , siehe Foto (c) oben. Ist also die Wellenlänge groß gegen die Blendenöffnung, so breiten sich die Wellen unter großen Winkeln in das Gebiet hinter dem Hindernis aus. Je kleiner die Blendenöffnung wird, umso mehr nähert sich die Gestalt der gebeugten Wellen der Kugel. (Erinnern Sie sich an die Diskussion dieses Aspekts im Rahmen der Fourier-Analyse, Abschn. 9.3.1). Genau umgekehrt sind die Verhältnisse bei λ < AB, siehe Foto (a) oben. Nur in einem kleinen Gebiet unmittelbar hinter der Blende ist jetzt λ > Λmax , und nur hier interferieren alle Elementarwellen konstruktiv. Außerhalb dieser Zone kommt es teilweise zu destruktiver Interferenz, und der „Schatten“ beginnt. Beachten Sie dabei, dass der idealisierte geometrische Schatten dem Grenzfall λ → 0 entspricht.

876

10 Beugung

Die klassische Erklärung für den Verlauf des Lichts hinter dem Schirm liegt in der „Interferenz“ der vielen von der Blende ausgesendeten Elementarwellen: Diese addieren sich (als Zeiger) in jedem Raumpunkt, sodass es in Abhängigkeit von der optischen Weglänge (OWL) an manchen Stellen zur Verstärkung und manchen zur Auslöschung kommt. Die quantenmechanische Begründung (siehe Abschn. 4.11.1) liegt in der „Interferenz“ der Wahrscheinlichkeitsamplituden der Photonen: Diese addieren sich (als Zeiger) in jedem Raumpunkt, sodass es in Abhängigkeit von der optischen Weglänge an manchen Stellen zur Verstärkung und manchen zur Auslöschung kommt. Ist die Öffnung etliche Wellenlängen groß, wie in Foto (a) auf S. 875, so entsprechen die vielen möglichen Wege zu jedem Punkt P einem großen Phasenbereich der Zeiger. Betrachten wir alle Wege zu einem Punkt P0 in Vorwärtsrichtung. Die geradlinige Verbindung zwischen S und P0 entspricht dabei einem Minimum der optischen Weglänge. Jeder andere Weg durch die Öffnung nach P0 ist etwas länger (in Abhängigkeit von der Größe der Öffnung), und die zugehörigen Zeiger (die wir alle als gleich groß annehmen) sind um diesen stationären Wert der OWL gruppiert, etwa so, wie in Abbildung 4.80 gezeigt ist. Ihre Phasenunterschiede (zur Hälfte +, zur Hälfte −) sind gering; addiert man die Zeiger (immer Spitze an Ende), so ergibt sich eine Schlange, die sich in beide Richtungen krümmt und eine beträchtliche resultierende Wahrscheinlichkeitsamplitude liefert. Ein Photonenzähler in P0 „sieht“ demnach ziemlich viel Licht. Außerhalb der Vorwärtsrichtung, wo die OWL nicht stationär ist, sind die Phasenunterschiede der Zeiger für jeden Weg relativ groß und alle Vorzeichen sind gleich. Addiert man die Zeiger (Spitze an Ende), so entstehen kreisförmige Gebilde und die Resultierende wird nahezu null. Ein Detektor zählt in P1 nur wenige Photonen, in P2 sogar noch weniger. Je kleiner die Blendenöffnung wird, desto mehr Licht kommt in P1 und P2 an, wobei gleichzeitig die Photonenzahl in P0 abfällt. In diesem Fall liegen die Wege nach P1 und P2 viel enger beieinander, ihre OWL ist nahezu gleich. Daher sind auch die Phasendifferenzen kleiner, grafisch schließen sich die Spiralen nicht mehr zum Kreis, und die Wahrscheinlichkeitsamplitude hat überall einen kleinen, aber merklichen Wert. Qualitativ führen die QED und das Fresnel-Huygens-Prinzip zum gleichen Ergebnis: Licht wird gebeugt, und das grundlegende Prinzip ist die Interferenz. Das Fresnel-Huygens-Prinzip ist bis zu diesem Punkt noch größtenteils hypothetisch und weist außerdem einige Mängel auf, die wir später untersuchen wollen. Eine strengere Theorie, die unmittelbar auf der Lösung der Wellengleichung aufbaut, stellte Gustav Kirchhoff vor. Kirchhoff war zwar ein Zeitgenosse Maxwells, erarbeitete sein Modell aber bereits, bevor Hertz die Fortpflanzung elektromagnetischer Wellen 1887 experimentell demonstriert hatte (und das Thema in der Folge an Popularität gewann). Dementsprechend benutzte Kirchhoff die ältere Theorie, die Licht als elastische Welle im Festkörper behandelte. Seine genauere Analyse bestätigte die Annahmen von Fresnel und führte zu einer präziseren, exakt aus der Wellengleichung abgeleiteten

10.1 Einleitende Betrachtungen

877

Formulierung des huygensschen Prinzips. Trotzdem ist auch die kirchhoffsche Theorie nur eine Näherung, gültig ausschließlich bei hinreichend kleiner Wellenlänge (wenn die Abmessungen der beugenden Öffnung groß gegen λ sind). Die genaue Beschreibung ist so schwierig, weil wir eine Lösung einer partiellen Differentialgleichung benötigen, die die durch das Hindernis vorgegebenen Randbedingungen erfüllt. Eine mathematisch exakte Lösung dieses Problems ist nur für wenige Spezialfälle bekannt. Die kirchhoffsche Theorie leistet auf jeden Fall gute Dienste, obwohl sie von der skalaren Wellengleichung ausgeht und somit nicht beachtet, dass Licht ein transversales Vektorfeld ist.3 Die Bestimmung einer exakten Lösung für eine bestimmte beugende Anordnung gehört zu den größten Herausforderungen der Optik. Die erste derartige Lösung, abgeleitet mithilfe der elektromagnetischen Theorie des Lichts, wurde 1896 von Arnold Johannes Wilhelm Sommerfeld (1868–1951) veröffentlicht. Für die Aufklärung der grundsätzlichen Vorgänge bei der Beugung war dieses Ergebnis äußerst wertvoll, obwohl es sich auf eine physikalisch recht unrealistische Situation bezog: Sommerfeld ging von einem unendlich dünnen, aber undurchsichtigen, ideal leitenden, ebenen Schirm aus. Für viele der praktisch interessanten Anordnungen wurde bis heute keine derartige exakte Lösung gefunden. Wir sind daher gezwungen, uns mit den Näherungslösungen von Huygens-Fresnel und Kirchhoff zufriedenzugeben. In den vergangenen Jahren wurden mithilfe von Mikrowellen Beugungsfelder untersucht, die sich im optischen Bereich vermutlich kaum studieren ließen. Diesen Bewährungsproben hielt die kirchhoffsche Theorie erstaunlich gut stand.4 In vielen Fällen soll uns die einfachere Fresnel-Huygens-Behandlung genügen.

10.1.1 Undurchsichtige Hindernisse Beugung kann als ein Phänomen betrachtet werden, das durch die Wechselwirkung einer elektromagnetischen Welle mit einem Hindernis hervorgerufen wird. Wir sind daher gut beraten, noch einmal kurz die Vorgänge zu diskutieren, die innerhalb eines undurchsichtigen Materials tatsächlich ablaufen. Eine Möglichkeit der Beschreibung ist, den Schirm als Kontinuum zu betrachten, also seine mikroskopische Struktur vollkommen zu vernachlässigen. Für eine nicht absorbierende Metallplatte (ohne ohmsche Erwärmung, daher unendlich leitfähig) können wir die maxwellschen Gleichungen für die Platte und das umgebende Medium aufschreiben und anschließend versuchen, beide Lösungen durch geeignete Randbedingungen an der Grenzfläche zur Übereinstimmung zu bringen. Auf diese Weise 3

4

Eine vektorielle Formulierung der skalaren kirchhoffschen Theorie ist bei J. D. Jackson, Classical Electrodynamics zu finden. Siehe auch Sommerfeld, Optik. Allgemein zum Thema Beugung sei noch empfohlen B. B. Baker und E. T. Copson, The Mathematical Theory of Huygens’ Principle. Keiner dieser Texte ist ohne weiteres verständlich. C. L. Andrews, Am. J. Phys. 19 (1951) 250; S. Silver, J. Opt. Soc. Am. 52 (1962) 131.

878

10 Beugung

lassen sich exakte Lösungen für einige sehr einfache Anordnungen ermitteln. Die reflektierte und die gebeugte Welle hängen dann von der Stromverteilung innerhalb der Platte ab. Betrachten wir den Schirm nun auf einer submikroskopischen Skala und stellen wir uns vor, dass die Elektronenhülle jedes Atoms durch die einfallende Strahlung in Schwingungen versetzt wird. Das klassische Modell, das von Elektronenoszillatoren ausgeht, die mit der Frequenz der Quelle schwingen und remittieren, soll uns genügen. Sowohl die Amplitude als auch die Phase eines Oszillators im Schirm ist durch das lokale elektrische Feld bestimmt, das den Oszillator umgibt. Dieses Feld entsteht seinerseits als Superposition des ankommenden Feldes und der Felder aller anderen schwingenden Elektronen. Ein großer, undurchsichtiger Schirm ohne Öffnungen, der aus schwarzem Papier oder auch aus Aluminiumfolie bestehen kann, hat einen offensichtlichen Effekt: Hinter ihm gibt es kein optisches Feld mehr. Elektronen nahe der beleuchteten Oberfläche werden vom einfallenden Licht zu Schwingungen angeregt. In der Folge emittieren sie Energie, die entweder reflektiert oder vom Material absorbiert wird, oder beides. In jedem Fall überlagern die Felder der einfallenden Schwingung und der Elektronenoszillatoren einander so, dass keinerlei Licht hinter dem Schirm ankommt. Diese Überlagerung entspricht keineswegs einem besonders speziellen Fall: Würden die einfallenden Wellen nicht vollständig ausgelöscht, so könnten sie tiefer in das Material des Schirms eindringen und mehr Elektronen zur Strahlung anregen. Dies wiederum würde die Primärwelle stärker abschwächen, bis sie schließlich verschwände, sofern der Schirm dick genug ist. Selbst ein gewöhnlich undurchsichtiges Material wie Silber ist als hinreichend dünne Schicht partiell transparent (denken Sie an den rückseitig versilberten Spiegel). Machen wir nun in die Mitte des Schirms ein kleines, kreisförmiges Loch, durch welches Licht fallen kann. Die Oszillatoren, die auf dem entfernten Scheibchen lagen, sind mit diesem beseitigt worden und können die übrigen Elektronen des Schirms nicht mehr beeinflussen. In erster, sicher grober Näherung nehmen wir nun an, die gegenseitige Beeinflussung der Oszillatoren sei im Wesentlichen vernachlässigbar; d. h., die Entfernung des Scheibchens änderte nichts am Verhalten der übrig gebliebenen Oszillatoren. Hinter der Öffnung ist das Feld dann wieder null (wie vorher) abzüglich des Beitrags der Oszillatoren auf dem Scheibchen. Abgesehen vom Vorzeichen entspricht dies der Situation, dass sowohl Quelle als auch Schirm entfernt wurden und nur die Oszillatoren auf dem Scheibchen zurückblieben. Mit anderen Worten, das Beugungsfeld setzt sich dann ausschließlich aus Beiträgen einer Anzahl fiktiver, voneinander unabhängiger Oszillatoren zusammen, die gleichmäßig über den Bereich des Lochs verteilt sind. Dies ist natürlich die Kernaussage des Fresnel-Huygens-Prinzips. Wir können jedoch davon ausgehen, dass die Wechselwirkungen zwischen den Elektronen eine gewisse Reichweite haben; diese ist sicherlich kurz, da die Oszillatorfelder mit dem Abstand schnell abnehmen. Physikalisch realistischer ist es demnach, anzunehmen, dass die Elektronen in unmittelbarer Nachbarschaft der Öffnung sehr wohl

10.1 Einleitende Betrachtungen

879

Aufnahmen in einer Wellenwanne: Links Beugung am Einzelspalt, rechts ist die Öffnung von mehreren Punktquellen in jeweils gleichem Abstand bedeckt, wobei ein ähnliches Muster entsteht. (Mit frdl. Genehmigung von PSSC Physics, D. C. Heath, Boston 1960.)

vom Herausnehmen des Scheibchens beeinflusst werden. Ist die Öffnung groß, so übersteigt die Anzahl der Oszillatoren auf dem Scheibchen bei weitem die Anzahl am Rand. Befindet sich der Beobachtungspunkt dann in großer Entfernung und in Vorwärtsrichtung, so sollte das Fresnel-Huygens-Prinzip zufriedenstellende Ergebnisse liefern. So ist es tatsächlich (siehe die Fotos oben). Ist die Öffnung dagegen sehr klein oder befindet sich der Beobachtungspunkt nahe am Schirm, so gewinnen Randeffekte an Bedeutung, und wir müssen uns auf Schwierigkeiten gefasst machen. Für einen Punkt innerhalb der Öffnung sind die Elektronenoszillatoren am Rand aufgrund ihrer Nähe von größter Bedeutung. Genau diese werden durch die Entfernung des Scheibchens jedoch am meisten beeinflusst, und wir müssen mit ausgeprägten Abweichungen vom Fresnel-Huygens-Prinzip rechnen.

10.1.2 Fraunhofer- und Fresnelbeugung Betrachten wir einen undurchsichtigen Schirm Σ mit einer einzigen, kleinen Öffnung, die von einer weit entfernten Punktquelle S mit ebenen Wellen beleuchtet wird. Die Beobachtungsebene σ sei ein weiterer Schirm parallel zu und in unmittelbarer Nähe von Σ. Unter diesen Bedingungen erkennt man auf dem Schirm σ eine (trotz leichter Streifenbildung am Rand) klare Abbildung der Öffnung (Abb. 10.2). Bewegt man die Beobachtungsebene von Σ weg, so wird das Bild der Öffnung immer undeutlicher und von Strukturen überlagert, bleibt aber noch erkennbar. Dieses Phänomen bezeichnet man als Fresnel- oder Nahfeldbeugung. Bewegt man die Beobachtungsebene nun noch weiter von Σ weg, so dehnt sich das Streifenmuster immer weiter aus, bis es dem ursprünglichen Bild von der Öffnung überhaupt nicht mehr ähnelt. Eine weitere Vergrößerung des Abstandes führt dann nur noch zu einer Vergrößerung des Musters, ohne dass sich dessen Erscheinungsbild weiter ändert. Dies ist der Bereich der Fraunhofer- oder Fernfeldbeugung. Könnten wir an dieser Stelle die

10 Beugung

880

R

(a)

u

b

(b)

Abb. 10.2: (a) Eine Reihe aufeinanderfolgender Beugungsmuster bei zunehmendem Abstand von einem einzelnen Spalt; unten (Abstand klein) Fresnelbeugung, oben (Abstand groß) Fraunhoferbeugung. (Mit kleinen Änderungen übernommen aus Fundamentals of Waves and Oscillations von K. U. Ingard.) (b) Das Fernfeld setzt ungefähr in einer Entfernung von R ein, wobei R > b2 /λ.

Wellenlänge der ankommenden Strahlung hinreichend reduzieren, so würden wir wieder zur fresnelschen Situation gelangen. Für noch kleinere λ (λ → 0) würden die Streifen verschwinden, und das Bild nähme die Gestalt der Öffnung an, wie es die geometrische Optik vorhersagt. Kehren wir zur ursprünglichen Anordnung zurück und verringern wir nun den Abstand der Quelle S vom Schirm Σ. Dann fallen Kugelwellen auf die Öffnung, und das Fresnel-Muster bleibt erhalten, auch wenn sich die Beobachtungsebene in großer Entfernung von Σ befindet. Betrachten wir nun eine Punktquelle S und einen Beobachtungspunkt P , die beide sehr weit vom Schirm entfernt sind; das System enthalte keinerlei Linsen (Aufgabe 10.1). Solange nun sowohl die auf Σ einfallenden als auch die von Σ auslaufenden Wellen über die Ausdehnung der Öffnung (oder des Hindernisses) nahezu eben sind, erhalten wir Fraunhoferbeugung. Anders ausgedrückt bedeutet dies, dass aufgrund der Unterschiede der durchlaufenen Weglängen die Phase jedes Beitrags in P von Bedeutung für die Bestimmung des resultierenden Feldes ist. Sind außerdem die auf der Öffnung

10.1 Einleitende Betrachtungen

881

eintreffenden und die von ihr ausgehenden Wellenfronten eben, so lassen sich die Weglängenunterschiede als lineare Funktion der beiden Variablen der Öffnung formulieren. Diese Linearität bezüglich der Öffnungsvariablen ist, mathematisch gesehen, das Kriterium für Fraunhoferbeugung. Befinden sich andererseits S oder P oder beide so nahe an Σ, dass die Krümmung der einfallenden und auslaufenden Wellenfronten nicht vernachlässigt werden kann, so liegt Fresnelbeugung vor. Jeder Punkt der Öffnung kann als Quelle huygensscher Elementarwellen betrachtet werden, mit deren relativen Stärken wir uns etwas ausführlicher beschäftigen sollten. Liegt S relativ nahe an der Öffnung (im Vergleich zu deren Größe), so wird das Loch von einer Kugelwellenfront beleuchtet. Die Abstände zwischen S und den einzelnen Punkten der Öffnung sind dann unterschiedlich, und die elektrische Feldstärke (die zum Abstand umgekehrt proportional ist) ist für jeden Punkt in der Öffnung des beugenden Schirms verschieden. Natürlich ist dies nicht der Fall, wenn die einfallenden Wellen homogen und eben sind. Prinzipiell dasselbe gilt auch für die gebeugten Wellen, die sich vom Schirm Σ zum Punkt P ausbreiten. Selbst wenn diese alle mit derselben Amplitude ausgestrahlt werden (wenn die einfallende Welle also eben ist), sind die Wellen, die zu P konvergieren, sphärisch, falls P nahe bei Σ liegt. Aufgrund der verschiedenen Abstände zwischen den einzelnen Punkten in der Öffnung und P variieren auch die Amplituden dieser konvergierenden Wellen. Im idealen Fall, wenn P im Unendlichen liegt (was immer dies auch praktisch bedeuten mag), kommen in P ebene Wellen an, sodass wir uns über Unterschiede der Feldstärken keine Gedanken zu machen brauchen. Dies trägt ebenfalls zur Einfachheit des Fraunhofer-Grenzfalls bei. Als praktische Faustregel gilt: Fraunhoferbeugung tritt auf, wenn für eine Öffnung oder ein Hindernis mit der größten Ausdehnung b R > b2 /λ ist. R ist dabei der kleinere der beiden Abstände SΣ und ΣP (Aufgabe 10.1). Geht R gegen unendlich, so ist die endliche Größe der Öffnung offensichtlich bedeutungslos. Zudem rückt jede Vergrößerung von λ die Phänomene weiter in Richtung des Fraunhofer-Grenzfalls. Nachdem sich das Fraunhofermuster einmal eingestellt hat, wird es auf dem Schirm, auf dem es beobachtet wird, einfach immer größer, wenn dieser weiter weg bewegt wird. Der Winkel θ, der in einem typischen Fraunhofermuster von dem zentralen Maximum auf dem Blendenschirm gebildet wird, kann tatsächlich näherungsweise als konstant angesehen werden. Abbildung 10.2 b zeigt den einfachen Fall, in dem ebene Wellen die beugende Apertur beleuchten. Wir werden demnächst sehen, dass allgemein θ ≈ λ/b gilt, und da aus der Abbildung ersichtlich ist, dass Rθ ≈ b, folgt daraus R ≈ b2 /λ. Salopp gesagt beginnt hinter R das Fernfeld. Praktisch lässt sich die Fraunhoferbedingung mit einer Anordnung umsetzen, wie sie in Abbildung 10.3 gezeigt ist. Die Punktquelle S befindet sich im Brennpunkt F1

10 Beugung

882

P

S

L2

L1 Σ

σ

Abb. 10.3: Fraunhoferbeugung an einer Anordnung von Linsen. Quelle und Streifenmuster befinden sich in bequem handhabbaren Abständen von der Öffnung.

der Linse L1 , die Beobachtungsebene ist die zweite Brennebene der Linse L2 . In der Terminologie der geometrischen Optik sind die Ebene der Quelle und σ konjugiert. Diese Gedanken lassen sich auf jedes Linsensystem verallgemeinern, das ein Bild einer Lichtquelle oder eines ausgedehnten Objekts liefert (Aufgabe 10.4).5 In jedem Fall ist das Bild ein fraunhofersches Beugungsmuster. Aufgrund dieser wichtigen praktischen Überlegungen und der Einfachheit der Fraunhoferbeugung werden wir diese vor der Fresnelbeugung behandeln, obwohl sie eigentlich ein Spezialfall der Letzteren ist.

10.1.3 Mehrere kohärente Oszillatoren Eine einfache und doch logische Brücke zwischen Interferenz und Beugung baut uns die in Abbildung 10.4 gezeigte Anordnung. Wir sehen N kohärente Punktquellen (oder strahlende Antennen), die sämtlich identisch sind (sogar bezüglich ihrer Polarisation). Zunächst wollen wir annehmen, zwischen den Oszillatoren bestünden keine Phasenunterschiede – alle haben denselben Phasenwinkel. Die eingezeichneten Strahlen sind fast parallel, sie treffen sich erst in einem sehr weit entfernten Punkt P . Ist die räumliche Ausdehnung dieser Anordnung relativ gering, so sind die Amplituden der einzelnen in P ankommenden Wellen ungefähr gleich, da auch die zurückgelegten Wege nahezu identisch sind: E0 (r1 ) = E0 (r2 ) = · · · = E0 (rN ) = E0 (r) . 5

Wenn man viel Platz hat, kann man mit einem He-Ne-Laser ohne Hilfslinsen wunderbare Muster erzeugen.

10.1 Einleitende Betrachtungen

883

(a)

(b)

Abb. 10.4: Lineare Anordnung phasengleicher kohärenter Oszillatoren. (a) Beachten Sie, dass in der gezeigten Anordnung δ = π ist, während bei θ = 0 der Winkel δ ebenfalls gleich null ist. (b) Eine der vielen Gruppen von Wellenfronten, die von einer Linie kohärenter Punktquellen ausgestrahlt werden.

Die Summe der interferierenden sphärischen Elementarwellen liefert in P ein elektrisches Feld, das durch den Realteil des Ausdrucks ! = E0 (r)ei(kr1 −ωt) + E0 (r)ei(kr2 −ωt) + · · · + E0 (r)ei(krN −ωt) E

(10.1)

gegeben ist. Aus Abschnitt 9.1 wissen wir, dass wir die Vektornatur des elektrischen Feldes in diesem Fall außer Acht lassen dürfen. Daher gilt

! = E0 (r)e−iωt eikr1 1 + eik(r2 −r1 ) + eik(r3 −r1 ) + · · · + eik(rN −r1 ) . E Der Phasenunterschied zwischen benachbarten Quellen kann mithilfe der Beziehung δ = k0 Λ berechnet werden. Weil in einem Medium mit dem Brechungsindex n gilt Λ = nd sin θ, wird δ = kd sin θ. Aus Abbildung 10.4 entnehmen wir δ = k(r2 − r1 ), 2δ = k(r3 − r1 ) usw. Das elektrische Feld in P ist somit beschrieben durch

! = E0 (r)e−iωt eikr1 1 + (eiδ ) + (eiδ )2 + (eiδ )3 + · · · + (eiδ )N −1 . (10.2) E Die geometrische Reihe in der eckigen Klammer hat den Wert (eiδN − 1)/(eiδ − 1) , was in der Form   eiN δ/2 eiN δ/2 − e−iN δ/2   eiδ/2 eiδ/2 − e−iδ/2

10 Beugung

884 oder, gleichbedeutend,   i(N −1)δ/2 sin N δ/2 e sin δ/2 geschrieben werden kann. Für das Feld ergibt sich damit   −iωt i[kr1 +(N −1)δ/2] sin N δ/2 ! E = E0 (r)e . e sin δ/2

(10.3)

Wenn R der Abstand zwischen der Mitte der Oszillatoranordnung und dem Punkt P ist, also R=

1 2

(N − 1) d sin θ + r1 ,

so nimmt Gleichung (10.3) die Form   i(kR−ωt) sin N δ/2 ! E = E0 (r)e sin δ/2

(10.4)

an. Die Flussdichteverteilung innerhalb eines Beugungsmusters, das von einer linearen Anordnung aus N kohärenten, identischen, weit entfernten Punktquellen erzeugt wird, ist schließlich für ein komplexes Feld proportional zu EE ∗ /2, sodass gilt I = I0

sin2 (N δ/2) , sin2 (δ/2)

(10.5)

wobei I0 die Flussdichte ist, die von einer einzelnen Punktquelle ausgehend in P ankommt. (Die grafische Herleitung der Bestrahlungsstärke ist Gegenstand von Aufgabe 10.2.) Für N = 0 ist I = 0, für N = 1 ist I = I0 und für N = 2 ist I = 4I0 cos2 (δ/2), wie nach Gleichung (9.17) auch zu erwarten war. Der funktionale Zusammenhang zwischen I und θ wird deutlicher, wenn wir Gleichung (10.5) in der Form I = I0

sin2 [N (kd/2) sin θ] sin2 [(kd/2) sin θ]

(10.6)

schreiben. Der Term im Zähler fluktuiert rasch, während sich die modulierende Funktion im Nenner nur langsam ändert. Die Kombination beider Funktionen liefert eine neue Funktion mit scharfen Hauptmaxima, die voneinander durch eine Reihe kleiner Nebenmaxima getrennt sind. Von den Punktquellen aus gesehen liegen die Hauptmaxima in den Richtungen θm mit δ = 2mπ (m = 0, ±1, ±2, . . . ). Wegen δ = kd sin θ ist d sin θm = mλ .

(10.7)

Wegen [sin2 N δ/2]/[sin2 δ/2] = N 2 für δ = 2mπ (Regel von L’Hospital) ist die Intensität der Hauptmaxima durch N 2 I0 gegeben. Dies entspricht unseren Erwartungen, da in diesen Richtungen die einzelnen Oszillatoren phasengleich sind. Das System strahlt

10.1 Einleitende Betrachtungen

885

Frühes interferometrisches Radioteleskop der Universität Sydney in Australien (N = 32, λ = 21 cm, d = 7 m, Durchmesser 2 m; Gesamtausdehnung der Anlage in Ost-WestRichtung: ca. 210 m). (Mit frdl. Genehmigung von Prof. W. N. Christiansen.)

ein Maximum senkrecht zur Anordnung der Punktquellen ab (m = 0, θ0 = 0 oder π). Wenn θ größer wird, dann wird auch δ größer und I fällt im ersten Minimum, bei N δ/2 = π, auf den Wert null. Für d < λ [Gl. (10.7)] existiert nur das Hauptmaximum nullter Ordnung, m = 0. Für eine idealisierte Linienquelle von Elektronenoszillatoren, jeweils voneinander getrennt durch Abstände in atomarer Größenordnung, wäre nur dieses eine Hauptmaximum im Lichtfeld zu erwarten. Die Antennenanordnung im Foto oben kann aufgrund dieser Überlegungen nur in einem schmalen Strahl (einer „Keule“), der zu einem Hauptmaximum gehört, Energie aussenden. (Da die gezeigten Parabolantennen in Vorwärtsrichtung reflektieren, ist das Strahlungsmuster nicht mehr symmetrisch zur gemeinsamen Achse der Anordnung.) Nehmen wir nun an, wir könnten zwischen jeweils zwei benachbarten Oszillatoren dieses Systems eine konstante Phasenverschiebung einführen. Dann ist δ = kd sin θ + ε , und die Hauptmaxima treten nun in den Richtungen auf, für die gilt d sin θm = mλ − ε/k . Die Orientierung θ0 des zentralen Hauptmaximums (m = 0) kann offensichtlich durch die Wahl von ε frei vorgegeben werden. Das Prinzip der Reversibilität besagt bekanntlich, dass der Weg einer Welle umgekehrt werden kann, wenn keine Absorption auftritt. Es führt dazu, dass eine gegebene Antenne als Sender dasselbe Feldmuster aufweist wie als Empfänger. Eine Anordnung, die als Radioteleskop arbeitet, kann daher „punktgenau“ ausgerichtet werden, indem die Signale der einzelnen Antennen unter Einführung einer geeigneten Phasenverschiebung ε miteinander kombiniert werden. Für ein bestimmtes ε entspricht das Ausgangssignal aller Antennen dann dem Signal, das aus einer speziellen Raumrichtung auf die Anordnung trifft (siehe auch Abschn. 4.3.1). Das Foto oben zeigt das erste Radio-Interferometer, entworfen von W. N. Christiansen und gebaut 1951 in Australien. Es besteht aus 32 Parabolantennen mit einem gegen-

10 Beugung

886

seitigen Abstand von jeweils 7 m und einem Durchmesser von jeweils 2 m, die bei der Wellenlänge einer Wasserstoffemissionslinie (λ = 21 cm) in Phase betrieben werden können. Die Anordnung ist in Ost-West-Richtung aufgebaut, was es erlaubt, die Erdrotation auszunutzen, um mit dem Teleskop den gesamten Himmel abzutasten.6

y D/2 Δyi

ri θ z

−D/2

R

P

x

Abb. 10.5: Eine kohärente Linienquelle.

Betrachten wir nun Abbildung 10.5. Gezeigt ist eine idealisierte Linienquelle von Elektronenoszillatoren, z. B. die sekundären Quellen des Fresnel-Huygens-Prinzips für einen langen Spalt, dessen Breite viel kleiner als λ ist und der von ebenen Wellen beleuchtet wird. Jeder Punkt sendet eine sphärische Elementarwelle aus, die wir als

ε  0 sin (ωt − kr) E= r schreiben können, also in einer Form, welche die 1/r-Abhängigkeit der Amplitude explizit zeigt. Die Größe ε0 heißt Quellstärke. Diese Situation unterscheidet sich von der in Abbildung 10.4 gezeigten dadurch, dass die einzelnen Quellen jetzt sehr schwach sind, die Gesamtzahl N aller Quellen sehr groß ist und der Abstand zwischen ihnen gegen null geht. Ein kleiner, aber endlicher Abschnitt der Anordnung, Δy  , enthält nun Δy  (N/D) Quellen, wobei D die Gesamtlänge des Systems ist. Zerlegen wir die Anordnung in Gedanken nun in M solche Abschnitte; der Index i läuft also von 1 bis M . Das i-te Element liefert im Punkt P dann einen Beitrag zur Feldstärke von     ε0 N Δy  , sin (ωt − kri ) Ei = ri D 6

Siehe E. Brookner, „Phased-Array Radars“, Sci. Am. Februar 1985, S. 94.

10.2 Fraunhoferbeugung

887

vorausgesetzt, Δy  ist so klein, dass der Phasenunterschied zwischen den Oszillatoren innerhalb dieses Abschnitts vernachlässigbar ist (ri ist konstant) und die Feldstärken einfach addiert werden können. Im Grenzfall, nämlich für N → ∞, erhalten wir eine kontinuierliche (kohärente) Linienquelle. Diese Beschreibung ist einerseits im makroskopischen Maßstab einigermaßen realistisch, andererseits gestattet sie die Verwendung der Integralrechnung für kompliziertere geometrische Formen. Geht die Anzahl der Quellen gegen unendlich, so muss die Quellstärke jeder einzelnen Quelle natürlich gegen null gehen, wenn die Quellstärke der gesamten Anordnung konstant bleiben soll. Wir können daher eine Konstante εL , die Quellstärke pro Längeneinheit der Anordnung, definieren: εL ≡

1 lim (ε0 N ) . D N →∞

(10.8)

Das Nettofeld aller M Segmente der Quelle in P ist dann E=

M  εL i=1

ri

sin (ωt − kri ) Δy  .

Für eine kontinuierliche Lichtquelle wird Δy  unendlich klein, M wird unendlich groß und die Summation geht in ein Integral über, ˆ +D/2 sin (ωt − kr) dy (10.9) E = εL r −D/2 mit r = r(y). Die Näherungen, die für den Übergang von Gleichung (10.8) zu Gleichung (10.9) verwendet wurden, hängen notwendigerweise davon ab, wo sich der Punkt P bezüglich der Quellenanordnung befindet. Diese Position macht daher auch den Unterschied zwischen Fresnel- und Fraunhoferbeugung aus. Eine kohärente optische Linienquelle existiert physikalisch nicht, doch als mathematisches Werkzeug können wir sie gut gebrauchen.

10.2 Fraunhoferbeugung 10.2.1 Beugung am Einzelspalt Kehren wir zu Abbildung 10.5 zurück. Unser Beobachtungspunkt soll nun sehr weit von der kohärenten Linienquelle entfernt sein, wodurch auch R  D ist. Unter diesen Umständen weicht r(y) nie sehr weit von seinem Wert R im Mittelpunkt der Quelle ab, sodass die Größe (εL /R) in P für alle Elemente dy als konstant angenommen werden kann. Aus Gleichung (10.9) folgt dann, dass in P das Feld eines differentiellen Elements dy der Quelle durch εL sin (ωt − kr) dy (10.10) dE = R

10 Beugung

888

gegeben ist; (εL /R)dy ist die Amplitude der Welle. Beachten Sie, dass die Phase viel empfindlicher auf eine Änderung von r(y) reagiert als die Amplitude, weshalb wir sehr sorgfältig vorgehen müssen, wenn wir für die Phase Näherungen einführen. Um r(y) explizit als Funktion von y aufschreiben zu können, entwickeln wir die Funktion ähnlich wie in Aufgabe 9.21 in eine Reihe:   (10.11) r = R − y sin θ + y 2 /2R cos2 θ + · · · . θ wird von der xz-Ebene aus gemessen. Der dritte Term in dieser Gleichung darf vernachlässigt werden, solange sein Beitrag auch für y = ±D/2 unwesentlich bleibt. Das bedeutet, (πD 2 /4λR) cos2 θ muss vernachlässigbar sein. Dies trifft für alle Winkel θ zu, wenn R hinreichend groß wird. So erhalten wir die Fraunhoferbedingung, wobei der Abstand r(y) linear von y abhängt: Der Abstand zum Beobachtungspunkt und damit die Phase können als lineare Funktionen der Öffnungsvariablen geschrieben werden. Einsetzen in Gleichung (10.10) und Integration liefert ˆ εL +D/2 sin [ωt − k (R − y sin θ)] dy (10.12) E= R −D/2 und schließlich E=

εL D sin [(kD/2) sin θ] sin (ωt − kR) . R (kD/2) sin θ

(10.13)

Um diesen Ausdruck zu vereinfachen, setzen wir β ≡ (kD/2) sin θ und erhalten durch Einsetzen   εL D sin β sin (ωt − kR) . E= R β

(10.14)

(10.15)

Die am einfachsten zu messende Größe ist die Bestrahlungsstärke, I(θ) = E 2 T (wenn wir alle Konstanten weglassen) oder     1 εL D 2 sin β 2 (10.16) I(θ) = 2 R β mit sin2 (ωt − kR) T = 12 . Bei θ = 0 ist sin β/β = 1 und I(θ) = I(0), was dem Hauptmaximum entspricht. Die Intensität einer idealisierten, kohärenten Linienquelle in der fraunhoferschen Näherung ist damit   sin β 2 (10.17) I(θ) = I(0) β oder, unter Verwendung der sinc-Funktion, sinc u = (sin u)/u, I(θ) = I(0) sinc2 β .

10.2 Fraunhoferbeugung

889

Dieses Ergebnis ist symmetrisch zur y-Achse und für alle Winkel gültig, die in einer Ebene gemessen werden, welche die y-Achse enthält. Beachten Sie, dass die Intensität für D  λ sehr schnell gegen null geht, weil für sehr große D (bei sichtbarem Licht ungefähr 1 cm) die Größe β = (πD/λ) sin θ sehr groß wird. Die Phase einer Linienquelle ist dann gemäß Gleichung (10.15) äquivalent zu der einer Punktquelle, die sich im Zentrum der Linie befindet, und zwar im Abstand R von P . Eine relativ lange (D  λ) kohärente Linienquelle schließlich kann als Punktstrahler betrachtet werden, der vornehmlich in Vorwärtsrichtung (θ = 0) strahlt. Seine Emission entspricht also einer Kreiswelle in der xz-Ebene. Für λ  D dagegen ist β klein; in diesem Fall gilt sin β ≈ β und I(θ) ≈ I(0). Die Bestrahlungsstärke ist in diesem Fall konstant für alle Winkel θ, und die Linienquelle gleicht einer Punktquelle, die Kugelwellen emittiert.

(a)

Abb. 10.6: (a) Fraunhoferbeugung an einem Einzelspalt. (b) Beugungsmuster eines vertikalen Spalts bei Beleuchtung durch eine Punktquelle.

Wenden wir uns nun dem Problem der Fraunhoferbeugung an einem Einzelspalt oder einem längeren, schmalen, rechteckigen Loch zu (Abb. 10.6). Eine derartige Öffnung ist typischerweise einige hundert Wellenlängen breit und mehrere Zentimeter lang. Zur Analyse teilt man den Spalt in eine Reihe langer, unendlich schmaler Streifen parallel zur y-Achse mit den Abmessungen dz × , wie es in Abbildung 10.7 gezeigt ist. Wir erkennen sofort, dass jeder Streifen eine lange, kohärente Linienquelle ist und daher durch einen Punktstrahler auf der z-Achse ersetzt werden kann. Effektiv sendet jeder dieser Strahler eine Zirkularwelle in der xz-Ebene (y = 0) aus. Dies ist verständlich, da die auslaufenden Wellenfronten in Spaltrichtung, bedingt durch die Länge des Spalts, nahezu nicht behindert werden. Parallel zu den senkrechten Kanten des Spaltes sollten daher praktisch keine Beugungseffekte auftreten. Das Problem reduziert sich somit darauf, jenes Feld in der xz-Ebene zu finden, das von unendlich

10 Beugung

890

(b)

(c)

(a)

(d)

(e)

Abb. 10.7: Zur Geometrie des Spalts. (a) Der Beobachtungspunkt P ist praktisch unendlich weit von Σ entfernt. (b) Huygenssche Elementarwellen, die über dem Querschnitt der Öffnung emittiert werden. (c) Äquivalente Darstellung im Strahlenbild. (d) Die Strahlenbündel entsprechen ebenen Wellen, die man als dreidimensionale Fourier-Komponenten betrachten kann. (e) Einzelspalt, beleuchtet von monochromatischen ebenen Wellen.

vielen Punktquellen verursacht wird, welche entlang der z-Achse gleichmäßig über die gesamte Spaltbreite verteilt sind. Wir brauchen also nur das Integral über die Beiträge dE aller Elemente dz in der Fraunhofernäherung auszuwerten. Diese Anordnung von Punktquellen entspricht aber wiederum einer kohärenten Linienquelle, sodass die Lösung für den Einzelspalt unserem früheren Resultat   sin β 2 [10.17] I(θ) = I(0) β entspricht, vorausgesetzt, dass   kb sin θ β= 2

(10.18)

ist, wobei der Winkel θ in der xz-Ebene gemessen werden muss (siehe Aufgabe 10.2). Beachten Sie, dass die Linienquelle in diesem Fall kurz ist (D = b und β ist klein). Daher kann man Nebenmaxima höherer Ordnung beobachten, wenngleich ihre Intensität rasch gegen null abfällt. Die Extremwerte der Funktion I(θ) treten für diejenigen

f (β)

f1 (β) = tan β

10.2 Fraunhoferbeugung

) (β

891

=

β

f2

−π

−π/2

0

π/2

π

3π/2 2π

5π/2

β

Abb. 10.8: Die Schnittpunkte der Kurven f1 (β) und f2 (β) sind die Lösungen von Gleichung (10.21).

Werte von β auf, für die die Ableitung dI/dβ = 0 ist, also 2 sin β (β cos β − sin β) dI = I(0) = 0. dβ β3

(10.19)

Die Bestrahlungsstärke hat Minima, die gleich null sind, wenn sin β = 0 ist, also bei β = ±π, ±2π, ±3π, . . .

(10.20)

Aus Gleichung (10.19) folgt außerdem, dass für β cos β − sin β = 0 gilt tan β = β .

(10.21)

Die Lösungen dieser transzendenten Gleichung können grafisch bestimmt werden (siehe Abb. 10.8). Die Schnittpunkte des Graphen von f1 (β) = tan β mit der Geraden f2 (β) = β erfüllen Gleichung (10.21). Zwischen zwei benachbarten Minima existiert jeweils nur ein solches Extremum (Gl. (10.20)), weshalb I(θ) für diese Werte von β Nebenmaxima haben muss (also für β = ±1,4303π, ±2,4590π, ±3,4707π, . . . ). Wir können uns auch ohne viel Mathematik klarmachen, was hier passiert. Betrachten wir den langen, schmalen Spalt in Abbildung 10.9. Wir nehmen an, dass jeder einzelne Punkt in der Öffnung huygenssche Elementarwellen emittiert. Dies entspricht einer Flut von elektromagnetischen Wellen mit gleicher Amplitude, Phase und Wellenlänge, da wir annehmen, dass der Spalt senkrecht mit homogenen, monochromatischen, ebenen elektromagnetischen Wellen bestrahlt wird. Die Netto-Propagation in die Vorwärtsrichtung ist in Abbildung 10.9 a durch ein Strahlenbündel dargestellt; sie konstituiert den ungebeugten Strahl. Wenn es um Fraunhoferbeugung für irgendeine Art von Öffnung geht, die in der beschriebenen Weise beleuchtet wird, dann gibt es immer nur einen solchen zentralen Strahl. Wenn der Beobachtungsschirm sehr weit entfernt ist, oder äquivalent, wenn es eine große Sammellinse in der Nähe der

10 Beugung

892

(a)

b

12l

(b)

u1

l

l (c)

2l

u2

z x

Abb. 10.9: Beugung des Lichts in verschiedene Richtungen. Die Öffnung ist hier ein Einzelspalt (wie in Abb. 10.7). Nullstellen der Bestrahlungsstärke treten für b sin θm = mλ auf, was in den Teilen (b) und (c) dargestellt ist. Links ist jeweils die Entwicklung der huygensschen Elementarwellen illustriert. In allen Fällen handelt es sich bei dem einfallenden Licht um ebene Wellen.

10.2 Fraunhoferbeugung

893

Öffnung gibt (wie in Abb. 10.7 e), dann wird in der Mitte des Schirms immer ein heller Bereich erscheinen, da die dort ankommenden Elementarwellen alle die gleiche optische Weglänge zurückgelegt haben, also in Phase sind und daher konstruktiv interferieren. Von dem Licht, das aus dem Spalt in alle Richtungen hervortritt, wollen wir nun den in Abbildung 10.9 b gezeigten, speziellen Strahl untersuchen. Es gibt nun einen Unterschied in den optischen Weglängen, die von den verschiedenen, an der Öffnung emittierten Elementarwellen bis zum Beobachtungsschirm zurückgelegt werden. Dieser Unterschied hängt von dem Winkel θ ab, den der Strahl mit der zentralen Achse bildet. Für den speziellen Strahl in Abbildung 10.9 b, der den Winkel θ1 mit der Achse bildet, variieren die Weglängen für die einzelnen Elementarwellen von oben nach unten um den Betrag λ. Wenn wir die Spaltbreite mit b bezeichnen, dann können wir diese Weglängendifferenz als b sin θ1 = λ ausdrücken. Elementarwellen, die in der Mitte des Spalts emittiert werden, kommen um 12 λ nach den obersten Elementarwellen am Beobachtungsschirm an, sodass es zur Auslöschung kommt. Ebenso löschen sich die Wellen, die von einem Punkt dicht unter der Mitte starten, mit denen aus, die dicht unterhalb der Spitze starten, usw. Entlang der gesamten Apertur löschen sich solche Wellenpaare gegenseitig aus, was zu einem Minimum auf dem Beobachtungsschirm bei dem Winkel θ1 führt. Mit anderen Worten, die resultierende Amplitude des elektrischen Feldes auf dem Beobachtungsschirm ist null. Und da sich die Bestrahlungsstärke wie das Quadrat der Amplitude des elektrische Feldes verhält, wird es bei dem Winkel θ1 über und unter der Achse kein Licht geben. Wir sagen, dass die Bestrahlungsstärke des zentralen Maximums an diesen ersten Minima auf null gefallen ist. Wenn θ weiter zunimmt, wird es wieder eine, wenn auch kleine, Nettoamplitude des elektrischen Feldes geben, und die Bestrahlungsstärke wird wieder anwachsen und ein sekundäres Maximum oder Nebenmaximum erreichen. Wir werden in Kürze sehen, wie dies geschieht, wenn wir die zugehörigen Zeiger betrachten. Eine weitere Zunahme des Winkels wird bald ein zweites Minimum erzeugen, wie in Abbildung 10.0 c zu sehen ist, wo b = sin θ2 = 2λ ist. In diesem Fall stellen wir uns vor, dass die Öffnung in vier Viertel geteilt ist. Elementarwelle für Elementarwelle wird das oberste Viertel das darunterliegende auslöschen, und das nächste Viertel (das dritte) wird das letzte Viertel auslöschen. Insgesamt führt dies zu einer Nettoamplitude des elektrischen Feldes von null. Paare von Elementarwellen, die von den gleichen Positionen in benachbarten Segmenten ausgehen, sind um λ/2 gegeneinander phasenverschoben und interferieren destruktiv. Allgemein treten Nullstellen der Bestrahlungsstärke auf, wenn b sin θm = mλ ,

m = ±1, ±2, ±3, . . . ,

was wegen β = mπ = (kb/2) sin θm äquivalent zu Gleichung (10.20) ist. Beachten Sie, dass für die beiden Elementarwellen vom oberen und unteren Ende des Spalts die Differenz der optischen Weglängen b sin θ ist. Dies ist äquivalent mit einer Anzahl

894

10 Beugung

von Weglängendifferenzen der Größe b sin θ/λ und mit einer Phasenwinkeldifferenz für den Einzelspalt von δ1 = 2π(b sin θ)/λ. Somit entspricht b der Hälfte der Phasenwinkeldifferenz δ1 zwischen Elementarwellen, die vom oberen bzw. unteren Ende des Einzelspalts emittiert werden. Zeiger und die Amplitude des elektrischen Feldes Abbildung 10.10 a zeigt das elektrische Feld des fraunhoferschen Beugungsmusters, das von einem schmalen Spalt auf einem entfernten Beobachtungsschirm erzeugt wird. Um zu sehen, wie dieses Muster durch Kombination der Amplituden des elektrischen Feldes entsteht, betrachten wir die Zeigerdarstellung der Elementarwellen. Ausgehend von den Abbildungen 10.7 e, 10.9 und 10.10 nehmen wir wieder an, dass dieser Spalt in eine geeignete, ungerade Zahl N gleich großer Segmente geteilt wird, von denen jeder eine Elementarwelle der gleichen Amplitude abstrahlt. Diese Elementarwellen kommen auf dem Beobachtungsschirm, der die zentrale Achse im Punkt P schneidet, in Phase an. Ihre elektrischen Felder addieren sich, was in Abbildung 10.10 b durch die lineare Aufsummierung der Zeiger dargestellt ist (jeder hat die E-Feld-Amplitude einer einzelnen Elementarwelle: E01 , E02 , E03 , usw.) Sie sind in einer geraden Linie angeordnet, da sie alle in Phase sind (δ1 , die Phasendifferenz des Einzelspalts ist null und β = 0.) Die Nettoamplitude des elektrischen Feldes im Punkt 1 in Abbildung 10.10 a ist dann E0 (θ) = E0 (0) = E01 + E02 + E03 + . . . , und das ist der maximale Wert, den die resultierende Amplitude erreichen kann. Da es N beitragende Elementarwellen gibt, die alle die Amplitude E01 haben, folgt E0 (0) = N E01 . Hier haben wir N = 9 gewählt, um das Verfahren zu illustrieren. Wenn θ zunimmt und sich der Punkt P auf dem Beobachtungsschirm nach oben verschiebt, kommt jede Elementarwelle mit der gleichen relativen Phasenverschiebung an. Liegt P im Punkt 2 der Abbildung 10.10 a, wo β = π/2 ist, dann gibt es eine Differenz der Phasen zwischen den beiden Elementarwellen an den Enden des Spalts, die gleich δ1 = 2β = π ist, also eine halbe Wellenlänge. Nehmen wir die vom Zentrum des Spalts ausgehende Elementarwelle als Referenz. Ihr Zeiger (bezeichnet mit R und markiert durch einen schwarzen Punkt an seinem Ende) wird in Abbildung 10.10 c wieder horizontal nach rechts gezeichnet. Die Zeiger für die Elementarwellen, die unterhalb des Zentrums entspringen (die Zeiger B1 , B2 und B3 in Abbildung 10.10 c, wobei N = 7 zu setzen ist), müssen längere optische Weglängen zurücklegen und liegen deshalb gegenüber der zentralen Welle zurück. Dagegen eilen die Zeiger der von oberhalb des Zentrums stammenden Elementarwellen (A1 , A2 und A3 , N = 7) dem Zeiger R voraus. Wieder gilt für den Punkt 2 in Abbildung 10.10 a β = π/2 und somit δ1 = 180◦ . Abbildung 10.10 c beginnt mit N = 7, während N in Abbildung 10.10 c eine wirklich sehr große ungerade Zahl ist, wie es sein muss. Nehmen wir in Abbildung 10.10 c den zentralen Zeiger R als Referenz, dann ist jeder der (N − 1)/2 Zeiger, die zu den unterhalb der Spaltmitte emittierten Elementarwellen gehören, gegenüber seinem Vorgänger um den Winkel δ1 /(N − 1) = 180◦ /(N − 1)

10.2 Fraunhoferbeugung (a)

895 (b)

E0 (0)

Punkt 1 E0(0) E01 E02 E03

E09 E0( q2 )

(c) E0( q2 )

Punkt 2

B3

A3

B2

A2 B1

(d) 2

3

4

A1

R E0( q2 )

E0( q3 ) 1

d1 = 0 b=0 N=9

d1 = p b = p/2 N=7

Punkt 2 d1 = p b = p/2 N sehr groß

5

b=0 b=p b=2p b=p/2 b=3p/2

(g) (e)

zwischen Punkt 2 und 3 d1 = 3p/2 b = 3p/4 N sehr groß

(f) E0( q3 ) = 0

Punkt 3 d1 = 2p b=p N sehr groß

(h)

E0( q5 ) = 0

Punkt 4 d1 = 3p b = 3p/2 N sehr groß Punkt 5 d1 = 4p b = 2p N sehr groß

Abb. 10.10: Elektrisches Feld für die Fraunhoferbeugung am Einzelspalt. (a) Amplitude des elektrischen Feldes als Funktion der Position. (b) Maximale Amplitude für β = 0. (c) Die resultierenden Amplituden für N = 7. B1 läuft R um 30◦ hinterher und ist gegenüber der Referenz um 30◦ im Uhrzeigersinn gedreht. B2 läuft entsprechend B1 nach und B3 läuft B2 nach. B3 kommt vom unteren Ende des Spalts. Entsprechend eilt A1 der Referenz R voraus, A2 eilt A1 voraus und A3 eilt A2 voraus (jeweils um 30◦ ). A kommt vom oberen Ende des Spalts. (d) Hier ist δ1 = π und E0 (θ2 ) ist positiv. (e) Für δ1 = 2π ist die Amplitude null. (f) Bei Punkt 4 ist E0 (θ4 ) negativ. (g) Für δ1 = 4π ist E0 (θ5 ) = 0.

gedreht (im Uhrzeigersinn, da die Zeiger hinterherlaufen). Entsprechend sind die (N − 1)/2 Zeiger, die zu den oberhalb der Spaltmitte emittierten Elementarwellen gehören, jeweils um 180◦ /(N − 1) gegen den Uhrzeigersinn gedreht. Insgesamt ergibt sich daraus eine Netto-Phasenverschiebung von π; die Zeiger für die Enden des Spalts zeigen nach unten (weißer Kreis am Pfeilende) bzw. oben (weiße Pfeilspitze). Entsprechend wird für N = 5, 7, 9, . . . jeder Zeiger gedreht, wobei die Winkel 45◦ , 30◦ , 22,5◦ usw. sind. Die Resultierende ist für jedes ungerade N der Zeiger mit der Amplitude E0 (θ2 ), der vom Ende des ersten Pfeils (kleiner weißer Kreis) nach rechts zur letzten Pfeilspitze (weiß) gezeichnet ist; er ist parallel zum Referenzzeiger und daher positiv. Außerdem wissen wir, dass für seinen Wert E0 (θ2 ) < E0 (0) gelten muss, da die Gesamtlänge der Zeiger auf dem Kreisbogen E0 (0) ist.

896

10 Beugung

Aus Symmetriegründen ist die Resultierende immer horizontal (positiv oder negativ). Mit anderen Worten, der Zeiger für eine Elementarwelle, die vom oberen Ende des Spalts kommt, ist gegenüber dem Zeiger der Elementarwelle vom unteren Ende um 2β = π phasenverschoben. Da im Punkt 2 δ1 = π gilt, liegen die Zeiger auf einem Halbkreis, dessen Zentrum mit dem Zentrum der Resultierenden zusammenfällt. Die beiden Radiusvektoren, die zum ersten Zeigeranfang und zur letzten Zeigerspitze gezeichnet sind, spannen einen Winkel auf, der gleich δ1 = 180◦ ist. Nehmen wir nun an, dass N sehr groß gemacht wird. Für jeden gegebenen Wert von θ werden die einzelnen Phasenverschiebungen, die alle gleich sind, entsprechend klein sein, was für die Zeiger ebenso gilt. Und wenn N noch größer wird, wird der von den aneinandergesetzten Zeigern gebildete Bogen in eine stetige Kurve übergehen, die als Vibrationskurve bezeichnet wird (Abb. 10.10 d). Damit wir besser sehen können, wie sich die Kurve mit θ ändert, markieren wir wieder den Anfang der Vibrationskurve mit einem weißem Kreis und das Ende mit einer weißen Pfeilspitze. Die Länge des Bogens ist durch die Länge der Kette von Zeigern in Abbildung 10.10 b fixiert, nämlich gleich E0 (0). Für jeden Wert von θ gibt es eine spezielle Konfiguration der Vibrationskurve. Wenn θ zunimmt, wächst die Differenz zwischen den optischen Weglängen der Elementarwellen vom oberen und vom unteren Ende des Spalts; der relative Phasenwinkel zwischen individuellen Zeigern wächst und die Vibrationskurve bildet eine sich nach innen windende Spirale. Das bedeutet, dass die maximal mögliche resultierende Amplitude immer kleiner wird, je weiter sich P von der zentralen Achse weg bewegt. Für Werte von β zwischen jenen in Punkt 2 und Punkt 3 von Abbildung 10.10 a biegt sich der halbkreisförmige Bogen der Vibrationskurve in Abbildung 10.10 d etwas mehr nach oben und beginnt, sich zu schließen, da die Bogenlänge konstant bleibt. Dies ist in Abbildung 10.10 e gezeigt. Die zum ersten Zeigeranfang und zur letzten Zeigerspitze gezeichneten Radiusvektoren schließen nun einen Winkel ein, der größer ist als 180◦ . Die Resultierende verläuft noch immer von links nach rechts und ist positiv, doch ihr Betrag hat abgenommen. Im Punkt 3 in Abbildung 10.10 a ist δ1 = 2β = 2π, also eine Wellenlänge, und wir haben die in Abbildung 10.9 b gezeigte Situation, in der die Elementarwellen einander auslöschen. Der aus infinitesimalen Zeigern zusammengesetzte Bogen (Abb. 10.10 e wächst und biegt sich oben nach links und rechts, während der Radius schrumpft, bis sich die Kurve oben schließt (denken Sie sich den winzigen Referenzzeiger noch unten an seinem Platz) und die Resultierende geht gegen null; die Amplitude des elektrischen Feldes ist im Punkt 3 null. Das Zentrum des Bogens der Vibrationskurve ist nun der Mittelpunkt des Kreises. Dies ist in Abbildung 10.10 f gezeigt. Die beiden zuvor gezeichneten Radien (zum Anfang des ersten Zeigers in der Kette und zur Spitze des letzten Zeigers) schließen nun einen Winkel von 360◦ ein. Den letzten infinitesimalen Zeiger ganz oben an dem Kreis kann man sich als nach links zeigend vorstellen, weil die Resultierende negativ sein wird, wenn θ wächst.

10.2 Fraunhoferbeugung

897

Für Punkt 4 in Abbildung 10.10 a ist δ1 = 2β = 3π, der Radiusvektor ist noch etwas kleiner geworden und die Vibrationskurve durchläuft 3π (Abb. 10.10 g). Gegenüber dem infinitesimalen Referenzzeiger (gekennzeichnet durch den schwarzen Punkt am Ende) hat sich der erste Zeiger (gekennzeichnet durch einen kleinen weißen Kreis) um 3π/2 im Uhrzeigersinn gedreht (wobei er immer tangential zur Kurve geblieben ist) und zeigt nach oben. Entsprechend hat sich die Spitze des letzten Zeigers (gekennzeichnet durch eine weiße Pfeilspitze) gegen den Uhrzeigersinn gedreht und zeigt nach unten. Die resultierende Amplitude ist klein und der Zeiger zeigt in die entgegengesetzte Richtung des Zeigers für das zentrale Maximum (Referenzzeiger). Dieses elektrische Feld ist daher negativ. Für Punkt 5 in Abbildung 10.10 a ist 2β = 4π, und der erste Zeiger dreht sich (beginnend am Referenzzeiger) um 360◦ im Uhrzeigersinn (Abb. 10.10 h), während sich der letzte Zeiger (beginnend am Referenzzeiger) um 360◦ gegen den Uhrzeigersinn dreht. Die beiden treffen sich, jeweils nach rechts zeigend, und die resultierende Amplitude ist wieder null. Da der letzte infinitesimale Zeiger nach rechts zeigt (weißer Pfeil), wird das Feld wieder positiv, wenn θ danach wieder wächst. So ergibt sich für die resultierende Amplitude des elektrischen Feldes ein alternierendes Vorzeichen, während ihr Betrag mit wachsendem θ abnimmt (siehe Abb. 10.11).

(d) (c) (b)

(a)

Abb. 10.11: Zusammenfassende Darstellung der Zeigeraddition für den Einzelspalt. Wenn sich P von der zentralen Achse weg bewegt, nimmt θ zu, ebenso der Abstand zwischen dem Spalt und P . Folglich werden die Amplituden der Elementarwellen, die P erreichen, kleiner, sodass die Amplituden der Zeiger mit wachsendem θ kleiner werden. Das führt dazu, dass die Vibrationskurve eine sich einwärts windende Spirale bildet. Die Gesamtlänge der Kurve ist von (a) nach (d) konstant. Der resultierende Zeiger dagegen ändert Länge und Vorzeichen, während P sich verschiebt und die Spirale sich einwärts windet.

Abbildung 10.12 zeigt den allgemeinen Fall, in dem die Amplitude E0 (θ) = 2r sin β ist und die Bogenlänge E0 (0) = 2rβ. Die normierte Amplitude des elektrischen Feldes ist dann sin β E0 (θ) = , E0 (0) β wobei das Quadrat davon Gleichung (10.17) für die Bestrahlungsstärke erfüllt. Die Amplitude, die sinc-Funktion, hat ihre Nullstellen bei β = ±π, ±2π, ±3π, . . . . Im Gegensatz zur Feldamplitude, die negativ sein kann, wird die Bestrahlungsstärke

10 Beugung

898 r A

b b

r

d r sinb rb

E0(u) E0(0)

r sinb

rb

B

Abb. 10.12: Hier ist die resultierende Amplitude (von A nach B) E0 = 2r sin β, und die zugehörige Bogenlänge ist E0 (0) = 2rβ.

(definiert als Energie pro Flächen- und Zeiteinheit) nie negativ. Obwohl die Amplitude des elektrischen Feldes von großem theoretischen Interesse ist, ist das, was wir messen, die Bestrahlungsstärke, auf die wir daher unsere Aufmerksamkeit richten wollen. An dieser Stelle sei eine Warnung eingefügt: Eine der Schwächen des HuygensFresnel-Prinzips besteht darin, dass es den Variationen der Amplitude mit dem Winkel entlang der einzelnen sekundären Elementarwellen nicht ausreichend Rechnung trägt. Wir werden darauf zurückkommen, wenn wir den Neigungsfaktor bei der fresnelschen Beugung betrachten, bei der der Effekt signifikant ist. Bei der Fraunhoferbeugung ist der Abstand von der Öffnung bis zur Beobachtungsebene so groß, dass wir uns darum nicht kümmern müssen, solange θ klein bleibt. Bestrahlungsstärke des Einzelspalts Abbildung 10.13 zeigt die normierte Flussdichte, wie sie durch Gleichung (10.17) gegeben ist. Betrachten wir einen Punkt auf der Kurve, z. B. das dritte Nebenmaximum bei β = 3,4707π. Weil β = (πb/λ) sin θ ist, muss der Winkel θ kleiner werden, wenn die Spaltbreite vergrößert wird und β konstant bleiben soll. Das gesamte Beugungsmuster zieht sich dann auf das Hauptmaximum zusammen. Derselbe Effekt tritt auf, wenn die Wellenlänge abnimmt. Die Breite des Streifenmusters und folglich die Breite des zentralen Maximums verhält sich umgekehrt proportional zur Spaltbreite. Die Breite des zentralen Maximums wird zweckmäßigerweise durch den Abstand zwischen der ersten Nullstelle der Bestrahlungsstärke auf der einen Seite des zentralen Maximums (m = +1) und der ersten Nullstelle auf der anderen Seite (m = −1) definiert. Wegen b sin θm = mλ und weil wir es gewöhnlich mit kleinen Winkeln zu tun haben, für die sin θm ≈ θm gilt, ist die Winkelbreite Δθ des zentralen Maximums (in rad) Δθ = 2θ1 ≈ 2λ/b . Die normierte Bestrahlungsstärke I(θ)/I(0) am zentralen Maximum ist gegeben durch (sin β)/β mit β → 0. Für kleine β ist sin β ≈ β, sodass (sin β)/β gegen 1 geht. Das nächste Maximum ist ein winziger Peak bei β = 1,4304π (siehe Abb. 10.8). Dort ist die relative Bestrahlungsstärke [(sin β)/β]2 = [(sin 1,4304π)/1,4304π]2 = 0,04719 . Dieses Maximum erreicht nur 4,72 % der Größe des zentralen Maximums. In Tabelle 10.1 sind die Werte von β und die zugehörigen Werte der normierten Bestrahlungs-

10.2 Fraunhoferbeugung

899

(a)

I(u)I(0) 1.0

I(u) sin b = I(0) b

(

0.5

)

2

0.4 0.3 0.2 0.1

−lb

p

0

lb

2p 2lb

3p 3lb

3.47p

0

2.46p

−p

1.43p

−2p

−2lb

−3lb (b)

−2.46p

−3p

−1.43p

0.016 −3.47p

0.008

0.047 b

sin u

I(u)I(0)

b = 1l 10l 4l 0

2l

Abb. 10.13: Das fraunhofersche Beugungsmuster für einen Einzelspalt. (a) Verteilung der Bestrahlungsstärke. (b) Normierte Bestrahlungsstärke für die Spaltbreiten λ, 2λ, 4λ und 10λ.

stärken für einige aufeinanderfolgende Maxima und Minima aufgelistet. Das zentrale Maximum, auch Hauptmaximum genannt, ist doppelt so breit wie die anderen Streifen höherer Ordnung, und es enthält mehr als 80 % des auf dem Beobachtungsschirm ankommenden Lichts. Wenn die Spaltbreite b klein gegenüber der Wellenlänge ist, wird das austretende Licht in Bezug auf die Normale zum Spalt deutlich aufgefächert, und das zentrale Bestrahlungsmaximum wird sehr breit. Abbildung 10.13 b zeigt die normierte Bestrahlungsstärke, wobei b die Werte λ, 2λ, 4λ und 10λ annimmt. Aufgrund der Normierung ist das Maximum für jede Kurve 1, doch natürlich ist die Energie bei kleiner werdendem b über einen breiteren Bereich verteilt und I(0) muss abnehmen – die Energie bleibt erhalten.

10 Beugung

900 Tabelle 10.1: Fraunhoferbeugung am Einzelspalt.

β

± normierte Amplitude normierte Bestrahlungsstärke Max./Min.?

0 π 1,4303 π 2π 2,4590 π 3π 3,4707 π 4π

1 0 −0,217 0 0,128 0 −0,091 0

1 0 0,047 0 0,016 0 0,008 0

Max. Min. Max. Min. Max. Min. Max. Min.

Beispiel 10.1 Betrachten Sie die Anordnung in Abbildung 10.3, in der eine große Linse L2 nahe vor dem langen, 0,25 mm schmalen Spalt des Blendenschirms platziert ist. Für die Bestrahlung wird grünes Magnesiumlicht bei 518,36 nm verwendet. Bestimmen Sie die Breite des von L2 gebildeten zentralen Maximums auf dem Beobachtungsschirm σ. Nehmen Sie an, dass die Linse eine Brennweite von 65,0 cm hat. Lösung Wir zeichnen eine Linie vom Mittelpunkt der Linse (auf der zentralen Achse liegend) zum Punkt P auf dem Schirm σ, wobei diese Linie mit der zentralen Achse den Winkel θ einschließt. Das auf dem Schirm zu sehende Bild hat einen senkrechten Abstand von einer Brennweite (f ) von der Linse. Y1 sei der auf dem Schirm gemessene Abstand von der zentralen Achse bis zur ersten Nullstelle der Bestrahlungsstärke im Punkt P . Die Breite des Hauptmaximums ist dann 2Y1 . Es gilt tan θ1 = Y1 /f und somit Y1 = f tan θ1 . Für kleine Werte von θ1 ist Y1 = f tan θ1 ≈ f sin θ1 , wobei für das m-te Minimum b sin θm = mλ und somit Y1 ≈ f λ/b gilt. Daraus folgt 2Y1 ≈ 2f λ/b ≈

2(65,0 × 10−2 )(518,36 × 10−9 ) ≈ 2,695 mm . 0,25 × 10−3

Gerundet auf zwei Nachkommastellen ist die Breite des zentralen Maximums auf dem Beobachtungsschirm also 2,70 mm.

Die Lichtwelle, die sich jenseits des Blendenschirms fortpflanzt, ist ziemlich kompliziert, da sie überall im Raum in den verschiedenen Richtungen (verschiedene Werte von θ) unterschiedliche Amplituden hat. Für die Anordnung aus Abbildung 10.3 mit einer Linse L2 , die die Brennweite f hat, ist in Abbildung 10.14 die resultierende

10.2 Fraunhoferbeugung

901 1

E0(u)E0(0) I(u)I(0)

Y

0 lf b 1.43

2

lf b

3

lf b

lf lf lf 2.46 3.47 b b b

Abb. 10.14: Die durchgezogene Kurve ist die normierte Bestrahlungsstärke. Die Punktlinie ist die normierte Amplitude des elektrischen Feldes. Das Muster wird von einer Linse mit der Brennweite f erzeugt. Der Abstand Y ist vom Durchstoßpunkt der zentralen Achse durch den Beobachtungsschirm aus gemessen.

normierte Amplitude des elektrischen Feldes sowie die normierte Bestrahlungsstärke dargestellt. Erinnern Sie sich, dass ein negativer Wert der Amplitude des elektrischen Feldes anzeigt, dass das Feld an dieser Stelle um 180◦ gegenüber dem Feld des zentralen Maximums phasenverschoben ist. Weiter vorn hatten wir den Versuch von Young behandelt, in dem am Anfang ein kleines Loch (Abb. 9.10) oder ein kleiner Spalt (Abb. 9.11) benutzt wurde, um das am Blendenschirm ankommende Licht zu beschränken. Wir haben das gemacht um zu erreichen, dass die beiden Öffnungen (zwei kleine Löcher oder Spalte) im zweiten Schirm innerhalb des zentralen Maximums des Beugungsmusters des ersten Lochs bestrahlt werden. Wenn daher der erste lichtundurchlässige Schirm einen sehr schmalen Spalt hätte, würde das dem breiten Hauptmaximum des Fraunhofermusters entsprechende Licht beide Spalte des Blendenschirms beleuchten. Wie wir in Kapitel 12 bei der Behandlung des so genannten Cittert-Zernike-Theorems sehen werden, besitzt das Licht innerhalb des ersten Hauptmaximums ein hohes Maß an räumlicher Kohärenz, und zwar auch dann, wenn die Quelle eine hohe Bandbreite hat. Strahlt die Quelle weißes Licht ab, so erscheinen bei den Maxima höherer Ordnung die Spektralfarben aufgefächert, wobei Rot am stärksten (und mit zunehmendem θ immer stärker) gebeugt wird. Die Maxima und Minima für jede einzelnen Farbkomponente liegen bei Positionen, die für die jeweilige Wellenlänge charakteristisch sind (Aufgabe 10.6). Nur in der Umgebung des Hauptmaximums, bei θ = 0, überlagern die Komponenten einander zu weißem Licht.

10 Beugung

902

S1 S2 s L2

(a)

L1

Σ

(b)

Abb. 10.15: (a) Einzelspaltmuster mit einer Linienquelle. (b) Derselbe Einzelspalt wird mit ebenen Wellen bestrahlt. Siehe das erste Foto von Abbildung 10.18.

In Abbildung 10.6 müssen wir uns die Punktquelle S auf einer Senkrechten durch die Mitte des Beugungsmusters vorstellen. Mit einer solchen Beleuchtung wird durch den Spalt in Σ ein Beugungsmuster in der yz-Ebene von σ erzeugt, das die Form einer Reihe heller Flecken hat, ähnlich dem ausgedehnten Bild von S in Abbildung 10.6 b. Eine inkohärente Quelle anstelle von S, die parallel zum Spalt in der Ebene des Kollimators L1 liegt, erzeugt eine Reihe von Bändern. Jeder Punkt der Linienquelle erzeugt ein eigenes Beugungsmuster; alle diese Muster sind gegeneinander entlang der y-Achse verschoben. Ohne Beugungsschirm wäre das Bild eine Linie parallel zum (nicht vorhandenen) Spalt. Mit dem Schirm wird diese Linie verbreitert, wie auch das Bild der Punktquelle (Abb. 10.15) verbreitert wurde. Denken Sie daran, dass die geringe Ausdehnung des Spalts für diese Verbreiterung verantwortlich ist. Beugungsmuster am Einzelspalt können auch ohne spezielle Ausrüstung leicht beobachtet werden. Nahezu alle Lichtquellen, die einer Punkt- oder Linienquelle ähneln, sind gut geeignet: eine Straßenlaterne bei Nacht, eine kleine Glühlampe oder das durch einen Spalt in der Jalousie fallende Sonnenlicht. Für unsere Zwecke eignet sich vielleicht am besten eine durchsichtige Glühlampe mit einem geraden Glühfaden von einigen Zentimetern Länge. Mit etwas Phantasie lassen sich alle möglichen Einzelspaltanordnungen erzeugen, etwa mithilfe eines Kammes oder einer Gabel (so gedreht, dass der projizierte Abstand zwischen den Zinken klein genug wird) oder eines Kratzers in einer Tuscheschicht auf einem Objektträger. Eine einfache Schieblehre liefert einen hervorragenden variablen Spalt: Halten Sie das Gerät etwa ein Zehntel Millimeter weit geöffnet, parallel zu einer Linienquelle (Glühfaden) sehr nahe vor das Auge. Stellen Sie Ihr Auge hinter dem Spalt auf Unendlich ein, damit es die Funktion der Linse L2 übernehmen kann.

10.2 Fraunhoferbeugung

903

10.2.2 Beugung am Doppelspalt Auf den ersten Blick könnte man ausgehend von Abbildung 10.7 vermuten, das Hauptmaximum müsse sich stets auf einer Linie mit dem Mittelpunkt der beugenden Öffnung befinden. Dies muss aber nicht so sein. Genau genommen bildet nämlich die Achse der Linse L2 das Zentrum des Beugungsmusters, dessen Position und Form gleich bleiben, solange sich die Orientierung des Spalts nicht ändert und die Bedingungen der Näherungen erfüllt sind (Abb. 10.16). Alle Wellen, die sich parallel zur Linienachse ausbreiten, werden im zweiten Brennpunkt fokussiert; dort befindet sich dann das Bild von S und das Zentrum des Beugungsmusters. Nehmen wir nun an, wir hätten zwei lange Spalte der Breite b, deren Mittelpunkte sich im Abstand a voneinander befinden (Abb. 10.17). Jeder Spalt für sich würde auf dem Beobachtungsschirm σ das gleiche Beugungsmuster erzeugen wie ein Einzelspalt. Jetzt aber überlagern sich in jedem Punkt der Ebene σ die Beiträge der beiden Spalte – zwar müssen die Amplituden der Beugungsbilder ungefähr gleich groß sein, doch können sich ihre Phasen wesentlich voneinander unterscheiden. Da die beiden sekundären Quellen (in den Spalten) von ein und derselben Primärquelle erzeugt werden, sind die entstehenden Elementarwellen kohärent. Deshalb ist Interferenz zu erwarten. Wenn die primäre ebene Welle unter einem Winkel θi auf dem Schirm Σ auftrifft (siehe Aufgabe 10.2), dann ergibt sich zwischen den beiden Sekundärquellen ein konstanter Phasenunterschied. Bei senkrechtem Einfall der Primärwelle werden alle Elementarwellen phasengleich emittiert. Das Interferenzmuster in einem beliebigen Punkt wird durch den Unterschied der optischen Weglängen bestimmt, die die von den Spalten ausgehenden, sich überlagernden Elementarwellen bis zum Punkt P zurücklegen. Wie wir noch sehen werden, ist die Flussdichteverteilung (Abb. 10.18) dann das Resultat des schnell variierenden Doppelspalt-Interferenzsystems, das durch das Beugungsmuster des Einzelspalts moduliert wird. Um einen Ausdruck für die optische Störung in einem Punkt P der Ebene σ zu erhalten, müssen wir die oben vorgenommene Analyse der Beugung am Einzelspalt lediglich etwas abwandeln. Wir teilen jede der beiden Öffnungen in infinitesimale Streifen (dz × ), welche sich ihrerseits wie unendlich viele, entlang der z-Achse anz

x

L2 Σ

Abb. 10.16: Die Doppelspalt-Anordnung. σ

10 Beugung

904 fehlende Ordnung

„halber“ Streifen (c)

0 (a)

(b)

Abb. 10.17: (a) Zur Geometrie des Doppelspalts. Punkt P auf σ ist praktisch unendlich weit entfernt. (b) Beugungsmuster am Doppelspalt (a = 3b). (c) Detailansicht: fehlende Ordnung.

geordnete Punktquellen verhalten. In der Fraunhofer-Näherung [Gl. (10.12)] erhalten wir dann als Gesamtbeitrag zum elektrischen Feld ˆ a+b/2 ˆ +b/2 F (z)dz + C F (z) dz (10.22) E=C −b/2

a−b/2

mit F (z) = sin[ωt − k(R − z sin θ)]. Der Faktor C gibt die als konstant angenommene (und von z unabhängige) Amplitude der sekundären Quelle pro Längeneinheit auf der z-Achse, geteilt durch R, den Abstand zwischen dem Ursprung und P , an. Einen konkreten Wert von C müssen wir nicht angeben, da wir uns an dieser Stelle nur für die relativen Flussdichten auf σ interessieren. Die Integration von Gleichung (10.22) liefert   sin β [sin (ωt − kR) + sin (ωt − kR + 2α)] (10.23) E = bC β mit α ≡ (ka/2) sin θ und, wie oben, β ≡ (kb/2) sin θ. Gleichung (10.23) entspricht einfach der Summe zweier Felder gemäß Gleichung (10.15), eines von jedem Spalt. Der Abstand zwischen dem ersten Spalt und P ist gleich R, wodurch ein Phasenbeitrag von −kR entsteht. Der zweite Spalt ist von P um (R − a sin θ) oder (R − 2α/k) entfernt, und der entsprechende Phasenbeitrag ist (−kR + 2α) wie im zweiten Sinusterm von Gleichung (10.23). Die Größe 2β ist die Phasendifferenz (kΛ) zweier fast paralleler Strahlen, die ausgehend von den Kanten eines der Spalte im Punkt P der Ebene σ eintreffen. Die Größe 2α hingegen entspricht der Phasendifferenz

10.2 Fraunhoferbeugung

905

5b br eit

e,

a

10

b

Io

alt

0

Sp

0

Abstan

d vom

.5Z

o

zentrale

b

Bestrahlungsstärke

(a)

n Max

imum,

(b)

Z

Zo

Abb. 10.18: Fraunhofer-Beugungsmuster am Einzel- und am Doppelspalt. (a) Diese Fotos wurden im monochromatischen Licht aufgenommen. (Mit frdl. Genehmigung von M. Cagnet, M. Francon und J. C. Thrierr, Atlas optischer Erscheinungen, Springer-Verlag, Berlin-Heidelberg-New York 1962.) (b) Ist der Abstand der Spalte gleich b, so verschmelzen diese zu einem Spalt mit der Breite 2b, und es ergibt sich ein Beugungsmuster am Einzelspalt (die am weitesten vorn liegende Kurve). Die am weitesten hinten liegende Kurve gehört zu einem Abstand von a = 10b zwischen den Spalten. Beachten Sie, dass das erste Minimum aller Doppelspaltmuster im Abstand Z0 vom zentralen Maximum liegt. Wenn b im Vergleich zu a kleiner wird, gehen die Kurven allmählich in Abbildung 10.17 b über. (Nachdruck aus „Graphical Representations of Fraunhofer Interference and Diffraction“, Am. J. Phys. 62 (1994) 6, mit frdl. Genehmigung von A. Bartlett, University of Colorado sowie B. Mechtly, Northeast Missouri State University und der American Association of Physics Teachers.)

10 Beugung

906

zweier Wellen im Punkt P , von denen eine von einem Punkt im ersten Spalt, die andere von einem entsprechenden Punkt im zweiten Spalt ausgeht. Wir vereinfachen Gleichung (10.23) zu   sin β cos α sin (ωt − kR + α) E = 2bC β und erhalten durch Quadrieren und Mittelwertbildung über ein relativ großes Zeitintervall die Bestrahlungsstärke  2  sin β (10.24) cos2 α . I(θ) = 4I0 β2 In Richtung θ = 0, also α = β = 0, ist I = 4I0 , wobei I0 der Beitrag jedes einzelnen Spaltes ist. Der Faktor 4 entsteht dadurch, dass die Amplitude des elektrischen Feldes doppelt so groß ist, wie sie für einen Einzelspalt wäre. Wenn b sehr klein wird (kb  1), dann ist (sin β/β) ≈ 1 und Gleichung (10.24) reduziert sich auf den Fall zweier langer Linienquellen, den wir vom youngschen Doppelspaltversuch her kennen [Gl. (9.17)]. Wird dagegen a = 0, dann verschmelzen die beiden Spalte zu einem, α = 0, und aus Gleichung (10.24) wird I(0) = 4I0 (sin2 β)/β 2 . Dies entspricht gerade Gleichung (10.17) für die Beugung am Einzelspalt mit verdoppelter Quellstärke. Den gesamten Ausdruck (10.24) können wir daher als cos2 α-Interferenzterm betrachten, moduliert durch einen Beugungsterm (sin2 β)/β 2 . Sind beide Spalte sehr schmal (aber noch endlich breit), dann liefert jeder Spalt ein Beugungsbild, das innerhalb eines großen Zentralbereichs gleichförmig aussieht und Bänder enthält, die den idealisierten youngschen Streifen ähneln. Nimmt der Winkel θ Werte an, für die β = ±π, ±2π, ±3π, . . . wird, so sorgen die Beugungseffekte dafür, dass kein Licht auf σ ankommt – folglich ist auch keine Interferenz zu erwarten. In Punkten von σ, für die dagegen α = ±π/2, ±3π/2, ±5π/2, . . . ist, sind die einzelnen Beiträge zum elektrischen Feld in der Ebene vollständig (um 180◦ ) phasenverschoben und löschen einander aus. Es ist also dunkel, unabhängig davon, wie viel Licht durch die Beugung geliefert wird. Als wir den youngschen Versuch für zwei idealisierte, schmale Spalte untersucht haben, war die Phasenwinkeldifferenz δ = ka sin θ und α = δ/2. Wir haben gesehen (Abb. 9.14 c), dass immer wenn δ gleich einem ungeraden ganzzahligen Vielfachen von π ist, die von den beiden Spalten kommenden Elementarwellen vollständig phasenverschoben sind und sich auf dem Beobachtungsschirm gegenseitig auslöschen. Mit anderen Worten, die zugehörigen Zeiger waren dann antiparallel, was zu einer

10.2 Fraunhoferbeugung

907

-20

-10

0 Position

10

20

Bestrahlungsstärke

a = 2.5 b = 0.25

-20

-10

0 Position

10

a = 2.5 b = 0.5

Bestrahlungsstärke

Bestrahlungsstärke

a = 2.5 b = 0.75

-20

-10

0 Position

10

20

Abb. 10.19: Fraunhoferbeugung am Doppelspalt. Hier wird bei konstant gehaltener Spaltbreite a die Spaltbreite b von 0,75 mm auf 0,25 mm verringert. Mit abnehmender Spaltbreite wird die Einhüllende des Einzelspalts breiter und enthält immer mehr Doppelspaltstreifen (cos2 -Streifen), die (bis auf die Höhe) gleich bleiben.

20

resultierenden Amplitude des elektrischen Feldes von null und zu einer Bestrahlungsstärke von null führte. Die Verteilung der Bestrahlungsstärke für die Fraunhoferbeugung am Doppelspalt ist in den Abbildungen 10.17 b und 10.19 dargestellt. Beachten Sie, dass es sich um eine Kombination der Abbildungen 9.12 und 10.6 handelt. Die gezeichnete Kurve entspricht dem Spezialfall a = 3b (also α = 3β). Eine Vorstellung vom allgemeinen Erscheinungsbild des Musters kann man gewinnen, wenn man sich überlegt, dass bei a = mb (m ist eine beliebige Zahl7 ) 2m helle Streifen innerhalb des Zentralbereichs entstehen, wenn wir auch „Bruchteile“ von Streifen mitzählen (Aufgabe 10.14). Zu einem bestimmten Wert von θ können ein Interferenzmaximum und ein Beugungsminimum (null) gehören. In diesem Fall steht an der jeweiligen Stelle kein Licht für die Interferenz zur Verfügung. Folglich fehlt ein Maximum und man spricht von einer fehlenden Ordnung. Beispiel 10.2 Gegeben sind zwei lange, schmale, parallele Spalte, die beide die Breite b und den Abstand a = 0,100 mm voneinander haben. Die Spalte werden senkrecht mit ebenen Wellen von gelbem Natriumlicht (λ = 589,6 nm) beleuchtet. Das 7

m muss keine ganze Zahl sein. Ist m jedoch ganzzahlig, so entstehen „halbe“ Streifen wie in Abbildung 10.17 c.

10 Beugung

908

resultierende Streifenmuster auf einem entfernten Schirm besteht aus insgesamt neun schmalen Maxima, deren Helligkeit vom zentralen Maximum zu den Seiten hin allmählich abnimmt. Bestimmen Sie eine Näherung für die Spaltbreite b. Lösung Wir wissen, dass für die Beugung am Einzelspalt b sin θmB = mB λ gilt, wobei das Subskript B für „Beugung“ steht. Außerdem gilt für die Doppelspaltinterferenz a sin θmI = mI λ, wobei das Subskript I für „Interferenz“ steht. Dass es insgesamt neun Maxima gibt, bedeutet, dass auf beiden Seiten des Hauptmaximums vier Nebenmaxima liegen, d. h., es ist mI = ±4. Daher sollte die Position des Randes des zentralen Beugungsmaximums θ1B der Position des Randes des vierten Interferenzstreifens θ4I entsprechen. Aus sin θ4I = sin θ1B folgt θ4I = θ1B . Daraus folgt 1λ 4λ = a b 4b = a 0,100 mm b= 4 und schließlich b = 0,025 mm.

Auch das Beugungsbild am Doppelspalt lässt sich leicht beobachten, und es liefert interessante Aufschlüsse. Am besten eignet sich die schon im Zusammenhang mit dem Einzelspalt beschriebene Glühlampe mit geradem Glühfaden. Um zwei Spalte zu erhalten, beschichtet man einen Objektträger mit Tusche (oder einer besser deckenden Suspension von Graphit in Alkohol) und ritzt zweimal mit einer Rasierklinge. Stellen Sie sich drei Meter von der Lichtquelle entfernt auf und halten Sie die Spalte, parallel zur Quelle, dicht vor das Auge, das auf Unendlich akkommodiert ist und so die notwendige Linse liefert. Halten Sie eine rote oder blaue Plastikfolie vor die Spalte. Wie ändert sich das Beugungsmuster in Abhängigkeit von der Wellenlänge? Was passiert, wenn Sie erst einen und dann beide Spalte mit einem Objektträger abdecken? Bewegen Sie die Spalte langsam in z-Richtung; halten Sie anschließend die Spalte ruhig und bewegen Sie das Auge in z-Richtung. Überzeugen Sie sich davon, dass der Mittelpunkt des Beugungsmusters tatsächlich von der Linse und nicht von der Öffnung abhängt.

10.2 Fraunhoferbeugung

909

10.2.3 Beugung an vielen Spalten Wir betrachten nun die Beugung an einer Reihe von langen, schmalen, parallelen Spalten. Bevor wir zur formalen mathematischen Analyse kommen, wollen wir anwenden, was wir über Zeiger wissen, um ein paar der Ergebnisse vorherzusagen. Abbildung 10.20 a zeigt drei parallele Spalte, die jeweils die Breite b und voneinander den Abstand a haben und die senkrecht mit monochromatischen ebenen Wellen bestrahlt werden. Die zugehörige Amplitude des elektrischen Feldes auf einem entfernten Beobachtungsschirm ist in Abbildung 10.20 b dargestellt. Dieser Graph zeigt die Nettoamplitude, wenn sich der Beobachtungspunkt transversal zu den Spalten weg von der zentralen Achse über das Beugungsmuster bewegt. Wir werden die zugehörigen Zeigerdiagramme verwenden, um diesen Graphen herzuleiten. In allen Fällen ist die Horizontale die Referenzachse. Für drei Spalte ist die Phasendifferenz zwischen aufeinanderfolgenden Elementarwellen wieder δ3 = (2π/λ)a sin θ. Die optische Weglänge, die die Elementarwelle von der Mitte des Blendenschirms zurücklegt, ist die Referenz, und ihr Zeiger (Nummer 2, gekennzeichnet durch einen schwarzen Punkt am Pfeilende) ist daher horizontal nach rechts gerichtet, stationär und positiv. Die anderen beiden Zeiger (Nummer 1 und 3) sind um δ3 gegenüber der Referenz phasenverschoben (der eine im Uhrzeigersinn, der andere gegen den Uhrzeigersinn). In Abbildung 10.20 c, die einem Punkt auf der zentralen Achse entspricht (θ > 0), kommen die drei Wellen in Phase an (δ3 = 0), die Zeiger liegen auf einer Geraden und die Nettoamplitude (3E01 ) ist maximal und positiv. In Abbildung 10.20 d ist der Winkel größer geworden; es gibt einen Phasenunterschied von etwa δ3 = 90◦ zwischen den aufeinanderfolgenden Zeigern. Der vom zentralen Spalt ausgehende Referenzzeiger 2 (wieder gekennzeichnet durch einen schwarzen Punkt am Pfeilende) bleibt horizontal, und die anderen beiden Zeiger sind ihm gegenüber um 90◦ phasenverschoben – Zeiger 1 im Uhrzeigersinn und Zeiger 2 gegen den Uhrzeigersinn (siehe Abb. 9.14 und 10.10 sowie die vorherige Diskussion). Die resultierende Feldamplitude (Abb. 10.20 d) ist klein (1E01 ) und positiv. In Abbildung 10.20 e sind die einzelnen Phasenverschiebungen gegenüber dem Referenzzeiger 2 jeweils δ3 = 120◦ (Zeiger 1 im Uhrzeigersinn, Zeiger 3 gegen den Uhrzeigersinn). Die drei Zeiger schließen sich zu einem gleichseitigen Dreieck, und die resultierende Amplitude ist null. In Abbildung 10.20 f sind Zeiger 3 und Zeiger 1 jeweils um δ3 = 135◦ gegenüber dem Zeiger 2 phasenverschoben, was zu einer kleinen und negativen Amplitude führt. Für δ3 = 180◦ ist der Zeiger 3 um 180◦ gegen den Uhrzeigersinn gegenüber Zeiger 2 phasenverschoben, während Zeiger 1 um 180◦ im Uhrzeigersinn phasenverschoben ist. Die drei Zeiger liegen dann alle übereinander, wobei zwei sich gegenseitig auslöschen und nur einer in negativer Richtung übrig bleibt (Abb. 10.20 g). Die Nettoamplitude ist dann −1,0E01 ; dies ist ein kleines negatives Nebenmaximum. Durch Quadrieren der Feldamplitude erhält man die Verteilung 2 der Bestrahlungsstärke, deren Hauptmaxima bei 0 und 360◦ proportional zu 32 E01 2 2 ◦ 2 2 bzw. 9 E01 sind, während das Nebenmaximum bei 180 den Wert 1 E01 hat.

10 Beugung

910 (a)

(b) E0(q)

sin

q

b

2p /l

a

3

3=

a

d

2 p/4

E01 1 0

(c) 1

90°

2

3

d

d3 = 0

(d) 3

E0(90°) 1

d3 /2 = 45°

1

E0(135°) 1

3

120° = d 3 2

3 1

120° = d 3

d3 /2 = 90°

(g)

3 2

1

3

135° = d3

3 2

240°

g

2

d3 /2 = 67.5°

(f)

d3

f e

E0(120°) = 0 1

2

180°

d3 /2

d3 /2 = 60°

(e)

d3 = 90°

2

3

p 270° 360°

120°

c

E0 (0)

p/2

135°

d3 = 180°

E0(180°) 2 1

Abb. 10.20: Das elektrische Feld für die Beugung am Dreifachspalt. (a) Der Blendenschirm. (b) Die resultierende Amplitude des elektrischen Feldes. (c) Die maximale Feldamplitude. (c) Die Resultierende ist positiv, wenn δ3 = 90◦ . (e) Die resultierende Amplitude ist null, wenn δ3 = 120◦ . (f) Die Amplitude ist negativ, wenn δ3 = 135◦ . (g) Die Amplitude ist E01 , wenn δ3 = 180◦ .

Allgemein treten Hauptmaxima dort auf, wo die Phasenverschiebung zwischen aufeinanderfolgenden Elementarwellen m2π ist (m ist dabei eine ganze Zahl einschließlich 0). Wie wir sehen werden, bilden die aneinandergesetzten Zeiger mit größer werdendem θ immer ein Polygon (für drei Spalte ein Dreieck) mit N Seiten. Die Nullstellen der Amplitude treten dann auf, wenn die Phasenwinkeldifferenz gleich m 2π/N ist (wobei m gleich einer ganzen Zahl ist). In diesem Fall ist m = 1, N = 3 und δ3 = 2π/3 = 120◦ , wo die Amplitude ihre erste Nullstelle hat. Für δN = τ liegen die Zeiger übereinander. Die Resultierende ist dann entweder 0 (für gerade N ) oder ±E01 (für ungerade N wie hier). Die zweite Nullstelle in dem Muster für den Dreifachspalt tritt auf, wenn m = 2 und δ3 = m 2π/N = 4π/3 oder δ3 = 120◦ (Abb. 10.20 b). Durch Quadrieren der Amplitude des elektrischen Feldes ergibt sich (bis auf eine Konstante) die Verteilung der Bestrahlungsstärke.

10.2 Fraunhoferbeugung

911

4

N=2

p

0

2p

9

3p

d2 /2

3p

d3 /2

3p

d4 /2

3p

d5 /2

3p

d6 /2

N=3

relative Bestrahlungsstärke

1 p

0

2p

16

N=4

p

0

2p

25

N=5 1 0

p

2p

36

N=6

0

p 2p Bestrahlungsstärke

Abb. 10.21: Muster der Bestrahlungsstärke für verschiedene Mehrspaltanordnungen unter Vernachlässigung der Einzelspaltbeugung. Hier ist δN /2 = πλ a sin θ, und N ist die Anzahl der parallelen, langen, sehr schmalen Spalte. Wie man hier sieht, wächst das Hauptmaximum wie N 2 .

Abbildung 10.21 illustriert die normierte Bestrahlungsstärke für N = 2, 3, 3, 5 und 6. Wir wollen zunächst die Idealisierung betrachten, dass die Spaltbreiten infinitesimal sind und die Einzelspaltbeugung daher vernachlässigt werden kann. Der Abstand a zwischen aufeinanderfolgenden Spalten ist bei allen Anordnungen derselbe. Erinnern Sie sich, dass die Analyse für ungerade Zahlen ein wenig anders war als die für gerade, nämlich insofern, als es im ersten Fall einen zentralen Spalt gibt, im zweiten Fall dagegen nicht. Dies wird dadurch berücksichtigt, dass in Abbildung 10.21 die relative Bestrahlungsstärke gegen 12 δN aufgetragen ist. Beachten Sie, dass die Hauptmaxima in dem Dreispaltmuster an den gleichen Positionen liegen wie beim Doppelspaltmuster. Da es im ersten Fall mehr Zeiger gibt, erreicht die Feldamplitude dort die erste Nullstelle früher als im zweiten Fall. Wie wir demnächst sehen werden, gibt es für die Elementarwellen umso mehr Möglichkeiten der Phasenverschiebung, je mehr Spalte es gibt. Das Hauptmaximum der Bestrahlungsstärke wird deshalb mit zumehmendem N immer schmaler und höher, und nur wenig Energie ist in den (N −2) Nebenmaxima enthalten. Die tatsächlichen Beugungsmuster sind in Abbildung 10.22 dargestellt. Abbildung 10.23 behandelt das Vierspaltsystem. Der Graph in Teil a zeigt wieder die Amplitude des elektrischen Feldes für verschiedene Werte von θ. Wie üblich kommen die vier Elementarwellen phasengleich auf der zentralen Achse (θ = 0) an

912

10 Beugung

Abb. 10.22: Beugungsmuster für die links abgebildeten Spaltsysteme. (Francis Weston Sears, Optics, c 1949, Addison Wesley Inc., Reading, Massachusetts. Nachdruck mit frdl. Genehmigung der Addison Wesley Longman, Inc.)

10.2 Fraunhoferbeugung

913

(a)

(b)

d4 = 4

E0(q)

1

2

3

4

E01 4

(c)

3

1

2

2 45°

(e)

E01 1 0

30° 60° 90° 120° 150° 180°

d4/2

4

p/2 3p/4

p /4

b

d c ef g

1 2

i

1 4

(h)

3

d4 = 180°

(i)

4

3

2

d4 144°

2 3

3 60° = d /2 4

(g) h

3 50° = d4 /2

(f)

d4 4 1 120

p

d4 100° 4

(d)

3 45° = d 4 /2

2 0

d4 90°

1

3 p 4

d4 /2 4

1

3

2

2

d4 = 2p

Abb. 10.23: Das elektrische Feld für die Beugung am Vierfachspalt. (a) Amplitude. (b) Die Zeiger liegen alle auf einer Linie; die Amplitude ist positiv und maximal. (c) Für δ4 = 90◦ ist die Resultierende null. (d) Wenn θ zunimmt, sodass δ4 > 90◦ , wird die Amplitude negativ. (e) Für δ4 = 120◦ ist die Amplitude negativ und gleich −E01 . (f) Für δ4 = 144◦ ist die Amplitude wieder −E01 . (g) Für δ4 = 180◦ löschen sich die vier Zeiger aus. (h) Für δ4 /2 = 3π/4 bilden die Zeiger ein Quadrat und die Resultierende ist null. (i) Für δ4 = 2π liegen die Zeiger wieder alle auf einer Linie und die Amplitude ist gleich −4E01 .

(δ4 = (2π/λ)a sin θ = 0). Die zugehörigen Zeiger – nummeriert mit 1, 2, 3 und 4 –, die alle die Amplitude E01 haben, liegen dann auf einer Linie, und die Nettoamplitude (4E01 ) ist maximal und positiv (Abb. 10.23 b). Dies definiert die Referenzrichtung, obwohl es in diesem Fall keinen zentralen Spalt und damit keinen Referenzzeiger gibt. Abbildung 10.23 c ist θ so gewählt, dass die Phasendifferenz zwischen aufeinanderfolgenden Zeigern δ4 = 90◦ ist. Da N eine gerade Zahl ist, gibt es keine zentrale Elementarwelle. Entsprechend sind die Zeiger 2 und 3 gegenüber der Referenzrichtung um δ4 /2 = 45◦ phasenverschoben, wobei Zeiger 2 im Uhrzeigersinn und Zeiger 3 gegen den Uhrzeigersinn gedreht ist. Die vier Zeiger, die jeweils um 90◦ gegeneinander verschoben sind, schließen sich zu einem Polygon, genauer gesagt zu einem Quadrat, und bilden die erste Nullstelle der Feldamplitude (Abb. 10.23 c). Dies ist in dem Graph in Abbildung 10.23 a bei δ4 /2 = π/4 = 45◦ eingezeichnet. Das Ergebnis steht im Einklang mit dem, was wir bereits festgestellt hatten, nämlich dass die erste Nullstelle bei δ4 = m 2π/N = 2π/4 auftritt. Beachten Sie, dass in einem Dreispaltsystem die erste Nullstelle erst bei δ3 /2 = 120◦ auftritt; das Hauptmaximum ist jetzt noch schmaler als zuvor. Unmittelbar nach δ4 = 90◦ kreuzt das Pfeilende von Zeiger 1 (weißer Kreis) die Spitze von Zeiger 4.

914

10 Beugung

Die Resultierende verläuft horizontal; sie ist klein und negativ (Abb. 10.23 d). Wenn θ noch weiter wächst (Abb. 10.23 c), senken sich die Zeiger 1 und 4, wobei sich 1 im Uhrzeigersinn und 4 gegen den Uhrzeigersinn dreht; die horizontale, negative Resultierende wird größer. Das setzt sich fort, bis sich Zeiger 1 und 4 überlappen und die Resultierende (vom weißen Kreis bis zur weißen Pfeilspitze) −E01 wird. Mit zunehmendem θ wächst auch sin θ und damit δ4 . Die Zeiger bilden dann einen unvollständigen Stern (Abb. 10.23 f) und die Nettoamplitude wird −E01 . Irgendwann ist θ gerade so groß, dass der relative Phasenwinkel zwischen den aufeinanderfolgenden Zeigern δ4 = 180◦ ist. Dann ist jeder der vier Zeiger antiparallel zu seinem Vorgänger, sodass sie sich vollständig auslöschen (Abb. 10,23 g) und eine zweite Nullstelle der Amplitude entsteht. Es gilt dann m = 2 und δ4 = m 2π/N = π. Weil es keinen zentralen Spalt gibt, werden die beiden Zeiger 2 und 3 jeweils um 3π/4 bezüglich der zentralen Achse verschoben (der eine im Uhrzeigersinn, der andere gegen den Uhrzeigersinn). Abbildung 10.23 h zeigt schließlich die vier Zeiger jeweils um 3π/4 gegenüber dem nächsten verschoben. Das Ergebnis ist ein geschlossenes Quadrat und eine Nettoamplitude von null. Wird δ4 noch größer, dann bewegt sich das Pfeilende von Zeiger 1 (der weiße Kreis) nach rechts, weg von der Spitze des Zeigers 4 (weiße Pfeilspitze), die sich nach links bewegt. Die Nettoamplitude (horizontal) ist jenseits von δ4 = 3π/2 negativ und wächst auf −4E01 bei δ4 = 2π; die Kurve in Abbildung 10.23 a zeigt, dass dies ein Minimum ist. Durch Quadrieren dieser Kurve erhält man die Verteilung der Bestrahlungsstärke (Abb. 10.21), die dem Vierfachspaltmuster in Abbildung 10.22 entspricht. Die Verteilung der Feldamplitude für fünf Spalte ist in Abbildung 10.24 a dargestellt. Das Hauptmaximum bei m = 0 ist 5E01 . Es folgt die erste Nullstelle bei δ5 = m 2π/N mit m = 1 und δ5 = 2π/5. Dort schließen sich die Zeiger zu einem Pentagon, wobei der Referenzzeiger 3 stationär bleibt und horizontal nach rechts zeigt (Abb. 10.24 b). Anschließend dreht sich Zeiger 1 (weißer Kreis) weiter im Uhrzeigersinn, während sich Zeiger 5 (weiße Pfeilspitze) gegen den Uhrzeigersinn dreht. Sie kreuzen einander und die Amplitude wird negativ (Abb. 10.24 c). In der Folge überqueren beide Zeiger (1 und 5) den Referenzzeiger 3 und treffen sich schließlich wieder, Pfeilende an Pfeilspitze, unterhalb des Referenzzeigers. Bei dem Wert δ5 = 4π/5, welcher der zweiten Nullstelle entspricht, schließen sich die Zeiger zu einem fünfzackigen Stern (Abb. 10.24 d). Der Referenzzeiger zeigt weiter nach rechts. Wenn δ5 weiter zunimmt, dreht sich Zeiger 5 gegen den Uhrzeigersinn, sodass seine Pfeilspitze nun rechts neben dem Pfeilende von Zeiger 1 liegt. Dies führt zu einer wachsenden, positiven Amplitude. Das zentrale positive Nebenmaximum in Abbildung 10.24 a ist bei δ5 /2 = π/2 gleich E01 . In Abbildung 10.24 e zeigt Zeiger 4 nach links, nachdem er gegenüber dem Referenzzeiger 180◦ gegen den Uhrzeigersinn überstrichen hat, und Zeiger 5 zeigt nach rechts, nachdem er gegenüber Zeiger 4 180◦ gegen den Uhrzeigersinn überstrichen hat. Entsprechend zeigt Zeiger 2 nach links, nachdem er gegenüber

10.2 Fraunhoferbeugung

915

(a)

(b) (c)

d5 p 2 = 5

E0(q)

5

5 72°

1

5

2

4

2

(d)

e

E01 1

b c d p 5

0

(f)

f

g

p 2p 2 3p 5 5

4p 5

216° = d5

3

5

1

2 4

p

3

4 2

d5 3p = 2 5

3

4 2 3

d5 /2

5

(g)

111° = d5

72° 2p = d5 5 3

3 2

1

3

4

d5

4

(e) 1

1

d5 = p

144° = d5

5

4

4p 5

d5 2p = 2 5

3 2

1 d5 p = 2 2

d5 4p = 2 5

3

2 4 1

3 5

288°

2

4

216° d5 = 288°

3

Abb. 10.24: Das elektrische Feld für die Beugung an fünf Spalten. (a) Die Amplitude des elektrischen Feldes. (b) Für δ5 /2 = π/5 ist E0 (θ) = 0. (c) Wenn δ5 /2 zwischen π/5 und 2π/5 liegt, ist das Feld negativ. (d) Für δ5 /2 = 2π/5 ist E0 (θ) = 0. (e) Für δ5 /2 = π ist E0 (θ) = E01 . (f) Für δ5 /2 = 3π/5 ist E0 (θ) = 0. (g) Für δ5 /2 = 4π/5 ist E0 (θ) = 0.

dem Referenzzeiger 180◦ im Uhrzeigersinn überstrichen hat, und Zeiger 1 zeigt nach rechts, nachdem er gegenüber Zeiger 2 180◦ im Uhrzeigersinn überstrichen hat. Somit zeigen zwei Zeiger nach links und drei nach rechts (Abb. 10.24 e). Die resultierende Amplitude ist +1E01 . Insgesamt ist die Verteilung der Feldamplitude symmetrisch um π/2. Betrachten wir noch einmal Abbildung 10.12, die es uns erlaubt hat, einen Ausdruck für das Beugungsfeld eines Einzelspalts der Breite b zu finden. Analog dazu konstruieren wir Abbildung 10.25 für N parallele, schmale Spalte. Jeder Zeiger ist die Basis eines gleichschenkligen Dreiecks mit einem Scheitelwinkel von 2α = δN , wobei α = (πa sin θ)/λ. Wir bleiben zunächst bei unserer Annahme, dass die Spaltbreite infinitesimal ist. Wie das Diagramm zeigt, sind die Längen der Zeiger gegeben durch 2r sin α = E01 .

10 Beugung

916 0 r a

sin 2r

r Na N2a r sin Na E0(u)

2a

a

2a

Abb. 10.25: Die Amplitude E0 (θ) bei der Fraunhoferbeugung für N parallele schmale Spalte.

Die resultierende N -Zeiger-Amplitude (gezeichnet von dem Pfeilende mit dem weißen Kreis bis zur Spitze mit dem weißen Pfeil) ist 2r sin α = E0 (θ) . Dividieren dieser beiden Gleichungen führt auf E0 (θ) = E01

sin N α . sin α

(10.25)

Dieser Ausdruck für die Amplitude des elektrischen Feldes entspricht den idealisierten Kurven in den Abbildungen 10.20 b, 10.23 a und 10.24 a. Beachten Sie, dass mit θ gegen null auch α gegen null geht, wobei das Verhältnis gegen N strebt. Wenn, etwas allgemeiner, α ein ganzzahliges Vielfaches von π ist, ist der Nenner null, und ebenso der Zähler. Es gilt dann E0 (θ) = E01 = 0/0 und wir müssen die Regel von l’Hospital anwenden. Wir bilden also auf der rechten Seite von Gleichung (10.25) für Zähler und Nenner die Ableitung. Wenn α gegen ein ganzzahliges Vielfaches von π geht, wird das Verhältnis ±N . Damit erhalten wir für Hauptmaxima E0 = ±N E01 , also genau das, was wir in den Abbildungen 10.20 b, 10.23 a und 10.24 a gesehen haben. Um die Beugungseffekte mit zu berücksichtigen, wiederholen wir, dass sin β E0 (θ) = , E0 (0) β wobei die Amplitude eines einzelnen Zeigers bei einem einzelnen Spalt E0 (0) = E01 ist. Daraus folgt E0 (θ) = E01

sin β sin N α . β sin α

(10.26)

Das Quadrat dieser Größe ist, abgesehen von einer Konstante, die Bestrahlungsstärke.

10.2 Fraunhoferbeugung

917

Die Bestrahlungsstärke für ein Mehrspaltsystem Um die Funktion der Bestrahlungsstärke für die Beugung an vielen Spalten zu bestimmen, verwenden wir im Wesentlichen dieselbe Methode wie für den Doppelspalt. Dabei müssen wir die Intergrationsgrenzen natürlich wieder entsprechend anpassen. Wir betrachten N lange, schmale Spalte der Breite b, deren Zentren den Abstand a voneinander haben (siehe Abb. 10.26). Der Ursprung des Koordinatensystems befinde z

P

Rj

y a

R

θj

θ b

x

(a)

Σ

(b)

(c)

(d)

Abb. 10.26: (a) Zur Geometrie der Mehrspaltanordnung. Punkt P auf σ ist wieder praktisch unendlich weit von Σ entfernt.

10 Beugung

918

sich wieder im Mittelpunkt des ersten Spalts. Die gesamte optische Störung an einem Punkt auf dem Schirm σ ist dann gegeben durch ˆ

+b/2

E=C

ˆ F (z)dz + C

−b/2 ˆ 2a+b/2

+C

a+b/2

F (z)dz

a−b/2

F (z)dz + . . . + C

ˆ

(N −1)a+b/2

F (z)dz

(N −1)a−b/2

2a−b/2

(10.27)

mit (wie oben) F (z) = sin[ωt − k(R − z sin θ)]. Dies gilt, wenn die Fraunhoferbedingung erfüllt ist: Die Spalte müssen sich sämtlich in der Nähe des Ursprungs befinden, und für die gesamte Anordnung muss die Näherung [Gl. 10.11)] r = R − z sin θ

(10.28)

gelten. Um den Beitrag des j-ten Spaltes (die Nummerierung beginne bei 0) zu bestimmen, werten wir nur das betreffende Integral in Gleichung (10.27) aus. Wir erhalten C

sin (ωt − kR) sin (kz sin θ) Ej = k sin θ ja+b/2 , − cos (ωt − kR) cos (kz sin θ) ja−b/2

wobei wir θj ≈ θ voraussetzen. Nach einigen Umformungen wird daraus   sin β sin (ωt − kR + 2αj) , Ej = bC β wobei wir daran erinnern wollen, dass β = (kb/2) sin θ und α = (ka/2) sin θ ist. Beachten Sie, dass dies gerade dem Ausdruck (10.15) für eine Linienquelle und natürlich auch dem Ausdruck für die Beugung am Einzelspalt entspricht, wenn entsprechend Gleichung (10.28) und Abbildung 10.26 Rj = R − ja sin θ und damit −kR + 2αj = −kRj ist. Die gesamte Störung ergibt sich nach Gleichung (10.27) dann einfach als Summe aller Beiträge Ej der einzelnen Spalte, E=

N −1 

Ej

j=0

oder E=

N −1  j=0

 bC

sin β β

 sin (ωt − kR + 2αj) .

10.2 Fraunhoferbeugung

919

Dies kann man nun als Imaginärteil einer komplexen Exponentialfunktion schreiben: ⎤ ⎡   N −1    sin β j ei(ωt−kR) ei2α ⎦ . (10.29) E = Im ⎣bC β j=0

Diese geometrische Reihe haben wir bereits im Zuge der Vereinfachung von Gleichung (10.2) berechnet. Damit reduziert sich Gleichung (10.29) auf die Form    sin N α sin β sin [ωt − kR + (N − 1) α] . (10.30) E = bC β sin α Die Phase von E in P ist gleich derjenigen einer Welle, die vom Mittelpunkt der Quelle emittiert wird, weil der Abstand des Mittelpunkts der Spaltanordnung vom Punkt P [R − (N − 1)(a/2) sin θ] beträgt. Die Verteilung der Flussdichte ist     sin β 2 sin N α 2 , (10.31) I(θ) = I0 β sin α wobei wir uns erinnern, dass β = (kb/2) sin θ und α = (ka/2) sin θ. Beachten Sie dabei, dass I0 die von einem beliebigen Spalt in Richtung θ = 0 abgestrahlte Flussdichte ist und dass I(0) = N 2 I0 ist. Anders ausgedrückt sind die in Vorwärtsrichtung in P ankommenden Wellen sämtlich phasengleich und verstärken einander. Jeder Spalt erzeugt einzeln genau das gleiche Beugungsbild. Überlagert man alle diese Bilder, so erhält man ein Interferenzmuster vieler Wellen, moduliert durch ein Beugungsmuster, das an einem Einzelspalt erzeugt wurde. Geht die Breite aller Öffnungen gegen null, dann liefert Gleichung (10.31) einen Ausdruck wie in (10.6) für die Flussdichte einer linearen, kohärenten Anordnung von Oszillatoren. Wie bereits durch Gleichung (10.17) gezeigt worden war, treten Hauptmaxima bei (sin N α/ sin α) = N auf, also bei α = 0, ±π, ±2π, . . . oder gleichbedeutend (wegen α = (ka/2) sin θ) bei a sin θm = mλ

(10.32)

mit m = 0, ±1, ±2, . . . . Dies gilt allgemein und sorgt dafür, dass die Maxima immer bei denselben Werten von θ erzeugt werden, ungeachtet des Wertes von N (mit N ≥ 2). Minima mit einer Flussdichte von null treten immer dann auf, wenn (sin N α/ sin α)2 = 0 ist oder α=±

2π 3π (N − 1) π (N + 1) π π ,± ,± ,... ,± ,± ,... . N N N N N

(10.33)

920

10 Beugung

Beispiel 10.3 Gegeben ist eine Anordnung aus 12 parallelen, langen, schmalen Spalten mit der Breite b und dem Spaltabstand 5b. Werden die Spalte normal mit ebenen Wellen bestrahlt, entsteht auf einem entfernten Schirm ein fraunhofersches Beugungsmuster. Bestimmen Sie die Bestrahlungsstärke des Hauptmaximums erster Ordnung relativ zum Hauptmaximum nullter Ordnung. Lösung Nach Gleichung (10.31) treten Hauptmaxima für (sin N α/ sin α) = N auf, sodass hier   sin β 2 I(θ) = I(0) β gelten muss. Außerdem gilt wegen a = 5b πa α π sin θ = . β = b sin θ = λ λ5 5 Das Maximum erster Ordnung tritt auf für α = π, sodass β = π/5. Damit folgt für m = 1     sin π/5 2 sin β 2 = I(0) , I(θ) = I(0) β π/5 sodass     sin π/5 2 0,5878 2 I(θ) = = = 0,9362 . I(0) π/5 0,6283 Das Hauptmaximum erster Ordnung ist 0,875-mal so groß wie das Maximum nullter Ordnung.

Erinnern Sie sich, dass es zwischen zwei aufeinanderfolgenden Hauptmaxima (d. h. während die Größe α den Bereich π überstreicht) immer N − 1 Minima gibt. Selbstverständlich sind diese Minima durch je ein Nebenmaximum voneinander getrennt. Der Term (sin N α/ sin α)2 , der sozusagen die Interferenzeffekte enthält, hat einen Zähler, der wesentlich schneller variiert als der Nenner. Die Nebenmaxima befinden sich daher ungefähr an den Punkten, wo sin N α maximal wird, nämlich 5π 3π ,± ,... . (10.34) α=± 2N 2N

10.2 Fraunhoferbeugung

921

Im Abbildung 10.22 erkennt man deutlich die N − 2 Nebenmaxima zwischen aufeinanderfolgenden Hauptmaxima. Eine ungefähre Vorstellung von der Flussdichte an diesen Maxima erhalten wir durch Umformulierung von Gleichung (10.31):     I(0) sin β 2 sin N α 2 . (10.35) I(θ) = N2 β sin α An den Punkten, die uns interessieren, ist |sin N α| = 1. Für große N wird α klein und sin2 α ≈ α2 . Im ersten Nebenmaximum ist α = 3π/2N und     sin β 2 2 2 . (10.36) I ≈ I(0) β 3π 1 der Flussdichte des nächstliegenden HauptmaxiDie Flussdichte beträgt nur noch 22 mums (siehe Aufgabe 10.17). Weil sich der Term (sin β)/β für kleine β nur langsam ändert, ist er in der Nähe des Hauptmaximums nullter Ordnung ungefähr gleich eins, 1 wird. Das Flussdichteverhältnis für das nächste Nebenmaximum bewomit I/I0 ≈ 22 1 trägt etwa 62 ; das Verhältnis nimmt so lange ab, bis α einen Wert erreicht, der der Mitte zwischen zwei Hauptmaxima entspricht. An dieser Stelle ist α ≈ π/2 und daher sin α ≈ 1. Das Flussdichteverhältnis wird hier minimal (ungefähr 1/N 2 ). Wird danach α > π/2, so beginnt die Flussdichte der Nebenmaxima wieder anzusteigen.

Versuchen Sie, die in Abbildung 10.22 gezeigten Ergebnisse mit einer Glühlampe und dem selbst gefertigten Spaltsystem zu reproduzieren. Wahrscheinlich haben Sie Schwierigkeiten, die Nebenmaxima deutlich zu sehen; der einzig beobachtbare Unterschied besteht meist in einer Verbreiterung der dunklen Regionen zwischen zwei hellen Hauptmaxima. Mit wachsendem N werden, wie in Abbildung 10.22, die Zwischenräume zwischen den Hauptmaxima breiter und die Nebenmaxima schwächer. Betrachten wir ein Maximum als durch zwei Minima (Nullstellen) begrenzt, so erstreckt sich ein Maximum über den Winkel θ (sin θ ≈ θ) von ungefähr 2λ/N a. Steigt N an, so bleiben die Abstände zwischen den Maxima (λ/a) konstant, die Maxima selbst werden jedoch schmaler. Abbildung 10.27 zeigt die Verhältnisse bei sechs Spalten mit a = 4b. Der Interferenzterm für Vielspaltsysteme in Gleichung (10.35) hat die Form (sin2 N α)/N 2 sin2 α. Für große N kann man (N 2 sin2 α)−1 als die Kurve betrachten, unterhalb derer sin2 N α schnell variiert. Beachten Sie, dass der Interferenzterm für kleine α der Form sinc2 N α ähnelt (siehe Abb. 10.28). Beispiel 10.4 Gegeben ist ein lichtundurchlässiger Schirm mit sieben parallelen, langen, sehr schmalen und dicht benachbarten Spalten. Wenn diese mit monochromatischen ebenen Wellen bestrahlt werden, zeigt sich auf einem entfernten Beobachtungs-

10 Beugung

922 1

0

1

0

0

0

Abb. 10.27: Beugungsmuster am Mehrspaltsystem (a = 4b, N = 6). Im letzten Teil wird die Interferenz durch die Beugungseinhüllende eines Einzelspalts endlicher Breite moduliert.

10.2 Fraunhoferbeugung

923

schirm ein fraunhofersches Beugungsmuster. (a) Wie viele Nebenmaxima gibt es zwischen dem nullten und dem ersten Hauptmaximum? (b) Nehmen Sie an, dass die einzelnen Spalte als infinitesimal angesehen werden können und vergleichen Sie die Bestrahlungsstärke des kleinsten Nebenmaximums mit der Bestrahlungsstärke eines Hauptmaximums. Lösung (a) Zwischen benachbarten Hauptmaxima gibt es (N − 2) Nebenmaxima. Somit gibt es 7 − 2 = 5 kleine Peaks zwischen dem nullten und dem ersten Hauptmaximum. (b) Wenn N eine ungerade Zahl größer 2 ist, dann hat die Bestrahlungsstärke in der Mitte zwischen zwei Hauptmaxima ein Nebenmaximum. Die Amplitude des elektrischen Feldes ist dort 1E01 , da alle bis auf einen der sieben Zeiger sich gegenseitig auslöschen (sechs Zeiger sind antiparallel). Dies ist das kleinste Nebenmaximum. Die sieben Zeiger liegen für jedes Hauptmaximum auf einer geraden Linie, was auf eine Amplitude von 7E01 führt. Somit ist das Verhältnis der zugehörigen Bestrahlungsstärken 12 /72 = 1/49.

2 Spalte

4 Spalte

-4

-2

0 Position

2

4

a = 4.0 b = 1.0

Bestrahlungsstärke

Bestrahlungsstärke

a = 4.0 b = 1.0

-4

-2

0 Position

2

4

8 Spalte

Bestrahlungsstärke

a = 4.0 b = 1.0

-4

-2

0 Position

2

4

Abb. 10.28: Beugung am Mehrfachspalt; jeder Spalt hat eine endliche Breite. Je mehr Spalte geöffnet sind, umso schmaler sind die Peaks. Die Hauptmaxima befinden sich an festen Positionen. Zusätzlich zu den Hauptmaxima gibt es (N − 2) Nebenmaxima, die zwischen den Hauptmaxima liegen.

10 Beugung

924

10.2.4 Beugung an einer rechteckigen Öffnung Betrachten wir nun die Anordnung in Abbildung 10.29. Eine monochromatische, ebene Welle, die sich in x-Richtung fortpflanzt, trifft auf den undurchsichtigen Beugungsschirm Σ. Wir suchen nun die (Fernfeld-)Flussdichteverteilung im Raum oder, gleichbedeutend, an einem beliebigen, weit entfernten Punkt P . Nach dem FresnelHuygens-Prinzip ist ein Flächenelement dS innerhalb der Öffnung von kohärenten sekundären Punktquellen bedeckt. Da nun dS in seiner Ausdehnung viel kleiner als λ ist, bleiben alle Beiträge der einzelnen Quellen zum Feld in P phasengleich und addieren sich. Dies gilt für alle Winkel θ; mit anderen Worten, dS sendet eine Kugelwelle aus (Aufgabe 10.22). Ist εA die Quellenstärke pro Flächeneinheit, von der wir annehmen, sie sei über die Fläche der Öffnung konstant, dann ist die optische Störung in P , die von dS verursacht wird, gleich dem Realteil oder dem Imaginärteil von

ε  A ei(ωt−kr) dS . (10.37) dE = r Die Auswahl bleibt Ihnen überlassen, je nachdem, ob Sie lieber Sinus- oder Kosinuswellen verwenden wollen. Der einzige Unterschied zwischen beiden Varianten besteht in einem Phasenunterschied von π/2. Der Abstand zwischen dS und P ist 1/2  , (10.38) r = X 2 + (Y − y)2 + (Z − z)2 und wie wir bereits gesehen haben, ist die Fraunhofer-Bedingung erfüllt, wenn dieser Abstand gegen unendlich geht. Solange die Öffnung relativ klein ist, genügt es wieder, r durch OP , also R, zu ersetzen. Die Phasennäherung für r muss etwas sorgfältiger vorgenommen werden, denn k = 2π/λ ist eine große Zahl. Dazu entwickeln wir den Ausdruck (10.38) in eine Reihe und erhalten mit 1/2  (10.39) R = X2 + Y 2 + Z2

y

dS r O

θ

R

(X, Y, Z) P

x

z

Σ

Abb. 10.29: Fraunhoferbeugung an einer beliebig geformten Öffnung; r und R sind im Vergleich zu den Maßen des Loches sehr groß.

10.2 Fraunhoferbeugung

925

die Beziehung 1/2  . r = R 1 + (y 2 + z 2 )/R2 − 2(Y y + Zz)/R2

(10.40)

Im Falle der Fraunhofernäherung ist R sehr groß gegenüber den Dimensionen der Öffnung, sodass wir den Term (y 2 + z 2 )/R2 sicherlich vernachlässigen dürfen. Weil P weit von Σ entfernt ist, kann der Winkel θ klein gehalten werden, obwohl Y und Z ziemlich groß sind. Dadurch werden alle Schwierigkeiten, die durch die nichtisotrope (richtungsabhängige) Emission des Strahlers bedingt sein können, beseitigt. Nun ist 1/2  , r = R 1 − 2(Y y + Zz)/R2 woraus sich, wenn wir nur die ersten beiden Terme der Binomialentwicklung berücksichtigen, ergibt   r = R 1 − (Y y + Zz)/R2 . Die gesamte Störung in P ist damit ¨ εA ei(ωt−kR) ! eik(Y y+Zz)/R dS . E= R

(10.41)

Öffnung

Betrachten wir nun die in Abbildung 10.30 gezeigte spezielle Anordnung.

y

a

dy

dz

b

r

R x

Y P

z

P0 Σ

Z

σ

Abb. 10.30: Eine rechteckige Öffnung.

10 Beugung

926

(a) Fraunhofer-Beugungsmuster an einer quadratischen Öffnung. (b) Das gleiche Muster, fotografiert mit längerer Belichtungszeit, um weitere Details zu erfassen. (Fotos E. H.)

Gleichung (10.41) können wir dann in der Form ˆ ˆ +a/2 εA ei(ωt−kR) +b/2 ikY y/R ! e dy eikZz/R dz E= R −b/2 −a/2 schreiben, wobei dS = dy dz. Mit β  ≡ kbY /2R und α ≡ kaZ/2R erhalten wir      ˆ +b/2  eiβ − e−iβ sin β  ikY y/R e dy = b =b 2iβ  β −b/2 und analog ˆ +a/2

 ikzZ/R

e

dz = a

−a/2

womit i(ωt−kR) ! = AεA e E R







eiα − e−iα 2iα

sin α α





sin β  β

 =a

sin α α

 ,



! 2 T gilt nun wird. A ist die Fläche der Öffnung. Wegen I = (Re E)     sin α 2 sin β  2 , I(Y, Z) = I(0) α β

(10.42)

(10.43)

wobei I(0) die Bestrahlungsstärke in P0 , also bei Y = Z = 0 ist (siehe Foto). Nehmen Y und Z geeignete Werte an, sodass entweder α = 0 oder β  = 0 wird, dann entsteht eine Intensitätsverteilung I(Y, Z), wie wir sie aus Abbildung 10.13 kennen. Sind

10.2 Fraunhoferbeugung

927

(a)

Abb. 10.31: (a) Verteilung der Bestrahlungsstärke für eine quadratische Öffnung. (b) Bestrahlungsstärke, erzeugt durch Fraunhoferbeugung an einer quadratischen Öffnung. (c) Verteilung des E-Feldes bei Fraunhoferbeugung an einer quadratischen Öffnung. (R. G. Wilson, Illinois Wesleyan University.)

β  und α ganzzahlige Vielfache von π ungleich null oder, gleichbedeutend, Y und Z ganzzahlige, von null verschiedene Vielfache von λR/b bzw. λR/a, dann ist I(Y, Z) = 0. Wir erhalten dann ein rechteckiges Gitter von Knotenlinien (siehe Abb. 10.31). Beachten Sie, dass sich das Muster invers zu den Abmessungen der Öffnung in Y - und Z-Richtung verhält: Eine horizontal-rechteckige Öffnung zum Beispiel erzeugt ein Muster mit einem vertikalen Rechteck in der Mitte und umgekehrt (siehe Abb. 10.32 und 10.33).

10 Beugung

928

Abb. 10.32: Fraunhofersches Beugungsmuster für eine rechteckige Öffnung; b > a. (M. Cagnet, M. Francon und J. C. Thrierr: Atlas optischer Erscheinungen, Berlin Heidelberg New York. Springer-Verlag. New York.)

Entlang der β  -Achse ist α = 0, und die Nebenmaxima befinden sich ungefähr in der  = ±3π/2, ±5π/2, ±7π/2, . . . Mitte zwischen zwei Minima (Nullstellen), also bei βm  In jedem Nebenmaximum ist sin βm = 1 und natürlich auch sin α /α = 1, weil entlang der β  -Achse α = 0 ist. Die Bestrahlungsstärken können daher einfach durch 1 I = 2 I(0) βm

(10.44)

genähert werden. Ähnlich gilt entlang der α -Achse 1 I = 2 . I(0) αm

(10.45)

1 1 1 , 62 , 122 usw. und die NebenDieses Flussdichteverhältnis8 nimmt rasch ab: 1, 22 maxima, die nicht auf einer Achse liegen, sind noch kleiner. So haben z. B. die vier Eckpunkte unmittelbar neben dem zentralen Maxium mit den Koordinaten β  = 1 2 ) . ±3π/2 und α = ±3π/2 relative Intensitäten von ( 22

Abb. 10.33: Fraunhofersches Beugungsmuster für eine vertikale rechteckige Öffnung (b > a). Man denke sich ein Achsenkreuz im Zentrum sowie die Markierungen A = 1, B = 0,047 und C = 0,016. Die Diagonalterme sind dann B × B = 0,002 und C × C = 0,0002. Die verbleibenden Terme sind C × B = B × C = 0,0007. Die Anzeige kann durch Verwendung von D = 0,083 erweitert werden.

8

Die hier gezeigten Fotos wurden in einem Praktikum aufgenommen. Als Quelle ebener Wellen wurde ein He-Ne-Laser verwendet. In einem langen, abgedunkelten Raum wurde das Muster direkt auf einem 10 × 13-cm-Polaroidfilm (3000 ASA) erzeugt. Da der Film ungefähr 10 m von einer kleinen Öffnung entfernt war, konnte auf eine Hilfslinse verzichtet werden. Als Verschluss wurde eine von den Studenten entworfene Pappdeckel-Guillotine verwendet. Daher können keine Verschlusszeiten angegeben werden. Jeder Verschluss einer einäugigen Spieglereflex-Kamera erfüllt den gleichen Zweck (Optik entfernen, Kamerarückwand öffnen), aber der Unterhaltungswert ist geringer.

10.2 Fraunhoferbeugung

929

Beispiel 10.5 Die Öffnung in dem in Abbildung 10.30 dargestellten lichtundurchlässigen Schirm misst 0,120 mm in y-Richtung und 0,240 mm in z-Richtung. Sie wird mit einem Helium-Neon-Laserstrahl von 543 nm beleuchtet. Eine große Sammellinse mit einer Brennweite von 1,00 m projiziert ein fraunhofersches Beugungsmuster auf einen Schirm, der in der Brennebene der Linse aufgestellt ist. Bestimmen Sie die relative Bestrahlungsstärke auf dem Beobachtungsschirm, I(Y, Z)/I(0), bei Y = 2,00 mm und Z = 3,00 mm. Lösung Nach Gleichung (10.43) ist     sin α 2 sin β  2 I(Y, Z) = I(0) α β mit α = kaZ/2R und β  = kbY /2R. Hier ist R ≈ f , a = 0,240 mm, b = 0,120 mm und   sin(πaZ/f λ) 2 sin(πbY /f λ) 2 I(Y, Z) = I(0) πaZ/f λ πbY /f λ  2  sin(1388,5Z) I(Y, Z) sin(694,27Y ) 2 = I(0) 1388,5Z 694,27Y 2    −0,8541 0,9834 2 = = (0,2050)2 (0,7082)2 4,1655 1,3885 und somit I(2, 3) = 0, 0211I(0) .

10.2.5 Beugung an einer kreisrunden Öffnung Die Fraunhoferbeugung an kreisrunden Öffnungen ist im Hinblick auf die Funktionsweise optischer Instrumente von größter Bedeutung. Betrachten wir dazu eine typische Anordnung. Ebene Wellen fallen auf einen Schirm Σ mit einer kreisrunden Öffnung. Das dabei entstehende Beugungsbild fällt auf einen weit entfernten Beobachtungsschirm σ. Verwendet man eine Hilfslinse L2 , dann kann die Beobachtungsebene auch nahe an der Öffnung liegen. Setzt man nun die Linse L2 genau in die Öffnung und bemisst sie so, dass sie die Öffnung exakt ausfüllt, dann bleibt die Form des Beugungsbildes im Wesentlichen unverändert. Von der Lichtwelle, die auf Σ trifft, wird auf jeden Fall nur ein kreisförmiger Ausschnitt verwendet – jener, der sich durch die Linse L2 ausbreitet –, um in der Brennebene das Bild zu erzeugen. Nichts anderes passiert offensichtlich im Auge, einem Teleskop, Mikroskop oder einer Kameraoptik.

10 Beugung

930

Das Bild einer fernen Punktquelle, erzeugt mit einer ideal aberrationsfreien Sammellinse, ist daher nie ein Punkt, sondern stets eine Art Beugungsbild. Da wir immer nur einen Teil der auftreffenden Wellenfront verwenden, können wir nicht erwarten, ein ideales Bild zu erhalten. Wie im vorangegangenen Abschnitt gezeigt wurde, kann die optische Störung im Punkt P , die von einer beliebigen Öffnung erzeugt wird, in der Fraunhofernäherung wie folgt formuliert werden: ¨ εA ei(ωt−kR) ! eik(Y y+Zz)/R dS . [10.41] E= R Öffnung Für eine kreisrunde Öffnung bietet es sich aufgrund der Symmetrie an, sowohl in der Ebene der Öffnung (Σ) als auch in der Beobachtungsebene (σ) Polarkoordinaten einzuführen (Abb. 10.34). Wir setzen also z = ρ cos φ Z = q cos Φ

y = ρ sin φ Y = q sin Φ .

Das Flächenelement wird dann dS = ρ dρ dφ . y

ρ φ 0 θ a

Y R P q

z

Φ Σ

Z

σ

Abb. 10.34: Zur Geometrie der kreisrunden Öffnung.

P0

10.2 Fraunhoferbeugung

931

Durch Einsetzen dieser Ausdrücke in Gleichung (10.41) erhalten wir i(ωt−kR) ˆ a ˆ 2π ! = εA e ei(kρq/R) cos(φ−Φ) ρ dρ dφ . E R ρ=0 φ=0

(10.46)

Da die Anordnung axialsymmetrisch ist, muss die Lösung unabhängig von Φ sein. Wir können die Gleichung (10.46) daher für den Fall Φ = 0 lösen, was die Sache etwas vereinfacht. Der in dem Doppelintegral auftretende Teil, der die Variable φ enthält, ˆ 2π ei(kρq/R) cos φ dφ 0

tritt in der mathematischen Physik häufig auf. Es handelt sich um eine Funktion, die nicht mehr auf eine einfachere Funktion (wie die verschiedenen hyperbolischen, trigonometrischen und Exponentialfunktionen) zurückgeführt werden kann. Die Größe ˆ 2π 1 eiu cos v dv (10.47) J0 (u) = 2π 0 nennt man Besselfunktion (der ersten Art) nullter Ordnung. Allgemein ist ˆ i−m 2π i(mv+u cos v) e dv Jm (u) = 2π 0

(10.48)

die Besselfunktion der Ordnung m. Numerische Werte von J0 (u) und J1 (u) sind für große Bereiche von u in vielen mathematischen Tabellenwerken zu finden. Wie für die Sinus- und Kosinusfunktion existieren auch für die Besselfunktionen Reihenentwicklungen – genau betrachtet sind die Besselfunktionen nicht geheimnisvoller als die erwähnten anderen Funktionen, die Sie bereits aus der Schule kennen. Wie Abbildung 10.35 zeigt, sind J0 (u) und J1 (u) langsam abklingende, periodische und weitgehend undramatische Funktionen.

1.0

J0 u J1 u

0.5

0

−0.5

J2 u

5

10

15

u

Abb. 10.35: Besselfunktionen.

10 Beugung

932 Tabelle 10.2: Besselfunktionen.∗

x 0,0 0,1 0,2 0,3 0,4 0,5 0,6 0,7 0,8 0,9 1,0 1,1 1,2 1,3 1,4 1,5 1,6 1,7 1,8 1,9 2,0 2,1 2,2 2,3 2,4 2,5 2,6 2,7 2,8 2,9

J1 (x)∗ 0,0000 0,0499 0,0995 0,1483 0,1960 0,2423 0,2867 0,3290 0,3688 0,4059 0,4401 0,4709 0,4983 0,5220 0,5419 0,5579 0,5699 0,5778 0,5815 0,5812 0,5767 0,5683 0,5560 0,5399 0,5202 0,4971 0,4708 0,4416 0,4097 0,3754

x 3,0 3,1 3,2 3,3 3,4 3,5 3,6 3,7 3,8 3,9 4,0 4,1 4,2 4,3 4,4 4,5 4,6 4,7 4,8 4,9 5,0 5,1 5,2 5,3 5,4 5,5 5,6 5,7 5,8 5,9

J1 (x) 0,3391 0,3009 0,2613 0,2207 0,1792 0,1374 0,0955 0,0538 0,0128 −0,0272 −0,0660 −0,1033 −0,1386 −0,1719 −0,2028 −0,2311 −0,2566 −0,2791 −0,2985 −0,3147 −0,3276 −0,3371 −0,3432 −0,3460 −0,3453 −0,3414 −0,3343 −0,3241 −0,3110 −0,2951

x 6,0 6,1 6,2 6,3 6,4 6,5 6,6 6,7 6,8 6,9 7,0 7,1 7,2 7,3 7,4 7,5 7,6 7,7 7,8 7,9 8,0 8,1 8,2 8,3 8,4 8,5 8,6 8,7 8,8 8,9

J1 (x) −0,2767 −0,2559 −0,2329 −0,2081 −0,1816 −0,1538 −0,1250 −0,0953 −0,0652 −0,0349 −0,0047 0,0252 0,0543 0,0826 0,1096 0,1352 0,1592 0,1813 0,2014 0,2192 0,2346 0,2476 0,2580 0,2657 0,2708 0,2731 0,2728 0,2697 0,2641 0,2559



J1 (x) = 0 für x = 0, 3,832, 7,016, 10,173, 13,324 . . . Mit leichten Änderungen übernommen aus E. Kreyszig, Advanced Engineering Mathematics. Nachdruck mit frdl. Erlaubnis von John Wiley & Sons, Inc.

Nun können wir Gleichung (10.46) neu formulieren: ˆ a i(ωt−kR) kρq ! = εA e 2π ρ dρ . J0 E R R 0

(10.49)

Eine weitere allgemeine Eigenschaft der Besselfunktionen ist die Existenz von Rekursionsformeln; d. h., die Besselfunktion der Ordnung m lässt sich aus der Besselfunktion der Ordnung m − 1 berechnen: d m [u Jm (u)] = um Jm−1 (u) . du

10.2 Fraunhoferbeugung Ist m = 1, so folgt daraus einfach ˆ u   u J0 u du = uJ1 (u) ,

933

(10.50)

0

wobei u als Hilfsvariable zur Unterscheidung von u eingeführt wurde. Kehren wir nun zum Integral in Gleichung (10.49) zurück. Wenn wir die neue Variable w = kρq/R einführen, dann ist dρ = (R/kq)dw, und das Integral wird zu  2 ˆ w=kaq/R ˆ ρ=a R kρq ρ dρ = J0 J0 (w)w dw . R kq ρ=0 w=0 Unter Verwendung von Gleichung (10.50) erhalten wir   i(ωt−kR) R kaq ! (t) = εA e 2πa2 J1 . E R kaq R

(10.51)

! !∗ ! 2 = 1 E Die Bestrahlungsstärke in P ist (Re E) 2 E (bis auf eine Konstante), daher ist  2ε2A A2 J1 (kaq/R) 2 , (10.52) I= R2 kaq/R wobei A die Fläche der kreisförmigen Öffnung ist. Zur Bestimmung der Bestrahlungsstärke im Mittelpunkt des Beugungsbildes (also im Punkt P0 ) setzen wir q = 0. Aus der oben angegebenen Rekursionsformel (für m = 1) folgt dann J0 (u) =

d J1 (u) J1 (u) + . du u

(10.53)

Aus Gleichung (10.47) entnehmen wir, dass J0 (0) = 1 ist, und aus Gleichung (10.48) folgt J1 (0) = 0. Wenn u gegen null geht, dann geht das Verhältnis J1 (u)/u gegen denselben Wert wie das Verhältnis der Ableitungen von Zähler und Nenner (Regel von l’Hospital). Die rechte Seite von Gleichung (10.53) ist also zweimal so groß wie dieser Grenzwert, d. h. 1 J1 (u) = für u → 0 . u 2 Die Bestrahlungsstärke in P0 ist dann ε2A A2 , (10.54) 2R2 was gerade dem durch Gleichung (10.46) gegebenen Resultat für eine rechteckige Öffnung entspricht [Gl. (10.43)]. I(0) =

10 Beugung

934 I/I(0)

Abb. 10.36: (a) Airy-Muster. (b) Verteilung des elektrischen Feldes bei Fraunhoferbeugung an einer kreisrunden Öffnung. (c) Verteilung der Bestrahlungsstärke bei Fraunhoferbeugung an einer kreisrunden Öffnung. (Fotos mit frdl. Genehmigung von R. D. Wilson, Illinois Wesleyan University.)

1.0

0.5 0.4 0.3 0.0175 0.0042

0.2 0.1

10

ka sin θ

7.02 8.42

5 3.83

−3.83

0

5.14

−5 −5.14

−8.42 −7.02

−10

(a)

Kann R für das gesamte Beugungsbild als im Wesentlichen konstant angenommen werden, so ist  2J1 (kaq/R) 2 . (10.55) I = I(0) kaq/R Wegen sin θ = q/R können wir die Bestrahlungsstärke auch als Funktion von θ schreiben:  2J1 (ka sin θ) 2 . (10.56) I(θ) = I(0) ka sin θ Diese Funktion ist in Abbildung 10.36 gezeigt. Aufgrund der axialen Symmetrie muss man sich diese Figur als um die Achse der Bestrahlungsstärke rotiert vorstellen. Von oben betrachtet erscheint das hohe zentrale Maximum dann als heller Fleck, als so genanntes Airy-Scheibchen. Sir George Biddell Airy (1801–1892), königlich-englischer

10.2 Fraunhoferbeugung

935

Abb. 10.37: Fraunhofersche Beugung an einer kreisrunden Öffnung; das Airy-Muster.

Astronom, leitete Gleichung (10.56) als Erster her. Der mittlere Fleck ist umgeben von einem dunklen Ring, der zum ersten Nulldurchgang der Funktion J1 (u) gehört. Aus Tabelle 10.2 (S. 932) ist ersichtlich, dass J1 (0) = 0 ist, wenn u = 3,83 (in unserem Fall kaq/R = 3,83) ist. Der Radius q1 dieses ersten dunklen Ringes kann als der Radius des Airy-Scheibchens angesehen werden (Abb. 10.37). Er ist gegeben durch q1 = 1,22

Rλ . 2α

(10.57)

Für eine auf den Beobachtungsschirm σ fokussierte Linse gilt f ≈ R, somit ist q1 ≈ 1,22

fλ . D

(10.58)

D ist der Durchmesser der Öffnung, also D = 2a. (Der Durchmesser eines AiryScheibchens im sichtbaren Licht ist in grober Näherung gleich der f -Zahl der Linse in millionstel Metern.) Wie die Fotos unten zeigen, ist der Durchmesser des AiryScheibchens umgekehrt proportional zum Durchmesser der Öffnung. Nähert sich D der Wellenlänge λ, dann werden die Airy-Scheibchen sehr groß und die Öffnung ähnelt mehr und mehr einer Punktquelle, die Kugelwellen abstrahlt.

Airy-Ringe; links: Lochdurchmesser 0,5 mm, rechts: Lochdurchmesser 1,0 mm. (E. H.)

10 Beugung

936

Die Nullstellen höherer Ordnung treten für kaq/R = 7,02, 10,17 usw. auf. Die Nebenmaxima befinden sich dort, wo u die Bedingung  d J1 (u) =0 du u erfüllt, was gleichbedeutend ist mit der Bedingung J2 (u) = 0. Die entsprechenden Werte können in den Tabellen abgelesen werden, z. B. kaq/R = 5,14, 8,42, 11,6 usw. Die Intensität dieser Nebenmaxima fällt von I/I(0) = 1 für das Hauptmaximum auf I/I(0) = 0,0175, 0,0042 bzw. 0,0016 (siehe Aufgabe 10.36).

Links: Airy-Ringe, lange Belichtung (Lochdurchmesser 1,5 mm). Rechts: Zentrales AiryScheibchen, kurze Belichtung mit derselben Blende. (E. H.)

Soweit es die Linsenformen betrifft, sind kreisförmige den rechteckigen Öffnungen vorzuziehen, da der Kurvenverlauf der Bestrahlungsstärke bei den kreisförmigen im Bereich des zentralen Maximums breiter ist und nach außen schneller abfällt. Welcher Anteil der auftreffenden Strahlung auf die einzelnen Maxima entfällt, ist sicher interessant, für uns jedoch zu aufwändig zu klären.9 Durch Integration der Bestrahlungsstärke über einzelne Bereiche kann man ermitteln, dass etwa 84 Prozent des Lichts auf das Airy-Scheibchen entfallen. Innerhalb des zweiten dunklen Ringes treffen 91 Prozent des auf die Ebene σ fallenden Lichts ein. Beispiel 10.6 Das kreisrunde Loch in einem lichtundurchlässigen Schirm hat einen Durchmesser von 4,98 mm. Es wird senkrecht mit Licht aus einem Helium-Neon-Laser (λ0 = 543 nm) bestrahlt und bildet auf einem entfernten Beobachtungsschirm ein fraunhofersches Beugungsmuster. Bestimmen Sie die Winkelbreite 2Δθ1 des Airy-Scheibchens. Wie groß wäre es, wenn das Loch nur ein Zehntel der oben genannten Größe hätte?

9

Siehe Born und Wolf, Prinzipien der Optik, oder die gut verständliche Einführung Wave Phenomena von Towne.

10.2 Fraunhoferbeugung

937

Lösung Wir wissen, dass sin θ = q/R. Δθ1 sei die Hälfte der Winkelbreite des Scheibchens. Mithilfe von Gleichung (10.57) ergibt sich hieraus sin Δθ1 = 1,22

q1 λ = . 2a R

Für kleine Winkel gilt sin Δθ1 ≈ Δθ1 , sodass wir schreiben können λ 2Δθ1 = 1,22 . a Für die gegebenen Werte erhalten wir 2Δθ1 = 1,22

543 × 10−9 m 2,49 × 10−3 m

und Δ2θ1 = 2,66 × 10−4 rad . Für a = 0,498 mm ist 2Δθ1 = 2,66×10−3 rad. Je kleiner das Loch, umso größer das Airy-Scheibchen.

Beugungsverfahren lassen sich möglicherweise bei der schnellen automatisierten Analyse zytologischer Krebstests (Pap-Test) anwenden. Links: FraunhoferBeugungsmuster einer normalen Zelle des Gebärmutterhalses. Rechts: Das Beugungsmuster einer malignen Gebärmutterhalszelle sieht deutlich anders aus. (Fotos Benjamin J. Pernick.)

10.2.6 Das Auflösungsvermögen abbildender Systeme Betrachten wir nun ein Linsensystem, das ein ausgedehntes Objekt abbildet. Leuchtet das Objekt selbst, dann können wir es mit großer Wahrscheinlichkeit als Anordnung inkohärenter Punktquellen behandeln. Sehen wir das Objekt hingegen im reflektierten Licht, dann sind die Phasen der von den einzelnen Streuzentren abgestrahlten Wellen sicherlich in bestimmter Weise korreliert. Sind die Punktquellen tatsächlich inkohärent, so besteht das Bild des Gegenstandes aus voneinander unabhängigen, einander teilweise überlagernden Airy-Mustern. Bei sehr guten Linsensystemen mit vernach-

10 Beugung

938

Abb. 10.38: Überlagerte Beugungsbilder, gut aufgelöst.

lässigbaren Abbildungsfehlern setzt die beugungsbedingte Ausdehnung der einzelnen Bildpunkte der Bildqualität eine unüberwindliche Grenze. Der Einfachheit halber diskutieren wir nur zwei gleich helle, inkohärente und weit entfernte Punktquellen. Stellen wir uns z. B. vor, wir betrachten zwei Sterne durch das Objektiv eines Teleskops, dessen Eintrittspupille als beugende Öffnung wirkt. Wie wir aus dem vorangegangenen Abschnitt wissen, ist der Radius des Airy-Scheibchens durch q1 = 1,22f λ/D gegeben. Ist nun Δθ das Winkelmaß, so ist Δθ = 1,22λ/D wegen q1 /f = sin Δθ ≈ Δθ. Daher ist das Airy-Scheibchen jedes einzelnen Sterns bezogen auf den geometrischen Bildpunkt um den doppelten Winkel Δθ verbreitert (siehe Abb. 10.38). Beträgt der Winkelabstand zwischen den beiden Sternen Δϕ und ist Δϕ  Δθ, so lassen sich die Beugungsbilder problemlos voneinander unterscheiden: Sie sind vollständig aufgelöst. Wird nun Δϕ kleiner, dann kommen die beiden Bilder einander näher, sie überlagern sich und verschmelzen schließlich zu einem einzigen Bild. Wenden wir Lord Rayleighs Kriterium an, dann nennen wir die Sterne gerade noch aufgelöst, wenn der Mittelpunkt des Airy-Scheibchens der einen Quelle in den ersten dunklen Streifen des anderen Airy-Musters fällt. (Dieses Kriterium mag willkürlich erscheinen, ist aber besonders einfach.10 ) Der kleinste auflösbare Winkel10

Mit Rayleighs eigenen Worten: „Die Regel ist praktisch, weil sie so einfach ist. Sie ist auch hinreichend exakt, wenn man bedenkt, dass wir natürlich nicht genau sagen können, was mit Auflösung gemeint ist.“ Siehe dazu auch Abschnitt 9.6.1.

10.2 Fraunhoferbeugung

939

Abb. 10.39: Überlagerte Beugungsbilder, gerade noch aufgelöst.

abstand oder, anders ausgedrückt, der kleinste Winkel, unter dem Objekte noch als getrennt wahrgenommen werden, ist dann (Δϕ)min = Δθ = 1,22λ/D ,

(10.59)

wie in Abbildung 10.39 gezeigt ist. Ist Δ der Abstand zwischen den beiden Bildmittelpunkten, so gilt für die Auflösungsgrenze fλ . (10.60) D Das Auflösungsvermögen eines optischen Systems ist dann allgemein definiert als 1/(Δϕ)min oder 1/(Δ)min . (Δ)min = 1,22

Beispiel 10.7 Eine Sammellinse mit einem Durchmesser von 40 mm wird verwendet, um das Bild zweier Sterne auf einem CCD in einer Kamera zu erzeugen. Angenommen, die Sterne sind 1000 Lichtjahre von der Erde entfernt. Wie weit sind die beiden Sterne voneinander entfernt, wenn sie nach dem Rayleigh-Kriterium gerade noch auflösbar sind? Nehmen Sie λ0 = 550 nm an. Lösung Gemäß Gleichung (10.59) ist (Δϕ)min = 1,22λ/D .

10 Beugung

940

Für die gegebenen Werte erhalten wir hieraus (Δϕ)min =

1,22(550 × 10−9 m) = 1,6775 × 10−5 rad . 40 × 10−3 m

Der Abstand zwischen den Sternen ist somit L = R(Δϕ)min = 1000 · (1,6775 × 10−5 ) ≈ 0,0168 Lichtjahre .

Die Auflösung zweier kleiner Lichtquellen mit gleicher Bestrahlungsstärke.

Soll der noch auflösbare Abstand verringert, also die Auflösungsgrenze erhöht und das Auflösungsvermögen verbessert werden, so kann man z. B. mit kleineren Wellenlängen arbeiten. Verwendet man in einem Mikroskop ultraviolettes statt sichtbares Licht, dann erkennt man feinere Strukturen. Elektronenmikroskope arbeiten mit Materiewellen, deren Wellenlängen um einen Faktor von 104 bis 105 geringer sind als die des sichtbaren Lichts. Damit kann man Objekte oder Strukturen untersuchen, die bei Verwendung von sichtbarem Licht durch Beugungseffekte völlig verschwommen erscheinen würden. Das Auflösungsvermögen eines Fernrohrs kann man durch eine Vergrößerung des Objektivs oder des Primärspiegels verbessern. Abgesehen davon, dass dann ein größerer Teil des einfallenden Lichts verwendet wird, ergibt ein größerer Primärspiegel kleinere Airy-Scheibchen und damit hellere, schärfere Bilder. Der

10.2 Fraunhoferbeugung

klar aufgelöst

Sparrow

941

Rayleigh

nicht mehr aufgelöst

Abb. 10.40: Rayleigh- und Sparrow-Kriterium für überlagerte Punktabbildungen.

Durchmesser des Primärspiegels des 200 -Teleskops vom Observatorium Mount Palomar beträgt fünf Meter (in der Mitte ist allerdings ein kleiner Bereich abgeschattet). Bei einer Wellenlänge von 550 nm ergibt dies eine Winkelauflösungsgrenze von 0,027 Bogensekunden. Dagegen hat die 80-Meter-Radioantenne des Observatoriums Jodrell Bank bei einer Wellenlänge von 21 cm nur ein Auflösungsvermögen von 700 Bogensekunden. Die Eintrittspupille des menschlichen Auges ist bekanntlich variabel. Wenn es hell ist, kann die Öffnung einen Durchmesser von etwa 2 mm haben. Bei einer Wellenlänge von 550 nm ergibt sich ein Auflösungsvermögen (Δϕ)min von ungefähr einer Bogenminute. Mit einer Brennweite von rund 20 mm kommt so auf der Retina eine Auflösungsgrenze (Δ)min von 6700 nm zustande. Dies ist ungefähr der doppelte durchschnittliche Abstand der Sinneszellen auf der Netzhaut. Das menschliche Auge sollte demnach eigentlich in der Lage sein, zwei Objekte aufzulösen, die in 100 m Entfernung um 2,5 cm voneinander getrennt sind. Wahrscheinlich werden Sie das nicht schaffen. Ein durchschnittlich leistungsfähiges Auge trennt in einer Entfernung von 100 m zwei Objekte, deren gegenseitiger Abstand 10 cm beträgt. Das Rayleigh-Kriterium für das Auflösungsvermögen stützt sich, wie bereits beschrieben wurde, auf ein Minimum oder einen Sattelpunkt zwischen zwei benachbarten Maxima. Wird der Winkelabstand zwischen den beiden betrachteten Punktquellen weiter verringert, so ist dieses Minimum immer schlechter erkennbar und verschwindet schließlich vollständig. Der Winkelabstand, in dem das Minimum gerade verschwindet, diente C. Sparrow für die Definition eines strengeren, in vielen Fällen besser geeigneten Kriteriums für das Auflösungsvermögen (siehe Abb. 10.40). Wenn die Maxima verschmelzen, so entsteht ein neues Maximum mit breiter Spitze; im Ursprung, also der Mitte dieser Spitze, ist die zweite Ableitung der Funktion der Bestrahlungsstärke null, d. h., der Anstieg ändert sich nicht. Beim Rayleigh-Kriterium wird die Inkohärenz der Punktquellen stillschweigend vorausgesetzt. Das Sparrow-Kriterium hingegen lässt sich auf den Fall kohärenter Quellen

10 Beugung

942

Dieses Bild besteht aus nur ungefähr 750 Pixeln. Wenn Sie aus geringem Abstand darauf schauen, erkennen Sie das abgebildete Objekt nicht, aber Sie sehen die einzelnen quadratischen Pixel. (Halten Sie sich die Seite dazu dicht vor die Augen.) Um das Objekt klarer zu sehen, müssen Sie Ihre Fähigkeit zur Auflösung der Pixel einschränken: Vermindern Sie D, die Apertur Ihrer Augen (blinzeln Sie) oder verringern Sie den Winkelabstand der Kanten der Pixel (schauen Sie aus größerer Entfernung auf die Seite). In beiden Fällen sollten Sie das Bild des Autors erkennen. (Foto E. H.)

verallgemeinern. Astronomische Beobachtungen an gleich hellen Sternen haben zudem gezeigt, dass die Sparrow-Bedingung weitaus realistischer ist.

10.2.7 Der Besselstrahl nullter Ordnung Nach dem Durchtritt eines Strahls durch eine kleine kreisförmige Öffnung nimmt der Durchmesser des mittleren Airy-Scheibchens gemäß Gleichung (10.57) mit der Entfernung von der Öffnung zu: Der Strahl verbreitert sich während der Fortpflanzung. Laserstrahlen können zwar näherungsweise als parallele Lichtbündel betrachtet werden, aber auch sie divergieren. Der einfachste Laserstrahl, der auch besonders häufig verwendet wird, ist der gaußsche Strahl in der Mode TEM00 . D0 sei der Durchmesser der Strahltaille (der Durchmesser des Strahls an dessen dünnster Stelle); der Strahl verdoppelt seinen Durchmesser nach Durchlaufen einer Strecke zR , des RayleighBereichs, gegeben durch zR = πD02 /4λ. Alle realen Strahlen divergieren, auch wenn sie hochkollimiert sind. Die Wellengleichung im Vakuum hat jedoch eine Klasse „nichtbeugender“ Lösungen; sie gehören zu Strahlen, die sich nicht verbreitern. Die einfachste von ihnen entspricht

10.2 Fraunhoferbeugung

943

einer monochromatischen Welle, die sich in z-Richtung ausbreitet und deren elektrisches Feld proportional zur Besselfunktion J0 nullter Ordnung ist: ! (r, θ, z, t) ∝ J0 (k⊥ r) ei(k || z−ωt) . E ! (r, θ, z, t) ist hier in Zylinderkoordinaten angegeben (siehe Abschn. 2.10), k || = E k cos φ, k⊥ = k sin φ und der Winkel φ kann nur Werte zwischen 0◦ und 90◦ annehmen. Beachten Sie, dass für φ = 0 gilt sin φ = 0 und J0 (0) = 1; die Lösung ist dann eine ebene Welle. Ideale ebene Wellen verbreitern sich während der Fortpflanzung nicht. Allerdings sind sie weder in einem schmalen Strahl lokalisiert, noch existieren sie wirklich. (a)

(b)

R a

φ

φ

f Zmax

(c)

Abb. 10.41: Anordnung zur Erzeugung eines Besselstrahls mithilfe eines ringförmigen Spalts. (a) Die Ringöffnung wird mit ebenen Wellen beleuchtet. (b) Die Öffnung befindet sich in der vorderen Brennebene der Linse, sodass parallele Strahlen aus der Linse austreten. (c) Die Propagationsvektoren der ebenen Wellen liegen sämtlich auf einem Kegel. Die Wellen überlagern einander bis zu einem Abstand zmax .

944

10 Beugung

Ein Besselstrahl. (Foto mit frdl. Genehmigung von Ryan P. MacDonald.)

Wie wir in Kapitel 11 bei der Einführung der Fourier-Transformation genauer bespre! (r, θ, z, t) als Summe chen werden, kann allgemein eine komplexe Wellenform wie E unendlich vieler ebener Wellen mit k-Werten, die ein Kontinuum bilden, aufgefasst ! (r, θ, z, t) als Superposition unendlich vieler ebener werden. Insbesondere kann man E Wellen betrachten, deren Propagationsvektoren (oder Wellenvektoren) entlang eines Kegels liegen, dessen Halbwinkel – gemessen von der Mittelachse, der z-Achse aus – gleich φ ist. Dies ist die Definition des Besselstrahls oder J0 -Strahls. !E !∗ ist, verschwindet jede Abhängigkeit Da die Bestrahlungsstärke proportional zu E 2 von z; I (r, θ, t) ∝ J0 (k⊥ r), und die Bestrahlungsstärke ist in allen Ebenen senkrecht zur z-Achse gleich. Das transversale Bestrahlungsstärkemuster breitet sich deshalb nicht aus, wenn die Welle fortschreitet; es besteht aus einem schmalen mittleren Bereich (Durchmesser 2,405/k⊥ ), umgeben von konzentrischen Ringen (siehe Foto). Jeder Ring trägt ungefähr dieselbe Energie wie das zentrale Maximum, nur rund 5% der Anfangsenergie des Strahls. In der Realität lassen sich ideale ebene Wellen nicht erzeugen, und damit auch kein idealer J0 -Strahl. Ebene Wellen sind räumlich unendlich ausgedehnt und daher als unerreichbare Idealisierung zu betrachten. Was wir aufbauen können, ist eine Welle, die einem J0 -Strahl in einem begrenzten Bereich des Raumes nahe kommt. Mit verschiedenen Methoden wurde dies bereits erreicht. In Abbildung 10.41 a sehen Sie eine elegante Anordnung zur Erzeugung eines QuasiJ0 -Strahls. Ein schmaler (≈ 10 µm), kreisrunder Spalt – ein Ring von wenigen Millimetern Durchmesser – wird mit monochromatischen ebenen Wellen mit der Wellenlänge λ beleuchtet. Jeder Punkt des Spalts wirkt als Punktquelle von Kugelwellen. Der Ring befindet sich in der vorderen Brennebene einer Linse mit dem Radius R. Je-

10.2 Fraunhoferbeugung

945

de sphärische Elementarwelle tritt als ebene Welle aus der Linse aus und pflanzt sich unter einem Winkel φ fort, sodass gilt   −1 1 a/f . φ = tan 2 Die Wellen überlagern einander bis zu einem Abstand zmax von der Linse (siehe Abb. 10.41 b). Dabei ist tan φ = R/zmax = 12 a/f und folglich 2Rf . a Dies ist die Reichweite eines Besselstrahls. Sie kann, hält man a klein und R groß, bedeutend größer sein als der Rayleigh-Bereich eines gaußschen Strahls mit vergleichbarem Durchmesser.11 zmax =

10.2.8 Das Beugungsgitter Eine Anordnung beugender Elemente (Öffnungen oder Hindernisse), die sich regelmäßig wiederholen und dadurch periodische Änderungen der Amplitude, der Phase oder beider Größen einer auslaufenden Welle verursachen, heißt Beugungsgitter. Ein einfaches Beispiel ist die in Kapitel 10.2.3 besprochene Mehrspaltanordnung, die wahrscheinlich um 1785 von dem amerikanischen Astronomen David Rittenhouse erfunden wurde. Unabhängig davon entdeckte Joseph von Fraunhofer einige Jahre darauf die Gitter wieder; Fraunhofer leistete auch wichtige Beiträge sowohl zur Theorie als auch zur technischen Ausführung dieser Systeme. Anfangs verwendete man tatsächlich Mehrspaltanordnungen, bestehend aus dünnen Drähten oder Fäden, die um zwei als Abstandhalter dienende Schrauben gewickelt waren. Beim Durchtritt durch ein solches Gitter „sieht“ eine Wellenfront abwechselnd durchsichtige und undurchsichtige Bereiche und erfährt auf diese Weise eine Amplitudenmodulation. Das Gitter nennt man entsprechend Transmissions-Amplituden-Gitter. Eine andere, gebräuchlichere Variante besteht in einer durchsichtigen Glasplatte, in deren Oberfläche parallele Rillen graviert wurden (Abb. 10.42 a). Jede Rille streut Licht, und gemeinsam wirken die Rillen als regelmäßige Anordnung paralleler Linienquellen. Ist das Gitter vollständig durchlässig, so kann man die Amplitudenmodulation vernachlässigen. Die periodische Änderung der optischen Weglänge infolge der unterschiedlichen Dicke des Glases führt dann zu einer Phasenmodulation der Wellenfront. Ein solches Gitter nennt man Transmissions-Phasen-Gitter (siehe Foto S. 947). Im Fresnel-HuygensBild stellen wir uns vor, kleine Elementarwellen mit verschiedenen Phasen gingen von 11

Lord Rayleigh, „On the passage of electric waves through tubes, or the vibrations of dielectric cylinders“, Phil. Mag., S. 5, 43, Nr. 261 (Feb. 1897) 125; J. Durnin, „Exact solutions for nondiffracting beams. 1. The scalar theory“, J. Opt. Soc. Am. A 4 (1987) 651; J. Durnin, J. J. Miceli jr. und J. H. Eberly, „Diffraction-Free Beams“, Phys. Rev. Lett. 58 (1987) 1499; C. A. McQueen, J. Arit und K. Dholakia, „An experiment to study a ‚nondiffracting‘ light beam“, Am. J. Phys. 67 (1999) 912.

10 Beugung

946 1. Ordnung

0. Ordnung

-te Ordnung

1. Ordnung

(a)

(b)

Abb. 10.42: Transmissionsgitter.

der Oberfläche des Glases aus. Demnach wird die Form, nicht aber die Amplitude der auslaufenden Wellenfront periodisch verändert. Dies wiederum ist äquivalent zu einer Wellenfront, die durch ebene Wellen mit vorgegebener Winkelverteilung erzeugt wird. Wird Licht an der Oberfläche eines solchen Gitters reflektiert, so erreichen die Strahlenbündel (die abwechselnd von einer Rille oder der unversehrten Oberfläche ausgehen) einen Punkt P mit einer bestimmten Phasenbeziehung. Nach der Reflexion entsteht ein Interferenzmuster, sehr ähnlich dem Muster, das man an einem Transmissionsgitter beobachten kann. Gitter, die speziell für diese Funktion hergestellt werden, heißen Reflexions-Phasen-Gitter (Reflexionsgitter; siehe Abb. 10.43). Moderne Gitter dieser Art werden hergestellt, indem man eine Aluminiumschicht auf eine planparallele Glasplatte aufdampft und die Metallschicht anschließend einritzt. Die Vorteile dieser Methode bestehen in der leichten, werkzeugschonenden Ritzbarkeit des weichen Aluminiums und im, verglichen mit Glas, wesentlich besseren Reflexionsvermögen des Metalls für ultraviolettes Licht. Die Herstellung solcher Gitter ist schwierig und kostspielig, weshalb nur geringe Stückzahlen produziert werden. Die meisten heute gebräuchlichen Gitter sind sehr gute Plastikkopien von hochwertigen Mastergittern. Viele Gitter werden inzwischen auch holographisch hergestellt (siehe Abschn. 13.3). Schauen wir senkrecht durch ein Transmissionsgitter auf eine sehr weit entfernte Lichtquelle, dann dient unser Auge als Sammellinse für das Beugungsbild. In Abschnitt 10.2.3 hatten wir die Beziehung a sin θm = mλ

[10.32]

hergeleitet, die man auch Gittergleichung (bei senkrechtem Lichteinfall) nennt. Die Werte m geben die Ordnung der verschiedenen Hauptmaxima an. Wenn die Lichtquelle ein breites kontinuierliches Spektrum abstrahlt wie etwa ein Wolframglühfaden, dann gehört die nullte Ordnung (m = 0) zum nicht abgelenkten (θ0 = 0) Bild im

10.2 Fraunhoferbeugung

947

Gitter

sichtbarer Bereich Ultraviolett

(a)

Licht tritt durch ein Gitter. (a) Der linke Bereich entstand mit sichtbarem, der rechte Bereich mit ultraviolettem Licht. (Foto mit frdl. Genehmigung von Klinger Educational Prod. Corp., College Point, NY.) (b) Blick von oben auf die gebeugten Strahlen mit m = 0 und m = ±1, die beim Durchgang von Licht eines He-Ne-Lasers durch ein Gitter mit 530 Linien pro Millimeter entstanden. Die Gitter befanden sich in Luft (oben; λ = 632,8 nm) bzw. Wasser (unten). Aus dem gemessenen Wert von θ1 wurde mithilfe der Gittergleichung berechnet λw = 471 nm und daraus nw = 1,34. (Foto mit frdl. Genehmigung von A. F. Leung, The Chinese University of Hong Kong.)

weißen Licht (siehe Foto). Die Gittergleichung (10.32) ist eine Funktion der Wellenlänge, weshalb für jedes m = 0 das Bild der Quelle für jede Wellenlänge (jede Spektralfarbe) etwas anders (θm ) abgelenkt wird. Die Bereiche, die von den schwachen Nebenmaxima eingenommen werden, erscheinen dann als lichtschwache Bänder im Spektrum. Die beiden Hauptmaxima erster Ordnung (m = ±1) befinden sich auf beiden Seiten des Hauptmaximums nullter Ordnung, gefolgt (abwechselnd mit dunklen Zwischenräumen) von den höheren Ordnungen (m = ±2, ±3, . . . ). Je kleiner a in Gleichung (10.32) wird, umso weniger Ordnungen kann man erkennen. Es sollte uns nicht überraschen, dass die Gittergleichung faktisch Gleichung (9.29) ist, welche die Lage der Hauptmaxima im youngschen Doppelspaltversuch beschreibt.

10 Beugung

948

1. Ordnung

-te Ordnung

0. Ordnung

(a)

1. Ordnung

(b)

Abb. 10.43: Reflexionsgitter.

Die Interferenzmaxima, alle mit demselben Winkel abgelenkt, erscheinen jetzt schärfer – ähnlich, wie die Verwendung vieler Strahlen die Streifen im Fabry-Perot-Etalon schärfer macht. Im Falle des Doppelspalts sind die beiden Wellen auch dann noch mehr oder weniger phasengleich, wenn der Beobachtungspunkt nicht exakt im Zentrum des Interferenzmaximums liegt. Die Intensität ist natürlich geringer, aber noch beträchtlich. Deswegen sind die hellen Bereiche ziemlich breit. Im Gegensatz dazu führt bei Mehrstrahlsystemen bereits eine geringfügige Verschiebung des Beobachtungspunktes dazu, dass manche Wellen um 12 λ phasenverschoben bezüglich der anderen Wellen ankommen, obwohl die Wellen in den Zentren der Maxima konstruktiv interferieren. Nehmen wir z. B. an, der Punkt P befinde sich etwas abseits von θ1 , sodass a sin θ nicht gleich 1,000 λ, sondern 1,010 λ ist. Wellen, die von aufeinanderfolgenden Spalten ausgehen, treffen dann jeweils um 0,01 λ versetzt in P ein. Auf diese Weise verschiebt sich die Weglänge bis zum 50. Spalt um 0,5 λ, und das Licht vom 51. Spalt löscht dasjenige vom ersten Spalt gerade aus. Dasselbe gilt für die Paare 2/52, 3/53 usw. Außerhalb der Maxima fällt die Bestrahlungsstärke aus diesem Grund rasch ab. Beispiel 10.8 Polychromatisches Licht, das den Wellenlängenbereich von 400 bis 600 nm umfasst, fällt senkrecht auf ein Transmissionsgitter mit 500 000 Spalten pro Meter. Eine in der Nähe befindliche Sammellinse erzeugt ein fraunhofersches Beugungsmuster auf einem Schirm, der in der Brennebene der Linse platziert ist. Welche Brennweite muss die Linse haben, damit sich das Spektrum zweiter Ordnung über einen Bereich von 2 cm Länge erstreckt? Diskutieren Sie die Reihenfolge der Farben in dem Muster.

10.2 Fraunhoferbeugung

949

Lösung Die Gittergleichung a sin θm = mλ bestimmt die Positionen der Hauptmaxima. Für das Spektrum zweiter Ordnung ist m = 2. Seien Y2 (400) und Y2 (600) die von der zentralen Achse bis zum Schirm gemessenen Abstände für die Grenzwellenlängen, dann gilt Y2 (600) − Y2 (400) = 2,00 × 10−2 m . Wenn θ2 (λ) der Winkel zwischen einer Spektrallinie und der zentralen Achse ist, gilt tan θ2 = Y2 /R = Y2 /f . Aus a sin θ2 = 2λ und sin θ2 ≈ tan θ2 =

2λ a

folgt 2λ Y2 = . f a Hier ist a = 1/500 000 = 2,00 × 10−6 , sodass 2(600 × 10−9 ) f = 0,60 f 2,00 × 10−6 2(400 × 10−9 ) f = 0,40 f . Y2 (400) = 2,00 × 10−6

Y2 (600) =

Durch Bilden der Differenz Y2 (600)− Y2 (400) = 0,20 f erhalten wir f = 0,1 m. Je größer λ, umso größer ist θm und umso weiter liegt die Spektrallinie von der zentralen Achse weg: Violett liegt am nächsten und Rot am weitesten weg.

Betrachten wir nun den etwas allgemeineren Fall des schrägen Einfalls (Abb. 10.42 und 10.43). Die Gittergleichung wird dann sowohl für ein Transmissions- als auch ein Reflexionsgitter zu a (sin θm − sin θi ) = mλ .

(10.61)

Diese Gleichung gilt unabhängig vom Brechungsindex des Materials des Transmissionsgitters (Aufgabe 10.63). Die bisher besprochenen Gitter haben einen wesentlichen Nachteil, weshalb sie auch als veraltet angesehen werden müssen: Die vorhandene

10 Beugung

950 γ

a

θi θ0 0. Ordnung γ

b spiegelnde Reflektion (Beugungsmaximum)

2γ 0. Ordnung

θi

γ

θr

Abb. 10.44: Teil eines Reflexions-Phasen-Gitters mit bevorzugter Reflexion (blazed grating).

Abb. 10.45: Reflexions-Phasen-Gitter mit bevorzugter Reflexion (blazed grating).

Lichtenergie wird auf eine Reihe von Spektralordnungen niedriger Intensität verteilt. An einem Gitter wie in Abbildung 10.43 wird der größte Teil des einfallenden Lichts spiegelnd reflektiert (wie an einem ebenen Spiegel). Aus der Gittergleichung folgt, dass θm = θi für die nullte Ordnung (m = 0) gilt. Dieses Licht wird, zumindest für spektroskopische Zwecke, praktisch verschwendet, weil sich für diese Ordnung alle Wellenlängen überlagern (wir erhalten weißes Licht). Lord Rayleigh schrieb 1888 in der Encyclopedia Britannica, es müsse zumindest theoretisch möglich sein, Licht aus der nicht verwendbaren nullten Ordnung in eine der höheren Ordnungen abzulenken. Dies regte 1910 Robert Williams Wood (1868–1955) an, ein Gitter mit speziell geformten Rillen herzustellen, wie es in Abbildung 10.44 gezeigt ist. Die meisten modernen Gitter sind von dieser Art (blazed grating). Die Winkelpositionen der höheren Ordnungen werden von a, α und, was uns besonders interessiert, von θm bestimmt. θi und θm werden jedoch von der Normalen zur Gitteroberfläche gemessen, nicht von der Normalen zur Oberfläche den einzelnen Rillen. Andererseits ist die Position des Maximums im Beugungsmuster einer einzelnen Rille durch die spiegelnde Reflexion des Lichts an der Oberfläche dieser Rille gegeben, sie wird bestimmt durch den Blaze-Winkel γ und kann unabhängig von θm verändert werden. Diese Situation ist analog zu der in Abschnitt 10.1.3 besprochenen Antennenanordnung, bei der die räumliche Position des Interferenzmusters [Gl. (10.6)] ungeachtet der Orientierung der Antennen von der relativen Phasenverschiebung der Quellen abhängt.

10.2 Fraunhoferbeugung

951

Betrachten wir noch die Situation in Abbildung 10.45. Eine Welle fällt senkrecht zur Oberfläche eines Blazed-Gitters ein; es ist demnach θi = 0 und deshalb für m = 0 auch θ0 = 0. Bei spiegelnder Reflexion gilt θi − θr = 2γ (Abb. 10.44), und der größte Teil der gebeugten Strahlung konzentriert sich um θr = −2γ. (θr ist negativ, weil θi und θr auf derselben Seite der Gitternormalen liegen.) Dies entspricht einer der höheren Ordnungen, nämlich derjenigen, für die θm = −2γ ist, also a sin(−2γ) = mλ für das entsprechende λ und m. Gitterspektroskopie In den frühen 1920er-Jahren begann die Entwicklung der Quantenmechanik, zunächst auf dem Gebiet der Atomphysik: Man versuchte, aus der von einem Wasserstoffatom ausgesendeten Strahlung auf die strukturellen Details des Atoms zu schließen. Zur Überprüfung der Aussagen war die Spektroskopie unerlässlich, und man brauchte größere, bessere Gitter. Gitterspektrographen für alle Spektralbereiche von der weichen Röntgenstrahlung bis zum fernen Infrarot sind noch heute weit verbreitet. Astrophysikern liefern solche Geräte – fest auf der Erde installiert oder an Bord von Raumsonden – wichtige Aufschlüsse über den Ursprung des Universums, über Sternentemperaturen, die Rotation von Galaxien oder die Rotverschiebung im Spektrum von Quasaren. Mitte des 20. Jahrhunderts gelang es George R. Harrison und George W. Stroke, die Qualität hochauflösender Gitter enorm zu verbessern, indem sie zum Einritzen der Gitterlinien in die Glasplatten eine interferometrisch gesteuerte Maschine verwendeten.12 Wir wollen nun einige grundlegende Eigenschaften eines Gitterspektrums näher untersuchen. Dazu gehen wir von einer unendlich kleinen, inkohärenten Lichtquelle aus. Als effektive (spektrale) Breite einer von dieser Quelle ausgesendeten Spektrallinie können wir den Winkelabstand zwischen den Nullstellen der Bestrahlungsstärke auf beiden Seiten des Hauptmaximums ansehen, d. h. Δα = 2π/N gemäß Gleichung (10.33). Für schrägen Einfall des Lichts definieren wir die Größe α neu durch α = (ka/2)(sin θ − sin θi ), und damit ist eine kleine Änderung in α gegeben durch 2π ka cos θ(Δθ) = (10.62) 2 N mit konstantem Einfallswinkel, also Δθi = 0. Selbst im Falle einer monochromatischen Lichtquelle erhalten wir dann eine endliche Winkelbreite einer Spektrallinie, nämlich 2λ , (10.63) Δθ = N a cos θm Δα =

die so genannte instrumentelle Linienbreite, deren Ursache das Instrument (der Gitterspektrograph) ist. Interessanterweise ist diese Winkelbreite umgekehrt proportional zur Breite des Gitters, N a. 12

Mehr darüber erfahren Sie z. B. in A. R. Ingalls, Sci. Amer. 186 (1952) 45 oder E. W. Palmer und J. F. Verrill, Contemp. Phys. 9 (1968) 257.

10 Beugung

952

Eine weitere wichtige Größe ist die Differenz in der Winkelposition, die zu einer gegebenen Differenz in der Wellenlänge gehört. Diese Winkeldispersion ist wie bei einem Prisma definiert als dθ . dλ Durch Differentiation der Gittergleichung erhalten wir m . D= a cos θm D≡

(10.64)

(10.65)

Dies bedeutet, der Winkelabstand zwischen zwei Spektrallinien nimmt mit der Ordnung m zu.

Photoplatte

Spalt als Lichtquelle

Abb. 10.46: Reflexionsgitter in Littrow-Autokollimationsanordnung.

Ebene Blazed-Gitter, deren Rillen ein nahezu rechteckiges Profil aufweisen, werden meist so ausgerichtet, dass der Fortpflanzungsvektor des einfallenden Lichts nahezu senkrecht auf einer der beiden Rillenflächen steht. Man spricht dann von Autokollimation: θi und θm liegen auf derselben Seite der Gitternormalen, und γ ≈ θi ≈ −θm (siehe Abb. 10.46). Die Winkeldispersion hängt dann nicht mehr von a ab: 2 tan θi . (10.66) λ Wird die Wellenlängendifferenz zwischen zwei Spektrallinien so klein, dass die Linien einander im Beugungsbild überlappen, dann ist das entstehende Maximum nicht mehr Dauto =

10.2 Fraunhoferbeugung

953

eindeutig, die beiden Linien können nicht mehr voneinander getrennt werden. Das chromatische Auflösungsvermögen R eines Spektrometers ist definiert als R≡

λ , (Δλ)min

[9.76]

wobei (Δλ)min der kleinste auflösbare Unterschied zweier Wellenlängen, die Auflösungsgrenze, ist; λ ist die mittlere Wellenlänge der beiden Linien. Lord Rayleighs Kriterium für die Auflösung zweier Quellen gleicher Intensität verlangt bekanntlich, dass das Hauptmaximum einer Quelle mit dem ersten Minimum der anderen Quelle zusammenfällt. (Vergleichen Sie dies mit der Erläuterung in Abschnitt 9.6.1). Wie in Abbildung 10.40 gezeigt, ist der Winkelabstand an der Auflösungsgrenze gleich der Hälfte der Linienbreite oder, gemäß Gleichung (10.63), (Δθ)min =

λ . N a cos θm

Durch Verwendung des Ausdrucks für die Winkeldispersion erhalten wir (Δθ)min =

(Δλ)min m . a cos θm

Die Kombination der beiden Beziehungen liefert λ = mN (Δλ)min

(10.67)

und damit für das Auflösungsvermögen N a (sin θm − sin θi ) . (10.68) λ Das Auflösungsvermögen eines Gitters hängt also von der Gitterbreite N a, dem Einfallswinkel und der Wellenlänge λ ab. Ein 15 cm breites Gitter mit etwa 600 Linien pro Millimeter hat insgesamt ungefähr 9 × 104 Linien. In zweiter Ordnung ergibt sich daraus ein Auflösungsvermögen von 1,8 × 105 . Bei einer Wellenlänge von ungefähr 540 nm kann dieses Gitter zwei Spektrallinien noch trennen, deren Wellenlängen sich um 0,003 nm unterscheiden. Beachten Sie, dass das Auflösungsvermögen den Wert 2N a/λ nicht übersteigen kann; dieser Wert gehört zu θi = −θm = 90◦ . Den größten Wert für R erhalten wir, wenn das Gitter in Autokollimationsanordnung verwendet wird. Dann ist R=

Rauto =

2N a sin θi , λ

(10.69)

θi und θm liegen wieder auf der gleichen Seite der Gitternormalen. Das Auflösungsvermögen eines Harrison-Gitters mit bevorzugter Reflexion (260 mm breit, Littrow-Anordnung, 75◦ ) ist bei einer Wellenlänge von 500 nm etwas besser als 106 .

10 Beugung

954

Wenden wir uns nun noch dem Problem der überlappenden Ordnungen zu. Aus der Gittergleichung geht eindeutig hervor, dass eine Spektrallinie von 600 nm Wellenlänge in der ersten Ordnung genau an der gleichen Stelle θm liegt wie eine Linie von 300 nm in der zweiten Ordnung oder eine von 200 nm in der dritten. Wenn zwei Spektrallinien der Wellenlängen λ und (λ + Δλ) in den aufeinanderfolgenden Ordnungen m und (m + 1) zusammenfallen, dann gilt a (sin θm − sin θi ) = (m + 1)λ = m (λ + Δλ) . Die zugehörige Wellenlängendifferenz heißt freier Spektralbereich des Gitters, λ , (10.70) m wie wir ihn auch für das Fabry-Perot-Interferometer definiert haben. Analog zu diesem Instrument, dessen Auflösungsvermögen als (Δλ)FSB =

R = Fm

[9.76]

definiert war, können wir N als Finesse (Feinheit) des Beugungsgitters bezeichnen (siehe Aufgabe 10.65). Ein hochauflösendes Gitter für die erste Ordnung verlangt eine hohe Liniendichte (bis zu 1200 Linien pro Millimeter), um bei maximalem Spektralbereich ein hohes Auflösungsvermögen R zu gewährleisten. Aus Gleichung (10.68) ergibt sich aber, dass R auch dann erhalten bleibt, wenn weniger Linien mit größerem Abstand zueinander verwendet werden, sodass N a konstant bleibt. Allerdings muss man dann zu höheren Ordnungen übergehen, wodurch sich der freie Spektralbereich verringert. Wird N bei zunehmendem a konstant gehalten, so steigt R an. Da aber auch m zunimmt, nimmt (Δλ)FSB ab. Die Winkelbreite der Linien wird kleiner, und die Linien werden schärfer. Da sich aber die Winkeldispersion für einen gegebene Ordnung verringert, rücken die Linien im Spektrum näher zusammen. Bisher haben wir nur Gitter einer speziellen Form, die Liniengitter, betrachtet. In der Literatur finden sich sehr viele Informationen über Formen, Varianten und Anwendungen dieses weit verbreiteten und gut untersuchten Gittertyps.13 Als grobe Gitter lassen sich sogar verschiedene Alltagsgegenstände verwenden, von denen Sie dies wahrscheinlich nicht erwarten würden. Bei streifendem Einfall eignet sich z. B. die Oberfläche einer Schallplatte; noch bessere Reflexionsgitter geben CDs ab. Überraschenderweise kann man bei θi ≈ 90◦ auch mit einem feinzinkigen Kamm (oder einer Stange Heftklammern) weißes Licht in seine spektralen Bestandteile zerlegen. Dies geschieht im Prinzip genauso wie bei einem herkömmlichen Reflexionsgitter. James Gregory schrieb am 12. Mai 1673 an einen Freund, dass Son13

Siehe z. B. F. Kneubühl, Appl. Opt. 8 (1969) 505; R. S. Longhurst, Geometrical and Physical Optics sowie den sehr ausführlichen Artikel von G. W. Stroke in der Encyclopedia of Physics, herausgegeben von S. Flügge.

10.2 Fraunhoferbeugung

955

nenlicht, welches durch eine Feder fällt, ein farbiges Muster erzeugt. Der Adressat wurde gebeten, diese Beobachtung an Herrn Newton weiterzugeben. Wenn Sie also irgendwo eine Feder finden, dann haben Sie ein schönes Transmissionsgitter. Beispiel 10.9 Angenommen, wir wollen die beiden hellen, gelben Natriumlinien (589,5923 nm und 588,9953 nm) in dem Spektrum zweiter Ordnung auflösen, das mit einem Transmissionsgitter erzeugt wurde. Wie viele Spalte oder Linien muss das Gitter mindestens haben? Lösung Das Auflösungsvermögen des Gitters ist λ/(Δλ)min , wobei λ die mittlere Wellenlänge ist, also 12 (589,5923 + 588,9953) nm = 589,2938 nm. Damit ist (Δλ)min = (589,5923−588,9953) nm = 0,597. Aus Gleichung (10.67) mit m = 2 folgt λ = mN (Δλ)min und N=

589,2938 nm = 493,5 . 2(0,597 nm)

Um zwei Linien zu sehen, benötigen wir ein Gitter mit mindestens 494 Spalten.

Zwei- und dreidimensionale Gitter Nehmen wir nun an, der Schirm Σ enthalte eine große Zahl (N ) zufällig verteilter, identischer beugender Öffnungen (oder Hindernisse), die sämtlich gleich orientiert sind. Nun beleuchten wir Σ mit ebenen Wellen, und eine ideale Linse L2 fokussiere die aus dem Schirm austretenden Wellen auf σ (siehe Abb. 10.16). Die einzelnen Öffnungen erzeugen dann identische fraunhofersche Beugungsmuster, die sich auf dem Schirm Σ überlagern. Sind die Öffnungen vollkommen unregelmäßig verteilt, dann müssen auch die Phasen der in einem Punkt P auf σ ankommenden Wellen vollkommen zufällig verteilt sein. Allerdings gibt es eine Ausnahme, nämlich wenn sich P auf der Achse befindet, d. h. P = P0 . Alle zur Achse parallelen Strahlen von allen Öffnungen legen bis zu P0 den gleichen optischen Weg zurück, treffen dort phasengleich ein und interferieren daher konstruktiv. Betrachten wir nun ein beliebig gerichtetes Bündel paralleler Strahlen, die von verschiedenen Öffnungen kommen und nicht parallel zu Achse sind. Sie sind auf einen Punkt P in der Ebene σ fokussiert. Für jeden Strahl ist die Wahrscheinlichkeit gleich groß, mit irgendeiner Phase zwischen 0 und 2π in P einzutreffen. Zu bestimmen ist nun das elektrische Feld, das aus der Überlagerung von N Vektoren gleicher

956

10 Beugung

Amplitude, aber zufällig verteilter Phase resultiert. Die Lösung dieses Problems erfordert Methoden der Wahrscheinlichkeitstheorie, was uns hier zu aufwändig ist.14 Das wichtige Ergebnis besteht darin, dass die Summe einer Reihe von Zeigern gleicher Amplitude und zufälliger Phase nicht einfach null ist, wie man annehmen könnte. Aus statistischen Gründen geht die allgemeine Analyse von sehr vielen verschiedenen Schirmen aus, von denen jeder N zufällig verteilte Öffnungen hat. Jeder Schirm wird von einer monochromatischen Welle beleuchtet. Es überrascht sicher nicht, dass die Beugungsmuster zweier verschiedener Verteilungen von z. B. 100 Löchern (N = 100) verschieden sind, wenn auch vielleicht geringfügig. Je kleiner N wird, umso offensichtlicher werden die Unterschiede. So ist auch zu erwarten, dass sich Ähnlichkeiten dieser Anordnungen bei einer hinreichend großen Zahl von Schirmen statistisch manifestieren. Dies führt zum beschriebenen Ansatz. Mitteln wir nun die verschiedenen erhaltenen Muster der Bestrahlungsstärke alle in einem Punkt P auf σ, der nicht auf der Achse liegt, dann ergibt sich die mittlere Bestrahlungsstärke Imit als Produkt aus N und der Bestrahlungsstärke I0 , die von einer einzigen Öffnung herrührt: Imit = N I0 . Trotzdem kann die von einem einzelnen Schirm herrührende Bestrahlungsstärke an jedem Punkt deutlich von diesem Mittelwert abweichen, ungeachtet der Größe von N . In jedem einzelnen Beugungsmuster zeigen sich diese Fluktuationen um den Mittelwert in jedem Punkt durch eine meist radiale, faserähnliche Strukturierung. Mitteln wir diese feinkörnigen Flecken über einen kleinen Bereich (der immer noch viele Fluktuationen enthält), so erhalten wir für die Bestrahlungsstärke den Wert N I0 . In einem realen Experiment wird die Situation natürlich nicht exakt dem idealen Fall entsprechen. Es gibt kein wirklich monochromatisches Licht und auch keine wirklich zufällige Verteilung einander nicht überlappender beugender Elemente. Beleuchten wir aber einen Schirm mit N „zufällig“ verteilten Öffnungen mit quasimonochromatischem Licht, das aus nahezu ebenen Wellen besteht, so können wir immerhin eine fleckige Flussdichteverteilung sehen, die der von einer einzigen Öffnung hervorgerufenen stark ähnelt, aber N -mal so hell ist. Wir können auch einen hellen Fleck im Zentrum (auf der Achse) erkennen, dessen Flussdichte dem N 2 -fachen derjenigen einer einzelnen Öffnung entspricht. Enthält der Schirm beispielsweise N rechteckige Löcher (Abb. 10.47 a), so erinnert das Beugungsmuster (Abb. 10.47 b) an das Foto auf Seite 926, das Beugungsbild eines einzelnen Lochs. Entsprechend entsteht an runden Löchern (Abb. 10.47 c) ein Ringmuster (Abb. 10.47 d). Wenn die Anzahl der Öffnungen zunimmt, dann wird der mittlere Fleck immer heller, bis er schließlich den Rest des Musters überstrahlt. Es sei noch darauf hingewiesen, dass die obigen Überlegungen nur für den Fall gelten, dass alle Löcher im Schirm vollständig kohärent beleuchtet werden. In der Realität bestimmt der tatsächliche 14

Eine statistische Behandlung ist nachzulesen in J. M. Stone, Radiation and Optics, oder in A. Sommerfeld, Optik. Nützlich sind auch die Artikel „Diffraction Plates for Classroom Demonstrations“ von R. B. Hoover, Am. J. Phys. 37 (1969) 871 und T. A. Wiggins, „Hole Gratings for Optics Experiments“, Am. J. Phys. 53 (1985) 227.

10.2 Fraunhoferbeugung

957

(a)

(b)

(e)

(c)

(d)

(f)

Abb. 10.47: (a) Schirm mit zufällig verteilten rechteckigen Löchern. (b) Fraunhofer-Muster dieses Schirms mit weißem Licht. (c) Schirm mit zufällig verteilten kreisrunden Löchern und (d) das zugehörige Fraunhofer-Muster mit weißem Licht. (Fotos mit frdl. Genehmigung von The Ealing Corporation und Richard B. Hoover.) (e) Eine Kerzenflamme, fotografiert durch eine angehauchte Glasplatte. Die Spektralfarben sind als konzentrische Ringe sichtbar. (f) Ähnliches farbiges Ringsystem, das sich beim Blick auf eine Weißlichtquelle durch eine Glasplatte ergibt, die mit kugelförmigen, durchsichtigen Lycopodium-Sporen bedeckt ist. (Foto E. H.)

Kohärenzgrad die Verteilung der Bestrahlungsstärke im Beugungsbild (siehe Kap. 12). Die Intensität durchläuft die gesamte Skala von null im Falle vollständig inkohärenter Beleuchtung bis zur oben diskutierten Situation vollständig kohärenter Beleuchtung (Aufgabe 10.67). Ähnliche Effekte werden von so genannten zweidimensionalen Phasengittern erzeugt. Die Korona („Kranz“) um Sonne oder Mond, die man bei geeignetem Wetter sehen kann, kommt z. B. durch Beugung des Lichts an den zufällig verteilten Wassertröpfchen der Wolken zustande. Um diesen Effekt nachzustellen, hauchen Sie einen Objektträger an, den Sie eventuell vorher mit einer dünnen Schicht Talkumpuder versehen können. Wenn Sie durch diesen Objektträger eine Punktquelle betrachten, die weißes Licht abstrahlt, dann sollten Sie ein deutliches Muster farbiger, konzentrischer Ringe sehen [Gl. (10.56)], die ein weißes Scheibchen umgeben. Sehen Sie nur einen hellen Fleck, dann haben Sie auf Ihrem Objektträger keine Verteilung annähernd gleich großer Partikel – versuchen Sie es noch einmal. Ein wunderschönes System farbiger,

10 Beugung

958

konzentrischer Ringe sieht man durch die Maschen eines gewöhnlichen Nylonstrumpfes. Vielleicht gibt es in Ihrer Stadt Quecksilberdampflampen als Straßenbeleuchtung – dann können Sie mithilfe einer Feinstrumpfhose ohne Probleme die zugehörigen Spektrallinien im sichtbaren Bereich sehen. Ansonsten können Sie auch eine Leuchtstofflampe weitgehend abdecken, sodass nur eine kleine Lichtquelle übrig bleibt. Das Beugungsbild ist umso symmetrischer, je mehr Lagen des Strumpfes Sie übereinander legen. Übrigens regte ein ähnliches Experiment (allerdings mit seidenen Taschentüchern) Rittenhouse zur Erfindung des Beugungsgitters an. Betrachten wir nun eine regelmäßige, zweidimensionale Anordnung beugender Elemente, die von senkrecht einfallenden ebenen Wellen beleuchtet wird (Abb. 10.48). Jedes kleine Element wirkt als kohärente Quelle. Da die Quellen aber regelmäßig angeordnet sind, stehen die von ihnen ausgehenden Wellen zueinander in einer festen Phasenbeziehung. So tritt in bestimmten Richtungen überwiegend konstruktive Interferenz auf – natürlich dann, wenn die Abstände der beugenden Elemente von Punkt P gerade so groß sind, dass die Wellen nahezu phasengleich in P eintreffen. Diesen Effekt kann man beobachten, wenn man eine Punktquelle durch ein Stück dünnes, gitterförmiges Gewebe (etwa ein Stück aus einer Nylongardine, siehe Abb. 10.48 e) oder durch das feine Drahtmaschengitter eines Teesiebes betrachtet. Das Beugungsbild entspricht der Überlagerung zweier Beugungsmuster im rechten Winkel zueinander. In der Mitte des Bildes ist die gitterartige Struktur noch gut zu erkennen. Bei der Beschreibung eines dreidimensionalen Gitters muss man nicht prinzipiell anders vorgehen. Mit Sicherheit entstehen Interferenzmaxima an regelmäßigen räumlichen Anordnungen von Streuzentren in bestimmten Vorzugsrichtungen. Max von Laue (1879–1960) kam 1912 auf die geniale Idee, die regelmäßig angeordneten Atome in einem Kristall als dreidimensionales Gitter zu verwenden. Im sichtbaren Licht ergeben sich allerdings Schwierigkeiten: Aus der Gittergleichung (10.61) geht hervor, dass nur das Beugungsbild nullter Ordnung beobachtet werden kann, wenn die Wellenlänge des verwendeten Lichts viel größer als die Gitterkonstante (die Abstände der Streuzentren) ist. Es wird dann θi = θ0 , und es kommt zu spiegelnder Reflexion. Da der Abstand zwischen den Atomen eines Kristallgitters in der Größenordnung von Ångström (Å, 1 Å = 0,1 nm) liegt, kann sichtbares Licht nur in die spektroskopisch nutzlose nullte Ordnung gebeugt werden. Von Laue löste dieses Problem durch die Verwendung von Röntgenstrahlen, deren Wellenlängen in der Größenordnung der Atomabstände liegen (Abb. 10.49 a). Ein schmaler Röntgenstrahl, der das breite Frequenzspektrum einer Röntgenröhre enthält, wird auf einen dünnen Einkristall gerichtet. Auf der Fotoplatte entsteht ein Fraunhofermuster (Abb. 10.49 b), bestehend aus scharf lokalisierten Punkten. Diese Punkte konstruktiver Interferenz entstehen immer dort, wo der Winkel zwischen dem Röntgenstrahl und einer Schar von Atomlagen innerhalb des Kristalls das braggsche Gesetz 2d sin θ = mλ

(10.71)

10.2 Fraunhoferbeugung

(a)

959

(b)

(e)

(c)

(d)

Abb. 10.48: (a) Schirm mit regelmäßig angeordneten rechteckigen Löchern, (b) zugehöriges Fraunhofer-Muster mit weißem Licht. (c) Schirm mit regelmäßig angeordneten runden Löchern, (d) zugehöriges Fraunhofer-Muster (Fotos mit frdl. Genehmigung von The Ealing Corporation und Richard B. Hoover.) (e) Eine Punktquelle weißen Lichts, betrachtet durch ein Stück feinmaschiges Gewebe. (Foto E. H.)

erfüllt. Dabei ist zu beachten, dass man bei der Röntgenbeugung den Winkel θ üblicherweise von der Fläche, nicht von ihrer Normalen aus misst. Jede Schar von Kristallebenen beugt eine bestimmte Wellenlänge in eine bestimmte Richtung. Das Foto auf S. 960 zeigt sehr eindrucksvoll den analogen Vorgang in einer Wellenwanne. Anstatt die Wellenlänge der Strahlung bis in den Röntgenbereich zu verringern, kann man die gesamte Anordnung natürlich auch um einen Faktor von etwa einer Milliarde vergrößern. An einem räumlichen Gitter aus Metallkugeln kann man dann Mikrowellen beugen.

10 Beugung

960

Filmebene einfallender Weißlichtstrahl (a)

(b)

Einkristall

Abb. 10.49: (a) Entstehung eines Laue-Musters. (b) Röntgenbeugungsmuster für Quarz (SiO2 ).

Wasserwellen in einer Wellenwanne, die an einer regelmäßigen Anordnung von Stiften reflektiert werden. (Foto mit frdl. Genehmigung von PSSC Physics, D. C. Heath, Boston, 1960.)

10.3 Fresnelbeugung 10.3.1 Die freie Ausbreitung einer Kugelwelle In der Fraunhofernäherung ist das beugende Element relativ klein und der Beobachtungspunkt befindet sich in weiter Entfernung, sozusagen im Unendlichen. Unter diesen Umständen konnten wir einige an sich problematische Details des FresnelHuygens-Prinzips außer Acht lassen. Nun aber wollen wir uns mit dem Nahfeldbereich befassen, also mit jenem Bereich, der bis zu den beugenden Elementen heranreicht. Die in den vorangegangenen Abschnitten getroffenen Näherungen sind dann nicht mehr gültig. Aus diesem Grunde wollen wir das Fresnel-Huygens-Prinzip jetzt noch etwas genauer untersuchen. Wir betrachten also zu jedem Zeitpunkt jeden Punkt einer Wellenfront als kontinuierliche Quelle sekundärer Elementarwellen. Wenn sich aber alle Elementarwellen gleichmäßig ausbreiten, dann müsste zu jeder nach vorne fortschreitenden Wellenfront eine zweite, sich nach hinten (in Richtung Quelle) ausbreitende Front entstehen. Eine solche Front kann man experimentell nicht nachweisen. Demnach müssen wir das Abstrahlungsverhalten der Sekundärquelle ändern.

10.3 Fresnelbeugung

961

k

P

q

K (q) 0.6 0.4 0.2 k

0.2 0.4 0.6 0.8 -0.2 sekundäre Elementarwelle

-0.4 -0.6 Wellenfront

(a)

primäre Welle

q

P

(b)

Abb. 10.50: (a) Sekundäre Elementarwellen. (b) Der Neigungsfaktor K(θ).

Zur Beschreibung der „Gerichtetheit“ sekundärer Quellen führen wir eine Funktion K(θ) ein, den Schrägheits- oder Neigungsfaktor. Dass man eine solche Größe braucht, erkannte schon Fresnel, der sich allerdings nicht weiter damit befasste, außer Vermutungen über die Form der Funktion anzustellen.15 Es blieb dem eher analytisch arbeitenden Kirchhoff vorbehalten, einen konkreten Ausdruck für die Funktion anzugeben. Wie wir in Abschnitt 10.4 genauer diskutieren werden, ist dies 1 (1 + cos θ) . (10.72) 2 Dabei ist θ der Winkel zwischen der Normalen und der primären Wellenfront k (Abb. 10.50). Das Maximum der Funktion, K(0) = 1, liegt in der Vorwärtsrichtung; gleichzeitig verschwindet die rückwärts laufende Welle, weil K(π) = 0 ist. K(θ) =

Untersuchen wir jetzt die freie Ausbreitung einer monochromatischen Kugelwelle, die von einer Punktquelle S ausgeht. Wenn das Fresnel-Huygens-Prinzip korrekt ist, dann sollten wir durch Summation aller im Punkt P ankommenden sekundären Elementarwellen die ungestörte primäre Wellenfront erhalten können. Im Zuge der Bearbeitung dieses Problems werden wir auch eine neue, sehr nützliche Methode entwickeln. 15

Lassen wir Fresnel selbst zu Wort kommen (ohne zu vergessen, dass der Forscher Licht als elastische Schwingung im Äther betrachtete): „Da der Impuls, der jedem Teil der primitiven Welle mitgeteilt wird, in Richtung der Normalen liegt, sollte die Bewegung, die durch jeden von ihnen dem Äther aufgeprägt zu werden scheint, in dieser Richtung intensiver sein als in jeder anderen. Die ausgehenden Strahlen wären dann, für sich betrachtet, umso weniger intensiv, je weiter sie von dieser Richtung abweichen. [..] Die Untersuchung des Gesetzes, gemäß dem sich die Intensität der Strahlen um jedes Zentrum herum ändert, ist sicher schwierig; . . . “

10 Beugung

962

0

3

1 2

Abb. 10.51: Zur Ausbreitung einer Kugelwellenfront.

Wir betrachten Abbildung 10.51. Die Kugeloberfläche entspricht der Primärwellenfront zu einem beliebigen Zeitpunkt t nach ihrem Start in der Quelle S zum Zeitpunkt t = 0. Die Störung mit dem Radius ρ lässt sich durch jeden mathematischen Ausdruck darstellen, der eine harmonische Kugelwelle beschreibt, z. B. durch   ε0 cos ωt − kρ . (10.73) E= ρ In der Abbildung wurde die Wellenfront in eine Reihe ringförmiger Zonen unterteilt. Die Grenzen dieser Ringe entsprechen den Schnittlinien der Wellenfront mit konzentrischen Kugeln, deren Mittelpunkte in P liegen und deren Radien gegeben sind durch r0 +λ/2, r0 +λ, r0 +3λ/2 usw. Diese Zonen heißen Fresnelzonen (Halbperiodenzonen). Zu jeder sekundären Punktquelle in einer bestimmten Zone gehört eine weitere Punktquelle in der benachbarten Zone, deren Abstand von P gerade um λ/2 größer ist. Da nun jede Zone zwar klein ist, aber eine endliche Ausdehnung hat, können wir ein ringförmiges Flächenelement dS definieren (Abb. 10.52). Alle Punktquellen innerhalb von dS sind kohärent, und wir nehmen an, dass sie alle phasengleich mit der Primärwelle in Gleichung (10.73) emittieren. Diese Elementarwellen legen einen Weg r bis zum Punkt P zurück, den sie zu einem Zeitpunkt t phasengleich erreichen; die Phase ist ωt − k(ρ + r). Die Amplitude der Primärwelle im Abstand ρ von der Quelle S ist ε0 /ρ; die Quellstärke pro Flächeneinheit εA der Sekundärquellen sei proportional zu ε0 /ρ, also εA = Qε0 /ρ. Der Gesamtbeitrag der sekundären Quelle auf dS zur optischen Störung in P ist daher εA cos [ωt − k (ρ + r)] dS . (10.74) dE = K r Der Neigungsfaktor kann nur langsam variieren, weshalb wir ihn innerhalb einer Fresnelzone als konstant betrachten können. Um nun dS als Funktion von r zu erhalten, schreiben wir dS zunächst in Polarkoordinaten: dS = ρ dϕ 2π (ρ sin ϕ) .

10.3 Fresnelbeugung

963

-te Zone 0

Abb. 10.52: Zur Ausbreitung einer Kugelwellenfront.

Unter Verwendung des Kosinussatzes erhalten wir r 2 = ρ2 + (ρ + r0 )2 − 2ρ(ρ + r0 ) cos ϕ und daraus nach Ableitung 2r dr = 2ρ(ρ + r0 ) sin ϕ dϕ bei konstantem ρ und r0 . Wir setzen nun für dϕ seinen Wert ein und erhalten für das Flächenelement dS ρ r dr . (10.75) dS = 2π (ρ + r0 ) Der Beitrag der l-ten Zone zur Störung in P ist damit ˆ rl εA ρ cos [ωt − k(ρ + r)] dr El = Kl 2π (ρ + r0 ) rl−1 und nach Integration El =

r=rl −Kl εA ρλ

sin(ωt − kr − kρ) . (ρ + r0 ) r=rl −1

Durch Einführung der Beziehungen rl−1 = r0 + (l − 1)λ/2 und rl = r0 + lλ/2 vereinfacht sich obiger Ausdruck (siehe Aufgabe 10.69) zu El = (−1)l+1

2Kl εA ρλ sin [ωt − k(ρ + r0 )] . (ρ + r0 )

(10.76)

Die Amplitude von El wird abwechselnd positiv und negativ, je nachdem, ob l gerade oder ungerade ist. Dies bedeutet, dass die Beiträge benachbarter Zonen außer Phase sind und einander mehr oder weniger auslöschen. Hier kommt der Neigungsfaktor ins

10 Beugung

964

Spiel: Mit steigendem l nimmt θ zu und infolgedessen K ab. Die Beiträge benachbarter Zonen löschen einander daher nicht vollkommen aus. Interessanterweise ist El /Kl von allen Ortsvariablen unabhängig. Die Flächen benachbarter Zonen sind zwar nahezu gleich, aber sie werden mit steigendem l langsam größer – das bedeutet, die Zahl der emittierenden Quellen nimmt zu. Zugleich wächst aber auch der mittlere Abstand der Zonen von P , sodass Kl /El gerade konstant bleibt (Aufgabe 10.70). Die Summe der Beiträge aller m Zonen zur optischen Störung in P ist E = E1 + E2 + E3 + · · · + Em und aufgrund der alternierenden Vorzeichen können wir auch schreiben E = |E1 | − |E2 | + |E3 | − · · · ± |Em | .

(10.77)

Ist m ungerade, dann lässt sich die Reihe auf zwei Arten umschreiben, nämlich entweder     |E1 | |E3 | |E3 | |E5 | |E1 | + − |E2 | + + − |E4 | + + ··· E= 2 2 2 2 2   |Em | |Em | |Em−2 | − |Em−1 | + + (10.78) + 2 2 2 oder     |E2 | |E4 | |E2 | |E4 | |E6 | − − |E3 | + − − |E5 | + 2 2 2 2 2   |Em−1 | |Em−1 | |Em−3 | − |Em−2 | + − + |Em | . (10.79) + ··· + 2 2 2

E = |E1 | −

Nun gibt es zwei Möglichkeiten: Entweder ist |El | größer als das arithmetische Mittel der beiden Nachbarwerte |El−1 | und |El+1 |, oder es ist kleiner. Grundsätzlich ist dies eine Frage der Änderungsrate von K(θ) mit θ. Ist |El−1 | + |El+1 | , 2 so wird jeder der eingeklammerten Terme in den obigen Reihen negativ. Aus Gleichung (10.78) folgt dann |El | >

|E1 | |Em | + , 2 2 und aus Gleichung (10.79) folgt E
|E1 | −

|E2 | |Em−1 | − + |Em | . 2 2

(10.80)

(10.81)

10.3 Fresnelbeugung

965

Da sich der Neigungsfaktor über sehr viele Zonen hinweg von 1 nach 0 ändert, können wir die Änderung von einer Zone zur nächsten vernachlässigen: |E1 | ≈ |E2 | und |Em−1 | ≈ |Em |. Mit dieser Näherung wird Gleichung (10.81) zu |E1 | |Em | + . 2 2 Aus den Gleichungen (10.80) und (10.82) schließen wir damit auf E>

|E1 | |Em | + . 2 2 Dasselbe Resultat erhalten wir, wenn E≈

|El |
Δtc , wodurch die tatsächlich beobachtete Korrelation einen Faktor Δtc /T erhält: ΔI1 (t)ΔI2 (t) = I1 I2 7

Δtc |! γ12 (0)|2 . T

(12.36)

Mit modernen Detektoren erreicht man mittlerweile Zeitauflösungen von weniger als 10−10 s.

12.5 Kohärenz und Stellarinterferometrie

1155

PM2

gefiltertes Hg-Licht

I2(t) Strahlteiler h

PM1 I1(t) Verstärker mit Bandbegrenzung D I1

Verstärker mit Bandbegrenzung D I2 Korrelator D I1 D I2 Integrator á D I1 D I2 ñ

Abb. 12.21: Der Versuch von Hanbury-Brown und Twiss.

Im oben beschriebenen Experiment hatte das gefilterte Quecksilberlicht eine Kohärenzzeit von ≈ 1 ns und die reziproke Durchlassbandbreite oder effektive Integrationszeit der Elektronik betrug ≈ 40 ns. Beachten Sie, dass sich die Gleichungen (12.35) und (12.36) nicht prinzipiell unterscheiden, Letztere ist lediglich etwas realitätsnäher. Kurz nach Beendigung ihres erfolgreichen Laborversuchs konstruierten HanburyBrown und Twiss das in Abbildung 12.20 gezeigte Stellarinterferometer. Das Sternenlicht wurde mithilfe zweier Schweinwerferspiegel gesammelt und jeweils auf Photovervielfacher fokussiert. Ein Zweig enthielt ein Verzögerungskabel, damit man die Spiegel physikalisch auf gleicher Höhe anbringen, dabei aber jegliche Laufzeitunterschiede des Lichts ausgleichen konnte. Durch Messung von ΔI1 (t)ΔI2 (t) T bei verschiedenen Abständen der Detektoren erhielt man das Betragsquadrat des Kohärenzgrades, |! γ12 (0)|2 , und daraus den Winkeldurchmesser der Quelle (ähnlich wie beim Michelson-Stellarinterferometer). Im Gegensatz zum Michelson-Gerät konnten jetzt allerdings auch sehr große Abstände h gewählt werden, weil man sich nicht um die Phasen der Wellen kümmern musste. Beim Michelson-Stellarinterferometer hatte eine leichte Verschiebung eines Spiegels um den Bruchteil einer Wellenlänge fatale Folgen, das Hanbury-Brown-Interferometer dagegen berücksichtigt die Phase nicht, und die Spiegel müssen nicht einmal von hoher optischer Qualität sein. Der erste untersuchte Stern war Sirius, dessen Winkeldurchmesser mit 0,0069 Bogensekunden gemessen wurde. Später errichtete man in Narrabri (Australien) ein Korrelationsinterferometer mit einer Grundlinie von 188 m. Damit lassen sich sogar Winkeldurchmesser von 0,0005 Bogensekunden messen – wie wenig das ist, erkennt man im Vergleich mit dem erwähnten Durchmesser des Beteigeuze (0,047 Bogensekunden).8 8

Erläuterungen zum Photonenaspekt der Bestrahlungsstärke-Korrelation findet man in Garbuny, Optical Physics, Abschnitt 6.2.5.2, oder in Klein, Optics, Abschnitt 6.4.

12 Grundlagen der Kohärenztheorie

Korrelation

1156

−4

−2

0 2 h (mm)

4

Abb. 12.22: Korrelationsfunktion für eine pseudothermische Quelle. (Aus A. B. Haner und N. R. Isenor, Am. J. Phys. 38 (1970) 748.

Wäre das einfallende Licht nahezu monochromatisch und von wesentlich höherer Flussdichte, so könnte man die zur Untersuchung der Bestrahlungsstärke-Korrelation verwendete Elektronik stark vereinfachen. Zwar ist Laserlicht nichtthermisch und zeigt daher nicht die gleichen statistischen Schwankungen, man kann es aber zur Erzeugung von pseudothermischem9 Licht verwenden. Eine pseudothermische Lichtquelle besteht aus einer gewöhnlichen hellen Quelle (am besten einem Laser) und einem bewegten Medium inhomogener optischer Dicke, etwa einer rotierenden Milchglasscheibe. Untersucht man das Streulicht, das aus einer ruhenden Mattglasscheibe austritt, mit einem hinreichend langsamen Detektor, so sind die Fluktuationen der Bestrahlungsstärke vollständig geglättet. Lässt man die Scheibe rotieren, dann schwankt die Bestrahlungsstärke mit einer simulierten Kohärenzzeit, die der Drehgeschwindigkeit des Glases entspricht. So erhält man eine hervorragende thermische Lichtquelle mit variablem Δtc (von etwa 1 s bis 10−5 s), mit deren Hilfe man verschiedenste Kohärenzeffekte untersuchen kann. Abbildung 12.22 z. B. zeigt die Korrelationsfunktion für eine pseudothermische Lichtquelle mit kreisförmiger Apertur. Sie ist proportional zu [2J1 (u)/(u)]2 und wurde aus Schwankungen der Bestrahlungsstärke bestimmt. Die Versuchsanordnung ist ähnlich wie in Abbildung 12.21, die Elektronik ist allerdings bedeutend einfacher.10

9

10

Siehe dazu W. Martienssen und E. Spiller, „Coherence and Fluctuations in Light Beams“, Am. J. Phys. 32 (1964) 919 oder A. B. Haner und N. R. Isenor, „Intensity Correlations from Pseudothermal Light Sources“, Am. J. Phys. 38 (1970) 748. Eine gute Lektüre zu den Themen dieses Kapitels ist der Übersichtsartikel „Coherence Properties of Optical Fields“, L. Mandel und E. Wolf, Revs. Modern Phys. 37 (1965) 231, der allerdings nicht leicht zu verstehen ist. Siehe auch K. I. Kellermann, „Intercontinental Radio Astronomy“, Sci. Am. 226 (Februar 1972) 72.

Aufgaben

1157

Aufgaben Lösungen zu den Aufgaben ohne ∗ finden Sie am Ende des Buches. 12.1* Zwei monochromatische Punktquellen strahlen in Phase. In der gewöhnlichen, entfernten Beobachtungsebene (parallel zu der Linie, welche die Punktquellen verbindet) ist die Bestrahlungsstärke von einer der beiden Quellen 100-mal so stark wie die der anderen. Zeigen Sie, dass für das Streifenmuster allgemein gilt Imax =

2 I1 + I2

und

Imin =

2 I1 − I2 .

Skizzieren Sie den Verlauf der Nettobestrahlungsstärke in Abhängigkeit vom Abstand von der zentralen Achse. Wie sieht das Muster aus? Bestimmen Sie die Sichtbarkeit. 12.2* Betrachten Sie noch einmal Abbildung 12.3 und zeigen Sie, dass für zwei inkohärente cos2 -Streifensysteme der Form I0 cos2 α, die sich so überlappen, dass die Maxima des einen mit den Minima des anderen zusammentreffen, die Resultierende I = I0 ist, also eine gleichmäßige Beleuchtung. 12.3* Zeigen Sie, dass die Näherung (12.2),  Ac ≈

λ0 θs

2

vernünftig ist. Nähern Sie dann As durch d2s und zeigen Sie, dass 2

Ac ≈

l 2 λ0 . As

Beachten Sie, dass Ac größer wird, wenn l größer wird. 12.4* Eine kleine thermische Quelle von monochromatischem Licht mit einer mittleren Wellenlänge von 500 nm und einer Fläche von 1,0 × 10−6 m2 bestrahlt einen lichtundurchlässigen Schirm, der zwei winzige Löcher von je 0,10 mm Durchmesser hat. Zwei Meter vor diesem Schirm befindet sich eine scheibenförmige, gleichmäßig strahlende Quelle. Bestimmen Sie die Größenordnung der Kohärenzfläche. 12.5* Sei Ωs der Raumwinkel, der von der Quelle ausgeleuchtet wird, wenn diese vom Zentrum des Blendenschirms aus betrachtet wird. Zeigen Sie, dass 2

Ac ≈

λ0 Ωs

die Kohärenzfläche repräsentiert. Diese Gleichung ist nützlich, wenn wir den Abstand zur Quelle nicht kennen. Beachten Sie, dass die Kohärenzfläche umso größer ist, je kleiner die Quelle ist. 12.6* Die Sonnenscheibe bildet von der Erdoberfläche aus gesehen einen Winkel von etwa 9,3 × 10−3 rad. Angenommen, das Sonnenlicht wird gefiltert und hat danach eine mittlere Wellenlänge von 550 nm. Wie groß ist dann ungefähr die Kohärenzfläche auf

12 Grundlagen der Kohärenztheorie

1158

einem Blendenschirm, der sich auf der Erde befindet? Wie weit sind die Löcher in diesem Blendenschirm voneinander entfernt, wenn die Interferenzstreifen verschwinden, die sie ansonsten erzeugen? [Hinweis: Schauen Sie sich Aufgabe 12.5 an.] 12.7* Obwohl die Kohärenzfläche wächst, wenn Σa sich von Σs entfernt, gibt es eine Größe, die unverändert bleibt – dies ist der Raumwinkel Ωc , welcher der Kohärenzfläche im Zentrum der Quelle gegenüberliegt. Verifizieren Sie die Gültigkeit der Beziehung 2

Ωc ≈

λ0 As

für ein weit entferntes Objekt wie etwa einen Stern. Wenn sich der Blendenschirm Σa von Σs weg bewegt, dann schneidet er den Kegel des Raumwinkels, wobei der Wert von Ac immer größer wird. 12.8

An einem Michelson-Interferometer, beleuchtet mit dem Licht einer Quecksilberdampflampe, entsteht ein Interferenzmuster. Erläutern Sie, wie sich das Muster verändert, während der Dampfdruck des Quecksilbers nach dem Einschalten der Lampe bis auf einen stationären Betriebswert steigt.

12.9* Wir wollen die Bestrahlungsstärke untersuchen, die beim youngschen Doppelspaltversuch entsteht, wenn die Spalte gleichzeitig von zwei monochromatischen ebenen Wellen E1 und E2 geringfügig verschiedener Frequenz beleuchtet werden. Skizzieren Sie die Wellen als Funktion der Zeit mit λ1 = 0,8λ2 . Tragen Sie nun das Produkt E1 E2 in einem Punkt P in Abhängigkeit von der Zeit auf. Was können Sie über den Mittelwert des Produkts über einem relativ langen Zeitraum aussagen? Beschreiben Sie (E1 + E2 )2 und vergleichen Sie dies mit (E12 + E22 ). Bestimmen Sie eine Näherung für (E1 + E2 )2 T in einem Intervall, das lang ist im Vergleich zur Periodendauer der Wellen. 12.10* In Aufgabe 12.9 haben wir einen Punkt P während eines Zeitintervalls betrachtet. Nun wollen wir die räumliche Verteilung der Bestrahlungsstärke zu einem bestimmten Zeitpunkt untersuchen. Die einzelnen Wellen erzeugen die Bestrahlungsstärkeverteilungen I1 und I2 . Tragen Sie diese auf der gleichen Raumachse auf und zeichnen Sie dazu ihre Summe (I1 + I2 ) ein. Diskutieren Sie Ihre Ergebnisse und vergleichen Sie mit Abbildung 7.16. Wie verändert sich die resultierende Bestrahlungsstärke, wenn noch mehr Wellen mit verschiedenen Frequenzen hinzukommen? Erläutern Sie dies unter Bezug auf die Kohärenzlänge. Was passiert mit dem Muster, wenn die Frequenzbandbreite (hypothetisch) gegen unendlich geht? 12.11 Im Hinblick auf die Ergebnisse von Aufgabe 12.10 betrachten wir noch einmal die Autokorrelation einer Sinusfunktion (Abb. 11.51). Ein Signal bestehe aus sehr vielen sinusförmigen Komponenten. Skizzieren Sie die Autokorrelation dieses Signals, zunächst für drei bis vier Komponenten, wie in Abbildung 11.51 e. Wie sieht die Autokorrelationsfunktion aus, wenn die Anzahl der Komponenten sehr groß wird und das Signal statistischem Rauschen ähnelt? Welche Bedeutung hat der Punkt τ = 0? Vergleichen Sie Ihre Antworten mit Aufgabe 12.10. 12.12* Wir betrachten die Versuchsanordnung in Abbildung 12.8. Berechnen Sie die Sichtbarkeit, wenn der Abstand zwischen je zwei Interferenzmaxima 1 mm beträgt und die Breite des auf dem Schirm abgebildeten Spaltes dort 0,5 mm ist.

Aufgaben

1159

12.13 Gegeben sei eine Anordnung mit spaltförmiger Lichtquelle und Lochscheibe (Abbildung A.12.13). Zeigen Sie durch Integration über die Quelle: I(Y ) ∝ b +

sin(πa/λl)b cos(2πaY /λs) . πa/λl Y

y

P S2

S S

a

O S1

b l

s Σo

Abb. A.12.13

12.14 Leiten Sie Gleichung (12.22) für die Sichtbarkeit mit allen Zwischenschritten her. 12.15 Wann ist die Bestrahlungsstärke auf Σo in Abbildung A.12.15 gleich 4I0 ? I0 ist die Bestrahlungsstärke, die von nur einer der beiden inkohärenten Punktquellen stammt.

S2 S S 

O  O

S1 Σo

Abb. A.12.15

12.16* Angenommen, wir verwenden als Lichtquelle für den youngschen Doppelspaltversuch eine Natriumdampflampe (λ0 = 589,3 nm), vor die wir einen Schirm mit einer runden Öffnung des Durchmessers 0,1 mm stellen. Der Abstand zwischen der Lichtquelle und den Spalten betrage 1 m. Wie weit müssen die Spalte auseinander liegen, damit das Interferenzmuster verschwindet? 12.17* Betrachten Sie das in Abbildung 9.10 skizzierte youngsche Experiment. Thermisches, monochromatisches Licht, gefiltert zu einem Mittelwert von 500 nm, trifft von links auf das Loch im Quellenschirm, das einen Durchmesser von 0,10 mm hat. Wie weit voneinander entfernt können die beiden Öffnungen im Blendenschirm höchstens sein, wenn die Streifen erscheinen? Die Quelle ist 1,0 m vom Blendenschirm entfernt. 12.18 Zeigen Sie, dass die Gleichungen (12.34) und (12.35) aus den Gleichungen (12.32) und (12.33) folgen. 12.19* Teilen Sie Gleichung (12.21) in einen kohärenten und einen inkohärenten Beitrag auf. Der erste Beitrag kommt durch die Superposition der beiden kohärenten Wellen mit Bestrahlungsstärken von |! γ12 (τ )|I1 und |! γ12 (τ )|I2 mit einer relativen Phase von α12 (τ ) − ϕ zustande, der zweite durch die Superposition der inkohärenten Wellen mit

12 Grundlagen der Kohärenztheorie

1160

Bestrahlungsstärken von [1 − |! γ12 (τ )|]I1 und [1 − |! γ12 (τ )|]I2 . Leiten Sie Beziehungen ab für Ikoh /Iinkoh und Iinkoh /Igesamt . Diskutieren Sie die physikalische Bedeutung dieser alternativen Formulierung. Was sagt sie hinsichtlich der Sichtbarkeit der Streifen aus? 12.20 Im youngschen Doppelspaltversuch soll eines der beiden Löcher von einem neutralen Schwärzungsfilter verdeckt sein, welcher die Bestrahlungsstärke um den Faktor 10 verringert. Das andere Loch wird mit einem Stück Glas abgedeckt, sodass keine Phasenverschiebung auftritt. Berechnen Sie die Sichtbarkeit für den (hypothetischen) Fall vollständig kohärenter Beleuchtung. 12.21* Die Anordnung im youngschen Doppelspaltversuch werde mit Sonnenlicht (mittlere Wellenlänge: 550 nm) beleuchtet. Bestimmen Sie den Abstand der Spalte, bei dem die Streifen verschwinden. 12.22* Betrachten Sie noch einmal Abbildung 12.8 und die breite, quasimonochromatische, lange, rechteckige Lichtquelle (λ0 = 500 nm). Nehmen Sie an, dass die beiden beweglichen, schmalen Blendenspalte zunächst einen Abstand von nahe null voneinander haben, der dann allmählich vergrößert wird. Wie groß muss der Abstand mindestens werden, damit das Streifenmuster auf Σo erstmals sichtbar wird? Die Quelle befindet sich 1,0 m vor dem Blendenschirm und die Breite der Quelle ist 0,1 mm. 12.23* Betrachten Sie noch einmal Abbildung 12.8 und die breite, quasimonochromatische Spaltquelle. Wie breit sollte diese Quelle sein, damit die Sichtbarkeit des Streifens 0,9 ist? Die Quelle befindet sich 1,0 m vor dem Blendenschirm und es gilt λ0 = 550 nm. Der Spaltabstand beträgt 0,20 mm. 12.24 Wir wollen eine Anordnung mit zwei Löchern konstruieren, die von einer gleichförmigen, quasimonochromatischen, inkohärenten Spaltquelle mit einer mittleren Wellenlänge von 500 nm beleuchtet werden. Die Breite der Spaltquelle sei b, ihr Abstand zum Blendenschirm betrage 1,5 m. Wie groß darf b sein, wenn die Löcher 0,50 mm weit auseinander liegen, damit die Sichtbarkeit der Interferenzstreifen in der Beobachtungsebene mindestens 85% beträgt? 12.25* Stellen wir uns eine inkohärente, quasimonochromatische, gleichförmige thermische Spaltquelle vor (etwa eine Entladungslampe, davor eine Maske und ein Filter). Wir wollen damit ein Gebiet auf einem 10,0 m entfernten Blendenschirm beleuchten; dabei soll der Absolutbetrag des komplexen Kohärenzgrades in jedem 1,00 mm breiten Gebiet des Schirms nicht kleiner als 90% werden. Wie breit darf der Spalt bei einer Wellenlänge des Lichts von 500 nm sein?

α1 S1

α2

S2

a

Σa l

s Σ0

Abb. A.12.26

Aufgaben

1161

12.26* Abbildung A.12.26 zeigt zwei inkohärente, quasimonochromatische Punktquellen, die zwei Öffnungen in einer Maske beleuchten. Zeigen Sie, dass die Sichtbarkeit der Interferenzstreifen in der Beobachtungsebene minimal wird für a(α2 − α1 ) = 12 m ,

m = ±1, ±3, ±5, . . . .

12.27 Wir betrachten eine breite, quasimonochromatische Lichtquelle (λ = 500 nm), bestehend aus einer Reihe vertikaler, inkohärenter, unendlich schmaler Linienquellen im Abstand von je 500 µm. Damit beleuchten wir zwei außerordentlich schmale vertikale Spalte in einem 2,0 m entfernten Blendenschirm. Wie weit müssen die beiden Spalte voneinander entfernt sein, damit ein Streifenmuster maximaler Sichtbarkeit entsteht? 12.28* Weiter vorn hatten wir in einem Beispiel dc ≈ λ0 /θs verwendet, um eine Näherung für den lateralen Kohärenzabstand von Sonnenlicht zu berechnen. Bestimmen Sie nun die gleiche Größe, den Durchmesser der Kohärenzfläche für eine kreisrunde thermische Quelle, unter Verwendung der Konzepte, die zu Gleichung (12.31) führten. 12.29* Betrachten Sie das Michelson-Sterninterferometer. Unter welchen Bedingungen werden die Streifen verschwinden, wenn das Licht von zwei gleich hellen Sternen kommt? Vergleichen Sie dies mit der Situation, in der es nur einen gleichmäßig hellen Stern mit einem adäquaten Winkeldurchmesser gibt. Schreiben Sie für beide Fälle Ausdrücke für die Raumwinkel auf, die von den beiden Quellen in dem Instrument erfasst werden. 12.30* Bei der Untersuchung des Sterns Arcturus mit einem Michelson-Sterninterferometer verschwinden die Streifen, wenn der Abstand zwischen den beiden Spiegel auf 7,3 m eingestellt wird. Wenn das Licht eine mittlere Wellenlänge von 500 nm hat, wie groß ist dann der Raumwinkel (in Bogensekunden), unter dem der Stern von der Erde aus erscheint?

13 Moderne Optik 13.1 Laser und Laserstrahlung In den frühen 1950er-Jahren wurde der Maser erfunden, ein bemerkenswertes Gerät, an dessen Entwicklung eine Reihe von Wissenschaftlern beteiligt war. Die entscheidenden Beiträge leisteten der US-Amerikaner Charles Hard Townes sowie Alexander Michailowitsch Prochorow und Nikolai Gennadiewitsch Basow aus der Sowjetunion. 1964 teilten sich diese drei Forscher den Nobelpreis für Physik. Maser ist ein Akronym für Microwave Amplification by Stimulated Emission of Radiation; es handelt sich also um einen extrem rauscharmen Mikrowellenverstärker.1 Die Funktion des Masers beruhte, für damalige Verhältnisse höchst ungewöhnlich, auf der quantenmechanischen Wechselwirkung zwischen Materie und Strahlungsenergie. Fast unmittelbar nach der Einführung des Masers spekulierte man, ob und wie diese Technik auch im optischen Spektralbereich Anwendung finden könnte. 1958 sagten Townes und Arthur L. Schawlow voraus, unter welchen Bedingungen man eine derartige Lichtverstärkung durch induzierte Emission von Strahlung (Light Amplification by Stimulated Emission of Radiation) erreichen sollte. Im Juli 1960 schließlich berichtete Theodore H. Maiman über den ersten erfolgreichen Betrieb eines solchen optischen Masers oder Lasers – zweifellos war dies einer der Meilensteine in der Geschichte der Optik, wenn nicht in der Geschichte der Naturwissenschaften überhaupt. Ein Laser ist ein quantenmechanisches Gerät, das eine außergewöhnliche Art von Licht erzeugt, wobei die Wechselwirkung von Atomen mit elektromagnetischer Strahlung direkt ausgenutzt wird. Bevor wir uns grundlegende, wenn auch keinesfalls vollständige Kenntnisse über die Arbeitsweise eines Lasers aneignen, wollen wir „gewöhnlichere“ thermische Lichtquellen wie Glühbirnen und Sterne besprechen. Dies erfordert zunächst eine Einführung in die Theorie der Schwarzkörperstrahlung, doch die Einblicke, die wir dabei gewinnen, sind von grundlegender Bedeutung für jedwede Wechselwirkung zwischen elektromagnetischer Strahlung und Materie. Anschließend werden wir die Boltzmann-Verteilung in ihrer Anwendung auf atomare Energieniveaus diskutieren. Darauf aufbauend, können wir dann die Funktionsweise der induzierten Emission (mithilfe der Einstein-Koeffizienten A und B) verstehen. 1

Siehe James P. Gorden, „The Maser“, Sci. Am. 199 (Dez. 1958) 42. – Interessant ist auch das Buch „How the Laser Happened“, ein autobiographisch angelegter Bericht von Charles H. Townes. Oxford University Press, Oxford, 1999 (Anm. d. Ü.).

https://doi.org/10.1515/9783111025599-013

1164

13 Moderne Optik

13.1.1 Strahlungsenergie und Materie im Gleichgewicht Der kirchhoffsche Strahlungssatz Licht – also Strahlungsenergie – ist ein grundlegendes physikalisches Phänomen. Daher verwundert es keineswegs, dass die Ergründung der wahren Natur des Lichts in der Geschichte der Physik eine ständige Herausforderung war und dass die Lösung dieses Problems die gesamte Naturwissenschaft auf den Kopf stellen konnte. Die frühesten Wurzeln der Quantentheorie reichen bis 1859 zurück, als ein scheinbar rätselhaftes Phänomen untersucht wurde: die Schwarzkörperstrahlung. Im gleichen Jahr, als Charles Darwin seine Entstehung der Arten durch natürliche Zuchtwahl veröffentlichte, legte Robert Kirchhoff eine intellektuelle Herausforderung vor, die die Physik revolutionieren sollte. Kirchhoff beschäftigte sich damals mit der Art und Weise des Austauschs von Strahlungsenergie zwischen Körpern, die sich im thermischen Gleichgewicht befinden. Die Quelle dieser so genannten thermischen Strahlung, einer von allen Körpern abgegebenen Form elektromagnetischer Energie, ist die Zufallsbewegung der Atome. Kirchhoff charakterisierte die Fähigkeit eines Körpers, elektromagnetische Energie aufzunehmen und abzugeben, mithilfe des Emissionskoeffizienten ελ und des Absorptionskoeffizienten αλ . Dabei gibt ελ die pro Flächen- und Zeiteinheit emittierte Energie in einem winzigen Wellenlängenbereich um λ an (Einheit: W/m2 /m). Die thermische Strahlung umfasst stets einen breiten Frequenzbereich, und jedes Energiemessgerät lässt natürlich einen gewissen Wellenlängenbereich durch. Des Weiteren ist αλ der Anteil der einfallenden Strahlungsenergie, der vom betreffenden Körper pro Flächen- und Zeiteinheit im gegebenen Wellenlängenbereich absorbiert wird. Sowohl der Emissions- als auch der Absorptionskoeffizient hängt von der Beschaffenheit der Oberfläche des Körpers (Farbe, Textur usw.) sowie von der Wellenlänge der einfallenden Strahlung ab. Wir betrachten einen isolierten Hohlraum im thermischen Gleichgewicht bei einer Temperatur T . Sehr wahrscheinlich ist ein solcher Raum von Strahlungsenergie sehr vieler verschiedener Wellenlängen erfüllt – denken Sie etwa an einen Ofen mit glühenden Kohlen. Kirchhoff suchte nun nach einer Verteilungsfunktion Iλ (λ), die von T abhängt und die abgestrahlte Energie pro Flächen- und Zeiteinheit bei jeder Wellenlänge angibt. Wir nennen Iλ (λ) die spektrale Flussdichte (innerhalb des Hohlraums) oder den spektralen Emissionsgrad (bezogen auf die Strahlung, die den Hohlraum verlässt). Kirchhoff folgerte, dass der Quotient aus der gesamten von den Wänden absorbierten Energiemenge (bei allen Wellenlängen) und der von den Wänden emittierten Energiemenge konstant sein muss, da sich ansonsten die Temperatur ändern müsste, was nicht zutrifft. Weiter argumentierte er, dass dieses Gleichgewicht für jede einzelne Wellenlänge auch dann gelten müsse, wenn die Wände des Hohlraums aus unterschiedlichen Materialien (mit unterschiedlichem Temperaturverhalten) bestehen. Die bei λ absorbierte Energie αλ Iλ muss gleich der

13.1 Laser und Laserstrahlung

1165

abgestrahlten Energie ελ sein, und zwar unabhängig von den Eigenschaften des Materials. Der kirchhoffsche Strahlungssatz lautet demnach ελ = Iλ . (13.1) αλ Iλ (Einheit: J/m3 · s oder W/m3 ) ist eine universelle Funktion, die nur von T und λ abhängt, nicht von den Wänden (Material, Farbe, Größe und Gestalt) des Hohlraums. Dieses Ergebnis ist in der Tat bemerkenswert! Allerdings hatte der britische Keramikhersteller Thomas Wedgwood bereits 1792 angemerkt, dass alle Objekte in einem Brennofen gleichzeitig mit den Wänden des Ofens rot zu glühen beginnen, unabhängig von ihrer Art, Größe und Form. Eine allgemeine Form der Energieverteilungsfunktion konnte Kirchhoff nicht liefern. Er beobachtete aber, dass ein ideal absorbierender Körper mit αλ = 1 schwarz erscheint und dass in diesem speziellen Fall Iλ = ελ gilt. Die Verteilungsfunktion für einen idealen schwarzen Körper ist außerdem gleich derjenigen für einen isolierten Hohlraum bei derselben Temperatur. (Einen schwarzen Körper stellen Sie sich am besten im Gleichgewicht innerhalb eines heißen Ofens vor.) Die Verteilung der Strahlungsenergie innerhalb eines isolierten Hohlraums im thermischen Gleichgewicht ist in jeder Hinsicht identisch mit der Verteilung der Energie, die von einem idealen schwarzen Körper derselben Temperatur ausgesendet wird. Zusammenfassend folgern wir: Die Energie, die durch ein kleines Loch aus einem solchen Hohlraum austritt, ist gleich der Energie, die ein schwarzer Körper derselben Temperatur aussendet. Viele Wissenschaftler nahmen die Herausforderung an, Iλ experimentell zu bestimmen. Sie sahen sich jedoch zahlreichen technischen Problemen gegenüber, die nur langsam gelöst wurden. Der Versuchsaufbau (Abb. 13.1 a) ist im Prinzip nicht kompliziert, aber man fand lange Zeit keine zuverlässige Strahlungsquelle. Da man Daten gewinnen muss, die nicht von der Bauweise des verwendeten Detektors abhängen, bietet es sich an, die Strahlungsenergie pro Zeiteinheit zu erfassen, welche den Detektor pro Flächeneinheit (des Eintrittsfensters) und pro Einheitsintervall der Wellenlänge (entsprechend dem Durchlass des Gerätes) erreicht. In Abbildung 13.1 b sehen Sie verschiedene Kurven von Iλ als Funktion der Wellenlänge, jeweils bei einer bestimmten Temperatur, die auf diese Weise erhalten wurden. Das Stefan-Boltzmann-Gesetz 1865 veröffentlichte John Tyndall verschiedene Ergebnisse experimenteller Untersuchungen. Er hatte unter anderem festgestellt, dass ein erhitzter Platindraht bei 1200 ◦ C (1473 K) 11,7-mal soviel Energie emittierte wie bei 525 ◦ C (798 K). 1879 fiel Josef Stefan auf, dass das Verhältnis von (1473 K)4 zu (798 K)4 gleich 11,6 ist, also nahe an 11,7. Stefan vermutete daraufhin, dass die Gesamtstrahlung eines Körpers proportional zu T 4 ist. Stefan hatte Recht, allerdings auch Glück, denn Tyndalls Platindraht war natürlich alles andere als ein schwarzer Körper. Ludwig Boltzmann gelang es 1884,

13 Moderne Optik

1166

Lichtquelle

nicht absorbierendes Prisma

(W/m

Strahlungsenergie

(hoch)

(niedrig)

Detektor

0

1000

2000

3000

(nm) (a)

(b)

Abb. 13.1: (a) Einfache Versuchsanordnung zur Messung von Schwarzkörperstrahlung. (b) Messwerte von Iλ in Abhängigkeit von der Wellenlänge. Jede Kurve gehört zu einer bestimmten Temperatur der Strahlungsquelle.

das Gesetz theoretisch abzuleiten, indem er den Strahlungsdruck auf einen Kolben in einem Zylinder in klassischer Weise mithilfe der Hauptsätze der Thermodynamik und des kirchhoffschen Satzes behandelte. Er erhielt das Stefan-Boltzmann-Gesetz für schwarze Körper, das korrekt ist, obwohl man es heute anders herleiten würde: P = σAT 4 .

(13.2)

P ist die Gesamtstrahlungsleistung bei allen Wellenlängen, A ist die strahlende Fläche, T ist die absolute Temperatur in Kelvin und σ ist eine universelle Konstante, σ = 5,67033 × 10−8

W m2 K 4

.

Die Fläche unter einer der in Abbildung 13.1 b gegebenen Kurven für ein bestimmtes T entspricht der Leistung pro Flächeneinheit. Aus Gleichung (13.2) geht hervor, dass dies gerade gleich P/A = σT 4 ist. Ideale schwarze Körper gibt es in Wirklichkeit nicht. Kohlenruß hat ein Absorptionsvermögen von nahezu eins, allerdings nur bei bestimmten Frequenzen; der optische Spektralbereich gehört offensichtlich dazu, im fernen Infrarot ist das Absorptionsvermögen jedoch merklich geringer. Bei bestimmten Temperaturen und Wellenlängen verhalten sich dessen ungeachtet die meisten Objekte näherungsweise wie schwarze

13.1 Laser und Laserstrahlung

1167

Körper. Für Sie selbst gilt das z. B. im Infrarotbereich. Es ist daher sinnvoll, eine ähnliche Beziehung wie das Stefan-Boltzmann-Gesetz auch für gewöhnliche Körper zu formulieren. Dazu führen wir einen Faktor ein, den Emissionsgrad ε, der die jeweils abgestrahlte Leistung zur Strahlungsleistung eines schwarzen Körpers mit ε = 1 bei derselben Temperatur in Beziehung setzt: P = εσAT 4 . In Tabelle 13.1 finden Sie einige Werte von ε bei Raumtemperatur, wobei gilt 0 < ε < 1. Beachten Sie, dass der Emissionsgrad dimensionslos ist. Tabelle 13.1: Emissionsgrad∗ ausgewählter Oberflächen.

Material

ε

Material

Aluminiumfolie Kupfer, poliert Kupfer, oxidiert Kohle weißer Anstrich, eben

0,02 0,03 0,5 0,8 0,87

roter Ziegel Beton schwarzer Anstrich, eben Ruß



ε 0,9 0,94 0,94 0,95

Raumtemperatur, T = 300 K.

Bringt man einen Körper mit einem Gesamt-Absorptionsvermögen α in einen Hohlraum mit einem Emissionsvermögen εe und einer Temperatur Te , so strahlt der Körper mit einer Rate εσAT 4 und absorbiert innerhalb des Hohlraums mit der Rate  α εe σATe4 . Wenn sich der Körper und der Hohlraum im thermischen Gleichgewicht befinden, also T = Te ist, müssen diese Raten gleich sein. Demnach gilt für alle Temperaturen αεe = ε. Die Nettoleistung, die von dem Körper emittiert (wenn T > Te ) oder absorbiert (wenn T < Te ) wird, ist dann   P = εσA T 4 − Te4 . Alle Körper, deren Temperatur verschieden von null Kelvin ist, strahlen. Da T hier in der vierten Potenz auftritt, ändert sich die Strahlungsleistung sehr stark mit der Temperatur. Heizt man z. B. einen Körper von 0 ◦ C (273 K) auf 100 ◦ C (373 K) auf, dann steigt die abgegebene Strahlungsleistung ungefähr auf das Dreieinhalbfache. Da mit zunehmender Temperatur eines Körpers die abgegebene Strahlungsleistung progressiv ansteigt, wird es dann immer schwieriger, einen Körper weiter aufzuheizen. Versuchen Sie einmal, einen Teelöffel aus Stahl auf 1300 ◦ C zu erhitzen. Mit steigender Temperatur verschiebt sich auch die Energieverteilung der Strahlung über die verschiedenen Wellenlängen. Wenn der Glühfaden einer Glühlampe reißt, nehmen Widerstand, Stromdichte und Temperatur zu; die Farbe des ausgesendeten Lichts ist nicht mehr gelblichweiß, sondern ein bläulichweißer Blitz leuchtet auf.

13 Moderne Optik

1168 Das wiensche Verschiebungsgesetz

Den wohl letzten bemerkenswerten Erfolg bei der Anwendung der klassischen Theorie auf das Problem der Schwarzkörperstrahlung konnte 1893 der deutsche Physiker und Nobelpreisträger Wilhelm Wien verzeichnen. Er leitete das heute so genannte Verschiebungsgesetz ab. Jede Kurve der Strahlungsintensität eines schwarzen Körpers erreicht bei einer charakteristischen Wellenlänge λmax , welche nur von der absoluten Temperatur T abhängt, ihr Maximum. Bei dieser Wellenlänge strahlt der Körper die meiste Energie ab. Wien konnte zeigen, dass λmax T = konstant

(13.3)

ist, wobei die Konstante experimentell zu 0,002 898 m·K bestimmt wurde. Die Wellenlänge λmax ist umgekehrt proportional zur absoluten Temperatur. Steigt die Temperatur, so verschiebt sich das Maximum der Strahlung zu kürzeren Wellenlängen bzw. höheren Frequenzen (siehe die gestrichelte Kurve in Abb. 13.2). Mit steigender Temperatur verschiebt sich die Farbe des Lichts einer glühenden Kohle oder eines Sterns von unsichtbarer IR-Strahlung über Rot nach Bläulichweiß. Ein Mensch oder ein Stück Holz – beides sind nur in grober Näherung schwarze Körper – strahlt vor allem im Infraroten und würde erst bei etwa 600 ◦ C bis 700 ◦ C schwach im Sichtbaren zu glühen beginnen – vorher hätte er sich allerdings längst thermisch zersetzt. Das leuchtende Kirschrot von „rotglühendem“ Eisen setzt bei ungefähr 1300 ◦ C ein.

60

00 K K 4000 K 3000 K

50

00

500 sichtbarer Bereich

1000

1500

2000

Abb. 13.2: Kurven der Schwarzkörperstrahlung. Die gestrichelte Hyperbel, die durch alle Maxima verläuft, entspricht dem wienschen Verschiebungsgesetz.

1899 gelang den Forschern ein bedeutender experimenteller Fortschritt, indem sie ein kleines Loch in einem geheizten Ofen als Quelle von Schwarzkörperstrahlung benutzten (Abb. 13.3). Die Energie, die durch diese Öffnung in den Hohlraum gelangt, wird darin vielfach reflektiert und schließlich absorbiert; die Chance, dass sie wieder aus der Öffnung herausreflektiert wird, ist verschwindend gering. (Aus dem gleichen

13.1 Laser und Laserstrahlung

1169

Grund erscheint die Pupille des Auges schwarz.) Ein solcher nahezu idealer Absorber ist auch ein nahezu idealer Emitter, sodass die Region um ein kleines Loch in einem Ofen eine hervorragende Quelle für Schwarzkörperstrahlung ist.

Abb. 13.3: Strahlungsenergie, die durch ein kleines Loch in einen Hohlraum gelangt, wird innen vielfach hin- und herreflektiert. Die Wahrscheinlichkeit, dass die Energie den Hohlraum durch das Loch wieder verlässt, ist jedoch gering, weshalb das Loch schwarz erscheint. Eine Öffnung in einem geheizten Ofen wirkt umgekehrt als Quelle von Schwarzkörperstrahlung.

Über diesen Punkt kam man mit der klassischen Theorie nicht hinaus. Alle Versuche, die Strahlungskurve (Abb. 13.2) an einen analytischen Ausdruck anzupassen, der auf der Theorie des Elektromagnetismus beruhte, scheiterten. Wien selbst fand eine Beziehung, die im Bereich kleiner Wellenlängen gut mit den experimentellen Daten übereinstimmte, bei großen Wellenlängen jedoch versagte. Lord Rayleigh und später Sir James Jeans (1877–1946) schlugen eine Beschreibung mithilfe der Moden stehender Wellen des Feldes innerhalb des Hohlraums vor. Dieses Strahlungsgesetz von Rayleigh und Jeans lieferte aber nur bei sehr großen Wellenlängen die richtigen Resultate. Vorerst war das Versagen der klassischen Theorie völlig unerklärlich. Ein Wendepunkt in der Geschichte der Physik kündigte sich an. Das plancksche Strahlungsgesetz Max Karl Ernst Ludwig Planck wurde im Alter von 42 Jahren etwas widerstrebend zum Vater der Quantentheorie. Wie viele andere Theoretiker arbeitete auch Planck um die Jahrhundertwende an der Erklärung der Schwarzkörperstrahlung. Es gelang ihm aber nicht nur, die von Kirchhoff gesuchte Verteilungsfunktion abzuleiten, sondern er stellte damit auch das Weltbild der Physik regelrecht auf den Kopf. Wir wollen seine Herleitung hier nicht im Detail erläutern – übrigens war seine ursprüngliche Version falsch und wurde erst Jahre später von Bose und Einstein korrigiert. Die Wirkung von Plancks Theorie war jedoch so gewaltig, dass es sich lohnt, auf einige Aspekte näher einzugehen, die sich im Laufe der Jahre als korrekt erwiesen haben. Gibt man Moleküle mit zufällig verteilten Energien in eine Kammer, die auf einer konstanten Temperatur gehalten wird, so stellt sich zwingend ein Gleichgewicht ein, das mit einer Maxwell-Boltzmann-Verteilung der Teilchengeschwindigkeiten verbunden ist. Davon ausgehend vermutete Planck, dass auch eine zufällige Verteilung von Strahlungsenergien, in einen Hohlraum mit konstanter Temperatur gebracht, im Gleichgewicht schließlich die kirchhoffsche Energieverteilung erreicht. Im Oktober 1900 legte Planck ein Verteilungsgesetz vor, das auf den aktuellsten experimentellen Resultaten beruhte. Diese mathematische „Erfindung“, mit glücklicher Hand zusammengemischt, reproduzierte tatsächlich alle verfügbaren Daten. Die Be-

13 Moderne Optik

1170

ziehung enthielt zwei Naturkonstanten; eine davon, h, wurde später als plancksche Konstante bezeichnet. Diese Entdeckung war, für sich genommen, bereits ein großer Erfolg, selbst wenn sie nichts erklärt hätte. Planck war dabei, die Welt der Physik zu revolutionieren, obwohl er sich dessen überhaupt nicht bewusst war. Natürlich versuchte Planck nun, für die Gleichung, die er bereits aufgestellt hatte, einen theoretischen Rahmen zu finden, aus dem sie sich logisch herleiten ließe. Er nahm dazu an, dass die Strahlung im Hohlraum mit einfachen, mikroskopischen Oszillatoren einer unbekannten Art in Wechselwirkung tritt. Diese Oszillatoren sollten an den Oberflächen der Kammer schwingen und dabei Strahlungsenergie absorbieren und wieder emittieren, ungeachtet des Materials der Wand. (Das stimmt tatsächlich: Die Atome liegen in den festen Wänden so dicht gepackt vor, dass sie mit sehr vielen Nachbarn wechselwirken können. Dadurch verschwimmen ihre sonst scharfen Resonanzfrequenzen zu breiten Bändern, sodass die Atome in einem großen Frequenzbereich oszillieren und ein kontinuierliches Spektrum aussenden.) Planck konnte jedoch versuchen, was er wollte – er hatte keinen Erfolg. Er war damals ein Anhänger von Ernst Mach, der wenig von der physikalischen Realität der Atome hielt. Und doch trieb die scheinbare Unlösbarkeit des Problems Planck schließlich zu einem „Akt der Verzweiflung“. Zögerlich wandte er sich Boltzmanns „unappetitlicher“ statistischer Methode zur Beschreibung des Verhaltens der Atome in Gasen zu. Boltzmann, ein großer Verfechter des Atomkonzepts, und Planck waren eine Zeit lang intellektuelle Widersacher gewesen. Nun aber fühlte sich Planck gezwungen, auf die statistische Analyse seines Rivalen zurückzugreifen, die er (ironischerweise) falsch anwenden sollte. Wenn man Boltzmanns Methode zur Abzählung von Atomen auf eine kontinuierliche Größe übertragen wollte, etwa auf die Energie, dann musste man einige Modifikationen anbringen. Die Gesamtenergie der Oszillatoren, so Planck, musste man sich zumindest vorübergehend als in winzige „Energieelemente“ aufgeteilt denken, die sich abzählen lassen. Diesen Energieelementen wurde ein Wert zugeordnet, der proprtional zur Frequenz ν des Resonators ist. Bedenken Sie, dass Planck die Formel bereits hatte, die er nun theoretisch begründen wollte, und in dieser Formel kam der Term hν vor. Die plancksche Konstante, h = 6,626 075 5 × 10−34 J· s

oder

4,135 669 2 × 10−15 eV· s ,

ist eine sehr kleine Zahl; also ist auch hν (in Einheiten der Energie) sehr klein. Entsprechend setzte Planck die Größe seines Energieelements ε gleich hν. Es handelte sich um eine statistische Analyse. Das Verfahren des Abzählens stand demnach im Mittelpunkt. Wenn die Methode jedoch im boltzmannschen Sinne angewendet wurde, glättete sich die Energie in einer Weise, dass man wieder das gewohnte Kontinuum erhielt. Auf die Einzelheiten wollen wir auch hier nicht eingehen. Wichtig ist, dass Planck hier auf ein ganz erstaunliches Geheimnis der Natur gestoßen war, ohne es zu bemerken: Die Energie ist quantisiert, also in winzige Elemente geteilt.

13.1 Laser und Laserstrahlung

1171

Aus dem spektralen Emissionsgrad, den er bereits durch Anpassung theoretischer Kurven an experimentelle Daten kannte, leitete Planck seine folgende Antwort auf Kirchhoffs Herausforderung ab:   2πhc2 1 . (13.4) Iλ = hc λ5 e λkB T − 1

Helligkeit Nanowatt

Dabei ist kB die Boltzmann-Konstante. Die Beziehung (13.4) nennen wir das plancksche Strahlungsgesetz. Es reproduziert die experimentellen Daten ganz ausgezeichnet, wie Sie in Abbildung 13.4 sehen. Beachten Sie, dass die Gleichung die Lichtgeschwindigkeit, die Boltzmann-Konstante und die plancksche Konstante enthält, also eine Brücke zwischen der Theorie des Elektromagnetismus und dem Atom schlägt.

120 100 80 60 40 20 0

2 4 6

8 10 12 14 16 18 20

Abb. 13.4: Die kosmische Hintergrundstrahlung. Seit seiner Entstehung durch den Urknall dehnt sich das Weltall aus, wobei es sich abkühlt. Die Messpunkte (im Mikrowellenbereich) stammen vom Satelliten COBE (Cosmic Background Explorer). Die durchgezogene Kurve wurde mit dem planckschen Strahlungsgesetz für T = 2,735 ± 0, 006 K berechnet.

Beispiel 13.1 Ein schwarzer Körper mit einer Oberfläche von 1,0 m2 strahlt bei einer angenehmen Temperatur von 300 K in den Raum ab. Bestimmen Sie die abgestrahlte Leistung bei 1,0 µm über einen Wellenlängenbereich von 0,10 µm. Lösung Die Strahlungsleistung P ist die pro Zeiteinheit emittierte Energie: P = Iλ Δλ ΔA . Folglich ist

 1 2πhc2 Δλ ΔA P = λ5 ehc/λkB T − 1

oder, wenn wir die Ergebnisse von Aufgabe 13.11 verwenden, P =

3,742 × 10−25 Δλ ΔA W/m2 · nm . λ5 (e0,0144/λT − 1)

13 Moderne Optik

1172

Einsetzen von Δλ in Nanometer und λ in Meter ergibt P =

3,742 × 10−25 (100 nm)(1) = 5,3 × 10−14 W . 1 × 10−30 (7,017 × 1020 − 1)

Dies ist eine winzig kleine Leistung.

Obwohl Gleichung (13.4) eine deutliche Abkehr von früheren Vorstellungen darstellt, mochte Planck nicht mit der klassischen Theorie brechen. Für ihn war es unvorstellbar, dass die Strahlungsenergie nicht kontinuierlich sein sollte. Die Einteilung der Energie in kleine Quanten, merkte Planck später an, sei eine rein formale Annahme gewesen, der er nicht allzu viel physikalische Bedeutung beigemessen habe. Erst Jahre später, um 1905, lehrte uns ein kühner Denker, dass die atomaren Oszillatoren real sind und ihre Energie tatsächlich quantisiert ist: Wie Albert Einstein zeigte, kann die Energie eines Oszillators nur Werte annehmen, die ganzzahlige Vielfache von hν sind. (Stellen Sie sich dies z. B. wie die schrittweise Zunahme der potentiellen Energie vor, wenn man eine Treppe hinaufsteigt.) Darüber hinaus ist die Strahlungsenergie selbst quantisiert und existiert nur in lokalisierten „Paketen“ von E = hν.

13.1.2 Induzierte Emission Die Lichtverstärkung im Laser erfolgt, indem man sich energiereiche Atome im Medium zunutze macht. Wir wollen daher untersuchen, in welcher Weise die Atome eines Systems bei einer beliebigen Temperatur im Normalfall auf die einzelnen Energiezustände verteilt sind. Dieses Problem gehört in das Gebiet der statistischen Mechanik und wird mithilfe der Maxwell-Boltzmann-Verteilung behandelt. Die Besetzung der Energieniveaus Wir betrachten eine Kammer, gefüllt mit einem Gas im Gleichgewicht bei einer beliebigen Temperatur T . Ist diese Temperatur relativ niedrig wie z. B. in einem Wohnzimmer, dann befinden sich die meisten Atome im jeweiligen Grundzustand. Nur wenige Atome nehmen kurzzeitig Energie auf und gelangen dadurch in einen angeregten Zustand. Die klassische Maxwell-Boltzmann-Verteilung sagt nun aus, dass sich im Mittel Ni Atome pro Volumeneinheit in einem angeregten Zustand der Energie Ei befinden, wobei gilt Ni = N0 e−Ei /kB T ; N0 ist eine temperaturabhängige Konstante. Je höher die Energie des Zustands, also Ei , ist, desto kleiner wird der Exponentialterm und desto weniger Atome befinden sich in dem betreffenden Zustand.

13.1 Laser und Laserstrahlung

1173

Da wir uns mit Übergängen von Atomen zwischen beliebigen Energieniveaus beschäftigen wollen, betrachten wir nun das j-te Niveau mit Ej > Ei . Für dieses Niveau gilt dann Nj = N0 e−Ej /kB T , und das Verhältnis der Besetzungszahlen der beiden Niveaus ist gleich e−Ei /kB T Ni = −E /k T . Nj e j B

(13.5)

Dies ist die relative Besetzungszahl. Es folgt Nj = Ni e−(Ej −Ei )/kB T = Ni e−hνji /kB T ,

(13.6)

wobei wir ausgenutzt haben, dass ein Übergang vom j-ten zum i-ten Niveau einer Energieänderung um (Ej − Ei ) entspricht. Da solche Übergänge unter Emission eines Photons der Frequenz νji stattfinden, können wir einsetzen (Ej − Ei ) = hνji . Die Einstein-Koeffizienten 1916 formulierte Einstein eine elegante, insgesamt recht einfache Theorie des dynamischen Gleichgewichts für einen Stoff, der von elektromagnetischer Strahlung umgeben ist und dabei absorbiert und reemittiert. Mit dieser Analyse wurde erstens das plancksche Strahlungsgesetz bestätigt und zweitens die theoretische Grundlage für den Laser geschaffen. Mit dem Mechanismus der Absorption sind Sie bereits vertraut (siehe Abb. 3.35). Wir nehmen an, das Atom befinde sich in der Konfiguration niedrigster Energie, also dem Grundzustand. Ein Photon geeigneter Energie tritt mit dem Atom in Wechselwirkung, wobei es seine Energie überträgt, und die Elektronenwolke geht in eine neue Konfiguration über. Das Atom erreicht auf diese Weise einen angeregten Zustand höherer Energie (Abb. 13.5). In dichten Medien (z. B. in Festkörpern) gibt das Atom die überschüssige Energie mit großer Wahrscheinlichkeit durch Stöße an seine nächsten Nachbarn weiter. Nicht immer, aber in aller Regel ist eine solche energiereiche Konfiguration extrem kurzlebig. Nach ungefähr 10 ns gibt das Atom den Energieüberschuss in Form eines Photons ab, wenn äußere Einflüsse keine Rolle spielen. Dabei kehrt das Atom in einen stabilen Zustand zurück. Den Vorgang nennt man spontane Emission (Abb. 13.5 b). Bemerkenswerterweise existiert ein alternativer Emissionsprozess. Er wurde erstmals von Einstein bemerkt und spielt die zentrale Rolle für die Funktionsweise des Lasers, welcher allerdings erst rund 50 Jahre später erfunden wurde. Ist ein Medium von elektromagnetischer Strahlung umgeben, dann kann ein Photon auch mit einem Atom wechselwirken, das sich noch in einer angeregten, hochenergetischen Konfiguration befindet. Das Atom gibt die überschüssige Energie dann gleichzeitig mit dem angekommenen Photon ab. Man nennt den Vorgang induzierte Emission (Abb. 13.5 c).

13 Moderne Optik

1174 Ausgangszustand

Endzustand

induzierte Absorption

E

E

(a)

spontane Emission

E

E

(b)

induzierte Emission

E

E

(c)

Abb. 13.5: Schematische Darstellung: (a) induzierte Absorption, (b) spontane Emission und (c) induzierte Emission.

Wie viele Atome pro Zeiteinheit aus einem Anfangszustand in einen Zustand höherer Energie übergehen, muss von der Stärke des Photonenfeldes abhängen, das auf die Atome trifft. Mit anderen Worten, die kritische Größe ist die Energiedichte u, gegeben durch Gleichung (3.34), oder, genauer gesagt, die Energiedichte im Frequenzbereich des Übergangs. Dies ist die spektrale Energiedichte uν , angegeben in J· s/m2 . (Betrachten wir das Strahlungsfeld als Photonengas, dann können wir uns die spektrale Energiedichte als Photonendichte pro Einheitsbereich der Frequenz vorstellen.) Die Änderungsrate der Atomzahl in einem bestimmten Zustand, die Übergangsrate, ist auch proportional zur Besetzungszahl, also zur Anzahldichte der Atome im betreffenden Zustand (Ni ): Je mehr Atome den Zustand bevölkern, desto mehr können ihn pro Sekunde durch Energieabsorption verlassen. Die Triebkraft

13.1 Laser und Laserstrahlung

1175

dieses Prozesses ist das Photonenfeld; wir wollen ihn daher als induzierte Absorption bezeichnen. Die Übergangsrate ist dann   dNi = −Bij Ni uν . (13.7) dt ind.A. Bij ist ein Proportionalitätsfaktor, der Einstein-Koeffizient für die Absorption, und das Minuszeichen kommt daher, dass Ni abnimmt. Für die induzierte Emission haben wir entsprechend   dNj = −Bji Nj uν . (13.8) dt ind.E. Die Konstante Bji ist der Einstein-Koeffizient für die induzierte Emission. Die spontane Emission ist hingegen vom äußeren Feld unabhängig, und es ergibt sich   dNj = −Aji Nj . (13.9) dt sp.E. Dies ist die Rate, mit der die höherenergetische Population, Nj , aufgrund spontaner Emission abnimmt. Und Aji ist der Einstein-Koeffizient der spontanen Emission, der den Verlust des Energieniveaus j an das Energieniveau i beschreibt. Da die Rate der induzierten Emission von uν abhängt, die Rate der spontanen Emission dagegen nicht, können wir bei hoher Energiedichte – was in einem Laser der Fall ist – erwarten, dass die induzierte Emission überwiegt. Beispiel 13.2 Ein 10-mW-Laser emittiert bei einer mittleren Wellenlänge von 500 nm. Bestimmen Sie die Rate, mit der induzierte Emission auftritt. Lösung Wir wissen, dass der Laser 10 × 10−3 J/s abstrahlt. Was wir suchen, ist die Energie, die jedes Photon fort trägt. Mit E = hν und c = λν erhalten wir E=

(6,626 × 10−34 )(2,998 × 108 ) hc = , λ 500 × 10−9

und somit eine pro Photon emittierte Energie von E = 3,973 × 10−19 J. Die Rate der Photonenemission ist dann 10 × 10−3 J/s = 2,52 × 1016 Photonen/s , 3,973 × 10−19 J wobei wir annehmen können, dass es sich im Wesentlichen um induzierte Emission handelt.

13 Moderne Optik

1176

Die Übergangsrate – die Anzahl der pro Sekunde in den jeweils anderen Zustand übergehenden Atome –, geteilt durch die Gesamtzahl der Atome, ist dabei die Übergangswahrscheinlichkeit P, bezogen auf eine Sekunde. Die zugehörige Wahrscheinlichkeit der spontanen Emission (pro Sekunde) ist folglich Psp.E. = Aji . Für einen spontanen Übergang eines einzelnen Atoms in einen Zustand niedriger Energie ist der Kehrwert der Übergangswahrscheinlichkeit pro Sekunde gleich der (mittleren) Lebensdauer τ des angeregten Zustands. Lassen sich alle anderen Mechanismen als die spontane Emission ausschließen und befinden sich N Atome im angeregten Zustand, so ist die Gesamtübergangsrate (die Anzahl der pro Sekunde emittierten Photonen) gleich N Psp.E. = N Aji = N/τ . Eine niedrige Übergangswahrscheinlichkeit ist also mit einer hohen Lebensdauer verbunden. Allgemein kann ein Elektron, das sich in einem hohen Energieniveau befindet, in verschiedene tiefere Niveaus zerfallen (siehe Abb. 13.6). Es gibt dann entsprechend unterschiedliche Werte für dieÜbergangswahrscheinlichkeiten, und die Gesamtwahrscheinlichkeit ist die Summe Aji aller dieser Einzelwahrscheinlichkeiten. Übergänge, die mit einiger Wahrscheinlichkeit auftreten, nennt man erlaubte Übergänge, während solche, die höchst unwahrscheinlich sind, als verbotene Übergänge bezeichnet werden. Im sichtbaren Bereich liegen die Aji -Werte für erlaubte Übergänge zwischen 106 s−1 und 108 s−1 ; für verbotene Übergänge sind sie dagegen kleiner als 104 s−1 . Cadmium+ A = 1.6 × 105 s−1 353.6 nm

2d32

325.0 nm A = 7.8 × 105 s−1

2p32

2p12

Abb. 13.6: Zwei starke Emissionsübergänge, die in einem He-Cd-Laser auftreten.

Beispiel 13.3 Gegeben sei eine Probe, in der Nj angeregte Elektronen pro Volumeneinheit im Energieniveau j über dem Grundzustandsniveau i sind. Zeigen Sie, dass die Population im Energieniveau j exponentiell abfällt, wenn Elektronen über spontane Emissionen entkommen. Was lässt sich über die Lebensdauer von Niveau j sagen? Lösung Gemäß Gleichung (13.9) gilt dNj = −Aji Nj dt

13.1 Laser und Laserstrahlung

1177

und somit dNj = −Aji dt , Nj und wenn wir in der letzten Gleichung beide Seiten integrieren, erhalten wir Nj = Nj (0)e−Aji t , wobei Nj (0) die Population Nj zur Zeit t = 0 ist. Die Population fällt somit innerhalb der Zeit τ = 1/Aji um den Faktor 1/e.

Einsteins Argumentation folgend, nehmen wir nun an, •

dass sich das Strahlungsfeld und die davon umgebenen Atome bei jeder Temperatur T im thermodynamischen Gleichgewicht befinden,



dass die Energiedichte derjenigen eines schwarzen Körpers bei T gleicht und



dass die Anzahldichten der beiden Zustände der Maxwell-Boltzmann-Verteilung entsprechen.

Wenn sich das System im Gleichgewicht befinden soll, muss die Übergangsrate nach oben (i → j) gleich der Übergangsrate nach unten (j → i) sein: Bij Ni uν = Bji Nj uν + Aji Nj . Wir teilen beide Seiten durch Ni , ordnen um und erhalten Bij uν Nj = . Ni Aji + Bji uν Unter Verwendung von Gleichung (13.6), die wir mithilfe der Anwendung der Maxwell-Boltzmann-Verteilung erhalten haben, wird dies zu e−hνji /kB T =

Bij uν . Aji + Bji uν

Die Auflösung nach uν führt zu uν =

Aji /Bji . (Bij /Bji ) ehνji /kB T − 1

(13.10)

Einstein hob hervor, dass bei T → ∞ auch die spektrale Energiedichte, also die spektrale Photonendichte, gegen unendlich geht. Abbildung 13.2 zeigt, dass Iλ mit steigender Temperatur zunimmt; daraus lässt sich die Vermutung ableiten, dass uν sich ähnlich verhält. Tatsächlich ist Iν = 14 cuν , ein Punkt, auf den wir im Anschluss

13 Moderne Optik

1178

zurückkommen werden. Wegen e0 = 1 kann uν nur groß werden, wenn bei hohen Temperaturen Bij = Bji = B wird. Alle drei Konstanten hängen jedoch nicht von der Temperatur ab, sind also immer gleich. Die Wahrscheinlichkeiten der induzierten Emission und Absorption sind Pind.E. = Bji uν bzw. Pind.A. = Bij uν . Das bedeutet, die Wahrscheinlichkeit der induzierten Emission ist gleich der Wahrscheinlichkeit der induzierten Absorption: Ein Atom in einem niedrigen Energiezustand kann mit ebenso großer Wahrscheinlichkeit in einen höheren Zustand übergehen, wie ein angeregtes Atom durch induzierte Emission in einen niedrigeren Zustand zurückfallen kann. Wir vereinfachen die Bezeichnungsweise (Aji = A). Gleichung (13.10) wird damit zu  1 A . (13.11) uν = B ehνji /kB T − 1 Um das Verhältnis A/B durch grundlegende Größen auszudrücken, vergleichen wir mit   2πhc2 1 . [13.4] Iλ = hc λ5 e λkB T − 1 Zunächst wollen wir aber Iλ in Iν umwandeln, um Beziehungen für den Emissionsgrad im Intervall dλ bzw. dν zu erhalten. Wegen λ = c/ν führt die Differentiation zu dλ = −cdν/ν 2 . Weiterhin ist Iλ dλ = Iν dν (wir lassen das Vorzeichen weg, weil es nur aussagt, dass die eine Größe zunimmt, während die andere abnimmt) und daher Iλ c/ν 2 = Iν . So gelangen wir zu   2πhν 3 1 . (13.12) Iν = hν c2 e kB T − 1 Als letzten Schritt vergleichen wir nun die spektrale Energiedichte uν in der Kammer mit dem spektralen Emissionsgrad, c (13.13) Iν = uν , 4 bezogen auf die Strahlung, die den Hohlraum verlässt. Wir wollen hier auf eine vollständige Herleitung der Beziehung verzichten und uns mit einer eher qualitativen Begründung begnügen. Wie Sie wissen, bezeichnet Iν einen Energiefluss durch eine Flächeneinheit (auf einer Seite hinein, auf der anderen wieder heraus) – einen Strahl also, der die Kammer verlässt. In Abschnitt 3.3.1 haben wir gesehen, dass der momentane Fluss einer Leistung senkrecht durch eine Flächeneinheit (der PoyntingVektor) gegeben ist als S = cu, für einen Strahl also im Mittel I = cu. Innerhalb eines Hohlraums breitet sich das Licht jedoch in alle möglichen Richtungen aus,

13.1 Laser und Laserstrahlung

1179

und nicht alle Photonen, die zu u beitragen, liefern auch einen Beitrag zum Emissionsgrad in einer bestimmten Richtung. Hielte man in die Mitte der Kammer eine Platte von der Größe einer Flächeneinheit, so wäre der Energiefluss durch diese Platte in beiden Richtungen wahrscheinlich gleich. Außerdem tragen nur die Komponenten senkrecht zur Fläche zu S bei. Der Faktor 14 erscheint demnach nicht unvernünftig. Aus den Gleichungen (13.11), (13.12) und (13.13) folgt 8πhν 3 A = . (13.14) B c3 Die Wahrscheinlichkeit der spontanen Emission ist proportional zur Wahrscheinlichkeit der induzierten Emission. Ein Atom, das sich gemäß dem einen Mechanismus verhalten kann, kann ebenso dem anderen Mechanismus folgen. Die Funktionsweise des Lasers beruht auf der induzierten Emission; jeder Faktor, der die spontane Emission (A) auf Kosten der induzierten Emission (B) verstärkt, wird sich demnach nachteilig auf den Laserprozess auswirken. Da das Verhältnis A/B proportional zu ν 3 ist, kann man erwarten, dass Röntgenlaser besonders schwer zu konstruieren sind. Das stimmt tatsächlich! Beispiel 13.4 Der 632,8-nm-Strahl eines 2-mW-He-Ne-Lasers hat einen Durchmesser von 1,5 mm. Bestimmen Sie das Verhältnis zwischen den Einstein-Koeffizienten A und B. Lösung Gemäß Gleichung (13.14) gilt 8πhν 3 8πh A = = 3 . B c3 λ Daraus erhalten wir 8π 6,626 × 10−34 J · s A = = 6,572 × 10−14 J · s/m3 . B (632,8 × 10−9 m)3 Betrachten wir ein System von Atomen im thermischen Gleichgewicht, die nur zwei mögliche Zustände haben. Wir wollen noch fordern, dass die Lebensdauer der Atome hinreichend lang ist, damit wir die spontane Emission vernachlässigen können. Treffen Photonen geeigneter Energie auf dieses System, dann wird das niedrigere Niveau i durch Absorption und das obere Niveau j durch induzierte Emission entvölkert. Die Anzahl der Photonen, die pro Sekunde durch induzierte Absorption aus dem System verschwinden, ist proportional zu Pind.A. Ni , und die Anzahl der Photonen, die pro Sekunde durch induzierte Emission in das System gelangen, ist proportional

1180

13 Moderne Optik

zu Pind.E. Nj . Aus der Gleichheit der B-Koeffizienten folgt aber Pind.A. = Pind.E. und damit Pind.A. Nj = Pind.E. Nj . Befindet sich das System aber im thermischen Gleichgewicht, so ist Ni > Nj , es verschwinden also pro Sekunde mehr Photonen aus dem System, als wieder eintreten. Da die Besetzungszahl des Zustands niedrigerer Energie bei jeder Temperatur größer ist als die des Zustands höherer Energie, kommt es zu einer Nettoabsorption von Photonen durch den niedrigeren Zustand. Könnten wir eine Situation erzeugen, in der Ni < Nj ist – eine so genannte Besetzungsinversion –, dann würde die induzierte Emission die Absorption überwiegen.

13.1.3 Der Laser Betrachten wir ein gewöhnliches Medium. Einige seiner Atome sollen sich in einem angeregten Zustand befinden, den wir in quantenmechanischer Schreibweise mit |j bezeichnen wollen. Um bei einem dieser angeregten Atome eine induzierte Emission auszulösen, muss ein Photon eines einfallenden Lichtstrahls die Frequenz νji besitzen (siehe Abb. 13.5 c. Bemerkenswerterweise hat das emittierte Photon dieselbe Phase, dieselbe Polarisation und dieselbe Ausbreitungsrichtung wie die stimulierende Strahlung. Man sagt, das ausgesendete Photon befinde sich in derselben Strahlungsmode wie die einfallende Welle; es trägt verstärkend zur Strahlungsintensität bei. Da sich jedoch normalerweise die meisten Atome eines Mediums im Grundzustand befinden, ist die Absorption wesentlich wahrscheinlicher als die induzierte Emission. Daher stellt sich die Frage: Was geschähe, wenn wir die meisten Atome in einen Zustand höherer Energie anregen könnten, wodurch sich die niedrigeren Zustände entleeren würden? Diese Situation nennt man, wie bereits erwähnt, Besetzungsinversion. Ein einfallendes Photon geeigneter Frequenz könnte dann die lawinenartige Emission sämtlich phasengleicher Photonen auslösen. Solange konkurrierende Prozesse wie die Streuung nicht überwiegen und die Besetzungsinversion aufrechterhalten bleibt, würde sich die anfängliche Welle weiter aufbauen. In ein derartiges Gerät müsste man demnach (chemische, elektrische, optische usw.) Energie hineinpumpen, um die Inversion zu sichern, und man erhielte einen austretenden Lichtstrahl, der das aktive Medium durchlaufen hat. Der erste Laser – ein gepulster Rubinlaser Um zu sehen, wie all dies in die Praxis umgesetzt wurde, betrachten wir Maimans ursprüngliche Konstruktion (Abb. 13.7). Das aktive Medium des ersten funktionsfähigen Lasers war ein kleiner, zylindrischer, synthetischer, blass rosafarbener Rubin, also ein Al2 O3 -Kristall, der ungefähr 0,05 Masseprozent Cr2 O3 enthält. Rubin, noch heute eines der populärsten kristallinen Lasermedien, war bereits vorher in Masern verwendet worden. Schawlow schlug vor, diesen Kristall auch in einem Laser einzusetzen. Die Stirnseiten des Zylinders wurden senkrecht zur Achse parallel und eben poliert. Anschließend wurden sie verspiegelt (eine nur teilweise), und es entstand ein Resonator.

13.1 Laser und Laserstrahlung

1181

Abb. 13.7: Der Aufbau des ersten Rubinlasers. (a) entspricht ungefähr der Originalgröße.

Der Resonator wurde in eine schraubenförmige Blitzlicht-Gasentladungsröhre gebracht, die für ein breitbandiges optisches Pumpen sorgt. Der Rubinkristall erscheint rot, weil die Chromatome Absorptionsbanden im blauen und grünen Spektralbereich haben (Abb. 13.8 a). Beim Zünden der Blitzlampe entsteht ein wenige Millisekunden lang andauernder, intensiver Lichtblitz. Der größte Teil seiner Energie geht als Wärme verloren, aber trotzdem werden viele Cr3+ -Ionen angeregt. In Abbildung 13.8 b sehen Sie ein vereinfachtes Energieniveauschema. Die angeregten Ionen fallen

1182

13 Moderne Optik

Abb. 13.8: Energieniveaus des Rubinlasers.

schnell (innerhalb von etwa 100 ns) in den Grundzustand zurück, wobei sie Energie an das Kristallgitter abgeben. Es handelt sich dabei um strahlungslose Übergänge, die bevorzugt in zwei nahe beieinander liegenden, besonders langlebigen metastabilen Zuständen enden. Dort verharren die Atome mehrere Millisekunden (bei Raumtemperatur etwa 3) lang, bevor sie in zufälliger Weise und meist spontan in den Grundzustand zurückkehren. Dabei kommt es zur Emission des für den Rubin charakteristischen roten Fluoreszenzlichts. Der Übergang vom niedrigeren Zustand aus überwiegt dabei, und die Emission umfasst einen relativ breiten Spektralbereich um 694,3 nm. Das Licht wird in alle Richtungen abgegeben und ist inkohärent. Erhöht man nun die Pumprate, so kommt es zur Besetzungsinversion, und die ersten spontan emittierten Photonen lösen eine Kettenreaktion aus. Ein Lichtquant regt die schnelle, phasengleiche Emission eines anderen Photons an, wobei die im metastabilen Zustand befindlichen Atome Energie an die Lichtwelle abgeben (Abb. 13.7 b). Die Welle wird immer intensiver, während sie im aktiven Medium vor- und zurückläuft – vorausgesetzt, die Energie reicht aus, um Verluste an den verspiegelten Stirnseiten zu

13.1 Laser und Laserstrahlung

1183

kompensieren. Da eines der beiden Enden halbdurchlässig verspiegelt ist, tritt dort ein intensiver, roter Lichtpuls aus, der ungefähr 0,5 ms lang andauert und eine Linienbreite von etwa 0,01 nm aufweist. Lassen Sie die Einfachheit und Effektivität der Konstruktion einen Moment auf sich wirken! Durch die breiten Absorptionsbanden wird der erste Schritt, die Anregung, vereinfacht, während die lange Lebensdauer des metastabilen Zustands die Besetzungsinversion ermöglicht. Das atomare System besteht also aus den Absorptionsbanden, dem metastabilen Zustand und dem Grundzustand. Entsprechend nennt man es auch Dreiniveau-Laser. Rubinlaser werden heutzutage als Hochleistungsquellen gepulster, kohärenter Strahlung verbreitet eingesetzt, u. a. in der Interferometrie, der Plasmadiagnose und der Holografie. Die Kohärenzlängen solcher Geräte liegen bei 0,1 m bis 10 m. Moderne Rubinlaser arbeiten mit flachen, außen angebrachten Spiegeln, wobei der eine vollständig und der andere teilweise reflektiert. Als einzelner Oszillator erzeugt der Rubinlaser Millisekundenimpulse im Energiebereich von etwa 50 J bis 100 J, während man mit Serien-Oszillatorverstärkern bis weit über 100 J erreichen kann. Kommerzielle Rubinlaser liefern im Allgemeinen geringe Gesamtwirkungsgrade (unter 1%). Der Strahldurchmesser liegt zwischen 1 mm und 25 mm mit einer Divergenz zwischen 0,25 mrad und 7 mrad. Heute sind so viele unterschiedliche Arten von Lasern verfügbar, dass der Rubinslaser seine vorherrschende Stellung verloren hat. Optische Resonatoren Der Resonator spielt eine zentrale Rolle für den Betrieb des Lasers. Im oben beschriebenen Fall handelt es sich natürlich um ein Fabry-Perot-Etalon. In der Anfangsphase des Laserprozesses werden spontan und induziert emittierte Photonen in alle Richtungen ausgesendet. Sämtliche Photonen verlassen den Resonator sofort durch die Seitenflächen des Rubins – mit Ausnahme jener, deren Ausbreitungsrichtung (zumindest nahezu) in der Achse des Kristalls liegt. Dieser Axialstrahl baut sich kontinuierlich auf, während er viele Male hin und zurück durch das aktive Medium läuft. Dies erklärt die erstaunliche Parallelität des austretenden Laserstrahlenbündels, das tatsächlich als kohärente ebene Welle betrachtet werden kann. Das Medium verstärkt dabei zwar die Welle, aber infolge der optischen Rückkopplung durch den Resonator wird das System zu einem Oszillator, also eigentlich zu einem Lichterzeuger. Die im Akronym „Laser“ enthaltene Bezeichnung „Verstärker“ ist deshalb vielleicht etwas irreführend. Da der Lichtstrahl in einem Laser sich aufbaut, während er auf und ab streicht, ist es natürlich, den Prozess mithilfe einer Größe zu beschreiben, die man Verstärkung nennt, ganz ähnlich, wie man es bei einem elektronischen Verstärker tun würde. Bei einem Verstärker ist der Verstärkungsfaktor das Verhältnis der Stärke des Ausgabesignals zu der des Eingabesignals. Analog dazu betrachten wir ein schwaches Signal, einen Lichtstrahl, der auf einer Seite in ein aktives Lasermedium (das Verstärkungs-

13 Moderne Optik

1184

medium) eintritt und auf der anderen Seite um einen gewissen Faktor verstärkt wieder austritt. Das Lasermedium ist der Vermittler von Energie, die es dem Strahl über den Mechanismus der induzierten Emission seiner Atome zuführt. Nehmen wir an, dass es sich bei dem Lasermedium um ein angeregtes Gas handelt. Das durch Gasentladung emittierte Licht, in dem Atome mit hohen Geschwindigkeiten umherfliegen, ist aufgrund des Dopplereffekts frequenzverschoben. Der atomare Emissionsübergang, der sonst innerhalb eines sehr schmalen Frequenzbereichs um ν0 beschränkt bliebe, dehnt sich nun zu einem breiten, gaußförmigen Frequenzband aus. Dieser Prozess, der als Dopplerverbreiterung bezeichnet wird, ist ein bestimmendes Merkmal des Gaslasers. Tatsächlich ist die Verstärkung proportional zur Dopplerbreite der Emission. Mit anderen Worten, die Verstärkung hängt von der Linienform oder der Frequenzverteilung des spontan emittierten Lichts ab. Ein Atom in einem bestimmten angeregten Zustand kann durch ein Photon des optischen Feldes zur Emission stimuliert werden. Dieses Photon muss genau die Frequenz (Energie) haben, die mit dem bevorstehenden Übergang des Atoms in einen tieferen Energiezustand verbunden ist. Die Dopplerverbreiterung ändert die Verfügbarkeit dieser Photonen und beeinflusst auf diese Weise die Verstärkung. Für ein System mit einem moderaten Verstärkungsfaktor lässt sich das frequenzabhängige Verstärkungsprofil recht gut durch eine gaußsche Glockenkurve darstellen (Abb. 13.9 a). Daher ist für ein schwaches Signal der Maximalwert des Verstärkungsprofils, der dem Mittelpunkt der Dopplerkurve entspricht, das Maximum der ungesättigten Verstärkung oder einfach die Verstärkung. Wenn wir nun das aktive Medium zwischen Spiegel bringen, um einen Hohlraumresonator zu erzeugen, dann kommen verschiedene Verlustmechanismen ins Spiel: Energie entweicht über die Spiegel, durch Absorption, Streuung an Störstellen usw. Nehmen wir an, dass sich der Verstärkungsfaktor g (Einheit cm−1 ) auf 1,0 cm des vom Strahl durchdrungenen Lasermediums bezieht. Entsprechend sei α (Einheit cm−1 ) der gesamte Verlustfaktor pro Zentimeter für alle möglichen Verlustmechanismen (außer der nicht perfekten Reflexion an den Spiegeln, die leicht zu messen ist). Der Reflexionsgrad dieser Endspiegel sei dann R1 bzw. R2 . Ein Strahl der Intensität I0 startet am ersten Spiegel und erreicht den zweiten Spiegel mit I = I0 exp[(g − α)L]. Nach der Reflexion an Spiegel 2 geht er zurück zu Spiegel 1, sodass er anschließend die aktive Region zweimal durchquert hat, woraufhin gilt I = I0 R1 R2 exp[2(g − α)L] . Die Gesamtverstärkung G = I0 /I für die beiden Durchgänge ist dann G = R1 R2 exp[2(g − α)L] . Der Laser beginnt zu oszillieren, wenn die Verstärkung gerade die Höhe der Verluste erreicht, d. h. für G = 1,0. Der Schwellwert für den Verstärkungsfaktor ist somit gc = α + (1/2L) ln(1/R1 R2 ) .

13.1 Laser und Laserstrahlung

1185

Fabry-Perot-Hohlraum, stehene Wellen (a)

L I dopplerverbreiterte Laserlinie (b)

n

n0

Verstärkung

0

Hohlraummoden

(c) Schwellwert

1.0

Verluste

Ausgabeleistung

n0 Breite der Fabry-Perot Resonanz

q q-2 q+2 q+1 q-1

Hohlraummoden

n v 2L (d)

n

Abb. 13.9: (a) Stehende Wellen im Hohlraum. (b) Dopplerverbreiterte gaußsche Emissionslinie. (c) Verstärkungsprofil, das die Lage der Hohlraummoden zeigt. (d) Modulierte Fabry-Perot-Resonanzen, die den Laseremissionen entsprechen.

In Gaslasern ist α meist zu vernachlässigen. Dann ergibt die Gleichung für L = 15 cm, R1 = 98 % und R2 = 95 % einen Schwellwert von 2,4 × 10−3 cm−1 . Damit der Laser stabil arbeitet, muss bei jedem Lasertyp das Verstärkungsmaximum des aktiven Mediums groß genug sein, um wenigstens so viel Energie über das Medium verfügbar zu machen, dass die Energieverluste plus die Energie des Ausgabestrahls ausgeglichen werden. Die Störung nimmt innerhalb des Resonators die Gestalt einer stehenden Welle an, deren Kenngrößen durch den Spiegelabstand (L) bestimmt sind (Abb. 13.9 b). Stehende Wellen bilden sich im Resonator genau dann aus, wenn zwischen die Spiegel ein ganzzahliges Vielfaches der halben Wellenlänge passt. Dazu muss sich einfach an

13 Moderne Optik

1186

jedem Spiegel ein Knoten befinden – und das kann nur der Fall sein, wenn L ein ganzzahliges Vielfaches von λ/2 ist (mit λ = λ0 /n). Also gilt m=

L λ/2

und

mv . (13.15) 2L Folglich gibt es unendlich viele longitudinale Resonatormoden, zu denen jeweils eine bestimmte Frequenz νm gehört. Zwischen zwei aufeinanderfolgenden Moden liegt der Frequenzabstand v , (13.16) νm+1 − νm = Δν = 2L was dem freien Spektralbereich des Etalons, Gleichung (9.79), und übrigens auch dem Kehrwert der Umlaufzeit entspricht. Für einen 1 m langen Gaslaser ist Δν ≈ 150 MHz. νm =

Der Frequenzabstand der einzelnen resonanten Moden ist deutlich geringer als die Bandbreite der normalen, spontanen atomaren Übergänge (Abb. 13.9 d). Diese Moden – ob eine oder mehrere, hängt von der Bauweise des Gerätes ab – werden im Resonator nicht gedämpft, und deshalb ist der austretende Strahl auf einen Bereich nahe dieser Frequenzen beschränkt. Mit anderen Worten, der Strahlungsübergang stellt ein relativ großes Frequenzspektrum zur Verfügung, aus dem der Resonator nur bestimmte schmale Bänder, gegebenenfalls sogar nur ein solches Band, auswählt und verstärkt. Aus diesem Grund ist Laserstrahlung fast monochromatisch. Die Bandbreite der Strahlung, die z. B. der Rubin bei der Rückkehr in den Grundzustand aussendet, ist aufgrund der Wechselwirkungen der Chrom-Ionen mit dem Gitter ziemlich groß (0,53 nm oder 330 GHz). Der Frequenzbereich einer einzelnen Resonatormode ist dagegen mit 0,000 05 nm (30 MHz) winzig klein. Sie sehen dies in Abbildung 13.9: Gezeigt sind die typische Linienform eines atomaren Übergangs und eine Serie zugehöriger Resonatorlinien, deren gegenseitiger Abstand hier v/2L und deren Breite 30 MHz beträgt. Nur diejenigen Hohlraummoden, die in die so genannte aktive Region fallen – die graue Fläche in Abbildung 13.9 c –, werden erhalten und als Laserstrahlung ausgesendet. Beispiel 13.5 Die Dopplerverbreiterung für einen bei 632,8 nm arbeitenden He-Ne-Laser ist 1,5 × 109 Hz; dies ist im Wesentlichen die Verstärkungsbandbreite. Nehmen Sie an, dass die Spiegel des Lasers 0,8 m voneinander entfernt sind und berechnen Sie näherungsweise die Anzahl der longitudinalen Moden. Verwenden Sie für den Brechungsindex des Gasgemischs den Wert 1,0.

13.1 Laser und Laserstrahlung

1187

Lösung Der Abstand zwischen aufeinanderfolgenden Moden ist durch Gleichung (13.16) gegeben: Δν =

3 × 108 m/s v = . 2L 2(0,8 m)

Dies liefert den Wert Δν = 187,5 MHz. Wir teilen daher 1,5 × 109 Hz (was der Halbwertsbreite entspricht) durch Δν: 1,5 × 109 Hz = 8. 0,1875 × 109 Hz Es kann 8 Frequenzintervalle geben, von denen jedes die Breite Δν hat. Und mit einer Mode an jedem Extremum macht das 9 Moden. (Siehe Abb. 13.9).

Um nur eine einzelne Mode zu erzeugen, könnte man beispielsweise dafür sorgen, dass der durch Gleichung (13.16) gegebene Abstand der Moden größer ist als die Linienbreite des Übergangs, dass also nur eine einzige Mode im Frequenzspektrum des Übergangs enthalten ist (Abb. 13.10). Für einen bei 632,8 nm arbeitenden Helium-Neon-Laser brauchen wir einen Resonator von etwa 10 cm Länge, um den Einmodenbetrieb sicherstellen zu können. Der Nachteil dieses Ansatzes besteht darin, dass durch die Beschränkung der Länge des aktiven Mediums auch die Ausgangsleistung des Lasers eingeschränkt wird. Neben den longitudinalen oder axialen Schwingungsmoden, die stehenden Wellen entlang der z-Achse des Resonators entsprechen, kann man auch dauerhafte transVerstärkung

(a)

Schwellwert

n0 -

v 2L

n0

n0 +

v 2L

v 2L

Ausgabeleistung

0

n0 -

v v n0 n0 + 2L 2L Hohlraummoden

n (b)

n

Abb. 13.10: Longitudinaler Einmodenbetrieb eines Lasers. Wie Sie sehen, passt nur eine Hohlraummode in die aktive Region (graue Fläche) des Verstärkungsprofils in (a). Folglich wird nur Licht dieser einen Mode im Hohlraum verstärkt und als Laserstrahl ausgegeben.

13 Moderne Optik

Ausgangsleistung

1188

TEMmnq TEMrsq

TEMmn(q + 1) TEMrs(q + 1)

Frequenz

v / 2L v / 2L

Abb. 13.11

versale Moden erzeugen (Abb. 13.11 und 13.12). Da die Felder fast genau senkrecht auf z stehen, spricht man auch von TEMmn -Moden (TEM für transverse electric and magnetic). Die Indizes m und n sind ganze Zahlen und geben die Anzahl transversaler Knotenlinien in x- und y-Richtung, quer zum Laserstrahl, an. Der Strahlquerschnitt zerfällt dann in entsprechend viele einzelne Gebiete, und jede mögliche Anordnung gehört zu genau einer TEM-Mode (siehe dazu Abb. 13.13 und 13.14). Die Transversalmode niedrigster Ordnung, TEM00 , wird wohl am meisten verwendet, und das aus guten Gründen: Erstens entspricht die Verteilung der Flussdichte über dem Strahlquerschnitt fast einer Gaußkurve (Abb. 13.15); zweitens treten im elektrischen Feld keine Phasenverschiebungen quer zum Strahl auf, wie es bei anderen Moden der Fall ist, und daher ist der Strahl vollständig räumlich kohärent; drittens ist der Streuwinkel des Strahls besonders klein, und viertens lässt sich der Strahl am besten fokussieren. Beachten Sie, dass die Amplitude in dieser Mode in Wirklichkeit nicht über die Wellenfront konstant ist und es sich folglich um eine inhomogene Welle handelt. Abb. 13.12: Drei Betriebskonfigurationen für einen kontinuierlichen Gaslaser. Von links nach rechts: mehrere longitudinale Moden unter einer annähernd gaußschen Hüllkurve, mehrere longitudinale und transversale Moden, eine einzelne longitudinale Mode. (E. H.)

Komplett bezeichnet man eine Resonatormode mit TEMmnq , wobei q die Longitudinalmode angibt. Zu jeder Transversalmode (m, n) kann es mehrere Longitudinalmoden q geben. Häufig ist man aber nicht auf eine spezielle longitudinale Mode angewiesen, und der Index q wird weggelassen.2 Andere Resonatoranordnungen sind von wesentlich größerer praktischer Bedeutung als der ursprüngliche planparallele Aufbau (Abb. 13.16). Ersetzt man die Planspiegel z. B. durch zwei identische, konkave Kugelspiegel, deren gegenseitiger Abstand 2

Siehe dazu R. A. Phillips und R. D. Gehrz, „Laser Mode Structure Experiments for Undergraduate Laboratories“, Am. J. Phys. 38 (1970) 429.

13.1 Laser und Laserstrahlung

1189

TEM

00

TEM

10

TEM

20

TEM

30

TEM

40

TEM

50

TEM

60

TEM

70

TEM

11

TEM

21

TEM

22

TEM

33

Abb. 13.13: Modenformen (Strahlquerschnitte; die schwachen Interferenzstreifen haben andere Ursachen). (Foto mit frdl. Genehmigung von den Bell Telephone Laboratories.)

Abb. 13.14: Modenkonfigurationen in Rechtecksymmetrie. Radialsymmetrische Moden lassen sich auch beobachten, sie werden aber durch die geringste Asymmetrie (z. B. ein BrewsterFenster) zerstört.

nahezu ihrem Krümmungsradius entspricht, dann entsteht ein konfokaler Resonator. Die Bezeichnung weist darauf hin, dass die Brennpunkte auf der Mitte der Achse zwischen den Spiegeln fast zusammenfallen. Wird ein sphärischer und ein ebener Spiegel verwendet, erhält man einen hemisphärischen (halbkugelförmigen) oder hemikonzentrischen Resonator. Beide Konfiguratio-

13 Moderne Optik

1190

I(x, y)

y

x

(a)

(b)

Abb. 13.15: (a) Gaußförmige Verteilung der Bestrahlungsstärke. (b) Ein tatsächliches Laserstrahlprofil für eine kontinuierliche Laserdiode (405 nm, 20 mW). (S. J. Bentley, Aldephi University Quantum & Nonlinear Optics Lab.)

nen sind erheblich einfacher zu justieren als die planparallele Anordnung. Abhängig von dem Maß, in dem der Strahl in sich selbst zurückläuft, also nicht merklich von der optischen Achse abweicht, nennt man Resonatoren stabil oder labil (Abb. 13.17). Ein labiler Resonator führt zum „Ausbrechen“ des Strahls; dieser entfernt sich immer weiter von der Achse und verlässt den Resonator bald gänzlich. Einen stabilen Resonator (mit Spiegeln, die zu fast 100% reflektieren) kann der Strahl 50-mal oder öfter durchlaufen. In Hochleistungslasern benutzt man oft labile Resonatoren, weil der Strahl dort einen weiteren Bereich des aktiven Mediums überstreicht, die Verstärkung größer ist und deshalb mehr Energie gewonnen werden kann. Besonders zweckmäßig ist dieser Ansatz für aktive Medien wie Kohlendioxid oder Argon, bei denen der Energiezuwachs des Strahls bei jedem Durchlauf sehr groß ist. Die notwendige Anzahl von Durchläufen ist durch die so genannte Kleinsignalverstärkung des aktiven Mediums festgelegt. Welche Resonatoranordnung man auswählt, hängt vom speziellen Anwendungsgebiet ab – keine der Konstruktionen ist die universell beste. Das Abklingen der Energie in einem Resonator wird anhand des Gütefaktors Q (von engl. quality factor) ausgedrückt. Dieser Begriff stammt aus der Anfangszeit der Radiotechnik und wurde verwendet, um die Leistungsfähigkeit eines abstimmbaren

13.1 Laser und Laserstrahlung

(a) fast eben (konvex)

1191

(b) eben marginal stabil

instabil

(d) fast konfokal

(e) konfokal marginal stabil

stabil

(g) konzentrisch

(h) fast konzentrisch

marginal stabil

instabil

(c) fast eben (konkav) stabil

(f) fast konzentrisch stabil

(i) hemisph risch marginal stabil

Abb. 13.16: Resonatoren. (In veränderter Form übernommen aus O’Shea, Callen und Rhodes, An Introduction to Lasers and Their Applications.)

Schwingkreises zu beschreiben. Ein verlustarmer Schwingkreis (mit hohem Gütefaktor) bedeutete einen schmalen Bandpass und eine gute Resonanzschärfe des Radios. Wird ein optischer Resonator beschädigt oder zerlegt, indem z. B. ein Spiegel entfernt oder verschoben wird, so funktioniert der Laser in der Regel nicht mehr. Greift man jedoch absichtlich in dieser Weise ein, um den Beginn der Schwingung im Resonator zu verzögern, so handelt es sich um das so genannte Güteschalten (Q-switching).

M2

M1 (a)

M2 M1 (b)

Abb. 13.17: Stabile und labile Resonatoren. (In veränderter Form übernommen aus O’Shea, Callen und Rhodes, An Introduction to Lasers and Their Applications.)

13 Moderne Optik

1192

Die Ausgangsleistung eines Laser begrenzt sich selbst, denn die Besetzungsinversion geht im Zuge der induzierten Emission durch das Strahlungsfeld allmählich verloren. Verzögert man nun das Einsetzen der Schwingung, so kann die Anzahl der Atome, die in den (langlebigen) metastabilen Zustand gepumpt werden, erheblich anwachsen, wodurch die Besetzungsinversion sehr groß wird. Schaltet man den Resonator dann im geeigneten Moment ein, dann fallen die Atome nahezu gleichzeitig in den Grundzustand zurück, und ein gewaltiger Riesenimpuls mit einer Leistung von bis zu etlichen hundert Megawatt verlässt den Resonator. Solche Güteschaltungen arbeiten nach den verschiedensten Prinzipien. Manche verwenden Farbstoffe, die bei Beleuchtung ausbleichen (durchlässig werden), andere enthalten rotierende Spiegel und Prismen, mechanische Chopper (Zerhacker), sowie akustooptische oder elektrooptische Modulatoren wie Kerr- oder Pockelszellen. Gaußsche Strahlen Das Profil der TEM00 -Mode, die in einem Resonator entsteht, ist gaußförmig (Abb. 13.15), d. h., die Intensität der strahlähnlichen Welle fällt senkrecht zu deren Ausbreitungsrichtung in Form einer zur Strahlachse symmetrischen Glockenkurve ab (Abb. 13.18 a). Wie zu Beginn von Kapitel 2 erläutert wurde, ist eine Gaußfunktion eine Exponentialfunktion mit negativem Exponenten, welcher das Quadrat der Variablen enthält. In unserem Fall ist die Variable der Abstand r zur in der Ausbreitungsrichtung liegenden Achse z, gemessen in der senkrecht dazu stehenden Ebene. Da die Gaußfunktion weiter außen sehr langsam ausläuft, begrenzt man ihre Breite willkürlich. Dazu sei r = w die Halbwertsbreite des Strahls (der Abstand von der Achse, an dem das elektrische Feld des Strahls von seinem Maximalwert E0 auf der Achse bis E0 /e oder rund 0,37E0 gesunken ist). Die Bestrahlungsstärke des Strahls, die mit dem Quadrat der Amplitude zusammenhängt, ist bei r = w gleich I0 /e2 oder rund 0,14I0 . Innerhalb des gedachten Zylinders mit dem Radius w breitet sich der größte Teil der Energie des Strahls aus. Dort ist (Abb. 13.18 b) I = I0 e−2r

2 /w 2

und bei r = w (wie oben angegeben) ist I = I0 e−2 . (a)

(b) I0

x

2

I = I0 e−2r /w

r x

x

0.14I0 0

Abb. 13.18: Eine strahlähnliche gaußsche Welle breitet sich in z-Richtung aus.

w

r

2

13.1 Laser und Laserstrahlung

1193

200 150

r (mm)

100 50 0 −50

−100 −150 −200 −400

−300

−200

−100

0 z (mm)

100

200

300

400

Abb. 13.19: Instantane Bestrahlungsstärke eines gaußschen Strahls; w = 40 mm, λ = 30 mm. ([email protected].)

Wird der Resonator, wie in Abbildung 13.17 a gezeigt, von gekrümmten Spiegeln begrenzt, so wird der Strahl in gewisser Weise fokussiert; an einer bestimmten Stelle wird der Strahldurchmesser dann minimal, man spricht vom Durchmesser der Strahltaille w0 . Die Divergenz des Laserstrahls außerhalb des Resonators lässt sich als Fortsetzung der dieser Taille folgenden Divergenz auffassen (Abb. 13.19 und 13.20). Zwischen den Spiegeln eines Resonators befindet sich stets eine Strahltaille, deren genaue Position von Details des Designs abhängt. Bei einem konfokalen Resonator beispielsweise (siehe Abb. 13.16) liegt die Taille in der Mitte zwischen den Spiegeln. r

r

Strahltaille w0 √

I(r)

2 w0

w(z)

I(r)

Θ zR z=0

Abb. 13.20: Verbreiterung eines gaußschen Strahls. Stellen Sie sich zwei konkave Spiegel vor, die den Abstand d = 2zR voneinander haben und einen konfokalen Hohlraum bilden. Wenn einer der Spiegel teilweise mit Silber beschichtet ist, tritt der Strahl mit einer Winkeldivergenz Θ aus.

Eine ausführlichere Analyse der elektromagnetischen Strahlung im Resonator (mit z = 0 an der Position der Strahltaille) liefert folgenden Ausdruck für die Halbwertsbreite an einem beliebigen Punkt z:   1/2  λz 2 . (13.17) w (z) = w0 1 + πw02 Die Form des Strahls ist gemäß dieser Gleichung ein Rotationshyperboloid (mit Rotation um die z-Achse). Ein praxistaugliches Maß für die Divergenz eines Laserstrahls ist die Entfernung, innerhalb derer sich der Strahlquerschnitt verdoppelt oder äquiva-

13 Moderne Optik

1194

√ lent der Wert von z, für den w (z) = 2w0 ist. Dieser so genannte Rayleigh-Bereich zR ist, wie aus Gleichung 13.17 folgt, gegeben durch πw02 . λ Betrachten wir also einen konfokalen Hohlraum, der durch zwei konkave Spiegel gebildet wird. Die Spiegel haben beide den Krümmungsradius R und voneinander den Abstand L. Im Falle R = L = 2zR folgt aus der Geometrie, dass der minimale Radius durch  λL (13.18) w0 = 2π zR =

gegeben ist. Viele Laser können im TEM00 -Mode arbeiten, in dem der emittierte Strahl gaußsch ist. Je schmaler die Taille (oder je kleiner die minimale Querschnittsfläche) des Strahls ist, umso kleiner ist auch der Rayleigh-Bereich – das bedeutet, umso schneller divergiert der Strahl. In großen Abständen von der Taille nähert sich der Vollwertswinkel (Θ in rad) dem Wert 2w (z) /z. Mit anderen Worten, wenn die Gerade mit der Länge z um einen Winkel Θ rotiert, dann überstreicht ihr Endpunkt eine Entfernung von ungefähr 2w (z). Ist z groß und w0 klein, dann wird der zweite Term im Ausdruck für w (z) groß gegen 1 und   1/2 λz λz 2 ≈ . w (z) ≈ w0 2 πw0 πw0 Wegen Θ → 2w (z) /z ist Θ=

λ 2λ = 0,637 . πw0 w0

Wieder lesen wir ab: Je kleiner w0 ist, desto größer ist die Divergenz des Strahls, Θ. Teilweise aus diesem Grund verwendet man Megaphone – je größer die Öffnung ist, aus der ein Strahl austritt, desto geringer ist die Divergenz des Strahls. Beispiel 13.6 Ein Helium-Neon-Laser im TEM00 -Mode emittiert einen 632,8-nm-Strahl. Der symmetrische, konfokale Hohlraum des Lasers hat einen Spiegelabstand von 28,0 cm. Bestimmen Sie den minimalen inneren Radius des Strahls sowie den Winkel, unter dem der Strahl aus dem Laser divergiert.

13.1 Laser und Laserstrahlung

1195

Lösung Der minimale Radius w0 ist gegeben durch Gleichung (13.18):   1/2 (632,8 × 10−9 )(28 × 10−2 ) λL = = 0,168 mm . w0 = 2π 2π Für die Winkeldivergenz des Strahls folgt Θ = 0,637

632,8 × 10−9 λ = 0,637 , w0 0,168 × 10−3

also Θ = 2,399 mrad oder 0,137◦ .

Der Strahl, der an zwei Planspiegeln entsteht, ist durch Beugung öffnungsbegrenzt; bei gekrümmten Spiegeln ist dies nicht der Fall. Es sei an Gleichung (10.58) erinnert, wonach gilt q1 ≈ 1,22f λ/D (D ist der Durchmesser der Öffnung). Dieser Ausdruck beschreibt das Airy-Scheibchen, und wenn wir beide Seiten durch f dividieren, dann erhalten wir den Halbwertswinkel des gebeugten, kreisförmigen Strahls mit dem Durchmesser D. Die Verdoppelung dieses Wertes liefert den Vollwertswinkel Θ, die Divergenz eines öffnungsbegrenzten Laserstrahls: Θ ≈ 2,44λ/D . Zum Vergleich: Der Vollwertswinkel eines taillierten Strahls, weit entfernt vom Punkt minimalen Querschnitts, beträgt Θ ≈ 1,27λ/D0 .

(13.19)

Der minimale Durchmesser D0 kann aus den Parametern der jeweiligen Resonatoranordnung berechnet werden. Der Helium-Neon-Laser Von seinem ersten betriebsfähigen Laser berichtete Maiman am 7. Juli 1960 auf einer Pressekonferenz in New York.3 Im Februar 1961 stellten Ali Javan und seine Kollegen W. R. Bennett jr. und D. R. Harriott einen funktionstüchtigen kontinuierlichen Laser (cw-Laser von engl. continuous wave) vor, einen Helium-Neon-Gaslaser mit einer Wellenlänge von 1152,3 nm. Bis heute ist der He-Ne-Laser (Abb. 13.21) außerordentlich populär. Man betreibt ihn meist mit wenigen Milliwatt Dauerleistung bei einer Wellenlänge von 632,8 nm (im sichtbaren Spektralbereich). Seine Attraktivität ist vor allem in der einfachen Bauweise begründet: Er ist billig, recht zuverlässig und oft mit einem einzigen Schalter zu bedienen. Das Pumpen erfolgt in der Regel 3

Maiman hatte vorher einen „traditionellen“ Artikel in einer wissenschaftlichen Zeitschrift eingereicht. Die Herausgeber der Physical Review Letters lehnten die Publikation jedoch ab, was sie später bereuen sollten.

13 Moderne Optik

1196 Anode

E θp

BrewsterFenster

Entladungsröhre

Kathode

Spiegel

Gleichstromquelle

Abb. 13.21: Ein einfacher, früher Helium-Neon-Laser.

durch eine elektrische Entladung (mit Gleichstrom, Wechselstrom oder elektrodenloser Hochfrequenzanregung). Freie Elektronen und Ionen werden durch ein angelegtes Feld beschleunigt, es kommt zur Stoßionisation und Anregung der im Gas enthaltenen Atome (eine typische Mischung enthält etwa 104 Pa He und 13 Pa Ne). Viele Heliumatome sammeln sich bei der Rückkehr aus mehreren oberen Niveaus in den langlebigen, metastabilen Zuständen 21 S und 23 S (Abb. 13.22), von denen aus alle Strahlungsübergänge verboten sind. Die angeregten Heliumatome übertragen bei unelastischen Stößen Energie auf Neonatome im Grundzustand, die dadurch ihrerseits in 5s- und 4s-Zustände gelangen. Diese beiden sind die oberen Laserniveaus. Die sich aufbauende Besetzungsinversion bezieht sich auf die tiefer liegenden 4p- und 3pZustände. Übergänge zwischen den 4s- und den 5s-Niveaus sind verboten. Spontan emittierte Photonen lösen induzierte Emissionen aus, und die Kettenreaktion startet. Die wichtigsten Laserübergänge liegen im Infraroten (1152,3 nm und 3391,2 nm) und, Helium 21

Energie (eV)

23 S

5s Stöße 4s

339 1n m

m 3n 54nm 3 nm 2 2.8 15 63

20

21 S

Neon

1 115118 n 2 nmm

19

4p

3p

18 Absorption

594.5 nm

3s

0

1s2 2s2 2p6 Grundzustand induzierter Übergang spontaner Übergang

Abb. 13.22: Energieniveaus des Helium-NeonLasers.

13.1 Laser und Laserstrahlung

1197

natürlich, im Sichtbaren (632,8 nm, hellrot). Die p-Zustände entleeren sich in das 3sNiveau, bleiben also selbst leer, wodurch die Inversion ständig aufrechterhalten wird. Das 3s-Niveau wiederum ist metastabil; 3s-Atome kehren in den Grundzustand zurück, nachdem sie Energie an die Wände des Gefäßes abgegeben haben. Aus diesem Grund ist der Durchmesser der Plasmaröhre umgekehrt proportional zur Verstärkung, was ihn zu einem wichtigen Konstruktionsparameter macht. Während beim Rubinlaser mit dem Laserübergang der Grundzustand erreicht wird, erfolgt beim He-Ne-Laser die induzierte Emission beim Übergang zwischen zwei angeregten Niveaus. Das ist insofern von Bedeutung, als der 3p-Zustand normalerweise nur wenig besetzt ist und man eine Besetzungsinversion leicht erzielen kann, ohne hierzu den Grundzustand halb entleeren zu müssen. Kehren wir zu Abbildung 13.21 zurück, die einige wichtige Merkmale eines HeNe-Lasers (früher Bauweise) zeigt. Die Spiegel sind mit einem dielektrischen Mehrschichtfilm überzogen, dessen Reflexionsgrad 99% beträgt. An den Enden der Entladungsröhre fällt die Strahlung durch Brewster-Fenster (Scheiben, die um den Polarisationswinkel geneigt sind) und wird linear polarisiert. Wären die Endplatten senkrecht zur Achse orientiert, würden die Reflexionsverluste (4% bei jeder Grenzfläche) viel zu groß. Durch die Neigung um den Polarisationswinkel werden die Scheiben vollständig durchlässig für Licht, dessen elektrische Feldkomponente parallel zur Einfallsebene (der Papierebene) steht. Dieser Polarisationszustand überwiegt schnell, da die senkrechte Komponente bei jedem Durchgang durch das Fenster teilweise von der Achse weg reflektiert wird. Die induzierte Emission in der Kammer wird bald hauptsächlich von Licht bewirkt, das in der Einfallsebene linear polarisiert ist, wobei die orthogonale Polarisation endgültig ausgeschlossen wird.4 Bis zur Mitte der 1970er-Jahre dichtete man die Fenster an den Enden der Röhre mit Epoxidharz ab – ein verbreitetes, aber wenig erfolgreiches Verfahren, denn es war nicht zu vermeiden, dass die Epoxidschicht mit der Zeit undicht wurde, sodass Wasserdampf in die Röhre eindringen und Helium entweichen konnte. Heutzutage sind die Laser hartversiegelt: Das Glas ist direkt an Metallrahmen (Kovar) gebunden, die im Inneren der Röhre die Spiegel halten. Einer der Spiegel ist im Allgemeinen vollständig reflektierend. Die Spiegelbeschichtungen sind widerstandsfähig und werden durch die Entladungen im Inneren des Rohrs praktisch nicht beschädigt. Betriebsdauern von 20 000 Stunden sind heutzutage keine Seltenheit; 1960 waren es nur wenige hundert Stunden. Nicht alle Laser sind mit Brewster-Fenstern ausgestattet, und die meisten kommerziellen He-Ne-Laser erzeugen mehr oder weniger unpolarisierte Strahlung. Als typisches Massenprodukt wird ein He-Ne-Laser (mit einer Ausgangsleistung von 0,5 bis 5 mW) im TEM00 -Mode mit einem bescheidenen Wirkungsgrad von 4

Die Hälfte der Ausgangsleistung des Lasers geht nicht durch Reflexion an den Brewster-Fenstern verloren, wenn der transversale P-Zustand des Lichts gestreut wird. Der Resonator lenkt einfach nicht kontinuierlich Energie in diese Polarisationskomponente. Licht, das einmal aus der Röhre herausreflektiert wurde, kann dort keine Emissionen mehr anregen.

1198

13 Moderne Optik

0,01% bis 0,1% betrieben. Die Kohärenzlänge des Strahls beträgt ungefähr 25 cm, der Strahldurchmesser etwa 1 mm. Am populärsten ist nach wie vor der rote He-Ne-Laser (632,8 nm), obwohl es He-Ne-Laser auch im Infrarotbereich und neuerdings sogar im grünen sichtbaren Spektralbereich (543,5 nm) gibt. Moderne Lasertechnologie Die Lasertechnologie ist ein enorm dynamisches Gebiet: Was heute als Durchbruch im Labor gilt, kann man im nächsten Jahr in jedem Geschäft kaufen. Immer wieder hört man vom „kleinsten“, „größten“ oder „leistungsfähigsten“ Laser „aller Zeiten“. Wir wollen uns im Folgenden einen kurzen Überblick über bestehende Verfahren verschaffen (siehe auch Tab. 13.2 am Ende des Kapitels), ohne uns in Spekulationen über Weiterentwicklungen zu versuchen, die nach der Drucklegung dieses Buches mit Sicherheit zu erwarten sind. Laserstrahlen wurden schon am Mond reflektiert; sie schweißen abgelöste Netzhaut wieder an, erzeugen Fusionsneutronen, regen Keimung und Wachstum an, dienen der Kommunikation, lesen CDs, lenken Mühlen, Raketen, Schiffe und feinmechanische Werkzeuge, übertragen Fernsehsignale, bohren Löcher in Diamanten und halten kleine Gegenstände in der Schwebe. Laserstrahlen werden auch zu vielen kuriosen Dingen verwendet. Festkörperlaser Neben dem Rubin werden zahlreiche andere feste Stoffe in Festkörperlasern verwendet, deren Wellenlängen ungefähr zwischen 170 nm und 3900 nm liegen. Solche Laser verwenden einen Glas- oder Kristallstab, der mit Ionen dotiert ist, um die benötigten Energiezustände bereitzustellen. Es sei daran erinnert, dass Rubin mit Chrom dotierter Korund ist. Häufig trifft man dreiwertige Ionen der Seltenerdmetalle Praseodym, Neodym, Europium, Gadolinium, Thulium, Holmium und Erbium als Dotierungsmetalle in Wirtsgittern wie Calciumwolframat (CaWO4 ), Yttriumoxid (Y2 O3 ), Strontiummolybdat (SrMoO4 ), Lanthantrifluorid (LaF3 ), YttriumAluminium-Granat (abgekürzt YAG) oder auch in Glas an. Besonders wichtig sind mit Neodym dotiertes Glas oder YAG („Neodym-YAG-Laser“). Beide Hochleistungsmedien senden Strahlung bei ungefähr 1060 nm aus. Nd:YAG-Laser können im Dauerstrich (kontinuierlichen Betrieb) Leistungen von bis zu einem Kilowatt abgeben. Nd:YAG-Laser gehören zu den am häufigsten eingesetzten Lasern. Anwendungsgebiete dieser Laser sind u. a. die Chirurgie, die Kennzeichnung von Werkstücken und Materialien, Fertigungstechnologien, Materialprüfung und Frequenzverdopplung. Etwas neuer sind Hochleistungslaser auf der Basis von mit Neodym dotiertem Yttriumlithiumfluorid (Nd:YLF) und Yttriumorthovanadat (Nd:YVO4 ), die auch im Infrarotbereich arbeiten (1064 nm). Ein paar Mikrozellen können einen preiswerten IR-Diodenlaser versorgen. Stecken Sie einen KTP-Frequenzverdopplungskristall in den Hohlraum, und Sie haben einen gut kollimierten grünen Laserpointer. Ebenso gibt es eine Vielzahl von Lasermedien, die mit Ytterbium dotiert sind, etwa Yb:YAG und Yb:KGW. Diese arbeiten gewöhnlich bei hohen Leistungen im Wellenlängenbereich von 1020 nm bis 1050 nm. Der Holmium-YAG-Laser (Ho:YAG)

13.1 Laser und Laserstrahlung

1199

bei 2100 nm wird oft eingesetzt, um Gallensteine, Nierensteine sowie verschiedene Tumore zu zerstören. Zusammen mit dem Erbium-YAG-Laser (Er:YAG), der bei 2940 nm arbeitet, wird dieser Lasertyp in der Zahnheilkunde bevorzugt. Die hier erwähnten Laser sind nur eine kleine Auswahl aus dem breiten Spektrum der heute verfügbaren Festkörperlaser. Beispiel 13.7 Ein Nd:YAG-Laserstab besteht aus Nd-Ionen, die mit einer Konzentration von 1 % in einen Yttrium-Aluminium-Granat-Wirt dotiert wurden. Dies entspricht einer Nd+3 -Ionendichte von 1,38 × 1026 m−3 . Nehmen Sie an, dass alle diese Ionen im Wesentlichen gleichzeitig in ihr oberes 4 F3/2 -Niveau gepumpt werden. Von dort kaskadieren sie nach unten und emittieren dabei Strahlung von 1060 nm. Bestimmen Sie die pro Kubikmeter abgestrahlte Energie. Lösung Wir wollen zunächst die Energie für ein einzelnes Photon bestimmen. Wenn wir dann annehmen, dass alle Nd-Ionen strahlen, können wir daraus die insgesamt emittierte Energie berechnen. Bei 1060 nm ist die Energie E = hν =

(6,626 × 10−34 J · s)(2,998 × 108 m/s) hc = = 1,874 × 10−19 J . ν 1060 × 10−9 m

Bei 1,38 × 1026 Ionen pro Kubikmeter, von denen jedes ein Photon mit 1,874 × 10−19 J abstrahlt, ergibt dies eine pro Kubikmeter emittierte Energie von ET = (1,874 × 10−19 J)(1,38 × 1026 m−3 ) = 25,9 × 106 J/m3 . Gepulste Laserstrahlung außerordentlich hoher Leistung kann man durch Reihenschaltung („Array“) mehrerer Impulslaser erzeugen. Der erste Laser in einer solchen Reihe dient als gütegeschalteter Oszillator, der seine Strahlung in den nächsten Laser abgibt, welcher als Verstärker wirkt. Eine Reihe kann auch mehrere Verstärker enthalten. Setzt man die Rückkopplung eines Resonators herab, so verstärkt der Laser eine einfallende Welle, die die induzierte Emission auslöst. Der Verstärker ist also ein aktives, gepumptes Medium, dessen Endflächen jedoch nur teilweise oder überhaupt nicht reflektieren. Kommerziell erhältlich sind Rubinsysteme dieser Art; sie liefern bis zu mehreren Gigawatt (109 Watt) in Form von Pulsen, die einige Nanosekunden lang andauern. Am 19. Dezember 1984 gab der größte damals existierende Laser, der Nova-Laser am Lawrence Livermore National Laboratory in Kalifornien, erstmals alle seine zehn Strahlen gleichzeitig ab, wobei in einem 1-ns-Puls 18 kJ 350-nm-Strahlung freigesetzt wurden. Dieser gewaltige neodymdotierte Glaslaser kann bis zu 120 TW (allerdings nur eine Nanosekunde lang) auf ein winziges Kügelchen fokussieren, in dem eine Kernfusion stattfinden soll. Diese Leistung entspricht dem 500-Fachen der

1200

13 Moderne Optik

Der Nova-Laser. (Foto mit frdl. Genehmigung vom Lawrence Livermore National Laboratory.)

Leistungsabgabe aller Elektrizitätswerke in den USA! In den letzten Betriebsjahren des Nova-Lasers wurden hier mit nur einem Strahl 1,25-Petawatt-Pulse (1 PW = 1015 W) von jeweils 490 Femtosekunden Dauer erzeugt, die eine Energie von 580 J mitführten. Der 1980 (mit 24 Festkörperlasern) in Betrieb genommene Nachfolger von Nova steht im Laboratory for Laser Energetics (LLE) der University of Rochester. Gegenwärtig wird dort mit dem 30- bis 45-kJ-Omega-Laser gearbeitet; das Labor ist die weltweit führende Forschungseinrichtung auf dem Gebiet der Laserfusion (Foto unten). 1995 wurde das System zu einem neodymdotierten 60-Strahl-Phosphatglaslaser aufgerüstet und kann nun eine Strahlungsenergie von 60 × 1012 W auf ein stecknadelkopfgroßes Target konzentrieren. Diese Meisterleistung wird erreicht, indem der ursprüngliche Ausgangsstrahl wiederholt aufgespalten und die Teilstrahlen einzeln an Nd-GlasScheiben und -Stäben verstärkt werden. Unmittelbar vor dem Auftreffen auf das Target wird die Frequenz der Strahlen mithilfe von KDP-Kristallen auf 351 nm verdreifacht (siehe Abschn. 13.4.2). Die Anlage wird von einer Vielzahl von Forschern genutzt und momentan mit der maximalen Rate von einem „Schuss“ pro Stunde betrieben.

Blick in die Targetkammer der Laserfusionsanlage am Laboratory for Laser Energetics, University of Rochester. Die Fusionsreaktionen finden innerhalb eines winzigen Targetkügelchens statt, gefüllt mit einem Deuterium-Tritium-Gemisch und bestrahlt mit einem 30-kJ-Omega-Laser. (Foto mit frdl. Genehmigung des Laboratory for Laser Energetics, Rochester, Eugene Kowaluk, Bildspezialist.)

13.1 Laser und Laserstrahlung

1201

Ein Teil der laserbasierten Trägheitsfusionsanlage, die 2010 in Betrieb genommen wurde. (Lawrence Livermore National Laboratory)

Der Nachfolger des Omega-Systems steht im National Ignition Facility (NIF) des USEnergieministerium in Livermore, Kalifornien. Die ersten Zündungsexperimente mit diesem Gerät, das mit 192 Strahlen 500-TW-Ströme von Strahlungsenergie produziert, wurden 2010 durchgeführt. Beim NIF beginnt der Strahl als kleiner Blitz von geringer Energie (nur wenige Nanojoule) im Infrarotbereich (1053 nm) aus einem mit Ytterbium dotierten optischen Faserlaser. Dieser teilt sich in viele Strahlen, die durch Vorverstärker aus Neodymglas gesendet werden, aus denen sie mit einer Energie von etwa 6 J austreten. Die Hauptreihe von Glasverstärkern, gepumpt durch 7680 Xenonblitzlampen, stößt die gesamte Strahlenergie von nominal bis zu 4 MJ aus. Filter reinigen die Strahlen und entfernen dabei alle Abweichungen, die entlang des Weges durch Störstellen in der Optik eingeführt wurden. Somit ist sichergestellt, dass die Strahlen mit hoher Homogenität am Target ankommen. Infrarote Strahlung wird von Elektronen in dem heißen Target sehr effizient absorbiert, wobei es zu erheblicher Interferenz mit dem komprimierten Deuterium-TritiumBrennstoff kommt. Deshalb werden die Strahlen, bevor sie das Target erreichen, in den UV-Bereich konvertiert, indem sie nacheinander durch zwei KDP-Platten geführt werden. Die erste Platte konvertiert Infrarot (1053 nm) in grünes Licht von 527 nm. Die zweite Platte konvertiert dieses Licht in UV-Licht von 351 nm. Dieser Prozess hat eine Effizienz von nur 50 %, wodurch die insgesamt lieferbare Energie auf etwa 1,8 MJ reduziert wird. Erstmals schickte der NIF-Laser alle seine 192 Strahlen im Jahr 2009 in die TargetKammer, wobei 1,1 MJ an UV erzeugt wurden. Damit wurde die Anlage zum leistungsfähigsten Laser der Welt. Gaslaser Im Bereich zwischen dem fernen IR und dem UV-Bereich (1 mm bis 150 nm) arbeiten viele Gaslaser, vorwiegend Helium-Neon-, Argon-, Kryptonsysteme und Laser mit molekularen Gasen wie Kohlendioxid, Fluorwasserstoff und Stickstoff. Argonlaser kann man gepulst oder im Dauerstrich betreiben, die Strahlung liegt im grünen, blaugrünen und violetten Spektralbereich (v. a. bei 488,0 und 514,5 nm). In

1202

13 Moderne Optik

der Regel beträgt die Leistung im Dauerstrich einige Watt; manche Systeme liefern bis zu 150 W. In vieler Hinsicht ähnelt der Argonlaser dem oben beschriebenen HeNe-System, aber er ist leistungsfähiger und teurer, seine Linien sind breiter und die Wellenlänge ist kürzer. Die am besten untersuchten gasförmigen Lasermedien sind die Edelgase (He, Ne, Ar, Kr, Xe). Ionengase anderer Elemente lassen sich ebenfalls verwenden. Bei CO2 -Molekülen findet der Laserübergang zwischen Schwingungsmoden statt. Die Emission erfolgt im Infraroten (10,6 µm), die Leistungen im Dauerstrich liegen zwischen einigen Watt und mehreren Kilowatt. Durch Hinzufügen von N2 und He zum Lasermedium kann der Kohlendioxidlaser ungewöhnlich hohe Wirkungsgrade von bis zu 15% erreichen. Zur Erzeugung von 10 kW Dauerleistung benötigte man einst eine 200 m lange Röhre. Heute stehen deutlich kleinere „Tischmodelle“ zur Verfügung. Der Rekordhalter hinsichtlich der Leistung war in den 1970er-Jahren zweitweise ein gasdynamischer Versuchslaser, der thermisch gepumpt wurde und in einer Mischung aus CO2 , N2 und H2 O in Multimodenbetrieb eine Dauerleistung von 60 kW erzeugte (10,6 µm). Der gepulste Stickstofflaser arbeitet im Ultravioletten (337,1 nm), ebenso der HeliumCadmium-Laser (325,0 nm). Verschiedene andere Metallionenlaser (oder Metalldampflaser) generieren Emissionen tief im UV-Bereich, darunter HeAg (224 nm) und NeCu (248,6 nm). Wieder andere, darunter Kupferdampf (510,6 nm, 578,2 nm) und Golddampf (627 nm) emittieren im sichtbaren Bereich. Der Helium-Cadmium-Laser strahlt bei 325,0 nm und 441,6 nm. Dies sind Übergänge des Cadmiumions nach dessen Anregung durch Zusammenstöße mit metastabilen Heliumatomen. Excimerlaser sind Gaslaser, die auf einer elektrischen Entladung basieren. In der Regel verwenden sie eine Kombination aus einem Edelgas wie Xenon, Krypton oder Argon und einem reaktionsfreudigen Gas wie Fluor, Chlor oder Brom. Ein Excimer ist ein Pseudomolekül, das nur in einem angeregten Zustand existiert. Excimerlaser wie XeF (351 nm), XeCl (308 nm), XeBr (282 nm), KrF (248 nm), KrCl (222 nm) und ArF (193 nm) emittieren typischerweise einen zweistelligen Wert von Milliwatt im UV-Bereich. Sie werden oft für LASIK („Augenlasern“ zur Korrektur von Fehlsichtigkeiten) sowie bei der Produktion von integrierten Schaltkreisen eingesetzt. Wie bereits erwähnt wurde, sind modengekoppelte Titan:Saphir-Laser sehr stabile Infrarotgeräte (650 bis 1100 nm), die über einen weiten Bereich einstellbar sind. Sie sind hervorragend dazu geeignet, leistungsstarke, ultrakurze Pulse zu erzeugen, und haben dementsprechend viele Anwendungsgebiete gefunden. Besonders erwähnt seien an dieser Stelle die Spektroskopie und LIDAR-Systeme. Halbleiterlaser 1962, bald nach der Entwicklung der Leuchtdiode (light-emitting diode, LED), wurde der Halbleiter- oder Diodenlaser erfunden. Er spielt heute eine zentrale Rolle in der Elektrooptik, in erster Linie aufgrund der Reinheit seines Spektrums, seines hohen Wirkungsgrades (rund 100%), seiner Robustheit und lan-

13.1 Laser und Laserstrahlung

1203

gen Lebensdauer und der trotz seiner Kleinheit (Stecknadelkopfgröße) beachtlichen Leistung von bis zu 200 mW. Außerdem lassen sich solche Laser besonders schnell (bis in den MHz-Bereich) modulieren. Halbleiterlaser gehören als Bestandteil des CDPlayers mittlerweile zum Alltag, außerdem werden sie verbreitet in der faseroptischen Kommunikationstechnik eingesetzt. Die ersten derartigen Laser arbeiteten mit einer einzigen Verbindung als aktivem Medium: Galliumarsenid, geeignet dotiert, um einen p-n-Übergang zu bilden. Der hohe Schwellenwert dieser so genannten Homostrukturen legte sie auf gepulste Arbeitsweise und tiefe Temperaturen fest, andernfalls wären sie durch die auf kleinstem Raum entwickelte Wärme zerstört worden. 1964 wurde ein durchstimmbarer BleisalzDiodenlaser konstruiert, der allerdings erst nach zwölf Jahren in den Handel kam. Er arbeitete bei der unbequem niedrigen Temperatur flüssigen Stickstoffs, kann aber immerhin einen Bereich von 2 µm bis 30 µm überstreichen. In den darauffolgenden Jahren gelang es, den Schwellenwert immer weiter herabzusetzen, sodass der Weg frei war für bei Raumtemperatur betreibbare DauerstrichDiodenlaser. Die Übergänge treten hier zwischen dem Valenz- und dem Leitungsband auf; die induzierte Emission findet in unmittelbarer Nähe des p-n-Übergangs statt (Abb. 13.23). Fließt allgemein ein Strom in Durchlassrichtung durch eine Halbleiterdiode, so rekombinieren Elektronen aus dem Leitungsband der n-Schicht mit Löchern aus der p-Schicht. Dabei wird Energie in Form von Photonen freigesetzt. Dieser Strahlungsprozess konkurriert mit den jeweils möglichen Absorptionsvorgängen (z. B. der Erzeugung von Phononen) und überwiegt, sobald die Rekombinationsschicht dünn und der Strom hinreichend groß ist. Um den Laserprozess in Gang zu bringen, wird das von der Diode emittierte Licht im Inneren eines Resonators zurückgehalten. Meist erreicht man dies einfach durch Polieren der Endflächen senkrecht zum p-n-Übergang. Netzschlusskabel -Leiter

polierte Stirnfl¨ache

Metallkontakt -GaAlAs GaAs (aktive Schicht) -GaAlAs

¨ - -Ubergang

polierte Stirnfl¨ache Laserstrahl (a)

NetzschlussKabel -Leiter

-GaAs Metallkontakt Laserstrahl

(b)

Abb. 13.23: (a) Ein früher GaAs-Halbleiterlaser mit p-n Übergang. (b) Ein modernerer Diodenlaser.

1204

13 Moderne Optik

Ein früher Laser mit spaltengekoppeltem Resonator. (Mit frdl. Genehmigung von Alcatel-Lucent USA Inc.)

Heutzutage werden Halbleiterlaser für spezielle Zwecke konstruiert. Mit verschiedenen Anordnungen erhält man Strahlung mit Wellenlängen zwischen 700 nm und rund 30 µm. In den frühen 1970er-Jahren wurde der GaAs/GaAlAs-Dauerstrichlaser entwickelt, der bei Zimmertemperatur Strahlung zwischen 750 nm und 900 nm liefert (abhängig vom Aluminium/Gallium-Verhältnis). Der winzige Diodenchip ist meist 1 cm3 . Abbildung 13.23 b zeigt einen typischen derartigen Diodennicht größer als 16 laser mit einer so genannten Heterostruktur (verschiedene Materialien sind beteiligt). Der Strahl dringt in zwei Richtungen aus der 0, 2 µm dicken aktiven GaAs-Schicht heraus. Die Leistung solcher kleinen Laser liegt im Dauerstrich bei ungefähr 20 mW. Um in der Glasfaseroptik den verlustarmen Bereich des Glases (λ ≈ 1,3 µm) ausnutzen zu können, führte man Mitte der 1970er-Jahre den GaInAs/InP-Laser ein (1,2 bis 1,6 µm). Der GaN-Diodenlaser emittiert violettes Licht bei 450 nm. Er wird für das Beschreiben und Lesen von Blu-ray Discs verwendet. Der Quantenkaskadenlaser strahlt im mittleren bis in den fernen Infrarotbereich. Seit 2006 ist eine Version davon kommerziell erhältlich, die über einen weiten Bereich eingestellt werden kann. Der Quantenkaskadenlaser ist heute ein besonders nützliches Instrument für Forschungszwecke. Das Foto oben zeigt einen Laser mit spaltengekoppeltem Resonator. Durch Steuerung der Anzahl der Axialmoden erhält man damit durchstimmbare Strahlung in sehr engen Bandbereichen. Zwei Resonatoren sind über einen winzigen Zwischenraum gekoppelt, wodurch die Strahlung auf die geringe Bandbreite festgelegt ist, die in beiden Resonatorkammern aufrechterhalten werden kann.5 5

Siehe dazu Y. Suematsu, „Advances in Semiconductor Lasers“, Phys. Today 32 (Mai 1985). Laser mit Heterostrukturen werden erläutert in M. B. Panish und I. Hayashi, „A New Class of Diode Lasers“, Sci. Am. 225 (Juli 1971) 32.

13.1 Laser und Laserstrahlung

1205

Flüssigkeitslaser Der erste Flüssigkeitslaser wurde im Januar 1963 in Betrieb genommen.6 Die erste Generation dieser Geräte arbeitete ausschließlich mit Chelaten (Organometallverbindungen, bestehend aus einem Metallion und einem großen organischen Rest). Bei dem ersten Flüssigkeitslaser war dies eine alkoholische Lösung von Europium-Benzoylacetonat (613,1 nm). Dass auch andere organische Farbstoffe zur Erzeugung von Laserstrahlung verwendet werden können, entdeckte man eher zufällig, als man nach induzierter Raman-Emission in einer AluminiumchloridPhthalocyanin-Lösung suchte. (Der genannte Farbstoff fluoresziert bei 755,5 nm.)7 Mittlerweile kennt man zahlreiche Fluoreszenzfarbstoffe (Phthalocyanine, Fluoresceine, Cumarine, Rhodamine), die in Farbstofflasern Strahlung mit Wellenlängen vom Infrarotbereich bis zum Ultravioletten liefern. In der Regel (aber nicht immer) werden diese Laser gepulst betrieben. Es gibt sehr viele organische Farbstoffe, weshalb sich für jede Frequenz im sichtbaren Bereich eine geeignete Substanz finden sollte. Außerdem sind diese Geräte in einem bestimmten Wellenlängenbereich (70 nm, in Einzelfällen bis zu 170 nm) durchstimmbar. Diese interne Abstimmbarkeit des Primärstrahls ist von Anordnungen zu unterscheiden, in denen die Frequenz eines Primärstrahls extern beeinflusst wird (siehe Abschnitt 13.4). Im Falle des Farbstofflasers variiert man die Konzentration des Farbstoffes oder die Länge der Farbstoffzelle, oder man bringt am Ende des Resonators einen Reflektor in Form eines Beugungsgitters an. Auf dem Markt sind auch mehrfarbige Lasersysteme, bei denen man zwischen verschiedenen Farbstoffen umschalten kann und die deswegen einen breiten Frequenzbereich abdecken. Chemische Laser Ein chemischer Laser wird mit der Energie gepumpt, die bei einer chemischen Reaktion freigesetzt wird. Das erste derartige Instrument wurde 1964 entwickelt, aber erst 1969 hatte man auch einen chemischen Laser mit Dauerstrichbetrieb. Besonders vielversprechend ist der Deuteriumfluorid-Kohlendioxid-(DF-CO2 -)Laser, der keine Energiezufuhr von außen benötigt. Beim Mischen der beiden nicht besonders exotischen Gase Fluor und Deuterium kommt es zur Reaktion F2 + D2 → 2DF, die ausreichend viel Energie liefert, um einen Kohlendioxidlaser zu pumpen. Der Wasserstofffluoridlaser emittiert bei 2700–2900 nm und der Deuteriumlaser bei 3800 nm. Inzwischen ist, wie man sieht, eine große Vielfalt verschiedener Lasersysteme in Gebrauch: Festkörper-, Gas-, Dampf- (zum Beispiel Wasserdampf-) und Farbstofflaser; Halbleiterlaser und Freie-Elektronen-Laser; Röntgenlaser und Laser mit speziellen Eigenschaften, beispielsweise ultrakurzen Impulsen oder außerordentlich hoher Frequenzstabilität. Letztere verwendet man seit längerer Zeit in der hochauflösenden Spektroskopie, aber zunehmend werden auch andere Anwendungsfelder erschlossen, u. a. Interferometer zum Aufspüren von (bislang hypothetischen) Gravitationswellen. Derartige Resonatoren sind besonders anfällig gegenüber Temperaturschwankungen, 6 7

Siehe A. Heller, „Laser Action in Liquids“, Phys. Today (Nov. 1967) 35. Siehe P. Sorokin, „Organic Laser“, Sci. Amer. 220 (Februar 1969) 30.

1206

13 Moderne Optik

Vibrationen und sogar Schallwellen. Den derzeitigen Rekord hält wohl ein Laser am Joint Institute for Laboratory Astrophysics in Boulder, Colorado, dessen Frequenzstabilität (Abschn. 7.4.3) 1:1014 beträgt.

13.1.4 Fantastisches Licht Laserstrahlen sind von Gerät zu Gerät geringfügig unterschiedlich, ihnen gemeinsam sind aber einige bemerkenswerte Eigenschaften. In aller Regel sind Bündel von Laserstrahlen außerordentlich parallel (hochgradig kollimiert). Blasen Sie ein bisschen Rauch in den ansonsten unsichtbaren Laserstrahl, und infolge der Streuung erblicken Sie einen dünnen Lichtfaden, der durch den Raum gespannt zu sein scheint. Die Divergenz eines He-Ne-Laserstrahls im TEM00 -Mode ist im Allgemeinen geringer als eine Bogenminute! Sie erinnern sich, dass die Bestrahlungsstärke in diesem Mode in Form einer Gaußkurve über den Strahl verteilt ist; die Flussdichte fällt von einem Maximum (in der Achse) ohne Nebenmaxima zu den Rändern des Strahls hin ab. Ein typischer Laserstrahl ist sehr dünn, sein Durchmesser beträgt nur wenige Millimeter. Er ähnelt einer räumlich begrenzten ebenen Welle und ist deshalb hochgradig räumlich kohärent. Die Parallelität des Strahls kann man als Ausdruck dieser Kohärenz betrachten. Laserlicht ist außerdem zeitlich kohärent: Es ist quasimonochromatisch mit einer äußerst geringen Frequenzbandbreite (siehe Abschn. 7.4.2). Innerhalb dieses schmalen Frequenzbandes wird eine enorme Strahlungsleistung abgegeben. Wir haben gesehen, dass ein Laser sämtliche Energie in Form eines dünnen Lichtstrahls emittiert. Eine Glühlampe strahlt vielleicht insgesamt mehr Energie ab als ein Dauerstrichlaser niedriger Leistung, aber die Strahlung der Glühlampe ist inkohärent, verteilt sich über einen großen Raumwinkel und hat außerdem eine große Bandbreite. Mit einer guten Linse8 kann man einen Laserstrahl vollständig einfangen und seine Energie auf einen winzigen Fleck fokussieren, dessen Durchmesser proportional zu λ und zur Brennweite der Linse ist, sowie umgekehrt proportional zum Strahldurchmesser. Schon mit Linsen, die mäßig kurze Brennweiten haben, erhält man Lichtflecke mit Durchmessern von wenigen Hundertsteln Millimetern, und Durchmesser von einigen Zehnmillionsteln Millimetern sind im Prinzip erreichbar. Die Leistungsdichte in einem gebündelten Laserstrahl kann auf diese Weise ohne weiteres größer als 1017 W/cm2 werden – man vergleiche dies mit einer (an sich schon sehr heißen) Acetylen-Sauerstoff-Flamme, die ungefähr 103 W/cm2 abgibt! Ein gebündelter CO2 -Laserstrahl von wenigen Kilowatt Dauerleistung brennt in 10 s ein Loch durch eine 5 mm starke Edelstahlplatte. Stellt man hingegen vor eine gewöhnliche Lichtquelle ein Filter und eine Lochblende, so erzeugt man zwar zeitlich und räumlich kohärentes Licht, aber nur mit einem Bruchteil der insgesamt abgegebenen Leistung. 8

Das größte Problem bereitet in der Regel die sphärische Aberration, da Laserstrahlen sowohl quasimonochromatisch sind als auch längs der optischen Achse einfallen.

13.1 Laser und Laserstrahlung

1207

Optische Pulse im Femtosekundenbereich In den 1970er-Jahren wurde der Farbstofflaser mit passiver Modenkopplung (Modelocking) eingeführt, was den Anstrengungen zur Erzeugung ultrakurzer Lichtpulse neuen Auftrieb gab.9 1974 konnte man bereits optische Pulse im Subpikosekundenbereich (1 ps = 10−12 s) erzeugen. Danach stagnierten die Forschungsarbeiten mehrere Jahre lang. 1981 gelang es gleich zwei Gruppen, Pulse im Femtosekundenbereich (kürzer als 100 fs oder 0,1 ps) zu erzeugen: In den Bell Labs wurde ein Kollisionspuls-Ringfarbstofflaser konstruiert, bei IBM wurde ein neues Pulskomprimierungsverfahren entwickelt. Diese Neuerungen werden erstens natürlich in der elektrooptischen Kommunikation angewendet. Zweitens führten sie aber zur Etablierung eines völlig neuen Forschungsgebiets, das sich mit ultraschnellen Phänomenen beschäftigt. Will man den zeitlichen Ablauf eines Vorgangs beschreiben, so wählt man naturgemäß am besten eine Zeitskala, deren Einteilung im Vergleich zum untersuchten Geschehen fein ist. Dies gilt auch für sehr schnelle Vorgänge wie die Teilchendynamik in Halbleitern, Fluoreszenz, photochemisch-biologische Prozesse, die Umordnung von Molekülstrukturen oder allgemein chemische Reaktionen. Pulse, die kürzer sind als etwa 10 fs, versprechen neue Einsichten in den Aufbau und die Reaktionsweise der Materie.

Röntgenbeugungsmuster eines Mimivirus, erzeugt mit dem weltweit leistungsstärksten Röntgenlaser am Linearbeschleuniger SLAC. (Tomas Ekeberg, Uppsala University, SLAC National Accelerator Laboratory, Stanford University)

Inzwischen gehört das Erzeugen von Femtosekundenpulsen, die nur 8 × 1015 s lang andauern, zur Routine – das entspricht Wellenzügen, die gerade viermal so lang sind wie rote Lichtwellen (600 nm)! Eine der Methoden, die derart ultrakurze Wellengruppen ermöglichen, stammt aus der Radartechnik der 1950er-Jahre: die Pulskomprimierung. Dabei wird das Frequenzspektrum eines primären Laserstrahls verbreitert, 9

Siehe auch Chandrasekhar Joshi und Paul Corkum, „Interactions of Ultra-Intense Laser Light with Matter“, Phys. Today 36 (Januar 1995).

1208

13 Moderne Optik

wodurch das Inverse – die zeitliche Pulsbreite – verringert werden kann. [Wie Sie sich erinnern, sind Δν und Δt konjugierte Fourier-Größen, siehe Gl. (7.63).] Der Eingangspuls wird in ein nichtlinear dispersives Medium, eine Einmodenfaser, geleitet. Ist der Puls hinreichend intensiv, dann tritt im Brechungsindex ein merklicher nichtlinearer Term auf (Abschn. 13.4), und die Trägerfrequenz des Pulses wird zeitabhängig verschoben. Nach der Durchquerung von ungefähr 30 m Faser ist das Frequenzband des Pulses auseinandergezogen. Dieser spektral verbreiterte Impuls wird nun durch ein anderes dispersives System (eine Verzögerungsstrecke) geleitet, etwa zwei Beugungsgitter. Durch das Durchlaufen verschiedener Weglängen holt die blauverschobene hintere Flanke des Pulses die rotverschobene Vorderflanke ein, wodurch ein zeitlich komprimierter Ausgangspuls entsteht. Der Speckle-Effekt Eine weitere und leicht zu beobachtende Manifestation der räumlichen Kohärenz von Laserlicht ist dessen granulares Erscheinungsbild bei Reflexion an einer diffusen Oberfläche. Erweitern Sie den Strahl eines He-Ne-Lasers (632,8 nm) mithilfe einer einfachen Linse und projizieren Sie ihn an eine Wand oder auf ein Blatt Papier. Die Lichtscheibe erscheint nicht gleichmäßig hell, sondern wie von tanzenden, schimmernden Flecken (engl. speckle) bedeckt. Wenn Sie schielen, werden die Körnchen größer; treten Sie näher heran, schrumpfen sie; setzen Sie Ihre Brille ab, bleiben sie scharf. Falls Sie kurzsichtig sind, verschwindet im letzteren Fall sogar das Beugungsmuster, das vom Staub auf den Brillengläsern verursacht wird – die Flecken erscheinen also noch schärfer. Halten Sie einen Stift so vor Ihre Augen, dass die Lichtscheibe unmittelbar darüber erscheint. Fokussieren Sie Ihre Augen auf den Stift, während Sie ihn in verschiedenen Abständen halten. Stets bleibt das granulare Muster scharf sichtbar. Selbst wenn Sie das Muster durch ein Fernrohr betrachten und die Scharfeinstellung von einem Extrem zum anderen drehen, sehen Sie zwar die Wand verschwommen, nicht aber die Lichtkörnchen. Das räumlich kohärente, an einer rauen Oberfläche gestreute Laserlicht erfüllt den Raum mit einem stationären Interferenzmuster, wie wir es von den Interferometern mit Wellenfrontaufspaltung kennen (Abschn. 9.3). Unmittelbar an der Oberfläche sind die „Lichtkörnchen“ sehr klein, mit zunehmender Entfernung werden sie größer. In jedem Punkt des Raumes ergibt sich das resultierende Feld als Superposition vieler gestreuter Elementarwellen. Damit das Interferenzmuster nicht zusammenbricht, muss der Phasenunterschied der Elementarwellen konstant sein; diese Differenz ist bestimmt durch die jeweilige optische Weglänge vom Streuzentrum bis zum betrachteten Punkt. Die Fotos auf der nächsten Seite veranschaulichen diese Zusammenhänge: Sie sehen einen Zementblock, beleuchtet mit kollimiertem Licht einer Quecksilberbogenlampe (a) und mit Laserlicht (b). Die räumliche Kohärenz beider Strahlenbündel ist in etwa gleich. Die Kohärenzlänge des Laserlichts ist viel größer als die Unebenheiten der Oberfläche, die Kohärenzlänge des Hg-Lichts dagegen nicht. Deswegen sind im ersteren Fall die Lichtflecken deutlich zu sehen, Strukturen in der Oberfläche erkennt man nicht

13.1 Laser und Laserstrahlung

(a)

(b)

1209

Speckle-Muster. Ein Zementblock wird (a) mit Licht einer Quecksilberbogenlampe und (b) mit Licht aus einem He-Ne-Laser beleuchtet. (Aus: B. J. Thompson, J. Soc. Phot. Inst. Engr. 4 (1965) 7.)

mehr; im zweiten Fall sieht man ungeachtet der räumlichen Kohärenz der Strahlung keine Flecken, sondern Details der Oberfläche. Aufgrund der Rauigkeit der Oberfläche ist die optische Weglängendifferenz zweier Elementarwellen, die in einem Punkt des Raumes ankommen, stets größer als die Kohärenzlänge des Quecksilberlichts. Daher ändern sich die relativen Phasen der einander überlagernden Wellenzüge rasch und zeitlich zufällig, und das Interferenzmuster ist nicht mehr erkennbar. Vor dem Schirm erzeugen die gestreuten Wellen ein reales Beugungsmuster. Um die Streifen sichtbar zu machen, halten Sie ein Blatt Papier an eine geeignete Stelle. Hinter dem Muster laufen die Strahlen auseinander, und man sieht jeden Teil des Bildes direkt, wenn man das Auge entsprechend scharf einstellt. Strahlen, die anfangs divergieren, scheinen dem Auge dagegen von einem Punkt hinter der streuenden Oberfläche auszugehen, und es entsteht ein virtuelles Bild. Infolge der chromatischen Aberration stellen normal- und weitsichtige Augen rotes Licht in einem Punkt hinter dem Schirm scharf. Kurzsichtige Augen sehen dagegen, unabhängig von der Wellenlänge, immer das reelle Feld vor dem Schirm. Bewegt der Beobachter seinen Kopf nach rechts, dann bewegt sich das Lichtmuster im ersten Fall ebenfalls nach rechts (der Brennpunkt liegt hinter dem Schirm) und im zweiten Fall nach links (der Brennpunkt liegt davor). Wenn Sie das Beugungsmuster in unmittelbarer Nähe des Schirms betrachten, dann scheint es den Bewegungen Ihres Kopfes zu folgen. Denselben Effekt können Sie beobachten, wenn Sie aus einem Fenster schauen: Außen liegende Gegenstände scheinen sich mit ihrem Kopf, innen liegende dagegen in entgegengesetzter Richtung zu bewegen. Der räumlich kohärente Laserstrahl mit seiner geringen Frequenzbandbreite eignet sich hervorragend zur Beobachtung des Granulationseffekts. In ungefiltertem Sonnenlicht sieht man winzige, vielfarbige Lichtpünktchen – besonders gut auf einem ebenen, schwarzen Hintergrund wie Fotokarton, aber auch auf dem Fingernagel oder einer abgenutzten Münze.10 10

Siehe dazu J. C. Dainty, Laser Speckle and Related Phenomena, Springer Verlag, Berlin 1975; G. Koppelmann und H. Rudolph, Die Ursachen der Laserlicht-Granulation, DPG, Fachausschuss Didaktik der Physik, Gießen 1976; L. I. Goldfischer, J. Opt. Soc. Am. 55 (1965) 247; D. C. Sinclair, J. Opt. Soc. Am. 55 (1965) 575; J. D. Rigden und E. I. Gordon, Proc. IRE 50 (1962) 2367 und B. M. Oliver, Proc. IEEE 51 (1963) 220.

1210

13 Moderne Optik

Doch auch wenn der Granulationseffekt ästhetisch und didaktisch wunderbar ist, kann er sich bei kohärent beleuchteten Systemen in der Praxis störend auswirken. Bei holografischen Abbildungen beispielsweise wirkt das Speckle-Muster als störendes Hintergrundrauschen. Einen ähnlichen Effekt kann man übrigens beobachten, wenn man beim Radiohören den Empfänger bewegt: In Abhängigkeit von der Umgebung und dem sich ergebenden Interferenzmuster schwankt die Signalstärke. Der spontane Raman-Effekt Nicht immer kehrt ein angeregtes Atom durch die Emission eines Photons in seinen Grundzustand zurück. Bereits vor der Entwicklung der Quantentheorie wurden derartige Vorgänge von Georges Stokes untersucht. Das Atom gelangt durch einen stokesschen Übergang in einen Zwischenzustand und sendet dabei ein Photon aus, dessen Energie niedriger ist als die des einfallenden (anregenden) Photons. Erfolgt dies sehr schnell (innerhalb von rund 10−7 s), so bezeichnet man den Vorgang als Fluoreszenz. Tritt dagegen eine merkliche Verzögerung auf (um Sekunden oder Minuten, in manchen Fällen sogar Stunden), so spricht man von Phosphoreszenz. Fluoreszenzen im sichtbaren Spektralbereich tritt mittlerweile bei vielen alltäglichen Substanzen auf: Waschmittel (insbesondere die enthaltenen optischen Aufheller), organische Farbstoffe und Zahnpasta absorbieren UV-Quanten und senden charakteristische sichtbare Photonen aus. Beleuchtet man solche Stoffe mit einer UV-Lampe, so scheinen sie zu glühen. Quasimonochromatisches Licht wird in der Regel mit derselben Frequenz gestreut. Gelegentlich beobachtet man jedoch sehr schwache zusätzliche Komponenten mit höheren und niedrigeren Frequenzen (Seitenbänder). Da der Frequenzunterschied zwischen den Seitenbändern und der einfallenden Strahlung (νi ) offenbar charakteristisch für den streuenden Stoff ist, lag eine Anwendung dieses Effekts in der Spektroskopie nahe. Dieser so genannte spontane Raman-Effekt wurde 1923 von Adolf Smekal vorhergesagt und 1928 von Sir Chandrasekhara Vankata Raman (1888–1970), damals Professor für Physik an der Universität Kalkutta, experimentell nachgewiesen. Den Raman-Effekt praktisch auszunutzen, erwies sich als schwierig: Man brauchte starke Lichtquellen (am Anfang vorwiegend Quecksilberentladungslampen) und große Proben. Der Ultraviolettanteil des Anregungslichts führte zudem häufig zur Zerstörung der Probe. Daher ist es nicht verwunderlich, dass den vielversprechenden praktischen Aspekten des Raman-Effekts zunächst nur wenig Interesse geschenkt wurde. Doch mit dem Aufkommen des Lasers hat sich die Situation entscheidend geändert. Heute ist die Raman-Spektroskopie ein einzigartiges und leistungsfähiges analytisches Werkzeug. Um den Raman-Effekt zu verstehen, betrachten wir zunächst die wesentlichen Merkmale eines Molekülspektrums. Ein Molekül kann im fernen Infrarot- und Mikrowellenbereich Energie absorbieren, die in Rotationsenergie umgewandelt wird. Außerdem kann es Photonen im mittleren und nahen Infrarotbereich absorbieren (mit Wellenlängen zwischen ungefähr 10 µm und 700 nm), wobei Schwingungsmoden angeregt werden. Und schließlich kann ein Molekül auch Energie im sichtbaren und ultravioletten Spektralbereich absorbieren. Dabei werden Elektronenübergänge angeregt – den

13.1 Laser und Laserstrahlung

1211 Zwischenzustand

(a)

Zwischenzustand

(b)

Abb. 13.24: Spontane Raman-Streuung.

Mechanismus kennen wir im Wesentlichen schon von der Anregung der Atome. Betrachten wir ein Molekül in einem bestimmten Schwingungszustand, den wir, wie in der Quantenmechanik üblich, mit |b bezeichnen (siehe Abb. 13.24 a). Dabei muss es sich nicht unbedingt um einen angeregten Zustand handeln. Ein einfallendes Photon mit der Energie hνi wird absorbiert und hebt das System in einen instabilen (virtuellen) Zwischenzustand. Von dort aus erfolgt sofort ein stokesscher Übergang, wobei ein (gestreutes) Photon der Energie hνs < hνi ausgesendet wird. Aufgrund der Energieerhaltung regt die Energiedifferenz, hνi − hνs = hνcb , das Molekül in einen höheren Schwingungszustand |c an. Manchmal werden gleichzeitig Elektronen- oder Rotationsübergänge angeregt. Ist dagegen der Ausgangszustand bereits ein angeregter Zustand (um dies zu erreichen, braucht man die Probe nur zu erwärmen), so kann das Molekül nach der Absorption und Emission eines Photons sogar in einen tieferen Zustand gelangen (siehe Abb. 13.24 b). Dabei ist hνs > hνi , d. h., ein Teil der Schwingungsenergie des MoleZwischenzustand

Abb. 13.25: Rayleigh-Streuung.

13 Moderne Optik

1212

Laser

Linse

Linse

Probenk¨uvette

Spektrum

Photonenz¨ahler

Doppelabtastmonochromator

Schreiber

Abb. 13.26: Ein Laser-Ramanspektrometer.

küls (nämlich hνba = hνs − hνi ) wurde in Strahlungsenergie umgewandelt. In jedem Fall entsprechen die Unterschiede zwischen νi und νs bestimmten, molekülspezifischen Abständen zwischen einzelnen Energieniveaus, weshalb sich aus der spektralen Zusammensetzung der Streustrahlung Rückschlüsse auf die Molekülstruktur ziehen lassen. Abbildung 13.25 zeigt zum Vergleich die Rayleigh-Streuung ohne Frequenzänderung (νs = νi ). Der Laser ist eine ideale Lichtquelle zur Anregung der spontanen Ramanstreuung. Laserstrahlung ist intensiv, quasimonochromatisch und bei vielen Frequenzen verfügbar. In Abbildung 13.26 sehen Sie ein typisches Laser-Ramanspektrometer. Im Handel erhält man komplette Systeme dieser Art, bestehend aus einem Laser (in der Regel Edelgaslaser), Linsensystemen und der Elektronik für die Photonenzählung. Der Doppelabtast-Monochromator unterscheidet zwischen νi und νs , denn das unverschobene (νi ) Laserlicht wird gemeinsam mit den Ramanspektren (νs ) gestreut. Seit der Einführung des Lasers sind die Raman-Spektrometer so empfindlich geworden, dass sich sogar Auswirkungen von Elektronenbewegungen im Molekül untersuchen lassen. Der induzierte Raman-Effekt 1962 entdeckten Eric J. Woodbury und Won K. Ng eher zufällig den so genannten induzierten Raman-Effekt. Die Forscher hatten an einem gepulsten Rubinlaser mit einer Leistung im Millionen-Watt-Bereich gearbeitet, welcher mit einer NitrobenzolKerrzelle ausgerüstet war (siehe Abschn. 8.11.3). Sie bemerkten, dass ungefähr 10% der bei 694,3 nm einfallenden Energie als kohärente Streustrahlung mit 766,0 nm

13.1 Laser und Laserstrahlung

1213

Probenk¨uvette Laserfrequenz rot orange gelb grun¨ Linse

Abb. 13.27: Induzierte Raman-Streuung. (Siehe R. W. Minck, R. W. Terhune und C. C. Wang, Proc. IEEE 54 (1966) 1357.)

(gestreuter Strahl)

Laser

StokesLinien

Anti-StokesLinien

austrat. Nachfolgend stellte man fest, dass die zugehörige Frequenzverschiebung von rund 40 THz zu einer Schwingungsmode des Nitrobenzolmoleküls gehörte, und man fand in der Streustrahlung weitere Frequenzkomponenten. Induzierte RamanStreuung kann in Festkörpern, Flüssigkeiten und dichten Gasen durch energiereiche, fokussierte Laserpulse ausgelöst werden (Abb. 13.27). Schematisch ist der Effekt in Abbildung 13.28 dargestellt: Zwei Photonen treffen gleichzeitig auf ein Molekül, eines mit der Laserfrequenz νi , das andere mit der Streufrequenz νs . In der ursprünglichen Anordnung von Woodbury und Ng wurde der gestreute Strahl durch die Probe hin und her reflektiert, der Effekt kann aber auch ohne Resonator auftreten. Der Laserstrahl verliert ein Photon hνi , während der Streustrahl ein Photon hνs aufnimmt und dadurch verstärkt wird. Die verbleibende Energie, hνba = hνi − hνs , wird an die Probe abgegeben. Die Kettenreaktion, bei der ein großer Teil des einfallenden Lichts in induzierte Ramanstrahlung umgewandelt wird, kann nur einsetzen, wenn die Flussdichte des Anregungslichts einen bestimmten Schwellenwert übersteigt.

hνi

hνi hνs hνs

hνs

|c |b |a

Abb. 13.28: Energieniveauschema der induzierten Raman-Streuung.

1214

13 Moderne Optik

Durch die induzierte Raman-Streuung werden kohärente Lichtquellen hoher Flussdichte mit Wellenlängen vom Infraroten bis zum Ultravioletten zugänglich. Dabei sollte noch erwähnt werden, dass im Prinzip jeder spontane Streumechanismus (wie die Rayleigh- und die Brillouinstreuung) eine induzierte Entsprechung hat.11

13.2 Das Bild als räumliche Verteilung optischer Information Datenverarbeitung mithilfe optischer Methoden ist heutzutage nichts Ungewöhnliches mehr. Seit den 1960er-Jahren hat das Interesse an der optischen Datenverarbeitung ständig zugenommen, wie man aus der einschlägigen Fachliteratur ersehen kann. Zu den wichtigsten Anwendungsgebieten gehören das Fernsehen, die Bildverstärkung, die Verarbeitung von Radar- und Sonarsignalen sowie die Mustererkennung (etwa in Luftaufnahmen oder beim Vergleich von Fingerabdrücken). Im Folgenden wollen wir uns mit den wichtigsten Begriffen und Konzepten beschäftigen, um einen Eindruck von diesem modernen Gebiet der Optik zu gewinnen.

13.2.1 Raumfrequenzen Beschäftigt man sich mit elektrischen Prozessen, so hat man es in der Regel mit zeitlich veränderlichen Signalen zu tun, nämlich mit den Schwankungen des Momentanwerts der Spannung zwischen zwei räumlich festen Polen. In der Optik begegnen uns dagegen meist Informationen, die zu einem gegebenen Zeitpunkt im Raum verteilt sind. Die Situation in Abbildung 13.29 a können wir uns z. B. als zweidimensionale Verteilung der Flussdichte vorstellen. Dabei könnte es sich um ein beleuchtetes Dia, ein Fernsehbild oder ein Bild eines Kinofilms auf einer Leinwand handeln. In jedem Fall gibt es sicherlich eine Funktion I (y, z), die jedem Punkt des Bildes einen bestimmten Wert von I zuordnet. Um es uns etwas einfacher zu machen, wollen wir den Bildschirm in Gedanken entlang einer waagerechten Linie (z = 0) abtasten und die Bestrahlungsstärke als Funktion des Weges auftragen, wie in Abbildung 13.29 b geschehen. Die Funktion I (y, 0) kann mithilfe der Fourier-Analyse, die wir in den Kapiteln 7 und 11 besprochen haben, aus harmonischen Komponenten zusammengesetzt werden. In unserem Fall ist die resultierende Funktion recht kompliziert und entsprechend viele harmonische Teilfunktionen müssen wir hinzuziehen. Ist die Form der Funktion I (y, 0) jedoch einmal bekannt, ist das Verfahren nicht mehr schwierig. Beim Abtasten einer anderen Linie, beispielsweise z = a, erhalten wir I (y, a), die in diesem Beispiel zufällig eine Abfolge von Rechteckpulsen in regelmäßigem Abstand ist (Abb. 13.29 c). 11

Als weiterführende Literatur ist z. B. der Übersichtsartikel von Nicolaas Bloembergen „The Stimulated Raman Effect“, Am. J. Phys. 35 (1967) 989 zu empfehlen. Dort finden Sie u. a. zahlreiche Literaturhinweise und einen nützlichen historischen Überblick. Auch viele Artikel in der Zeitschrift Lasers and Light beschäftigen sich mit diesem Thema und sind sehr lesenswert.

13.2 Das Bild als räumliche Verteilung optischer Information

1215

Periode Bestrahlungsdichte oder Feldamplitude

0

0

(a) (a)

Bestrahlungsdichte oder Feldamplitude

0

Periode

(b)

(b)

Abb. 13.30: (a) Signal mit Sinusverteilung. (b) Signal mit Rechteckverteilung.

0 Periode (c)

Fourierkomponenten

(d)

Abb. 13.29: Eine zweidimensionale Verteilung der Bestrahlungsstärke.

Eine solche Funktion haben wir in Abschnitt 7.3 ausführlich diskutiert; Abbildung 13.29 d zeigt eine grobe Skizze von einigen der zugehörigen Fourier-Komponenten. Beträgt die Entfernung zwischen den Mittelpunkten je zweier Maxima in 13.29 c zum

1216

13 Moderne Optik

Beispiel 1 cm, dann ist die räumliche Periode gleich 1 cm/Zyklus und ihr Kehrwert, die Raumfrequenz, gleich 1 Zyklus/cm. Allgemein lässt sich die Information, die in einer bestimmten solchen Abtastlinie enthalten ist, in eine Reihe von Sinusfunktionen geeigneter Amplitude und Raumfrequenz umwandeln. Weist das Bild eine einfache Sinus- oder Rechteckwellenverteilung des Signals auf wie in Abbildung 13.30, so erhält man beim Abtasten entlang beliebiger waagerechter Linien natürlich immer dieselbe Funktion – das Muster ist effektiv eindimensional. In Abbildung 7.40 sehen Sie das Raumfrequenzspektrum der Fourierkomponenten, die man zum Aufbau der Rechteckfunktion benötigt. Für das Stillleben mit Weinflaschen und Leuchter (Abb. 13.29 a) ist die Funktion I (y, z) dagegen offensichtlich zweidimensional, und entsprechend sind zweidimensionale Fourier-Transformierte vonnöten (siehe dazu Abschn. 7.4.4 und 11.2.2). Es soll noch erwähnt werden, dass wir ebenso die Amplitude des elektrischen Feldes in jedem Bildpunkt aufzeichnen und dieses Signal auf ähnliche Weise in Fourierkomponenten zerlegen könnten. Aus Abschnitt 11.3.3 wissen wir, dass das Fernfeld- oder Fraunhofer-Beugungsmuster durch die Fourier-Transformierte der Blendenöffnungsfunktion A (y, z) gegeben ist. Die Blendenöffnungsfunktion ist proportional zu εA (y, z), der Quellstärke pro Einheitsfläche [Gl. (10.37)] in der Gegenstandsebene. Ist, anders ausgedrückt, die Feldverteilung in der Gegenstandsebene gegeben durch A (y, z), dann erscheint deren zweidimensionale Fourier-Transformierte in Form der Feldverteilung E (y, z) auf einem weit entfernten Schirm. Wie in den Abbildungen 7.52 und 10.3 können wir hinter dem Objekt eine Linse L1 einfügen, um die Entfernung zur Bildebene zu verringern. Diese Objektivlinse bezeichnet man auch als Transformationslinse, denn sie wirkt ähnlich wie ein optischer Computer, der sofort Fourier-Transformierte bilden kann. Betrachten wir nun ein etwas idealisiertes Transmissionsgitter, beleuchtet mit einer räumlich kohärenten, quasimonochromatischen Welle, etwa der Strahlung eines Lasers oder kollimiertem, gefiltertem Licht einer Quecksilber-Bogenlampe (Abb. 13.31). In beiden Fällen können wir davon ausgehen, dass die Feldamplitude der einfallenden Wellenfront annähernd konstant ist. Die Blendenöffnungsfunktion ist dann eine periodische Stufenfunktion (Abb. 13.32), d. h., die Amplitude ist entweder null oder gleich einer Konstante, wenn wir uns Punkt für Punkt über die Gegenstandsebene bewegen. Die Gitterkonstante a ist gleichzeitig die räumliche Periode der Stufenfunktion, ihr Kehrwert ist die räumliche Grundfrequenz des Gitters. Der mittlere Lichtfleck (m = 0) im Beugungsmuster ist der Gleichlichtterm, der einer Raumfrequenz von null entspricht. Dies ist der Untergrund, der dadurch entsteht, dass das Eingangssignal A (y, z) überall positiv ist. Zur Verschiebung dieses Untergrundes kann man das Stufenmuster auf einem einheitlich grauen Hintergrund erzeugen. Je weiter ein Lichtfleck in der Bildebene (in diesem Fall in der Ebene der Fourier-Transformierten) von der optischen Achse entfernt ist, desto größer ist seine Raumfrequenz m/a in Übereinstimmung mit der Gittergleichung, sin θm = λ (m/a). Ein gröberes Gitter hat eine größere Gitter-

13.2 Das Bild als räumliche Verteilung optischer Information

ebene Wellen

(a)

Gitter

1217

Transformationslinse

Bildebene oder Transformiertenebene

2 1

(b)

Abb. 13.31: Beugungsmuster an einem Gitter.

konstante, weshalb bei gegebener Ordnung m die Raumfrequenz m/a entsprechend geringer ist und alle Lichtflecken näher an der optischen Achse erscheinen. Hätten wir als Objekt ein Dia wie in Abbildung 13.30 a gewählt, für das die Blendenöffnungsfunktion sinusförmig variiert, dann wären im Idealfall nur drei Lichtflecken auf der Transformiertenebene erschienen: der mittlere Fleck zur Raumfrequenz null und, zu beiden Seiten, die Maxima erster Ordnung oder Grundmaxima (m = ±1). Bei Verwendung eines gekreuzten Gitters (Netzes) hat man den zweidimensionalen Fall und erhält ein Beugungsmuster wie im Foto auf der nächsten Seite unten. Beachten Sie, dass die Gitterstruktur nicht nur in horizontaler und vertikaler Richtung, sondern z. B. auch entlang der Diagonalen periodisch ist. Ein ausgeprägter strukturiertes Muster, etwa ein Dia von der Mondoberfläche, liefert ein wesentlich komplizierteres Beugungsmuster. Aufgrund der einfachen periodischen Struktur des Gitters konnten wir uns die Komponenten der zugehörigen Fourier-Reihe vorstellen. Bei komplizierteren Strukturen müssen wir uns dagegen an die Fourier-Transformierten halten. In jedem Fall zeigt jeder Lichtfleck im Beugungsmuster das Vorhandensein einer spezifischen Raumfrequenz an, die proportional zum Abstand des Lichtflecks von der optischen Achse (welche zur Raumfrequenz null gehört) ist. Frequenzkomponenten mit positivem und negativem Vorzeichen liegen einander, bezüglich der optischen Achse gesehen, diametral gegenüber. Könnten wir das elektrische Feld in jedem Punkt der

13 Moderne Optik

1218 A

Transformierte

1 2 3

0

Beugungsmuster

Raumfrequenz m( )

Abb. 13.32: Eine Rechteckwelle und ihre Transformierte.

Transformiertenebene messen (was praktisch natürlich unmöglich ist), so ergäbe sich tatsächlich die Transformierte der Blendenöffnungsfunktion. Stattdessen können wir die Verteilung der Flussdichte analysieren, und die Bestrahlungsstärke ist in jedem Punkt proportional zum zeitlichen Mittelwert des Quadrates des elektrischen Feldes oder, gleichbedeutend, zum Quadrat der Amplitude des jeweiligen Raumfrequenzbeitrages in diesem Punkt.

Beugungsmuster an einem gekreuzten Gitter (Netz).

13.2 Das Bild als räumliche Verteilung optischer Information

1219

13.2.2 Die abbesche Bildentstehungstheorie Objektiv Transformiertenebene Gitter

Brennebene

Objektebene

(a)

(b)

Abb. 13.33: Bildentstehung.

Betrachten wir das System in Abbildung 13.33 a, eine etwas genauer bezeichnete Version von Abbildung 13.33 b. Monochromatische ebene Wellenfronten gehen von einer Kollimatorlinse Lc aus und werden an einem Gitter gebeugt. Es entsteht eine verformte Wellenfront, die wir wiederum in eine Reihe ebener Wellen auflösen können. Jede dieser Wellen gehört zu einer bestimmten Ordnung (m = 0, ±1, ±2, . . . ) oder Raumfrequenz und breitet sich in eine bestimmte Richtung aus (Abb. 13.33 b). Die Objektivlinse Lt wirkt als Transformationslinse, die das fraunhofersche Beugungsmuster des Gitters in der Transformiertenebene Σt (die der hinteren Brennebene von Lt entspricht) abbildet. Natürlich breiten sich die Wellen über Σt hinaus aus und tref-

13 Moderne Optik

1220

fen in der Bildebene Σi ein. Indem sie sich überlagern und interferieren, entsteht dort ein umgekehrtes, seitenverkehrtes Bild des Gitters. Die Punkte G1 und G2 werden demnach in den Punkten P1 bzw. P2 abgebildet. Die Objektivlinse erzeugt zwei Bilder, die uns interessieren: die Fourier-Transformierte in der Brennebene, die zur Ebene der Quelle konjugiert ist, und das Bild des Objekts in der Ebene, die zur Objektebene konjugiert ist. Abbildung 13.34 zeigt eine ähnliche Anordnung mit einem langen, schmalen, horizontalen Spalt, der kohärent beleuchtet wird.

fraunhofersches Beugungsmuster Feldamplitude Feldamplitude

Feldamplitude

0

0

Gegenstandsebene

Transformiertenoder Brennebene

Bildebene

Abb. 13.34: Die Abbildung eines horizontalen Spaltes.

Die Punkte S0 , S1 , S2 usw. in Abbildung 13.33 a können wir als Punktquellen huygensscher Elementarwellen betrachten; das Beugungsmuster auf Σt ist dann das Bild des Gitters. Anders ausgedrückt, das Bild entsteht durch einen zweifachen Beugungsvorgang. Alternativ können wir uns auch vorstellen, die ankommende Welle werde am Gegenstand und die Beugungswelle ein zweites Mal an der Objektivlinse gebeugt. Ohne die letztere Linse erschiene auf Σi nicht das Bild, sondern das Beugungsmuster des Gegenstandes. Diese Ideen wurden erstmals 1873 von Ernst Abbe (1840–1905) vorgeschlagen.12 Abbe beschäftigte sich damals gerade mit der Mikroskopie, deren Bezug zu unserer 12

Ein alternativer Ansatz stammt von Lord Rayleigh (1896), der jeden Punkt des Gegenstandes als kohärente Quelle betrachtete, deren Welle von der Linse zu einem Airy-Muster gebeugt wird. Das Zentrum jedes Airy-Scheibchens liegt im idealen Bildpunkt (auf Σi ) der zugehörigen Punktquelle. Auf diese Weise ist Σi mit einer Verteilung von interferierenden Airy-Mustern bedeckt.

13.2 Das Bild als räumliche Verteilung optischer Information

1221

Diskussion sofort klar wird, wenn wir Lt als Objektiv eines Mikroskops betrachten. Ersetzen wir außerdem das Gitter durch einen dünnen, durchscheinenden Gegenstand (die zu untersuchende Probe), der mit Licht aus einer kleinen Lichtquelle und einem Kondensor beleuchtet wird, so wird aus unserem System effektiv ein Mikroskop. Carl Zeiss (1816–1888) betrieb in der Mitte des neunzehnten Jahrhunderts eine kleine Mikroskopfabrik in Jena. Er erkannte die Nachteile der damaligen Forschungsstrategie in der Optik, die im Wesentlichen auf dem unsystematischen Ausprobieren von Ideen beruhte, und engagierte 1866 Ernst Abbe, Professor an der Universität Jena, um eine wissenschaftlichere Methodik der Mikroskopentwicklung zu erarbeiten. Abbe fand durch Experimente bald heraus, dass die Auflösung umso besser war, je weiter die Blende geöffnet wurde, selbst wenn der scheinbare Kegel des einfallenden Lichts nur einen kleinen Teil des Objektivs ausfüllte. Irgendwie schien der umgebende dunkle Raum zur Abbildung beizutragen. Abbe folgerte, dass der bereits bekannte Beugungsmechanismus an den Kanten einer Linse, der im Falle einer Punktquelle zur Erzeugung eines Airy-Musters führt, bei einem Mikroskop nicht in gleicher Weise wirkt wie bei einem inkohärent beleuchteten Fernrohrobjektiv. Es schien, als streuten Objekte in der Größenordnung von λ Licht in den „Dunkelraum“ des Mikroskopobjektivs. Beachten Sie, dass die Abbildung dem Objekt nicht exakt gleicht, wenn die Öffnung des Objektivs zu klein ist, um sämtliches gestreute Licht einzufangen (Abb. 13.33 b). Stattdessen sieht man einen fiktiven Gegenstand, dessen Beugungsmuster dem von Lt gesammelten Licht entspricht. Aus dem vorangegangenen Abschnitt wissen wir, dass die dabei verlorengegangenen Anteile des Fraunhofer-Beugungsmusters zu den hohen Raumfrequenzen gehören, deren Unterdrückung zu einem Verlust an Bildschärfe und Auflösung führt. Dies werden wir im Anschluss ausführlich diskutieren. Das oben betrachtete Gitter kann in der Praxis niemals streng periodisch sein, denn es ist nicht unendlich breit. In seinem kontinuierlichen Fourier-Spektrum dominieren deshalb die diskreten Fourierreihenglieder, die anderen Terme haben eine wesentlich kleinere Amplitude. Bei komplizierten, unregelmäßigen Gegenständen erkennt man dagegen eindeutig die kontinuierliche Natur der Fourier-Transformierten. In jedem Fall jedoch wirkt die Objektivlinse als Tiefpassfilter, solange ihre Blendenöffnung nicht unendlich groß ist: Sie lässt nur Raumfrequenzen unterhalb eines bestimmten Grenzwertes durch. Nicht durchgelassen werden alle diejenigen Raumfrequenzen, die jenseits der physikalischen Grenzen der Linse liegen. Bei kohärenter Beleuchtung ist demnach kein reales Linsensystem in der Lage, sämtliche Raumfrequenzen eines Gegenstandes korrekt wiederzugeben.13 Es sollte noch erwähnt werden, dass optische Abbildungssysteme, die mit hohen Raumfrequenzen arbeiten, grundsätzlich nichtlinear sind.14 13

14

Einen umfassenden Bericht über die Leistungen von Ernst Abbe auf dem Gebiet der Optik finden Sie in H. Volkmann, „Ernst Abbe and His Work“, Appl. Opt. 5 (1966) 1720. R. J. Becherer und G. B. Parrent jr., „Nonlinearity in Optical Imaging Systems“, J. Opt. Soc. Am. 57 (1967) 1479.

1222

13 Moderne Optik

13.2.3 Räumliche Filterung Betrachten wir noch einmal die Anordnung in Abbildung 13.33 a. Als Quelle ebener Wellen soll ein Laser verwendet werden. Wenn die Punkte S0 , S1 , S2 usw. ein Fraunhofer-Beugungsmuster erzeugen sollen, muss der Schirm im Prinzip bei x = ∞ stehen (in der Praxis reichen 10 bis 20 Meter aus). Sie erinnern sich, dass wir die Linse Lt ursprünglich eingeführt haben, um das Beugungsmuster des Objekts aus dem Unendlichen heranzuholen. Jetzt wollen wir eine Abbildungslinse Li hinzunehmen (Abbn. 13.35 und 13.36), um das Beugungsmuster der Punkte S0 , S1 , S2 . . . aus dem Unendlichen heranzuholen und gleichzeitig Σi in einen bequemen Abstand zu verschieben. Die transformierende Linse lässt das vom Gegenstand ausgehende Licht in Form eines Beugungsmusters auf Σt konvergieren, d. h., auf Σt entsteht eine zweidimensionale Fourier-Transformierte des Objekts. Das Raumfrequenzspektrum des Objekts ist also über die Transformiertenebene verteilt. Li , die „invers“ transformierende Linse, projiziert dann das Beugungsmuster des über Σt verteilten Lichts in die Bildebene. Mit anderen Worten, Li beugt den gebeugten Strahl nochmals, was effektiv bedeutet, dass eine inverse Transformierte erzeugt wird. Das Endbild ist damit die inverse Transformierte der Daten auf Σt . In der Praxis sind Lt und Li oft identische (ft = f  ), gut korrigierte mehrteilige Linsen. Sind sie von guter Qualität, dann kann ihre Auflösung vielleicht 150 Linienpaare/Millimeter betragen, wobei ein Linienpaar einer Periode in Abbildung 13.30 b entspricht. Geringeren Ansprüchen genügen bereits zwei Projektorobjektive mit großen (etwa 10 cm) Blendenöffnungen und geeigneten Brennweiten (ungefähr 30 bis 40 cm). Eine dieser Linsen wird so gedreht, dass ihre beiden hinteren Brennebenen mit Σt zusammenfallen. Die Objektebene braucht dabei übrigens nicht eine Brennweite von Lt entfernt zu sein, damit die Transformierte auf Σt erscheint. Durch Verschieben von Σ0 ändert sich nur die Phase der Amplitudenverteilung, was im Allgemeinen nicht weiter interessant ist. Die in den Abbildungen 13.35 und 13.36 gezeigte Anordnung bezeichnet man auch als kohärenten optischen Computer. Sie ermöglicht das Einbringen von Hindernissen (Masken oder Filtern) in die Transformiertenebene und damit das teilweise oder vollständige Ausblenden einzelner Raumfrequenzen, die folglich die Bildebene nicht erreichen können. Eine solche Änderung des Frequenzspektrums eines Bildes heißt räumliche Filterung (siehe auch Abschn. 7.4.4).

Abb. 13.35: Objekt-, Transformierten- und Bildebene.

13.2 Das Bild als räumliche Verteilung optischer Information

1223

y

ebene Welle

Gegenstandsebene

Y kY Transformiertenebene Bildebene z

z Σo

Lt

Z kZ Li

Σt

ft ft

fi

Σi

y

fi

(a)

(b)

(c)

(e)

(f)

(g)

(d)

Abb. 13.36: Die Fourier-Transformierte des Buchstaben E, erhalten mit einem optischen Computer. Die Fotos (a) bis (g) zeigen, wie die Transformierte mit zunehmender Belichtungszeit immer detailreicher wird. (Fotos E. H.)

Aus der vorausgegangenen Diskussion der Fraunhofer-Beugung wissen wir, dass ein langer, schmaler, beliebig orientierter und positionierter Spalt auf Σ0 eine Transformierte auf Σt erzeugt, die aus einer Reihe von Lichtflecken besteht. Diese Lichtflecke liegen auf einer Geraden senkrecht zum Spalt (Abb. 10.6), die durch den Ursprung ver-

1224

13 Moderne Optik

läuft. Wird folglich das linienförmige Objekt beschrieben durch y = mz + b, so liegt das Beugungsmuster auf der Linie Y = −Z/m oder gleichbedeutend [Gln. (11.64) und (11.65)] kY = −kZ /m. Bedenken wir dies sowie die Form des Airy-Musters, so können wir die Struktur der Transformierten verschieden geformter Objekte ungefähr vorhersagen. Beachten Sie dabei auch, dass der Mittelpunkt dieser Transformierten auf der optischen Achse des Systems (Raumfrequenz null) liegt. Zu einem durchsichtigen Pluszeichen, dessen waagerechter Balken dicker als der senkrechte ist, gehört eine zweidimensionale Transformierte, die ebenfalls mehr oder weniger wie ein Pluszeichen aussieht. Der dicke waagerechte Balken erzeugt kurze senkrechte Striche, der dünne senkrechte Balken erzeugt eine Linie aus langen waagerechten Strichen. Sie erinnern sich, dass Licht an kleinen Gegenständen unter großen Winkeln gebeugt wird. Abbe folgend, könnte man auch diese Tatsache als Ausgangspunkt der Überlegungen verwenden. Die Begriffe der räumlichen Filterung und der Transformierten spiegeln eher die modernen Einflüsse der Theorie der Nachrichtenübermittlung wider. Die senkrechten Anteile des Buchstabens E in Abbildung 13.36 sorgen dafür, dass im waagerechten Muster ein breites Frequenzspektrum erscheint. Alle parallelen Linienquellen eines gegebenen Objekts entsprechen einer einzigen linearen Anordnung in der Transformiertenebene. Diese Anordnung wiederum verläuft durch den Ursprung auf Σt (der Schnittpunkt liegt bei null), wie es auch für das Gitter der Fall war. Eine durchsichtige Zahl 5 erzeugt ein Muster, das aus einer horizontalen und einer vertikalen Verteilung von Lichtflecken besteht und sich über einen relativ großen Frequenzbereich erstreckt. Daneben tritt eine konzentrische, ringähnliche Struktur mit vergleichsweise niedrigen Frequenzen auf. Die Transformierten von Scheiben, Ringen und Ähnlichem sind offensichtlich radialsymmetrisch, wogegen an einer waagerecht elliptischen Öffnung senkrecht ausgerichtete, konzentrische elliptische Bänder entstehen. Fernfeldmuster besitzen meist ein Symmetriezentrum (siehe die Aufgaben 10.25 und 11.37).

Abb. 13.37: Ein feinmaschiges, leicht staubiges Gitter und seine Transformierte. (Fotos mit frdl. Genehmigung aus D. Dutton, M. P. Givens und R. E. Hopkins, Spectra-Physics Laser Technical Bulletin Number 3.)

13.2 Das Bild als räumliche Verteilung optischer Information

1225

Wir können den Prozess der räumlichen Filterung nun besser verstehen. Dazu betrachten wir ein Experiment, wie es in ähnlicher Weise 1906 von A. B. Porter dokumentiert wurde. Abbildung 13.37 a zeigt ein feinmaschiges Drahtgitter, dessen Periodizität von einigen Staubteilchen unterbrochen wird. Das Gitter befinde sich in Σ0 ; dann zeigt Abbildung 13.37 b die Transformierte, die in Σt erscheint. Da aber die Information, die zu den Staubkörnchen gehört, als unregelmäßig geformter Fleck um den Mittelpunkt herum zum Ausdruck kommt, können wir sie leicht eliminieren – wir brauchen nur eine geeignete lichtundurchlässige Maske in Σt zu bringen. Hat diese Maske nur in den Mittelpunkten aller Hauptmaxima Löcher, so werden nur die zugehörigen Frequenzen durchgelassen, und das Bild erscheint staubfrei (Abb. 13.38 a). Im anderen Extremfall könnten wir nur den Fleck passieren lassen, der die Information über die Staubteilchen enthält; im Bild ist die periodische Struktur dann fast vollständig ververändertes Bild

gefilterte Transformierte

verändertes Bild

(a)

(b)

(c)

(d)

(e)

(f)

gefilterte Transformierte

Abb. 13.38: Verschiedene Teile des Beugungsmusters in Abbildung 13.34 b wurden hier durch entsprechende Masken oder räumliche Filter abgedeckt. (Mit frdl. Genehmigung aus D. Dutton, M. P. Givens und R. E. Hopkins, Spectra-Physics Laser Technical Bulletin Number 3.)

13 Moderne Optik

1226

schwunden, und man sieht tatsächlich vor allem den Staub (Abb. 13.38 b). Lassen wir nur das mittlere Maximum nullter Ordnung durch, dann erscheint ein gleichmäßig ausgeleuchtetes Bild (der Gleichlicht-Untergrund), als ob das Gitter überhaupt nicht vorhanden wäre. Je mehr hohe Frequenzen eliminiert werden, desto detailärmer wird das Bild (Abb. 13.38 d, e und f). Um dies zu verstehen, müssen wir uns lediglich daran erinnern, wie eine Funktion mit „scharfen“ Ecken aus harmonischen Komponenten zusammengesetzt wurde. Zur Illustration dieser Idee dient Abbildung 7.34: Wie man sieht, werden durch das Hinzufügen der höheren Harmonischen vor allem die Ecken ausgeformt und die Peaks im Profil abgeflacht. Auf diese Weise tragen die höheren Raumfrequenzen zur scharfen Trennung zwischen hellen und dunklen Bildbereichen bei. Durch die Ausblendung der hochfrequenten Terme wird die Stufenfunktion abgerundet, woraus im zweidimensionalen Fall ein Verlust an Auflösung folgt. Was geschieht, wenn wir den Gleichlicht-Untergrund ausblenden, indem wir nur den mittleren Fleck verdecken (Abb. 13.38 c)? Ein Punkt, der auf dem ursprünglichen Foto schwarz erscheint, bezeichnet eine Bestrahlungsstärke nahe null, was natürlich einer Feldamplitude von ebenfalls fast null entspricht. Auf den Punkt fällt kein Licht, weil dort sämtliche Komponenten des optischen Feldes einander auslöschen. Entfernen wir aber den Gleichlichtterm, so wird die Feldamplitude mit großer Wahrscheinlichkeit verschieden von null, was selbstverständlich auch für ihr Quadrat gilt. Wegen I ∝ E02 /2 führt dies zu einer Bestrahlungsstärke größer als null. Die Ausblendung des Gleichlichts hat demnach zur Folge, dass Gebiete, die auf dem ursprünglichen Foto schwarz aussahen, nun weißlich erscheinen, während vorher weiße Gebiete grau aussehen (siehe Fotos unten).

(a)

(b)

(b) entstand durch Filterung von (a), wobei die nullte Ordnung entfernt wurde. (Fotos mit frdl. Genehmigung aus D. Dutton, M. P. Givens und R. E. Hopkins, Spectra-Physics Laser Technical Bulletin Number 3.)

Betrachten wir nun einige Anwendungen dieses Verfahrens. Abbildung 13.39 a zeigt ein Foto der Mondoberfläche, das aus einzelnen Filmstreifen zusammengesetzt wurde. Die Videodaten wurden von der Sonde Lunar Orbiter I zur Erde gefunkt. Die regel-

13.2 Das Bild als räumliche Verteilung optischer Information

(a)

1227

(b)

(c)

(d)

Abb. 13.39: Räumliche Filterung. (a) Zusammengesetztes Foto der Mondoberfläche, aufgenommen vom Lunar Orbiter. (b) Gefilterte Variante des Bildes (a), bei der die horizontalen Linien entfernt wurden. (c) Eine typische ungefilterte Transformierte (Leistungsspektrum) einer Mondlandschaft. (d) Beugungsmuster, wobei das senkrechte Fleckenmuster herausgefiltert wurde. (Fotos mit frdl. Genehmigung von D. A. Ansley und W. A. Blikken, The Conduction Corporation, und von der NASA.)

13 Moderne Optik

1228

(a)

(b)

Abb. 13.40: Ungefilterte und gefilterte Aufnahme von Spuren in einer Blasenkammer.

mäßigen Linien zwischen je zwei Streifen bilden eine Art Gitter, das sich in einer Verteilung vertikaler Frequenzen mit großer Bandbreite äußert, wie man sie in Abbildung 13.39 c erkennen kann. Blendet man diese Frequenzkomponenten aus, so sieht man dem Bild nicht mehr an, dass es aus vielen kleinen Teilen zusammengesetzt ist. Auf ganz ähnliche Weise unterdrückt man störende Daten in Blasenkammeraufnahmen von Spuren subatomarer Teilchen.15 Die Analyse dieser Fotos wird durch Spuren ungestreuter Strahlen erschwert (Abb. 13.40), welche jedoch alle parallel sind und sich deshalb durch räumliche Filterung leicht entfernen lassen. Ein Schwarzweiß-Drucker kann auf weißem Papier die Illusion verschiedener Graustufen erzeugen. (Mithilfe dieses weit verbreiteten Halbton- oder Faksimileverfahrens entstehen z. B. die Bilder in Tageszeitungen.) Bringt man ein Dia eines solchen Halbtonbildes in die Ebene Σ0 (Abb. 13.35), so erscheint das zugehörige Frequenzspektrum in Σt . Auch hier kann man die relativ hochfrequenten Komponenten, die durch das Halbtongitter entstehen, problemlos ausblenden. In dem so erhaltenen Graustufenbild (Abb. 13.41) lässt sich die diskontinuierliche Natur des Originals nicht mehr erkennen. Ein Filter, das nur die Frequenzen des quadratischen Gitters unterdrückt, erhält man durch Verwendung eines Dias mit dem Negativ der Transformierten des Karomusters. Im Allgemeinen genügt es jedoch, durch die Verwendung eines Tiefpassfilters mit kreisrunder Blendenöffnung einige hochfrequente Anteile des Originals sozusagen im Vorbeigehen zu entfernen, zumindest, wenn die Raumfrequenz des Gitters hinreichend hoch ist. Das gleiche Verfahren wendet man zur Unterdrückung der Körnung stark vergrößerter Fotos an. Von Bedeutung ist dies z. B. bei der Auswertung von Luftaufnahmen. Ein unscharfes Foto wird dagegen schärfer, wenn man die hochfrequenten Komponenten betont. Dazu eignet sich beispielsweise ein Filter, das den niederfrequenten Anteil des Frequenzspektrums besonders gut absorbiert. Seit den 1950er-Jahren beschäftigt man sich intensiv mit der Verstärkung fotografischer Aufnahmen, und tatsächlich konnten dabei einige wesentliche Fortschritte erzielt werden. Besonders wichtige Beiträge leistete A. Maréchal vom Institut für Optik an der Pariser Universität, dem es mithilfe phasenverschiebender und absorbierender Filter gelang, Details in sehr 15

D. G. Falconer, „Optical Processing of Bubble Chamber Photographs“, Appl. Opt. 5 (1966) 1365. Hier finden Sie auch Angaben zu einigen weiteren Anwendungen des kohärenten optischen Computers.

13.2 Das Bild als räumliche Verteilung optischer Information

1229

Abb. 13.41: Ein Selbstporträt von K. E. Bethke, das nur aus schwarzen und weißen Flecken besteht, ähnlich einem Halbtonbild. Durch Herausfiltern der hohen Frequenzen entstehen Grauschattierungen, und die scharfen Grenzen verschwimmen. [R. A. Phillips, Am. J. Phys. 37 (1969) 536.]

unscharfen Fotos zum Vorschein zu bringen. Die Filter bestehen aus Glasplatten mit durchsichtigen Beschichtungen zur Verzögerung der Phase einzelner Spektralbereiche (Abschn. 13.2.4). In den kommenden Jahren wird die klassische Fotografie mit Sicherheit von elektrooptischen Echtzeitverfahren verdrängt. Zu nennen sind beispielsweise Arrays von akustooptischen Modulatoren für Licht, die einen Mehrkanaleingang bilden.16 Der kohärente optische Computer wird einen gewissen Reifegrad erlangen, wobei bedeutende Verbesserungen durch die elektrooptische Ausführung des Signaleingangs, der Filterung und des Ausgangs zu erwarten sind. Ein solches Gerät könnte einen kontinuierlichen Strom von Echtzeitdaten verarbeiten.

13.2.4 Phasenkontrast Im vorangegangenen Abschnitt wurde erwähnt, dass ein rekonstruiertes Bild durch ein phasenverschiebendes Filter verändert werden kann. Das wahrscheinlich am besten bekannte Anwendungsbeispiel dieser Technik stammt bereits aus dem Jahr 1934, als der niederländische Physiker Fritz Zernike die Methode des Phasenkontrastes erfand und sie in seinem Phasenkontrast-Mikroskop umsetzte. Wir „sehen“ einen Gegenstand, weil er in irgendeiner Weise von seiner Umgebung absticht – sei es durch seine Farbe, seine Tönung oder das Fehlen einer Färbung. Dieses Hervorstechen nennen wir Kontrast, und ein derartiger Gegenstand ist ein Amplitudenobjekt, weil seine Erkennbarkeit auf Variationen in der Amplitude der Lichtwelle beruht. Im Verlaufe dieses Vorgangs wird eine Welle, die ein solches Objekt reflektiert oder durchlässt, amplitudenmoduliert. 16

Wir haben das Gebiet der optischen Datenverarbeitung lediglich gestreift. Eine ausführlichere Diskussion finden Sie z. B. in Goodman, Introduction to Fourier Optics, Kapitel 7. Dieses Lehrbuch beinhaltet auch eine umfangreiche Liste der Originalliteratur in Zeitschriften. Siehe auch P. F. Mueller, „Linear Multiple Image Storage“, Appl. Opt. 8 (1969) 267. Da sich die moderne Optik unablässig weiterentwickelt, veralten die Arbeiten allerdings relativ schnell.

1230

13 Moderne Optik

Fritz Zernike (1888–1966), Nobelpreisträger für Physik 1953.

Phasenobjekte dagegen, die durchsichtig sind, keinen Kontrast zu ihrer Umgebung haben und nur die Phase der vom Beobachter registrierten Welle verändern, können wir nicht sehen, obwohl dies häufig wünschenswert wäre. Die optische Dicke solcher Objekte ändert sich meist von Punkt zu Punkt, da der Brechungsindex und/oder die tatsächliche Dicke des Materials variieren; das Auge kann die Phasenvariation jedoch nicht wahrnehmen. Aus diesem Grunde färbt man zum Beispiel farblose Objekte in der Mikroskopie an und verwandelt auf diese Weise Phasenobjekte in Amplitudenobjekte. Oft führt aber auch diese Methode nicht zu befriedigenden Ergebnissen, weil z. B. der verwendete Farbstoff das Untersuchungsobjekt abtötet. Wie Sie sich erinnern, tritt Beugung dann auf, wenn ein Teil der Fläche konstanter Phase verdeckt wird, d. h., wenn ein Abschnitt der Wellenfront in der Amplitude oder der Phase (der Form) verändert wird. Nehmen wir an, eine ebene Welle durchquere ein durchsichtiges Objekt, das die Phase in einem bestimmten Bereich der Wellenfront verzögert. Hinter dem Objekt ist die Welle nicht mehr vollständig eben, sondern sie enthält eine kleine „Vertiefung“, wo die Phase von der Probe verzögert wurde. Die Welle ist dann phasenmoduliert. Vereinfacht können wir uns vorstellen, dass die phasenmodulierte Welle EPM (r, t) (Abb. 13.42) sich aus der ursprünglich einfallenden ebenen Welle Ei (x, t) und einer lokalisierten Störung Ed (r, t) zusammensetzt. (Mit dem Symbol r soll angedeutet werden, dass EPM und Ed von x, y und z abhängen, sich also in der yz-Ebene ändern, wohingegen Ei dies nicht tut.) Ist die Phasenverzögerung nur geringfügig, so besteht die lokalisierte Störung in einer Welle sehr kleiner Amplitude, E0d , die der restlichen Welle um λ/4 nacheilt (Abb. 13.43). Man sieht in der Abbildung, dass die Differenz zwischen EPM (r, t) und Ei (x, t) gleich Ed (r, t) ist. Man nennt Ei (x, t) die direkte Welle oder Welle nullter Ordnung, während Ed (r, t) die Beugungswelle ist. Erstere erzeugt in Σi ein gleichmäßig ausgeleuchtetes Feld, das nicht vom Objekt beeinflusst ist, Letztere trägt dagegen die gesamte Information, die die optische Struktur des Objekts betrifft. Die Raumfrequenzglieder höherer Ordnung divergieren zunächst ausgehend vom Objekt (Abschn. 13.2.2) und werden dann in der Bildebene gesammelt. Die direkte und die Beugungswelle sind bei der Vereinigung um π/2 außer Phase. Es bildet sich wieder die phasenmodulierte Welle. Da die Amplitude dieser rekonstruierten Welle EP M (r, t) überall auf Σi gleich ist, obwohl sich die Phase von einem Punkt zum anderen ändert, ist auch die Flussdichte einheitlich. Folglich sieht man kein Bild des Objekts. Das Spektrum nullter Ordnung eines Phasengitters ist in ähnlicher Weise um π/2 bezüglich der Spektren höherer Ordnung verschoben.

13.2 Das Bild als räumliche Verteilung optischer Information

1231

Objekt außerhalb der Achse Dia

Punktquelle

Durchlichtkondensor

Objekttr¨ager (Glas)

Phasenobjekt phasenmodulierte Wellenfront

ebene Wellen Objektiv Querschnitte der Phasenebene

Negativ

Bild

Positiv

Abb. 13.42: Anordnung zum Phasenkontrast.

Könnten wir den Phasenunterschied zwischen der direkten und der Beugungswelle vor der Rekombination zusätzlich um π/2 erhöhen, dann wären die Wellen noch immer kohärent und könnten konstruktiv oder destruktiv interferieren (Abb. 13.44). In beiden Fällen würde daraus eine Amplitudenmodulation der rekonstruierten Welle im Bereich des Bildes resultieren, d. h., das Bild wäre sichtbar. Diese Überlegungen lassen sich analytisch leicht nachzuvollziehen. Dazu sei Ei (x, t) |x=0 = E0 sin ωt die einfallende monochromatische Lichtwelle in Σ0 , wenn sich kein Objekt im Strahlengang befindet. Der Gegenstand bewirkt eine ortsabhängige Phasenänderung φ (y, z), sodass die Welle, die den Gegenstand verlässt, gegeben ist durch EP M (r, t) |x=0 = E0 sin [ωt + φ (y, z)] .

(13.20)

Dies ist eine Welle mit konstanter Amplitude; in der Bildebene erscheint sie im Wesentlichen ebenso. Genauer gesagt treten zwar Verluste auf, wenn aber die Linse

13 Moderne Optik

1232 Phasenobjekt

x Ed (t)

Ei (t)

EP M (t)

Ei (t) phasenmodulierte Welle

Momentaufnahme zum Zeitpunkt t

Eod

Eo Ed (t)

x lokalisierte Welle

Ei (t)

ebene Welle EP M (t) phasenmodulierte Welle Eo ebene Welle Eo

Eod lokalisierte Welle

Zeiger

Die Phasendifferenz beträgt ≈ 90◦ .

Abb. 13.43: Wellenfronten beim Phasenkontrast.

groß und frei von Abbildungsfehlern ist und wir die Orientierung und Größe des Bildes vernachlässigen, reicht Gleichung (13.20) aus, um die phasenmodulierte Welle sowohl auf Σ0 als auch auf Σi darzustellen. Wir formulieren die Welle um, EP M (y, z, t) = E0 sin ωt cos φ + E0 cos ωt sin φ , und beschränken uns auf sehr kleine Werte von φ. So ergibt sich EP M (y, z, t) = E0 sin ωt + E0 φ (y, z) cos ωt . Im Gegensatz zum ersten Term hängt der zweite Term vom Gegenstand ab. Wenn wir also, wie oben beschrieben, die relative Phase um π/2 ändern, indem wir vom Kosinus zum Sinus übergehen oder umgekehrt, erhalten wir EAM (y, z, t) = E0 [1 + φ (y, z)] sin ωt .

(13.21)

Dies ist eine amplitudenmodulierte Welle. Wenn man φ (y, z) als Fourierentwicklung aufschreibt, kommen die mit dem Objekt verbundenen Raumfrequenzen ins Spiel. Übrigens äußerte 1936 E. H. Armstrong genau diese Überlegungen, als er nach einer

13.2 Das Bild als räumliche Verteilung optischer Information

1233

um verzögert

(a)

um vorauseilend

(b)

Abb. 13.44: Auswirkungen von Phasenverschiebungen.

Methode suchte, um amplitudenmodulierte (AM) Radiowellen in frequenzmodulierte (FM) umzuwandeln. [Dazu kann man sich φ (t) als Frequenzmodulation vorstellen, wobei der Term nullter Ordnung die Trägerfrequenz ist.] Mithilfe eines elektrischen Bandfilters wurde die Trägerfrequenz vom restlichen Spektrum getrennt und die Phasenverschiebung um π/2 vorgenommen. Im Wesentlichen dasselbe erreicht man mit der folgenden, von Zernike entwickelten Methode. Zernike brachte ein räumliches Filter in die Transformiertenebene Σt des Objektivs, welches die π/2-Phasenverschiebung bewirkte. Das direkte Licht bildet ein kleines Bild der Lichtquelle auf der optischen Achse in Σt . Als Filter ließ sich deshalb eine kleine, kreisrunde Vertiefung der Tiefe d verwenden, die in eine durchsichtige Glasplatte mit dem Brechungsindex ng geätzt war. Im Idealfall tritt nur der direkte Strahl durch diese Vertiefung, wobei er einen Phasenvorlauf von (ng − 1) d gegenüber der gebeugten Welle gewinnt. Man kann dafür sorgen, dass diese Phasenverschiebung gerade λ/4 ist. Filter dieser Art nennt man Phasenplättchen. Sie bewirken, wie in Abbildung 13.44 b dargestellt, destruktive Interferenz. Phasenobjekte, die dicker als das Plättchen sind oder einen höheren Brechungsindex haben, erscheinen deshalb dunkel vor einem hellen Hintergrund. Hätte das Phasenplättchen keine kreisförmige Vertiefung, sondern eine ebensolche Erhöhung, so träfe das Gegenteil zu. Die erste Situation nennt man positiven Phasenkontrast, die zweite negativen Phasenkontrast. In der Praxis erhält man ein helleres Bild, indem man anstelle einer Punktquelle eine ausgedehntere Lichtquelle mit einem Durchlichtkondensor verwendet. Die austretenden ebenen Wellen beleuchten eine ringförmige Blende (Abb. 13.45), welche die Quellenebene bildet und deshalb zur Transformiertenebene des Objektivs konjugiert ist. In der Abbildung sehen Sie die Wellen nullter Ordnung, die entsprechend

13 Moderne Optik

1234

Phasenplattten

konjugierte Ebenen

ringf¨ormige Blende in der hinteren Brennebene eines hier nicht gezeigten Durchlichtkondensors

positiv

negativ

Kondensor Dia Objektiv

Phasenplatte (durchsichtig)

konjugierte Ebenen

Abb. 13.45: Phasenkontrast; gezeigt ist nur die nullte Ordnung.

den Gesetzen der geometrischen Optik durch das Objekt laufen und anschließend das ringförmige dünnere Gebiet des in Σt befindlichen Phasenplättchens passieren. Dieser dünnere Ring ist sehr schmal, sodass ihn der größte Teil des gebeugten Strahlenbündels verfehlt. Bringt man nun auf diesem Ring ein absorbierendes Medium (z. B. eine dünne Metallfolie) an, so wird der sehr große, gleichförmige Term nullter Ordnung (Abb. 13.46) im Vergleich zu den Termen höherer Ordnung abgeschwächt. Auf diese Weise wird der Kontrast verbessert, oder, anders ausgedrückt, E0 auf einen Wert im Bereich der Beugungswelle, E0d , abgesenkt. Mikroskope enthalten in der Regel mehrere solche Phasenplättchen mit verschiedenen Absorptionseigenschaften. In der Terminologie der modernen Optik versteht man unter Phasenkontrast einfach die Einführung einer Phasenverschiebung um λ/2 in das Spektrum nullter Ordnung der Fouriertransformierten eines Phasenobjekts mithilfe eines geeigneten räumlichen Filters (gegebenenfalls unter gleichzeitiger Abschwächung der zugehörigen Amplitude). Für sein Phasenkontrastmikroskop wurde Zernike 1953 der Nobelpreis verliehen. Das Gerät wird in vielen verschiedenen Bereichen eingesetzt (Fotos S. 1235). Zu den faszinierendsten Anwendungen gehört sicherlich die Untersuchung von physiologischen Vorgängen in Organismen, die mit bloßem Auge nicht sichtbar sind.

13.2 Das Bild als räumliche Verteilung optischer Information

elektrische Feldamplitude

1235

elektrische Feldamplitude

(a)

(b)

Abb. 13.46: Feldamplitude innerhalb eines kreisförmigen Gebietes in der Bildebene. (a) Absorbiert die Phasenplatte nicht, so zeigt die Bestrahlungsstärke eine kleine Erhöhung auf einem hohen Plateau. (b) Bei Dämpfung der nullten Ordnung nimmt der Kontrast zu.

(a)

(b)

(a) Konventionelle mikroskopische Aufnahme von Diatomeen, Pflanzenfasern und Bakterien. (b) Phasenaufnahme der gleichen Szene. (Fotos mit frdl. Genehmigung von T. J. Lowery und R. Hawley.)

13.2.5 Die Dunkelfeld- und die Schlierenmethode Kehren wir zu Abbildung 13.42, einer Anordnung zur Untersuchung eines Phasenobjekts, zurück. Wir wollen die in der Mitte liegende nullte Ordnung jetzt aber nicht nur verzögern und dämpfen, sondern mithilfe einer undurchsichtigen Scheibe in So vollständig entfernen. Befindet sich das Objekt nicht im Strahlengang, dann ist die Bildebene vollkommen dunkel (Dunkelfeld). Nach dem Einfügen des Objekts entsteht das Bild in Σi ausschließlich aus der lokalisierten Beugungswelle. (In der Mikroskopie erreicht man dies, indem man das Objekt schräg beleuchtet, sodass kein Licht direkt in die Objektivlinse fällt.) Eliminiert man den Gleichlichtterm, so wird die Amplitudenverteilung (siehe Abb. 13.46) abgesenkt, und Anteile, die vor der Filterung nahe bei null lagen, werden negativ. Da die Bestrahlungsstärke proportional zum Betragsquadrat der Amplitude ist, kommt es auf diese Weise zu einer Art Kontrastumkehr

13 Moderne Optik

1236

Schlierenaufnahme eines Löffels in einer Kerzenflamme. (Foto E. H.)

Versuchskammer (Windkanal) (a)

ko

nj

ug

ier

te

Eb

en en

Versuchskammer

(b)

Abb. 13.47: Schlieren-Anordnung.

13.2 Das Bild als räumliche Verteilung optischer Information

1237

bezüglich der Situation des Phasenkontrasts (siehe Abschn. 13.2.3). Dieses Verfahren liefert allgemein weniger befriedigende Ergebnisse als die Phasenkontrastmethode, bei welcher eine Flussdichteverteilung in der Bildebene entsteht, die zu der über dem Objekt hervorgerufenen Phasenänderung proportional ist. 1864 führte A. Toepler die so genannte Schlierenmethode zum Auffinden von Materialfehlern in Linsen ein. Wir wollen diese Technik kurz vorstellen, da sie erstens mittlerweile in der Hydrodynamik verbreitet eingesetzt wird und zweitens ein anschauliches Beispiel für die Anwendung der räumlichen Filterung ist. Schlierensysteme verwendet man überall dort, wo sich Druckvariationen als Änderungen des Brechungsindex äußern, z. B. in der Ballistik, der Aerodynamik oder bei der Analyse von Ultraschallbildern (siehe Foto S. 1236 oben). Betrachten wir dazu eine der möglichen Versuchsanordnungen zur Beobachtung der Fraunhofer-Beugung (etwa Abb. 10.3 oder Abb. A.10.4). Wir verwenden aber nun kein beugendes Amplitudenobjekt wie eine Blendenöffnung, sondern ein Phasenobjekt, z. B. eine gasgefüllte Messkammer (Abb. 13.47). In Σt entsteht wieder ein FraunhoferMuster, und wenn man hinter diese Ebene das Objektiv einer Kamera bringt, dann erhält man auf dem Film ein Bild der Messkammer. Wir könnten damit beliebige Amplitudenobjekte im Versuchsraum fotografieren, Phasenobjekte wären jedoch nach wie Kondensor

Hg-Hochdrucklichtbogen

Filter

nullte Ordnung

Parabolspiegel

Parabolspiegel

eine gebeugte Welle

Messkammer

Messerschneide

Kameraobjektiv Brennebene (Photoplatte)

Abb. 13.48: Schlieren-Anordnung mit Spiegeln.

13 Moderne Optik

1238

vor unsichtbar. Nun bringen wir eine Messerklinge von unten her in Σt und heben sie so lange an, bis sie das Licht nullter Ordnung (manchmal nur teilweise) und damit auch aller höheren Ordnungen auf der Unterseite verdeckt. Jetzt erkennen wir, wie bei der Dunkelfeldmethode, auch Phasenobjekte, außerdem Inhomogenitäten in den Fenstern der Messkammer sowie Materialfehler in den Linsen. Letzteres stört natürlich, weshalb man heutzutage meist auf Spiegelsysteme (Abb. 13.48) zurückgreift, die außerdem ein größeres Blickfeld ermöglichen. Will man Daten elektronisch auswerten, z. B. mit einem Photodetektor, dann arbeitet man in aller Regel mit quasimonochromatischer Beleuchtung. Andererseits erlauben Lichtquellen mit großer spektraler Bandbreite eine bessere Ausnutzung der Farbempfindlichkeit fotografischer Emulsionen, weshalb auch Farbschlierensysteme in verschiedenen Varianten im Einsatz sind.

13.3 Holografie Fotografische Verfahren gibt es schon lange, und wir haben uns mittlerweile daran gewöhnt, die dreidimensionale Welt in eine Papierebene gepresst zu sehen. Aus dem Fernsehapparat lächelt uns ein Moderator ohne Tiefe an, der zwar zweifellos existiert, aber auch nicht greifbarer und wirklicher erscheint als der Eiffelturm auf einer Postkarte. Das Problem besteht darin, dass man mit traditionellen Mitteln nicht das Lichtfeld abbilden kann, welches das Objekt ursprünglich umgab, sondern nur punktweise das Quadrat der Feldamplitude aufzeichnet. Licht, das von einem Foto reflektiert wird, informiert den Betrachter zwar über die Bestrahlungsstärke, aber nicht über die Phase der vom Objekt ausgehenden Welle. Könnte man dagegen sowohl die Amplitude als auch die Phase der ursprünglichen Welle rekonstruieren, dann erhielte man ein Lichtfeld, das nicht vom Original zu unterscheiden wäre (vorausgesetzt, die Frequenzen wären gleich). Das heißt, Sie könnten ein vollständig dreidimensionales Bild sehen (bzw. fotografieren), das die perfekte Illusion vermittelt, das Objekt stände vor Ihnen.

13.3.1 Verfahren Nach etlichen Jahren des Nachdenkens unternahm Dennis Gabor 1947 seine inzwischen berühmten Holografieversuche am Forschungslabor der britischen ThomsonHouston Company. Seine erste Anordnung, zu sehen in Abbildung 13.49, bestand in einem linsenfreien zweistufigen Abbildungsprozess. Dabei wurde zunächst ein

Dennis Gabor (1900–1977). Der in Ungarn geborene britische Physiker erhielt 1971 den Nobelpreis.

13.3 Holografie

1239

Abb. 13.49: Holografische Aufnahme und Rekonstruktion eines Bildes (die Elemente befinden sich in einer Linie).

Interferenzmuster fotografiert, das durch die Wechselwirkung einer kohärenten Referenzwelle mit quasimonochromatischem, an einem Gegenstand gestreuten Licht entstanden war. Das so erzeugte Muster nannte Gabor Hologramm (nach griech. holo, „ganz“). Im zweiten Prozessschritt wurde das optische Feld des Gegenstandes rekonstruiert, und zwar durch Beugung eines kohärenten Strahls am entwickelten Hologramm (in Form eines Dias). Auf eine Weise, die an Zernikes Phasenkontrastverfahren (Abschn. 13.2.4) erinnert, entstand das Hologramm durch die Interferenz der ungestreuten Hintergrund- oder Referenzwelle mit der an dem kleinen, halb durchsichtigen Objekt S (damals oft ein Stück Mikrofilm) gebeugten Welle. Der entscheidende Punkt ist, dass das Interferenzmuster oder Hologramm in Form der Streifenanordnung Informationen sowohl über die Amplitude als auch über die Phase der am Gegenstand gestreuten Welle enthält. Zugegebenermaßen ist es nicht sofort einzusehen, warum man ein originalgetreues, dreidimensionales Bild des Gegenstandes rekonstruieren kann, indem man eine ebene Welle durch das verarbeitete Hologramm schickt. Momentan soll uns folgende Erklärung genügen: Ist der Gegenstand sehr klein, dann ist die gestreute Welle nahezu kugelförmig und das Interferenzmuster besteht aus konzentrischen Ringen, deren Mittelpunkt auf einer Achse durch den Gegenstand und senkrecht zur ebenen Welle liegt.

1240

13 Moderne Optik

Abgesehen davon, dass sich die Bestrahlungsstärke der Ringe schrittweise von einem zum nächsten ändert, entspricht die resultierende Flussdichteverteilung derjenigen einer gewöhnlichen fresnelschen Zonenplatte (siehe Abschn. 10.3.5). Sie werden sich erinnern, dass eine Zonenplatte in gewisser Hinsicht wie eine Linse wirkt: Sie beugt kollimiertes Licht in einen Strahl, der in einem reellen Brennpunkt Pr zusammenläuft. Außerdem erzeugt sie eine divergierende Welle, die scheinbar von Pr kommt und ein virtuelles Bild entstehen lässt. Etwas vereinfacht können wir uns also vorstellen, dass jeder Punkt eines ausgedehnten Objekts eine eigene Zonenplatte erzeugt, die gegenüber allen anderen verschoben ist, und die Gesamtheit all dieser, einander zum Teil überlagernder Zonenplatten ist das Hologramm.17 Während der Rekonstruktion bildet jede einzelne Zonenplatte sowohl ein reelles als auch ein virtuelles Bild des jeweiligen Objektpunktes, und so entsteht Punkt für Punkt das ursprüngliche Lichtfeld. Hat das Rekonstruktionslicht dieselbe Wellenlänge wie das Aufzeichnungslicht (was nicht notwendigerweise der Fall sein muss und es oft tatsächlich nicht ist), dann erscheint das virtuelle Bild ohne Verzerrungen an der zuvor vom Gegenstand eingenommenen Position. Das bedeutet, dem Objektfeld entspricht das virtuelle Bildfeld. Aus diesem Grund nennt man das virtuelle Bild auch das wahre Bild und das reelle Bild das konjugierte. In jedem Fall ist ein Hologramm als Überlagerung von Interferenzmustern aufzufassen, welche in den einfachsten Fällen Zonenplatten ähneln. Wie wir im Anschluss sehen werden, ist das Sinusgitter ein für Hologramme ebenso fundamentales Interferenzsystem. Gabors Forschung, für die er 1971 den Nobelpreis für Physik erhielt, hatte eigentlich eine Verbesserung der Elektronenmikroskopie zum Ziel. Anfangs erregte Gabor mit seinen Resultaten zwar ein gewisses Interesse, alles in allem gerieten die Erkenntnisse jedoch für rund 15 Jahre in Vergessenheit. Erst zu Beginn der 1960er-Jahre beschäftigte man sich wieder mit der Wellenfrontrekonstruktion, zunächst im Zusammenhang mit bestimmten Problemen der Radartechnik. Inzwischen stand aber das kohärente Laserlicht zur Verfügung, und die Holografie wurde innerhalb kurzer Zeit zu einem vielversprechenden und dynamischen Forschungsfeld. Der Ausgangspunkt dieser Wiederbelebung war das Labor für Radartechnik an der University of Michigan. Emmett N. Leith und Juris Upatnieks führten dort u. a. eine verbesserte Anordnung zur Erzeugung von Hologrammen ein, die in Abbildung 13.50 skizziert ist. Bei Gabors einzeiligem Aufbau war das konjugierte Bild lästigerweise vor dem wahren Bild entstanden – jetzt dagegen waren beide Bilder in befriedigender Weise außerhalb der Achse voneinander getrennt, wie die Skizze zeigt. Wieder ist das Hologramm ein Interferenzmuster, das aus einer kohärenten Referenzwelle und einer am Objekt gestreuten Welle entsteht (man nennt dies auch ein Nebenband-Fresnelhologramm). Abbildung 13.51 zeigt eine äquivalente Anordnung zur Erzeugung von NebenbandFresnelhologrammen durchsichtiger Objekte. 17

Siehe M. P. Givens, „Introduction to Holography“, Am. J. Phys. 35 (1967) 1056.

13.3 Holografie

1241

Spiegel

Gegenstand

Photoplatte

Hologramm virtuelles Bild

Rekonstruktion

reelles Bild

Abb. 13.50: Holografische (Nebenband-)Aufzeichnung und Rekonstruktion eines Bildes.

Wir können die Situation in zweierlei Hinsicht erklären, einmal bildlich anhand der Fourieroptik und zum anderen auf direkt mathematischem Wege. Beide Ansätze ergänzen einander, wie wir gleich sehen werden. In erster Linie handelt es sich natürlich um ein Interferenz- (oder, wenn Sie wollen, Beugungs-) Problem. Daher können wir auf unsere Beschreibung der komplexen Objektwellenfront, zusammengesetzt aus Fourierkomponenten in Form ebener Wellen (Abbn. 7.52 und 10.7 d), zurückkommen. Diese ebenen Wellen breiten sich in Richtungen aus, die mit den verschiedenen Raumfrequenzen des Lichtfeldes des Objekts (reflektiert oder durchgelassen) verknüpft sind. Auf der Fotoplatte interferiert jede ebene Fourier-Welle mit der Referenzwelle. Die zur jeweiligen Raumfrequenz gehörende Information wird auf diese Weise in Form eines charakteristischen Interferenzmusters dauerhaft gespeichert.

Spiegel

EB

EO Gegenstand

Fotoplatte

Abb. 13.51: Anordnung zur Erzeugung von Nebenband-Fresnelhologrammen durchsichtiger Objekte.

13 Moderne Optik

1242

Referenzwelle

am Objekt gestreuter Wellenzug

(a)

(c)

(b)

Abb. 13.52: Interferenz zweier ebener Wellen, wobei ein Kosinusgitter entsteht.

Um diesen Vorgang zu verstehen, betrachten wir die vereinfachte Darstellung mit zwei Wellen in Abbildung 13.52. Im hier festgehaltenen Augenblick hat die Referenzwelle gerade einen Wellenberg an der Frontseite des Films, und die Wellenberge der im Winkel θ einfallenden Streuwelle liegen in den Punkten A, B und C. In diesen Punkten entstehen im gezeigten Moment Interferenzmaxima. Beim Fortschreiten beider Wellen nach rechts bleiben sie in diesen Punkten phasengleich, Täler überlagern einander, und die Maxima in A, B und C bleiben erhalten. Zwischen diesen Punkten überlagern Wellenberge jeweils Wellentäler und es entstehen Minima. Die relative Phase φ der

13.3 Holografie

1243

beiden Wellen ist auf dem Film von Punkt zu Punkt verschieden und kann als Funktion von x formuliert werden. Wenn x um die Länge der Strecke AB zunimmt, ändert sich φ um 2π, deshalb gilt φ/2π = x/AB. Wegen sin θ = λ/AB können wir die Länge von AB eliminieren und erhalten als allgemeine Phase φ (x) = (2πx sin θ) /λ .

(13.22)

Haben beide Wellen dieselbe Amplitude E0 , dann folgt das resultierende Feld aus Gleichung (7.17)   φ φ , E = 2E0 cos sin ωt − kx − 2 2 und die Verteilung der Bestrahlungsstärke, die proportional zum Quadrat der Feldamplitude ist, erhält mithilfe von Gleichung (3.44) die Form   φ 2 φ c0 2E0 cos = 2c0 E02 cos2 I (x) = 2 2 2 oder I (x) = 2c0 E02 + 2c0 E02 cos φ .

(13.23)

Wir haben in der Filmebene also eine kosinusförmige Verteilung der Bestrahlungsstärke mit der räumlichen Periode AB und der Raumfrequenz 1/AB = sin θ/λ. Entwickelt man den Film so, dass das Profil des Amplitudendurchgangs gerade I (x) entspricht, erhält man ein Kosinusgitter. Wird dieses einfache Hologramm (das einem unstrukturierten „Gegenstand“ ohne Informationsgehalt entspricht) mit einer ebenen Welle beleuchtet, die identisch mit der ursprünglichen Referenzwelle (Abb. 13.52 c) ist, so treten drei Strahlen aus, einer davon nullter Ordnung, die anderen beiden erster Ordnung. Einer der Strahlen erster Ordnung breitet sich in gleicher Richtung wie der ursprüngliche Gegenstandsstrahl aus und entspricht dessen rekonstruierter Wellenfront. Gehen wir nun einen Schritt über dieses einfachste Hologramm hinaus und untersuchen wir einen Gegenstand mit einer optischen Struktur. Wir wählen ein Dia mit einem unkomplizierten periodischen Muster, das eine einzige Raumfrequenz aufweist, etwa ein Kosinusgitter. Abbildung 13.53 zeigt hiervon eine leicht vereinfachte Darstellung, wobei die schwachen Terme höherer Ordnung weggelassen wurden, die aufgrund der endlichen Ausmaße des Strahls und des Gitters entstehen. Sie sehen das beleuchtete Gitter, die drei durchgelassenen Strahlen und den Referenzstrahl. Das Resultat ist eine abgewandelte Version von Abbildung 13.52: Jeder der drei durchgelassenen Strahlen bildet einen etwas anderen Winkel θ mit dem Referenzstrahl. Alle drei Überlagerungsgebiete enthalten daher eine Serie von Kosinusstreifen mit einer geringfügig anderen Raumfrequenz gemäß Gleichung (13.22). Beim Betrachten des entstandenen Hologramms (Abbn. 13.53 a und b) spielen wieder die ungebeugte Welle, das virtuelle Bild und das reelle Bild eine Rolle. Nur dort, wo alle drei Strahlen aufeinander treffen und

13 Moderne Optik

1244

Referenzwelle Rekonstruktionswelle Gegenstandswellen Kosinusgitter Photoplatte

virtuelles Bild (b)

(a)

Hologramm reelles Bild

Abb. 13.53: Es gibt drei Bereiche mit verschiedenen Raumfrequenzen. Jede erzeugt auf dem wieder beleuchteten Hologramm drei Wellen.

jeweils ihren Informationsgehalt (die Raumfrequenz) beitragen, entstehen Bilder des ursprünglichen Gitters. Verwenden wir ein strukturierteres Objekt, so können wir erwarten, dass die relative Phase von Gegenstands- und Referenzwelle, φ, sich von Punkt zu Punkt in komplizierter Weise ändert und auf diese Weise das Trägersignal (Abb. 13.54) moduliert, welches zwei ebene Wellen ohne Vorhandensein des Gegenstandes erzeugen. Abbildung 13.53 verallgemeinernd können wir folgern, dass der Phasenunterschied φ (eine Funktion von θ) in der Anordnung der Streifen codiert ist. Waren außerdem die Amplituden von Gegenstands- und Referenzwelle verschieden, so wurde die Bestrahlungsstärke der betreffenden Streifen beeinflusst. Wir können deshalb vermuten, dass die Amplitude der Gegenstandswelle in jedem Punkt der Filmebene in der Sichtbarkeit der einzelnen Interferenzstreifen codiert ist.

(a)

(b)

(c)

Abb. 13.54: Verschiedene Grade der Modulation von Hologrammstreifen. (Mit frdl. Genehmigung von Emmett N. Leith und Scientific American.)

13.3 Holografie

1245

Der in Abbildung 13.50 schematisch gezeigte Vorgang kann wie folgt analytisch erfasst werden. Dazu sei die xy-Ebene die Ebene ΣH des Hologramms. Dann beschreibt EB (x, y) = E0B cos [2πνt + φ (x, y)]

(13.24)

die ebene Hintergrund- oder Referenzwelle in ΣH , wobei wir die Polarisation unberücksichtigt lassen wollen. Die Amplitude E0B dieser Welle ist konstant, ihre Phase dagegen ortsabhängig. Die Referenzwelle ist also in bestimmter Weise gegen ΣH geneigt. Wäre die Welle z. B. so ausgerichtet, dass sie sich durch eine einfache Drehung um einen Winkel θ um die y-Achse mit ΣH zur Deckung bringen ließe, dann hinge die Phase in jedem Punkt der Hologrammebene von dessen x-Wert ab. φ nähme wieder die Form 2π x sin θ = kx sin θ φ= λ an, wäre demnach im speziellen betrachteten Fall unabhängig von y und eine lineare Funktion von x. Der Einfachheit halber schreiben wir allgemein φ (x, y) und denken daran, dass es sich dabei um eine einfache bekannte Funktion handelt. Die am Objekt gestreute Welle ist nun EO (x, y) = E0O (x, y) cos [2πνt + φ0 (x, y)] ,

(13.25)

wobei sowohl die Amplitude als auch die Phase komplizierte Funktionen des Ortes sind, die einer unregelmäßigen Wellenfront entsprechen. Aus nachrichtentechnischer Sicht handelt es sich um eine amplituden- und phasenmodulierte Trägerwelle, die sämtliche verfügbare Information über das Objekt enthält. Diese Information ist nicht in zeitlichen, sondern in räumlichen Variationen der Welle codiert. Die beiden Wellen EB und EO überlagern einander, und durch Interferenz entsteht eine Bestrahlungsstärkeverteilung, die von der fotografischen Emulsion aufgezeichnet wird. Für die resultierende Bestrahlungsstärke gilt, abgesehen von einem konstanten Faktor, ) ( 2 , was gemäß Abschnitt 9.1 gleich I (x, y) = (EB + EO ) T

2 E0O + E0B E0O cos (φ − φO ) (13.26) 2 2 ist. Wie Sie sehen, ist die Position der Minima und Maxima der Bestrahlungsstärke auf ΣH wieder durch die Phase der Gegenstandswelle bestimmt. Außerdem enthält der Kontrast oder die Sichtbarkeit

I (x, y) =

2 E0B

+

V ≡ (Imax − Imin ) / (Imax + Imin ) in der Hologrammebene, gegeben durch  2  2 + E0O , V = 2E0B E0O / E0B die zugehörige Information über die Amplitude der Gegenstandwelle.

[12.1]

(13.27)

13 Moderne Optik

1246

In der Terminologie der Nachrichtentechnik ist der Film also sowohl das Speicher- als auch das Nachweismedium. An seiner Oberfläche entsteht eine Verteilung undurchsichtiger Bereiche, die einer modulierten räumlichen Wellenform entspricht. Der dritte Term in Gleichung (13.27), die Differenzfrequenz, ist dann infolge der Ortsabhängigkeit von E0O (x, y) und φO (x, y) sowohl amplituden- als auch phasenmoduliert. In Abbildung 13.54 b wurde ein Teil eines Interferenzmusters, des Hologramms eines einfachen, im Wesentlichen zweidimensionalen, halbdurchlässigen Objekts, vergrößert. Wären die beiden interferierenden Wellen ideal eben wie in Abbildung 13.54 a, so ergäbe sich das bekannte youngsche Beugungsmuster (Abschn. 9.3) und die sichtbaren, die Information enthaltenden Schwankungen in der Position und Helligkeit der Ringe würden fehlen. Man kann sich die sinusförmige Struktur des Transmissionsgitters in Abbildung 13.54 a als Trägersignal vorstellen, dem die Information aufmoduliert wurde. Außerdem kann man sich überlegen, dass die modulierten Streifen der Abbildung 13.54 b durch kohärente Überlagerung unzähliger Zonenplatten (je einer für jeden Punkt eines ausgedehnten Objekts) entstanden sind. Wäre die Modulation noch deutlicher, etwa im Falle eines großen, dreidimensionalen, diffus reflektierenden Gegenstands, so würden die Streifen die in Abbildung 13.54 b noch erkennbare Regelmäßigkeit vollkommen verlieren. Auf Hologrammen sieht man übrigens oft Wirbel und konzentrische Ringsysteme, die durch Beugung an Staubteilchen und dergleichen zustande gekommen sind. Man kann erreichen, dass das Amplitudentransmissionsprofil des entwickelten Hologramms proportional zu I (x, y) ist. In diesem Fall ist die austretende Welle EF (x, y) proportional dem Produkt I (x, y) ER (x, y), wobei ER (x, y) die auf das Hologramm fallende Rekonstruktionswelle ist. Trifft eine Rekonstruktionswelle der Frequenz ν schräg auf ΣH , wie es auch für die Referenzwelle der Fall war, können wir demnach schreiben ER (x, y) = E0R cos [2πνt + φ (x, y)] .

(13.28)

Die endgültige Welle ergibt sich, abgesehen von einem konstanten Faktor, als Produkt der Gleichungen (13.26) und (13.28):  2  1 2 + E0O cos [2πνt + φ (x, y)] EF (x, y) = E0R E0B 2 1 + E0R E0B E0O cos (2πνt + 2φ − φO ) 2 1 + E0R E0B E0O cos (2πνt + φO ) . 2

(13.29)

Das vom Hologramm ausgehende Licht wird demnach durch drei Terme beschrieben. Der Erste kann auch in der Form  1 2 2 E0B + E0O ER (x, y) 2

13.3 Holografie

1247

geschrieben werden, es handelt sich dabei um eine amplitudenmodulierte Variante der Rekonstruktionswelle. Letzten Endes wirkt jeder Bereich des Hologramms als Beugungsgitter, und dieser erste Term entspricht dem direkten (ungebeugten) Strahl nullter Ordnung. Er ist für uns kaum von Interesse, da er keine Information über φO , die Phase der Objektwelle, enthält. Die nächsten beiden Terme, die so genannten Nebenbandwellen, sind der Summenbzw. Differenzterm, die beiden am gitterähnlichen Hologramm gebeugten Wellen erster Ordnung. Der erste Term, der Summenterm, beschreibt eine Welle, deren Amplitude abgesehen von einem konstanten Faktor gleich derjenigen der Objektwelle E0O (x, y) ist. Ihre Phase enthält außerdem einen Beitrag 2φ (x, y), der, wie Sie sich erinnern werden, aus der Neigung der Referenz- und der Rekonstruktionswelle bezüglich ΣH stammt. Dieser Phasenfaktor sorgt für den Winkelabstand zwischen dem reellen und dem virtuellen Bild. Der Summenterm enthält nicht die Phase der Objektwelle, sondern deren negativen Wert. Diese Welle führt demnach alle erforderlichen Informationen über das Objekt mit, aber in nicht vollkommen richtiger Weise. Tatsächlich handelt es sich um das reelle Bild, das im konvergierenden Licht hinter dem Hologramm (also zwischen dem Hologramm und dem Betrachter) entsteht. Die negative Phase äußert sich in einem tiefenverkehrenden Effekt, wie man ihn ähnlich beim Vertauschen der Elemente eines Stereobildpaares beobachten kann: Erhabene Regionen erscheinen als Vertiefungen, und Bildpunkte, die vor ΣH lagen, sieht man nun hinter ΣH (wobei die Position relativ zu anderen Bildpunkten erhalten bleibt); der Objektpunkt, der einem Betrachter am nächsten liegt, erscheint im reellen Bild am weitesten entfernt. Die Szenerie wird in sich selbst umgekehrt, was man möglicherweise selbst gesehen haben muss, um es richtig zu verstehen. Stellen Sie sich beispielsweise vor, Sie blicken auf das holografisch konjugierte Bild einer Kegelbahn: Die „hintere“ Kegelreihe wird zwar nach wie vor teilweise von den „vorderen“ Reihen verdeckt, sie scheint Ihnen aber trotzdem näher zu liegen als der Königskegel. Sie sehen die Anordnung jedoch, wohlgemerkt, auch nicht von hinten, denn niemals wurde Licht aufgezeichnet, das von den hinteren Kegeln kam, sondern Sie erblicken eine wölbungsverkehrte Vorderansicht. Solche Bilder sind im Allgemeinen von geringem Wert. Man kann ihre Wölbung wieder richtig stellen, indem man ein zweites Hologramm mit dem reellen Bild als Gegenstand bildet. Der Differenzterm in Gleichung (13.29) hat, abgesehen von einem konstanten Faktor, exakt die Form der Gegenstandswelle E0O (x, y). Könnten Sie in (nicht auf!) das beleuchtete Hologramm blicken, als ob es ein Fenster wäre, durch das man die Szene dahinter beobachten kann, dann „sähen“ Sie das Objekt vollkommen wirklichkeitsgetreu. Sie könnten den Kopf bewegen, um Einzelheiten zu erkennen, die vorher durch Gegenstände im Vordergrund verdeckt waren. Mit anderen Worten, die Illusion vollständiger Dreidimensionalität wird durch Parallaxeneffekte verstärkt, wie sie bei keinem anderen Abbildungsverfahren erzeugt werden können (siehe die Fotos S. 1248).

13 Moderne Optik

1248

(a)

(b)

(c)

(d)

Die Teile (b) bis (d) zeigen drei verschiedene Ansichten desselben holografischen Bildes, das aus dem Hologramm in (a) erzeugt wurde. (Fotos aus Smith, Principles of Holography.)

Stellen Sie sich vor, Sie schauen auf die holografische Abbildung einer Lupe, durch die man eine Seite eines Buches sieht. Wenn Sie Ihre Augen bezüglich der Hologrammebene bewegen, dann verändern sich tatsächlich die Buchstaben, die durch die Lupe (welche ja selbst nur eine Abbildung ist) vergrößert werden, genauso, als ob Sie durch eine „echte“ Linse auf eine „echte“ Druckseite sähen. Bei einer ausgedehnten Szene mit merklicher Tiefe müssten sich Ihre Augen jeweils neu scharfstellen, wenn Sie auf einen Gegenstand in einer anderen Entfernung blicken. In derselben Weise müsste ein Kameraobjektiv nachgezogen werden, wenn verschiedene Bereiche des virtuellen Bildes fotografiert werden sollten (Foto S. 1249).

13.3 Holografie

1249

(a)

(b)

Rekonstruiertes holografisches Bild eines Modellautos. Kameraposition und Scharfeinstellung sind verschieden. (Fotos aus O’Shea, Callen und Rhodes, An Introduction to Lasers and Their Applications.)

Hologramme haben weitere interessante und sehr wichtige Eigenschaften. Stellen Sie sich z. B. vor, Sie verdecken ein Fenster mit einer Pappe. Wenn Sie ein kleines Loch in die Pappe bohren, dann können Sie durch diese Öffnung immer noch die Außenwelt sehen. Dasselbe trifft für ein Hologramm zu: Jedes kleine Bruchstück der Aufnahme enthält Informationen über das gesamte Objekt, zumindest für einen bestimmten Blickwinkel, und aus jedem dieser Bruchstücke kann man das vollständige Bild rekonstruieren, wenn auch mit geringerer Auflösung. Abbildung 13.55 fasst den größten Teil der bisherigen Diskussion bildlich zusammen und zeigt außerdem, wie eine Anordnung zur Aufnahme und Betrachtung eines Hologramms tatsächlich aussehen könnte. Die fotografische Emulsion ist mit einer gewissen Tiefe dargestellt, im Gegensatz zu Abbildung 13.52, wo sie als rein zweidimensional behandelt wurde. Natürlich hat jede fotografische Schicht eine endliche Dicke. Sie beträgt ungefähr 10 µm, während die räumliche Periode der Streifen im Mittel ungefähr 1 µm beträgt. Abbildung 13.56 a zeigt die Art dreidimensionaler Streifen, die in Wirklichkeit in der gesamten Schicht gebildet werden, detaillierter. Im Falle ebener Wellen teilen die parallelen Streifenebenen den Winkel zwischen der Referenzund der Gegenstandswelle genau in zwei Teile. Beachten Sie, dass wir bisher alle Hologramme im Durchlicht betrachtet haben. Es handelte sich ausschließlich um Transmissionshologramme, die dadurch entstanden sind, dass Referenz- und Gegenstandswelle von derselben Seite auf den Film trafen. Etwas Ähnliches passiert, wenn Referenz- und Gegenstandswelle von verschiedenen Seiten durch die fotografische Schicht fallen (Abb. 13.56 b). Der Einfachheit halber soll es sich wieder um zwei ebene Wellen handeln. Das resultierende Interferenzmuster kann man sich veranschaulichen, indem man mit zwei Bleistiften die Fronten entlangfährt: Natürlich haben die Streifen die Form gerader Bänder (Ebenen) parallel

13 Moderne Optik

1250

Laser

Strahlteiler virtuelles Bild Laser Spiegel Gegenstandswelle

Spiegel

Gegenstand Rekonstruktionswelle Hologramm nz re fe lle Re we

Spiegel

Interferenzmuster Film (a)

(b)

Abb. 13.55: (a) Erzeugung eines Transmissionshologramms einer Spielzeuglokomotive. (b) Rekonstruktion des Bildes.

zur Oberfläche der Fotoplatte. Überlagert eine reale, sehr unebene Gegenstandswelle eine ebene, kohärente Referenzwelle, dann werden die geraden Streifen mit der Information über das Objekt moduliert. Das zugehörige dreidimensionale Beugungsgitter nennt man Reflexionshologramm. Bei der Rekonstruktion streut es den beleuchtenden Strahl zurück zum Betrachter und man sieht ein virtuelles Bild hinter dem Hologramm (als ob man in einen Spiegel blicken würde). Die holografischen Systeme, die wir bisher behandelt haben, konnten wir mithilfe der Zonenplatte interpretieren, und zwar ungeachtet dessen, ob gebeugte Wellen im Nahoder im Fernfeld vorlagen (d. h., ob es sich um Fresnel- oder Fraunhoferhologramme handelte). Diese Methode führt in der Tat stets zum richtigen Ergebnis, wenn das Interferogramm durch die Überlagerung der an den einzelnen Objektpunkten gestreuten kugelförmigen Elementarwellen und einer kohärenten, ebenen oder sogar kugelförmigen Referenzwelle entsteht – vorausgesetzt, die Krümmung der Referenzwelle unterscheidet sich von jener der Elementarwellen. Allen diesen Ansätzen ist folglich ein Problem gemeinsam, dessen Ursache √ darin liegt, dass die Radien der Zonenplatte, Rm , gemäß Gleichung (10.91) von m abhängen. Die Zonenstreifen liegen deshalb umso dichter, je weiter sie vom Mittelpunkt der zugehörigen Zonenlinse entfernt sind (je größer also m ist). Dies ist gleichbedeutend mit einer zunehmenden Raumfrequenz

13.3 Holografie

1251

(a)

(b)

Abb. 13.56: (a) Zwei ebene Wellen treffen von derselben Seite auf den Film, durch Interferenz entsteht ein Transmissionshologramm. (b) Zwei ebene Wellen treffen von verschiedenen Seiten auf den Film, durch Interferenz entsteht ein Reflexionshologramm. Brechungseffekte wurden jeweils vernachlässigt.

der hellen und dunklen Ringe, die von der Fotoplatte aufgezeichnet werden müssen. Demselben Problem begegnet man auch in der Kosinusgitter-Darstellung, wo die Raumfrequenz mit θ zunimmt. Ein Film kann aber, wie feinkörnig er auch immer ist, nicht unendlich viele Raumfrequenzen registrieren und deshalb nicht unendlich viele Daten aufzeichnen. So entsteht eine inhärente Auflösungsgrenze. Könnte man dagegen die mittlere Frequenz der Streifen konstant halten, so wäre man wesentlich weniger durch das fotografische Medium beschränkt, und die mögliche Auflösung nähme deutlich zu. Sogar eine grobkörnige Emulsion wie Polaroid P/N könnte dann ohne merkliche Verluste an Auflösung verwendet werden, vorausgesetzt, sie wäre in der Lage, die mittlere Raumfrequenz der Streifen zu registrieren. Abbildung 13.57 zeigt eine Anordnung, mit der man genau dies erreicht, indem man die gebeugten Elementarwellen einfach mit einer kugelförmigen Referenzwelle ungefähr derselben Krümmung interferieren lässt. Man erhält ein so genanntes Fourier-Hologramm (in unserem Fall handelt es sich um ein hoch aufgelöstes Hologramm eines linsenlosen Systems). Das Ziel dieser Anordnung besteht in der Aufhebung der quadratischen Ortsabhängigkeit der Phase (wie bei der Zonenlinse) auf ΣH durch die Referenzwelle. Exakt gelingt dies jedoch nur für ein ebenes, zweidimensionales Objekt. Im dreidimensionalen Fall (Abb. 13.58) erreicht man das Ziel nur in einer Ebene und erhält folglich ein Hologramm als Kombination beider Arten (Zonenlinse und Fourier-Typ). Im Gegensatz zu den bisher besprochenen Anordnungen sind beim Fourier-Hologramm beide Bilder virtuell; sie liegen in der gleichen Ebene und sind so orientiert, dass im Ursprung ein Symmetriezentrum liegt (siehe Foto S. 1253).

13 Moderne Optik

1252 durchsichtiger Gegenstand

Linse

Referenzloch punktförmig

einfallende ebene Welle

(a) Hologramm

Bild axialer Strahl Linse

Bild

Hologramm

Rekonstruktion

(b)

Abb. 13.57: Linsenfreie Fourierholografie eines durchsichtigen Objekts, (a) Aufnahme, (b) Wiedergabe.

Auch hier kommt die gitterartige Natur aller bis jetzt behandelten Hologramme eindeutig zum Ausdruck. Wenn Sie beispielsweise durch ein Fourier-Hologramm auf eine kleine Weißlichtquelle (etwa eine Taschenlampe in einem dunklen Zimmer) schauen, dann sehen Sie zwei Spiegelbilder, allerdings sehr verschwommen und von regenbogenfarbigen Bändern umgeben. Die Ähnlichkeit dieser Situation mit weißem Licht, das an einem Gitter gebeugt wurde, ist nicht zu übersehen.18 18

Siehe DeVelis und Reynolds, Theory and Applications of Holography; Stroke, An Introduction to Coherent Optics and Holography; Goodman, Introduction to Fourier Optics; Smith, Principles of Holography; The Engineering Uses of Holography, Hg. E. R. Robertson und J. M. Harvey.

13.3 Holografie

1253

Linse und Lochblende Laser

Spiegel

dreidimensionales Objekt ΣH

EO EB

Fotoplatte

Abb. 13.58: Linsenfreie Fourierholografie eines undurchsichtigen Objekts.

Rekonstruktion eines Fourierhologramms. (Aus G. W. Stroke, D. Brumm und A. Funkhauser, J. Opt. Soc. Am. 55 (1965) 1327.)

13.3.2 Entwicklungen und Anwendungen Abgesehen vom unvermeidlichen dreidimensionalen Plakat fand die Holografie in den ersten Jahren nach ihrer Entwicklung kaum Anwendungen. Typisch für diese Zeit sind unzählige Abbildungen von Spielzeugautos, Schachfiguren und kleinen Büsten – lauter kleinen Gegenständen, die stets auf großen Granitblöcken standen. Die Objekte durften nur klein sein, weil die Leistung und Kohärenzlänge der Laser stark beschränkt war, und die massive Granitplattform sollte das Objekt erschütterungsfrei halten: Schon winzigste Schwingungen, ein lauter Ton oder ein Windstoß konnten die Fotoplatte, den Gegenstand oder die Spiegel geringfügig verschieben, was das Interferenzmuster verwischt und die aufgezeichneten Daten wertlos gemacht hätte. Dabei muss man bedenken, dass die Aufnahmen damals enorm lange (bis zu einer Minute) belichtet werden mussten. Dies war das Zeitalter der Holografie der Stillleben. Heute stehen neue, viel empfindlichere Filme zur Verfügung, und mit ultrakurzen

1254

13 Moderne Optik

Rekonstruktion eines holografischen Porträts. (Foto mit frdl. Genehmigung von L. D. Siebert.)

(≈ 40 ns) Hochleistungs-Lichtblitzen aus gepulsten Einmoden-Rubinlasern sind nun auch holografische „Schnappschüsse“ und Porträtaufnahmen möglich (Foto oben).19 In den 1960er- und 1970er-Jahren staunte man vor allem über das ästhetische Wunder der Holografie. Seit den 1980er-Jahren gehören Hologramme durch die Massenproduktion Millionen billiger Reflexionshologramme auf Plastikfolien zunehmend zum Alltag. Sie begegnen uns auf Kreditkarten und Buchrücken, liegen als Sticker vielen Süßigkeiten bei und verschönern Zeitschriften, Modeschmuck, ja selbst Einwickelpapier. Billige und stabile Fotopolymere, mit denen man überdies Hologramme hervorragender Qualität erzeugen kann, lassen das Hologramm zum Wegwerfprodukt werden. Dessen ungeachtet hat sich mittlerweile die Erkenntnis durchgesetzt, dass die Holografie auch über den Bereich der Abbildungsverfahren hinaus großes Potential hat, und diese neue Entwicklungsrichtung findet zunehmend wichtige Anwendungsmöglichkeiten. Volumenhologramme 1962 entwickelte Jurij Nikolajewitsch Denisjuk ein Verfahren zur Erzeugung von Hologrammen, das Gabriel Lippmanns frühem (1891) Prozess der Farbfotografie ähnelte. Die Objektwelle wird dabei, kurz gesagt, vom Gegenstand reflektiert und breitet sich rückwärts aus. Dabei findet eine Überlagerung mit der ankommenden kohärenten Referenzwelle statt. Es entsteht ein dreidimensionales Muster stehender Wellen (Abb. 13.56). Die räumliche Verteilung der Interferenzstreifen wird über der gesamten Dicke einer fotografischen Schicht aufgezeichnet, und das Resultat nennt man Volumenhologramm. Das Verfahren wurde seither in verschiedener Hinsicht abgewandelt, die Grundlagen bleiben jedoch unverändert: Ein Volumenhologramm ist keine herkömmliche zweidimensionale gitterähnliche Struktur, sondern ein dreidimensionales Gebilde – genauer gesagt, eine dreidimensionale, modulierte, periodische Anordnung von Phasen- oder Amplitudenobjekten, welche die Daten bilden. Volu19

L. D. Siebert, Appl. Phys. Letters 11 (1967) 326 sowie R. G. Zech und L. D. Siebert, Appl. Phys. Letters 13 (1968) 417.

13.3 Holografie

1255

Drei unterschiedliche Ansichten einer Briefmarke der USA, bestehend aus einem farbigen Hologramm. (Foto E. H.)

menhologramme können auf verschiedenen Materialien aufgezeichnet werden, z. B. in dicken Fotoemulsionen (abgeschiedene Silberkörnchen sind die Amplitudenobjekte), in fotochromen Gläsern, mithilfe von Halogenidkristallen wie KBr, die auf Bestrahlung durch Veränderungen ihrer Farbzentren reagieren, oder mittels ferroelektrischer Kristalle wie Lithiumniobat, bei denen sich lokal der Brechungsindex ändert und eine Art Phasenvolumenhologramm entsteht. Das Resultat ist in jedem Fall eine dreidimensionale Anordnung von Daten, gespeichert in einem Medium, das sich während der Rekonstruktion ähnlich verhält wie ein mit Röntgenstrahlen beleuchteter Kristall: Die einfallende Welle (Rekonstruktionswelle) wird gemäß dem braggschen Gesetz (Abschn. 10.2) gestreut. Das überrascht nicht sonderlich, denn Streuzentren und Wellenlänge wurden proportional zueinander vergrößert. Eine wichtige Eigenschaft der Volumenhologramme ist der Zusammenhang zwischen der Wellenlänge und dem Streuwinkel über das braggsche Gesetz, 2d sin θ = mλ. Das heißt, bei einem bestimmten Winkel beugt das Hologramm nur Licht einer bestimmten Farbe. Durch schrittweise Änderung des Einfallswinkels (oder der Wellenlänge) kann man in einem einzelnen holografischen Medium auf diese Weise gleichzeitig sehr viele Hologramme speichern, weshalb sich solche Systeme als dicht gepackte Datenspeicher anbieten. In einem 8 mm dicken Medium wurden z. B. 550 Seiten mit Informationen gespeichert, wobei jede Seite einzeln abgerufen werden konnte. Theoretisch kann ein einzelner Lithiumniobatkristall problemlos tausende Hologramme speichern, und jedes lässt sich mittels eines unter dem geeigneten Winkel einfallenden Laserstrahls einzeln ansprechen. Gegenwärtige Forschungsarbeiten konzentrieren sich besonders auf den Einsatz von Kaliumtantalatniobat (KTN) als potentielles fotobrechendes Kristallspeichermedium. Holografische 3D-Filme, Bibliotheken oder einfach persönliche Notizbücher und Terminkalender, gespeichert in einer Handvoll kleiner, durchsichtiger Kristalle sind vielleicht gar nicht mehr so utopisch. Aus schwarz-weißen volumenholografischen Platten kann man Farbbilder rekonstruieren. Mit zwei, drei oder mehr verschiedenfarbigen, untereinander inkohärenten, überlagerten Laserstrahlen erzeugt man getrennte Komponentenhologramme. Beleuchtet man sie alle gleichzeitig mit den verschiedenen Komponentenstrahlen, so erhält man ein mehrfarbiges Bild.

1256

13 Moderne Optik

Ein anderes vielversprechendes Verfahren ist die von G. W. Stroke und A. E. Labeyrie entwickelte Weißlicht-Reflexionsholografie. Als Rekonstruktionswelle wird hierbei ein gewöhnlicher weißer Lichtstrahl (aus einer Lampe, einem Blitzlicht, einem Projektor) verwendet, dessen Wellenfront derjenigen der ursprünglichen quasimonochromatischen Referenzwelle ähnelt. Beleuchtet man ein solches Hologramm von der Seite des Betrachters aus, dann wird nur Licht einer spezifischen Wellenlänge – jenes, das unter dem richtigen braggschen Winkel in das Speichermedium eintritt – reflektiert, wobei ein virtuelles, dreidimensionales Bild entsteht. Wurde die Aufnahme beispielsweise mit rotem Laserlicht angefertigt, so wird nur rotes Licht reflektiert, und das Bild erscheint wieder rot. Allerdings kann die Emulsion während der fotografischen Entwicklung schrumpfen; macht man diesen Prozess nicht durch eine geeignete Chemikalie (beispielsweise Triethylamin) rückgängig, so nimmt der gegenseitige Abstand d der Bragg-Ebenen ab. Die bei einem bestimmten Einfallswinkel θ reflektierte Wellenlänge wird proportional dazu ebenfalls kleiner. Eine Aufnahme, angefertigt in rotem Licht eines He-Ne-Lasers, kann beim Betrachten im Weißlicht dann orange oder sogar grün erscheinen. Speichert man mehrere Hologramme, die zu verschiedenen Wellenlängen gehören, so erhält man mehrfarbige Bilder. Die Vorteile, die sich aus der Verwendung von gewöhnlichem weißen Licht zur Rekonstruktion von farbigen dreidiemnsionalen Bildern ergeben, sind offensichtlich und weitreichend. Optoelelektronische Bildrekonstruktion Betrachten wir die Prozedur, die zur Erzeugung eines einfachen Hologramms nötig ist: Eine ebene Welle, die auf eine Gruppe von Objekten fällt (etwa auf ein Schachbrett), wird als verwackeltes Wellenfeld reflektiert. Störungen der Wellenfronten entsprechen den Eigenschaften der Objekte und ihren Positionen im Raum. Die reflektierte Welle wird dann dazu gebracht, mit einer ebenen Referenzwelle zu interferieren, die identisch mit der ursprünglichen Welle ist. Das entstehende Interferenzmuster ist das Herzstück des Hologramms, das üblicherweise auf einem feinkörnigen fotografischen Film aufgenommen wird. Die verwackelte Welle, die von dem Schachbrett kommt, ist das, was wir „sehen“ würden, wenn wir Szene direkt betrachten. Durch Überlappung dieser reflektierten Objektwelle mit einer ebenen Referenzwelle entsteht ein Interferenzmuster, das alle benötigten Informationen über die Amplitude und die Phase der Objektwelle enthält. Der entwickelte Film ist mit feinen Linien bedeckt, die das Hologramm konstituieren. Wenn es mit der Referenzwelle beleuchtet wird, überträgt das Hologramm die rekonstruierte, verwackelte Welle des Schachbretts. Wir schauen in das Hologramm, ganz ähnlich wie wir in ein Fenster schauen, und sehen eine 3-DSzene, so als würde das Schachbrett noch vor uns stehen und Licht reflektieren. Nehmen wir nun an, dass wir das Schachbrett wegnehmen und die ganze Szene durch ein durchscheinendes Gerät ersetzen, das in der Lage ist, die ankommende Welle so umzuformen, dass exakt die originale, verwackelte Welle reproduziert wird. Diese

13.3 Holografie

1257

Ersatz-Objektwelle kann ein Hologramm des Schachbretts produzieren, auch wenn dieses nie an der entsprechenden Stelle war. Wenn dieser so genannte räumliche Lichtmodulator (SLM für engl. spatial light modulator) schnell variieren würde und wir die resultierenden Interferenzmuster in Echtzeit aufzeichnen könnten, dann könnten wir sogar 3-D-Filme aufnehmen. So weit sind wir noch nicht ganz, doch es gibt bereits preisgünstige Flüssigkristall-SLMs (LC-SLMs) zu kaufen. Solche Geräte bestehen gewöhnlich aus einem zweidimensionalen Array von elektronisch adressierbaren, winzigen und dicht gepackten nematischen Flüssigkristallzellen. Außerdem ist es mihilfe von Kristallen wie Fe:Ce:Ti-dotiertem LiNbO3 möglich, Hologramme direkt aufzunehmen, anstatt zu warten, bis der Film entwickelt ist. Das folgende Foto wurde aus einem volumenholografischen Datenspeichersystem zurückgewonnen. Ein Laserstrahl, räumlich digital geformt durch einen LC-SLM, hat dazu die Eingabe-Bildinformation in Form von Variationen der Wellenfront zu einem fotobrechenden Kristall übertragen, wo sie auf eine Referenzwelle getroffen ist. Das daraus entstehende Interferenzmuster wurde in dem Kristall gespeichert. Später wurde das Bild durch einen Wiedergabe-Laserstrahl rekonstruiert und einfach fotografiert.

Ein Hologramm, das mit einem LCSLM erstellt wurde. (Andreas Hermerschmidt und HOLOEYE Photonics AG, Berlin)

Holografische Interferometrie Die Interferometrie ist eines der innovativsten und praxisbezogensten modernen Anwendungsgebiete der Holografie. Für Aufgaben der zerstörungsfreien Untersuchung, etwa die Feststellung mikroskopisch kleiner Veränderungen durch Spannung, Vibration oder Hitze in Festkörpern, haben sich besonders drei Ansätze bewährt. Bei der Doppelbelichtungsmethode fertigt man zunächst ein Hologramm des Objekts im Originalzustand an, das man nicht entwickelt. Vor der weiteren fototechnischen Verarbeitung folgt die zweite Belichtung, nun unter Verwendung des durch Einwir-

1258

13 Moderne Optik

kung verschiedener Faktoren gestörten Objekts. Am Ende erhält man so zwei einander überlagerte rekonstruierte Wellen, aus deren Interferenzmuster man die Veränderungen des Objekts ablesen kann. Solche Muster entstehen sowohl durch die Änderung der optischen Weglänge (siehe das folgende Foto) als auch durch Variationen des Brechungsindex, etwa bei Windkanalversuchen.

Doppelbelichtungs-Interferogramm. (Aus S. M. Zivi und G. H. Humberstone, „Chest Motion Visualized by Holographic Interferometry“, Medical Research Eng., Juni 1970.) Vergleichen Sie dieses Bild mit der Radaraufnahme auf S. 862

Bei der Echtzeitmethode fertigt man wieder zunächst ein Vergleichshologramm des ursprünglichen Objekts an und entwickelt es. Der Gegenstand wird dabei exakt in seiner Position belassen. Man hält das Hologramm nun so, dass das virtuelle Bild mit dem Gegenstand zur Deckung kommt (Abb. 13.59). Sämtliche Störungen, die sich beim nachfolgenden Testen zeigen – etwa Systeme von Streifen –, kann man in Echtzeit studieren, indem man durch das Hologramm blickt. Man kann dieses Verfahren auf undurchsichtige und transparente Objekte anwenden und sogar einen Film drehen, der die Reaktion des betrachteten Gegenstands im Verlauf des Versuchs wiedergibt. Schließlich ist noch die zeitgemittelte Methode zu erwähnen, die man insbesondere auf Systeme anwendet, welche rasch, aber mit kleiner Amplitude schwingen. Die Fotoplatte wird hier über eine längere Zeit belichtet, während der das Objekt etliche Schwingungen ausführt. Man erhält ein Hologramm als Überlagerung vieler einzelner Bilder – folglich bilden sich stehende Wellen. Helle Flächen zeigen an, wo es stationäre Bereiche (Schwingungsknoten) gibt, während Höhenlinien Flächen konstanter Schwingungsamplitude nachzeichnen. In der Industrie ist die holografische Materialprüfung heute weit verbreitet. Die Anwendungen reichen von der Schallreduktion in Autoantrieben bis zur routinemäßigen Inspektion von Düsentriebwerken.

13.3 Holografie

1259 Spiegel

Linse und Lochblende Spiegel Betrachter

verarbeitetes Hologramm

Laser Strahlteiler

Linse und Lochblende

Objekt, überlagert vom virtuellen Bild

Abb. 13.59: Holografische Interferometrie in Echtzeit.

Akustische Holografie In der akustischen Holografie verwendet man zur Aufzeichnung hochfrequente Schallwellen (Ultraschall), zur Rekonstruktion eines sichtbaren Bildes dagegen Laserlicht. Zur Erläuterung betrachten wir Abbildung 13.60: Zwei unter Wasser befindliche, kohärente Ultraschallsender erzeugen an der Wasseroberfläche ein stationäres Wellenmuster als Hologramm des Fisches. Dieses Wellenmuster wird fotografiert, wobei ein Hologramm entsteht, das man zur Rekonstruktion beleuchten kann. Alternativ kann man das Muster auch direkt mit einem Laserstrahl beleuchten, um eine sofortige Rekonstruktion im reflektierten Licht zu erzielen. Laser

Abb. 13.60: Akustische Holografie.

1260

13 Moderne Optik

Interferogramm eines Geldstücks, erhalten mittels akustischer Holografie. (Foto mit frdl. Genehmigung von Holosonics, Inc.)

Der Vorteil akustischer Verfahren liegt darin, dass sich Schallwellen über große Entfernungen hinweg in Medien wie dichten Flüssigkeiten oder Festkörpern fortpflanzen können, die für Licht undurchdringlich sind. Die Anwendungsgebiete sind vielfältig, beispielsweise kann man U-Boote oder innere Organe aufzeichnen.20 Die in Abbildung 13.60 gezeigte Anordnung liefert eine Aufnahme, die einem bewegten Röntgenbild des Fisches ähnelt. In dem Foto oben sehen Sie ein mit Ultraschall (48 MHz) aufgenommenes holografisches Interferogramm eines Geldstücks. Die Schallfrequenz entspricht in Wasser einer Wellenlänge von ungefähr 30 µm, sodass jeder sichtbare Streifen für eine Höhenänderung von λ/2 = 15 µm steht. Holografische optische Elemente Bei der Überlagerung zweier ebener Wellen wie in Abbildung 13.52 entsteht ein Kosinusgitter. Folglich könnte man sich vorstellen, dass man mit der Holografie nicht nur Bilder erzeugen, sondern z. B. auch Beugungsgitter herstellen kann. Unter holografischen optischen Elementen (HOE) versteht man Beugungsvorrichtungen, die aus einem Interferenzmuster (einer Verteilung beugender Amplituden- oder Phasenobjekte) bestehen und entweder direkt holografisch oder durch eine Computersimulation eines holografischen Prozesses erzeugt wurden. Im Handel sind sowohl holografische Sinusgitter als auch Gitter mit bevorzugter Reflexionsrichtung (blazed gratings, siehe Abschn. 10.2.7) erhältlich, mit denen sich bis zu 3600 Linien pro Millimeter erzielen lassen. Diese Gitter sind zwar nicht so effizient wie herkömmliche geritzte Gitter, erzeugen aber weniger Streulicht, was bei vielen Anwendungen wichtig sein kann. Angenommen, wir zeichnen das Interferenzmuster eines konvergierenden Strahls mit einer ebenen Referenzwelle auf. Beleuchten wir das fertige Transmissionshologramm mit einer passenden ebenen Welle, so tritt wieder ein konvergierender Strahl aus: Das Hologramm wirkt wie eine Sammellinse (siehe Abb. 13.49). Ist analog die Referenzwelle ein von einer Punktquelle aus divergierender Strahl und das Objekt eine ebene Welle, dann liefert das Hologramm, beleuchtet mit einer Punktquelle, 20

Siehe A. F. Metherell, „Acoustical Holography“, Sci. Am. 221 (Oktober 1969) 36. Eine andere interessante Anwendung von Oberflächenreliefmustern wird beschrieben in A. L. Dalisa et al., „Photoanodic Engraving of Holograms on Silicon“, Appl. Phys. Letters 17 (1970) 208.

13.3 Holografie

1261

wieder eine ebene Welle. Ein holografisches optisches Element kann folglich die Rolle komplizierter Linsen übernehmen und ist dabei billig, leicht und platzsparend. Holografische optische Elemente werden heute bereits in Barcodelesern verwendet, mit denen an Supermarktkassen aus standardisierten „Strichcodes“ automatisch Art und Preis einer Ware abgelesen werden. Ein Laserstrahl überstreicht eine rotierende Scheibe, die aus holografischen Linsenprismenflächen besteht. Diese refokussieren, verschieben und lenken den Strahl schnell durch den Raum, sodass es in der Regel ausreicht, das Produkt einmal am Lesegerät vorbeizuführen. HOEs werden auch benutzt, um unmittelbar vor den Augen eines Flugzeugpiloten im Cockpit auf einer ansonsten völlig durchsichtigen Fläche Daten einzuspielen, ohne dem Piloten die Sicht zu versperren. Weitere Einsatzgebiete dieser Elemente sind Kopiergeräte und Solarkonzentratoren. Zur optischen Strukturerkennung, beispielsweise zum Auffinden von Fehlern in Halbleitern oder zur Ortung militärischer Objekte, setzt man holografische Elemente in Form von angepassten Raumfiltern ein. Das HOE besteht hier in einem Hologramm, dessen Objekt die Fourier-Transformierte des Suchmusters (etwa das Bild eines Panzers oder ein Wort) ist. Stellen wir uns z. B. vor, mithilfe eines optischen Computers (Abb. 13.35) sollte automatisch ein bestimmtes Wort auf einer Buchseite gefunden werden. Dazu ist eine Kreuzkorrelation des Wortes mit der Seite erforderlich. Das Hologramm der Transformierten des Musters wird in die Transformiertenebene gebracht und mit der Transformierten der gesamten Seite beleuchtet. Die Feldamplitude, die dieses HOE-Filter verlässt, ist dann proportional zum Produkt der Transformierten der Seite bzw. des Musters. Eine letzte Linse erzeugt die Transformierte dieses Produkts und bildet sie auf der Bildebene ab – dies ist die gesuchte Kreuzkorrelation (siehe dazu den Wiener-Khintchine-Satz, Abschn. 11.3.4). Befindet sich das gesuchte Wort auf der Seite, dann erscheint eine hohe Korrelation in Form eines hellen Flecks, der dem Endbild an jeder Stelle überlagert ist, wo das Suchmuster auftritt.21 Es ist auch möglich, ein Hologramm eines fiktiven Objekts Punkt für Punkt zusammenzusetzen. Der direkteste Ansatz hierfür besteht darin, mithilfe eines Computers die Bestrahlungsstärkeverteilung zu berechnen, die sich bei geeigneter Beleuchtung eines echten Gegenstandes in einer hypothetischen Aufzeichnung ergäbe. Das Interferogramm, erhalten als Computerausdruck oder auch auf einem Oszillographenschirm, wird anschließend fotografiert. Beleuchtet man das so erzeugte Hologramm, so erhält man ein dreidimensionales Bild eines Gegenstandes, der selbst nie existierte. Auch HOEs kann man mittlerweile computergestützt herstellen; sie dienen oft als Bezugsgrößen bei optischen Testverfahren. Im Prinzip kann man mit diesen Technologien beliebige Wellenfronten erzeugen, die ansonsten nicht erhältlich sind. Die Zukunft könnte daher noch manche Überraschung bereithalten. 21

Siehe A. Ghatak und K. Thyagarajan, Contemporary Optics, S. 214.

1262

13 Moderne Optik

13.4 Nichtlineare Optik Die nichtlineare Optik beschäftigt sich allgemein mit Phänomenen, bei denen nicht die erste, sondern höhere Potenzen der elektrischen und magnetischen Feldstärke dominieren. Ein typisches Beispiel für eine schon lange bekannte nichtlineare Beziehung ist der Kerr-Effekt (Abschn. 8.11.3), der quadratische Zusammenhang zwischen dem Brechungsindex und der angelegten Spannung, also auch dem elektrischen Feld. In der herkömmlichen, klassischen Behandlung der Ausbreitung des Lichts (Superposition, Reflexion, Brechung usw.) geht man von einer linearen Beziehung zwischen dem elektromagnetischen Lichtfeld und dem beleuchteten Medium in Form eines atomaren Systems aus. Doch ebenso, wie man einen mechanischen Schwinger (etwa eine belastete Feder) durch Ausübung hinreichend großer Kräfte in den nichtlinearen Bereich bringen kann, sollte auch ein extrem intensiver Lichtstrahl merkliche nichtlineare Effekte hervorrufen können. Die elektrischen Felder der Lichtstrahlen, die von gewöhnlichen (traditionellen) Lichtquellen ausgehen, sind viel zu schwach, als dass man Nichtlinearitäten deutlich beobachten könnte. Erst mit dem Aufkommen des Lasers als Hochleistungsquelle im optischen Bereich blühte diese Forschungsrichtung auf. Um eine Vorstellung von den heute erreichbaren Feldern zu bekommen, denken wir an einen Laserstrahl, der sich mit den verfügbaren Methoden auf einen Fleck von ungefähr 10−9 m2 fokussieren lässt. Ein 200 Megawatt starker Puls, z. B. aus einem gütegeschalteten Rubinlaser, erzeugt so eine Flussdichte von 20 × 1016 W/m2 . Die zugehörige Amplitude des elektrischen Feldes ist dann gegeben (Aufgabe 13.37) durch  I . (13.30) E0 = 27,4 n In unserem speziellen Fall ist die Feldamplitude bei n ≈ 1 damit 1,2 × 108 V/m, was viel mehr ist als die Zündspannung in Luft (etwa 3 × 106 V/m) und nur um wenige Größenordnungen geringer als die Felder, die einen Kristall zusammenhalten. (Die Kristallkräfte sind in grober Näherung so groß wie die Anziehung, die Elektron und Kern eines Wasserstoffatoms zusammenhält, nämlich 5 × 1011 V/m.) Seitdem solche und noch stärkere (bis zu 1012 V/m) Felder zur Verfügung stehen, wurden zahlreiche neue nichtlineare Phänomene und Geräte untersucht und gebaut. Wir werden unsere Diskussion auf die Betrachtung einiger Effekte in passiven Medien beschränken, d. h. Medien, die lediglich als Katalysatoren wirken, ohne eigene charakteristische Frequenzen einzubringen. Insbesondere wollen wir die optische Gleichrichtung, die Erzeugung von Oberschwingungen, die Frequenzmischung und die Selbstfokussierung von Licht besprechen. Nichtlineare optische Phänomene in aktiven Medien – also solchen, die der Lichtwelle ihre eigenen charakteristischen Frequenzen aufzwingen – sind z. B. die induzierte Raman-, Rayleigh- und Brillouinstreuung.22 22

Eine ausführlichere Behandlung, als wir sie hier vornehmen können, finden Sie in N. Bloembergen, Nonlinear Optics, oder G. C. Baldwin, An Introduction to Nonlinear Optics.

13.4 Nichtlineare Optik

1263

Wie Sie sich sicherlich erinnern, übt das elektromagnetische Feld einer Lichtwelle, die sich in einem Medium fortpflanzt, Kräfte auf die schwach gebundenen Außenoder Valenzelektronen aus. Normalerweise sind diese Kräfte sehr klein, und in linearen isotropen Medien ist die resultierende elektrische Polarisation parallel und direkt proportional zum angelegten Feld. Effektiv folgt die Polarisation dem Feld: Ist Letzteres harmonisch, so ändert sich auch die Polarisation harmonisch. Wir können folglich schreiben P = 0 χE .

(13.31)

χ ist eine dimensionslose Konstante, die elektrische Suszeptibilität. Trägt man P in Abhängigkeit von E auf, so erhält man eine Gerade. Es ist nicht schwer vorzustellen, dass P in extremen Fällen sehr starker Felder nicht unendlich weit linear mitwachsen kann, sondern eine Art Sättigung eintritt (ähnlich wie bei ferromagnetischen Materialien, deren magnetisches Moment schon bei relativ niedrigen Werten von H gesättigt ist). Je größer E wird, desto deutlicher dürfte die im Normalfall bedeutungslose, aber vorhandene Nichtlinearität dieses Zusammenhangs ins Gewicht fallen. Im einfachsten Fall, dem des isotropen Mediums, fallen die Richtungen von P und E zusammen, und wir können die Polarisation in eine Reihe entwickeln:   (13.32) P = 0 χE + χ2 E 2 + χ3 E 3 + . . . . Die gewöhnliche lineare Suszeptibilität χ ist wesentlich größer als χ2 , χ3 usw., die Koeffizienten der Feldterme höherer Ordnung. Letztere liefern deshalb nur bei Feldern mit sehr großer Amplitude einen merklichen Beitrag. Es sei nun E = E0 sin ωt eine auf das Medium fallende Lichtwelle. Die dabei entstehende Polarisation P = 0 χE0 sin ωt + 0 χ2 E02 sin2 ωt + 0 χ3 E03 sin3 ωt + . . .

(13.33)

kann wie folgt umgeschrieben werden: 0 χ2 2 E0 (1 − cos 2ωt) P = 0 χE0 sin ωt + 2 0 χ3 3 E0 (3 sin ωt − sin 3ωt) + . . . . + 4

(13.34)

Bei der Ausbreitung erzeugt die Lichtwelle im Medium eine Art Polarisationswelle, eine sich wellenförmig fortpflanzende Ladungsumverteilung als Reaktion auf die Einwirkung des Feldes. Wenn nur der lineare Term eine Rolle spielt, dann hat die elektrische Polarisationswelle die Form eines oszillierenden Stroms, der der einfallenden Lichtwelle folgt. Wieder abgestrahlt wird dann die normale Brechungswelle, die sich mit der reduzierten Geschwindigkeit v fortpflanzt und deren Frequenz mit jener des einfallenden Lichts übereinstimmt. Die Anwesenheit von Termen höherer Ordnung

1264

13 Moderne Optik

in Gleichung (13.33) bedeutet jedoch, dass die Polarisationswelle nicht das gleiche harmonische Profil wie die einfallende Welle hat. Gleichung (13.34) kann als Fourierreihendarstellung des gestörten Profils von P (t) aufgefasst werden.

13.4.1 Optische Gleichrichtung Der zweite Term in Gleichung (13.34) hat zwei interessante Komponenten. Einer davon ist die konstante Untergrundpolarisation, die proportional zu E02 ist. Durchquert ein intensiver, linear polarisierter Strahl einen geeigneten (piezoelektrischen) Kristall, so äußert sich der quadratische Term zum Teil als konstante elektrische Polarisation des Mediums. Folglich entsteht eine Spannungsdifferenz, die proportional zur Flussdichte des einfallenden Strahls ist. In Analogie zu seiner Entsprechung bei Radiofrequenzen nennt man diesen Effekt optische Gleichrichtung.

13.4.2 Erzeugung von Harmonischen Der cos 2ωt-Term in Gleichung (13.34) entspricht einer Variation der elektrischen Polarisation, die zweimal so schnell wie die Grundfrequenz erfolgt (mit dem Doppelten der Frequenz des einfallenden Lichts). Das von den Oszillatoren wieder abgestrahlte Licht weist ebenfalls eine Komponente mit der Frequenz 2ω auf. Man nennt diesen Vorgang Erzeugung der zweiten Harmonischen. Im Photonenbild können wir uns vorstellen, dass sich im Medium zwei identische Photonen der Energie ω zu einem Photon der Energie 2ω vereinigen. Erstmals beobachtet wurde der Effekt 1961 von Peter A. Franken und seinen Mitarbeitern an der University of Michigan. Dabei wurde ein 3 kW-Puls roten (694,3 nm) Lichts von einem Rubinlaser auf einen Quarzkristall fokussiert. Ein Hundermillionstel (1/108 ) der einfallenden Welle wurde in die zweite Harmonische umgewandelt, die im Ultravioletten bei 347,15 nm liegt. Wenn P (E) für ein bestimmtes Material eine ungerade Funktion ist, d. h., wenn sich bei einer Richtungsumkehr des E-Feldes gleichzeitig die Richtung von P umkehrt, dann verschwinden die geraden Potenzen von E in Gleichung (13.32). Genau dies trifft auf isotrope Medien wie Glas oder Wasser zu, denn Flüssigkeiten haben keine Vorzugsrichtung. In Kristallen mit Symmetriezentrum (Inversionszentrum) müssen überdies bei einer Umkehr der Koordinatenachsen die Beziehungen zwischen den einzelnen physikalischen Größen unverändert bleiben. In Stoffen dieser Art können folglich keine geraden Harmonischen erzeugt werden. Dritte Harmonische dagegen können durchaus entstehen, in Calcit zum Beispiel wurden sie bereits beobachtet. Das Fehlen eines Inversionszentrums ist eine notwendige Bedingung nicht nur für die Erzeugung gerader Harmonischer, sondern auch für die Piezoelektrizität eines Kristalls. In piezoelektrischen Kristallen wie Quarz, Kaliumdihydrogenphosphat (KDP) oder Ammoniumdihydrogenphosphat (ADP) wird bei Druckausübung die Symmetrie gestört, wodurch eine elektrische Spannung entsteht. Von den 32 Kristallklassen weisen 20 kein Inversionszentrum auf und könnten daher für die Erzeugung zweiter Harmo-

13.4 Nichtlineare Optik

1265

nischer geeignet sein. Die in Gleichung (13.32) gegebene skalare Beziehung ist nicht wirklich eine adäquate Beschreibung für einen typischen dielektrischen Kristall. Die Sache ist komplizierter, weil die Feldkomponenten in den verschiedenen Raumrichtungen eines Kristalls die elektrische Polarisation in jeder Richtung anders beeinflussen können. Für eine vollständige Beschreibung muss der Zusammenhang zwischen P und E demnach nicht durch einen einzelnen skalaren Faktor, sondern durch einen Tensor – den so genannten Suszeptibilitätstensor – ausgedrückt werden.23 Eine der größten Schwierigkeiten bei der Erzeugung größerer Mengen von Licht der zweiten Harmonischen erwächst aus der Frequenzabhängigkeit der Brechungsindizes, also der Dispersion. Zu Beginn, wenn aus der einfallenden ω-Welle die zweite Harmonische oder 2ω-Welle entsteht, sind beide Wellen kohärent. Während der Fortpflanzung im Kristall liefert die ω-Welle weitere Beiträge zum 2ω-Licht. Alle diese Beiträge können einander nur dann konstruktiv überlagern, wenn ihre Phasenbeziehung dies zulässt. Die Phasengeschwindigkeit vω der ω-Welle ist jedoch in der Regel verschieden von der Phasengeschwindigkeit v2ω der 2ω-Welle. Periodisch gerät daher die emittierte zweite Harmonische außer Phase bezüglich der davor ausgesendeten 2ω-Welle. Berechnet man die Bestrahlungsstärke I2ω beim Austritt aus einer Platte der Dicke , so erhält man I2ω ∝

sin2 [2π (nω − n2ω ) /λ0 ] (nω − n2ω )2

(13.35)

(siehe Abb. 13.61). Daraus ergibt sich, dass I2ω maximal wird bei  = c mit c =

λ0 1 . 4 |nω − n2ω |

(13.36)

Die Größe c nennt man (etwas irreführend) auch Kohärenzlänge, und sie liegt ungefähr in der Größenordnung von 20λ0 . Zur effizienten Erzeugung der zweiten Harmonischen gibt es ein weiteres Verfahren, die Brechungsindex-Anpassung, womit man die unerwünschten Nebeneffekte der Dispersion vermeiden kann. Kurz gesagt sorgt man dafür, dass nω = n2ω ist. Ein häufig zur Erzeugung zweiter Harmonischer verwendeter Kristall ist Kaliumdihydrogenphosphat, KDP. Das Material ist piezoelektrisch, durchsichtig und überdies negativ einachsig doppelbrechend (siehe Abschn. 8.4.2). Zusätzlich hat er die folgende interessante Eigenschaft: Ist der einfallende Strahl mit der Grundfrequenz ein ordentlicher Strahl, so entsteht die zweite Harmonische als außerordentlicher Strahl. Breitet sich Licht in einem KDP-Kristall unter einem Winkel θ0 zur optischen Achse aus (Abb. 13.62), ist der Brechungsindex 23

Ein solcher Zusammenhang ist nichts Außergewöhnliches: Tensoren treten in der Physik häufig auf. Man denke etwa an den Spannungstensor, den Trägheitstensor oder den Tensor der Entmagnetisierung.

13 Moderne Optik

Ausgangsleistung

1266

Laserstrahl

nichtlinearer Kristall

Filter

30

Photomultiplier

20

10

0 10 (Grad)

20

30

Abb. 13.61: Erzeugung der zweiten Harmonischen als Funktion von θ an einer 0,78 mm dicken Quarzplatte. Die Maxima treten auf, wenn die effektive optische Dicke ein geradzahliges Vielfaches von c ist. (Aus P. D. Maker, R. W. Terhune, M. Nisenoff und C. M. Savage, Phys. Rev. Letters 8 (1962) 21.)

Ausgangsintensit¨at KDP (a)

der zweiten Harmonischen

optische Achse

(b)

Abb. 13.62: (a) Brechungsindexoberfläche von KDP. (b) I2ω als Funktion der Kristallorientierung in KDP. (Aus Maker et al.)

n0ω der ordentlichen Grundwelle exakt gleich dem Brechungsindex ne2ω der außerordentlichen zweiten Harmonischen. So interferieren die Elementarwellen der zweiten Harmonischen konstruktiv, was zu einer Verbesserung der Umwandlungseffektivität um mehrere Größenordnungen führt. Kristalle zur Erzeugung zweiter Harmonischer, bei denen es sich einfach um geeignet geschnittene und orientierte Stücke handelt, sind im Handel erhältlich. Bedenken Sie aber, dass θ0 eine Funktion von λ ist und jeder einzelne Kristall daher nur für eine bestimmte Frequenz verwendet werden kann. Vor nicht allzu langer Zeit ist es gelungen, einen kontinuierlichen 1-W-Strahl einer zweiten Harmonischen bei 532,3 nm zu erzeugen, indem ein Bariumnatriumniobat-Kristall in den Resonator eines 1-W-Infrarotlasers (1,06 µm) gebracht wurde. Das Vor- und Zurücklaufen der ω-Welle im Resonator und damit durch den Kristall erhöhte in diesem Fall die Effizienz der Umwandlung.

13.4 Nichtlineare Optik

1267

Der KDP-Frequenzwandler des Nova-Lasers. (Foto mit frdl. Genehmigung vom Lawrence Livermore National Laboratory.)

Bereits zu Beginn der 1980er-Jahre entwickelte sich die Erzeugung zweiter Harmonischer vom Exoten zum Standardprozess. Nach wie vor entstehen beeindruckende Geräte, z. B. das in dem Foto oben gezeigte Array mit einem Durchmesser von 74 cm, das im Rahmen des Nova-Laserfusionsprogramms konstruiert wurde. Ein Jahrzehnt später wurde das Programm zum Omega-Frequenzverdreifachungssystem weitergeführt. Seine Aufgabe besteht in der Umwandlung von über 80% der Infrarotemission (1,05 µm) eines Neodym-Glas-Lasers in wirkungsvollere höherfrequente Strahlung. Aufgrund seiner Ausmaße besteht der Umwandler aus kleinen KDP-Einkristallen, die geeignet ausgerichtet und in zwei Schichten hintereinander angeordnet sind. Will man die zweite Harmonische (grünes Licht bei 0,53 µm) erhalten, so arbeiten die beiden Schichten unabhängig voneinander und erzeugen je eine frequenzverschobene Komponente. Diese Komponenten sind senkrecht zueinander polarisiert und überlagern einander. Die dritte Harmonische (blaues Licht bei 0,35 µm) entsteht, wenn man die Anordnung im geeigneten phasenangepassten Winkel orientiert. Die erste Schicht wandelt dann zwei Drittel der einfallenden Energie in die zweite Harmonische um, die zweite Schicht mischt diese zweite Harmonische mit der verbliebenen IR-Grundwelle zur dritten Harmonischen.

13 Moderne Optik

1268

13.4.3 Frequenzmischung Eine andere Situation von beträchtlichem praktischem Interesse ist die Mischung zweier oder mehrerer Primärstrahlen unterschiedlicher Frequenz innerhalb eines nichtlinearen Dielektrikums. Der Prozess lässt sich am leichtesten verstehen, wenn man eine Welle E = E01 sin ω1 t + E02 sin ω2 t

(13.37)

in den einfachsten Ausdruck für P , Gleichung (13.32), einsetzt. Der Term zweiter Ordnung ist dann gleich   2 2 sin2 ω1 t + E02 sin2 ω2 t + 2E01 E02 sin ω1 t sin ω2 t . 0 χ2 E01 Die ersten beiden Terme sind Funktionen von 2ω1 bzw. 2ω2 , aus dem letzten Glied ergeben sich der Summen- und der Differenzterm, ω1 + ω2 und ω1 − ω2 . Im quantenmechanischen Bild entsteht das Photon mit der Frequenz ω1 + ω2 einfach durch eine Vereinigung der beiden ursprünglichen Photonen, wie wir es bereits bei der Erzeugung der zweiten Harmonischen kennengelernt haben. (Dort hatten beide Quanten die gleiche Frequenz.) Die vernichteten Photonen geben dabei ihre Energie und ihren Impuls an das neu entstandene Photon weiter. Etwas komplizierter zu erklären ist die Entstehung des Differenzphotons mit ω1 − ω2 . Die Energie- und Impulserhaltung erfordert, dass bei der Wechselwirkung mit einem ω2 -Photon nur das höherfrequente Photon ω1 verschwindet, wodurch zwei neue Teilchen entstehen: ein ω2 -Photon und ein Differenzphoton. Betrachten wir eine Anwendung dieses Phänomens. In einem nichtlinearen Kristall schicken wir eine intensive Welle mit der Frequenz ωp , das so genannte Pumplicht, auf eine schwache Signalwelle mit der niedrigeren Frequenz ωs , die verstärkt werden soll. Das Pumplicht wird dabei in Signallicht und eine Differenzwelle, das Idlerlicht (von engl. idler, Müßiggänger) mit der Frequenz ωi = ωp − ωs , umgewandelt. Auf diese Weise werden sowohl das Signal als auch die Idlerwelle verstärkt. Es handelt sich bei diesem Verfahren im Prinzip um eine Erweiterung der seit Ende der 1940er-Jahre für Mikrowellen angewendeten parametrischen Verstärkung auf den optischen Frequenzbereich. Abbildung 13.63 zeigt den ersten optisch-parametrischen Oszillator, der 1965 gebaut wurde. Die ebenen parallelen Stirnseiten eines nichtlinearen Kristalls (Lithiumniobat) wurden so beschichtet, dass ein Fabry-Perot-Resonator entstand. Die Signalund die Idlerfrequenz lagen beide bei ungefähr 1000 nm und entsprachen zwei Resonanzfrequenzen des Resonators. War die Flussdichte des Pumplichts hinreichend hoch, dann wurde Energie der Pumplichtmode in Schwingungsmoden des Signal- und Idlerlichts übertragen; diese Moden bauten sich auf, und kohärente Strahlungsenergie mit den entsprechenden Frequenzen wurde emittiert. Diese Energieübertragung zwischen zwei Wellen in einem verlustfreien Medium ist typisch für parametrische Prozesse. Durch kontinuierliche Änderung des Brechungsindex des Kristalls, etwa infolge von

13.4 Nichtlineare Optik

1269

Variationen der Temperatur oder des elektrischen Feldes, wird der Oszillator durchstimmbar. Inzwischen wurden verschiedene ähnliche Anordnungen, zum Teil unter Verwendung anderer nichtlinearer Kristalle wie Bariumnatriumniobat, entwickelt. Der optisch-parametrische Oszillator ist somit eine laserähnliche, in einem weiten Bereich zwischen IR und UV abstimmbare Quelle kohärenter Strahlung.

¨ gutegeschalteter Laser Laserstrahl 1058 nm LiNbO Kristall

529 nm IR absorbierendes Filter

LiNbO -Kristall mit beschichteten Endflächen (Resonator) Siliciumfilter

Abb. 13.63: Ein optisch-parametrischer Oszillator. (Nach J. A. Giordmaine und R. C. Miller, Phys. Rev. Letters 4 (1965) 973.)

13.4.4 Selbstfokussierung von Licht Wenn man ein Dielektrikum einem räumlich veränderlichen elektrischen Feld aussetzt, sodass es parallel zu P einen Feldgradienten gibt, dann entsteht im Inneren des Materials eine Kraft. Dadurch kann sich die Dichte, die Dielektrizitätskonstante und somit der Brechungsindex des Mediums ändern, was sowohl für lineare als auch nichtlineare isotrope Medien gilt. Angenommen, ein Laserstrahl mit einer transversalen Gaußverteilung der Flussdichte fällt auf eine Probe. In der Umgebung der Einfallsstelle ändert sich daraufhin der Brechungsindex und das Medium wirkt wie eine Sammellinse. Der Strahl bündelt sich daraufhin, die Flussdichte wird noch größer und die Bündelung setzt sich fort. Man nennt diesen Vorgang Selbstfokussierung. Der Effekt lässt sich aufrechterhalten, bis der Strahldurchmesser sehr klein (etwa 5 × 10−6 m) geworden ist und das Strahlenbündel totalreflektiert wird, als ob es inmitten des Mediums in einer optischen Faser eingeschlossen wäre.24

24

Siehe A. Giordmaine, „Nonlinear Optics“, Phys. Today 39 (Januar 1969).

13 Moderne Optik

1270 Tabelle 13.2: Einige Laser und ihre Emissionswellenlängen

Festkörperlaser

Wellenlängen (nm)

Cr:Al2 O3 (Rubin) Cr:BeAl2 O3 Cr:LiCaF Cr:LiSrAlF Cr:ZnSe Er:YAG Ho:YAG Nd:Glas Nd:YAG Nd:YCOB Nd:YLF Nd:YVO4 Pr:Glas Sm:CaF2 Ti:Saphir Tm:YAG U:CaF2 Yb:Glas Yb:YAG

694,3 700–830 700–830 800–1050 2200–2800 2940 2100 1080, 1062, 1054 1064,1, 266, 355, 532, 1320 ≈ 1060 1047, 1053 1064 933, 1098 708,5 650-1180 2000 2500 1030 1030

Gaslaser

Wellenlängen (nm)

Argonionen Kohlendioxid Kohlenmonoxid Helium-Cadmium Helium-Neon Wasserstoffcyanid Kryptonionen Stickstoff Wasserdampf Xenonionen

488,0, 514,5, 275, 363,8, 457,9, 465,8, 528,7 10600, 9600 4700–8200, 2500-4200 441,6, 330,0 632,8, 543,5, 593,9, 1523 337 000 647.1, 676,4, 416, 530,9, 568,2, 752,5, 799,3 337,1 28 000, 118 600 540

Excimerlaser

Wellenlängen (nm)

ArCl ArF ArO F2 HgBr KrCl KrF XeBr XeCl XeF XeO

169, 175 193,4 558 157 499–504,6 222 248 282 308 353 537,6, 544,2

Aufgaben

1271

Tabelle 13.2: Einige Laser und ihre Emissionswellenlängen (Fortsetzung)

Metalldampflaser

Wellenlängen (nm)

Kupferdampf Golddampf Bleidampf HeAg HeCd HeHg HeSe NeCu Strontiumdampf

510,5, 578,2 627,8 722,9 224,3 441,56, 352,0, 353,6 567, 615 497,5, 499,2, 506,8, 517,6, 522,7, 530,5 248,6 430,5

Halbleiterlaser

Wellenlängen (nm)

AlGaAs, AlGaInP GaAlAs/GaAS GaAs/GaAS GaInPAs/GaAS GaN/SiC InGaAsP/InP PbSnSe Quantenkaskaden

630–900 720–900 904 670–680 423, 405–425 1000–1700 8000–30 000 mittlerer bis Ferninfraotbereich

Flüssigkeitslaser

Wellenlängen (nm)

Cumarin Dicyanomethylen Europiumionen-Chelat Kiton Rot Rhodamine Stilbene

≈ 460 − −558 610–705 613,1 600–650 ≈ 528 − −640 ≈ 391 − −465

Chemische Laser

Wellenlängen (nm)

AGIL COIL DF-CO2 DF HBr HF

1315 1315 10 600 ≈ 2700–4200 4000 2700–2900

Aufgaben Lösungen zu den Aufgaben ohne ∗ finden Sie am Ende des Buches. 13.1* Ein Rohstahlwürfel mit 10 cm Seitenlänge wird in einen Ofen mit einer Innentemperatur von 400 ◦C gebracht. Nach einer Weile hat sich das Temperaturgleichgewicht eingestellt. Berechnen Sie die Rate der Energieabstrahlung von jeder Seite des Würfels. Das Emissionsvermögen des gesamten Würfels sei 0,97.

13 Moderne Optik

1272 13.2

Die Oberfläche einer nackten Person betrage rund 1,4 m2 , die Hauttemperatur im Durchschnitt 33 ◦ C. Welche Leistung strahlt der Körper pro Flächeneinheit ab (dies entspricht der Bestrahlungsstärke)? Das Emissionsvermögen des Körpers sei 97%, die Umgebungstemperatur sei 20 ◦ C. Wie viel Energie gibt der Körper pro Sekunde ab?

13.3

Mit einem optischen Pyrometer messen wir den Emissionsgrad aus einem kleinen Loch in einem Ofen mit 22,8 W/cm2 . Wie heiß ist es im Inneren des Ofens?

13.4

Die Temperatur eines Objekts, das einem schwarzen Körper ähnelt, werde von 200 K auf 2000 K angehoben. Wie verändert sich dadurch die abgestrahlte Energiemenge?

13.5* Ihre Haut ist ungefähr 33 ◦ C warm. Angenommen, Sie strahlen bei dieser Temperatur als schwarzer Körper. Bei welcher Wellenlänge emittieren Sie dann die meiste Energie? 13.6* Bei welcher Wellenlänge wird die meiste Energie abgegeben, wenn ein Objekt, das einem schwarzen Körper ähnelt, in eine bei Raumtemperatur (20 ◦ C) befindliche Umgebung strahlt? 13.7* Die Oberflächentemperatur eines bläulichweißen Sterns der Klasse O liege bei ungefähr 40 × 103 K. Bei welcher Frequenz strahlt der Stern die meiste Energie ab? 13.8* Fotografiert man das Sonnenspektrum von einer Rakete aus, die sich außerhalb der Erdatmosphäre befindet, so erscheint ein Maximum des spektralen Emissionsgrades bei etwa 465 nm. Berechnen Sie die Oberflächentemperatur der Sonne unter der Annahme, dass es sich um einen schwarzen Körper handelt. Der Wert, den Sie mit dieser Näherung erhalten, ist ungefähr 400 K zu hoch. 13.9* Ein Objekt, das einem schwarzen Körper ähnelt, emittiert die maximale Energiemenge pro Wellenlängeneinheit am roten Ende des sichtbaren Spektralbereiches (λ = 680 nm). Welche Temperatur hat die Oberfläche des Objekts? 13.10* Die Energie pro Flächeneinheit, Zeiteinheit und Wellenlängenintervall, die ein schwarzer Körper bei der Temperatur T emittiert, ist gegeben durch   1 2πhc2 Iλ = . hc λ5 e λkB T − 1 Bei einer bestimmten Temperatur ist die pro Flächeneinheit des schwarzen Körpers insgesamt abgestrahlte Leistung gleich der Fläche unter dem Graphen, wenn man Iλ als Funktion von λ aufträgt. Leiten Sie daraus das Stefan-Boltzmann-Gesetz ab. [Hinweis: Vereinfachen Sie den Exponentialterm durch die Variablentransformation x=

hc . λkB T

´∞ Verwenden Sie die Beziehung 0 xn exdx −1 = Γ (n + 1) ζ (n + 1) mit der Gammafunktion, die durch Γ (n + 1) = n! gegeben ist, und der riemannsche Zetafunktion 4 ζ, die für n = 3 den Wert ζ (4) = π90 hat.] 13.11* Gehen Sie von Gleichung (13.4) aus und zeigen Sie, dass diese äquivalent ist zu Iλ =

3,742 × 10−25 W/m2 · nm . λ5 (e0,0144/λT − 1)

Aufgaben

1273

13.12* Im atomaren Bereich gibt man Energien häufig in Elektronenvolt (eV) an. Leiten Sie die folgende Gleichung für die Energie eines Lichtquants in eV ab, wenn die Wellenlänge in Nanometern gegeben ist: E=

1239,8 eV· nm . λ

Wie groß ist die Energie eines Lichtquants bei 600 nm? 13.13 Abbildung A.13.13 zeigt die spektrale Bestrahlungsstärke, die an einem klaren Tag in Höhe des Meeresspiegels auf eine waagerechte Fläche fällt, wenn die Sonne im Zenit steht. Welche Energie (in eV und J) haben die energiereichsten Photonen, die dabei auftreten? m

m

1000

Wm

1400

600

m

200 0 0.2

Abb. A.13.13

0.6

1.0

1.4

1.8

2.2

m

13.14* Eine gelbe (550 nm) 100-W-Glühlampe befinde sich 100 m entfernt von einer Blendenöffnung mit einem Durchmesser von 3 cm. Die Glühlampe wandle 2,5% der elektrischen Leistung in Licht um. Wie viele Photonen treten durch die Blendenöff1 nung, wenn diese für 1000 s geöffnet wird? 13.15 Die Solarkonstante ist die Strahlungsflussdichte auf der Oberfläche einer sonnenzentrierten Kugel, deren Radius der mittleren Entfernung zwischen Erde und Sonne entspricht. Ihr Wert beträgt 0,133 bis 0,14 W/cm2 . Die mittlere Wellenlänge der Sonnenstrahlung setzen wir gleich 700 nm. Wie viele Photonen treffen höchstens pro Sekunde und pro Quadratmeter auf einem Sonnensegel unmittelbar über der Erdatmosphäre ein? 13.16 Eine 50,0 cm3 große Kammer ist mit Argongas unter einem Druck von 20,3 Pa bei einer Temperatur von 0 ◦ C gefüllt. Nahezu alle Atome befinden sich dabei im Grundzustand. Ein Lichtblitz aus einer Röhre, die die Kammer umgibt, hebt 1,0% der Atome in den gleichen angeregten Zustand mit einer mittleren Lebensdauer von 1,4×10−8 s an. Wie groß ist die Rate, mit der das Gas anschließend Photonen emittiert, maximal (sie fällt natürlich mit der Zeit ab)? Nehmen Sie an, dass es sich um ein ideales Gas handelt und dass nur spontane Emission auftritt.

13 Moderne Optik

1274

13.17* Zeigen Sie, dass für ein im Gleichgewicht befindliches System aus Atomen und Photonen das Verhältnis der Übergangsraten in induzierter bzw. spontaner Emission gegeben ist durch   1 . hν e kB T − 1 13.18* Ein System von Atomen im thermischen Gleichgewicht emittiert und absorbiert Photonen mit einer Energie von 2,0 eV. Berechnen Sie das Verhältnis der Übergangsraten in induzierter bzw. spontaner Emission bei 300 K. Was folgt aus Ihrem Resultat? [Hinweis: Orientieren Sie sich an der vorangegangenen Aufgabe.] 13.19 Wiederholen Sie die Rechnung der vorangegangenen Aufgabe bei einer Temperatur von 30,0 × 103 K und vergleichen Sie die Ergebnisse. 13.20* Gegeben ist ein atomares Zweiniveausystem, in dem das Niveau 2 energetisch höher liegt als das Grundzustandsniveau 1, was in der Gleichung dN2 = B12 uν N1 − B21 uν N2 − A21 N2 dt zum Ausdruck kommt. Zeigen Sie, dass im thermischen Gleichgewicht gilt A21 N2 + B21 uν N2 = B12 uν N1 . 13.21* Bestimmen Sie die Rate, mit der in einem bei 441,56 nm emittierenden 100-mW-HeCd-Laser induzierte Emission abläuft. 13.22* Wir betrachten ein System aus Atomen im Gleichgewicht, das zwei Energieniveaus besetzen kann. Zeigen Sie, dass die Anzahldichten der beiden Zustände sich einander immer weiter nähern, wenn die Temperatur so hoch wird, dass gilt kB T  Ej − Ei . [Hinweis: Bilden Sie das Verhältnis der Übergangsraten zwischen der gesamten Emission und Absorption.] 13.23* 21-cm-Strahlung, die aus großen Wasserstoffgaswolken stammt, trifft aus dem Weltraum auf die Erde. Berechnen Sie unter der Annahme, dass die Temperatur der kosmischen Hintergrundstrahlung 3 K beträgt, das Verhältnis zwischen den Übergangsraten der induzierten und der spontanen Emission. Diskutieren Sie Ihr Ergebnis. 13.24* Gehen Sie von Beispiel 13.7 aus und bestimmen Sie die mittlere Leistung pro Kubikmeter, die von einem Nd:YAG-Laser abgestrahlt wird, wenn der Übergang bei einer Lebensdauer des oberen Niveaus von 230 µs stattfindet. 13.25* Gehen Sie von Abbildung 13.6 aus, in der zwei Übergänge für den He-Cd-Laser gezeigt sind, und bestimmen Sie die Lebensdauer des höherenergetischen d-Zustands.

Aufgaben

1275

13.26* Der Helium-Neon-Laser ist bekannt für seine Rotlichtemission bei 632,8 nm. Elektronen in dem gleichen hochenergetischen Niveau können jedoch nach unten in neun tiefere Niveaus springen (jeweils mit einer nicht zu vernachlässigenden Wahrscheinlichkeit), wobei Energie mit den in Tabelle 13.3 aufgelisteten Wellenlängen abgestrahlt wird. Bestimmen Sie die Lebensdauer dieses oberen Niveaus. Welcher Übergang ist am wahrscheinlichsten? Was ist die hellste sichtbare Emission? λ (nm)

Aji ( s−1 )

60,0 543,4 593,9 604,6 611,8 629,4 632,8 635,2 640,1 730,5

259 × 105 283 × 105 2,0 × 105 2,26 × 105 6,09 × 105 6,39 × 105 33,9 × 105 3,45 × 105 13,9 × 105 2,55 × 105

Tabelle 13.3 Emissionen des He-Ne-Lasers

13.27* Aus einem He-Ne-Laser (λ = 632,8 nm) fällt ein Strahl mit einem Anfangsdurchmesser von 3,0 mm auf eine 100 m entfernte senkrechte Wand. Wie groß ist der Lichtfleck, der auf der Wand entsteht? 13.28* Schätzen Sie grob ab, wie viel Energie ein Rubinlaser liefern kann, dessen Kristall 0,050 m lang ist und einen Durchmesser von 5,0 mm hat. Die Lichtpulse sollen 5,0 × 10−6 s lang andauern. Die Dichte von Aluminiumoxid, Al2 O3 , beträgt 3,7 × 103 kg m−3 . Verwenden Sie die in der Diskussion von Abbildung 13.16 gegebenen Daten sowie die Tatsache, dass Chromionen bei 1,79 eV einen Laserübergang haben. Welche Leistung wird je Puls freigesetzt? 13.29 Berechnen Sie die Übergangsrate der Neon-Atome in einem He-Ne-Laser, wenn der Energieverlust für die 632,8-nm-Emission 1,96 eV beträgt und eine Leistung von 1,0 mW abgegeben wird. 13.30* Ein Festkörperlaser hat eine aktive Zone, die aus einem Stab von 10 mm Durchmesser und 0,050 m Länge besteht und mit einer Effizienz von 2 % arbeitet. Der Stab enthält 4 × 1019 partizipierende Ionen pro Kubikzentimeter. Der Laser emittiert Pulse bei 701 nm. Bestimmen Sie die Energie eines einzelnen solchen Pulses. 13.31* Ein Rubinlaser, der Strahlung bei 694,3 nm aussendet, habe eine Frequenzbandbreite von 50 MHz. Berechnen Sie die zugehörige Linienbreite. 13.32* Berechnen Sie den Frequenzunterschied zwischen zwei benachbarten axialen Resonatormoden eines typischen, 25 cm langen Gaslasers (n ≈ 1).

13 Moderne Optik

1276

13.33* Die 488,0-nm-Linie eines Argonionenlasers ist dopplerverbreitert auf 2,7 × 109 Hz. Nehmen Sie an, dass die Spiegel des Lasers 1,0 m voneinander entfernt sind, und bestimmen Sie näherungsweise die Anzahl der longitudinalen Moden. Der Brechungsindex des Gases ist 1,0. 13.34* Ein Gaslaser hat einen Fabry-Perot-Hohlraum von 40 cm Länge. Der Brechungsindex des Gases ist 1,0. Nehmen Sie an, dass der Laser bei 600 nm arbeitet und bestimmen Sie die Modenzahl, d. h. die Anzahl der Halbzyklen, die in den Hohlraum passen. 13.35* Ein kontinuierlicher He-Ne-Laser hat bei 632,8 nm eine dopplerverbreiterte Übergangsbandbreite von ungefähr 1,4 GHz. Es sei n = 1,0. Wie lang darf die Resonatorkammer höchstens sein, damit ein axialer Einmodenbetrieb möglich ist? Skizzieren Sie die Linienbreite des Übergangs und die zugehörigen Resonatormoden. 13.36* Bestimmen Sie den Schwellwert für den Verstärkungsfaktor eines Halbleiterlasers, wenn folgende Daten gegeben sind: α ≈ 10 cm−1 , die Resonatorlänge beträgt 0,03 cm, der Reflexionsgrad ist an beiden „Spiegeln“ nur 0,4. 13.37 Zeigen Sie, dass die maximale Intensität des elektrischen Feldes, Emax , bei einer bestimmten Bestrahlungsstärke gegeben ist durch  I Emax = 27,4 Einheit: V/m . n n ist der Brechungsindex des Mediums. 13.38* Ein He-Ne-Laser (λ = 632,8 nm) hat einen minimalen Querschnitt von 0,60 mm. Berechnen Sie den Vollwertswinkel (die Divergenz) des Strahls. 13.39 Was für ein Muster entsteht bei der Beugung eines Laserstrahls an den drei in Abbildung A.13.39 gezeigten gekreuzten Gittern?

Abb. A.13.39

Aufgaben

1277

13.40 Skizzieren Sie das fraunhofersche Beugungsmuster, das an dem in Abbildung A.13.40 a gezeigten Dia entsteht. Welche Art von Filter würden Sie verwenden, um das Muster in Abbildung A.13.40 b zu erhalten?

(a)

Abb. A.13.40 (Foto E. H.)

(b)

13.41 Wiederholen Sie Aufgabe 13.40 für Abbildung A.13.41.

(a)

(b)

Abb. A.13.41: (Foto mit frdl. Genehmigung von R. A. Philips.)

13.42* Wiederholen Sie Aufgabe 13.40 für Abbildung A.13.42.

(a)

Abb. A.13.42 (Foto mit frdl. Genehmigung von R. A. Philips.)

(b)

13 Moderne Optik

1278

13.43 Betrachten Sie noch einmal Abbildung 13.37. Welche Art von räumlichem Filter würden Sie verwenden, um die in Abbildung A.13.43 gezeigten Muster zu erhalten?

(a)

(b)

Abb. A.13.43 (Foto mit freundlicher Genehmigung von D. Dutton, M. P. Givens und R. E. Hopkins.)

13.44 Zeigen Sie, dass die Transversalvergrößerung des Systems aus Abbildung 13.36 gegeben ist durch −f  /ft . Skizzieren Sie die Strahlenverläufe! Zeichnen Sie einen Strahl durch den Mittelpunkt der ersten Linse, der mit der optischen Achse einen Winkel θ bildet. Zeichnen Sie, ausgehend vom Schnittpunkt dieses Strahls mit Σt , einen Strahl nach unten, der in einem Winkel Φ durch den Mittelpunkt der zweiten Linse geht. Beweisen Sie: Φ/θ = ft /f  . Zeigen Sie unter Verwendung des Begriffes der Raumfrequenz, Gleichung (11.64), dass kO in der Objektebene durch die Beziehung kI = kO

ft f

mit kI in der Bildebene verbunden ist. Was bedeutet dies für die Größe des Bildes, wenn f  > ft ist? Was können Sie über die räumliche Periode der Eingangsdaten im Vergleich zu denen der Ausgangsdaten aussagen? 13.45 Ein Beugungsgitter mit 50 Strichen pro Zentimeter dient im optischen Computer der Abbildung 13.41 als Gegenstand. Angenommen, dieses Gitter wird mit ebenen Wellen grünen (543,5 nm) Lichts aus einem He-Ne-Laser kohärent beleuchtet und jede Linse hat eine Brennweite von 100 cm. Wie weit liegen dann die Beugungspunkte in der Transformiertenebene auseinander? 13.46* Wir betrachten ein Kosinusgitter (also ein Gitter, dessen Amplituden-Transmissionsprofil kosinusförmig ist) mit einer räumlichen Periode von 0,01 mm. Das Gitter werde mit quasimonochromatischen, ebenen Wellen (λ = 500 nm) beleuchtet. Die Anordnung soll Abbildung 13.36 entsprechen, wobei die Brennweiten der transformierenden und der abbildenden Linse 2,0 m bzw. 1,0 m sind. (a) Diskutieren Sie das entstehende Muster. Entwerfen Sie ein Filter, das nur die Terme erster Ordnung durchlässt, und beschreiben Sie es ausführlich. (b) Wie sieht bei Verwendung dieses Filters das Bild auf Σi aus? (c) Wie erreichen Sie, dass nur der Gleichlichtterm durchgelassen wird? Wie sieht dann das Bild aus? 13.47 Angenommen, wir bringen in die Transformiertenebene der vorangegangenen Aufgabe eine Maske, die nur den Beitrag mit m = +1 durchlässt. Wie sieht dann das Bild

Aufgaben

1279

auf Σi aus? Erklären Sie Ihre Argumentation. Wie sieht das Bild aus, wenn nur der Term mit m = +1 oder mit m = −1 durchgelassen wird? 13.48* Das in den beiden vorangegangenen Aufgaben verwendete Kosinusgitter werde horizontal ausgerichtet. Skizzieren Sie die Amplitude des elektrischen Feldes entlang y  ohne Filterung. Zeichnen Sie die zugehörige Bestrahlungsstärkeverteilung des Bildes. Wie sieht das elektrische Feld des Bildes aus, wenn der Gleichlichtterm herausgefiltert wurde? Zeichnen Sie diese Situation sowie die neue Bestrahlungsstärkeverteilung. Was können Sie bezüglich der Raumfrequenz des Bildes mit und ohne Filterung aussagen? Beziehen Sie Ihre Antworten auf Abbildung 11.14. 13.49 Ersetzen Sie das Kosinusgitter der vorangegangenen Aufgabe durch ein quadratisches Strichgitter, also eine Reihe vieler schmaler, abwechselnd durchsichtiger und lichtundurchlässiger Streifen gleicher Breite. Filtern Sie nun alle Terme in der Transformiertenebene heraus mit Ausnahme der Beugungsflecken nullter und erster Ordnung, deren relative Bestrahlungsstärke 1,0, 0,36 und 0,36 betragen soll. Vergleichen Sie mit den Abbildungen 7.40 a und 7.42. Leiten Sie einen Ausdruck für die allgemeine Form der Bestrahlungsstärkeverteilung in der Bildebene ab und skizzieren Sie diese. Was für ein Streifenmuster entsteht? 13.50 Ein engmaschiges, quadratisches Drahtgitter mit 50 Drähten pro Zentimeter wird senkrecht in die Objektebene des optischen Computers aus Abbildung 13.50 gebracht. Die Brennweiten der Linsen sollen jeweils 1,0 m betragen. Mit Licht welcher Wellenlänge muss man die Anordnung beleuchten, wenn die Beugungsmaxima in der Transformiertenebene senkrecht und waagerecht jeweils 2,0 mm voneinander entfernt sein sollen? Wie groß sind die Abstände der Gitterlinien in der Bildebene? 13.51* Wir betrachten eine undurchsichtige Schablone, in die in regelmäßigen Abständen (etwa auf den Gitterpunkten eines Schachbretts) kreisrunde, gleich große Löcher gestanzt sind. Hinzu kommen etliche völlig zufällig verteilte Löcher. Wenn die Schablone in Aufgabe 13.49 als Gegenstand dient, wie sieht dann das Beugungsmuster aus? Angenommen, der gegenseitige Abstand der geordneten Löcher betrage senkrecht und waagerecht je 0,1 mm. Wie groß ist dann die Raumfrequenz der zugehörigen Flecken im Bild? Wie müsste ein Filter beschaffen sein, mit dem man die zufällig verteilten Löcher aus dem endgültigen Bild entfernen kann? 13.52* Stellen Sie sich ein großes Dia vor, auf dem ein Gesicht abgebildet ist. Diese Abbildung soll sich aus kleinen, regelmäßig angeordneten, gleich großen, kreisrunden Punkten zusammensetzen, wobei jeder Punkt eine bestimmte Schwärzung hat, sodass der durchgelassene Lichtstrahl eine bestimmte Feldamplitude hat. Das Dia werde mit einer ebenen Welle beleuchtet. Kann man die Amplitude des elektrischen Feldes unmittelbar hinter dem Dia als das Produkt (im Mittel) einer regelmäßigen, zweidimensionalen Anordnung von Zylinderfunktionen (Abb. 11.4), einer Art „Nagelbrett“, und der kontinuierlichen zweidimensionalen Bildfunktion darstellen? Begründen Sie Ihre Antwort. Stellen Sie mithilfe des Frequenzfaltungssatzes fest, wie das Licht in der Transformiertenebene verteilt ist. Wie müsste ein geeignetes Filter aussehen, um ein kontinuierliches Bild zu erhalten?

13 Moderne Optik

1280

13.53* Mithilfe der in Abbildung A.13.53 gezeigten Anordnung kann man einen kollimierten Laserstrahl in eine Kugelwelle umwandeln. Die Blende „reinigt“ den Strahl, d. h., sie eliminiert Beugungseffekte durch Staub und ähnliches auf der Linse. Wie funktioniert das?

Laserstrahl

Mikroskopobjektiv

Lochblende (a)

(b)

(c)

Abb. A.13.53 (a) und (b) Ein Hochleistungs-Laserstrahl vor und nach der Filterung. (Foto mit frdl. Genehmigung des Lawrence Livermore National Laboratory.)

13.54 Was passiert mit dem Fleckenmuster, das sich infolge des Speckle-Effekts bildet, wenn ein Laserstrahl nicht auf eine glatte Wand, sondern auf eine Suspension wie beispielsweise Milch gerichtet wird?

Anhang 1: Theorie des Elektromagnetismus Die maxwellschen Gleichungen in differentieller Form Die maxwellschen Gleichungen lauten in Integralschreibweise ˛ ¨ ∂B E · dI = − · dS ∂t C A  ¨  ˛ B ∂E · dI = · dS J+ μ ∂t C A ‹ ˚ E · dS = ρ dV A

und

[3.5]

[3.13] [3.7]

V

‹ B · dS = 0 .

[3.9]

A

Sie können aber auch in differentieller Form geschrieben werden, welche für die Herleitung des Wellenaspektes des elektromagnetischen Feldes geeigneter ist. Dieser Übergang kann mithilfe zweier Sätze der Vektoranalysis vollzogen werden, dem gaußschen Integralsatz ‹ ˚ F · dS = ∇ · F dV (A1.1) A

V

und dem Integralsatz von Stokes ¨ ˛ F · dI = ∇ × F · dS . C

(A1.2)

A

Dabei ist die Größe F kein konstanter Vektor, sondern eine vektorielle Funktion des Ortes, d. h., der jeweiligen Koordinaten. Diese Funktion ordnet jedem Raumpunkt einen bestimmten Vektor zu – im Falle kartesischer Koordinaten jedem (x, y, z) ein F(x, y, z). Vektorwertige Funktionen wie E und B nennt man Vektorfelder.

https://doi.org/10.1515/9783111025599-014

Anhang 1: Theorie des Elektromagnetismus

1282

Durch Anwendung des stokesschen Integralsatzes auf die elektrische Feldstärke erhalten wir ˛ ¨ E · dI = ∇ × E · dS . (A1.3) Durch Vergleich mit Gleichung (3.5) folgt ¨ ¨ ∂B · dS . ∇ × E · dS = − ∂t

(A1.4)

Dieses Ergebnis muss für alle Oberflächen zutreffen, die durch den Weg C eingeschlossen werden. Dies kann nur dann der Fall sein, wenn die Integranden selbst gleich sind, also wenn ∇×E=−

∂B ∂t

(A1.5)

ist. Entsprechend ergibt die Anwendung des stokesschen Satzes auf B und Gleichung (3.13)   ∂E ∇×B=μ J+ . (A1.6) ∂t Der gaußsche Integralsatz liefert bei Anwendung auf die elektrische Feldstärke ‹ ˚ E · dS = ∇ · E dV . Unter Berücksichtigung von Gleichung (3.7) wird dies zu ˚ ˚ 1 ∇ · E dV = ρ dV ,  V

(A1.7)

(A1.8)

V

und da dies für jedes Volumen (einen beliebigen geschlossen Raum) gelten soll, müssen die Integranden gleich sein. Folglich gilt an jedem Punkt (x, y, z, t) des Raum-Zeit-Kontinuums ∇·E=

ρ . 

(A1.9)

Analog ergibt die Anwendung des gaußschen Satzes auf B und Gleichung (3.9) ∇ ·B = 0.

(A1.10)

Die Gleichungen (A1.5), (A1.6), (A1.9) und (A1.10) sind die maxwellschen Gleichungen in differentieller Form. Vergleichen Sie dies mit den Gleichungen (3.18) bis (3.21) für den einfachen Fall kartesischer Koordinaten im ladungsfreien Raum (ρ = J = 0,  = 0 und μ = μ0 ).

Elektromagnetische Wellen Zur Herleitung der elektromagnetischen Wellengleichung müssen wir wieder die Anwesenheit eines Mediums berücksichtigen. In Abschnitt 3.5.1 hatten wir den Polarisationsvektor P als Maß für das Verhaltens des Mediums eingeführt, wobei P das resultierende elektrische Dipolmoment pro Volumeneinheit ist. Durch die Polarisation ergibt sich innerhalb des Mediums ein

Anhang 1: Theorie des Elektromagnetismus

1283

neues Feld. Entsprechend führen wir eine neue Feldgröße ein, die elektrische Verschiebungsdichte D mit D = 0 E + P .

(A1.11)

Daraus ergibt sich unmittelbar E=

D P − . 0 0

Das innere elektrische Feld E ist demnach die Differenz zwischen dem Feld ohne Polarisation, D/0 , und dem zusätzlichen Feld infolge der Polarisation, P/0 . Bei einem homogenen, isotropen und linearen Dielektrikum sind P und E gleich gerichtet und zueinander proportional. Folglich ist D auch proportional zu E: D = E .

(A1.12)

Wie auch E erstreckt sich D über den gesamten Raum und ist nicht, wie P, auf den Bereich beschränkt, den das Dielektrikum einnimmt. Die Feldlinien von D beginnen und enden an freien, beweglichen Ladungen. Die Feldlinien von E beginnen und enden entweder an freien Ladungen oder an gebundenen Polarisationladungen. Ist keine freie Ladung vorhanden, beispielsweise in der Nähe eines polarisierten Dielektrikums oder im freien Raum, so sind die Linien des D-Feldes in sich geschlossen. Optische Medien reagieren auf ein Magnetfeld im Allgemeinen ähnlich wie das Vakuum. Wir müssen die Vorgänge deshalb nicht ausführlich beschreiben; es soll genügen festzustellen, dass das Material polarisiert wird. Wir definieren nun eine magnetische Polarisation oder Magnetisierung, das magnetische Dipolmoment pro Volumeneinheit, durch den Vektor M. Um den Einfluss des magnetisch polarisierten Mediums zu beschreiben, führen wir außerdem den Hilfsvektor H ein, der magnetische Feldstärke genannt wird: H = μ−1 0 B−M.

(A1.13)

Im Falle eines homogenen, linearen (nicht ferromagnetischen), isotropen Mediums sind B und H parallel zueinander und proportional: H = μ−1 B .

(A1.14)

Neben den Gleichungen (A1.12) und (A1.14) gibt es noch eine weitere Materialgleichung, J = σE .

(A1.15)

Diese Beziehung ist das ohmsche Gesetz. Sie drückt eine experimentelle Beobachtung aus, die für Leiter bei konstanter Temperatur gilt: Die elektrische Feldstärke und also die Kraft, die auf jedes Elektron in einem Leiter wirkt, bestimmt den Ladungsfluss. Der Proportionalitätsfaktor zwischen E und J ist die Leitfähigkeit σ des jeweiligen Mediums. Betrachten wir nun allgemein die Umgebung eines linearen (weder ferroelektrischen noch ferromagnetischen), homogenen, isotropen und außerdem ruhenden Mediums. Mithilfe der

Anhang 1: Theorie des Elektromagnetismus

1284

Materialgleichungen können wir die maxwellschen Gleichungen dann der folgender Form schreiben: σ [A1.9] ∇·E=  ∇·B=0 [A1.10] ∂B ∇×E=− [A1.5] ∂t ∂E ∇ × B = μσE + μ . (A1.16) ∂t Um aus diesen Beziehungen eine Wellengleichung (2.61) abzuleiten, bilden wir am besten die zweiten Ableitungen nach den Ortsvariablen. Wir bilden die Rotation von Gleichung (A1.16) und erhalten ∇ × (∇ × B) = μσ(∇ × E) + μ

∂ (∇ × E) , ∂t

(A1.17)

wobei wir die Ableitungen nach dem Ort und nach der Zeit vertauschen dürfen, da wir annehmen wollen, dass E eine gutartige Funktion ist. Die gesuchte zweite Ableitung nach der Zeit ergibt sich durch Einsetzen von Gleichung (A1.5): ∇ × (∇ × B) = −μσ

∂B ∂ 2B − μ 2 . ∂t ∂t

(A1.18)

Das mehrfache Kreuzprodukt vereinfachen wir mithilfe der Operatorgleichung ∇ × (∇×) = ∇(∇·) − ∇2 ,

(A1.19)

woraus sich ergibt ∇ × (∇ × B) = ∇(∇ · B) − ∇2 B , wobei in kartesischen Koordinaten gilt (∇ · ∇)B = ∇2 B ≡

∂2B ∂2B ∂2B + + . ∂x2 ∂y 2 ∂z 2

Weil die Divergenz von B null ist, wird Gleichung (A1.18) zu ∇2 B = μ

∂2B ∂B = 0. − μσ ∂t2 ∂t

(A1.20)

Eine analoge Gleichung gilt für die elektrische Feldstärke. Wir verfahren im Wesentlichen wie oben und bilden die Rotation von Gleichung (A1.5): ∇ × (∇ × E) = −

∂ (∇ × B) . ∂t

Mithilfe von Gleichung (A1.16) eliminieren wir B, ∇ × (∇ × E) = −μσ

∂2E ∂E − μ 2 , ∂t ∂t

Anhang 1: Theorie des Elektromagnetismus

1285

und erhalten unter Verwendung von Gleichung (A1.19) ∂ 2E ∂E = ∇(ρ/) . − μσ ∂t2 ∂t Dabei haben wir außerdem verwendet ∇2 E − μ

∇(∇ · E) = ∇(ρ/) . Für ein elektrisch neutrales Medium ist ρ = 0 und deshalb ∇2 E − μ

∂ 2E ∂E = 0. − μσ 2 ∂t ∂t

(A1.21)

Die Gleichungen (A1.20) und (A1.21) heißen auch Telegraphengleichungen.1 Für ein nichtleitendes Medium ist σ = 0, und die Gleichungen bekommen die Form ∇2 B − μ

∂ 2B =0 ∂t2

(A1.22)

∇2 E − μ

∂2E =0 ∂t2

(A1.23)

∇2 H − μ

∂ 2H =0 ∂t2

(A1.24)

∇2 D − μ

∂2D = 0. ∂t2

(A1.25)

sowie analog

und

Im Vakuum, einem speziellen Nichtleiter, ist ρ = 0,

σ = 0,

Ke = 1 und Km = 1 ,

und die Gleichungen (A1.22) bis (A1.25) vereinfachen sich zu ∇2 E = μ0 0

∂2E ∂t2

(A1.26)

∇2 B = μ0 0

∂2B . ∂t2

(A1.27)

und

Beide Gleichungen beschreiben gekoppelte raum- und zeitabhängige Felder, und beide haben die Form einer Wellengleichung. Die weitere Diskussion erfolgt in Abschnitt 3.2. 1

Bei einer Telegraphenleitung, etwa zwei parallelen Drähten, verursacht der endliche Widerstand der Drähte einen Leitungsverlust, wobei Wärme entsteht. Einer elektromagnetischen Welle, die sich durch eine solche Leitung bewegt, steht deshalb immer weniger Energie zur Verfügung. Die ersten Ableitungen nach der Zeit in den Gleichungen (A1.20) und (A1.21) sind auf den Leitungsstrom zurückzuführen und bewirken die Dämpfung.

Anhang 2: Kirchhoffsche Beugungstheorie Zur Lösung der Helmholtz-Gleichung (10.113) gehen wir von zwei skalaren Funktionen U1 und U2 aus, für die der zweite greensche Satz lautet ˚ ‹ (U1 ∇2 U2 − U2 ∇2 U1 )dV = (U1 ∇U2 − U2 ∇U1 ) dS . (A2.1) V

S

Wenn U1 und U2 Lösungen der Helmholtz-Gleichung sind, d. h., wenn gilt ∇2 U1 + k 2 U1 = 0 und ∇2 U2 + k 2 U2 = 0 , dann gilt offensichtlich ‹ (U1 ∇U2 − U2 ∇U1 ) dS = 0 .

(A2.2)

S

! der räumliche Anteil einer nicht näher spezifizierten skalaren optischen Es sei nun U1 = E, Störung [Gl. (10.112)]. Außerdem sei U2 =

eikr , r

wobei r von einem Punkt P aus gemessen wird. Beide gewählte Funktionen erfüllen offensichtlich die Helmholtz-Gleichung. Im Punkt P , wo r = 0 ist, tritt eine Singularität auf. Deshalb umgeben wir den Punkt mit einer kleinen Kugel und schließen ihn somit aus dem von S umschlossenen Gebiet aus (siehe Abb. A2.1). Damit wird Gleichung (A2.2) zu ‹   ikr  ‹   ikr  eikr ! eikr ! e e ! ! 0= − ∇E · dS + − ∇E · dS . (A2.3) E∇ E∇ r r r r S

S

Wir entwickeln nun den Anteil des Integrals, der zu S  gehört. Die Einheitsnormale n ˆ in der kleinen Kugel zeigt zum Punkt P , und es ist   ikr   1 e ik ikr = e n ∇ − ˆ, r r2 r https://doi.org/10.1515/9783111025599-015

Anhang 2: Kirchhoffsche Beugungstheorie

1288

weil der Gradient radial nach außen zeigt. Ausgedrückt durch den Raumwinkel (dS = r2 dΩ), gemessen in P , lautet das Integral über S   ‹  ∂ E! ikr ! ! e dΩ E − ik Er + r ∂r

(A2.4)

S

2 ! dΩ. Wenn die Kugel um P schrumpft, so geht auf S  r → 0 und mit ∇E! · dS = −(∂ E/∂r)r exp(ikr) → 1. Wegen der Stetigkeit von E! nähert sich dessen Wert in jedem Punkt von S  seinem Wert in P , nämlich E!p . Die letzten beiden Terme in Gleichung (A2.4) gehen gegen null, und das Integral wird zu 4π E!p . Aus Gleichung (A2.3) wird dann schließlich

1 E!p = 4π

‹

eikr ! ∇E · dS − r



S

 ikr  e ! · dS . E∇ r

S

Das ist der kirchhoffsche Integralsatz. ˆ n

P

ˆ n

S

Abb. A2.1

[10.114]

Lösungen ausgewählter Aufgaben Kapitel 2 2.6 (0,003) × (2,54 × 10−2 )/580 × 10−9 = Anzahl der Wellen = 131. c = νλ, λ = c/ν = 3 × 108 /1010 , λ = 3 cm. Die Wellen erstrecken sich über 3,9 m. 2.11

v = νλ = 1498 m/s = (440 Hz)λ; λ = 3,40 m.

2.21 ψ = A sin 2π(κx − νt), ψ1 = 4 sin 2π(0,2x − 3t) (a) ν = 3 (b) λ = 1/0,2 (c) τ = 1/3 (d) A = 4 (e) v = 15 (f) positives x ψ = A sin(kx + ωt), ψ2 = (1/2,5) sin(7x + 3,5t) (a) ν = 3,5/2π (b) λ = 2π/7 (c) τ = 2π/3,5 (d) A = 1/2,5 (e) v = 0,5 (f) negatives x 2.27 vy = −ωA cos(kx − ωt + ε), ay = −ω 2 y. Einfache harmonische Bewegung wegen ay ∝ y. 2.28 τ = 2,2 × 10−15 s, daher ist ν = 1/τ = 4,5 × 1014 Hz; v = νλ, 3 × 108 m/s = (4,5 × 1014 Hz)λ; λ = 6,6 × 10−7 m und k = 2π/λ = 9,5 × 106 m−1 . ψ(x, t) = (103 V/m) cos[9,5 × 106 m−1 × (x + 3 × 108 m/s × t)]. Der Kosinus steht wegen cos 0 = 1. 2.29

y(x, t) = C/[2 + (x + vt)2 ]. y t=2

C/2

t=0 v = 1m/s

−2

−1

0

1

√ 2

2

3

x

2.31 Nein. Die Funktion ist nicht zweimal (nichttrivial) ableitbar und keine Lösung einer Wellengleichung. ∂ψ dx ∂ψ dy dψ = + . 2.34 dt ∂x dt ∂y dt Wir setzen y = t, womit sich ergibt ∂ψ ∂ψ dψ = (±v) + =0 , dt ∂x ∂t und das gesuchte Ergebnis folgt unmittelbar.

https://doi.org/10.1515/9783111025599-016

Lösungen ausgewählter Aufgaben

1290

∂ϕ dx ∂ϕ dx dϕ = + =0=k − kv . dt ∂x dt ∂t dt dx Der letzte Term wird null, wenn = ±v ist, wie zu erwarten. Für die Welle aus Aufgabe 2.20 dt gilt

2.35

dϕ ∂ϕ ∂ϕ = (±v) + = π 3 × 106 (±v) + π 9 × 1014 = 0 , dt ∂y ∂t und die Geschwindigkeit ist gleich −3 × 108 m/s. ψ(z, 0) = A sin(kz + ε);

π  √3 λ  ψ − , 0 = A sin − + ε = 12 6 2

π  1

λ  +ε = ψ , 0 = A sin 6 3 2

π 

λ  +ε =0 ψ , 0 = A sin 4 2

π 

 π π π A sin + ε = A sin cos ε + cos sin ε = A cos ε = 0, ε = 2 2 2 2

π π 

5π  1 A sin + = A sin = 3 2 6 2 Daher ist A = 1 und folglich ψ(z, 0) = sin(kz + π/2). 2.37

2.38 (a) und (b) sind Wellen, da es sich um zweimal differenzierbare Funktionen von (z −vt) bzw. (x + vt) handelt. Für (a) gilt deshalb ψ = a2 (z − bt/a)2 , und die Geschwindigkeit in positiver z-Richtung ist gleich b/a. Für (b) ist ψ = a2 (x + bt/a + c/a)2 , und die Geschwindigkeit in negativer x-Richtung ist gleich b/a. 2.40 ψ(x, t) = 5 exp[−a(x + b/a × t)2 ]. Die Welle breitet sich in negativer x-Richtung aus. v = b/a = 0,6 m/s. ψ(x, 0) = 5 exp(−25x2 ).

2.42

30◦ entspricht

1 1 λ oder × (3 × 108 )/(6 × 1014 ) = 42 nm. 12 12

Lösungen ausgewählter Aufgaben 2.43

1291

t λ τ

 x t ψ = 60 sin 2π − 400 × 10−9 1,33 × 10−15 λ = 400 nm ψ = A sin 2π

x

±

v = 400 × 10−9 /1,33 × 10−15 = 3 × 108 m/s τ = 1,33 × 10−15 s. ν = (1/1,33) × 1015 Hz, 2.48

ψ = A exp i(kx x + ky y + kz z) ky = kβ kz = kγ kx = kα |k| = [(kα)2 + (kβ)2 + (kγ)2 ]1/2 = k[α2 + β 2 + γ 2 ]1/2

2.52

λ = h/mv = 6,6 × 10−34 /6 × 1 = 1,1 × 10−34 m.

2.53 Um k zu erhalten, bilden wir einen Einheitsvektor, der in die geeignete Richtung zeigt, und multiplizieren ihn mit k. Der Einheitsvektor ist √ ˆ ˆ [(4 − 0)ˆı+(2 − 0)ˆj+(1 − 0)k]/ 42 + 22 + 12 = (4ˆı+2ˆj+k)/ 21 √ ˆ 21. und k = k(4ˆı+2ˆj+k)/ ˆ r = xˆı+yˆj+z k und daher √ √ √ ψ(x, y, z, t) = A sin[(4k/ 21)x + (2k/ 21)y + (k/ 21)z − ωt] . 2.55

ψ(r1 , t) = ψ[r2 − (r2 − r1 ), t] = ψ(k · r1 , t) = ψ[k · r2 − k · (r2 − r1 ), t] = ψ(k · r2 , t) = ψ(r2 , t) wegen k · (r2 − r1 ) = 0 .

Kapitel 3 3.1

Ey = 2 cos[2π × 1014 (t − x/c) + π/2] Ey = A cos[2πν(t − x/v) + π/2] aus Gl. (2.26).

(a) ν = 1014 Hz, v = c und λ = c/ν = 3 × 108 /1014 = 3 × 10−6 m, Ausbreitung in positiver x-Richtung, A = 2 V/m, ε = π/2, linear polarisiert in y-Richtung. 2 (b) Bx = 0, By = 0, Bz = cos[2π × 1014 (t − x(c) + π/2]. c 3.2 Ez = 0, Ey = Ex = E0 sin(kz − ωt) oder Kosinus. Bz = 0, By = −Bx = Ey /c. Alternativ auch E0 E = √ (ˆı + ˆj) sin(kz − ωt) 2

Lösungen ausgewählter Aufgaben

1292 und E0 B = √ (ˆj − ˆı) sin(kz − ωt) . c 2

3.6 Das Feld ist in y-Richtung linear polarisiert und geht sinusförmig von null bei z = 0 bis null bei z = z0 . Die Wellengleichung lautet ∂ 2 Ey ∂ 2 Ey ∂ 2 Ey 1 ∂ 2 Ey + + − 2 =0 2 2 2 ∂x ∂y ∂z c ∂t2 und damit ist  π2 ω2 πz −k 2 − 2 + 2 E0 sin cos(kx − ωt) = 0 . z0 c z0 Weil dies für alle x, z und t gilt, muss jeder Term null werden, also ist 

cπ 2 ω k= 1− c ωz0 und außerdem v=

c ω = 2 .

k cπ 1 − ωz0

ˆ 1 t+T 3.15 cos (k · r − ωt) = cos2 (k · r − ωt ) dt . T t Es sei nun k · r − vt = x. Dann ist ˆ ˆ 1 + cos 2x 1 1 cos2 x dx = cos2 (k · r − ωt) = dx −ωT −ωT 2  k·r−ω(t+T ) 1 x sin 2x + . = −ωT 2 4 k·r−ωt √ √ √ √ 3.25 E0 = (−E0 / 2)ˆı + (E0 / 2)ˆj und k = (2π/λ)(ˆı/ 2 + ˆj/ 2), also ist E = √ √ 1 (1/ 2)(−10ˆı + 10ˆj) cos[( 2π/λ)(x + y) − ωt] und I = c0 E02 = 0,13 W/m2 . 2 3.26 (a) l = c Δt = (3 × 108 m/s)(2 × 10−9 s) = 0,6 m. (b) Das Volumen eines Pulses beträgt (0,6 m)(πR2 ) = 2,945 × 10−6 m3 ; also: (6,0 J)/(2,945 × 10−6 m3 ) = 2,0 × 106 J/m3 . 2

3.28

(10−3 W) × (t) 10−3 W (Leistung) × (t) = = (Volumen) (πr2 )(ct) π(10−3 )2 (3 × 108 ) −5 10 J/m3 = 1,06 × 10−6 J/m3 . u= 3π

u=

Lösungen ausgewählter Aufgaben 3.30

1293

h = 6,63 × 10−34 , E = hν;

19,88 × 10−2 I = = 3 × 1024 Photonen/m2 s . hν (6,63 × 10−34 ) × (100 × 106 ) Alle Photonen im Volumen V durchdringen eine Flächeneinheit in einer Sekunde; V = (ct)(1 m2 ) = 3 × 108 m3 3 × 1024 = V (Dichte) Dichte = 1016 Photonen/m3 . 3.32 Pe = iV = 0,25 × 3,0 = 0,75 W; dies ist die insgesamt abgegebene Leistung. Als Licht zur Verfügung steht davon nur Pl = 0,01Pe = 75 × 10−4 W. (a) Photonenfluss = Pl /hν = 75 × 10−4 λ/hc = 75 × 10−4 (550 × 10−9 )/(6,63 × 10−34 )(3 × 108 ) = 2,08 × 1016 Photonen/s. (b) Im Volumen (3 × 108 )(1 s)(10−3 m2 ) befinden sich 2,08 × 1016 Photonen. Also ist 2,08 × 1016 Photonen/m3 = 0,69 × 1011 Photonen/m3 . 3 × 105 (c) I = (75 × 10−4 W)/(10 × 10−4 m2 ) = 7,5 W/m2 . 3.34 Wir stellen uns zwei konzentrische Zylinder mit den Radien r1 bzw. r2 vor, die die Welle einschließen. Die Energie, die pro Sekunde durch den ersten Zylinder fließt, muss auch durch den zweiten Zylinder gelangen, also S1 2πr1 = S2 2πr2 . Demnach ist S 2πr konstant, und S ist umgekehrt proportional zu r. Weil aber S ∝ E02 ist, ist E0 proportional zu 1/r. 3.36

A sei die Fläche.     1 dW dp = dt c dt     1 dW I 1 dp = = . P = A dt Ac dt c

3.39

E = 300 W × 100 s = 3 × 104 J . p = E/c = (3 × 104 )/(3 × 108 ) = 10−4 kg · m/s .

(a) P = 2 S /c = 2 × (1,4 × 103 W/m2 )/(3 × 108 m/s) = 9 × 10−6 N/m2 . (b) S und folglich auch P fallen proportional zum Reziproken des Abstandsquadrates ab; S = [(0,7 × 109 m)−2 /(1,5 × 1011 m)−2 ] × (1,4 × 103 W/m2 ) = 6,4 × 107 W/m2 , und P = 0,21 N/m2 . 3.40

3.43

S = 1400 W/m2 P = 2 × [(1400 W/m2 )/(3 × 108 m/s)] = 9,3 × 10−6 N/m2 F = A P = 2000 m2 (9,3 × 10−6 N/m2 ) = 1,9 × 10−2 N .

3.44

S = (200 × 103 W)(500 × 2 × 10−6 s)/A(1 s) F = A P = A S /c = 6,7 × 10−7 N .

Lösungen ausgewählter Aufgaben

1294 3.45

10 W = 3,3 × 10−8 N 3 × 108 a = 3,3 × 10−8 N/100 kg = 3,3 × 10−10 m/s2 1 v = at = × 10−9 × t = 10 m/s 3 t = 3 × 1010 s, 1 Jahr hat 3,2 × 107 s .

F = A P = A S /c =

3.46 B umgibt v kreisförmig, und E ist radial. Daher bildet E × B eine Tangente an die Kugel, aus welcher keine Energie nach außen abfließt. 3.51

n = c/v = (2,998 × 108 m/s)/(1,245 × 108 m/s) = 2,41 .

3.56 Die thermische Bewegung der molekularen Dipole bewirkt eine deutliche Abnahme von Ke , beeinflusst n aber wenig. Bei optischen Frequenzen wird n vor allem von der Elektronenpolarisation bestimmt; die Rotation der molekularen Dipole ist nur bei sehr viel niedrigeren Frequenzen wirksam. 3.57

Aus Gl. (3.70) erhalten wir für eine einzelne Resonanzfrequenz   1/2 N qe2 1 n= 1+ . 0 me ω02 − ω 2

Weil für Stoffe mit geringer Dichte n ≈ 1 ist, wird der zweite Term  1, und wir müssen nur √ die ersten beiden Terme der binomischen Entwicklung von n mitnehmen. Damit ist 1 + x ≈ 1 + x/2 und n=1+

 1 N qe2 1 . 2 2 2  0 me ω 0 − ω

3.59 Die normale Anordnung der Farben bei einem Glasprisma ist R-O-Ge-Gr-B-V, wobei Rot (R) am wenigsten und Violett (V) am meisten abgelenkt wird. Ein Fuchsinprisma weist eine Absorptionsbande im grünen Bereich auf. Daher nehmen die Brechungsindizes für Gelb (Ge) und Blau (B) auf beiden Seiten von Grün Extremwerte an; genauer gesagt ist nGe ein Maximum, nB ein Minimum, und nGe > nO > nR > nV > nB . Die Anordnung des Spektrums ist demnach (in Richtung steigender Ablenkung) B-V-schwarze Bande-R-O-Ge. n(ω)

R OGeGr B V

ω

3.61 Liegt ω im sichtbaren Bereich, so ist (ω02 − ω 2 ) kleiner für Bleiglas und größer für Quarzglas. Darum ist n(ω) dann größer für Bleiglas und kleiner für Quarzglas. 3.63

Mit zunehmender Wellenlänge λ nähert sich n dem Wert C1 .

3.64 Die horizontalen Werte von n(ω), die jeweils im Gebiet zwischen zwei Absorptionsbanden genähert werden, nehmen mit fallendem ω zu.

Lösungen ausgewählter Aufgaben

1295

Kapitel 4 V E0i V K V E0i =K ; muss daher dimensionslos sein, und die Einheit von K r r r −2 ist folglich (Länge) . Die einzige nicht berücksichtigte Größe ist λ. Wir schließen deshalb, dass K = λ2 ist und Ii /Is ∝ K 2 ∝ λ−4 . 4.1

E0s ∝

4.4 x0 (−ω 2 + ω02 + iγω) = (qe E0 /me )eiα = (qe E0 /me )(cos α + i sin α), und x0 folgt unmittelbar nach Quadrieren beider Seiten gemäß x20 [(ω02 − ω 2 )2 + γ 2 ω 2 ] = (qe E0 /me )2 × (cos2 α + sin2 α). Zur Berechnung von α dividieren wir die Imaginärteile beider Seiten der erstgenannten Gleichung, nämlich x0 γω = (qe E0 /me ) sin α, durch die Realteile, x0 (ω02 − ω 2 ) = (qe E0 /me ) cos α, und erhalten α = tan−1 [γω/(ω02 − ω 2 )]. Das heißt, α läuft kontinuierlich von null über π/2 bis π. 4.5 Der Phasenwinkel wird verzögert um den Betrag (n Δy 2π/λ) − Δy 2π/λ oder (n − 1)Δy ω/c. Es gilt demnach Ep = E0 exp iω[t − (n − 1)Δy/c − y/c] oder Ep = E0 exp[−iω(n − 1)Δy/c] exp iω(t − y/c) für n ≈ 1 oder Δy  1. Weil für kleine x gilt ex ≈ 1 + x, ist exp[−iω(n − 1)Δy/c] ≈ 1 − iω(n − 1)Δy/c und wegen exp(−iπ/2) = −i ist Ep = Eu + 4.11

ω(n − 1)Δy Eu e−iπ/2 . c

ni sin θi = nt sin θt sin 30◦ = 1,52 sin θt θt = sin−1 (1/3,04) θt = 19◦ 13 .

nt c/vt vi νλi λi = = = = ; ni c/vi vt νλt λt es ist also λt = 3λi /4 = 9 cm. 4.17

nti =

sin θi = nti sin θt  −1 3 (0,707) = θt = 32◦ . sin 4

Lösungen ausgewählter Aufgaben

1296 4.21

(Grad)

(Grad)

0

4.30 Die Anzahl der Wellen pro Längeneinheit der Grenzfläche entlang AC ist gleich (BC/λi )/(BC sin θi ) = (AD/λt )(AD/ sin θt ). Durch Multiplikation beider Seiten mit c/ν folgt daraus das snelliussche Gesetz. 4.32 Es sei τ die Zeit, die die Welle benötigt, um sich entlang eines Strahls von b1 nach b2 , von a1 nach a2 und von a1 nach a3 fortzupflanzen. Also ist a1 a2 = b1 b2 = vi t und a1 a3 = vt t. sin θi = b1 b2 /a1 b2 = vi /a1 b2 sin θt = a1 a3 /a1 b2 = vt /a1 b2 sin θr = a1 a2 /a1 b2 = vi /a1 b2 vi nt sin θi = = = nti und θi = θr . sin θt vt ni 4.33

ni sin θi = nt sin θt ˆi × u ˆt × u ˆn ) = nt (k ˆn ) ni (k

ˆi und k ˆt als Einheitsvektoren der mit k Fortpflanzung. Damit ist ˆt × u ˆi × u ˆn ) − ni (k ˆn ) = 0 nt (k

Γ

ˆi ni k θi −θt ˆ θt k t θi

ˆt nt k

ˆn u

ˆ k

i ˆ t − ni k ˆi ) × u ˆn = 0 . (nt k ˆ t − ni k ˆi = Γ = Γˆ Nun sei nt k un . Γ, oft als astigmatische Konstante bezeichnet, ist gleich der ˆt und ni k ˆi auf u ˆn ; wir bilden also das Skalarprodukt Γ · u ˆn : Differenz der Projektionen von nt k

Γ = nt cos θt − ni cos θi . ˆix = k ˆrx und k ˆiy = −k ˆry , und wegen 4.34 Wegen θi = θr ist k ˆ ˆ ˆ ˆ ˆ ˆn )ˆ ˆn )ˆ (ki · u un = kiy ist ki − kr = 2(ki · u un .

ˆi k

ˆr k y x

ˆn u

ˆt k

Lösungen ausgewählter Aufgaben

1297

G re

nz

fla¨ c

he

4.35 Weil SB  > SB und B  P > BP ist, tritt der kürzeste Weg auf, wenn B  mit B in der Einfallsebene zusammenfällt.

n1 sin θi = n2 sin θt , n2 sin θi = n1 sin θt

4.38

θt = θi

n1 sin θi = n1 sin θt und θi = θt d cos θt = AB a sin(θi − θt ) = AB a sin(θi − θt ) = cos θt d d sin(θi − θt ) = a. cos θt 4.40 Der Strahl verläuft nicht geradlinig von Punkt S nach Punkt P , sondern tritt unter einem spitzeren Winkel in die Platte ein. Dadurch wird zwar der in Luft zurückgelegte Weg etwas länger, der damit verbundene Zeitverlust wird jedoch mehr als ausgeglichen, weil der Weg in der Glasplatte gleichzeitig kürzer wird. Aus diesem Grund können wir erwarten, dass die Verschiebung a mit n21 zunimmt: Mit wachsendem n21 für ein gegebenes θi nimmt θt ab, (θi −θt ) nimmt zu, und a nimmt natürlich ebenfalls zu, wie aus dem Ergebnis von Aufgabe 4.30 zu entnehmen ist. 4.38

Aus Gl. (4.42) folgt r || =

1,52 cos 30◦ − cos 19◦ 13 , cos 19◦ 13 + 1,52 cos 30◦

wobei wir θt = 19◦ 13 aus Aufgabe 4.11 übernommen haben. Analog ist 2 cos 30◦ t || = ◦ cos 19 13 + 1,52 cos 30◦ 1,32 − 0,944 r || = = 0,165 0,944 + 1,32 1,732 = 0,766 . t || = 0,944 + 1,32

Lösungen ausgewählter Aufgaben

1298

4.43 Wir dividieren in Gl. (4.34) Zähler und Nenner durch ni und ersetzen nti durch sin θi / sin θt . Es ergibt sich r⊥ =

sin θt cos θi − sin θi cos θt . sin θt cos θi + sin θi cos θt

Dieser Ausdruck ist äquivalent zu Gl. (4.42); analog folgt Gl. (4.44). Um zu r || zu gelangen, gehen wir von Gl. (4.40) aus und erhalten, derselben Prozedur folgend, r || =

sin θi cos θi − cos θt sin θt . cos θt sin θt + sin θi cos θi

Es gibt nun verschiedene Möglichkeiten fortzufahren. Zum Beispiel können wir r || wie folgt umschreiben r || =

(sin θi cos θt − sin θt cos θi )(cos θi cos θt − sin θi sin θt ) (sin θi cos θt + sin θt cos θi )(cos θi cos θt + sin θi sin θt )

und erhalten r || =

tan(θi − θt ) sin(θi − θt ) cos(θi + θt ) = . sin(θi + θt ) cos(θi − θt ) tan(θi + θt )

In ähnlicher Weise gelangen wir auch zu t || , das im Übrigen den gleichen Nenner hat. 4.63 [E0r ]⊥ + [E0i ]⊥ = [E0t ]⊥ ; das tangentiale Feld im Einfallsmedium ist gleich dem tangentialen Feld im transmittierenden Medium, also   E0t E0r − = 1 und t⊥ − r⊥ = 1 . E0i ⊥ E0i ⊥ Alternativ folgt aus den Gln. (4.42) und (4.44) sin(θi − θt ) + 2 sin θt cos θi = 1? sin(θi + θt ) sin θi cos θt − cos θi sin θt + 2 sin θt cos θi = 1. sin θi cos θt + cos θi sin θt 4.66

θi + θt = 90◦ für θi = θp

ni sin θp = nt sin θt = nt cos θp nt tan θp = = 1,52, und θp = 56◦ 40 . ni (siehe Gl. 8.29). nt n2 = 4.68 tan θp = ni n1 n1 1  tan θp = , tan θp = n2 tan θp cos θp sin θp = , also ist sin θp sin θp − cos θp cos θp = 0 cos θp sin θp cos(θp + θp ) = 0,

θp + θp = 90◦ .

Lösungen ausgewählter Aufgaben 4.69

1299

Aus Gl. (4.92) folgt

tan γr = r⊥ [E0i ]⊥ /r || [E0i ] || r⊥ = tan γi r || und aus den Gln. (4.42) und (4.43) folgt tan γr = −

cos(θi − θt ) tan γi . cos(θi + θt )

1.0

Reflexionsgrad

4.71

0.5

R⊥ 0.04 0.0

R

33.7◦ 41.8◦

90◦

θi

n cos θ  t t r2 . 4.72 T⊥ = ni cos θi ⊥ Aus Gl. (4.44) und dem snelliusschen Gesetz folgt dann T⊥ =

sin θ cos θ  4 sin2 θ cos2 θ  sin 2θ sin 2θ i t t i i t = . 2 2 sin θt cos θi sin (θi + θt ) sin (θi + θt )

Analoge Überlegungen gelten für T || . 4.74 Φi sei der einfallende Strahlungsfluss oder die Strahlungsleistung, T sei die Durchlässigkeit an der ersten Luft-Glas-Grenzfläche. Der durchgelassene Fluss beträgt dann T Φi . Aus Gl. (4.68) ist zu entnehmen, dass bei senkrechtem Einfall die Durchlässigkeit von Glas nach Luft auch T ist. Hinter dem ersten Dia ist der Fluss demnach T Φi T , hinter dem letzten Dia Φi T 2N . Wegen T = 1 − R ist Tt = (1 − R)2N (siehe Gl. 4.67). R = (0,5/2,5)2 = 4%, T = 96%, Tt = (0,96)6 ≈ 78,3%. I(y) 4.75 T = = e−ay , T1 = e−α , T = (T1 )y I0 Tt = (1 − R)2N (T1 )d . 4.76

Bei θi = 0 ist R = R || = R⊥ =

n − n 2 t i nt + ni

(siehe Gl. 4.67). Bei nti → 1 geht nt → ni und natürlich R → 0.

Lösungen ausgewählter Aufgaben

1300 Bei θi = 0 ist T = T || = T⊥ =

4nt ni (nt + ni )2

und bei nt → ni ist lim T =

nti →1

4n2i = 1. (2ni )2

Das snelliussche Gesetz besagt, dass für nt → ni gilt θt → θi ; damit und mit den Ergebnissen von Aufgabe 4.91 erhalten wir lim T || =

nti →1

sin2 2θi =1 sin2 2θi

und

lim T⊥ = 1 .

nti →1

Aus Gl. (4.43) und mit R || = r2|| und θt → θi ergibt sich lim R || = 0 .

nti →1

Analog folgt aus Gl.(4.42) lim R⊥ = 0 .

nti →1

4.78

Für θi > θc kann man Gl. (4.70) schreiben: r⊥ = ∗ r⊥ r⊥ =

cos θi − i(sin2 θi − n2ti )1/2 cos θi + i(sin2 θi − n2ti )1/2 cos2 θi + sin2 θi − n2ti = 1. cos2 θi + sin2 θi − n2ti

Analog ist r || r∗|| = 1. 4.86 Aus Gl. (4.73) ist ersichtlich, dass der Exponent die Form k(x − vt) haben muss, vorausgesetzt, wir ziehen kt sin θi /nti als Faktor heraus, wobei ωnti t/kt sin θi als zweiter Term verbleibt; dieser muss gleich vt t sein, und es ist demnach ωnt /(2π/λt )ni × sin θi = vt und folglich vt = c/ni sin θi = vi sin θi . 4.87 Laut Definitionsgleichung (Abschn. 4.7.1) ist β = kt [(sin2 θi /n2ti ) − 1]1/2 = 3,702 × 106 m−1 . Wegen yβ = 1 ist y = 2,7 × 10−7 m. 4.91 Der Strahl wird vom nassen Papier gestreut und zum größten Teil durchgelassen, bis der Grenzwinkel erreicht ist; von da an wird das Licht zurück zur Quelle reflektiert. Weil tan θc = (R/2)/d ist, wird nti = 1/ni = sin[tan−1 (R/2d)]. 4.92

1,000 29 sin 88,7◦ = n sin 90◦ (1,000 29)(0,999 74) = n; n = 1,000 03 .

Lösungen ausgewählter Aufgaben

1301

4.93 Durch geeignete Einstellung der Zwischenräume kann man die Anordnung zur Wellenmischung verwenden: Man erhält verschiedene Anteile der beiden einfallenden Wellen in den emittierten Strahlen. Siehe auch H. A. Daw und J. R. Izatt, J. Opt. Soc. Am. 55 (1965) 201.

4.94 Licht durchquert die Basis des Prismas als abklingende Welle, die sich entlang der einstellbaren Lücke ausbreitet. Unter bestimmten Voraussetzungen kann dabei Energie in die dielektrische Schicht abfließen. Die Schicht wirkt wie ein Wellenleiter mit charakteristischen Schwingungszuständen (Moden). Zu jeder Mode gehört eine bestimmte Geschwindigkeit und Polarisation. Die abklingende Welle geht in die Schicht über, wenn sie einer Mode entspricht. 4.95 Das Material der Wahl ist offensichtlich Silber (siehe Abb. 4.69). Beachten Sie, dass in unmittelbarer Umgebung von 300 nm gilt nI ≈ nR ≈ 0,6; in diesem Fall liefert Gl. (4.83) R ≈ 0,18. Oberhalb von 300 nm steigt nI rasch an, während nR stark abfällt, sodass im sichtbaren Bereich und etwas darüber hinaus gilt R ≈ 1. 2 sin θ2 cos θ1 4.99 t || = sin(θ1 + θ2 ) cos(θ1 − θ2 ) 2 sin θ1 cos θ2 t|| = sin(θ1 + θ2 ) cos(θ2 − θ1 ) sin 2θ1 sin 2θ2  t || t || = 2 sin (θ1 + θ2 ) cos2 (θ1 − θ2 ) = T || . (Siehe Gl. 4.98.) Analog ist t⊥ t⊥ = T⊥ ; 2  2  tan(θ1 − θ2 ) − tan(θ2 − θ1 ) 2 r || = = tan(θ1 + θ2 ) tan(θ1 + θ2 ) 2  tan(θ2 − θ1 ) r|| = = r2|| = R || . tan(θ1 + θ2 ) E0 tr 3 t E0 tr 4 E0 tr 3 E0 tr 2 t

Lösungen ausgewählter Aufgaben

1302 4.79

Aus Gl. (4.45) folgt (2 sin θp cos θp )(2 sin θp cos θp ) t|| (θp )t || (θp ) = sin2 (θp + θp ) cos2 (θp − θp ) =

sin 2θp sin 2θp cos2 (θp − θp )

wegen θp + θp = 90◦

=

sin2 2θp cos2 (θp − θp )

wegen

=

sin 2θp = sin 2θp

sin2 2θp = 1. ◦ p − 90 )

cos2 (2θ

Kapitel 5 5.1 Alle optischen Weglängen von S nach P müssen gleich sein, deswegen gilt n1 + n2 = an1 + a n2 = konstant. Wir fällen das Lot von A auf die optische Achse, der Schnittpunkt ist B. BP = a + a − x; alles andere folgt aus dem Satz des Pythagoras. 5.2 Wegen n1 +  n2 = konstant ist o + 3 /2 = konstant und 5 + 6 × 3/2 = 14. So ist 2o + 3 = 28 für  = 6,  = 5,3,  = 7 und  = 4,66. Beachten Sie, dass sich die Kreisbögen mit den Mittelpunkten S und P schneiden müssen, damit sich physikalisch sinnvolle Werte von  und  ergeben.

7 6 S

P 4.66 5.33

5.4 Aus Abbildung 5.4 geht hervor, dass eine ebene Welle, die auf eine konkave, elliptische Oberfläche trifft, zur Kugelwelle wird. Hat die zweite sphärische Oberfläche die gleiche Krümmung, so fallen sämtliche Strahlen senkrecht zu dieser Fläche ein und werden folglich nicht verändert.

Lösungen ausgewählter Aufgaben 5.8

Erste Fläche: n1 n2 n 2 − n1 +  = a a R



1303

1 1,5 0,5 +  = 1,2 a 0,1

a = 0,36 m (das reelle Bild befindet sich 0,36 m rechts vom ersten Scheitelpunkt). Zweite Fläche: a = 0,20 − 0,36 = −0,16 m (Abstand des virtuellen Objekts.) 1,5 1 −0,5 + , = −0,16 a −0,1

a = 0,069 .

Das endgültige Bild ist reell (a > 0), umgekehrt (MT < 0) und befindet sich 6,9 cm rechts vom zweiten Scheitelpunkt. 5.13 Gemäß Gl. (5.8) ist 1/8+1,5/a = 0,5/−20 . An der ersten Fläche ist a = −10 cm. Das virtuelle Bild entsteht 10 cm links vom ersten Scheitelpunkt. An der zweiten Fläche entsteht ein reelles Bild 15 cm vom zweiten Scheitelpunkt, 1,5/15 + 1/a = −0,5/10 , a = −20/3 = −6,66 cm. Das virtuelle Bild befindet sich links vom zweiten Scheitelpunkt. 5.15

Zur Minimierung von a + a ist a + a = aa /f und d aa  a a da d da (a + a ) = 0 = 1 + oder = + = 0. da da da f f f da

Daher ist da /da = −1 und da /da = −a /a, also a = a. Der Abstand würde maximal, wenn eine der beiden Größen ∞ wäre; beide Größen gleichzeitig können aber nicht unendlich sein. Deshalb ist a = a die Bedingung für ein Minimum. Aus der gaußschen Gleichung folgt dann a = a = 2f . 5.16 1/5 + 1/a = 1/10, a = −10 cm, virtuell. MT = −a /a = 10/5 = 2, aufrecht. Das Bild ist 4 cm hoch. Oder: −5(x ) = 100, x = −20, MT = −x /f = 20/10 = 2. 5.17

1/a + 1/a = 1/f . a

2f f 0

a f

2f

3f

5.20 a < 0, denn das Bild ist virtuell. 1/100−1/50 = 1/f , f = −100 cm. Das Bild befindet sich auch rechts im Abstand von 50 cm. MT = −a /a = 50/100 = 0,5. Das Bild der Ameise ist halb so groß wie das Original und aufrecht (MT > 0).

Lösungen ausgewählter Aufgaben

1304 5.23

1/f = (nl − 1)[(1/R1 ) − (1/R2 )] = 0,5[(1/∞) − (1/10)] = −0,5/10 f = −20 cm,

D = 1/f = −1/0,2 = −5 dpt.

5.31 (a) Aus der gaußschen Linsengleichung folgt 1/15,0 m + 1/a = 1/3,00 m und a = +3,75 m. (b) Die Berechnung der Vergrößerung liefert MT = −a /a = −3,75 m/15,0 m = −0,25 . Da der Bildabstand positiv ist, ist das Bild reell. Da die Vergrößerung negativ ist, erscheint das Bild umgekehrt, und da der Betrag der Vergrößerung kleiner als eins ist, erscheint das Bild verkleinert. (c) Aus der Definition der Vergrößerung folgt y  = MT y = (−0,25)(2,25 m) = −0,563 m. Das Minuszeichen gibt an, dass das Bild umgekehrt erscheint. (d) Wieder folgt aus der gaußschen Linsengleichung 1/17,5 m + 1/a = 1/3,00 m und a = 3,62 m. Das Bild des Pferdes ist insgesamt nur 0,13 m lang. 5.38 Zunächst berechnen wir mithilfe der Linsenschleiferformel die Brennweite in Wasser: fw /fa = fw /(10 cm) = (ng − 1)/[(ng + nw ) − 1] = 0,56/0,17 = 3,24; fw = 32 cm. Aus der gaußschen Linsengleichung folgt der Bildabstand: 1/a + 1/100 cm = 1/32,4 cm; a = 48 cm. 5.39 Ein reelles Bild ist in diesem Fall umgekehrt; die Anordnung muss daher auf den Kopf gestellt oder das Bild auf andere Weise gedreht werden. MT = −3 = −a /a; 1/a + 1/3a = 1/0,60 m; a = 0,80 m, und 0,80 m + 3 × (0,80 m) = 3,20 m.

1 1 1  = (nlm − 1) 5.40 − f R1 R2 1 (nlm − 1) 1 1,5/1,33 − 1 1 0,125 1 = = = fw (nl − 1) fa 1,5 − 1 fa 0,5 fa fw = 4fa . 5.44 1/f = 1/f1 + 1/f2, 1/50 = 1/f1 − 1/50, f1 = 25 cm. Es seien R11 und R12 bzw. R21 und R22 die Radien der ersten bzw. zweiten Linse. Dann ist 1/f1 = (nl − 1)(1/R11 − 1/R12 ),

1/25 = 0,5 × (2/R11 )

R11 = −R12 = −R21 = 25 cm 1/f2 = (nl − 1)(1/R21 − 1/R22 ) −1/50 = 0,55 × [1/(−25) − 1/R22 ] R22 = −275 cm . 5.45

MT1 = −a1 /a1 = −f1 /(a1 − f1 ) MT2 = −a2 /a2 = −a2 /(d − a1 ) MT = f1 a2 /(a1 − f1 )(d − a1 ) .

Wir substituieren a1 anhand von Gl. (5.30) und erhalten MT =

f1 a2 . (a1 − f1 )d − a1 f1

Lösungen ausgewählter Aufgaben

1305

5.47 Erste Linse: 1/a1 = 1/30 − 1/30 = 0, a1 = ∞. Zweite Linse: 1/a2 = 1/(−20) − 1/(−∞). Das Objekt für die zweite Linse befindet sich auf der rechten Seite im Unendlichen, also ist a2 = −∞, a2 = −20 cm, das Bild ist virtuell und 10 cm links von der ersten Linse. MT = (−∞/30)(+20/ − ∞) =

2 3

oder mithilfe von Gl. (5.34) MT =

2 30 × (−20) = . 10 × (30 − 30) − 30 × 30 3

5.51

fo fe

3 = 14◦ ein. Um 12 das Bild der Blende zu finden, das in L1 erscheint, verwenden wir Gl. (5.23): xx = f 2 , −6x = 81, x = −13,5 cm; das Bild liegt 4,5 cm hinter L1 . Die Vergrößerung ist −x /f = 13,5/9 = 1,5, und daher beträgt der Radius des Loches im Bild 0,5 × 1,5 = 0,75 cm. Der Winkel, der in

0,75  S mit der optischen Achse eingeschlossen wird, ist demnach gleich tan−1 = 2,6◦ . 16,5 Das Bild von L2 in L1 ergibt sich aus −4x = 81, x = −20, 2 cm, es befindet sich also 11, 2 cm rechts von L1 . MT = 20,2/9 = 2,2; folglich wird der Rand von L2 4,4 cm über der Achse abgebildet, und der bei S eingeschlossene Winkel ist tan−1 4,4/(12 + 11,2) oder 9,8◦ . Die Blende ist demzufolge die Aperturblende, und die Eintrittspupille (ihr Bild in L1 ) hat einen Durchmesser von 1,5 cm bei 4,5 cm hinter L1 . Das Bild der Blende in L2 ist die 1 1 6 Austrittspupille. Also ist + 1/a = , und a = −6, also 6 cm vor L2 . MT = = 3, der 2 3 2 Durchmesser der Austrittspupille ist 3 cm. 5.55

L1 schließt in S mit der optischen Achse einen Winkel von tan−1

9 5 4.5

L1

L2 S

3



2

14

9 12

3 3

3

Lösungen ausgewählter Aufgaben

1306

5.57 Entweder der Rand von L1 oder der Rand von L2 ist die Aperturblende. Da sich links von L1 keine Linse befindet, entspricht entweder der Rand von L1 oder P1 der Eintrittspupille. Hinten (links von Punkt A) schließt L1 den kleinsten Winkel ein und ist die Eintrittspupille, weiter vorne (rechts von A) legt P1 den Rand der Eintrittspupille fest. Im ersteren Fall ist P2 die Austrittspupille, im letzteren Fall ist der Rand von L2 selbst die Austrittspupille (da rechts von L2 keine Linse mehr liegt). (Bild des Randes von L2 erzeugt von L1 )

P2

P1

(Bild des Randes von L1 erzeugt von L2 )

F1

A

F1

F2

F2 Σ2

L1

L2 P2

5.58 Die Aperturblende ist entweder der Rand von Σ1 L1 oder von L2 . Daher wird die Eintrittspupille entweder von P1 oder von P2 festgelegt. Jenseits von Fo1 P1 schließt P1 den kleineren Winkel ein; daher bestimmt Σ1 die Aperturblende. Das F1 F2 Bild der Aperturblende, das in den O Linsen rechts von ihr erscheint, legt P3 als Austrittspupille fest. L1

Σ3

P3

L2

5.60 Wir zeichnen den Hauptstrahl von der Spitze zu L1 , dessen Verlängerung durch die Mitte der Eintrittspupille verläuft. Von dort aus läuft er durch den Mittelpunkt der Aperturblende und wird durch L2 so abgelenkt, dass er anschließend durch die Mitte der Austrittspupille verläuft. Ein Randstrahl läuft von S durch den Rand der Eintrittspupille, knickt in L1 so ab, dass er die Kante der Aperturblende knapp verfehlt, und wird in L2 so abgelenkt, dass er an der Kante der Austrittspupille vorbeiläuft.

S Bild L2 AperturL1 blende Austrittspupille

Eintrittspupille

Lösungen ausgewählter Aufgaben

1307

5.61

S

5.62

Nein – sie beobachtet den Betrachter des Gemäldes.

5.63 Der Spiegel ist parallel zur Ebene des Gemäldes; das Bild des Mädchens sollte deshalb unmittelbar hinter ihr entstehen und nicht nach rechts verschoben. 5.64 1/a + 1/a = −2/R. Für R → ∞ ist 1/a + 1/a = 0, a = −a und MT = +1. Das Bild ist virtuell, von unveränderter Größe und aufrecht. 5.71 Nach Gl. (5.49) ist 1/100 + 1/a = −2/80 und demnach a = −28,5 cm. Das Bild ist virtuell (a < 0), aufrecht (MT > 0) und verkleinert. Vergleichen Sie mit Tabelle 5.5. 5.74 Das Bild auf dem Schirm muss reell sein. Folglich ist a positiv und 1/25 + 1/100 = −2/R, 5/100 = −2/R, R = −40 cm . 5.75 Das Bild ist aufrecht und verkleinert; es handelt sich daher (siehe Tabelle 5.5) um einen konvexen Kugelspiegel. 5.80 Der Spiegel muss konkav sein, damit ein vergrößertes und aufrechtes Bild entsteht; dieses ist außerdem virtuell. MT = 2,0 = a /(0,015 m), a = −0,03 m, und demzufolge 1/f = 1/(0,015 m) + 1/(−0,03 m); f = 0,03 m und f = −R/2; R = −0,06 m. 5.81 MT = y  /y = −a /a; wir verwenden Gl. (5.50); a = f a/(a − f ), und wegen f = −R/2 ist MT = −f /(a − f ) = −(−R/2)/(a + R/2) = R/(2a + R). 5.84 MT = −a /25 cm = −0,064; a = 1,6 cm; 1/25 cm + 1/1,6 cm = −2/R, R = −3,0 cm. 5.89

f = −R/2 = 30 cm, 1/20 + 1/a = 1/30, 1/a = 1/30 − 1/20.

a = −60 cm, MT = −a /a = 60/20 = 3. Das Bild ist virtuell (a < 0), aufrecht (MT > 0), rund 30 cm hoch und liegt 60 cm hinter dem Spiegel.

5.92

Das Bild wird um 180◦ gedreht.

Lösungen ausgewählter Aufgaben

1308

5.93 Laut Gl. (5.61) ist die numerische Apertur gleich (2,624 − 2,310)1/2 = 0,550, und θmax = sin−1 0,550 = 33◦ 22 . Der maximale Eintrittswinkel ist 2θmax = 66◦ 44 . Ein Strahl, der unter einem Winkel von 45◦ einfällt, verlässt die Faser rasch wieder – schon nach der ersten Reflexion verbleibt nur ein geringer Teil der Energie im Leiter. 5.95

Nach Gl. (5.62) ist log 0,5 = −0,3 = −αL/10 und damit L = 15 km.

5.98

Entsprechend Gl. (5.61) ist die numerische Apertur gleich 0,232 und Nm = 9,2 × 102 .

5.101 MT = −f /x = −1/xD. Für das menschliche Auge ist D ≈ 58,6 dpt. x = 230 000 × 1,61 = 371 × 103 km MT = −1/3,71 × 106 (58,6) = 4,6 × 10−11 y  = 2160 × 1,61 × 103 × 4,6 × 10−11 = 0,16 mm. 5.103 1/20 + 1/ao = 1/4, a0 = 5 m.

1/0,3 + 1/ae = 1/0,6,

ae = −0,6 m.

MT o = −5/10 = −0,5 MT e = −(−0,6)/0,5 = 1,2 MT o MT e = −0,6. 5.107 Strahl 1 in der Abbildung geht an der Augenlinse vorbei; am korrespondierenden Bildpunkt kommt deshalb weniger Energie an. Darin besteht die Abschattung (Vignettierung). Augenabstand 2 HS

HS

1

Augenlinse

Objektiv

Austrittspupille

HS = Hauptstrahl

5.108 Die Strahlen, die in der Situation der vorangegangenen Aufgabe an der Augenlinse vorbeiliefen, werden nun von die Feldlinse umgeleitet und gelangen durch die Augenlinse. Die Feldlinse lenkt die Hauptstrahlen geringfügig ab, sodass sie die optische Achse etwas näher an der Augenlinse schneiden. Die Austrittspupille wird dadurch verschoben und der Augenabstand verkürzt. (Mehr zu diesem Thema finden Sie in Modern Optical Engineering von Smith.) Augenabstand HS

HS Objektiv HS = Hauptstrahl Feldlinse

Augenlinse Austrittspupille

Lösungen ausgewählter Aufgaben

1309

3,2 dpt Dc = = 3,03 dpt 1 + Dc d 1 + (3,2 dpt)(0,017 m) (also rund 3,0D). f1 = 0,330 m, der Fernpunkt liegt demnach (0,330 m − 0,017 m) = 0,313 m hinter der Augenlinse. Für die Kontaktlinse ist fc = 1/3,2 = 0,313 m. Der Fernpunkt ist für beide Linsen identisch, wie man auch erwarten sollte. 5.117 Dl = −

5.119 (a) Den Abstand zum Zwischenbild erhält man durch Anwendung der Linsenformel auf das Objektiv: 1 1 1 + , = 27 mm a 25 mm also ist a = 3,38 × 102 mm. Zu diesem Abstand zwischen Objektiv und Zwischenbild ist nun die Brennweite des Okulars zu addieren, um den Linsenabstand zu erhalten: 3,38 × 102 mm + 25 mm = 3,6 × 102 mm. (b) MT o = −a /a = −3,38 × 102 mm/27 mm = −12,5×. Die Transversalvergrößerung des Okulars beträgt dD = (254 mm)(1/25 mm) = 10,2×. Die Gesamtvergrößerung ist dann (−12,5)× (10,2) = −1,3 × 102; das Minuszeichen bedeutet, dass das Bild umgekehrt ist.

Kapitel 6 6.2

Entsprechend Gl. (6.8) ist 1 1 1 d 2 2 =  +  −   =  − , f f f ff f 3f 3f  . f = 4 Nach Gl. (6.9) ist

Feldblende

2f  1 3f  f × ×  = . H11 H1 = 4 3 f 2

2f  3

f 4

Nach Gl. (6.10) ist H22 H2 = −

H1

H2

f 3f  4

f 2

2

2f  1 3f  f × ×  =− . 4 3 f 2

6.3 Nach Gl. (6.2) ist 1/f = 0 für −(1/R1 − 1/R2 ) = (nl − 1)d/nl R1 R2 . Also ist d = nl (R1 − R2 )/(nl − 1). 6.5

1/f = 0,5 × (1/6 − 1/10 + 0,5 × 3/1,5 × 6 × 10) = 0,5 × (10/60 − 6/60 + 1/60); f = 24 . h1 = −24 × 0,5 × 3/(10 × 1,5) = −2,4 . h2 = −24 × 0,5 × 3/(6 × 1,5) = −4 .

6.7

f = 0,5nR/(n − 1); h1 = +R, h2 = −R .

6.11 f = 29,6 + 0,4 = 30 cm; a = 49,8 + 0,2 = 50 cm; 1/50 + 1/a = 1/30 cm. a = 75 cm (von H2 aus) und 74,6 cm (von der Rückseite aus).

Lösungen ausgewählter Aufgaben

1310 6.13

Aus Gl. (6.2) folgt  1 1 (1/4,0) − (1/ − 15) + (4,0)/(1,5 × 4,0 × (−15)) = 0,147 1/f = 2 2 f = 6,8 cm . h1 = −(6,8 × 0,5 × 4,0)/(−15 × 1,5) = 0,60 cm h2 = −2,3 .

Lokalisierung des Bildes: 1/100,6 + 1/a = 1/6,8; a = 7,3 cm oder 5 cm bezüglich der Rückseite der Linse. 6.22

h1 = ni1 (1 − a11 )/ − a12 = (D2 d21 /nt1 )f

= −(nt1 − 1)d21 f /R2 nt1 aus Gl. (5.64) mit nt1 = nl ; h2 = nt2 (a22 − 1)/ − a12 = −(D1 d21 /nt1 )f (aus Gl. 5.70) = −(ni1 − 1)d21 f /R1 nt1 . 6.23

A = R2 T21 R1 , für die ebene Fläche ist jedoch   1 −D2 R2 = 0 1

und D2 = (nt1 − 1)/(−R2 ), aber R2 = ∞;   10 R2 = ; 01 dies ist die Einheitsmatrix, also gilt A = T21 R1 . 6.24

D1 = (1,5 − 1)/0,5 = 1 (1,5 − 1)/ − (−0,25) = 2 D2 =    1 − 2 × 0,3/1,5 −1 + 2 × 1 × 0,3/(1,5 − 2) 0,6 A= = 0,3/1,5 −1 × 0,3/1,5 + 1 0,2

−2,6



0,8

|A| = 0,6 × 0,8 − 0,2 × (−2,6) = 0,48 + 0,52 = 1 . 6.30 Siehe E. Slayter, Optical Methods in Biology. P C/CA = (n1 /n2 )R/R = n1 /n2 und CA/P  C = n1 /n2 . Die Dreiecke ACP und ACP  sind deshalb ähnlich. Wir verwenden den Sinussatz sin ∠P AC sin ∠AP C = PC CA

oder n2 sin ∠P AC = n1 sin ∠AP C .

Nun ist aber θi = ∠P AC und deswegen θt = ∠AP C = ∠P  AC, und der gebrochene Strahl kommt scheinbar von P  .

Lösungen ausgewählter Aufgaben 6.31

1311

Laut Gleichung (5.6) setzen wir cos ϕ = 1 − ϕ2 /2; dann ist  = [R2 + (a + R)2 − 2R(a + R) + R(a + R)ϕ2 ]1/2 −1 = [a2 + R(a + R)ϕ2 ]−1/2 −1 = [a2 − R(a − R)ϕ2 ]−1/2 ,

wenn die ersten beiden Glieder der binomischen Reihe mitgenommen werden. −1 ≈ a−1 − (a + R)h2 /2a3 R mit ϕ ≈ h/R −1 ≈ a−1 + (a − R)h2 /2a3 R . Setzen wir dies in Gl. (5.5) ein, so erhalten wir Gl. (6.40). 6.32

Kapitel 7 7.1

E02 = 36 + 64 + 2 × 6 × 8 cos E = 10 sin(120πt + 0,93) .

π 8 = 100, E0 = 10; tan α = , α = 53,1◦ = 0,93 rad . 2 6

1m = 0,2 × 107 = 2 000 000 Wellen. 500 nm 0,05 × 1,5 0,05 = = 1,5 × 105 , Im Glas ist λ0 /n 500 nm 0,95 in Luft ist = 0,19 × 107 . λ0 Insgesamt sind es 2 050 000 Wellen.

7.5

Optische Weglängendifferenz = (1,5 × 0,05 + 1 × 0,95) − 1 × 1 Optische Weglängendifferenz = 1,025 − 1,000 = 0,025 m 0,025 Λ = 5 × 104 Wellen. = λ0 500 nm E = E1 + E2 = E01 {sin[ωt − k(x + Δx)] + sin(ωt − kx)} . 1 1 Wegen sin β + sin γ = 2 sin (β + γ) cos (β − γ) ist 2 2

Δx  kΔx sin ωt − k x + . E = 2E01 cos 2 2 7.8

Lösungen ausgewählter Aufgaben

1312 7.9

E = E0 Re[ei(kx+ωt) − ei(kx−ωt) ] = E0 Re[eikx (eiωt − e−iωt )] = E0 Re[eikx 2i sin ωt]

= E0 Re[2i cos kx sin ωt − 2 sin kx sin ωt] und E = −2E0 sin kx sin ωt. Die zusammengesetzte Welle ist eine stehende Welle mit einem Knoten in x = 0. y ∂E ∂B =− 7.13 ∂x ∂t Die Integration liefert ˆ ∂E E dt B(x, t) = − ∂x ˆ = −2E0 k cos kx cos ωt dt 2E0 k cos kx sin ωt . ω Wegen E0 k/ω = E0 /c = B0 ist aber z

B

=−

x

B(x, t) = −2B0 cos kx sin ωt . E = E0 cos ωc t + E0 α cos ωm t cos ωc t E0 α [cos(ωc − ωm )t + cos(ωc + ωm )t] . = E0 cos ωc t + 2 Der Hörbereich erstreckt sich von νm = 20 Hz bis 20 × 103 Hz. Die maximale Modulationsfrequenz beträgt νm (max) = 20 × 103 Hz. 7.21

νc − νm (max) ≤ ν ≤ νc + νm (max) Δν = 2νm (max) = 40 × 103 Hz . v = ω/k = ak, vg = dω/dk = 2ak = 2v .   gλ g = 7.29 v= 2π k dv (laut Gl. 7.38) vg = v + k dk  dv 1 v g =− =− dk 2k k 2k v vg = . 2 dv dv dv dω dv und = = vg . 7.31 vg = v + k dk dk dω dk dω Wegen v = c/n ist dv dv dn c dn = =− 2 . dω dn dω n dω v c vg ck dn vg = v − 2 = = . 2 n dω 1 + (ck/n )(dn/dω) n + ω(dn/dω) 7.22

Lösungen ausgewählter Aufgaben

1313

N qe2   N q2 f =1− 2 e . ω  0 me 0 me Die binomische Entwicklung für x  1 liefert 1 (1 − x) ≈ 1 − x 2 N q2 dn N qe2 = 3 e , n = 1− 2 2ω 0 me dω ω  0 me c c c = vg = = 2 2 N q N q N q2 n + ω(dn/dω) 1− 2 e + 2 e 1+ 2 e

7.40

ω  ωi ,

n2 = 1 −

ω2

2ω 0 me

2ω 0 me

ω 0 me

und vg < c, v=

c c = . N q2 n 1 − 2ω2 0eme

Die binomische Entwicklung für x  1 liefert (1 − x)−1 ≈ 1 + x N qe2 v = c(1 + ); vvg = c2 . 2ω 2 0 me ˆ  ˆ λ ˆ λ λ 1 7.43 sin akx sin bkx dx = cos[(a − b)kx]k dx − cos[(a + b)kx]k dx 2k 0 0 0 λ λ 1 sin(a + b)kx  1 sin(a − b)kx  =  − 2k  2k a−b a+b 0 0 = 0 für a = b . Für a = b hingegen ist ˆ 0

λ

1 sin akx dx = 2k 2

ˆ

λ

(1 + cos 2akx)k dx = 0

λ . 2

Die anderen Integrale sind ähnlich. 7.44

Gerade Funktion; deshalb ist Bm = 0. ˆ 2 λ/a 2 λ λ 4 + = dx = A0 = λ −λ/a λ a a a λ/a ˆ λ/a  2 2 Am = sin mkx 1 × cos mkx dx = λ −λ/a mkλ −λ/a m2π 2 sin . mπ a ˆ 1 a sin kL/2  f (x) = E0 L cos kx dk π 0 kL/2 ˆ ˆ E0 L b sin(kL/2 − kx) E0 L b sin(kL/2 + kx) dk + dk = 2π 0 kL/2 2π 0 kL/2

Am = 7.50

Lösungen ausgewählter Aufgaben

1314 Es sei nun kL/2 = w, (L/2)dk = dw, kx = wx . E0 f (x) = π 

ˆ 0

b

sin(w + wx ) E0 dw + w π

ˆ 0

b

sin(w − wx ) dw w

mit b = aL/2. Wir setzen w + wx = t, dw/w = dt/t, 0 ≤ w ≤ b und 0 ≤ t ≤ (x + 1)b. Im anderen Integral setzen wir w − wx = −t, 0 ≤ w ≤ b und 0 ≤ t ≤ (x − 1)b. ˆ  ˆ  E0 (x −1)b sin t E0 (x +1)b sin t  dt − dt f (x) = π 0 t π 0 t E0 E0 f  (x) = Si[b(x + 1)] − Si[b(x − 1)], x = 2x/L . π π Si(u) π/2

π

u



−π/2

7.54

In Analogie zu Gl. (7.61) ist A(ω) =

Δt Δt E0 sinc(ωp − ω) . 2 2

Aus Tabellenwerken zu entnehmen ist sinc(π/2) = 63,7% – nicht ganz 50%, aber sinc



π  Δt  π  = 49,8% und (ωp − ω)  < 1,65 2 2

oder



π π < (ωp − ω) < . Δt Δt

Nennenswerte Werte von A(ω) ergeben sich daher, wenn Δω in der Umgebung von 2π/Δt liegt und ΔνΔt etwa 1 ist. Die Bestrahlungsstärke ist proportional zu A2 (ω), und [sinc(π/2)]2 = 40,6%. 7.55 und

Δlc = c Δtc , Δlc ≈ c/Δν. Es ist aber Δω/Δk0 = ω/k0 = c, also |Δν/Δλ0 | = ν/λ0

Δlc ≈

cλ0 Δλ0 ν

2

Δlc ≈

λ0 . Δλ0

Sie können auch die Unbestimmtheitsrelation anwenden: Δlc ≈

h Δp

mit p =

h λ

und Δλ0  λ0 .

Lösungen ausgewählter Aufgaben 7.57

7.58

1315

Δlc = c Δtc = 3 × 108 m/s × 10−8 s = 3 m λ2 Δλ0 ≈ 0 = (500 × 10−9 m)2 /3 m Δlc Δλ0 ≈ 8,3 × 10−14 m = 8,3 × 10−5 nm Δλ0 Δν = 8,3 × 10−5 /500 = 1,6 × 10−7 entspricht ungefähr einem Teil von 107 . = ν λ0 Δν = 54 × 103 Hz (54 × 103 )(10 600 × 10−9 m) Δν/ν = (3 × 108 m/s) = 1,91 × 10−9 Δlc = c Δtc ≈ c/Δν 3 × 108 m/s = 5,55 × 103 m . Δlc ≈ 54 × 103 Hz

7.60

Δlc = c Δtc = 3 × 108 × 10−10 = 3 × 10−2 m Δν ≈ 1/Δtc = 1010 Hz 2

Δλ0 ≈ λ0 /Δlc (siehe Aufgabe 7.35) = (632,8 nm)2 /3 × 10−2 m = 0,013 nm Δν = 1015 Hz, Δλ0 ≈

2 λ0 /Δlc

Δlc = c × 10−15 = 300 nm

= 1334,78 nm .

Kapitel 8 8.4 (a) E = ˆıE0 cos(kz − ωt) + ˆjE0 cos(kz − ωt + π). Gleiche Amplituden, Ey eilt Ex um π nach. P-Zustand, bei 135◦ oder −45◦ . (b) E = ˆıE0 cos(kz − ωt − π/2) +ˆjE0 cos(kz − ωt + π/2). Gleiche Amplituden, Ey eilt Ex um π nach. Der gleiche Zustand wie in (a). (c) Ex eilt Ey um π/4 voraus. Gleiche Amplituden. Welle ist elliptisch polarisiert mit einer Neigung von 45◦ und linksdrehend. (d) Ey eilt Ex um π/2 voraus. Gleiche Amplituden. Welle ist im R-Zustand. Ex = ˆı cos ωt, Ey = ˆj sin ωt . 8.5 Linksdrehende, zirkular polarisierte, stehende Welle.

y x

z

Lösungen ausgewählter Aufgaben

1316 8.6

ER = ˆıE0 cos(kz − ωt) + ˆjE0 sin(kz − ωt) EL = ˆıE0 cos(kz − ωt) − ˆjE0 sin(kz − ωt) E = ER + EL = ˆı(E0 + E0 ) cos(kz − ωt) + ˆj(E0 − E0 ) sin(kz − ωt) .

    und E0 −E0 = E0y . Dann ist E = ˆıE0x cos(kz−ωt)+ˆjE0y sin(kz− Wir setzen E0 +E0 = E0x ωt). Aus den Gln. (8.11) und (8.12) geht dann hervor, dass es sich um eine Ellipse mit ε = −π/2 und α = 0 handelt.

8.7

E0y = E0 cos 25◦ ; E0z = E0 sin 25◦ ˆ 0 cos(kx − ωt + π/2). E(x, t) = (0,91ˆj + 0,42k)E

8.9

ˆ cos(kx − ωt)]. E = E0 [ˆj sin(kx − ωt) − k

8.15 In natürlichem Licht lässt jedes einzelne Filter 32% des einfallenden Strahlenbündels durch. Die Hälfte der ankommenden Flussdichte befindet sich in einem P-Zustand parallel zur Auslöschungsachse; davon wird praktisch nichts durchgelassen. Folglich werden 64% des Lichts parallel zur Transmissionsachse durchgelassen. In unserer Aufgabe erreichen 32% von Ii das zweite Filter, und 64% von diesem Anteil, also 21% von Ii , verlassen das zweite Filter wieder. 8.30

Siehe die Abbildung im Anschluss. Es ist demnach 1 2 E2 E01 sin2 θ cos2 θ = 01 (1 − cos 2θ)(1 + cos 2θ) 2 8 

1 2 2 1 E01 E 01 2 (1 − cos 2θ) = 1− cos 4θ + = 8 8 2 2 2 I1 E01 (1 − cos 4θ) = (1 − cos 4θ) . = 16 8 θ = ωt .

I=

E01

E01 cos θ E01 cos θ θ 90−θ

E01 cos θ cos(90 − θ)

8.31 Nein. Der Kristall funktioniert so, als bestünde er aus zwei entgegengesetzt orientierten, hintereinander gelegten Teilstücken. Zwei gleich orientierte, hintereinander gelegte Stücke verhalten sich dagegen wie ein einzelner dicker Kristall und trennen den o- und den e-Strahl daher noch stärker. 8.33 Das am Papier gestreute Licht läuft durch die Polaroidfilter und wird linear polarisiert. Das E-Feld des Lichts, das vom oberen Filter kommt, ist parallel zum Hauptschnitt (d. h. zur

Lösungen ausgewählter Aufgaben

1317

Diagonale zwischen dem zweiten und vierten Quadranten); es handelt sich deshalb um einen e-Strahl. Beachten Sie, wie die Buchstaben P und T extraordinär (außerordentlich) nach unten abgelenkt werden. Das untere rechte Filter lässt einen o-Strahl durch, weshalb der Buchstabe C nicht abgelenkt wird. Wie Sie bemerken, liegt das ordinäre (ordentliche) Bild näher an der stumpfen Ecke. 8.34 Die Fälle (a) und (c) sind in Analogie zur vorangegangenen Aufgabe zu erklären. (b) zeigt eine Doppelbrechung, weil die Achse des Polaroidfilters um etwa 45◦ zum Hauptschnitt des Kristalls geneigt ist. Daher existiert sowohl ein e- als auch ein o-Strahl.

Sauerstoff

Sauerstoff

Kohlenstoff

Sauerstoff

8.35 Liegt E senkrecht zur CO3 -Ebene, so ist die Polarisation geringer, als wenn E parallel zu dieser Ebene liegt. Im ersteren Fall verkleinert das Feld jedes polarisierten Sauerstoffatoms die Polarisation seines Nachbaratoms. Mit anderen Worten: Das induzierte Feld zeigt nach unten, während E nach oben gerichtet ist. Liegt E in der CO3 -Ebene, so verstärken jeweils zwei Dipole den dritten. Eine geringere Polarisierbarkeit führt zu einer kleineren Dielektrizitätskonstante, einem kleineren Brechungsindex und einer höheren Geschwindigkeit, also v || > v⊥ . 8.36 Für Kalkspat ist no > ne . Zwei Spektren sieht man, wenn man (b) oder (c) in einem Spektrometer verwendet. Die Indizes werden auf gewohnte Art berechnet: n=

sin 12 (α + δm ) sin 12 α

δm ist der Winkel minimaler Ablenkung beider Strahlen. α

(a)

8.37

sin θc =

e o

e o

o, e (b)

nBalsam 1,55 = 0,935 ; θc ≈ 69◦ . = n0 1,658

(c)

Lösungen ausgewählter Aufgaben

1318 8.40

(a) Kalkspat

(b) Quarz

(c) Unerwünschte Energie, die sich in einem der P-Zustände befindet, kann man ohne Gefahr der lokalen Aufheizung beseitigen. (d) Das Rochon-Prisma lässt einen unabgelenkten und deshalb achromatischen Strahl durch, den o-Strahl. 8.52

no = 1,6584, ne = 1,4864.

Snelliussches Gesetz: sin θi = no sin θto = 0,766 sin θi = ne sin θte = 0,766 sin θto ≈ 0,463, sin θte ≈ 0,516,

θto = 27◦ 35 θte = 31◦ 4

Δθ ≈ 3◦ 29 . 8.54 Ex eilt Ey um π/2 voraus. Anfangs waren sie phasengleich, und Ex > Ey . Die Welle ist daher linksdrehend, elliptisch polarisiert und horizontal. 8.68 Der R-Zustand, der auf den Glasschirm fällt, beschleunigt die Elektronen auf Kreisbahnen. Die Elektronen strahlen deshalb zirkular polarisiertes Licht zurück, dessen E-Feld sich in der gleichen Richtung wie dasjenige des ankommenden Strahls dreht. Die Ausbreitungsrichtung wurde bei dieser Reflexion jedoch umgekehrt, weshalb das reflektierte Licht linksdrehend ist, obwohl sich das einfallende Licht in einem R-Zustand befindet. Das reflektierte Licht wird also vom Rechtszirkularpolarisator vollständig absorbiert (siehe Abbildung).

R

L

Lösungen ausgewählter Aufgaben

1319

2π d Δn , λ0 1 1 aber wegen der Streifenverschiebung ist Δϕ = (2π) = π und 4 2 2πd × 0,005 π = 2 589,3 × 10−9 589,3 × 10−9 d= = 2,94 × 10−5 m . 2 × 10−2

8.69

Δϕ =

8.70 Ja, wenn sich die Amplituden der P-Zustände unterscheiden. Erzeugung zum Beispiel mit einem – möglichst niedrigen – Glasplattensatz-Polarisator (durchgelassener Strahl). 8.72 Bringen Sie das photoelastische Material so zwischen zwei Zirkularpolarisatoren, dass beide Phasenverschieber ihm gegenüberliegen. Bei Beleuchtung mit zirkular polarisiertem Licht gibt es keine Vorzugsorientierung der Spannungsachsen, die Orientierungen sind sämtlich ununterscheidbar. Nur die Doppelbrechung wirkt sich aus, und die Isochromaten sind sichtbar. Unterscheiden sich die Polarisatoren (ist einer ein L-, der andere ein R-Polarisator), so erscheinen Bereiche hell, wo Δn zu Δϕ = π führt; sind die Polarisatoren gleich, erscheinen diese Bereiche dunkel. λ0 8.74 Vλ/2 = 3 = 550×10−9/2·(1,58)3 ×5,5×10−12 = 105 /2·(3,94) = 12,7×103 V . 2n0 r63  E1 ist E2 ist e 8.76 E1 · E∗2 = 0, E2 = 21 e22 ∗ × (e ) + (−2i)(e22 )∗ = 0 E1 · E∗2 = (1) 21  2 E2 = i

8.84



1 ⎣0 0 0

0 0 0 −1

8.86



⎤⎡ ⎤ ⎡ 0 0 1 0 0 0 0 0 ⎦⎣ 0 1 0 0 ⎦ ⎣ 0 −1 0 0 0 −1 = 1⎡ 0 0 0 1⎤ ⎡0 ⎤ ⎡ 1 0 0 0 1 ⎣ 0 1 0 0 ⎦⎣ 0 ⎦ = ⎣ 0 0 −1 0 0 0 0 0 −1 ⎡ ⎤⎡ 1 ⎤ ⎡ 1 0 0 0 1 ⎣ 0 1 0 0 ⎦⎣ 0 ⎦ = ⎣ 0 0 −1 0 0 0 0 ⎤0 ⎡ −1 −1 ⎤ ⎡ 1 0 0 0 0 0 0 1 0 0 ⎦⎣ 0 1 0 0 ⎦ ⎣ 0 0 1 0 0 0 1 = 0 −1 0 0 0 −1 0

1 ⎣0 0 0



1 0 ⎣ 0 0

0 1 0 0

0 0 1 0

⎤⎡ 0 1 ⎦⎣ 0 0

1 0 0 0

0 0 0 1

0 0 1 0

⎤ ⎡ 0 1 −1 ⎦ ⎣ 0 = 0 0 0 0

0 1 0 0

0 0 1 0

⎤ 0 0⎦ 0 1

1 0 0 0 1 0 0 0 −1 0 0⎤ 0 1 0 ⎦ 0 −1⎤ 1 0⎦ 0 1 1 0 0 0 1 0 0 0 −1 0 0 0

⎤ 0 0 ⎦ 0 −1

⎤ 0 0 ⎦ 0 −1

Lösungen ausgewählter Aufgaben

1320 ⎡ 8.87

1 ⎣0 0 0

0 1 0 0

⎤ ⎤ ⎡ 1 0 1 0 0 1 0 ⎦ ⎣0 0 0 0⎦ −1 2 1 0 1 0 0 0 0 0 0 ⎡ ⎤⎡ ⎤ 1 0 1 0 1 1 ⎣ 0 0 0 0 ⎦⎣ 0 ⎦ 0 2 0 0 0 0 1 0 1 0 0 ⎡ ⎤⎡ ⎤ 1 0 1 0 1 1 ⎣ 0 0 0 0 ⎦⎣ 0 ⎦ 0 2 0 0 0 0 1 0 1 0 1 ⎡ ⎤⎡ ⎤ 1 0 0 1 1 1 ⎣ 0 0 0 0 ⎦⎣ 0 ⎦ 0 2 0 0 0 0 1 0 0 1 1 ⎡ ⎤⎡ ⎤ 1 0 1 0 1 1 ⎣ 0 0 0 0 ⎦⎣ 0 ⎦ 0 2 0 0 0 0 1 0 1 0 1 ⎡ ⎤⎡ ⎤ 1 0 0 1 1 1 ⎣ 0 0 0 0 ⎦⎣ 0 ⎦ 0 2 0 0 0 0 1 0 0 1 −1

0 0 0 1

⎡ 1 0 1 1⎣0 0 0 = 2 0 0 0 1 0 1 ⎡ ⎤ 1 1⎣0⎦ = 2 0 1 ⎡ ⎤ 1 1 0 = ⎣0⎦ 2 1 ⎡ ⎤ 1 1 0 = ⎣0⎦ 2 1 ⎡ ⎤ 1 1⎣0⎦ = 2 0 1 ⎡ ⎤ 0 0 ⎣ = 0⎦ 0

⎤ 0 0⎦ 0 0

teiϕ 0 8.89 0 teiϕ Die Durchquerung der Platte erzeugt in beiden Komponenten einen Phasenzuwachs um ϕ.



1 0 0 0 0 1 0 0 

8.90

8.91



t2 ⎢ 0 ⎣ 0 0

0 t2 0 0

0 0 t2 0

⎤ 0 0 ⎥ ⎦ 0 2 t



1 ⎣0 0 0

0 0 0 0

0 0 0 0

⎤ 0 0⎦ 0 0

(S 2 + S22 + S32 )1/2 Ip = 1 Ip + Iu S0 Ip = (S12 + S22 + S32 )1/2 ; I − Ip = Iu V =

Iu = S0 − (S12 + S22 + S32 )1/2 ⎡ ⎤ ⎡ ⎤ ⎡ ⎤ 4 1 5 ⎣ 0 ⎦+⎣ 0 ⎦ = ⎣ 0 ⎦ 0 0 0 0 1 1 5 − (0 + 0 + 1)1/2 = Iu .

Lösungen ausgewählter Aufgaben 8.93

1321

(a) 

 cos θ cos2 α cos α sin α sin θ cos α sin α sin2 α  2 cos α cos θ + cos α sin α sin θ = cos α sin α cos θ + sin2 α sin θ  cos α = cos (θ − α) sin α

(b) Der austretende Strahl ist unter einem Winkel α zur Waagerechten polarisiert, seine Amplitude ist um den Faktor cos (θ − α) abgeschwächt. Genau dasselbe geschieht an einem idealen linearen Polarisator, dessen Durchlassachse in einem Winkel α zur Waagerechten orientiert ist (erinnern Sie sich an das malussche Gesetz). (c) Ein Beispiel: Stellen Sie die Jones-Matrix für gekreuzte Polarisatoren auf. Der Neigungswinkel des zweiten Polarisators sei (α − 90◦ ), sodass Sie cos α durch sin α und sin α durch (− cos α) ersetzen müssen. Die Jones-Matrix für die Kombination ist:   cos2 α cos α sin α sin2 α sin α cos α cos α sin α sin2 α sin α cos α cos2 α  00 (die Nullmatrix!) . = 00

Kapitel 9 9.1

E1 · E2 =

mit Re(z) =

1 1 (E1 e−iωt + E∗1 eiωt ) · (E2 e−iωt + E∗2 eiωt ) 2 2

1 (z + z ∗ ). 2

E1 · E2 =

1 [E1 · E2 e−2iωt + E∗1 · E∗2 e2iωt + E1 · E∗2 + E∗1 · E2 ] ; 4

die beiden letzten Terme sind zeitunabhängig, während E1 · E2 e−2iωt → 0 und E∗1 · E∗2 e2iωt → 0 wegen des Koeffizienten 1/T ω. Also ist I12 = 2 E1 · E2 =

1 (E1 · E∗2 + E∗1 · E2 ) . 2

9.2 Der größte Wert von (r1 − r2 ) ist gleich a. Wenn also ε1 = ε2 ist, geht δ = k(r1 − r2 ) von 0 bis ka. Bei a  λ hat cos δ und daher auch I12 sehr viele Maxima und Minima, die einander über einem großen Raumbereich zu 0 ausmitteln. Ist dagegen a  λ, verändert sich δ nur geringfügig zwischen 0 und ka  2π. Hier mittelt sich I12 nicht zu 0, und entsprechend Gl. (9.6) weicht I nur wenig von 4I0 ab. Die beiden Quellen verhalten sich wie eine einzelne Quelle doppelter Intensität.

Lösungen ausgewählter Aufgaben

1322

9.4 Ja, eine Glühlampe in S erzeugt Interferenzmuster. Wir können uns vorstellen, die Lampe sei aus sehr vielen inkohärenten Punktquellen zusammengesetzt. Jede dieser Punktquellen erzeugt ein unabhängiges Interferenzmuster; alle Muster überlagern einander anschließend. Glühlampen in S1 und S2 sind inkohärent und erzeugen deshalb kein Interferenzmuster. 1 632,8 × 10−9 m 1 1 1 = (a) (r1 −r2 ) = ± λ, also ist a sin θ1 = ± λ; θ1 ≈ ± λ/a = ± 2 2 2 2 0,2 × 10−3 m −3 −3 ±1,58 × 10 rad; y1 = sθ1 = (1,00 m)(±1,58 × 10 rad) = ±1,58 mm. (b) y5 = 5sλ/a = (1,00 m) × 5 × (632,8 × 10−9 )/(0,2 × 10−3 m) = 1,582 × 10−2 m. (c) Das Ergebnis von (b) ist das Zehnfache des Ergebnisses von (a), weil die Variation der Streifen von cos2 abhängt und das Ergebnis von (a) einer halben Streifenbreite entspricht.

9.9

9.21 r22 = a2 + r12 − 2ar1 cos(90◦ − θ). Der Beitrag des dritten Gliedes der Maclaurin-Reihe zu cos(δ/2) ist vernachlässigbar, falls gilt  k a2 π cos2 θ  ; 2 2r1 2 deshalb ist r1  a2 /λ. 1 9.22 E = mv 2 ; v = 0,42 × 106 m/s. λ = h/mv = 1,73 × 10−9 ; Δy = sλ/a = 3,46 mm. 2 9.29 Δy = sλ0 /2dα(n − n ) . 9.31

Δy = (s/a)λ, a = 10−2 cm, a/2 = 5 × 10−3 cm.

δ = k(r + * a1 − r2 ) + π (lloydscher Spiegel) a sin α − [sin(90◦ − 2α)] sin α + π δ=k 2 2 δ = ka(1 − cos 2α)/2 sin α + π .  λ Ein Maximum tritt auf für δ = 2π bei sin α = (1 − cos 2α) = 2 sin2 α. Das erste Maxia −1 mum liegt bei α = sin (λ/2a) . 9.32

9.34 1,00 < 1,34 > 1,00, also ist laut Gl. (9.36) mit m = 0 d = (0+ 21 )×(633 nm)/2×1,34 = 118 nm. 9.38 Mit Gl. (9.37) ist m = 2nf d/λ0 = 10 000. Ein Minimum, deshalb ist der mittlere Bereich dunkel. x

d1

x

R1 − d1

R1

9.39 Das Interferenzmuster besteht aus fein gezackten Streifen, die bezüglich des Glases feststehen. 9.40

Δx = λf /2α ,

α = λ0 /2nf Δx



α = 5 × 10−5 rad = 10,2 s

Lösungen ausgewählter Aufgaben 9.43

1323

x2 = d1 [(R1 − d1 ) + R1 ] = 2R1 d1 − d21 ; analog ist x2 = 2R2 d2 − d22 und  λf x2 1 1 . , d=m − d = d1 − d2 = 2 R1 R2 2

Für R2 → ∞ nähert sich xm Gl. (9.43). 9.47 Eine Verschiebung um λ/2 bewirkt, dass ein einzelnes Streifenpaar vorbeiläuft. Folglich ist 92λ/2 = 2,53 × 10−5 m und λ = 550 nm. 9.53

Et2 = Et Et∗ = E02 (tt )2 /(1 − r2 e−iδ )(1 − r2 e+iδ ) It = Ii (tt )2 /(1 − r2 e−iδ − r2 eiδ + r4 ) .

9.54

(a) R = 0,80, also F = 4R/(1 − R)2 = 80 . √ (b) γ = 4 sin−1 (1/ F ) = 0,448 . (c) F = 2π/0,448 . (d) C = 1 + F .

9.55

 1 2 = 0,81 1 + 1 + F (Δδ/4)2 1 + F (Δδ/2)2

F 2 (Δδ)4 − 15,5F (Δδ)2 − 30 = 0 . 9.56

I = Imax cos2 δ/2 I = Imax /2 für δ = π/2, also

γ = π.

Der Abstand zwischen zwei Maxima ist gleich 2π, und F = 2π/γ = 2 . 9.58 Bei fast senkrechtem Einfall (θi ≈ 0) beträgt gemäß Abb. 4.52 e die relative Phasenverschiebung zwischen einem innen und einem außen reflektierten Strahl π rad. Der relative Phasenunterschied ist demnach insgesamt 2π [2(λf /4)] + π λf oder 2π. Die Wellen sind phasengleich und interferieren konstruktiv.

1 1 λ0 1 540 nm. 1,54 = 1,24; also ist d = λf = = 4 4 n1 4 1,24 Zwischen den beiden Wellen tritt keine relative Phasenverschiebung auf.

9.59

n0 = 1, ns = ng ,

n1 =



ng .

9.60 Die Brechungswelle durchläuft die Schicht zweimal, bei der Reflexion erfolgt keine Phasenverschiebung. Also ist d = λ0 /4nf = (550 nm)/4 × (1,38) = 99,6 nm.

Lösungen ausgewählter Aufgaben

1324

Kapitel 10 10.1 (R+)2 = R2 +a2 ; folglich ist R = (a2 −2 )/2 ≈ a2 /2, R = a2 /2. Für λ  , λR  a2 /2 ist dann R = (1 × 10−3 )2 × 10/2λ = 10 m. Nδ =π 10.3 d sin θm = mλ θ= 2 7 sin θ = 1 × 0,21 δ = 2π/N = kd sin θ sin θ = 0,03 sin θ = 0,0009 θ = 1,7◦ 10.4

R+ S

R

θ = 3 min.

Eine konvergierende Kugelwelle im Bildraum wird an der Austrittspupille gebeugt.

P

S

P

Austrittspupille

10.6

β = ±π sin θ = ±λ/b θ ≈ ±λ/b Lθ ≈ ±Lλ/b

≈ Lλ/b b L

Lθ ≈ ±f2 λ/b .

λ = 20 cm × sin 36,87◦ = 12 cm. kb ka sin θ, β = sin θ 10.14 α = 2 2 a = mb, α = mβ, α = m2π N = Anzahl der Streifen = a/π = m2π/π = 2m . 10.9

10.17

π 3π = 2N 2 1 I ≈ . I(0) 9 α=

(siehe Gl. 10.34)

λ a

λ b

I(θ) =

sin θ

I(0) sin β 2 N2 β

λ a

λ b

(siehe Gl. 10.35)

sin θ

a

Lösungen ausgewählter Aufgaben

1325

10.26 Ist die Öffnung symmetrisch bezüglich einer Fraunhoferlinie, so ist das Beugungsbild symmetrisch zu einer Parallelen dieser Linie. Außerdem ist das Bild symmetrisch zu einer Senkrechten auf der Symmetrieachse der Öffnung. Die Ursache dafür ist, dass FraunhoferBeugungsmuster ein Symmetriezentrum besitzen. 10.27

10.28 Drei parallele, kurze Spalte. 10.29 Zwei parallele, kurze Spalte. 10.30 Die Öffnung ist ein gleichseitiges Dreieck. 10.31 Die Öffnung ist kreuzförmig. 10.32 Das E-Feld einer rechteckigen Öffnung. 10.38 Entsprechend Gl. (10.58) ist q1 ≈ 1,22(f /D)λ ≈ λ. 10.39

Lösungen ausgewählter Aufgaben

1326

10.45 Um das Tausendfache des Punktdurchmessers, also mindestens rund 2,5 m. 2.5 mm

2.5 mm

2.5 mm

10.55 In Gl. (10.32) ist a = 1/(1000 Gitterstriche pro cm) = 0, 001 cm/Gitterstrich (von Mitte zu Mitte gerechnet). Also ist sin θm = 1 × (650 × 10−9 m)/(0,001 × 10−2 m) = 6,5 × 10−2 und θ1 = 3,73◦ . 10.61 Der größte Wert von m in Gl. (10.32) tritt auf, wenn der Funktionswert der Sinusfunktion gleich 1 ist, wobei die linke Seite der Gleichung so groß wie möglich wird. Es ist dann m = a/λ = (1/10 × 105 )/(3,0 × 108 m/s)/(4,0 × 1014 Hz) = 1,3, und man sieht nur das Spektrum erster Ordnung. 10.63 sin θi = n sin θn Optische Weglängendifferenz = mλ

n

a sin θm − na sin θn = mλ a(sin θm − sin θi ) = mλ . θi a θn

θn θm

10.65 R = mN = 106 , N = 78 × 103 also ist m = 106 /78 × 103 ΔλFSB = λ/m = 500 nm/(106 /78 × 103 ) = 39 nm 2nf d = 106 (siehe Gl. 9.76) R = Fm = F λ λ2 = 0,0125 nm (siehe Gl. 9.78) ΔλFSB = 2nf d 10.66 R = λ/Δλ = 5892,9/5,9 = 999 , N = R/m = 333 . 10.68 y = Lλ/d , d = 12 × 10−6 /12 × 10−2 = 10−4 m . ˆ ϕ 2 10.70 A = 2πρ sin ϕ dϕ = 2πρ2 (1 − cos ϕ) 0

ρ2 + (ρ + r0 )2 − rl2 cos ϕ = 2ρ(ρ + r0 ) lλ . rl = r0 + 2

Lösungen ausgewählter Aufgaben

1327

Fläche der ersten l Zonen: A = 2πρ2 − πρ(2ρ2 + 2ρr0 − lλr0 − l2 λ2 /4)/(ρ + r0 )  λπρ (2l − 1)λ . r0 + Al = A − Al−1 = ρ + r0 4 10.84 3

1 0 1 Δw = 5.5

2

3

$ 2  2 1 I0 1 − C(v1 ) + − S(v1 ) 10.85 I = 2 2 2 

πv 2 

πv 2  I0 1 2 1 1 + cos2 sin2 I= 2 πv1 2 2 I0 1 2 I= . 2 πv1 10.86 Man sähe Streifen sowohl im hellen Bereich als auch im Schatten. Siehe M. P. Givens und W. L. Goffe, Am. J. Phys. 34 (1966) 248.  2 ; Δu = Δy × 103 = 2,5 . 10.87 u = y λr0

0 1.25

10.88

5

Lösungen ausgewählter Aufgaben

1328

Kapitel 11 11.1

E0 sin kp x = E0 (eikp x − e−ikp x )/2i  ˆ +L ˆ +L E0 i(k+kp )x i(k−kp )x F (k) = e dx − e dx 2i −L −L iE0 sin(k + kp )L iE0 sin(k − kp )L + (k + kp ) (k − kp ) F (k) = iE0 L[sinc(k − kp )L − sinc(k + kp )L]

F (k) = −

F (k)

−kp

11.3

1 1 1 e2iωp t + e−2iωp t + cos 2ωp t = + 2 2 2 4 ˆ ˆ ˆ 1 1 1 +T iωt i(ω+2ωp )t e ei(ω−2ωp )t dt e dt + dt + F (ω) = 2 −T 4 4 1 1 1 sin(ω + 2ωp )T + sin(ω − 2ωp )T F (ω) = sin ωT + ω 2(ω + 2ωp ) (2ω − 2ωp ) T T F (ω) = T sinc ωT + sinc(ω + 2ωp )T + sinc(ω − 2ωp )T . 2 2

cos2 ωp t =

−2ωp

11.9

k

+kp

0

2ωp 0 T →∞

ω

−2ωp

0

2ωp

ω

F {af (x) + bh(x)} = aF (k) + bH(k)

11.11 F (k) = L sinc2 kL/2 bei k = 0, F (0) = L und F (±2π/L) = 0 . ˆ x=+∞ ˆ x =+∞ ˆ +∞    11.18 f (x) h(X−x) dx = − f (X−x ) h(x ) dx = h(x ) f (X−x ) dx x=−∞

mit x = X − x, dx = −dx . f h=hf

x =−∞

−∞

oder F {f  h} = F {f } · F{h} = F {h} · F{f } = F {h  f } .

11.22 Ein Punkt auf dem Rand von f (x, y), z. B. in (x = d, y = 0), wird zu einem Quadrat mit der Seitenlänge 2 und dem Mittelpunkt X = d ausgedehnt. Es erstreckt sich nicht weiter als bis X = d + , folglich muss die Faltung in X = d +  und darüber hinaus null sein.

Lösungen ausgewählter Aufgaben ˆ 11.24 f (x − x0 )  h(x) =

+∞

−∞

1329

f (x − x0 ) h(X − x) dx ;

wir setzen x − x0 = α und erhalten ˆ +∞ f (α)h(X − α − x0 )dα = g(X − x0 ) . −∞

11.28

0

0

0

11.32 Offensichtlich ist f (x) die Faltung einer Rechteckfunktion mit zwei δ-Funktionen. Nach dem Faltungssatz ist F (k) = F {rect(x)  [δ(x − a) + δ(x + a)]} = F {rect(x)} · F{[δ(x − a) + δ(x + a)]} 1 = a sinc ka · (eika + e−ika ) 2

1  = a sinc ka · 2 cos ka . 2 11.33 f (x)  h(x) = [δ(x + 3) + δ(x − 2) + δ(x − 5)]  h(x) = h(x + 3) + h(x − 2) + h(x − 5) 11.36

11.37

A(y, z) = A(−y, −z) ¨ E(Y, Z, t) ∝ A(y, z) ei(ky y+kz z) dy dz

Wir setzen −Y statt Y , −Z statt Z, −y statt y und −z statt z. So wird −ky aus ky und −kz aus kz , und es ist ¨ E(−Y, −Z) ∝ A(−y, −z) ei(ky y+kz z) dy dz, also E(−Y, −Z) = E(Y, Z) . 11.38 Laut Gl. (11.63) ist ¨ E(Y, Z) = A(y, z) eik(Y y+Zz)/R dy dz ¨ A(αy, βz) eik(Y y+Zz)/R dy dz ; E  (Y, Z) =

Lösungen ausgewählter Aufgaben

1330

wir setzen nun y  = αy und z  = βz, und so ist ¨   1 A(y  , z  ) eik[(Y /α)y +(Z/β)z ] dy  dz  E  (Y, Z) = αβ 1 E(Y /α, Z/β) . oder E  (Y, Z) = αβ ˆ +T 1 11.39 Cff = lim A sin(ωt + ε)A sin(ωt − ωτ + ε) dt T →∞ 2T −T ˆ  A2 1 1 cos(ωτ ) − cos(2ωt − ωτ + 2ε) dt = lim T →∞ 2T 2 2 1 1 wegen cos α − cos β = −2 sin (α + β) sin (α − β). Also ist 2 2 2 A cos(ωτ ) . Cff = 2 ˆ 11.40 E(kz ) =

b/2

−b/2 ˆ

A0 cos(πz/b)eikz z dz

ˆ πz πz cos kz z dz + iA0 cos sin kz z dz b b 1 1 bkz + π . E(kz ) = A0 cos π 2 ( b − kz ) ( b + kz ) = A0

cos

Kapitel 12 12.8 Bei niedrigem Druck ist die von der Lampe emittierte Lichtintensität niedrig, die Bandbreite gering und die Kohärenzlänge groß. Die Interferenzstreifen sind anfangs kontrastreich, allerdings insgesamt recht schwach. Mit zunehmendem Druck nimmt die Kohärenzlänge ab, der Kontrast lässt nach und das Streifenmuster kann sogar vollkommen verblassen. 12.11 Jede Sinusfunktion im Signal erzeugt eine kosinusförmige Autokorrelationsfunktion mit eigener Wellenlänge und Amplitude. Im Punkt τ = 0 sind sie alle phasengleich. Außerhalb dieses Punktes gelangen die Kosinusfunktionen rasch außer Phase und es kommt zu vielfältigen Überlagerungen, wodurch eine destruktive Interferenz wahrscheinlicher wird. (Dasselbe geschieht z. B., wenn man einen Rechteckpuls aus Sinusfunktionen zusammensetzt – außerhalb des Pulses löschen alle Beiträge einander aus.) Bei wachsender Komponentenzahl und komplexerem, statistischem Rauschen ähnlichem Signal wird die Autokorrelationsfunktion immer schmaler und wird schließlich zur δ-Funktion in τ = 0. 12.13 Eine Punktquelle erzeugt in Σ0 die Bestrahlungsstärke

δ = 2I0 (1 + cos δ) . 4I0 cos 2

Lösungen ausgewählter Aufgaben

1331

Für ein differentielles Element mit der Breite dy im Punkt S  der Quelle, y von der Achse entfernt, ist die optische Weglängendifferenz über die beiden Spalte zu P im Abstand Y gleich Λ = (S  S1 + S1 P ) − (S  S2 + S2 P ) = (S  S1 − S  S2 ) + (S1 P − S2 P ) = ay/l + aY /s

(siehe Abschn. 9.3) .

dy liefert dann folgenden Beitrag zur Bestrahlungsstärke: dI ∝ (1 + cos kΛ) dy ˆ +b/2 (1 + cos kΛ)dy I∝ −b/2



aY aY ab  ab  d sin + − sin − I ∝ b+ ka s 2l s 2l  kaY kab kaY kab d sin cos + cos sin I ∝ b+ ka s 2l s 2l kab kaY kab kaY cos + cos sin − sin s 2l s 2l 2l kab kaY I ∝ b+ sin cos . ka 2l s Imax − Imin Imax + Imin Imax = I1 + I2 + 2 I1 I2 |˜ γ12 | Imin = I1 + I2 − 2 I1 I2 |˜ γ12 | √ γ12 | 4 I1 I2 |˜ . V= 2(I1 + I2 ) λ 3λ 5λ 12.15 Mit S  S1 O −S  S1 O = , , , · · · ist die auf S  zurückzuführende Bestrahlungs2 2 2 stärke gegeben durch

δ  I  = 4I0 cos2 = 2I0 (1 + cos δ  ) , 2

12.14

V=

die auf S  zurückzuführende Bestrahlungsstärke ist gegeben durch

δ  

δ + π  = 4I0 cos2 = 2I0 (1 − cos δ  ) . I  = 4I0 cos2 2 2 Also ist I  + I  = 4I0 . 12.18 I1 (t) = ΔI1 (t) + I1 , also ist I1 (t + τ )I2 (t) = [ I1 + ΔI1 (t + τ )][ I2 + ΔI2 (t)] , weil I1 nicht von der Zeit abhängt. I1 (t + τ )I2 (t) = I1 I2 + ΔI1 (t + τ )ΔI2 (t) ,

Lösungen ausgewählter Aufgaben

1332

wobei wir uns erinnern, dass ΔI1 (t) = 0 ist. Gl. (12.34) folgt unmittelbar durch Vergleich mit Gl. (12.32). √ 12.20 Entsprechend Gl. (12.22) ist V = 2 (10I)I/(10I + I) = 2 10/11 = 0,57. 12.24 Mithilfe des van Cittert-Zernike-Theorems bestimmen wir γ˜12 (0) aus dem Beugungsmuster über den Öffnungen. Daraus ergibt sich die Sichtbarkeit in der Beobachtungsebene: V = |˜ γ12 (0)| = | sinc β|. Aus Tabellenwerken entnehmen wir sinc u = 0,85 für u = 0,97, und folglich ist πby/lλ = 0,97 und, mit y = P1 P2 = 0,50 mm, b = 0,97(lλ/πy) = 0,97×(1,5 m)× (500 × 10−9 m)/π × (0,50 × 10−3 m) = 0,46 mm. 12.27 Mithilfe des van Cittert-Zernike-Theorems können wir den Kohärenzgrad aus der Fourier-Transformierten der Ursprungsfunktion erhalten; diese ist dargestellt durch δFunktionen entsprechend einem Beugungsgitter mit dem Linienabstand a und a sin θm = mλ. Die Kohärenzfunktion ist deshalb auch eine Reihe von δ-Funktionen. Die Strecke P1 P2 , also der Spaltabstand d, muss der Lage des Beugungsstreifens erster Ordnung der Quelle entsprechen, wenn die Sichtbarkeit maximal werden soll. Dann ist aθ1 ≈ λ und d ≈ lθ1 ≈ λl/a = (500 × 10−9 m) × (2,0 m)/(500 × 10−6 m) = 2,0 mm.

Kapitel 13 13.2 P/A = σ(T 4 − Te4 ); P/A = 0,97 × (5,6703 × 10−8 W/m2 · K4 ) × (3064 − 2934 ) = I = 76,9 W/m2 . P = 108 W. 13.3

Ie = σT 4

(22,8 W cm2 ) × (104 cm2 m−2 ) = (5,7 × 10−8 W m−2 K−4 )T 4 

22,8 × 104 T = 5,7 × 10−8 13.4

1/4

= 1,414 × 103 = 1414 K .

T24 /T14 = P2 /P1 = 16 × 1012 /16 × 108 = 1,0 × 104 .

13.13 λmin = 300 nm (6,63 × 10−34 J · s)(3 × 108 m/s) hc = hν = λ 300 × 10−9 m −19 E = 6,63 × 10 J = 4,14 eV . 13.15 N hν = (1,4 × 103 W/m2 ) × (1 m2 ) × (1 s) (1,4 × 103 )(700 × 10−9 ) 980 × 1020 N = = = 49,4 × 1020 . −34 8 (6,63 × 10 )(3 × 10 ) 19,89 13.16 Wir bestimmen die Anzahl der vorhandenen Atome: pV = nRT ; n = 4,47×10−7 mol, also sind es 2,69 × 1017 Atome, von denen 2,67 × 1015 angeregt werden. Die Emissionsrate beträgt 2,67 × 1015 /τ = 1,92 × 1023 Photonen pro Sekunde. 13.19 hν/kB T = 0,774 und 1/(e0,774 − 1) = 0,86. Bei der höheren Temperatur spielen die beiden Mechanismen vergleichbare Rollen. 13.29 Die Übergangsrate muss gleich P/hν = 3 × 1015 s−1 sein.

Lösungen ausgewählter Aufgaben

1333

1 n 0 1/2 2 E0 mit μ ≈ μ0 vE02 = 2 2 μ0

μ 1/2

μ 1/2 I 0 0 , E02 = 2 = 376,730 Ω 0 n 0

I 1/2 E0 = 27,4 n 13.39 13.40 13.37

I=

. Beugungsmuster

Filter

Beugungsmuster

13.41

13.43

mehrere Filter

13.44 Aus der Geometrie der Anordnung folgt ft θ = f  Φ, kO = k sin θ und kI = k sin Φ. Also ist sin θ ≈ θ ≈ kO λ/2π und sin Φ ≈ Φ ≈ kI Λ/2π, und damit ist θ/Φ = kO /kI und kI = kO (Φ/θ) = kO (ft /f  ). Für f  > ft ist das Bild größer als das Objekt, die räumlichen Perioden in der Abbildung sind ebenfalls größer, und die Raumfrequenzen im Bild sind kleiner als im Objekt. 13.45 a = 1/50 cm; a sin θ = mλ, sin θ ≈ θ, also ist θ = (5000 m)×λ. Der Abstand zwischen den einzelnen Ordnungen in der Transformiertenebene beträgt f θ = 5000λf = 2,7 mm. 13.47 Jeder Punkt auf dem Beugungsgitter entspricht einer einzelnen Raumfrequenz. Wir stellen uns vor, die Beugungswelle setze sich aus ebenen Wellen zusammen; dann entspricht jeder Punkt auch einer Richtung einer einzelnen ebenen Welle. Solche Wellen übertragen selbst keinerlei Information über die Periodizität des Objekts und erzeugen ein mehr oder weniger

1334

Lösungen ausgewählter Aufgaben

gleichförmiges Bild. Die periodischen Eigenschaften der Quelle werden erst am Ort des Bildes reproduziert, wo die einzelnen ebenen Wellen einander überlagern. 13.49 Die relativen Feldamplituden sind 1,00, 0,60 und 0,60, daher ist E ∝ 1+0,60 cos(+ky  ) + 0,60(−ky  ) = 1 + 1,2 cos ky  . Dies ist eine Kosinusfunktion, die um die Linie bei 1,0 schwingt und Werte zwischen +2,2 und −0,2 annimmt. Ihr Quadrat entspricht der Bestrahlungsstärke, diese besteht aus einer Reihe von hohen Spitzen mit der Höhe (2,2)2 . Zwischen jeweils zwei solchen Spitzen befindet sich noch je eine niedrige Spitze proportional zu (0,2)2 . Beachten Sie die Ähnlichkeit mit Abbildung 11.46. 13.50 a sin θ = λ, hier ist f θ = 50λf = 0,20 cm, also λ = 0,20/50 × 100 = 400 nm. Die Vergrößerung ist 1,0, wenn die Brennweiten gleich sind; das Gitter besitzt demnach 50 Drähte pro cm. 13.54 Infolge der Eigenbewegung des Mediums verschwindet das Fleckenmuster.

Literatur Deutschsprachige Literatur Bergmann, L. und Schäfer, C., Lehrbuch der Experimentalphysik, Band III Optik, Walter de Gruyter, Berlin 2004. Born, M., Optik, Ein Lehrbuch der elektromagnetischen Lichttheorie, Springer, Berlin 1990. Demtröder, W., Experimentalphysik 2, Elektrizität und Optik, Springer, Berlin 2013. Jahns, J., Photonik, Grundlagen, Komponenten und Systeme, Oldenbourg, München 2001. Feynman, R. P., Quantenelektrodynamik, Eine Vorlesungsmitschrift, Oldenbourg, München 1997. Flügge. J. (Hrsg.), Die wissenschaftliche und angewandte Photographie, Band 1: Das photographische Objektiv. Springer, Wien 1955. Klein, M. V. und Furtak, T. E., Optik, Springer, Berlin 1988. Landau, L. D. und Lifschitz, E. M., Lehrbuch der theoretischen Physik, Band VIII, Elektrodynamik der Kontinua, Harry Deutsch, Frankfurt 1990. Paul, H., Lexikon der Optik, 2 Bde, Spektrum Akademischer Verlag 2003. Schlegel, K., Vom Regenbogen zum Polarlicht. Leuchterscheinungen in der Atmosphäre. Spektrum Akad. Verlag, Heidelberg 2001. Sommerfeld, A., Vorlesungen über theoretische Physik, Band IV: Optik, Harry Deutsch, Frankfurt 1989. Zinth, W. und Zinth U., Optik, Lichtstrahlen, Wellen, Photonen, Oldenbourg, München 2013.

Englischsprachige Literatur Allen, L. S., Barnett, S. M. und Padgett, M. J., Optical Angular Momentum, Institute of Physics Publishing, Bristol, 2003. Andrews, C. L., Optics of the Electromagnetic Spectrum, Prentice-Hall, Englewood Cliffs, N. J., 1960. Antonelli, Christian, Fischer, Giles, James und Stoner, Waves and Optics Simulations, Wiley, New York 1995. Bachor, Hans-A., A Guide to Experiments in Quantum Optics, Wiley-VCH, Weinheim 1998. Baker, B. B. und Copson, E. J., The Mathematical Theory of Huygens’ Principle, Oxford University Press, London 1969. Baldwin, G. C., An Introduction to Nonlinear Optics, Plenum Press, New York 1969. Band, Y. B., Light and Matter, Wiley, New York, 2006. Barber, N. F., Experimental Correlograms and Fourier Transforms, Pergamon, Oxford 1961. Barnoski, M., Fundamentals of Optical Fiber Communications, Academic Press, New York 1976. Barton, A. W., A Textbook on Light, Longmans Green, London 1939.

https://doi.org/10.1515/9783111025599-017

1336

Literatur

Beard, D. B. und Beard, G. B., Quantum Mechanics Wit Applications, Allyn and Bacon, Boston 1970. Bennett, C. A., Principles of Physical Optics, Wiley, New York, 2008. Beesley, M., Lasers and Their Applications, Taylor and Francis, New York 1976. Beran, M. J. und Parrent jr., G. B., Theory of Partial Coherence, Prentice-Hall, Englewood Cliffs, N. J., 1964. Blaker, J. W. und Rosenblum, W. M., Optics, Macmillan, New York 1993. Bloembergen, N., Nonlinear Optics, Addison-Wesley, Reading, MA, 1991. Bloom, A. L., Gas Lasers, Wiley, New York 1968. Bloss, D., An Introduction to the Methods of Optical Crystallography, Holt, Rinehart and Winston, New York 1961. Born, M. und Wolf, E., Principles of Optics, Pergamon, Oxford 1970. Borowitz, S., Fundamentals of Quantum Mechanics, Benjamin, New York 1967. Braddick, H., Vibrations, Waves, and Diffraction, MacGraw-Hill, New York 1965. Brooker, G., Modern Classical Optics, Oxford University Press, Oxford, 2003. Brouwer, W., Matrix Methods in Optical Instrument Design, Benjamin, New York 1964. Brown, E. B., Modern Optics, Reinhold, New York 1965. Buck, J. A., Optical Fibers, Wiley, New York 1995. Budker, D., Kimball, D. F. und DeMille, D. P., Atomic Physics, Oxford University Press, Oxford, 2004. Butcher, P. N. und Cotter, D., The Elements of Nonlinear Optics, Cambridge University Press, Cambridge 1990. Cajori, F., A History of Physics, Macmillan, New York 1899. Cathey, W., Optical Information Processing and Holography, Wiley, New York 1974. Chang, W. S., Principles of Quantum Electronics, Lasers: Theory and Applications, AddisonWesley, Reading, MA, 1969. Chartier, G., Introduction to Optics, Springer, New York, 2005. Cohen-Tannoudji, C., Dupont-Roc, J. und Grynberg, G., Photons and Atoms, Wiley, New York 1989. Collier, R., Burckhardt, C. und Lin, L., Optical Holography, Academic Pres, New York 1971. Conrady, A. E., Applied Optics and Optical Design, Dover Publications, New York 1929. Cook, A. H., Interference of Electromagnetic Waves, Clarendon Press, Oxford 1971. Cosslett, V. E., Modern Microscopy, Cornell University Press, Ithaca, N. Y., 1966. Cox, A., Optics, The Focal Press, London 1961. Coulson, C. A., Waves, Oliver and Boyd, Edinburgh 1949. Cowley, J. M., Diffraction Physics, North-Holland, Amsterdam 1986. Crawford jr., F. S., Waves, MacGraw-Hill, New York 1965. Darrigol, O., A History of Optics, Oxford University Press, Oxford, 2012. Davis, C. C., Lasers and Electro-Optics, Cambridge University Press, Cambridge 1996. Davis, H. F., Introduction to Vector Analysis, Allyn and Bacon, Boston 1961. Davis, S. P., Diffraction Grating Spectrographs, Holt, Rinehart and Winston, New York 1970. DeVelis, J. B., und Reynolds, G. O., Theory and Applications of Holography, Addison-Wesley, Reading, MA, 1967. Degiorgio, V. und Cristiani, I., Photonics, Springer, New York, 2014.

Literatur

1337

Denisyuk, Y., Fundamentals of Holography, Verlag Mir, Moskau 1984. DiMarzio, C. A., Optics for Engineers, CRC Press, New York, 2012. Dirac, P. A. M., Quantum Mechanics, Oxford University Press, London 1958. Ditchburn, R. W., Light, Wiley, New York 1963. Ditteon, R., Modern Geometrical Optics, Wiley, New York 1998. Dodd, J. N., Atoms and Light: Interactions, Plenum Press, New York 1991. Drude, P., The Theory of Optics, Longmans Green, London 1939. Elmore, W., und Heald, M., The Physics of Waves, McGraw-Hill, New York 1969. Ersoy, O. K., Diffraction Fourier Optics and Imaging, Wiley, New York, 2007. Feynman, R. P., QED, Princeton University Press, Princeton, N. J., 1985. Flügge, J. (Hrsg.), Die wissenschaftliche und angewandte Photographie, Band 1: Das photographische Objektiv. Springer, Wien 1955. Fowles, G., Introduction to Modern Optics, Holt, Rinehart and Winston, New York 1968. Françon, M., Modern Applications of Physical Optics, Interscience, New York 1963. Françon, M., Diffraction Coherence in Optics, Pergamon Press, Oxford 1966. Françon, M., Optical Interferometry, Academic Press, New York 1966. Françon, M., Krauzman, N., Mathieu, J. P. und May, M., Experiments in Physical Optics, Gordon and Breach, New York 1970. Françon, M., Optical Image Formation and Processing, Academic Press, New York 1979. Frank, N. H., Introduction to Electricity and Optics, McGraw-Hill, New York 1950. Freeman, M. H., Optics, Butterworths, London, 1990. French, A. P., Special Relativity, Norton, New York 1968. French, A. P., Vibrations and Waves, Norton, New York 1971. Froome, K. D. und Essen, L., The Velocity of Light and Radio Waves, Academic Press, London 1969. Fry, G. A., Geometrical Optics, Chilton, Philadelphia, 1969. Garbuny, M., Optical Physics, Academic Press, New York 1965. Gaskill, J., Linear Systems, Fourier Transforms, and Optics, Wiley, New York 1978. Gerry, C. C. und Knight, P. L., Introductory Quantum Optics, Cambridge University Press, Cambridge, 2006. Ghatak, A. K., An Introduction to Modern Optics, McGraw-Hill, New York 1971. Ghatak, A. und Thyagarajan, K., Contemporary Optics, Plenum Press, New York 1978. Goldin, E., Waves and Photons, An Introduction to Quantum Theory, Wiley, New York 1982. Goldwasser, E. L., Optics, Waves, Atoms, and Nuclei: An Introduction. Benjamin, New York 1965. Goodman, J. W., Introduction to Fourier Optics, McGraw-Hill, New York 1968. Graham Smith, F. und King, T. A., Optics and Photonics: An Introduction, Wiley, New York 2000. Greenler, R., Rainbows, Halos, and Glories, Cambridge University Press, Cambridge 1991. Guenther, R. D., Modern Optics, Wiley, New York 1990. Hardy, A. C. und Perrin, F. H., The Principles of Optics, McGraw-Hill, New York 1932. Hariharan, P., Basics of Interferometry, Academic Press, New York 1992. Harvey, A. F., Coherent Light, Wiley, London 1970. Heavens, O. S., Optical Properties of Thin Solid Films, Dover Publications, New York 1955.

1338

Literatur

Hecht, E., Optics: Schaum’s Outline Series, McGraw-Hill, New York 1975. Hecht, J., Understanding Fiber Optics, 4. Aufl., Prentice Hall, Upper Saddle River, New Jersey 2002. Hermann, A., The Genesis of Quantum Theory (1899-1913), MIT Press, Cambridge, MA, 1971. Houston, R. A., A Treatise on Light, Longmans Green, London 1938. Huard, S., Polarization of Light, Wiley, New York 1997. Hunsperger, R., Integrated Optics: Theory and Technology, Springer, Berlin 1984. Huygens, C., Treatise on Light, Dover Publications, New York 1962 (1690). Iga, K., Fundamentals of Laser Optics, Plenum Press, New York 1994. Iizuka, K., Engineering Optics, Springer, Berlin 1987. Iizuka, K., Elements of Photonics, Wiley, New York, 2002. Ingard, K. U., Fundamentals of Waves and Oscillations, Cambridge University Press, Cambridge 1988. Jackson, J. D., Classical Electrodynamics, Wiley, New York 1962. Jenkins, F. A. und White, H. E., Fundamentals of Optics, McGraw-Hill, New York 1957. Jennison, R. C., Fourier Transforms and Convolutions for the Experimentalist, Pergamon, Oxford 1961. Joannopoulos, J. D., Johnson, S. G. , Winn, J. N. und Meade, R. D., Photonic Crystals, Princeton University Press, Princeton, 2008. Johnsen, S., The Optics of Life, Princeton University Press, Princeton, 2012. Johnson, B. K., Optics and Optical Instruments, Dover Publications, New York 1947. Jones, B. et al., Images and Information, The Open University Press, Milton Keynes, 1978. Kafri, O. und Glatt, I,. The Physics of Moiré Metrology, Wiley, New York 1990. Karim, M. A., Electro-Optical Devices and Systems, PWS-Kent, Boston 1990. Kasap, S. O., Optoelectronics and Photonics, 2912 Prentice Hall, Upper Saddle River, N.J., 2001. Keiser, G., Optical Fiber Communications, McGraw-Hill, New York 1991. Kenyon, I. R., The Light Fantastic, Oxford University Press, Oxford, 2008. Kitchin, C. R., Telescopes and Techniques, Springer-Verlag, Berlin 1995. Klauder, J. und Sudarshan, E., Fundamentals of Quantum Optics, Benjamin, New York 1968. Klein, M. V., Optics, Wiley, New York 1970. Kreyszig, E., Advanced Engineering Mathematics, Wiley, New York 1967. Kuehni, R. G., Color, Wiley, New York, 1997. Lengyel, B. A., Introduction to Laser Physics, Wiley, New York 1966. Lengyel, B. A., Lasers, Generation of Light by Stimulated Emission, Wiley, New York 1962. Levi, L., Applied Optics, Wiley, New York 1968. Levinson, M. D. und Kano, S. S., Introduction to Nonlinear Laser Spectroscopy, Academic Press, New York 1988. Lipson, S. G., Lipson, H. und Tannhauser, D. S., Optical Physics (3. Aufl.), Cambridge University Press, London 1995. Longhurst, R. S., Geometrical and Physical Optics, Wiley, New York 1967. Loudon, R., The Quantum Theory of Light, Clarendon Press, Oxford 1986.

Literatur

1339

Mach, E., The Principles of Physical Optics, An Historical and Philosophical Treatment, Dover Publications, New York 1926. Magie, W. F., A Source Book in Physics, McGraw-Hill, New York 1935. Main, I. G., Vibrations and Waves in Physics (3. Aufl.), Cambridge University Press, Cambridge 1993. Malacara, D., Optical Shoptesting, Wiley, New York 1978. Mandel, L. und Wolf, E., Optical Coherence and Quantum Optics, Cambridge University Press, Cambridge 1995. Mansuripur, M., Classical Optics and Its Application, Cambridge University Press, Cambridge, 2002. Marchenko, O., Kazantsev, S. und Windholz, L., Demonstrational Optics, Kluwer Academic, New York, 2003. Marion, J. und Heald, M., Classical Electromagnetic Radiation, Academic Press, New York 1980. Markel, V. A. und George, T. F., Optics of Nanostructured Materials, Wiley, New York, 2001. Markos, P. und Soukoulis, C. M., Wave Propagation, Princeton University Press, Princeton, N.J., 2008. Martin, L. C. und Welford, W. T., Technical Optics, Sir Isaac Pitman & Sons, Ltd., London 1966. Matveev, A. N., Optics, Verlag Mir, Moskau 1988. Meyer, C. F., The Diffraction of Light, X-rays and Material Particles, University of Chicago Press, Chicago 1934. Meyer-Arendt, J. R., Introduction to Classical and Modern Optics, Prentice-Hall, Englewood Cliffs, NJ, 1972. Meystre, P. und Sargent III, M., Elements of Quantum Optics, Springer, Berlin 1990. Mickelson, A. A., Light Waves and Their Uses, University of Chicago Press, Chicago 1902. Mickelson, A. A., Studies in Optics, University of Chicago Press, Chicago 1927. Mickelson, A. R., Physical Optics, Van Nostrand Reinhold, New York 1992. Midwinter, J., Optical Fibers for Transmission, Wiley, New York 1979. Military Standardization Handbook – Optical Design, MIL-HDBK-141, 5. Oktober 1962. Milonni, P. W. und Eberly, J. H., Lasers, Wiley, New York 1988. Minnaert, M., The Nature of Light and Colour in the Open Air, Dover Publications, New York 1954. Möller, K. D., Optics, Wiley, New York 1988. Morgan, J., Introduction to Geometrical and Physical Optics, McGraw-Hill, New York 1953. Muirden, J., Beginner’s Guide to Astronomical Telescope Making, Pelham Books Ltd., London 1975. Newell, A. C. und Moloney, J. V., Nonlinear Optics, Addison-Wesley, Reading, MA, 1992. Newton, I., Opticks, Dover Publications, New York 1952 (1704). Noakes, G. R., A Text-Book of Light, Macmillan, London 1944. Nussbaum, A., Geometric Optics: An Introduction, Addison-Wesley, Reading, MA, 1968. Nussbaum, A. und Phillips, R., Contemporary Optics for Scientists and Engineers, Prentice Hall, Englewood Cliffs, N.J., 1976.

1340

Literatur

O’Neill, E. L., Introduction to Statistical Optics, Addison-Wesley, Reading, MA, 1963. O’Shea, D. C., Elements of Modern Optical Design, Wiley, New York 1985. O’Shea, D., Callen, W. und Rhodes, W., Introduction to Lasers and Their Applications, Addison-Wesley, Reading, MA, 1977. Okoshi, T., Optical Fibers, Academic Press, New York 1982. Paesler, M. A. und Moyer, P. J., Near-field Optics, Wiley, New York, 1996. Pain, H. J., The Physics of Vibrations and Waves, Wiley, New York, 2005. Palmer, C. H., Optics, Experiments and Demonstrations, John Hopkins Press, Baltimore, 1962. Papoulis, A., The Fourier Integral and Its Applications, McGraw-Hill, New York 1962. Papoulis, A., Systems and Transforms with Applications in Optics, McGraw-Hill, New York 1968. Paul, H., Introduction to Quantum Optics, Cambridge University Press, Cambridge, 2004. Pearson, J. M., A Theory of Waves, Allyn and Bacon, Boston 1966. Pedrotti, F. L., Pedrotti, L. S. und Pedrotti, L. M., Introduction to Optics, Pearson/Prentice Hall, Upper Saddle River, N.J., 2007. Personick, S. D., Optical Fiber Transmission Systems, Plenum Press, New York 1981. Planck, M. und Masius, M., The Theory of Heat Radiation, Blakiston, Philadelphia 1914. Preston, K., Coherent Optical Computers, McGraw-Hill, New York 1972. Reynolds, G., DeVelis, J. und Thompson, B., The New Physical Optics Notebook: Tutorials in Fourier Optics, SPIE and AIP, New York, 1989. Robertson, E. R. und Harvey, J. M. (Hrsg.), The Engineering Uses of Holography, Cambridge University Press, London 1970. Robertson, J. K., Introduction to Optics Geometrical and Physical, Van Nostrand, Princeton, N. J., 1957. Ronchi, V., The Nature of Light, Harvard University Press, Cambridge, MA, 1971. Rossi, B., Optics, Addison-Wesley, Reading, MA, 1957. Ruechard, E., Light Visible and Invisible, University of Michigan Press, Ann Arbor, MI, 1958. Safford jr., E. L. und McCann, J. A., Fiberoptics and Lasers, TAB Books, Blue Ridge Summit, PA, 1988. Saleh, B. E. A. und Teich, M. C., Fundamentals of Photonics, Wiley, New York 1991. Sandbakn, C. P., Optical Fibre Communication Systems, Wiley, New York 1980. Sanders, J. H., The Velocity of Light, Pergamon, Oxford 1965. Sargent, M., Scully, M. und Lamb, W., Laser Physics, Addison-Wesley, Reading, MA, 1974. Schawlow, A. L., Lasers and Light: Readings from Scientific American, Freeman, San Francisco 1969. Schrödinger, E. C., Science Theory and Man, Dover Publications, New York 1957. Schroeder, D. J., Astronomical Optics, Academic Press, New York 1987. Sears, F. W., Optics, Addison-Wesley, Reading, MA, 1949. Shamos, M. H. (Hrsg.), Great Experiments in Physics, Holt, New York 1959. Shannon, R. R., The Art and Science of Optical Design, Cambridge University Press, Cambridge, 1997. Shurcliff, W. A., Polarized Light: Production and Use, Harvard University Press, Cambridge, MA, 1962. Shurcliff, W. A. und Ballard, S. S., Polarized Light, Van Nostrand, Princeton, N. J., 1964.

Literatur

1341

Silvast, W. T., Laser Fundamentals, Cambridge University Press, Cambridge 1996. Silverman, M. P., Waves and Grains, Princeton University Press, Princeton, New Jersey, 1998. Simmons, J. und Guttmann, M., States, Waves and Photons: A Modern Introduction to Light, Addison-Wesley, Reading, MA, 1970. Sinclair, D. C. und Bell, D. E., Gas Laser Technology, Holt, Rinehart and Winston, New York 1969. Slayter, E. M., Optical Methods in Biology, Wiley, New York 1970. Smith, F. G. und King, T. A., Optics and Photonics: An Introduction, Wiley, New York, 2000. Smith, F. und Thomson, J., Optics, Wiley, New York 1971. Smith, G. und Atchison, D. A., The Eye and Visual Optical.Instruments, Cambridge University Press, Cambridge 1997. Smith, H. M., Principles of Holography, Wiley, New York 1969. Smith, W. J., Modern Optical Engineering (2. Aufl.), McGraw-Hill, New York 1990. Société Française de Physique (Hrsg.), Polarization, Matter and Radiation. Jubilee Volume in Honor of Alfred Kastler, Presses Universitaires de France, Paris 1969. Sommerfeld, A., Optics, Academic Press, New York 1964. Southall, J. P. C., Mirrors, Prisms and Lenses, Macmillan, New York 1933. Southall, J. P.C., Introduction to Physiological Optics, Dover Publications, New York 1937. Stark, H., Applications of Optical Fourier Transforms, Academic Press, New York 1982. Steward, E., Fourier Optics: An Introduction (2. Aufl.), Wiley, New York 1987. Stone, J. M., Radiation and Optics, McGraw-Hill, New York 1963. Stroke, G. W., An Introduction to Coherent Optics and Holography, Academic Press, New York 1969. Strong, J., Concepts of Classical Optics, Freeman, San Francisco 1958. Suiter, H. R., Star Testing Astronomical Telescopes, Willmann-Bell, Richmond, Virginia, 1999. Svelto, O., Principles of Lasers, Plenum Press, New York 1977. Symon, K. R., Mechanics, Addison-Wesley, Reading, MA, 1960. Tarasov, L., Laser Age in Optics, Verlag Mir, Moskau 1981. Tolansky, S., An Introduction to Interferometry, Longmans Green, London 1955. Tolansky, S., Multiple-Beam Interferometry of Surfaces and Films, Oxford University Press, London 1948. Tolansky, S., Curiosities of Light Rays and Light Waves, American Elsevier, New York 1965. Tolansky, S., Revolution in Optics, Penguin Books, Baltimore 1968. Towne, D. H., Wave Phenomena, Addison-Wesley, Reading, MA, 1967. Troup, G., Optical Coherence Theory, Methuen, London 1967. Valasek, J., Optics, Theoretical and Experimental, Wiley, New York 1949. Van Albada, L. E. W., Graphical Design of Optical Systems, Sir Isaac Pitman & Sons, London 1955. Van Heel, A. C. S. (Hrsg.), Advanced Optical Techniques, American Elsevier, New York 1967. Van Heel, A. C. S., und Velzel, C. H. F., What Is Light?, McGraw-Hill, New York 1968. Van de Hulst, H. C., Light Scattering by Small Particles, Dover Publications, New York 1981. Vasicek, A., Optics of Thin Films, North-Holland, Amsterdam 1960. Wagner, A. F., Experimental Optics, Wiley, New York 1929. Waldron, R., Waves and Oscillations, Van Nostrand, Princeton, N. J., 1964.

1342

Literatur

Webb, R. H., Elementary Wave Optics, Academic Press, New York 1969. Williams, W. E., Applications of Interferometry, Methuen, London 1941. Williamson, S., und Cummins, H., Light and Color in Nature and Art, Wiley, New York 1983. Wilson, R. G., Fourier Series and Optical Transform Techniques in Contemporary Optics, Wiley, New York 1995. Wolf, E. (Hrsg.), Progress in Optics, North-Holland, Amsterdam. Wolf, H. F. (Hrsg.), Physical Optics, Dover Publications, New York 1934. Wood, R. W., Physical Optics, Dover Publications, New York 1934. Wright, D., The Measurement of Color, Van Nostrand, New York 1971. Yariv, A., Quantum Electronics, Wiley, New York 1967. Young, H. D., Fundamentals of Optics and Modern Physics, McGraw-Hill, New York 1968. Young, M., Optics and Lasers, Springer, Berlin 1986. Yu, F. T. S. und Yang, X., Introduction to Optical Engineering, Cambridge University Press, Cambridge, 1997. Zajonc, A., Catching the Light, Oxford University Press, New York 1993. Zimmer, H., Geometrical Optics, Springer, Berlin 1970.

Sachverzeichnis 21-cm-Mikrowellenemission, Absorptionsband, 155, 276 656 Absorptionsgrad, 836 21-cm-Strahlung, 160 Absorptionskoeffizient, siehe auch DämpfungskoeffiziAbbe, Ernst, 432, 1220 ent abbesche Zahl, 532 Absorptionskoeffizient Abbildung, siehe auch Bild (-vermögen), 1164 –, am Kugelspiegel, 373, 375 Absorptionslinien, 276 –, an dünnen Linsen, 329, Absorptionsquerschnitt, 145 340 Abtastung des Zentralflecks, Abbildungsfehler, siehe auch 841 Aberration Achromat, 428 –, Korrektur, 352, 517 –, aus getrennten Linsen, 537 Abbildungsvorgang –, Beispiele, 534 –, Spiegel, 360 –, zweilinsiger, 347 Aberration, 311, 505, 1103 –, zweiteiliger, 530 –, chromatische, 428, 506, achromatisch, 383 528 achromatisiert, 530 – –, Korrektur, 530, 538 –, Minimierung, 506 Achromatismus, 7 –, monochromatische, 506 adaptive Optik, 453 –, sphärische, siehe sphäriAderhaut, 411 sche Aberration afokal, 439 –, stellare, 11 Airy, Sir George Biddell, 12, –, von Linsen, Messung, 857 934 –, von Spiegeln, 523 Airy-Funktion, 833 abklingende Welle, 258 Airy-Muster, 516, 520, 934, Ablenkprisma, 377 1083, 1220 Ablenkung, minimale, 379 Airy-Scheibchen, 449, 455, Ablenkungswinkel, 377 509, 934, 1058 –, und Einfallswinkel, 379 Abschattung, siehe Vignettie- Airy-Verteilung, 348 Akkommodation, 413 rung Absorption, siehe auch Licht, aktives Medium, 1180 akustische Levitation, 569 Absorption –, induzierte, 1175 Alhazen von Kairo, 2, 410, 433 –, selektive, 275 https://doi.org/10.1515/9783111025599-018

Alkalimetalle, 264 –, Plasmafrequenz (Tabelle), 267 Aluminium, 264 Aminosäuren, 721 Ammoniumdihydrogenphosphat (ADP), 216, 729 Ampère, Andre Marie, 87 ampèresches Verkettungsgesetz, 87 –, Maxwells Formulierung, 91 ampèresche Verkettungsgesetz, 87 Amplitude, 29, 47, 234 –, komplexe, 558 AmplitudenReflexionskoeffizient, siehe auch Amplitudenkoeffizienten, 237, 238, 240, 693 –, Matrixschreibweise, 846 AmplitudenTransmissionskoeffizient, siehe auch Amplitudenkoeffizienten, 237 Amplitudenkoeffizienten, 238, 239, 279 –, Funktion des Einfallswinkels, 242 Amplitudenmodulation, 574, 945, 1229 Amplitudenobjekt, 1229 Amplitudenverwaschungsfunktion, 1059 Analysator, 658 Anamorphot, 422–424

Sachverzeichnis

1344 anamorphotisch, 423 Anastigmat, 525 Anfangsphase, 36 angeregter Zustand, 137 anharmonisch, siehe auch Welle anharmonische Welle, 584 Anisotropie, optische, 668 Anregung, 1173 –, eines Atoms, 139 Anti-Bunching, 124 Anti-Stokes-Linien, 1213 Antireflexbeschichtung, 809, 842, 848 Apertur, numerische, siehe numerische Apertur Aperturblende, 350, 425 –, hintere, 351 –, vordere, 351 Aplanat, 447 Apodisation, 1081 Äquivalentbrennweite, 484, 487 Arago, Dominique F. J., 9, 692, 714 Argand-Diagramm, 43, 46 Aristoteles, 433 Asphärengenerator, 310 asphärische Fläche, 306, 309, 365 astigmatische Differenz, 519 Astigmatismus, 422–424, 446 –, Abbildungsfehler, 506, 519 –, Messung, 857 –, und Bildfeldwölbung, 524 –, visueller, 417, 522 astronomische Interferometrie, 1149 Asymmetriefehler, siehe Koma atmosphärische Turbulenz, 454 Atom, Anregung, 1173 Atominterferometer, 817

Atompolarisation, 147 außer Phase, 646 Auflösungsgrenze, 939, 953 Auflösungskriterium –, nach Rayleigh, 839, 938 –, nach Sparrow, 941 Auflösungsvermögen, 433, 939, 953 –, chromatisches, 840 –, Teleskop, 445 Aufrichtesystem, 385, 386, 442 Auge, 408 –, als Lochkamera, 433 –, Empfindlichkeit, 411 –, Facettenauge, 408 –, Farbfehler, 530 –, menschliches, 409 –, normalsichtiges, 416 –, von Insekten, 408 Auge, menschliches, 929 –, Auflösungsvermögen, 941 Augenlinse, 428 Ausbreitungsfunktion, siehe Propagator Auslöschung, siehe Interferenz, destruktive Auslöschungsachse, 659 Auslöschungssatz, 196 Austrittspupille, 351, 425 Autokollimation, 952 Autokorrelation, 1088, 1089 –, physikalische Bedeutung, 1097 Babinet, Prinzip von, 1007 Bacon, Roger, 2 Bandbreite, 570 –, kleinste auflösbare, 841 –, Spektrallinien, 615 Bandfilter, 843 Bandlücke, 402 –, photonische, 403 Barkla, Charles Glover, 689 Bartholinus, Erasmus, 672 Basow, Nikolai G., 1163

Bauelemente, optische, 16 Belichtungszeit, 357 Bennett, W. R., 1195 beschichtete Systeme, siehe auch Mehrschichtsysteme –, charakteristische Matrix, 846 –, mathematische Behandlung, 843 beschleunigte Ladung –, elektrisches Feld, 130 –, Strahlung, 129 Besetzungsinversion, 1180 Besetzungszahlen von Energieniveaus, 1173 Besselfunktionen, 931, 1039, 1136 –, Tabelle, 932 Besselgleichung, 64 Besselstrahl, 944 Besselstrahl, Erzeugung, 943 Besselverfahren, 469 Bestrahlungsspektrum, 622 Bestrahlungsstärke, 109, 137, 283, 356 –, und Interferenz, 761 Bestrahlungsstärkemodulator, 733 Beteigeuze, Vermessung, 1148 Beth, Richard A., 656 Beugung, 5, siehe auch Fraunhoferbeugung, Fresnelbeugung, 304, 625 –, am Spalt, siehe Fraunhoferbeugung und Fresnelbeugung –, an komplementären Schirmen, 1007 –, und Interferenz, 882 –, von Materiewellen, 1006 beugungsbegrenzt, 304, 449 Beugungsgitter, siehe auch Gitter-, 623, 785, 945 –, dreidimensionales, 958 –, Hauptmaxima, 946

Sachverzeichnis –, Herstellung, 946 –, mit bevorzugter Reflexion, 950 –, zweidimensionales, regelmäßiges, 958 –, zweidimensionales, unregelmäßiges, 955 Beugungsmuster, 783, 874 Beugungsproblem, grafische Lösung, 966 Beugungstheorie, von Kirchhoff, 1009 Beugungswelle, 1014 Bild, siehe auch Abbildung –, aufrechtes (Linse), 328 –, Frequenzgehalt, 624 –, konjugiertes, 1240 –, reelles, 309 –, umgekehrtes (Linse), 328 –, wahres, 1240 Bildauswertung, computergestützte, 624 Bilddatenanalyse, 1099 Bildentstehung, 1219 –, Linse, 327 –, Matrixanalyse, 496 Bildfeld, geebnetes, 525 Bildfeldebnungslinse, 524 Bildfeldglättungslinse, 391 Bildfeldwölbung, 506, 523 –, Korrektur, 524 Bildleitkabel, 390 Bildorientierung (Linse), 336 Bildraum, 303 Bildspeicherröhre, 1100 Bildwahrnehmung, 413 Bildweite (Linse), 312 Biomoleküle, 721 Biot, Jean Baptiste, 714 Blaze-Winkel, 950 Blazed grating, siehe Beugungsgitter mit bevorzugter Reflexion Blazed-Gitter, siehe Beugungsgitter mit bevorzugter Reflexion

1345 Blende, 349 –, Objektiv, 358 Blendenöffnungsfunktion, 1040, 1077, 1079 Blendenzahl, 357, 432 blinder Fleck, 412 Bohr, Niels, 16 Bolometer, 163 Boltzmann, Ludwig, 1165 Boltzmann-Konstante, 1171 Born, Max, 283 Bose, Satyendra N., 115 Bose-Einstein-Kondensat, 629 Bose-Einstein-Statistik, 115, 117, 122 Bosonen, 117 braggsches Gesetz, 958 Brechkraft, 499, 502 –, Linse, 415, 482 –, Lupe, 427 Brechung, 41, 204, 279, 305 –, aus der Sicht des Elektromagnetismus, 231 –, negative, 156 –, Phänomenologie, 204 –, und Streuung, 181 Brechungsgesetz, 4, 222 –, elektromagnetische Formulierung, 233 –, 1. Teil, 206 Brechungsindex, 151, 196 –, als Funktion der Wellenlänge, 154 –, Anpassung, 1265 –, Bestimmung, 380, 817 –, Definition, 143 –, Frequenzabhängigkeit, 146, 377, 399, 506, 580 –, Glasfaser, 395, 399 –, Gradient (GRIN), 539 –, ≥ 1, 195 –, komplexer (von Metallen), 263, 267 –, relativer, 210 –, Tabelle, 195

–, und Doppelbrechung, 669, 679 –, und Plasmafrequenz, 267 –, von Gasen, 187 Brechungsmatrix, 491 Brechungswelle, 192 Breitwandfilm, 424 Bremsstrahlung, 168 Brennebene –, Linse, 323–324 –, Spiegel, 371 Brennglas, 305, 308, 324 Brennpunkt –, eines Strahlenbündels, 303 –, erster (Objektbrennpunkt), 314, 371 –, von Linsen, 308, 322 –, von Spiegeln, 371 –, zweiter (Bildbrennpunkt), 314, 371 Brennweite –, Abhängigkeit von der Blendenöffnung, 507 –, dicke Linse, 484 –, effektive, 347 –, erste (Objektbrennweite), 314 –, hintere, 346 –, Lupe, 427 –, vordere, 346 –, zweite (Bildbrennweite), 314 Brewster, Sir David, 722 Brewster-Fenster, 1197 brewsterscher Winkel, 690 brewstersches Gesetz, 691 Brille, 414 Brillouin-Streuung, 574, 1262 Bunsen, Robert Wilhelm, 16 Cäsiumuhr, 161 Camera obscura, 3, 773 Carotinoide, 275 Cassegrain-Teleskop, 446 chaotisches Licht, 120

Sachverzeichnis

1346 CHARA-Array, 1151 charakteristische Strahlung, 168 Chelat, 1205 Chininsulfat-periodat, 663 Chlorophyllfarbstoffe, 275 cholesterischer Kristall, 719 Cholesterylbenzoat, 731 Chopper, 363 CO2 -Laser, 163 comb-Funktion, 1046, 1048 Cornu, Marie Alfred, 991 Cornu-Spirale, 559, 991 –, für den Einzelspalt, 998 –, für halbunendlichen Schirm, 1004 –, für Prinzip von Babinet, 1008 –, für schmales Hindernis, 1005 –, für Zylinderwellenfront, 996 COSTAR, 512 Cotton-Mouton-Effekt, 726, 727 cw-Laser, siehe Laser, kontinuierlicher Dämpfungskoeffizient, 264 Dämpfungskoeffizient, 258 Datenübertragung, 393 Datenspeicher, optischer, 1255 Datenverarbeitung (Bilddaten), 1099 dc-Term, siehe Gleichlichtterm de Broglie, Louis, 113 Delta-Funktion, 1041 –, Siebungseigenschaft, 1042, 1058 –, Verschiebung, 1044 Deltafolge, 1043 Denisjuk, Jurij N., 1254 Descartes, René, 4

Dichroismus, 660 –, Mechanismus, 663 Dichte, optische, 187 Dichteschwankungen in Gasen, Messung, 820 dicke Linse, 481 –, Brennweite, 484, 499 –, Geometrie, 485 –, Hauptebenen, 481, 487 –, Hauptpunkt, 481 –, Kombinationen aus n, 488 –, Kombinationen aus 2, 487 dielektrische Schichten, 794 Dielektrizitätskonstante, 151 –, Bestimmung, 817 –, relative, 87 –, Vakuum, 86 Differentialgleichung einer Welle, 24 diffuse Reflexion, 202–204 Dioptrie, 415 Dioptrik, 365 Dipolmoment, 135, 147 Dipolstrahlung, siehe auch oszillierender Dipol, 186 Dirac, Paul A. M., 172, 1041 diracsche Delta-Funktion, siehe Delta-Funktion Dispersion, 143, 146, 377 –, anomale, 155 –, intermodale, 397 –, normale, 155 Dispersionsgleichung, 151, 153, 265 Dispersionsprisma, 151 Dispersionsrelation, 575 Divergenz eines Laserstrahls, 1195 Dollond, John, 534 Doppelbelichtungsmethode, 1257 Doppelbrechung, 7, 668, 672 –, zirkulare, 716 Doppelspalt, 771, 903 Doppelspaltexperiment, 773,

823, 947, 1085, 1117, 1118, 1131, 1138 –, Anordnung, 775 –, Fourier-Analyse, 786 –, Fourier=Transformation, 1080 Doppelspat, siehe Kalkspat Doppelsternsystem, optische Auflösung, 1082 Doppler-Verbreiterung, 615, 1087 Dopplerverbreiterung, 1184 Drehimpuls eines Photons, 656 Drehvermögen, 715 –, spezifisches, 718 Drude, Paul Karl Ludwig, 265 Dunkelfeld, 1235 Dunkelresonanz, 629 dünne Linse, 316 –, Gleichung, 317 –, im Bild der QED, 349 –, Kombinationen aus n, 343, 503 –, Kombinationen aus 2, 340 –, Matrixanalyse, 502 Durchbiegung, 483 Durchflutungsgesetz, 87 Durchlässigkeit, siehe Transmission Durchlassachse, 658 Durchlasskurve von Farbfiltern, 276 Durchlassmaximum, 837 Durchschnittsleistung, 1095 Durchstimmbarkeit, 1205 DWDM, 394 ebene Welle, siehe Welle, ebene Echtzeitmethode, 1258 EDFA, 394 Eichkräfte, 173 Eigenkohärenzfunktion, 1140, 1144

Sachverzeichnis Eigenwertgleichung, 505 einachsig –, negativ, 678 –, positiv, 679 Eindringtiefe, 258, 264 Einfallsebene, 202, 207 Einfallswinkel, 199 Einheitsebene, 486 Einstein, Albert, 13 Einstein-Koeffizienten, 1177 Einstein-Ring, 462 Eintrittspupille, 351 Einzelspalt, 898 elektrische Feldkonstante, Influenzkonstante, 86 elektrische Leitfähigkeit, siehe Leitfähigkeit elektrische Verschiebung, 676 elektrischer Fluss, 85 elektrisches Feld, 97, 130 –, Begriff, 170 –, Definition, 79 elektromagnetisch induzierte Transparenz, 629 elektromagnetische Strahlung –, Erzeugung, 159 –, Quelle, 129 elektromagnetische Welle, 77 –, Ausbreitungsrichtung, 98 –, Konzept, 14 –, Licht als, 78 elektromagnetisches Feld, 98 elektromagnetisches Spektrum, 128, 158 –, Übersicht, 159 Elektromagnetismus –, Gesetze, 231 –, Theorie, 78 elektromotorische Kraft, 81 Elektronen in Metallen, 265 Elektronenübergang, 139, 1210 Elektronenmikroskop, 940 Elektronenpolarisation, 147

1347 elektrooptische Konstante, 730 elektrooptischer Effekt, siehe auch Kerr-Effekt und Pockels-Effekt –, linearer, 728 –, quadratischer, 727 Elementarteilchen, 117 elliptische Linse, 308 Emission –, induzierte, 1173 –, spontane, 1173 Emissionsgrad, 1167 –, spektraler, 1164 –, Tabelle, 1167 Emissionskoeffizient, 1164 Emissionslebensdauer, 1087 Emissionsspektrum, 140 Emissionsvermögen, 111 emmetrop, 416 Enantiomer, 718 enantiomorph, 715 Endoskop, 391 Energiedichte, 104 Energieerhaltung, 259, 282 Energiefluss, 106 Energiequant, 113, 1170 entoptische Wahrnehmung, 411 Entzerrung von Wellenfronten, 452 –, mit adaptiver Optik, 457 –, mit Phasenkonjugation, 460 Erde, Vermessung, 859 Etalon, 834 Euklid, 1, 199, 365 Euler, Leonhard, 7 eulersche Gleichung, 44 ewald-oseenscher Auslöschungssatz, 196 Extinktionsfarbe, 664 extraordinärer (e-) Strahl, siehe Strahl, außerordentlicher

f -Zahl, siehe Linse, f -Zahl Fabry, Charles, 834 Fabry-Perot –, Etalon, 948, 1183 –, Filter, 851 –, Interferenzmuster, 837 –, Interferometer, 834, 954 – –, mit Kugelspiegel, 842 –, Resonator, 851, 1268 –, Spektroskopie, 838 Faltung von Funktionen, 1060 Faltung, in zwei Dimensionen, 1073 Faltung, zweier Rechteckpulse, 1064, 1073 Faltungsintegral, 1060 Faltungsprozess, 1063 Faltungssatz, 1072 Faltungssatz, Frequenz-, 1074 Faraday, Michael, 79, 724 Faraday-Effekt, 724 –, Anwendung, 724, 725 –, theoretische Behandlung, 725 faradaysches Induktionsgesetz, 79 Farbdruck, 277 Farbe, 271 –, an Prismen, 379 –, durch Beugung, 278 –, durch Interferenz, 278 –, durch Streuung, 184 –, in der Natur, 275, 277 –, komplementäre, 714 –, Sättigung, 274 Farbeindruck, subjektiver, 271 Farbempfindung, siehe auch Weiß, Grau, Schwarz, 166, 270 Farbfehler, 6, siehe auch Aberration, chromatische, 428 Farbfernsehen, 271

1348 Farbfilter, 276 Farbfotografie, 277 Farbmischung, 271 –, additive, 271, 276 –, subtraktive, 276, 277 Farbortsfehler (Farblängsfehler), 529 Farbpigmente, 272 Farbquerfehler, 530 Farbstoffe, organische, 275 Faseroptik, 17, 388 Faserverstärker, erbiumdotierter, 394 Fata Morgana, 224 Fehldurchlässigkeit, 665 Fehlsichtigkeit, 417 Feldamplitude, 780, 894 Feldblende, 350 Feldlinse, 428 Feldstärke, magnetische, 1283 fermatsches Prinzip, 222, 347 –, klassische Formulierung, 222 –, moderne Formulierung, 227 Fermi-Dirac-Statistik, 117 Fermionen, 117 Fernfeld, 766 Fernfeldbeugung, siehe Fraunhoferbeugung Fernglas, 442 –, Kennzeichnung, 443 Fernpunkt (Auge), 417 Fernrohr, 4, 6, siehe auch Teleskop, 358, 428 –, afokales, 439 –, astronomisches, 438 –, Auflösungsvermögen, 940 –, Erd-, 442 –, galileisches, 444 –, keplersches, 438 –, Linsen- (Refraktor), 438 Fernsehkanal, Bandbreite, 618

Sachverzeichnis Fourier-Transformation Feynman, Richard P., 172, 284 –, numerische (diskrete), 620 Filterung, räumliche, 16, –, und Fraunhofer-Beugung, 1222 1077 Finesse, 838, 841, 954 –, und Linsen, 1040 Finessefaktor, 832 Fourier-Transformierte, 1035 Fizeau, Armand Hippolyte, –, Definition, 1031 10 –, der Dreiecksfunktion, 1040 Fizeau-Streifen, 803, 809, –, der Gaußfunktion, 1034 816 –, der Zylinderfunktion, 1037 Flintglas, 534 –, des gaußschen WellenpaFluoreszenz, 569, 1210 kets, 1075 Flussdichte, 111 –, eindimensionale, 1030 –, spektrale, 1164 –, inverse, 1031 –, Verteilung, 833 –, komplexe, 1047 Flüssigkeitsspiegels, 446 –, zweidimensionale, 1035 Flüssigkristall, 719, 731 fraktionale BrechungsindexFlüssigkristallanzeige, 733 differenz, 396 Flüssigkristallzelle als PolaFraunhofer, Joseph, 16, 945 risationsrotator, 732 Fraunhofer-Beugungsmuster, Fontana, Francisco, 4 Fortpflanzungsgeschwindigkeit 1216 Fraunhoferbedingung, 888 einer Welle, 31 Fotoapparat, siehe KameFraunhoferbeugung, 625, ra, Spiegelreflexkamera, 879, 887, 900 Lochkamera –, am Doppelspalt, 903 Fotografie, 119, 357, 433 – –, Beobachtung, 908 –, Objektive, 435–436 – –, Bestrahlungsstärke, 907 Foucault, Jean Bernard Leon, – –, Beugungsmuster, 905 10 –, am Einzelspalt, 887 Fourier, Jean Baptiste Joseph – –, Beobachtung, 902 Baron de, 588 – –, Bestrahlungsstärke, 890 Fourier-Analyse, 16, 102, – –, Beugungsmuster, 905 584, 592, 1010, 1214 – –, und Fourier–, Interferenz, 786 Transformation, 1079 Fourier-Hologramm, 1251 –, am Mehrspaltsystem, 909 Fourier-Integrale, 606 – –, Bestrahlungsstärke, 919 Fourier– –, Beugungsmuster, 922 Kosinustransformierte, – –, Hauptmaxima, 919 609 – –, Nebenmaxima, 920 Fourier-Reihe, 588 –, am schmalen rechteckigen –, für Rechteckwelle, 596 Loch, 889 –, Verallgemeinerung, 606 Fourier-Sinustransformierte, –, Amplitudenverteilung, 1084 609 Fourier-Theorem, 588 –, an beliebiger Öffnung, 924

Sachverzeichnis –, an drei Spalten – –, und FourierTransformation, 1082 –, an kreisrunder Öffnung, 929 – –, Bestrahlungsstärke, 934 –, an quadratischer Öffnung, 926 – –, Bestrahlungsstärke, 927 –, an rechteckiger Öffnung, 924 –, Kriterium für, 881, 887 –, und FourierTransformation, 1077 Fraunhoferhologramm, 1250 fraunhofersche Linien (Tabelle), 534 Freie-Elektronen-Laser, 129 freier Durchmesser, 350 freier Spektralbereich, 841, 1186 Frequenz, 30 Frequenzbandbreite, 614, 1117 –, einer Spektrallinie, 615, 1087 Frequenzfaltungssatz, 1074 Frequenzfilterung, 623 Frequenzkamm, 604 Frequenzmischung, 17, 1268 Frequenzspektrum, 585 Frequenzspektrum periodischer Funktionen, 1048 Frequenzstabilität, 617 Frequenzunterschiede, Nachweis, 574 Frequenzverdoppler, 216 Frequenzverteilung und Farbempfindung, 271 Fresnel, Augustin Jean, 8 Fresnel-Arago-Gesetze, 771, 772 –, experimentelle Prüfung, 817 Fresnel-Huygens-Prinzip,

1349 874, 966, 1009, 1013, 1014 fresnel-kirchhoffsche Beugungsformel, 1012 Fresnelbeugung, 625, 879, 960 –, am Einzelspalt, 997 – –, Beobachtung, 1000 –, am halbunendlichen Schirm, 1002 – –, Beobachtung, 1003 –, am kreisrunden Hindernis, 978 –, am schmalen Hindernis, 1005 –, an kreisrunder Öffnung, 968 –, an quadratischer Öffnung, 991 –, an rechteckiger Öffnung, 986 – –, Bestrahlungsstärke, 989 –, an regelmäßig angeodneten schmalen Hindernissen, 1009 –, von ebenen Wellen, 977 Fresnelhologramm, 1250 Fresnelhologramm, Nebenband-, 1240 fresnelsche Gleichungen, 237, 238, 693 fresnelsche Integrale, 987 –, geometrische Darstellung, 991 –, Tabelle, 988 Fresnelsche Zonenplatte, siehe Zonenplatte fresnelscher Spiegel, 789 fresnelsches Doppelprisma (Biprisma), 790 fresnelsches Rhomboeder, 707

Fresnelzonen, 962 –, an kreisrunder Öffnung, 971 –, auf Zylinderwellenfront, 995 Fried-Parameter, 455 FTIR, siehe Totalreflexion, gestörte (frustrierte) Funktional, 1043 Gütefaktor, 1190 Güteschalten, 1191 Güteschalter, 728, 730 Gabor, Dennis, 1238 Galilei, Galileo, 4, 438 Galliumarsenid-Laser, 1203 Gammastrahlung, 170 Gauß, K. F., 84, 313 Gaußfunktion, 22, 616 –, Fourier-Transformierte, 1034 gaußsche Linsenformel, 320, 328, 361 gaußsche Optik, 313, 506 gaußscher Bildpunkt, 1059 gaußscher Satz –, für das elektrische Feld, 84, 86 –, für das Magnetfeld, 87 gaußscher Strahl, 1192 gelber Fleck, 412 geometrische Optik, 77, 304 geometrische Welle, 1015 gequetschtes Licht, 122 Geschwindigkeit > c, 626 Geschwindigkeitsmessung, 574 Gespensterfeld, 283 Gitter, siehe Beugungsgitter Gittergleichung, 946 Gitterkonstante, 958 Gitterspektroskopie, 951 Gitterspektrum, 951 Glan-Focault-Polarisator, 684 Glan-Thompson-Polarisator, 684

Sachverzeichnis

1350 Glanz, 271 –, von Metallen, 264 Glas –, abbesche Zahl, 533 –, Brechungsindex, 533 Glas, optisches, 535 Glasfaser, 386 –, Aufbau, 388 –, Brechungsindex, 395, 399 –, Gradientenprofilfaser, 399, 400 –, konische, 391 –, Multimode-Faser, 395 –, Reflexion und Wellenleitung, 386 –, Singlemode-Faser, 400 –, Stufenindexfaser, 395, 400 –, Übertragungskapazität, 393 Glasfaserkabel, transatlantisches, 393 Glaskörper, 411 Glassorten, 533 –, Tabelle, 535 Gleichlichtterm, 1096, 1101 Gleichrichter, optischer, 1264 Glimmer, 701 Glucose, 721 Gold, 266, 267, 269, 274, 275 Goos-HänchenVerschiebung, 260 Gradient-Index-System, siehe GRIN-System Gradientenkonstante, 540 Gradientenoptik, siehe GRIN-System Grau (Farbempfindung), 271 Gravitationslinsen, 461 greenscher Satz, 1287 Gregory, James, 445 Gregory-Teleskop, 446 Grenzwinkel –, der Reflexion, 242 –, der Totalreflexion, 253 – –, Tabelle, 255

Hauptpunkte, 500 Hauptschnitt, 673 Hauptspannungsdifferenz, 723 Hauptstrahl, 352 Heisenberg, Werner, 172 Helium-Neon-Laser, 1195 –, Energieniveaus, 1196 Helmholtz-Gleichung, 1010, 1287 Herapathit, 663 Hero von Alexandrien, 1, 222 Hertz, Heinrich, 158 Heterostruktur, 1204 Himmel, Farbe, 183, 184, 186, 191, 274, 686 H-Folie, 664 Himmelskörper, Vermessung, Hörsystem, menschliches, 1146 597 Himmelslicht, Polarisation, Haidinger, Wilhelm Karl, 801 689 Haidinger-Ringe, 801, 809, hintere Brennebene, 324 816 Hintergrundwelle, siehe Rehalbdurchlässiger Spiegel, ferenzwelle 794 HN-Folie, 665 Halbebenenproblem, 1016 Hochatmosphäre, 267 Halbperiodenzone, siehe Hochpassfilter, 850 Fresnelzone Hohlraum, siehe auch optiHall, Chester Moor, 534 scher Resonator Hamilton, Sir. W.R., 574 –, konfokaler, 505 Hamilton, William Rowan, –, stabiler, 505 230 Hohlraumstrahlung, 113, hamiltonsches Prinzip, 230 115, 1165 Hanbury-Brown, R., 1152 Holografie, 1183, 1238 Harmonische, 17, 216, 600 –, akustische, 1259 –, dritte, 1264 –, linsenfreie, 1253 –, zweite, 1264 –, Weißlicht-Reflexions-, harmonische Welle, siehe 1256 Welle, harmonische holografische InterferomeHarriott, D. R., 1195 trie, 1257 Harrison-Gitter, 953 holografisches optisches EleHauptdurchlässigkeit, 665 ment, 1260 Hauptebene, 515 Hologramm, 1239 –, dünne Linse, 326 –, als Linse, 1261 –, eines Kristalls, 673 –, Fourier-, 1251 Haupteinfallswinkel, 269 –, Fresnel- oder Fraunhofer-, Hauptmaximum, 899 1250 Grimaldi, Francesco Maria, 5, 873 GRIN-Element, radiales, 539 GRIN-Stab, 540, 541 GRIN-System, 538 Grube (IR-Detektor), 408 Grundfarben, 271 Grundschwingung, 600 Grundzustand, 138 Gruppenbrechungsindex, 580 Gruppengeschwindigkeit, 574, 631 –, größer als c, 627 Gruppengeschwindigkeit, –, von Wellenpaketen, 577

Sachverzeichnis –, Parallaxeneffekte, 1247 –, Rekonstruktion, 1239 –, Volumen-, 1254 –, wölbungsverkehrtes, 1247 Holographie, 17 Homostruktur, 1203 Hooke, Robert, 5, 806 Hornhaut (Auge), 410 Hornstrahler, 368 HR-Folie, 665 Hubble-Weltraumteleskop, 367, 447–449, 511–513, 1149 –, Korrektur, 512 Huygens, Christiaan, 218 Huygenssches Prinzip, siehe auch Fresnel-HuygensPrinzip huygenssches Prinzip, 218, 874 –, und Interferenz, 219 Hydrodynamik, 1237 hyperbolische Linse, 308, 309 Hyperopie, siehe Weitsichtigkeit, 421 Hypersthen, 662 Idlerlicht, 1268 Immersionsobjektiv, 432, 510, 511 Impulsverhalten, 1056 in Phase, 644 Induktion, elektromagnetische, 79 Induktionsgesetz, 83 Induktionsgesetz, faradaysches, 79 Infrarotmodulator, 726 Infrarotstrahlung, 162 –, Ausfilterung, 843 inkohärentes Licht, 1117, 1141 Intensität, siehe Bestrahlungsstärke

1351 Interferenz, 281, 759 –, an dielektrischen Schichten, 794 –, an keilförmiger Schicht, 803, 825 –, Begriff, 874 –, bei endlicher Kohärenzlänge, 784 –, destruktive, 185, 554 –, in weißem Licht, 767 –, konstruktive, 185, 554 –, Mehrstrahlinterferenz, 826 –, und Aberrationen, 516 –, und Beugung, 876, 882 –, vollständig destruktive, 764 –, vollständig konstruktive, 763 –, von Elektronen, 819 –, von polarisiertem Licht, 771 –, von Streulicht, 852 –, von thermischem Licht, 556 –, von weißem Licht, 785 –, Zweistrahlinterferenz, 794 Interferenzbedingungen, 767 Interferenzen –, gleicher Dicke, 802 –, gleicher Neigung, 795, 816, 824 Interferenzfarben, 713 Interferenzfilter, 851 Interferenzgesetz für teilkohärentes Licht, 1141 Interferenzmuster –, quantitative Beschreibung, 1129 –, und Kohärenz, 1119 Interferenzprinzip, 8 Interferenzspektroskopie, 838 Interferenzstreifen, 765 –, lokalisierte, 816, 823 –, nicht lokalisierte, 823

–, reelle, 821, 823 –, virtuelle, 823 Interferenzterm, 552, 762 Interferogramm, 820 Interferometer, siehe auch Michelson-Interferometer, Stellarinterferometer, Korrelationsinterferometer, 377, 760 –, mit Amplitudenaufspaltung, 794 –, mit Wellenfrontaufspaltung, 772 – –, Selbstaufbau, 793 –, Radio-, 885 –, Spiegel-, 811 Interferometrie, 1183 –, Anwendungen, 852 –, astronomische, 1149 –, holografische, 1257 intermodale Dispersion, 397 Invarianz gegenüber der Zeitumkehr, 279 Inversion (Spiegel), 362 Inversionszentrum, 1264 Ionenpolarisation, 147 Ionosphäre, 167 Iris, siehe Regenbogenhaut isochromes Gebiet, 723 Isoklinenband, 723 Isomere, optische, 719 isoplanatisches Gebiet, 455 Isotopenstrahler, 619 Janssen, Zacharias, 437 Javan, Ali, 1195 Jeans, Sir James, 1169 Jones, R. Clark, 739 Jones-Matrizen, 742 Jones-Vektor, 738, 739 K-Folie, 665 Kaliumdihydrogenphosphat (KDP), 216, 729 Kaliumtantalniobat, 728

Sachverzeichnis

1352 Kalkspat, 7, 670 –, Atomgitter, 670 –, optische Achse, 672 Kaltlichtspiegel, 843 Kamera, siehe auch Fotographie, Lochkamera, Spiegelreflexkamera, 350, 357, 929 –, Objektive, 435–437 – –, Kennzeichnung, 357 Kammerwasser, 410 Kapillaroptik, 406 Kardinalpunkte, 482 katadioptrisches System, 450 Katoptrik, 365 Katoptrik, von Euklid, 199 Kaustik, 508 Keller, Joseph B., 1016 Kepler, Johannes, 4, 433 Kepler-Fernrohr, 438 Kerr, John, 727 Kerr-Effekt, 727, 1262 Kerr-Konstante, 727 Kerr-Zelle, 727 Kettler, Friedrich, 1016 Kirchhoff, Gustav R., 16, 876, 1164 kirchhoffsche Beugungstheorie, 1010 kirchhoffsche Theorie, 877 kirchhoffscher Integralsatz, 1010, 1288 –, für ungestörte Kugelwelle, 1010 kirchhoffscher Strahlungssatz, 1165 Kissenverzeichnung, 527 Kleinsignalverstärkung, 1190 Knotenpunkt, 482 kohärent, 120, 122 kohärente Wellen, 553 kohärentes Licht, 120, 768, 1117, 1141 Kohärenz, 768 –, räumliche, 770, 1118, 1121

–, räumliche Longitudinal-, 1121 –, räumliche Transversal-, 1121 –, teilweise, 1117 –, thermisches Licht, 770 –, und Interferenzmuster, 1119 –, und Polarisation, 712 –, zeitliche, 768, 1118, 1121 Kohärenzfläche, 1149 Kohärenzfunktion –, Eigen-, 1140 –, wechselseitige, 1140 Kohärenzgrad, 618, 1141 –, komplexer, 1141 –, komplexer räumlicher, 1144 –, komplexer zeitlicher, 1143 –, und Sichtbarkeit, 1142 Kohärenzlänge, 769, 794, 1265 –, endliche, 784 –, Laser, 769 Kohärenztheorie, 1117 Kohärenzzeit, 570, 615, 711, 1118 Kohärenz, 1121 Kohärenzfläche, 1125 Kohärenzlänge, 817 Kohlendioxidlaser, 1202 Kohlenwasserstoffe, Analyse, 725 Kohlrausch, Rudolph, 99 kollimiertes Licht, 325 Koma, 446, 506, 515, 1103 –, Abwesenheit, 519 –, Korrektur, 516–518 –, meridionale, 516 –, Messung, 857 –, sagittale, 516 Komafigur, 515 Kompensator, 708 –, Babinet-, 708 –, Soleil-, 709 Kompensatorplatte, 811

komplementäre Schirme, 1007 Komplementärfarben, 273, 714 komplexe Zahlen, 43 –, polare Schreibweise, 45 –, Rechenregeln, 44 konjugiert Komplexes, 44 konjugierte Punkte, 212, 303, 304 –, Spiegel, 370 konjugiertes System, 275 konkav, 308 Kontinuität der Wellenfront, 216 Kontrast, siehe Modulation Kontrastverbesserung, 849 konvex, 308 Konzentrationsmessung in Lösungen, 718 Korona, 957 Korrelationsinterferometer, 1152 Korrelogramm, 1097 korrespondierende Punkte, 221 Kosinus-Wellenzug, FourierTransformation, 611 Kosinusgitter, Hologramm, 1243 Kosinustransformierte, 1030, 1046 kosmische Hintergrundstrahlung, 1171 Krebsnebel, 134 Kreisfrequenz, mittlere, 571 Kreiswelle, 40 Kreuzkorrelation, 863, 1088, 1090, 1139 –, physikalische Bedeutung, 1097 Kristalllinse, 410 Kristallsymmetrie, 671 Kronglas, 534 Kryolith, 847 Krypton-Linie, 164

Sachverzeichnis –, Gaslaser, 1201 –, Halbleiterlaser, 1202 –, He-Ne-Laser, 1195 –, Impulslaser, 1199 –, Kohärenz, 769 –, Kohärenzzeit, 619 –, Kohlendioxid-, 163 –, kontinuierlicher, 1195 –, Lichtverstärkung im, 1172 –, Moden, 1188 λ-Plättchen, 699 –, Reihenschaltung, 1199 λ/2-Plättchen, 700 –, Resonator, 834, 842 –, Selbstbau, 702 –, Rubinlaser, 1180 λ/4-Doppelschichtbelag, 849 –, Strahlquerschnitte, 1189 λ/4-Plättchen, 702 –, transversale Moden, siehe –, Selbstbau, 703 TEM-Moden λ/4-Schichten Laserinterferometer, 809 –, Satz von, 849 Laserkühlung, 629 λ/n-Plättchen Laserlicht, 1144 –, jonessche und MuellerLaserstrahl, 1034 Matrizen, 743 –, öffnungsbegrenzter, 1195 Längenmessung –, Divergenz, 1195 –, mit Interferometer, 816 –, gaußscher, 1192 Längsvergrößerung, 335, 336 –, Halbwertsbreite, 1192 Labeyrie, A. E., 1256 Lagrange, Joseph Louis, 230 Laserstrahlung –, Leistung, 1206 Land, Edwin H., 663 –, Modenkopplung, 1207 langsame Achse, 700 –, Parallelität, 1183, 1206 Laplace-Operator –, räumliche Kohärenz, 1206 –, kartesische Koordinaten, –, zeitliche Kohärenz, 1206 58 Laue, Max v., 958 –, Polarkoordinaten, 59 Laue-Muster, 960 –, Zylinderkoordinaten, 63 LC, siehe Flüssigkristall, 731 Laser, 17, 1163, 1180 LCD, 733–735 –, Bandbreite, 619 Lebensdauer, des angeregten –, chemischer, 1205 Zustands, 1176 –, Diodenlaser, 1202 Lederhaut, 410 –, Dreiniveau-, 1183 Leistung, optische, 118 –, Durchstimmen, 1205 Leistungsfähigkeit optischer –, Einmodenbetrieb, 1187 Systeme, 1101 –, Farbstofflaser, 1205 Leistungsspektrum, 613, 617, –, Festkörperlaser, 1198 621, 1086, 1144 –, Flüssigkeitslaser, 1205 –, und Bild, 623 –, Freie-Elektronen-Laser, Leitfähigkeit, 263, 268 1206 –, Funktionsweise, 1179 Leitungsband, 403

Kugel-, siehe auch sphärisch Kugelwelle, 60, 960 –, als ebene Welle, 62 –, Beugung, 968 –, harmonische, 61 –, Wellengleichung, 61 Kupfer, 264, 266, 274 Kurzsichtigkeit, 417–420 Kurzzeitspektroskopie, 1207

1353 Leuchtdiode (LED), 399, 1202 Licht –, Absorption, 16, 138, 145 –, als elektromagnetische Welle, 100 –, Ausbreitung, 9, 222 – –, in dichten Medien, 189 – –, in Gasen, 186 – –, Vorwärtsrichtung, 186– 187, 190, 281 –, chaotisches, 120 –, elliptisch polarisiertes, 651 –, Emission, 16, 138 –, infrarotes, 162 –, inkohärentes, siehe inkohärentes Licht –, kohärentes, siehe kohärentes Licht, 120 –, kollimiertes, 325 –, linear polarisiertes, 644 –, monochromatisches, 711 –, natürliches, 654 –, polychromatisches, 711 –, pseudothermisches, 1156 –, sichtbares, 164 –, skalare Theorie, 550 –, teilweise polarisiertes, 655 –, thermisches, 1151 –, ultraviolettes, 167 –, unpolarisiertes, 654 –, weißes, 165, 618 –, Welleneigenschaften, 196 –, Wellentheorie, 281 –, zirkular polarisiertes, 648 –, zufällig polarisiertes, 654 Lichtäther, 11, 13 Lichtfeld, 185, 283, 569 Lichtgeschwindigkeit, 7, 10, 192, 626 –, Betrag, 100 –, kleiner als c, 628 –, Messung, 728 Lichtgeschwindigkeit, –, größer als c, 626

Sachverzeichnis

1354 Lichtintensität, siehe Bestrahlungsstärke Lichtleiter, 388 –, flexibler, 390 Lichtleitkabel, 390 Lichtmenge, 109 Lichtmodulation, 570 Lichtmodulator, 730 Lichtrezeptor, 411 Lichtschwebung, 574 Lichtstärke, 357, 389 –, Teleskop, 445 Lichtstrahl und Wellenfront, 201, 220–221 linear polarisierte Welle, 101 lineares System, 1056 Linienabbildung, primäre und sekundäre, 520, 521 Linienbreite –, einer Spektrallinie, 951 –, instrumentelle, 951 –, natürliche, 615, 1087 Liniengitter, 954 Linienpaare pro Millimeter, 1100 Linienquelle, kohärente, 887 –, Intensität, 888 Linienverwaschungsfunktion, 1061, 1100 linksdrehend, 715 linkshändiges Material, 157 linkszirkulares Licht, 650 Linse, 305 –, Abbildungen (Tabelle), 329 –, als Fourier-Transformator, 1040 –, als Hologramm, 1261 –, asphärische, 306 –, Bildorientierung, 336 –, Brennebene, 323–324 –, Brennpunkte, 322, 481 –, Brennweite, 322, 481 –, dünne, siehe dünne Linse –, dicke, siehe dicke Linse, 316

–, Durchbiegung, 483 –, elliptische, 308 –, f -Zahl, 935 –, für Mikrowellen, 316 –, freier Durchmesser, 350 –, GRIN-System als, 539 –, Herstellung, 809 –, hyperbolische, 308, 309 –, invers transformierende, 1222 –, konkave, siehe Zerstreuungslinse –, konvexe, siehe Sammellinse –, Matrixanalyse, 490, 502 –, menschliches Auge, 410 –, sphärische, 311, 317, 319 –, sphärozylindrische, 423 –, torische, 423 –, Vergleich mit Spiegel, 374 –, Vorzeichenkonvention, 313, 329 –, zylindrische, 423 Linsen-Röhren-System, 1100 Linsenfernrohr, 4 Linsenformel, gaußsche, 320, 328 Linsenschleiferformel, 320 Linsensystem, 937 –, Bildentstehung, 1057 Linsenteleskop, 445 Lippershey, Hans, 4, 437 Lippmann, Gabriel, 1254 Littrow-Anordnung, 952, 953 lloydscher Spiegel, 791 Lochkamera –, als Auge, 433 –, linsenlose, 433 löchrige Faser, 402 longitudinal, siehe Welle, longitudinale longitudinal coherence, 1118 Longitudinalaberration, 507 Lorentz, Hendrik A., 12, 265 Lorentz-Verbreiterung, 1087 Lorentzprofil, 1086

Lupe, 424 –, einlinsige, 427 –, zweilinsige, 427 Mach-ZehnderInterferometer, 819, 825 Maggi, Gian Antonio, 1015 Magnesiumfluorid, 847 Magnetfeld, 97 Magnetfeld, –, Definition, 79 magnetische Flussdichte, 81 magnetische Induktion, 79 magnetische Kompression, 820 magnetischer Fluss, 81 Magnetisierung, 1283 magnetooptischer Effekt, siehe Faraday-Effekt Malus und Dupin, Satz von, 221 Malus, Étienne, 9, 658, 689 malussches Gesetz, 658 Maraldi, 979 Maser, 1163 Matrixanalyse –, von Linsen, 490 –, von Spiegeln, 503 Matrixmethode, Beispiel, 501 Maxwell, James Clerk, 10, 91, 125 Maxwell-BoltzmannStatistik, 117 Maxwell-BoltzmannVerteilung, 1169, 1172 Maxwellsche Gleichungen, 10 maxwellsche Gleichungen, 78, 92, 100, 263, 282, 1281 maxwellsche Theorie des Elektromagnetismus, 206 Meay, Eugen, 1016 Mehrschichtsysteme, periodische, 849 Mehrspaltsystem, 909 Meniskus, 415

Sachverzeichnis Meridionalebene, 519, 520 Meridionalstrahl, 387, 488 Messenger-Boson, 172 Metalle –, Durchsichtigkeit, 264 –, Farbe, 264, 266 –, Glanz, 264 –, optische Eigenschaften, 251, 263 –, Reflexion, 268 Metamaterial, 156 metastabiler Zustand (Laser), 1182 Michelson, A. A., 12, 580, 1146 Michelson-Interferometer, 811, 823, 825, 856, 1144 –, Aufbau, 812 –, für Mikrowellen, 817 –, Strahlenverlauf, 813 –, zur Längenmessung, 816 Michelson-MorleyExperiment, 13 Mie, Gustav, 191 Mie-Streuung, 191 Mikroskop, 4, 428, 430, 929, 1221 –, Aufbau, 431 –, Phasenkontrast-, 1229 Mikroskopie, 1235 mikrostrukurierte Faser, 402 Mikrowellen, 160, 316 Mikrowellen-Interferometer, 786 Milch (Farbe), 190, 191 Mittelwert harmonischer Funktionen, 108 Miyamoto, Kenro, 1016 Modelocking, siehe Laserstrahlung, Modenkopplung Modulation, 1101, 1129 Modulationseinhüllende, 575 Modulationsfrequenz, 571 Modulationswellenzahl, 571 Modulator, optischer, 727 MOEMS, 363, 406

1355 Mondstein, 191 monochromatisch, 33 Monopol, magnetischer, 88 mooneysches Rhomboeder, 707 Morley, Edward Williams, 13 Mosaik, faseroptisches, 391 MTF, siehe Übertragungsfunktionen Mueller, Hans, 744 Muskowit, 701 Mustererkennung, optische, 1099 Myopie, siehe Kurzsichtigkeit, 417

Ng, Won K., 1212 Niépce, Joseph Nicéphore, 433 nichtaxiale Elemente, 368 nichtlinear-optisches System, 459 nichtlineare Effekte, 549 nichtlineare Optik, 41, 1262 nichtlineares Verhalten, 216 Nichtresonanzstreuung, 145 Nicol, William, 683 Nicol-Prisma, 683 Normalkongruenz, 221 Normalobjektiv, 435 numerische Apertur, 389, 432

Nachtfernglas, 355 Näherung der schwachen Führung, 396 Nahfeld, 767 Nahfeldbeugung, siehe Fresnelbeugung Nahpunkt, 424 –, Auge, 413 Natriumchlorid, 677 Nebenbandwelle, 1247 Nebenmaxima im Beugungsmuster, 1081 Nebenmaximum, 909 negative Brechung, 156 Neigungsfaktor, 961, 1012 –, nach Fresnel, 965 –, nach Kirchhoff, 965 nematische Phase, 731, 732 nematische Zelle –, parallele, 731 –, verdrehte, 733 Neodym-YAG-Laser, 1198 Netzhaut, 411 Netzwerk, optisches, 406 Newton, Sir Isaac, 5, 9, 31, 143, 379, 445, 532, 806, 852 newtonsche Abbildungsgleichung, 328, 485 newtonsche Ringe, 806, 825

Oberflächenwelle, 256, 258 Oberschwingung, siehe Harmonische Oberwelle, siehe Harmonische Objektiv, 428, 525, 528 –, Berechnung mit Matrixmethode, 501 –, Kamera, 357 –, Mikroskop, 430, 432 –, Mikroskop, Kennzeichnung, 431, 432 Objektraum, 303 Objektweite (Linse), 311 Öffnungsverhältnis, 357 Okular, .428 –, Erfle-, 429, 442 –, Huygens-, 428 –, huygenssches, 538 –, Kellner-, 429 –, orthoskopisches, 429 –, Plössl-, 429 –, Ramsden-, 429 Ölfilm, Farbe, 759, 802 Ommatidium, 408 Optik, 77 –, adaptive, 453 –, geometrische, 304 –, nichtlineare, siehe nichtlineare Optik

Sachverzeichnis

1356 –, paraxiale, 313 –, physikalische, 304 optisch ebene Fläche, 802 optisch-parametrischer Oszillator, 1268 optische Achse, 312 –, eines Kristalls, 662, 669 optische Aktivität, 714 –, Modell, 719 optische Datenverarbeitung, 1214 optische Dichte, 187 optische Elemente als lineare Operatoren, 1103 optische Interferenz, 760 optische Schwingung, 569 optische Weglänge, 223, 348 –, Variation, 228 optischer Computer, kohärenter, 1222 optischer Frequenzkamm, 603 optischer Mittelpunkt, 323 optischer Prozessor, 1099 optischer Resonator, 504 optischer Vortex, 67 optischer Wegunterschied, 553 optisches Element, holografisches, 1260 optisches Feld, 110 optisches System, 303 –, katadioptrisches, 450 –, Konstruktion, 340 –, Leistungsfähigkeit, 1101 ordinärer (o-) Strahl, siehe Strahl, ordentlicher Ordnung, fehlende, 907 Orientierungspolarisation, 147 orthoskopisch, 528 Oszillatormodell, 263 –, Elektron, 155 –, isotropes Medium, 149 Oszillatorstärke, 152

oszillierender Dipol, 135, 158 –, Bestrahlungsstärke, 137 OTF, siehe Übertragungsfunktionen OWL, siehe optische Weglänge Ozon, 167 Parabolspiegel, 365–369, 446, 523 parallele nematische Zelle, 731 parametrische Verstärkung, 1268 paraxial, 313 paraxiale Strahlen, 313 paraxialer Bereich, 313, 369, 426, 481, 506 Paraxialgleichung, 370 parsevalsche Gleichung, 1085 Partikelstreuung, 191 Pasteur, Louis, 718 Periode –, räumliche, 29, 600 –, zeitliche, 30 Periodenzahl, 540 Permeabilität –, des Vakuums, 89 –, relative, 90 Perot, Alfred, 834 Petzval, Josef Max, 436, 523 Petzval-Bedingung, 524 Petzval-Fläche, 523 Petzvalsche Bildfeldwölbung, siehe Bildfeldwölbung Phase, 30, 36, 47 Phasenbeziehung zwischen Primär- u. Sekundärwelle, 192 Phasendifferenz, siehe Phasenunterschied Phasenfront, 49

Phasengeschwindigkeit, 38 –, der Brechungswelle, 192 –, und Gruppengeschwindigkeit, 574, 578 phasengesteuerte Gruppenantenne, 859 phasengesteuertes Gruppenradar, 201 Phasengitter, 957 –, Beobachtung, 957 phasengleich, 644 Phasenkonjugation, 458 Phasenkonjugierte, Erzeugung, 459 Phasenkonstante, 36, 231 Phasenkontrast, 1229, 1234 –, negativer, 1233 –, positiver, 1233 Phasenkontrast-Mikroskop, 1229 Phasenmodulation, 945 Phasenmodulator –, mit Flüssigkristall, 733 phasenmoduliert, 1230 Phasenobjekt, 1230 Phasenplättchen, 699, 1233 –, jonessche und MuellerMatrizen, 743 Phasensingularität, 67 Phasenunterschied, 43, 552, 763 Phasenverschiebung –, bei Reflexion, 242 –, lineare, 704 Phasenverschiebungsgrad, 699 Phasenwinkel, 36 –, konstanter, 38 Phasor, siehe auch Zeiger, 46 Phosphoreszenz, 1210 Photoelastizität, 722 photoelektrischer Effekt, 114 Photon, 14, 113, 192 –, Absorption, 116 –, Drehimpuls, 656 –, Emission, 116

Sachverzeichnis –, Statistik, 117 –, virtuelles, 79 Photon, –, Reflexions/Brechungsgesetz, 287 Photon-Bunching, 123 Photonen –, Statistik, 120, 284 –, Wahrscheinlichkeitsverteilung, 283 –, Wellenlänge, 196 Photonenfluss, 118 Photonenflussdichte, 118 Photonengas, 115 Photonenzählung, 120, 283 photonische Bandlücke, 403 photonischer Kristall, 402, 606 physikalische Optik, 77, 304 Piezoelektrizität, 729, 1264 Piezoelement, 809 Planck, Max, 14, 113, 1169 plancksche Konstante (Wirkungsquantum), 14, 114, 1170 plancksches Strahlungsgesetz, 1171 Plasmafrequenz, 267 Pockels, Carl Alwin, 728 Pockels-Effekt, 728 Pohl-Interferometer, 821, 824 Poincaré, Jules Henri, 13 Poisson-Fleck, 979 Poisson-Verteilung, 121 polares Molekül, 147 Polarisation, 7, 9, 147 –, durch Anisotropie, 660, 669 –, durch Asymmetrie, 657 –, durch Reflexion, 689 –, durch Streuung, 687 –, elliptische, 651 –, lineare, 643, 644 –, magnetische, 1283 –, mathematische Beschreibung, 735

1357 –, und Bestrahlungsstärke, 736 –, und Kohärenz, 712 –, zirkulare, 648 Polarisationsdreher, 700 Polarisationsfilter, 663 Polarisationsfolie, 663 Polarisationsgrad, 695 Polarisationsmodulator, 729 –, Flüssigkristall, 732 Polarisationsvektor, 1282 Polarisationswelle, 1263 Polarisationswinkel, 240, 690 Polarisationszustände, 643, 654, 736 –, Korrektur, 700 –, orthogonale, 741 –, stokessche und jonessche Vektoren, 738 Polarisator, 377, 657 –, Ausgangsseite, 710 –, Drahtgitterpolarisator, 660 –, Eingangsseite, 710 –, Glan-Focault-Polarisator, 684 –, Glan-ThompsonPolarisator, 684 –, Glasplattensatz-, 692 –, jonessche und MuellerMatrizen, 743 –, Linearpolarisator, 657, 662, 670 –, Mechanismus, 657 –, Nicol-Prisma, 683 –, Wollaston-Prisma, 684 –, Zirkularpolarisator, 709 Polarisierung, 101 Polaroidfilter, siehe Polarisationsfilter Polyvinylalkohol, 664, 701 Polyvinylen, 665 Porta, Giovanni della, 433 Poynting, John Henry, 106 Poynting-Vektor, 106, 110, 125, 246 Primärwelle, 187, 193, 218

Prinzip der kürzesten Zeit, siehe fermatsches Prinzip Prinzip der kleinsten Wirkung, 230 Prisma, 377 –, Abbe-Prisma, 381 –, achromatisches, 383 –, Amici-Prisma, 384 –, Corner-Cube-Prisma, 385 –, Dispersionsprisma, 377 –, doppeltes Porro-Prisma, 385–386 –, Dove-Prisma, 384 –, Leman- (Sprenger-) Prisma, 385 –, mit konstanter Ablenkung, 380 –, Pellin-Broca-Prisma, 381 –, Pentaprisma, 385 –, Porro-Prisma, 383–384, 442 –, rechtwinkliges, 383 –, Reflexionsprisma, 381 –, Rhomboidprisma, 384 Prochorow, Alexander M., 1163 Propagator, 1138 Proteine, 721 Prüfverfahren, optische, 809, 853, 856 PTF, siehe Übertragungsfunktionen Pulskomprimierung, 1207 Pumpen, optisches, 1181 Pumplicht, 1268 Punktverwaschungsfunktion, 1057 Pupille, 350, 410 Purkinjesche Aderfigur, 413 Q-switching, siehe Güteschalten quadratisches Entfernungsgesetz, 113 Quantelung der Energie, 1170

1358 Quantenelektrodynamik, 284, 348 –, und Beugung, 874 Quantenfeldtheorie, 19, 170 Quantenmechanik, 14, 78, 172 –, statistische Formulierung, 115 quantenmechanisches Modell des Lichts, 196 Quantenrauschen, 123 Quantensprung, 140 Quantentheorie, 1164 Quarz, optische Aktivität, 715 Quasar, 135, 169 Quasi-Besselstrahl, 944 quasimonochromatisch, 33 Quellstärke, 62, 886

räumliche Filterung, 16, 626, 1083 räumliche Periode, siehe Periode, räumliche räumliches Fequenzspektrum, 606 Rauschen –, Abtrennung, 1091 –, Frequenzbandbreite, 1097 –, optisches, 1096 Rayleigh, Lord, 183, 839, 1169 –, Auflösungskriterium, siehe Auflösungskriterium Rayleigh-Bereich, 1194 Rayleigh-Bereichs, 942 Rayleigh-Jeans-Gesetz, 1169 Rayleigh-Streuung, 182, 1212, 1262 Raytracing, siehe Strahlenverlaufsberechnung Radar-Topographie, 861 Rechteckimpuls, 607 Radarinterferometrie, 859 –, Fourier-Integral, 610 Radioteleskop, 885 –, Leistungsspektrum, 622 Radioteleskop Arecibo, 513 Rechteckwelle, FourierRadiowellen, 158 Reihe, 596 Raman, Sir Chandrasekhara rechtsdrehend, 715 V., 1210 rechtszirkulares Licht, 649 Raman-Effekt reelles Bild, 309 –, induzierter, 1212 Referenzwelle, 1239 –, spontaner, 1210 reflektierter Strahl, 199 Raman-Spektroskopie, 1210, Reflektor, siehe Spiegeltele1212 skop Ramanstreuung, induzierte, Reflexion, siehe auch Total1262 reflexion, 41, 197, 279 Randbedingungen, 562 –, am ebenen Spiegel, 360 –, für elektrisches und ma–, an Metallen, 268 gnetisches Feld, 231 –, äußere, 198, 241 Randstrahl, 352 –, diffuse, 202–204 Raumfilter, angepasster, 1261 –, innere, 198, 242 Raumfrequenz, 16, 31, 600, –, Mechanismus, 197 1049, 1078 –, Phasenverschiebung, 242 –, und Kontrast, 1226 –, quantenelektrodynamische Raumfrequenzspektrum, Betrachtung, 286 1079 –, selektive, 266 –, spiegelnde, 203, 251 Rauminvarianz, 1056

Sachverzeichnis –, statistische Betrachtung, 284 –, und Elektromagnetismus, 231 –, und Farbempfindung, 270 –, und Phasenkonjugation, 458 –, und Polarisation, 689 –, und Streuprozess, 200 –, und Streuung, 181 –, und Transmission, 246 –, und Wellenlänge, 198 Reflexions-Phasen-Gitter, 946 Reflexionsgesetz, 199, 222 –, 1. Teil, 199 –, 2. Teil, 202 Reflexionsgrad, 247, 248, 693, 847 –, als Funktion der Wellenlänge, 269 –, als Funktion des Brechungsindex, 251 –, als Funktion des Einfallswinkels, 249 –, von Metallen, 268 Reflexionshologramm, 1250, 1251 Reflexionskoeffizient, 847 Reflexionsvermögen, als Funktion des Einfallswinkels, 694 reflexmindernde Schicht, 809, 842, 847 Refraktionsgleichung, 490 Refraktor, siehe Fernrohr Regenbogenhaut, 410 Reihensatz, 1084 Rekonstruktionswelle, 1246 Relativitätstheorie, 15, 127 Resonanzfrequenz, 140, 148, 150 Resonanzprofil, siehe Lorentzprofil

Sachverzeichnis Resonator, siehe auch optischer Resonator, 1180, 1183 –, konfokaler, 1189 –, spaltengekoppelter, 1204 –, stabiler und labiler, 1190 Resonatoren, Übersicht, 1191 Resonatormoden, longitudinale, 1186 Retina, siehe Netzhaut Reversibilität, Prinzip der, 229, 885 Ringlaser-Gyroskop, 574, 857 Rinnenfehler, 516 Rittenhouse, David, 945 Rømer, Ole Christensen, 7 Röntgen, Wilhelm Conrad, 168 Röntgenbeugung, 959 Röntgenlaser, 1179 Röntgenstrahlung, 168 –, Ausbreitung von, 195 –, Brechungsindex, 256 –, Fokussierung/Bündelung, 407 –, Phasengeschwindigkeit, 256 –, Reflexion, 199, 241 –, Totalreflexion, 406 –, transversale Natur, 689 Rotationen, von Molekülen, 160 Rotationsdispersion, 718 Rotationsgeschwindigkeit, Messung, 857 Rotationsoperator, 95 Rotationsübergang, 1210 Rubinlaser, 1180 –, Energieniveaus, 1182 Rubinowicz, Adalbert, 1016 Rückkopplung, optische, 1183 Saccharose, 721 Sägezahnfunktion, 594

1359 Sagittalebene, 519 Sagittalstrahl, 519 Sagnac-Interferometer, 821, 823, 825 –, rotierendes, 857 Sammellinse, 308, 316, 421 –, Abbildungsvorgang, 331, 332 –, Aberrationen, 510 –, Brennweite, 322 –, Lupe, 424 SAR-Interferometer, 861 Satz von Malus und Dupin, 221 Schallgeschwindigkeit, 574 Schalter, optischer, 363, 406 Schalter, spannungsgesteuerter, 734 Schatten, 873, 1006 –, geometrischer, 875 –, Struktur, 979 Schawlow, Arthur L., 1163 Scheiner, Chr., 409 Scheitelpunkt, 311 Schlierenmethode, 1237 Schmalbandfilter, 851 Schmidt, Bernhard W., 451 Schmidt-Kamera, 525 Schmidt-Platte, 451 schnelle Achse, 700 Schrägheitsfaktor, siehe Neigungsfaktor Schrödinger, Erwin C., 77 Schrödinger-Gleichung, 78 Schrotrauschen, 123 Schwartz, Laurent, 1041 Schwarz, als Farbempfindung, 277 schwarzer Körper, 165, 1166 Schwarzkörperstrahlung, siehe auch Hohlraumstrahlung, 1164, 1165, 1168 Schwebung, 571 Schwebungsfrequenz, 572 schwingende Saite, stehende Wellen, 566

Schwingungen von Molekülen, 160, 163 Schwingungsübergang, 1210 Schwingungskurve, 559 seidelsche Aberrationen, 507 Seifenblasen, 802 Seilwelle, 36 Seitenumkehrung am Spiegel, 361 sekundäres Spektrum, 537 Sekundärwelle, 192, 193, 218 Selbstfokussierung, 1269 Selbstphasenmodulation, 606 selektive Absorption, 275 selektive Reflexion, 266 Sender, 137 Seneca, 2 sichtbares Licht, 164 Sichtbarkeit, 1129, 1244 –, bei Zweistrahl-Interferenz, 1134 –, für kreisrunde Lichtquelle, 1135 –, und Kohärenzgrad, 1142 Siebensegment-Display, 735 Siebungseigenschaft, siehe Delta-Funktion Signalabschwächung, 393 Signalausbreitung, 576 Signalgeschwindigkeit, 626 Signalübertragung, 394 Silber, 269, 271 sinc-Funktion, 108, 599 Sinussatz, optischer, 518–519 Sinustransformierte, 1030, 1046 Smith, Robert, 326 Snell van Royen, Willebrord (Snellius), 4, 206 snelliussches Gesetz, 206, 210, 223 –, elektromagnetische Formulierung, 234 Solitonen, 393 Sommerfeld, Arnold, 877, 1016

Sachverzeichnis

1360 Sonnar-Objektiv, 526 Sonnenlicht, 270 Sonnenspektrum, 16 Sonnenstrahlung, Druck, 128 Sonnenwind, 128 Spaltebene, 671 Spaltform, 671 Spannungsdoppelbrechung, 722 Sparrow, C., 941 Speckle-Effekt, 1208 Spektralanalyse, 842 spektrale Energieverteilung, 1086 spektrale Reinheit, 769 Spektrallinien, 16, 615 –, Frequenzbandbreite, 1087 –, Struktur, 838 Spektrometer, 377, 834 Spektroskopie, 16 Spektrum, elektromagnetisches, siehe elektromagnetisches Spektrum spezielle Relativitätstheorie, 13, 127 sphärische Aberration, 506, 507 –, Korrektur (GRIN-Linse), 541 –, Messung, 857 sphärische Fläche, 368 sphärische Linse, 311, 317, 319 Spiegel, 359 –, Aberrationen, 523 –, asphärischer, 365 –, Brennpunkte, 371 –, dichroitischer, 842 –, ebener, 360 –, Ellipsoidspiegel, 366–367 –, Herstellung, 359 –, Hyperboloidspiegel, 366– 367 –, Matrixanalyse, 503 –, Parabolspiegel, 365–369

–, rotierender, 363 –, sphärischer, 368, 375 –, Vergleich mit Linse, 374 –, Vorzeichenkonvention, 361, 374 Spiegelbild, 361 Spiegelfernrohr, 6 Spiegelformel, 361, 371 spiegelnde Reflexion, 203, 251 Spiegelreflexkamera, 434 Spiegelteleskop, 445 –, Schmidtsches, 450 Spiegelung an heißen Straßen, 224 Spin, 173 Stäbchen (Netzhaut), 411 Stahl, 264 Standard-Meter, 816 stationäre Welle, siehe stehende Welle Statistik, 117 Stefan, Josef, 1165 Stefan-Boltzmann-Gesetz, 1166 stehende Welle, 562, 1185 –, Nachweis, 567 stellare Aberration, 11 Stellarinterferometer, 1149 –, Michelsonsches, 1146 –, von Hanbury-Brown und Twiss, 1153 Stickstofflaser, 1202 stigmatisches System, 303 Stokes, Sir George Gabriel, 279, 736, 1210 Stokes-Linien, 1213 stokessche Parameter, 736 stokessche Relationen, 280 stokesscher Übergang, 1210 stokesscher Vektor, 738 Störung, nichtlineare, 41 Strömung im Rohr, 84

Strahl –, außerordentlicher, 673, 683, 697, 1265 –, ordentlicher, 673, 683, 697, 1265 Strahlenverlaufsberechnung, 488, 506 –, Beispiel, 488 Strahlenverlaufsdiagramm, 325, 328 Strahlrichtung, 675, 676 Strahltaille, 942, 1193 –, Durchmesser, 1193 Strahlteiler, 261, 377, 684, 842 –, farbselektiver, 842 Strahlung, charakteristische, 168 Strahlungsdruck, 125 –, Ausnutzung, 128 Strahlungsfeld, 131 Strahlungsgesetz, von Rayleigh und Jeans, 1169 Strahlungsmode, 1180 Strahlungsverteilung im Bild, und Eingangsfeld, 625 Strahlverfolgung, 340 streifender Einfall, 201 Streufleck, 303 Streulichtinterferenz, 853 Streuplatte, 853 Streuung, 41, 181, 281, 686 –, an kleinen Partikeln, 191 –, elastische, 182 –, in Festkörpern, 191 –, in Huygens Theorie, 218 –, Mie-, 191 –, polarisierten Lichts, 688 –, Rayleigh-, 182 –, seitliche, 186, 188 –, und Polarisation, 687 –, und Totalreflexion, 254 –, und Wahrscheinlichkeit, 283 –, unpolarisierten Lichts, 688 Strichcodeleser, 1261

Sachverzeichnis –, gestörte (frustrierte), 261, 264 –, innere, 253 –, Röntgenstrahlung, 406 Townes, Charles Hard, 1163 Trägerfrequenz, 571 Trägerwelle, 574 Transferformel, 490 Transfermatrix, 492 Transformationslinse, 1219 Transformiertenebene, 1040 T-Strahlung, 161 Transformiertenpaar, 1032 Teilchenhypothese, 6, 14, Transmission, 246, 247, 838 113, 124 –, als Funktion des EinfallsTeilcheninterferenz, 787 winkels, 249 Teilkohärenz, siehe Kohä–, und Streuung, 181 renz, teilweise Transmissions-AmplitudenTelegraphengleichung, 1285 Gitter, 945 Telekommunikation, 386, Transmissions-Phasen-Gitter, 393 945 Teleobjektiv, 436 Transmissionshologramm, Teleskop, siehe auch 1249, 1250 Hubble-Weltraumteleskop, transversal, siehe Welle, Spiegelteleskop, 352, 384, transversale 429, 453, 528, 929 Transversalaberration, 509 –, Cassegrain/Gregory, 367 Transversalvergrößerung, –, mit adaptiver Optik, 455 328–329, 336, 361, 374, TEM-Mode, 1034, 1188 486 Theorie erster Ordnung, 313, –, Fernrohr, 441 505 Traubensäure, 718 Theorie dritter Ordnung, 313, Trichroismus, 663 507 Tubuslänge, 430 thermische Strahlung, 1164 Tunneleffekt, 261 thermonukleare Reaktion, Turmalin, 662 820 Twiss, R. Q., 1152 Thermopaar, 163 Twyman-GreenThomson, J. J., 114 Interferometer, 856 Tiefenschärfe, 433 Tyndall, John, 191, 386, 1165 Tiefpassfilter, 850, 1221 Überfüllung, 397 Tinte, 277 Übergangsrate, 1174 Tonnenverzeichnung, 526 Übergangswahrscheinlichkeit, Totalreflexion, siehe auch 152 Grenzwinkel, 253, 707 Überlichtgeschwindigkeit, –, als Streuprozess, 254 626 –, am Prisma, 381 Übersprechen, 388 –, äußere, 256 Stroke, G. W., 1256 Strukturerkennung, optische, 1261 Superposition, 1010 Superpositionsprinzip, 40, 549, 760 Synchrotron, 129, 132 System, lineares, siehe lineares System Systemmatrix, 494

1361 Übertragungsfunktionen, 16, 1099 –, Modulations- (MTF), 1102, 1104 –, normierte, 1107 –, optische (OTF), 1104 – –, nicht normierte, 1105 –, Phasen- (PTF), 1104 Übertragungskapazität, 386 –, Glasfaser, 393 Ulexit, 391 ultrakurzer Lichtpuls, 1207 Ultraviolettstrahlung, 167 Umkehrlinse, 442 Umkehrprisma, 377 Umkehrungsprinzip, 229 Umlenkprisma, 377 Ummantelung (Glasfaser), 388 Unschärfekreis, 509, 520 Unterfüllung, 397 V-Zahl, 395 Valenzband, 403 van Cittert, P. H., 1117 van Cittert-Zernike-Satz, 1144 Variation der optischen Weglänge, 228 Variationsprinzip, 222 –, und Quantenmechanik, 230 Vektorfeld, 92 Verdet, Emile, 1117 Verdet-Konstante, 724 verdrilltes Licht, 65 Vergrößerung –, eines optischen Instruments, 425 –, Längs-, 335, 336 –, Lupe, 424 –, transversale, 328–329, 336, 361, 374 Vergrößerungsglas, siehe Lupe

Sachverzeichnis

1362 Verkettungsgesetz, siehe amperesches Verkettungsgesetz Verlustfaktor, 1184 Verschiebungsdichte, elektrische, 1283 Verschiebungsgesetz, wiensches, 1168 Verschiebungsstromdichte, 91 Verstärkung, siehe Interferenz, konstruktive Verstärkungsfaktor, 1184 Verteilungsfunktion, der Energie der Hohlraumstrahlung, 1164 Verzögerungsplättchen, 696 –, achromatisches, 707 –, chromatisches, 699 –, höherer Ordnung, 705 –, nullter Ordnung, 704 Verzeichnung, 506, 526 –, Abwesenheit, 528 –, Korrektur, 527 Vibrationskurve, 966 –, für kreisrundes Hindernis, 980 –, für Prinzip von Babinet, 1008 Vignettierung, 354 Vinci, Leonardo da, 3, 433 virtuelles Objekt, 314 virtuelles Photon, 79, 172 Voigt-Effekt, 726 Volumenfluss, 84 vordere Brennebene, 324 wärmeabweisende Beschichtung, 843 Wärmereflexionsfilter, 843 Wärmestrahler, Interferenz, 556 Wärmestrahlung, 163, 164 Wahrscheinlichkeit und Elementarwelle, 284

Wahrscheinlichkeitsamplitude, 284, 348, 876 –, halb klassische, 283 –, quantenmechanische, 287 Wahrscheinlichkeitsdichte, 283 Wasser, Farbe, 270, 275 Wasserdampf, 270 Wasserstoffatom, 656 Weber, Wilhelm, 99 Weglänge –, räumliche, 223 Wegunterschied, optischer, 553 Weiß, 165, 686 –, Farbempfindung, 270 –, Farbpigmente, 270 weißes Licht, 618 Weinsäure, 715 Weitsichtigkeit, 417, 421– 422 Weitwinkelobjektiv, 435 Welle –, anharmonische, 584 –, anharmonische periodische, 597 –, Beugungs-, 1015 –, Definition, 19 –, Differentialgleichung, 24 –, Dimension, 24 –, ebene, 49, 102 –, ebene harmonische, 55 –, ebene, Fresnelbeugung, 977 –, elektromagnetische, siehe elektromagnetische Welle, 19, 1282 –, Energie, 105 –, geometrische, 1016 –, harmonische, 28, 61 –, inhomogene, 53, 258 –, linear polarsierte, 101 –, longitudinale, 20 –, mechanische, 20 –, monochromatische, 33, 118

–, nichtperiodische, 603 –, Profil, 21 –, quasimonochromatische, 33 –, Sinuswelle, 28 –, stehende, siehe stehende Welle –, transversale, 20, 100 –, und Trägermedium, 21 –, Zeigerdarstellung, 46 Welle-Teilchen-Dualismus, 15, 19, 77 Wellenaberration, 508 Wellenaddition –, algebraische, 550 –, bei gleicher Frequenz, 550 –, bei verschiedender Frequenz, 570 –, komplexe, 557 Wellenbauch, 562 Wellenform, 584 Wellenfront, 49, 53 –, Umformung – –, an Linsen, 306 –, Umformung/Entzerrung, 452 Wellenfrontrekonstruktion, 1240 Wellenfrontsensor, 456 Wellenfunktion –, eindimensionale, 22 –, komplexe Darstellung, 46 –, Schrödinger, 283 Wellengleichung, 24, 40 –, dreidimensionale, 57 –, eindimensionale, 26 –, elektromagnetische, 97 –, Kugelwelle, 61 –, skalare, 1009 –, Zylinderwelle, 64 Wellengruppe, 613 Wellenhypothese, 6, 8, 9 Wellenknoten, 562 Wellenlänge –, Definition, 29

Sachverzeichnis –, experimentelle Bestimmung, 567 –, im Vakuum, 215 Wellenleiter, 392 Wellenoptik, 77, 161 Wellenpaket, 577, 613 –, Fourier-Transformation, 1075 Wellentheorie des Lichts, 281 Wellenvektor, 53 Wellenzahl, 29, 31, 53, 600 –, mittlere, 571 Wellenzug, 140 Wiener, Otto, 567 Wiener-Khintchine-Satz, 1089, 1261 windschiefer Strahl, 489 Winkelauflösung (Teleskop), 449 Winkelbreite, 898 Winkelbreite einer Spektrallinie, 951 Winkeldispersion, 952 Winkelgeschwindigkeit, 31, 37 –, der Erde, 859 Winkelvergrößerung, 425 –, Fernrohr, 440 Wodd, Robert Williams, 950

1363 Wolf, Emil, 1016 Wollaston, William Hyde, 16, 517 Wollaston-Prisma, 684 Woodbury, Eric J., 1212 Young, Thomas, 8, 271, 772 Young-Maggi-RubinowiczTheorie, 1016 Youngsches Doppelspaltexperiment, siehe Doppelspaltexperiment Zapfen (Netzhaut), 411 Zeeman-Effekt, 573 Zeiger, 46, 558, 780, 894 –, Addition, 48, 558–559, 967 Zeiss, Carl, 1221 zeitgemittelte Methode, 1258 zeitliche Periode, siehe Periode, zeitliche Zentralgrube, 412 zentriertes System, 316 Zernike, Fritz, 1117, 1229 Zerrlinse, 422 Zerstreuungslinse, 308, 316 –, Brennweite, 322 –, in Brillen, 417

Zerstreuungsvermögen, 532 Ziliarmuskeln, 413 Zirkulation, 83 Zonenlinse, 1251 Zonenplatte, 981 –, Brennpunkte, 984 –, Brennweite, 984 –, Herstellung, 985 –, mit Phasenumkehr, 984 –, und Holografie, 1240, 1246 Zucker, 715, 718, 721 Zustand –, eines Atoms, 138 –, eines Teilchens, 118 zweiachsiger Kristall, 679 zweidimensionale Bilder, 1049 Zweifarbträger, 664 Zweistrahl-Interferenz, 569, 1120 Zylinderfunktion, FourierTransformierte, 1037 Zylinderwelle, 63 –, Erzeugung, 64 –, Wellengleichung, 64