Articles

Plasmonische Ommatidien für linsenloses zusammengesetztes Sehen

Metasurface Design

Das Funktionsprinzip der in dieser Arbeit entwickelten winkelempfindlichen Geräte ist in Abb. 2. Das photodetektoraktive Material (ein Ge-Fotoleiter) ist mit einer zusammengesetzten Metaoberfläche beschichtet, die aus einem Metallfilm besteht, der mit einer Anordnung rechteckiger metallischer Nanopartikel (NPs) gestapelt ist. Die Metaoberfläche besteht aus drei verschiedenen Abschnitten — einem periodischen Gitterkoppler, einem Gitterreflektor und einem Satz von Schlitzen durch den darunter liegenden Metallfilm. Gold wird aufgrund seiner günstigen plasmonischen Eigenschaften bei Infrarotwellenlängen15 als Material der Wahl für alle metallischen Merkmale verwendet. Zwei dielektrische Schichten (SiO2) werden auch unmittelbar unterhalb und oberhalb des Au-Films eingebracht, um eine elektrische Isolierung von der aktiven Schicht bereitzustellen bzw. die Film-NP-Kopplung zu steuern. Da der Metallfilm optisch dick ist (100 nm), kann die Photodetektion nur durch einen indirekten Prozess erfolgen, bei dem im gewünschten Winkel einfallendes Licht zuerst vom NPs (im Abschnitt des periodischen Gitterkopplers) in Oberflächenplasmonenpolaritonen (SPPs) gebeugt wird — d. H. Geführte elektromagnetische Wellen, die sich entlang der Au-Luft-Grenzfläche ausbreiten. Eine kleine Anzahl von Subwellenlängenschlitzen im Metallfilm wird dann verwendet, um diese SPPs in Strahlung zu streuen, die sich überwiegend in die absorbierende aktive Schicht ausbreitet. Infolgedessen wird ein Fotostromsignal zwischen zwei vorgespannten Elektroden erzeugt, die sich über der Metaoberfläche befinden.

Abb. 2: Winkelempfindliche Metaflächen.
figure2

a, b Schematische Darstellungen der Metaoberflächengeometrie und des Funktionsprinzips. Unter dem gewünschten Detektionswinkel +θp(a) einfallendes Licht wird vom Gitterkoppler in SPPs gebeugt, die sich in Richtung der Schlitze ausbreiten, wo sie bevorzugt in das absorbierende Substrat gestreut werden. Licht, das unter dem entgegengesetzten Winkel θp (b) einfällt, wird vom NP-Array in SPPs gebeugt, die sich in Richtung des Gitterreflektors ausbreiten, wo sie wieder in Strahlung gebeugt werden. Licht, das in einem anderen Winkel einfällt, wird stattdessen vollständig von der Oberfläche weg reflektiert oder gebeugt. c Berechneter optischer Transmissionskoeffizient bei λ0 = 1550 nm durch sechs verschiedene Metaflächen für p polarisiertes Licht im Vergleich zum Einfallswinkel θ auf der x–z-Ebene. Die Gitterkopplerperiode (Anzahl der NPs) reicht von 1465 bis 745 nm (15 bis 29) in der Reihenfolge zunehmender Winkel der Peakdetektion. Die NP-Breiten variieren zwischen 250 und 570 nm. d-f Transmissionskoeffizient von drei Metaflächen von c als Funktion sowohl der polaren θ- als auch der azimutalen ϕ -Beleuchtungswinkel, summiert über xz- und yz-Polarisationen. In jeder Karte sind kx und ky die In-Plane-Komponenten des Auflichtwellenvektors, und die Farbskala ist auf den maximalen (MAX) Transmissionswert normalisiert. In e, Der durchgezogene rote Kreis mit dem Radius kSPP zeigt die verfügbaren SPP-Modi auf der oberen Metalloberfläche an; Die gestrichelte gekrümmte Linie hebt die Einfallsrichtungen der Spitzenübertragung hervor; die horizontalen grauen Pfeile (Länge 2π / Λ) veranschaulichen, wie entlang dieser Richtungen einfallendes Licht SPPs durch Beugung negativer erster Ordnung anregen kann; und die roten Pfeile zeigen die Ausbreitungsrichtungen der angeregten SPPs.

Der Einfallswinkel der Peakdetektion wird durch die Gitterkopplerperiode Λ gesteuert. Insbesondere SPPS, die sich entlang der ∓x-Richtung von Fig. 2a, b können durch Beugung erster Ordnung des einfallenden Lichts (auf der x-z–Ebene) unter den gleichen und entgegengesetzten Winkeln ±θp angeregt werden, die durch die Beugungsbedingung (2πsinθp) / λ0 − 2π / Λ = −2π / λSPP bestimmt werden, wobei λ0 und λSPP die Wellenlängen des einfallenden Lichts bzw. der angeregten SPPs sind. Licht, das in einem beliebigen anderen Winkel einfällt, wird stattdessen vollständig von der Oberfläche weg reflektiert oder gebeugt (insbesondere wird die Anregung von SPPs durch alle höheren Beugungsordnungen vermieden, indem Λ kleiner als λSPP gehalten wird). Die selektive Detektion nur einer Einfallsrichtung (z.B., +θp) erhält man dann, indem man den Gitterkoppler auf der einen Seite (in −x-Richtung) mit den Schlitzen und auf der anderen Seite (in +x-Richtung) mit dem Gitterreflektor umgibt. Der Reflektor ist eine andere Anordnung von rechteckigen NPs, die entworfen sind, um die eingehenden SPPs in Licht zu streuen, das von der Probe in der Nähe der Oberflächennormalen Richtung wegstrahlt. Bei dieser Anordnung breiten sich die durch einfallendes Licht bei +θp angeregten SPPs in Richtung der Schlitze aus, wo sie bevorzugt in das Substrat gestreut werden und einen Photostrom erzeugen (Fig. 2a und Ergänzungsfilm 1). Die durch einfallendes Licht at −θp angeregten SPPs breiten sich zum Gitterreflektor hin aus, wo sie wieder in den freien Raum gebeugt werden (Abb. 2b und Ergänzungsfilm 2). Infolgedessen sind die metaoberflächenbeschichteten Photodetektoren funktionell äquivalent zu den Ommatidien des Appositions-Facettenauges, während die planare Geometrie von Standard-Bildsensorarrays beibehalten wird.

Die soeben beschriebenen Metaflächen beruhen auf einer Reihe von Schlüsselideen aus der Plasmonik und Nanophotonik, die hier auf eine neuartige Gerätefunktionalität (Richtungsfilterung) angewendet werden. Erstens ist die Fähigkeit von Subwellenlängenschlitzen, SPPs effizient mit Strahlung zu koppeln, im Zusammenhang mit außergewöhnlicher optischer Transmission16 gut etabliert und wurde bereits für verschiedene Anwendungen ausgenutzt17,18,19. Im Detail, wenn ein SPP, der sich auf der oberen Metalloberfläche ausbreitet, die Schlitzgrenzen erreicht, wird effektiv eine Linie von in der Ebene oszillierenden Dipolen über den Schlitz erzeugt, die dann Strahlung emittieren, die sich hauptsächlich in das Substrat mit höherem Index ausbreitet. Das gleiche umgekehrte Verhalten wurde auch für die effiziente Anregung von SPPs auf der Oberseite eines perforierten Metallfilms über Beleuchtung von der Rückseite 20, 21, 22 angewendet. Zweitens basiert der Entwurf des Gitterreflektors auf dem Begriff der Metaflächen mit einem linearen Phasengradienten23,24, wobei zusammengesetzte asymmetrische Einheitszellen verwendet werden, um alle Beugungsordnungen q mit Ausnahme von q = -1 zu unterdrücken (siehe ergänzende Anmerkung 2 und ergänzende Fig. 2). Dadurch ist die SPP-Transmission (die der Beugung nullter Ordnung entspricht) in diesem NP-Array effektiv verboten, so dass die einfallenden SPPs aus dem Gitterkoppler (wie in Fig. 2b) mit möglichst geringer Periodenzahl vollständig in Strahlung gestreut werden. In einem Photodetektorarray kann jeder SPP, der über den Reflektor eines Pixels übertragen wird, gestreut und in ein benachbartes Pixel detektiert werden. Die Verwendung eines linearen Phasengradienten ist daher günstig, um durch Lichteinfall bei −θp erzeugte Fotostrom-Störsignale zu vermeiden (siehe ergänzende Fig. 3). In ähnlicher Weise könnte, wenn die q = + 1-Ordnung zugelassen würde, nahezu normales einfallendes Licht vom Gitterreflektor teilweise in SPPs gebeugt werden, die sich auch direkt in ein benachbartes Pixel ausbreiten, wo sie wiederum ein unerwünschtes Signal erzeugen könnten (im Gegensatz dazu breitet sich jedes SPP, das im Gitterreflektor durch q = -1−Beugung angeregt wird, entlang der -x-Richtung über das gesamte NP-Array aus, wo es eine nahezu vollständige Dämpfung durch Absorption und Streuung erfahren kann, bevor es die Schlitze auf der anderen Seite erreicht).

Mehrere Geräte, die auf der soeben beschriebenen Geometrie basieren und jeweils eine Peak-Photodetektion unter einem anderen Winkel θp bieten, wurden unter Verwendung elektromagnetischer Vollwellensimulationen basierend auf der Finite-Difference-Time-Domain (FDTD) -Methode entwickelt. Neben der Gitterkopplerperiode Λ gehören zu den wichtigsten Designparametern die Anzahl der NPs (die für eine maximale Spitzentransmission optimiert werden kann) und die NP-Breite (die ausgewählt werden sollte, um die Gitterbeugungseffizienz zu maximieren und gleichzeitig eine signifikante Kopplung zwischen SPPs und lokalisierten plasmonischen Resonanzen zu vermeiden, die vom NPs unterstützt werden); Weitere Einzelheiten finden Sie in der ergänzenden Anmerkung 1 und der ergänzenden Abb. 1. Abbildung 2c zeigt den berechneten p-polarisierten Leistungsübertragungskoeffizienten für einen Satz optimierter Metaflächen bei λ0 = 1550 nm als Funktion des Polareinfallswinkels θ auf der x–z-Ebene (die relevanten geometrischen Parameter sind in der ergänzenden Anmerkung 3 und der ergänzenden Tabelle 1 aufgeführt). Wenn die Metaflächen auf einem photodetektoraktiven Material hergestellt sind, ist das detektierte Signal proportional zu ihrem Transmissionskoeffizienten. Die Vorrichtungen der Fig. 2c kann daher eine abstimmbare gerichtete Photodetektion bereitstellen, mit einem breiten Abstimmbereich für den Winkel der Spitzendetektion θp von ± 75 ° und einer engen Winkelauflösung, die von 3 ° bis 14 ° voller Breite bei halbem Maximum (FWHM) reicht, wenn θp erhöht wird. Der Peak-Transmissionskoeffizient Tp liegt bei allen betrachteten Ausführungen im Bereich von 35-45%, bei einem Peak-to-average-Background-Verhältnis von etwa 6. Nebenbei sei angemerkt, dass in der Struktur mit θp = 0° der Gitterkoppler beidseitig von Schlitzen umgeben ist (da der gewünschte Winkelgang symmetrisch ist), was zu einem etwas größeren Wert von Tp führt. Für s-polarisiertes Licht ist die Transmission durch die gleichen Metaflächen isotrop und signifikant kleiner, <0,2% in allen Winkeln (siehe Ergänzende Abb. 4 und Diskussion unten).

Die vollständigen Winkelantwortmuster derselben Geräte sind in den Farbkarten von Abb. 2d-f und ergänzende Fig. 5, wo die Meta-Oberflächen-Transmissionskoeffizienten (berechnet mit einem reziprozitätsbasierten Verfahren und summiert über beide Polarisationen) als Funktion sowohl der polaren θ als auch der azimutalen ϕ Beleuchtungswinkel aufgetragen sind. In jeder Karte, Die Richtungen der hohen Transmission bilden eine C-förmige Region innerhalb der vollen Hemisphäre, was auf die Beugung des einfallenden Lichts erster Ordnung in SPPs verschiedener Wellenvektoren kSPP hinweist. Konkret wird die C-Form durch die reziproke Raumverteilung der verfügbaren SPP-Moden bei λ0 (roter Kreis in Fig. 2e), übersetzt durch den Gittervektor \({\hat{\mathbf{x}}}\)2π/Λ des Gitterkopplers (wie durch die horizontalen Pfeile in derselben Abbildung dargestellt). Dieses Verhalten vergrößert deutlich den Bereich der Einfallsrichtungen, die von jedem Pixel erfasst werden. Wichtig ist jedoch, dass die nachfolgend beschriebenen rechnerischen Abbildungstechniken die Rekonstruktion von Bildern mit höherer Auflösung im Vergleich zur Einzelpixel-Winkelselektivität ermöglichen, wenn Vorrichtungen mit geeigneten Überlappungen in ihren Winkelantworten kombiniert werden.

Für jede Einfallsrichtung wird die Meta-Oberflächen-Transmission für xz-polarisiertes Licht (d.h., mit elektrischem Feld auf der x–z-Ebene) ist wiederum viel größer als bei yz-polarisiertem Licht (siehe ergänzende Anmerkung 4). Dieses Verhalten beruht auf den Polarisationseigenschaften von SPPs. Im Allgemeinen besitzen SPPs eine in-plane elektrische Feldkomponente, die parallel zu ihrer Ausbreitungsrichtung15 ist. Daher ist in der untersuchten Geometrie xz-polarisiertes einfallendes Licht am effektivsten bei der Anregung von SPPs, die sich in einem kleinen Winkel in Bezug auf die x-Achse ausbreiten, und umgekehrt. In derselben Geometrie, in der die Schlitze linear und entlang der y-Richtung ausgerichtet sind, werden nur SPPs mit einem großen x (d. h. Durch die erwähnte Anregung von oszillierenden Dipolen über die Schlitze 22 kann die Komponente des elektrischen Feldes effizient in Strahlung eingekoppelt werden. Aus diesen Überlegungen folgt, dass die SPP-Moden, die stärker von den Schlitzen in das absorbierende Substrat gestreut werden, auch durch xz-polarisiertes (im Vergleich zu yz-polarisiertem) einfallendes Licht effektiver angeregt werden. Dieselben Überlegungen erklären auch, warum die Metaflächenübertragung innerhalb der C-förmigen Bereiche von Fig. 2d-f nimmt mit zunehmendem Azimutwinkel ϕ des einfallenden Lichts ab: je größer ϕ, desto kleiner sind die x-Komponenten des Wellenvektors kSPP und des elektrischen Feldes der entsprechend angeregten SPPs (siehe rote Pfeile in Fig. 2e). Die intrinsische Polarisationsabhängigkeit der Vorrichtungen nach Fig. 2 begrenzt ihre Gesamtempfindlichkeit für typische Abbildungsanwendungen mit unpolarisiertem Licht. Gleichzeitig könnte es in Verbindung mit computergestützten Bildgebungstechniken genutzt werden, um Polarisationssicht zu ermöglichen, die mehrere wünschenswerte Merkmale wie reduzierte Blendung und verbesserten Kontrast bietet25. Alternativ könnten polarisationsunabhängige winkelempfindliche Photodetektoren auch mit komplexeren Metaflächen ausgelegt werden, z. B. unter Verwendung zweidimensionaler NP-Arrays, die eine unabhängige Phasen- und Polarisationssteuerung ermöglichen26,27.

Experimentelle Ergebnisse

Die Metaflächen von Fig. 2 kann auf jede planare Photodetektortechnologie unabhängig von ihren Funktionsprinzipien angewendet werden. Hier verwenden wir Metall-Halbleiter-Metall (MSM) Ge-Fotoleiter, bei denen ein Fotostromsignal über zwei vorgespannte Elektroden gesammelt wird, die auf der Oberseite eines Ge-Substrats abgeschieden sind. Die winkelsensitive Metafläche ist auf dem aktiven Bereich zwischen den beiden Metallkontakten strukturiert. Während Photodioden im Allgemeinen eine höhere Leistung bieten, sind MSM-Photodetektoren besonders einfach herzustellen und bieten daher eine bequeme Plattform zur Untersuchung der Metaoberflächenentwicklung. Um die winkelaufgelösten Photostrommessungen zu vereinfachen, verwenden wir auch relativ große aktive Bereiche: In jedem Gerät beträgt der Abstand zwischen den beiden Elektroden d ≈ 300 µm, und die Metaoberfläche besteht aus einigen (5-6) identischen Wiederholungen einer gleichen Struktur basierend auf dem Design von Fig. 2a, wobei der Gitterreflektor eines Abschnitts unmittelbar an die Schlitze des nächsten Abschnitts angrenzt. Repräsentative optische und rasterelektronenmikroskopische (REM) Bilder sind in Abb. 3 eine komplette Vorrichtung (Fig. 3a), einen Metaschnitt (Fig. 3b) und ein Satz Schlitze (Fig. 3c).

Abb. 3: Messergebnisse.
figure3

a–c Optische (a) und SEM (b, c) Bilder von repräsentativen experimentellen Proben. Der Skalenbalken ist 100 µm in a, 4 µm in b und 2 µm in c. In a wird die gesamte Metaoberfläche einer kompletten Vorrichtung durch ein die gesamte Probe bedeckendes Ti-Fenster gesehen, das eingeführt wird, um unechte Photostromsignale zu vermeiden. Das Bild von c wurde vor der Herstellung des NP-Arrays aufgenommen. d-g Gemessene Winkelabhängigkeit des Photostroms von vier Vorrichtungen basierend auf den Strukturen von Fig. 2, bereitstellung peak antwort in der nähe θp = 0 ° (d), 12 ° (e), 28 ° (f), und 65 ° (g). In jedem Diagramm wird der Photostrom auf den Spitzenwert normalisiert. REM-Bilder zeigen einige Abweichungen in den Array-Perioden und NP-Breiten von ihren Ziel-Design-Werten. Die gemessenen Werte sind Λ = 1440, 1180, 1030 und 775 nm und w = 240, 560, 526 und 256 nm für die Geräte der Panels d, e, f und g. h-k Linie scannt entlang der direction = 0 ° Richtung von den Karten von d–g, beziehungsweise. l p- (d. H. xz-) und s- (d. h. yz–) polarisierte Ansprechempfindlichkeit gegenüber dem Polareinfallswinkel auf der xz-Ebene, gemessen mit drei verschiedenen Proben: einem Referenzgerät ohne Metallfilm und NP-Array und zwei mit Metaoberfläche beschichteten Geräten, die eine Peakdetektion bei θp = 12 ° bzw. 65 ° ermöglichen. Quelldaten für die Panels d-g werden als Quelldatendateien bereitgestellt.

Winkelaufgelöste Photostrommessungen mit diesen Geräten zeigen ein stark gerichtetes Verhalten in guter Übereinstimmung mit den Simulationen (Abb. 3d-k und ergänzende Fig. 8). Bei diesen Messungen wird jedes Gerät mit Laserlicht der Wellenlänge 1550 nm beleuchtet, und der polare und der azimutale Einfallswinkel werden jeweils durch Drehen der Fokussieroptik um die Probe und durch Drehen der Probe um ihre Oberflächennormale variiert. Für jede Probe werden zwei orthogonal polarisierte Winkelantwortkarten aufgezeichnet, und ihre Summen sind in Fig. 3d-g. In Übereinstimmung mit der obigen Diskussion zeigen die Messergebnisse, dass das stärkste Photostromsignal erhalten wird, wenn das einfallende Licht xz-polarisiert ist, während der yz-polarisierte Beitrag im Wesentlichen vernachlässigbar ist (siehe ergänzende Abb. 7). Jede Karte von Fig. 3 zeigt den erwarteten C-förmigen Bereich mit hoher Ansprechempfindlichkeit, zentriert in der Nähe des entworfenen Polarwinkels der maximalen Metaoberflächenübertragung θp (0, 12, 28 und 65 ° für die Felder d, e, f und g). Die Polarwinkelselektivität (FWHM) derselben Vorrichtungen, gemessen aus dem horizontalen Linienschnitt ϕ = 0 ° jeder Karte gemäß Fig. 3h-k, liegt im Bereich von 4-21° in der Reihenfolge zunehmender θp. Das Peak-to-Average-Hintergrundverhältnis beträgt ~ 3 für alle Geräte. Diese gemessenen Kennlinien liegen einigermaßen nahe an den berechneten Werten aus den Simulationsergebnissen von Fig. 2. Die beobachteten Unterschiede sind hauptsächlich auf das Vorhandensein einer gewissen Oberflächenrauhigkeit in den experimentellen Proben zurückzuführen (die einen Teil des einfallenden Lichts unabhängig von seiner Ausbreitungsrichtung in SPPs streuen können) sowie auf kleine Abweichungen in den Array-Perioden und NP-Breiten (hauptsächlich beeinflussen θp). In jedem Fall sind diese experimentellen Werte, wie nachfolgend beschrieben, bereits für eine qualitativ hochwertige Bildrekonstruktion voll ausreichend.

Um die Spitzentransmission der Metaflächen zu bewerten, wurden auch ansonsten identische blanke Proben ohne Metallfilm und NP-Array zwischen den beiden Elektroden hergestellt und getestet. Abbildung 3l zeigt die polarwinkelaufgelöste p- und s-polarisierte Empfindlichkeit einer solchen Probe zusammen mit Daten, die mit zwei Metasurface-Geräten gemessen wurden. Bei ihren Spitzenerkennungswinkeln von 12 ° und 65 ° werden die p-polarisierten Ansprechraten der letzteren Vorrichtungen auf ~ 42% bzw. 36% des entsprechenden Wertes aus der bloßen Probe reduziert, was in ausgezeichneter Übereinstimmung mit den Simulationsergebnissen von Fig. 2c. Leider ist ein umfangreicherer quantitativer Vergleich zwischen allen experimentellen Vorrichtungen von Fig. 3 ist aufgrund großer Schwankungen ihrer Dunkelwiderstände nicht möglich. Solche Variationen wurden sogar zwischen verschiedenen Proben beobachtet, die auf demselben Design basieren (einschließlich verschiedener blanker Proben), wobei die Ansprechempfindlichkeit mit zunehmendem Dunkelwiderstand konsistent zunimmt und möglicherweise durch herstellungsbedingte Defekte verursacht wird, die die Trägerdichte beeinflussen oder den Leckstrom fördern. Dadurch wird in Fig. 3l wir schließen nur Daten ein, die mit Geräten mit demselben dunklen Widerstand (~ 1,5 kΩ) gemessen wurden. Es sollte auch beachtet werden, dass die Werte der Spitzenempfindlichkeit pro angelegter Spannung, die in Fig. 3l (~ 10 mA W−1 V−1) sind für diese Art von Photodetektoren sinnvoll, insbesondere angesichts ihres großen Zwischenelektrodenabstandes d ≈ 300 µm, der die photoleitende Verstärkung (proportional zu 1 /d2) 28 begrenzt.

Bildrekonstruktion

Als nächstes untersuchen wir die Abbildungsmöglichkeiten der soeben beschriebenen winkelsensitiven Photodetektoren. Wir betrachten eine linsenlose Compound-Eye-Kameraarchitektur, die aus einem planaren Array dieser Geräte besteht, wobei jedes Pixel eine gerichtete Photodetektion mit einer anderen Kombination von Polar- und Azimutwinkeln (θp bzw. ϕp) bietet. Der Wert von θp kann durch Variation des Gitterkopplerdesigns gesteuert werden, wie oben diskutiert. Für ein festes Design kann ϕp variiert werden, indem einfach die gesamte Metafläche um ihre Oberflächennormale auf dem entsprechenden Photodetektor gedreht wird. Unter Verwendung dieser Pixelanordnung haben wir eine Reihe numerischer Simulationen mit dem folgenden Bilderzeugungsmodell durchgeführt. Wir betrachten Objekte, die ausreichend weit vom Pixelarray entfernt sind, so dass jeder Winkel eindeutig einem anderen räumlichen Punkt auf dem Objekt entspricht (Abb. 4a). Jedes Pixel integriert die erfasste Gesamtintensität entsprechend seiner Winkelantwort. Der Bildgebungsprozess kann dann durch eine lineare Matrixgleichung y = Ax beschrieben werden, die die Intensitätsverteilung des Objekts (x) mit den erfassten Daten (y) durch eine Sensormatrix (A) in Beziehung setzt (Fig. 4b). Die Winkelantwort jedes Pixels bildet einen anderen Zeilenvektor von A, der die Intensitätsbeiträge zu dem Pixelsignal von verschiedenen Punkten auf dem Objekt quantifiziert29. Um die Intensitätsverteilung des Objekts zu erhalten, führen wir eine Bildrekonstruktion basierend auf der TSVD-Technik (Truncated Singular Value Decomposition) durch30. Das geschätzte Objekt ist gegeben durch \({\hat{\mathbf{x}}} = \mathop{\sum}\nolimits_{l = 1}^L {\frac{1}{{\sigma _l}}} ({\mathbf{y}},{\mathbf{u}}_l){\mathbf{v}}_l\), wobei ul und vl den l-ten linken bzw. rechten Singularvektor bezeichnen und σl der entsprechende Singularwert ist. L ist ein Regularisierungsparameter, der die Anzahl der in der TSVD-Lösung verwendeten singulären Vektoren definiert, die durch manuelle Abstimmung basierend auf der visuellen Inspektion des rekonstruierten Bildes optimiert wird.

Abb. 4: Datenerfassung und Bildrekonstruktion.
figure4

eine schematische Darstellung der Abbildungsgeometrie. Jedes Pixel integriert die einfallende Lichtintensität aus verschiedenen Richtungen entsprechend seiner Winkelreaktion. b Bilderzeugungsmodell. Die Pixel-Array-Messung wird durch eine lineare Gleichung y = Ax auf das Objekt bezogen, wobei die Erfassungsmatrix A die Winkelantworten aller Pixel enthält. c-f Repräsentatives Objekt (c) und entsprechende Bildrekonstruktion ergibt sich bei SNR = 56 dB (d–f). g-j Beispiel eines komplexeren Objekts (g) und entsprechende Bildrekonstruktion ergibt sich bei SNR = 73 dB (h–j). Das ursprüngliche Kameramannbild (g) wird mit Genehmigung des Urheberrechtsinhabers (Massachusetts Institute of Technology) verwendet. Die Bilder von d, h basieren auf den simulierten Responsivitätsmustern von Fig. 2 mit einem 6240-Pixel-Array bei λ0 = 1550 nm. Die Bilder von e und i basieren auf den experimentellen Responsivitätsmustern von Fig. 3 mit einem 5280-Pixel-Array bei λ0 = 1550 nm. Die Bilder von f und j basieren auf den simulierten Mustern unter breitbandiger Beleuchtung mit der Bandbreite δλ/λ0 = 10 % (f) und 5 % (j). Der Bildrekonstruktionsalgorithmus wird öffentlich zugänglich gemacht.

Mit diesem Ansatz haben wir die Fähigkeit unserer entworfenen und hergestellten Metaoberflächen validiert, komplexe Bildrekonstruktionen zu ermöglichen. Für die entworfenen Strukturen wird die Abtastmatrix A aus den berechneten Angular Response Maps von Fig. 2d-f und ergänzende Fig. 5, zusammen mit ihren Interpolationen für zusätzliche Metaflächen, die eine Spitzenübertragung bei verschiedenen Polarwinkeln bereitstellen. Das Verfahren zum Interpolieren neuer Pixelantworten ist in der ergänzenden Anmerkung 6 detailliert beschrieben, und mehrere interpolierte Beispiele sind in den ergänzenden Fig. 9 und 10. Die erforderliche Anzahl verschiedener Pixel wird durch Berechnung der Überlagerung aller Pixelantworten bestimmt, um eine gleichmäßige Sichtfeldabdeckung zu gewährleisten, und durch zusätzliche Abbildungssimulationen (siehe ergänzende Anmerkung 7 und ergänzende Abb. 11). Basierend auf dieser Analyse wählen wir Δθp = 1.5 ° und ΔϕP = 3 ° für die Winkelabstände zwischen den Richtungen der Spitzendetektion aufeinanderfolgender Pixel, die eine gute Bildrekonstruktionsqualität mit einer relativ kleinen Anzahl von Pixeln (6240) liefern, die das volle ± 75 ° -Sichtfeld der entworfenen Metaflächen abdecken. Bei größerem Abstand in θp leiden die Rekonstruktionsergebnisse an radial orientierten Streifenartefakten aufgrund fehlender Abdeckung in den Winkelantworten. Bei größerem Abstand in ϕp verschlechtert sich die Auflösung insbesondere in den Bereichen mit hohem Polarwinkel. Ein ähnliches Verfahren mit den gleichen Winkelabständen wird verwendet, um die experimentellen Vorrichtungen zu modellieren, basierend auf den gemessenen Winkelantwortkarten von Fig. 3d-g und ergänzende Fig. 8. Das Sichtfeld für diese Interpolationen ist auf ± 65 ° reduziert (begrenzt durch den maximalen Polarwinkel der Peakdetektion, gemessen mit den vorliegenden Proben), aufgespannt von 5280 Pixeln.

Den erfassten Daten (den Vektoren y) wird auch weißes Gaußsches Rauschen hinzugefügt, um eine realistische Photodetektorleistung zu gewährleisten (siehe ergänzende Anmerkung 8). Im Allgemeinen ist das Signal-Rausch-Verhältnis (SNR) einer CCD/CMOS-Kamera durch die Sättigungsladung (Full Well Capacity) der einzelnen Pixel begrenzt. Darüber hinaus kann sie (um den Faktor \ (\ sqrt N\)) erhöht werden, indem die Signale von (N) identischen Pixeln gemittelt werden, auf Kosten einer entsprechenden Verringerung der Auflösung und / oder Zunahme der aktiven Fläche. Hier verwenden wir ein Baseline-Single-Pixel-SNR von 56 dB (d. h. ysignal / ynoise = 631), wie in der Literatur mit Standard-CMOS-Technologie und optimierten Schaltungsdesigns berichtet, selbst für einen Pixelabstand von nur ~ 8 µm31,32. Darüber hinaus führen wir auch Simulationen für SNR = 63 und 73 dB durch, was mit größeren Arrays erreicht werden kann, bei denen jedes Metaoberflächendesign auf N = 5 bzw. 50 Pixel angewendet wird, deren Signale dann zusammengefasst und gemittelt werden. Die Gesamtzahl der Pixel erhöht sich entsprechend auf etwa 260.000 bzw. 310.000 (bei Kameras auf Basis der gemessenen bzw. simulierten Geräte bei dem höchsten SNR von 73 dB), was immer noch deutlich im Bereich der aktuellen CMOS-Technologie liegt. Nebenbei sei angemerkt, dass die gleichen SNR-Werte auch mit mehreren anderen Kombinationen von Pixelzahl, Pixelabmessungen, Full-Well-Kapazität und Bin-Größe N erreicht werden könnten.

Die simulierten Abbildungsfähigkeiten unserer Geräte sind in Abb. 4. Abbildung 4c-f enthält Ergebnisse, die für ein relativ einfaches Objekt erhalten wurden (das Tempolimit-Verkehrszeichen von Abb. 4c), abgebildet beim Baseline-SNR von 56 dB. Ein komplexeres Objekt (das Kameramannbild von Abb. 4g) wird in Fig. 4g-j, abgebildet mit dem größeren SNR von 73 dB. Simulationsergebnisse für Arrays aus beiden berechneten abgeleitet (Abb. 4d, h) und gemessen (Fig. 4e, i) angular Response Maps dargestellt sind. In allen Fällen wird eine qualitativ hochwertige Bildrekonstruktion erzielt, wobei die Hauptmerkmale beider Objekte originalgetreu wiedergegeben werden. Der Vergleich zwischen den erhaltenen Ergebnissen mit den berechneten und gemessenen Winkelantworten zeigt im letzteren Fall einen gewissen Auflösungsverlust, der durch die geringere Winkelselektivität und die höheren Hintergrundpegel der experimentellen Karten verursacht wird. In jedem Fall zeigen diese Daten eindeutig die Fähigkeit, gut erkennbare Bilder auch auf der Grundlage der gemessenen Eigenschaften der hergestellten Vorrichtungen zu rekonstruieren. Diese Beobachtungen werden durch umfangreiche Simulationen bestätigt, die mit mehreren anderen Objekten unterschiedlicher Komplexität an verschiedenen SNRs durchgeführt wurden, wie in der ergänzenden Abb. 12.

Schließlich untersuchen wir, wie die Abbildungsfähigkeiten derselben Geräte durch die optische Bandbreite δλ des einfallenden Lichts unter polychromatischer Beleuchtung beeinflusst werden. Alle bisher verwendeten Angular Response Maps werden entweder berechnet oder bei einer einzigen Wellenlänge gemessen – dem Zielauslegungswert λ0 = 1550 nm. Gleichzeitig kann aufgrund der diffraktiven Natur unserer Metaoberflächen erwartet werden, dass ihre Transmissionseigenschaften mit der einfallenden Wellenlänge variieren. Wichtig ist jedoch, dass diese Variationen in unserem Computational Imaging-Ansatz berücksichtigt werden können, so dass gut erkennbare Bilder auch unter einigermaßen polychromatischer Beleuchtung mit nur einem relativ geringen Auflösungsverlust rekonstruiert werden können. Insbesondere wenn sich das Einfallsspektrum über eine endliche Bandbreite δλ erstreckt, ist der Haupteffekt auf das Winkelverhalten jeder Vorrichtung eine proportionale Verbreiterung δθp des Detektionspeaks. Unter Verwendung der obigen Beugungsbedingung finden wir δθp = δλ / λ0 (nSPP + sinθp) / cosθp, wobei θp der Polarwinkel der Peakdetektion bei λ0 ist und der effektive SPP-Index nSPP = λ0 / λSPP in den Metaoberflächendesigns von Fig. 2. Eine solche Verbreiterung kann durch eine 2D-Faltung zwischen der monochromatischen Pixelantwort und einem Gaußschen Unschärfekern der Breite δθp in die Bildrekonstruktionssimulationen einbezogen werden. Beispiele für Bilder, die mit diesem Ansatz auf die simulierten Karten angewendet werden, sind in Abb. 4f, j, einschließlich des einfachen Geschwindigkeitsbegrenzungszeichens abgebildet mit einer Bandbreite δλ/λ0 von 10% bei 56 dB SNR (Fig. 4f) und das komplexere Kameramannbild für δλ/λ0 = 5% und 73 dB SNR (Fig. 4j). Die Hauptmerkmale beider Objekte sind in den Bildern wieder gut wiedergegeben. Weitere Beispiele sind der ergänzenden Fig. 13. Die in diesen Simulationen betrachteten Abbildungssituationen können in der Praxis realisiert werden, indem das gesamte Kameraarray mit einem Bandpassfilter von 155 oder 77 nm Bandbreite abgedeckt wird. Größere Betriebsbandbreiten mit höherer Bildqualität könnten unter Verwendung komplexerer Gradientenmetaoberflächen erreicht werden, deren Bestandteile so ausgelegt sind, dass sie bei mehreren Wellenlängen die gleiche Reaktion liefern wie bei den jüngsten Arbeiten zur Entwicklung breitbandiger Linsen 33. Gleichzeitig kann es auch möglich sein, einige Informationen über die Farbverteilung des Objekts zu extrahieren, indem zuerst die spektralen Antworten jedes Pixels charakterisiert werden, gefolgt von einem Mehrkanalbildrekonstruktionsverfahren, ähnlich den jüngsten Arbeiten zur diffraktiven Optik-basierten Farbabbildung34.