Von klassischen CMOS-Sensoren über BSI bis hin zu Stacked CMOS und Global Shutter

Digitale Kameras haben in den vergangenen zwei Jahrzehnten enorme Fortschritte gemacht. Während Auflösung, Dynamikumfang und Rauschverhalten kontinuierlich verbessert wurden, stand eine andere Eigenschaft lange Zeit im Schatten: die Auslesegeschwindigkeit des Bildsensors.

Gerade moderne Anforderungen wie hochauflösende Serienbilder, 8K-Video, KI-gestützte Motiverkennung und elektronische Verschlüsse stellen Bildsensoren vor enorme Herausforderungen. Die Entwicklung von klassischen CMOS-Sensoren über Backside-Illuminated-Sensoren (BSI) bis hin zu Stacked-CMOS-Architekturen zeigt, wie die Industrie versucht, diese Herausforderungen zu bewältigen.

Der klassische CMOS-Sensor

Ein CMOS-Sensor besteht aus Millionen einzelner Pixel. Jedes Pixel enthält eine Fotodiode, die einfallendes Licht in elektrische Ladung umwandelt.

Vereinfacht besteht ein Pixel aus:

Fotodiode
Transistoren zur Verstärkung
Schalttransistoren zur Auslesung

Klassischer CMOS-Sensor

Aufbau des klassischen CMOS-Sensors; Darstellung der Schichten im Die

Frontside Illuminated (FSI)

Bei klassischen CMOS-Sensoren befindet sich die Verdrahtung oberhalb der lichtempfindlichen Fotodiode.

Prinzip

Licht trifft zunächst auf:

Mikrolinse
Metallverdrahtung
Transistorstrukturen
Fotodiode

Ein Teil des Lichts wird dabei reflektiert oder abgeschattet.

Nachteile

geringere Lichtausbeute
schlechteres Signal-Rausch-Verhältnis
eingeschränkte Leistung bei hohen ISO-Werten
kleinere Pixel verlieren überproportional viel Licht

Auslesung eines klassischen CMOS-Sensors

Die Auslesung erfolgt zeilenweise.

Rolling Shutter

Der Sensor liest nicht alle Pixel gleichzeitig aus.

Stattdessen:

Zeile 1 wird gelesen
anschließend Zeile 2
anschließend Zeile 3

und so weiter.

Bei einem 24-Megapixel-Sensor können mehrere Tausend Zeilen nacheinander ausgelesen werden.

Folgen

Bewegt sich das Motiv währenddessen oder schwenkt die Kamera schnell, entstehen:

schiefe Gebäude
verbogene Propeller
verzerrte Fahrzeuge
sogenannte "Jello-Effekte"

Dieses Phänomen bezeichnet man als Rolling Shutter.

Backside Illuminated Sensoren (BSI)

Mit steigenden Auflösungen wurden die Pixel immer kleiner.

Dadurch nahm der Anteil der Verdrahtung innerhalb jedes Pixels relativ zu.

Die Lösung war die Entwicklung des BSI-Sensors.

Aufbau eines BSI-Sensors

Beim BSI-Sensor wird der Wafer nach der Fertigung umgedreht.

Das Licht trifft nun zuerst auf die Fotodiode.

Aufbau

Licht →

Mikrolinse
Farbfilter
Fotodiode

Erst dahinter befinden sich:

Transistoren
Metalllagen
Verdrahtung

BSI-Sensoren

Der Unterschied zwischen einem klassischen CMOS-Sensor und einem BSI-Sensors liegt in der Lage der Fotodoiden. Die Fotodioden befinden sich direkt unterhalb des Farbfilters.

Vorteile von BSI

Höhere Lichtausbeute

Da keine Verdrahtung mehr im Lichtweg liegt, erreicht mehr Licht die Fotodiode.

Besseres Rauschverhalten

Mehr Photonen erzeugen ein stärkeres Signal.

Dadurch verbessert sich:

Dynamikumfang
ISO-Leistung
Farbwiedergabe

Kleinere Pixel möglich

BSI war ein entscheidender Faktor für:

hochauflösende Smartphone-Sensoren
moderne Vollformatsensoren mit 45–60 MP

Einfluss auf die Auslesegeschwindigkeit

Hier wird häufig ein Missverständnis sichtbar.

BSI verbessert hauptsächlich die Lichtausbeute.

Die eigentliche Auslesegeschwindigkeit steigt nur geringfügig.

Die Pixel werden weiterhin zeilenweise gelesen.

Rolling-Shutter-Effekte bleiben grundsätzlich bestehen.

Stacked CMOS – der nächste große Entwicklungsschritt

Mit steigenden Anforderungen an Serienbildgeschwindigkeit und Videofunktionen reichte die klassische Sensorarchitektur nicht mehr aus.

Die Lösung war die Einführung von Stacked-CMOS-Sensoren.

Was bedeutet „Stacked“?

Bei einem Stacked-Sensor werden mehrere Halbleiterschichten übereinander gestapelt.

Typischerweise:

Ebene 1

Pixel-Ebene

Fotodioden
Pixeltransistoren

Ebene 2

Logik-Ebene

Signalverarbeitung
Ausleseschaltungen
Parallelprozessoren

Ebene 3 (optional)

DRAM-Speicher

Zwischenspeicherung großer Datenmengen

Stacked CMOS-Sensor

Der “Stacked CMOS-Sensor” besteht aus drei Ebenen. Jede der einzelnen Ebenen hat spezielle Funktionen, die das Auslesen der Bilddaten deutlich steigern.

Zum Vergleich alle Sensoren noch einmal nebeneinander.

Vergleich des Strahlengangs bei den verschiedenen Sensortechnologie

Warum ist das so wichtig?

Bei klassischen Sensoren konkurrieren Pixel und Logik um dieselbe Chipfläche.

Bei einem Stacked-Sensor können beide Ebenen unabhängig optimiert werden.

Dadurch entsteht:

mehr Platz für Ausleseschaltungen
mehr parallele Datenkanäle
deutlich höhere Datenraten

Auswirkungen auf die Auslesegeschwindigkeit

Hier liegt der eigentliche Durchbruch.

Ein klassischer CMOS-Sensor benötigt häufig:

20–40 ms für die Komplettauslesung

Ein moderner Stacked-Sensor schafft oft:

3–8 ms

Dadurch werden Rolling-Shutter-Effekte drastisch reduziert.

Beispiele moderner Kameras:

Sony Alpha 1
Nikon Z9
Sony Alpha 9 III

Diese Kameras erreichen:

hohe Serienbildraten
nahezu blackoutfreie Sucher
leistungsfähige Motivverfolgung
schnelle elektronische Verschlüsse

Wie werden die Pixel ausgelesen?

Jedes Pixel arbeitet zunächst analog.

Die Fotodiode sammelt Ladung.

Diese Ladung wird anschließend:

verstärkt
zeilenweise selektiert
an Analog-Digital-Wandler übergeben
digital verarbeitet

Klassischer CMOS

Wenige parallele Auslesekanäle.

Die Daten wandern durch lange Leitungswege.

Dadurch entsteht ein Flaschenhals.

BSI

Die Auslesung bleibt weitgehend identisch.

Verbessert wird primär die Lichtsammlung.

Stacked CMOS

Viele zusätzliche Ausleseschaltungen befinden sich direkt unter der Pixelebene.

Dadurch können zahlreiche Pixelgruppen gleichzeitig verarbeitet werden.

Die effektive Parallelisierung steigt massiv.

Der Weg zum Global Shutter

Der ultimative Traum vieler Fotografen ist die vollständige Eliminierung des Rolling Shutters.

Die technischen Hintergründe zum “globale shutter”

Rolling Shutter

Belichtung und Auslesung erfolgen zeilenweise.

Zeitliche Unterschiede zwischen oberster und unterster Zeile führen zu Verzerrungen.

Auswirkungen des Rolling-Shutter auf die Darstellung des Bildes

Global Shutter

Alle Pixel beginnen und beenden die Belichtung exakt gleichzeitig.

Jedes Pixel speichert seine Ladung zunächst lokal.

Erst danach erfolgt die Auslesung.

Damit entstehen:

keine Schräglagen
keine verbogenen Propeller
keine Rolling-Shutter-Artefakte

Ausleseverfahren der verschiedenen Sensoren und dessen Einfluss auf Fotos

Warum war Global Shutter lange schwierig?

Jedes Pixel benötigt zusätzliche Schaltungselemente:

Speicherzelle
zusätzliche Transistoren

Dadurch entstehen Probleme:

geringere Lichtausbeute
weniger Dynamikumfang
höheres Rauschen

Frühere Global-Shutter-Sensoren waren deshalb oft sichtbar schlechter als Rolling-Shutter-Sensoren.

Warum ermöglichen Stacked-Sensoren den Global Shutter?

Durch die zusätzliche Logikebene können viele Schaltungselemente aus der Pixelfläche ausgelagert werden.

Dadurch bleiben die Pixel lichtstark, obwohl zusätzliche Speicherfunktionen integriert werden.

Ein aktuelles Beispiel ist die Sony Alpha 9 III, deren Sensor erstmals einen Global Shutter ohne die früher typischen massiven Nachteile realisiert.

Warum steigt die Bildauflösung nicht so schnell wie die Leistung anderer CMOS-Schaltkreise?

Hier liegt ein grundlegender Unterschied zwischen Bildsensoren und klassischen Computerchips.

Prozessoren verarbeiten Elektronen

Moderne Prozessoren arbeiten mit immer kleineren Transistoren.

Je kleiner die Struktur:

desto mehr Transistoren
desto höhere Rechenleistung

Bildsensoren sammeln Photonen

Ein Bildsensor ist durch die Physik des Lichts begrenzt.

Ein Pixel benötigt eine gewisse Fläche, um genügend Photonen einzufangen.

Wird ein Pixel zu klein:

sinkt die Lichtmenge
das Signal wird schwächer
das Rauschen steigt

Das Beugungslimit

Zusätzlich existiert eine optische Grenze.

Licht breitet sich wellenförmig aus.

Irgendwann wird der Lichtfleck größer als das Pixel selbst.

Weitere Verkleinerungen bringen dann kaum noch Detailgewinn.

Datenmengen wachsen quadratisch

Ein weiterer Faktor ist die Datenrate.

Ein Sensor mit:

24 MP erzeugt 24 Millionen Pixel
48 MP erzeugt doppelt so viele Pixel
96 MP erzeugt viermal so viele Pixel

Mit jeder Auflösungssteigerung müssen auch:

Ausleseschaltungen
Speicher
Bildprozessoren
Kamerabus
Speicherkarten

mithalten.

Die Herausforderung wächst daher wesentlich schneller als bei vielen anderen elektronischen Bauteilen.

Fazit

Die Entwicklung moderner Bildsensoren wurde in den letzten Jahren weniger von der reinen Auflösung als von der Auslesegeschwindigkeit geprägt.

Klassische CMOS-Sensoren bieten eine einfache und kostengünstige Architektur, leiden jedoch unter vergleichsweise langsamer Auslesung.
BSI-Sensoren verbessern vor allem die Lichtausbeute und ermöglichen kleinere Pixel mit besserem Rauschverhalten.
Stacked-CMOS-Sensoren erhöhen durch zusätzliche Logik- und Speicherebenen die Parallelisierung massiv und beschleunigen die Sensorauslesung um ein Vielfaches.
Diese Architektur ebnet den Weg zum Global Shutter, bei dem alle Pixel gleichzeitig belichtet werden und Rolling-Shutter-Artefakte vollständig verschwinden.

Während die Halbleiterindustrie weiterhin immer kleinere Transistoren entwickelt, stößt die Auflösung von Bildsensoren zunehmend an physikalische Grenzen der Photonenstatistik und Optik. Deshalb konzentriert sich die aktuelle Sensorentwicklung weniger auf immer mehr Megapixel und zunehmend auf schnellere Auslesung, höhere Dynamik, bessere Lichtausbeute und intelligentere Signalverarbeitung.

CMOS-Bildsensoren im Wandel der Zeit

Von klassischen CMOS-Sensoren über BSI bis hin zu Stacked CMOS und Global Shutter

Der klassische CMOS-Sensor