CMOS-Bildsensoren im Wandel der Zeit
Von klassischen CMOS-Sensoren über BSI bis hin zu Stacked CMOS und Global Shutter
Digitale Kameras haben in den vergangenen zwei Jahrzehnten enorme Fortschritte gemacht. Während Auflösung, Dynamikumfang und Rauschverhalten kontinuierlich verbessert wurden, stand eine andere Eigenschaft lange Zeit im Schatten: die Auslesegeschwindigkeit des Bildsensors.
Gerade moderne Anforderungen wie hochauflösende Serienbilder, 8K-Video, KI-gestützte Motiverkennung und elektronische Verschlüsse stellen Bildsensoren vor enorme Herausforderungen. Die Entwicklung von klassischen CMOS-Sensoren über Backside-Illuminated-Sensoren (BSI) bis hin zu Stacked-CMOS-Architekturen zeigt, wie die Industrie versucht, diese Herausforderungen zu bewältigen.
Der klassische CMOS-Sensor
Ein CMOS-Sensor besteht aus Millionen einzelner Pixel. Jedes Pixel enthält eine Fotodiode, die einfallendes Licht in elektrische Ladung umwandelt.
Vereinfacht besteht ein Pixel aus:
Fotodiode
Transistoren zur Verstärkung
Schalttransistoren zur Auslesung
Klassischer CMOS-Sensor
Aufbau des klassischen CMOS-Sensors; Darstellung der Schichten im Die
Frontside Illuminated (FSI)
Bei klassischen CMOS-Sensoren befindet sich die Verdrahtung oberhalb der lichtempfindlichen Fotodiode.
Prinzip
Licht trifft zunächst auf:
Mikrolinse
Metallverdrahtung
Transistorstrukturen
Fotodiode
Ein Teil des Lichts wird dabei reflektiert oder abgeschattet.
Nachteile
geringere Lichtausbeute
schlechteres Signal-Rausch-Verhältnis
eingeschränkte Leistung bei hohen ISO-Werten
kleinere Pixel verlieren überproportional viel Licht
Auslesung eines klassischen CMOS-Sensors
Die Auslesung erfolgt zeilenweise.
Rolling Shutter
Der Sensor liest nicht alle Pixel gleichzeitig aus.
Stattdessen:
Zeile 1 wird gelesen
anschließend Zeile 2
anschließend Zeile 3
und so weiter.
Bei einem 24-Megapixel-Sensor können mehrere Tausend Zeilen nacheinander ausgelesen werden.
Folgen
Bewegt sich das Motiv währenddessen oder schwenkt die Kamera schnell, entstehen:
schiefe Gebäude
verbogene Propeller
verzerrte Fahrzeuge
sogenannte "Jello-Effekte"
Dieses Phänomen bezeichnet man als Rolling Shutter.
Backside Illuminated Sensoren (BSI)
Mit steigenden Auflösungen wurden die Pixel immer kleiner.
Dadurch nahm der Anteil der Verdrahtung innerhalb jedes Pixels relativ zu.
Die Lösung war die Entwicklung des BSI-Sensors.
Aufbau eines BSI-Sensors
Beim BSI-Sensor wird der Wafer nach der Fertigung umgedreht.
Das Licht trifft nun zuerst auf die Fotodiode.
Aufbau
Licht →
Mikrolinse
Farbfilter
Fotodiode
Erst dahinter befinden sich:
Transistoren
Metalllagen
Verdrahtung
BSI-Sensoren
Der Unterschied zwischen einem klassischen CMOS-Sensor und einem BSI-Sensors liegt in der Lage der Fotodoiden. Die Fotodioden befinden sich direkt unterhalb des Farbfilters.
Vorteile von BSI
Höhere Lichtausbeute
Da keine Verdrahtung mehr im Lichtweg liegt, erreicht mehr Licht die Fotodiode.
Besseres Rauschverhalten
Mehr Photonen erzeugen ein stärkeres Signal.
Dadurch verbessert sich:
Dynamikumfang
ISO-Leistung
Farbwiedergabe
Kleinere Pixel möglich
BSI war ein entscheidender Faktor für:
hochauflösende Smartphone-Sensoren
moderne Vollformatsensoren mit 45–60 MP
Einfluss auf die Auslesegeschwindigkeit
Hier wird häufig ein Missverständnis sichtbar.
BSI verbessert hauptsächlich die Lichtausbeute.
Die eigentliche Auslesegeschwindigkeit steigt nur geringfügig.
Die Pixel werden weiterhin zeilenweise gelesen.
Rolling-Shutter-Effekte bleiben grundsätzlich bestehen.
Stacked CMOS – der nächste große Entwicklungsschritt
Mit steigenden Anforderungen an Serienbildgeschwindigkeit und Videofunktionen reichte die klassische Sensorarchitektur nicht mehr aus.
Die Lösung war die Einführung von Stacked-CMOS-Sensoren.
Was bedeutet „Stacked“?
Bei einem Stacked-Sensor werden mehrere Halbleiterschichten übereinander gestapelt.
Typischerweise:
Ebene 1
Pixel-Ebene
Fotodioden
Pixeltransistoren
Ebene 2
Logik-Ebene
Signalverarbeitung
Ausleseschaltungen
Parallelprozessoren
Ebene 3 (optional)
DRAM-Speicher
Zwischenspeicherung großer Datenmengen
Stacked CMOS-Sensor
Der “Stacked CMOS-Sensor” besteht aus drei Ebenen. Jede der einzelnen Ebenen hat spezielle Funktionen, die das Auslesen der Bilddaten deutlich steigern.
Zum Vergleich alle Sensoren noch einmal nebeneinander.
Vergleich des Strahlengangs bei den verschiedenen Sensortechnologie
Warum ist das so wichtig?
Bei klassischen Sensoren konkurrieren Pixel und Logik um dieselbe Chipfläche.
Bei einem Stacked-Sensor können beide Ebenen unabhängig optimiert werden.
Dadurch entsteht:
mehr Platz für Ausleseschaltungen
mehr parallele Datenkanäle
deutlich höhere Datenraten
Auswirkungen auf die Auslesegeschwindigkeit
Hier liegt der eigentliche Durchbruch.
Ein klassischer CMOS-Sensor benötigt häufig:
20–40 ms für die Komplettauslesung
Ein moderner Stacked-Sensor schafft oft:
3–8 ms
Dadurch werden Rolling-Shutter-Effekte drastisch reduziert.
Beispiele moderner Kameras:
Sony Alpha 1
Nikon Z9
Sony Alpha 9 III
Diese Kameras erreichen:
hohe Serienbildraten
nahezu blackoutfreie Sucher
leistungsfähige Motivverfolgung
schnelle elektronische Verschlüsse
Wie werden die Pixel ausgelesen?
Jedes Pixel arbeitet zunächst analog.
Die Fotodiode sammelt Ladung.
Diese Ladung wird anschließend:
verstärkt
zeilenweise selektiert
an Analog-Digital-Wandler übergeben
digital verarbeitet
Klassischer CMOS
Wenige parallele Auslesekanäle.
Die Daten wandern durch lange Leitungswege.
Dadurch entsteht ein Flaschenhals.
BSI
Die Auslesung bleibt weitgehend identisch.
Verbessert wird primär die Lichtsammlung.
Stacked CMOS
Viele zusätzliche Ausleseschaltungen befinden sich direkt unter der Pixelebene.
Dadurch können zahlreiche Pixelgruppen gleichzeitig verarbeitet werden.
Die effektive Parallelisierung steigt massiv.
Der Weg zum Global Shutter
Der ultimative Traum vieler Fotografen ist die vollständige Eliminierung des Rolling Shutters.
Die technischen Hintergründe zum “globale shutter”
Rolling Shutter
Belichtung und Auslesung erfolgen zeilenweise.
Zeitliche Unterschiede zwischen oberster und unterster Zeile führen zu Verzerrungen.
Auswirkungen des Rolling-Shutter auf die Darstellung des Bildes
Global Shutter
Alle Pixel beginnen und beenden die Belichtung exakt gleichzeitig.
Jedes Pixel speichert seine Ladung zunächst lokal.
Erst danach erfolgt die Auslesung.
Damit entstehen:
keine Schräglagen
keine verbogenen Propeller
keine Rolling-Shutter-Artefakte
Ausleseverfahren der verschiedenen Sensoren und dessen Einfluss auf Fotos
Warum war Global Shutter lange schwierig?
Jedes Pixel benötigt zusätzliche Schaltungselemente:
Speicherzelle
zusätzliche Transistoren
Dadurch entstehen Probleme:
geringere Lichtausbeute
weniger Dynamikumfang
höheres Rauschen
Frühere Global-Shutter-Sensoren waren deshalb oft sichtbar schlechter als Rolling-Shutter-Sensoren.
Warum ermöglichen Stacked-Sensoren den Global Shutter?
Durch die zusätzliche Logikebene können viele Schaltungselemente aus der Pixelfläche ausgelagert werden.
Dadurch bleiben die Pixel lichtstark, obwohl zusätzliche Speicherfunktionen integriert werden.
Ein aktuelles Beispiel ist die Sony Alpha 9 III, deren Sensor erstmals einen Global Shutter ohne die früher typischen massiven Nachteile realisiert.
Warum steigt die Bildauflösung nicht so schnell wie die Leistung anderer CMOS-Schaltkreise?
Hier liegt ein grundlegender Unterschied zwischen Bildsensoren und klassischen Computerchips.
Prozessoren verarbeiten Elektronen
Moderne Prozessoren arbeiten mit immer kleineren Transistoren.
Je kleiner die Struktur:
desto mehr Transistoren
desto höhere Rechenleistung
Bildsensoren sammeln Photonen
Ein Bildsensor ist durch die Physik des Lichts begrenzt.
Ein Pixel benötigt eine gewisse Fläche, um genügend Photonen einzufangen.
Wird ein Pixel zu klein:
sinkt die Lichtmenge
das Signal wird schwächer
das Rauschen steigt
Das Beugungslimit
Zusätzlich existiert eine optische Grenze.
Licht breitet sich wellenförmig aus.
Irgendwann wird der Lichtfleck größer als das Pixel selbst.
Weitere Verkleinerungen bringen dann kaum noch Detailgewinn.
Datenmengen wachsen quadratisch
Ein weiterer Faktor ist die Datenrate.
Ein Sensor mit:
24 MP erzeugt 24 Millionen Pixel
48 MP erzeugt doppelt so viele Pixel
96 MP erzeugt viermal so viele Pixel
Mit jeder Auflösungssteigerung müssen auch:
Ausleseschaltungen
Speicher
Bildprozessoren
Kamerabus
Speicherkarten
mithalten.
Die Herausforderung wächst daher wesentlich schneller als bei vielen anderen elektronischen Bauteilen.
Fazit
Die Entwicklung moderner Bildsensoren wurde in den letzten Jahren weniger von der reinen Auflösung als von der Auslesegeschwindigkeit geprägt.
Klassische CMOS-Sensoren bieten eine einfache und kostengünstige Architektur, leiden jedoch unter vergleichsweise langsamer Auslesung.
BSI-Sensoren verbessern vor allem die Lichtausbeute und ermöglichen kleinere Pixel mit besserem Rauschverhalten.
Stacked-CMOS-Sensoren erhöhen durch zusätzliche Logik- und Speicherebenen die Parallelisierung massiv und beschleunigen die Sensorauslesung um ein Vielfaches.
Diese Architektur ebnet den Weg zum Global Shutter, bei dem alle Pixel gleichzeitig belichtet werden und Rolling-Shutter-Artefakte vollständig verschwinden.
Während die Halbleiterindustrie weiterhin immer kleinere Transistoren entwickelt, stößt die Auflösung von Bildsensoren zunehmend an physikalische Grenzen der Photonenstatistik und Optik. Deshalb konzentriert sich die aktuelle Sensorentwicklung weniger auf immer mehr Megapixel und zunehmend auf schnellere Auslesung, höhere Dynamik, bessere Lichtausbeute und intelligentere Signalverarbeitung.
Kurzzusammenfassung der Sensoreigenschaften

