DDR-, GDDR- und HBM-Speichergeschwindigkeiten und Bandbreite
Die Leistung moderner Computer wird maßgeblich von der Geschwindigkeit und dem Typ des verwendeten Speichers beeinflusst. DDR-, GDDR- und HBM-Speicher sind für unterschiedliche Zwecke optimiert, sei es Hauptspeicher für CPUs, Speicher für Grafikkarten oder Aufgaben, die rechenintensive Berechnungen mit hoher Bandbreite erfordern. In diesem Beitrag vergleiche ich die Geschwindigkeiten und wichtigsten Parameter dieser Speichertypen.

Die Leistung von Computerhardware-Standards wird oft mit theoretischen Maximalwerten beworben, die unter idealen Laborbedingungen gemessen werden (in der Praxis können Übertragungsraten durch Gerätecontroller, Temperatur oder andere Engpässe begrenzt sein). Diese Werte spiegeln nicht unbedingt die Geschwindigkeiten im realen Einsatz wider, eignen sich aber hervorragend für Vergleichszwecke, da sie die Unterschiede zwischen den technologischen Generationen deutlich aufzeigen.
In den folgenden Tabellen stelle ich für jeden Standard den theoretischen Maximalwert bereit, der zur besseren Lesbarkeit und zum Vergleich gerundet und, falls zutreffend, immer in Byte (genauer gesagt MB/s) angegeben ist. Ich habe hier über Computer-Datenübertragungs- und Speicherstandards, Maßeinheiten, Geschwindigkeiten und deren theoretische Grundlagen geschrieben.
DDR SDRAM (Systemspeicher)
Computerspeicher (RAM - Random Access Memory) dient als temporärer, schnell zugreifbarer Datenspeicher des Computers. Moderne RAM-Module verwenden die DDR-Technologie (Double Data Rate), was bedeutet, dass die Datenübertragung sowohl an der steigenden als auch an der fallenden Flanke des Taktsignals erfolgt, wodurch die Datenübertragungsrate im Vergleich zum ursprünglichen SDRAM effektiv verdoppelt wird.
Das ursprüngliche SDRAM (manchmal auch als SD- oder SDR-RAM bezeichnet, um es von DDR zu unterscheiden) arbeitete mit Taktraten von 66-133 MHz. Da es sich nicht um "Double Data Rate" handelte, entsprach seine effektive Datenübertragungsrate (in Übertragungen pro Sekunde) seiner Taktrate (in Zyklen pro Sekunde).
MT/s (MegaTransfers pro Sekunde) gibt an, wie viele Millionen Datenübertragungsoperationen der Speicher pro Sekunde durchführen kann. Dies ist für DDR-Speicher (Double Data Rate) von Bedeutung, da pro Taktzyklus zwei Datenübertragungen stattfinden – eine an der steigenden und eine an der fallenden Flanke des Taktsignals.
Nehmen wir als Beispiel DDR2-400-Speicher:
- Seine Basistaktrate beträgt 200 MHz.
- Da er die DDR-Technologie (Double Data Rate) verwendet, ist die tatsächliche Übertragungsrate doppelt so hoch wie die Taktrate: 400 MT/s.
Zur besseren Veranschaulichung:
- Eine Taktrate von 200 MHz bedeutet 200 Millionen Taktzyklen pro Sekunde.
- In jedem Zyklus finden 2 Datenübertragungen statt (steigende und fallende Flanke).
- Daher betragen die Gesamtübertragungen: 200 Millionen Zyklen/Sek. × 2 Übertragungen/Zyklus = 400 Millionen Übertragungen pro Sekunde (400 MT/s).
Dies unterscheidet sich von der Bandbreite (MB/s), die die tatsächlich bewegte Datenmenge misst. Die Bandbreite wird berechnet, indem der MT/s-Wert mit der Speicherbusbreite (typischerweise 8 Byte für ein Standard-64-Bit-DDR-DIMM) multipliziert wird: 400 MT/s × 8 Byte/Übertragung = 3200 MB/s.
Version | Übertragungsrate (MT/s) | Modulname | Erscheinungsjahr | Taktrate (MHz) | Bandbreite (MB/s) |
---|---|---|---|---|---|
DDR | 200-400 | PC-1600 - PC-3200 | 1998 | 100-200 | 1.600 - 3.200 MB/s |
DDR2 | 400-1066 | PC2-3200 - PC2-8500 | 2003 | 200-533 | 3.200 - 8.533 MB/s |
DDR3 | 800-2133 | PC3-6400 - PC3-17000 | 2007 | 400-1066 | 6.400 - 17.066 MB/s |
DDR4 | 1600-3200+ | PC4-12800 - PC4-25600+ | 2014 | 800-1600+ | 12.800 - 25.600+ MB/s |
DDR5 | 4800-8000+ | PC5-38400 - PC5-64000+ | 2020 | 2400-4000+ | 38.400 - 64.000+ MB/s |
Bandbreite berechnet für eine standardmäßige 64-Bit (8 Byte) breite Speicherschnittstelle (einzelnes DIMM). Dual-Channel- oder Quad-Channel-Konfigurationen vervielfachen diese Bandbreite.
Hersteller vermarkten Speichermodule mit unterschiedlichen Bezeichnungen, wie z. B. Versionsnummer (DDR4), Übertragungsrate (3200 MT/s) oder Modulname (PC4-25600). Dies kann verwirrend sein, aber die obige Tabelle hilft, äquivalente Module zu identifizieren. Zum Beispiel beziehen sich DDR4-3200 und PC4-25600 auf die gleiche Speicherspezifikation.
DDR ECC-Speicher
ECC-Speicher (Error-Correcting Code) ist eine spezielle Art von Speicher, der hauptsächlich in Servern, Workstations und anderen Systemen verwendet wird, die eine hohe Zuverlässigkeit erfordern. DDR-ECC-Speicher unterscheidet sich von Standard-DDR-Speicher ohne ECC durch seine Fehlerkorrekturfähigkeiten.
- Fehlerkorrektur: ECC-Speicher kann Single-Bit-Fehler automatisch erkennen und korrigieren sowie Multi-Bit-Fehler erkennen. Dies reduziert das Risiko von Datenbeschädigung und Systemabstürzen erheblich.
- Zusätzliche Bits: Ein ECC-Speichermodul verwendet typischerweise zusätzliche Bits pro Datenwort (z. B. 72 Bits für 64 Datenbits), um die Fehlerprüfungscodes zu speichern und so die Fehlerkorrektur zu ermöglichen.
- Kompatibilität: Nicht alle Motherboards unterstützen ECC-Speicher. Die meisten Server- und Workstation-Motherboards sind kompatibel, typische Desktop-Motherboards für Endverbraucher jedoch nicht. Auch die CPU muss ECC unterstützen.
- Geschwindigkeit und Latenz: ECC-Speicher kann aufgrund des Overheads des Fehlerprüfungsprozesses etwas langsamer sein oder eine höhere Latenz aufweisen als vergleichbarer DDR-Speicher ohne ECC.
- DDR-Generationen: Die ECC-Technologie ist für alle modernen DDR-Versionen (DDR, DDR2, DDR3, DDR4, DDR5) verfügbar und wird häufig in Servern eingesetzt, um die Systemstabilität zu verbessern.
ECC-Speicher wird typischerweise in kritischen Systemen eingesetzt, in denen Datenintegrität und kontinuierlicher Betrieb unerlässlich sind, wie z. B. in Finanzdienstleistungen, Gesundheitssystemen, wissenschaftlicher Forschung und Hochleistungsrechenumgebungen.
GDDR (Grafikspeicher)
GDDR-Speicher: GDDR-Speicher (Graphics Double Data Rate) wurde speziell für Grafikkarten (GPUs) entwickelt. Er zeichnet sich im Allgemeinen durch höhere Taktraten und Übertragungsraten (GT/s) im Vergleich zu Standard-DDR-Systemspeicher aus und ist für den hohen Bandbreitenbedarf beim Rendern von Grafiken und bei der Parallelverarbeitung optimiert. GDDR-Speicherchips haben typischerweise eine breitere Schnittstelle (z. B. 32 Bit pro Chip) als Standard-DDR-Chips, und auf einer Grafikkarte werden mehrere Chips für einen sehr breiten Gesamtspeicherbus (z. B. 128 Bit, 256 Bit, 384 Bit) verwendet.
GT/s (GigaTransfers pro Sekunde) gibt die Anzahl der Datenübertragungsoperationen pro Sekunde an, ähnlich wie MT/s bei DDR-Speicher, aber um den Faktor 1000 skaliert (Giga vs. Mega). Es stellt die rohe Übertragungsgeschwindigkeit dar, nicht die endgültige Bandbreite in Byte/Sekunde.
Version | Erscheinungsjahr | Taktrate (MHz) | Übertragungsrate (GT/s) | Typische Bandbreite (GB/s) |
---|---|---|---|---|
GDDR2 | 2002 | 400–500 | 0.8–1.0 | ~12.8 – 16 GB/s |
GDDR3 | 2004 | 800–1000 | 1.6–2.0 | ~51.2 – 80 GB/s |
GDDR4 | 2006 | ~900–1150 | 1.8–2.3 | ~86 – 110 GB/s |
GDDR5 | 2008 | ~1250–2000 | 5.0–8.0 | ~160 – 384 GB/s |
GDDR5X | 2016 | ~1250–1750 | 10.0–14.0 | ~320 – 540 GB/s |
GDDR6 | 2018 | ~1750–2500 | 14.0–20.0 | ~448 – 960 GB/s |
GDDR6X | 2020 | ~1188–1438 | 19.0–23.0 | ~760 – 1104 GB/s |
Bandbreitenwerte sind illustrative Beispiele für typische High-End-Grafikkarten der damaligen Zeit, berechnet als (Übertragungsrate * Busbreite / 8). Die tatsächliche Bandbreite hängt stark von der spezifischen Speicherkonfiguration der GPU (Busbreite) ab. Die Taktrate bezieht sich auf den effektiven Datentakt (halbe Übertragungsrate für Nicht-PAM4-GDDR).
HBM (High Bandwidth Memory)
HBM-Speicher: HBM-Speicher (High Bandwidth Memory) verwendet einen grundlegend anderen Ansatz, indem er Speicher-Dies vertikal stapelt und sie über eine extrem breite Schnittstelle (z. B. 1024 Bit oder breiter pro Stack) auf einem Interposer mit dem Prozessor (oft eine GPU oder ein spezialisierter Beschleuniger) verbindet. Dies ermöglicht enorme Datenübertragungsraten bei niedrigeren Taktraten und geringerem Stromverbrauch im Vergleich zu GDDR, das eine ähnliche Bandbreite erreicht. HBM3E kann beispielsweise 1 TB/s Bandbreite pro Stack überschreiten. HBM wird hauptsächlich im High-Performance-Computing (HPC), in Beschleunigern für künstliche Intelligenz (KI) und in High-End-Grafikkarten eingesetzt, wo maximale Speicherbandbreite entscheidend ist.
Version | Erscheinungsjahr | Bandbreite pro Stack (GB/s) |
HBM | 2013 | ~128 GB/s |
HBM2 | 2016 | ~256 - 307 GB/s |
HBM2E | 2018 | ~307 - 460 GB/s |
HBM3 | 2022 | ~819 GB/s |
HBM3E | 2023 | ~1.200+ GB/s |
HBM4 (Prognostiziert) | ~2026 | ~1.500 - 2.000+ GB/s |
Zusammenfassender Vergleich
- DDR SDRAM: Standard-System-RAM für CPUs. Bietet ein ausgewogenes Verhältnis von Geschwindigkeit, Kapazität und Kosten. Die Bandbreite steigt mit den Generationen (DDR3, DDR4, DDR5) und durch die Verwendung mehrerer Kanäle (Dual, Quad). ECC-Varianten bieten Zuverlässigkeit für Server/Workstations.
- GDDR SDRAM: Optimiert für Grafikkarten (GPUs). Priorisiert sehr hohe Bandbreite durch schnellere Taktraten/Übertragungsraten und breite Speicherbusse auf der Grafikkarte. Essentiell für Gaming und GPU-beschleunigte Aufgaben. Im Allgemeinen höhere Kosten und höherer Stromverbrauch als DDR bei gleicher Kapazität.
- HBM: Entwickelt für maximale Bandbreitendichte und Energieeffizienz. Verwendet gestapelte Speicher-Dies und extrem breite Schnittstellen. Wird in High-End-GPUs, KI-Beschleunigern und HPC-Systemen eingesetzt, wo Datendurchsatz von größter Bedeutung ist. Höchste Kosten und typischerweise geringere Kapazitäten im Vergleich zu DDR/GDDR.