DDR-, GDDR- und HBM-Speichergeschwindigkeiten und Bandbreite

Gábor Bíró 11. Dezember 2024
6 Min. Lesezeit

Die Leistung moderner Computer wird maßgeblich von der Geschwindigkeit und dem Typ des verwendeten Speichers beeinflusst. DDR-, GDDR- und HBM-Speicher sind für unterschiedliche Zwecke optimiert, sei es Hauptspeicher für CPUs, Speicher für Grafikkarten oder Aufgaben, die rechenintensive Berechnungen mit hoher Bandbreite erfordern. In diesem Beitrag vergleiche ich die Geschwindigkeiten und wichtigsten Parameter dieser Speichertypen.

DDR-, GDDR- und HBM-Speichergeschwindigkeiten und Bandbreite
Quelle: Selbst erstellt

Die Leistung von Computerhardware-Standards wird oft mit theoretischen Maximalwerten beworben, die unter idealen Laborbedingungen gemessen werden (in der Praxis können Übertragungsraten durch Gerätecontroller, Temperatur oder andere Engpässe begrenzt sein). Diese Werte spiegeln nicht unbedingt die Geschwindigkeiten im realen Einsatz wider, eignen sich aber hervorragend für Vergleichszwecke, da sie die Unterschiede zwischen den technologischen Generationen deutlich aufzeigen.

In den folgenden Tabellen stelle ich für jeden Standard den theoretischen Maximalwert bereit, der zur besseren Lesbarkeit und zum Vergleich gerundet und, falls zutreffend, immer in Byte (genauer gesagt MB/s) angegeben ist. Ich habe hier über Computer-Datenübertragungs- und Speicherstandards, Maßeinheiten, Geschwindigkeiten und deren theoretische Grundlagen geschrieben.

DDR SDRAM (Systemspeicher)

Computerspeicher (RAM - Random Access Memory) dient als temporärer, schnell zugreifbarer Datenspeicher des Computers. Moderne RAM-Module verwenden die DDR-Technologie (Double Data Rate), was bedeutet, dass die Datenübertragung sowohl an der steigenden als auch an der fallenden Flanke des Taktsignals erfolgt, wodurch die Datenübertragungsrate im Vergleich zum ursprünglichen SDRAM effektiv verdoppelt wird.

Das ursprüngliche SDRAM (manchmal auch als SD- oder SDR-RAM bezeichnet, um es von DDR zu unterscheiden) arbeitete mit Taktraten von 66-133 MHz. Da es sich nicht um "Double Data Rate" handelte, entsprach seine effektive Datenübertragungsrate (in Übertragungen pro Sekunde) seiner Taktrate (in Zyklen pro Sekunde).

MT/s (MegaTransfers pro Sekunde) gibt an, wie viele Millionen Datenübertragungsoperationen der Speicher pro Sekunde durchführen kann. Dies ist für DDR-Speicher (Double Data Rate) von Bedeutung, da pro Taktzyklus zwei Datenübertragungen stattfinden – eine an der steigenden und eine an der fallenden Flanke des Taktsignals.

Nehmen wir als Beispiel DDR2-400-Speicher:

  • Seine Basistaktrate beträgt 200 MHz.
  • Da er die DDR-Technologie (Double Data Rate) verwendet, ist die tatsächliche Übertragungsrate doppelt so hoch wie die Taktrate: 400 MT/s.

Zur besseren Veranschaulichung:

  1. Eine Taktrate von 200 MHz bedeutet 200 Millionen Taktzyklen pro Sekunde.
  2. In jedem Zyklus finden 2 Datenübertragungen statt (steigende und fallende Flanke).
  3. Daher betragen die Gesamtübertragungen: 200 Millionen Zyklen/Sek. × 2 Übertragungen/Zyklus = 400 Millionen Übertragungen pro Sekunde (400 MT/s).

Dies unterscheidet sich von der Bandbreite (MB/s), die die tatsächlich bewegte Datenmenge misst. Die Bandbreite wird berechnet, indem der MT/s-Wert mit der Speicherbusbreite (typischerweise 8 Byte für ein Standard-64-Bit-DDR-DIMM) multipliziert wird: 400 MT/s × 8 Byte/Übertragung = 3200 MB/s.

Version Übertragungsrate (MT/s) Modulname Erscheinungsjahr Taktrate (MHz) Bandbreite (MB/s)
DDR 200-400 PC-1600 - PC-3200 1998 100-200 1.600 - 3.200 MB/s
DDR2 400-1066 PC2-3200 - PC2-8500 2003 200-533 3.200 - 8.533 MB/s
DDR3 800-2133 PC3-6400 - PC3-17000 2007 400-1066 6.400 - 17.066 MB/s
DDR4 1600-3200+ PC4-12800 - PC4-25600+ 2014 800-1600+ 12.800 - 25.600+ MB/s
DDR5 4800-8000+ PC5-38400 - PC5-64000+ 2020 2400-4000+ 38.400 - 64.000+ MB/s

Bandbreite berechnet für eine standardmäßige 64-Bit (8 Byte) breite Speicherschnittstelle (einzelnes DIMM). Dual-Channel- oder Quad-Channel-Konfigurationen vervielfachen diese Bandbreite.

Hersteller vermarkten Speichermodule mit unterschiedlichen Bezeichnungen, wie z. B. Versionsnummer (DDR4), Übertragungsrate (3200 MT/s) oder Modulname (PC4-25600). Dies kann verwirrend sein, aber die obige Tabelle hilft, äquivalente Module zu identifizieren. Zum Beispiel beziehen sich DDR4-3200 und PC4-25600 auf die gleiche Speicherspezifikation.

Generationen von DDR-RAM-Modulen

DDR ECC-Speicher

ECC-Speicher (Error-Correcting Code) ist eine spezielle Art von Speicher, der hauptsächlich in Servern, Workstations und anderen Systemen verwendet wird, die eine hohe Zuverlässigkeit erfordern. DDR-ECC-Speicher unterscheidet sich von Standard-DDR-Speicher ohne ECC durch seine Fehlerkorrekturfähigkeiten.

  • Fehlerkorrektur: ECC-Speicher kann Single-Bit-Fehler automatisch erkennen und korrigieren sowie Multi-Bit-Fehler erkennen. Dies reduziert das Risiko von Datenbeschädigung und Systemabstürzen erheblich.
  • Zusätzliche Bits: Ein ECC-Speichermodul verwendet typischerweise zusätzliche Bits pro Datenwort (z. B. 72 Bits für 64 Datenbits), um die Fehlerprüfungscodes zu speichern und so die Fehlerkorrektur zu ermöglichen.
  • Kompatibilität: Nicht alle Motherboards unterstützen ECC-Speicher. Die meisten Server- und Workstation-Motherboards sind kompatibel, typische Desktop-Motherboards für Endverbraucher jedoch nicht. Auch die CPU muss ECC unterstützen.
  • Geschwindigkeit und Latenz: ECC-Speicher kann aufgrund des Overheads des Fehlerprüfungsprozesses etwas langsamer sein oder eine höhere Latenz aufweisen als vergleichbarer DDR-Speicher ohne ECC.
  • DDR-Generationen: Die ECC-Technologie ist für alle modernen DDR-Versionen (DDR, DDR2, DDR3, DDR4, DDR5) verfügbar und wird häufig in Servern eingesetzt, um die Systemstabilität zu verbessern.

ECC-Speicher wird typischerweise in kritischen Systemen eingesetzt, in denen Datenintegrität und kontinuierlicher Betrieb unerlässlich sind, wie z. B. in Finanzdienstleistungen, Gesundheitssystemen, wissenschaftlicher Forschung und Hochleistungsrechenumgebungen.

GDDR (Grafikspeicher)

GDDR-Speicher: GDDR-Speicher (Graphics Double Data Rate) wurde speziell für Grafikkarten (GPUs) entwickelt. Er zeichnet sich im Allgemeinen durch höhere Taktraten und Übertragungsraten (GT/s) im Vergleich zu Standard-DDR-Systemspeicher aus und ist für den hohen Bandbreitenbedarf beim Rendern von Grafiken und bei der Parallelverarbeitung optimiert. GDDR-Speicherchips haben typischerweise eine breitere Schnittstelle (z. B. 32 Bit pro Chip) als Standard-DDR-Chips, und auf einer Grafikkarte werden mehrere Chips für einen sehr breiten Gesamtspeicherbus (z. B. 128 Bit, 256 Bit, 384 Bit) verwendet.

GT/s (GigaTransfers pro Sekunde) gibt die Anzahl der Datenübertragungsoperationen pro Sekunde an, ähnlich wie MT/s bei DDR-Speicher, aber um den Faktor 1000 skaliert (Giga vs. Mega). Es stellt die rohe Übertragungsgeschwindigkeit dar, nicht die endgültige Bandbreite in Byte/Sekunde.

Version Erscheinungsjahr Taktrate (MHz) Übertragungsrate (GT/s) Typische Bandbreite (GB/s)
GDDR2 2002 400–500 0.8–1.0 ~12.8 – 16 GB/s
GDDR3 2004 800–1000 1.6–2.0 ~51.2 – 80 GB/s
GDDR4 2006 ~900–1150 1.8–2.3 ~86 – 110 GB/s
GDDR5 2008 ~1250–2000 5.0–8.0 ~160 – 384 GB/s
GDDR5X 2016 ~1250–1750 10.0–14.0 ~320 – 540 GB/s
GDDR6 2018 ~1750–2500 14.0–20.0 ~448 – 960 GB/s
GDDR6X 2020 ~1188–1438 19.0–23.0 ~760 – 1104 GB/s

Bandbreitenwerte sind illustrative Beispiele für typische High-End-Grafikkarten der damaligen Zeit, berechnet als (Übertragungsrate * Busbreite / 8). Die tatsächliche Bandbreite hängt stark von der spezifischen Speicherkonfiguration der GPU (Busbreite) ab. Die Taktrate bezieht sich auf den effektiven Datentakt (halbe Übertragungsrate für Nicht-PAM4-GDDR).

HBM (High Bandwidth Memory)

HBM-Speicher: HBM-Speicher (High Bandwidth Memory) verwendet einen grundlegend anderen Ansatz, indem er Speicher-Dies vertikal stapelt und sie über eine extrem breite Schnittstelle (z. B. 1024 Bit oder breiter pro Stack) auf einem Interposer mit dem Prozessor (oft eine GPU oder ein spezialisierter Beschleuniger) verbindet. Dies ermöglicht enorme Datenübertragungsraten bei niedrigeren Taktraten und geringerem Stromverbrauch im Vergleich zu GDDR, das eine ähnliche Bandbreite erreicht. HBM3E kann beispielsweise 1 TB/s Bandbreite pro Stack überschreiten. HBM wird hauptsächlich im High-Performance-Computing (HPC), in Beschleunigern für künstliche Intelligenz (KI) und in High-End-Grafikkarten eingesetzt, wo maximale Speicherbandbreite entscheidend ist.

Version Erscheinungsjahr Bandbreite pro Stack (GB/s)
HBM 2013 ~128 GB/s
HBM2 2016 ~256 - 307 GB/s
HBM2E 2018 ~307 - 460 GB/s
HBM3 2022 ~819 GB/s
HBM3E 2023 ~1.200+ GB/s
HBM4 (Prognostiziert) ~2026 ~1.500 - 2.000+ GB/s

Zusammenfassender Vergleich

  • DDR SDRAM: Standard-System-RAM für CPUs. Bietet ein ausgewogenes Verhältnis von Geschwindigkeit, Kapazität und Kosten. Die Bandbreite steigt mit den Generationen (DDR3, DDR4, DDR5) und durch die Verwendung mehrerer Kanäle (Dual, Quad). ECC-Varianten bieten Zuverlässigkeit für Server/Workstations.
  • GDDR SDRAM: Optimiert für Grafikkarten (GPUs). Priorisiert sehr hohe Bandbreite durch schnellere Taktraten/Übertragungsraten und breite Speicherbusse auf der Grafikkarte. Essentiell für Gaming und GPU-beschleunigte Aufgaben. Im Allgemeinen höhere Kosten und höherer Stromverbrauch als DDR bei gleicher Kapazität.
  • HBM: Entwickelt für maximale Bandbreitendichte und Energieeffizienz. Verwendet gestapelte Speicher-Dies und extrem breite Schnittstellen. Wird in High-End-GPUs, KI-Beschleunigern und HPC-Systemen eingesetzt, wo Datendurchsatz von größter Bedeutung ist. Höchste Kosten und typischerweise geringere Kapazitäten im Vergleich zu DDR/GDDR.
Gábor Bíró 11. Dezember 2024