banner
Heim / Nachricht / Xilinx bringt Versal HBM auf den Markt
Nachricht

Xilinx bringt Versal HBM auf den Markt

Sep 26, 2023Sep 26, 2023

Es ist kein Geheimnis, dass wir in Daten ertrinken. Heutige Anwendungen und Algorithmen erfordern nahezu unvorstellbare Datenmengen, und das bedeutet, dass der Bandbreitenbedarf schneller explodiert, als Netzwerk- und Speichertechnologien bewältigen können. Selbst mit den fortschrittlichsten Beschleunigern, die wir mit unseren FPGAs bauen können, kann es sein, dass wir erstickt werden, wenn wir versuchen, Daten auf und von dem Chip zu bekommen und Speicherorte für Informationen zu finden, während wir sie verarbeiten.

Auch wenn die Speicherbandbreite rapide zugenommen hat, wächst die Nachfrage schneller. Die weltweite Verbreitung von Zettabytes an Informationen hat die aktuellen Technologien bis an ihre Grenzen beansprucht. Die Verlagerung leistungskritischer Aufgaben auf FPGAs hilft nicht, wenn das System nicht genügend Speicherbandbreite hat.

Gleichzeitig müssen immer mehr dieser Daten gesichert werden, und jedes Mal, wenn Daten über eine Schnittstelle verschoben werden, werden sie angreifbar.

Was wir brauchen, ist, die Erinnerung näher an die Verarbeitung heranzuführen.

Xilinx hat mit seiner neuen Versal HBM-Serie von „ACAP“-Geräten (wir bezeichnen sie als FPGAs) einen großen Schritt in Richtung Speicherlokalisierung gemacht. HBM (oder High-Bandwidth-Speicher) ist so konzipiert, dass er mit anderen Verarbeitungselementen im selben Gehäuse sitzt und über die fortschrittliche Stacked-Silicon-Interconnect-(SSI)-Gehäusetechnologie kommuniziert. Indem der Speicher im Gehäuse bleibt, sind Verbindungen mit viel höherer Bandbreite möglich, und der Verzicht auf Speicherschnittstellen außerhalb des Chips reduziert den Stromverbrauch und die Schnittstellenlatenz erheblich.

Dies ist bei weitem nicht das erste Rodeo von Xilinx mit SSI. Das Unternehmen war vor Jahren ein Pionier bei Silizium-Interposern mit FPGA und dieses neue Gerät basiert auf SSI der vierten Generation. Anfangs wurde SSI hauptsächlich zur Steigerung der effektiven Ausbeute eingesetzt, indem mehrere kleinere FPGA-Chiplets in ein einziges Gehäuse gepackt wurden, um einen größeren FPGA zu bauen. Aber heute wird SSI auch verwendet, um das Silizium von Xilinx skalierbarer und vielseitiger zu machen. Um beispielsweise Versal HBM zu bauen, haben sie einfach ein „Super Logic Region“ (SLR)-Chiplet gegen einen HBM2e-Stack aus ihrem Versal Premium-Gerät ausgetauscht, um Versal HBM zu bauen. (Okay, es ist etwas komplizierter, aber Sie verstehen, worauf es ankommt.)

Im Vergleich zu externem DDR5 bietet In-Package-HBM die 8-fache Bandbreite bei 63 % geringerem Stromverbrauch. Und das ist eine große Sache. Durch das Parken eines HBM-Stacks in Ihrem FPGA erhalten Sie eine Fülle an Speicherbandbreite und schonen gleichzeitig Ihr Energiebudget für die Verarbeitung.

Dies ist nicht das erste Mal, dass Xilinx HBM in eines seiner Geräte integriert. Eine Version ihrer Virtex Ultrascale+ FPGAs der vorherigen Generation war mit HBM im Gehäuse ausgestattet. Der neue Versal HBM übertrifft diesen jedoch in jeder Hinsicht mit der 1,8-fachen Speicherbandbreite (von 460 Gbit/s bis 820 Gbit/s) bei 15 % geringerem Stromverbrauch und der doppelten HBM-Speicherkapazität (32 GB gegenüber 16 GB).

Versal HBM bietet jedoch viel mehr als nur mehr Speicherbandbreite. Außerdem haben sie die Größe der SerDes-Pipes für den Datentransport auf und von dem Gerät erheblich vergrößert und die Gesamtbandbreite auf unglaubliche 5,6 Tbit/s verdoppelt. Der SerDes ist für maximale Anwendungsflexibilität skalierbar, mit 32 Gbit/s NRZ für leistungsoptimierte 100G-Schnittstellen, 58 Gbit/s PAM4 für den aktuellen 400G-Aufbau und Einsatz und supersportlichem 112 Gbit/s PAM4 für zukünftige 800-Gig-Netzwerkentwicklung auf 100G-pro-Lane-Optik.

Viele Standardschnittstellen sind für Sie vorgefertigt und gehärtet, einschließlich 2,4 Tbit/s skalierbarer Ethernet-Bandbreite, die Multirate bietet: 400/200/100/50/40/25/10G mit FEC, und Multistandard: FlexE, Flex-O, eCPRI, FCoE und OTN. Mit einem Verschlüsselungsdurchsatz von 1,2 Tbit/s mit Leitungsgeschwindigkeit, der über Bulk-Crypto AES-GCM-256/128, MACsec, IPsec bereitgestellt wird, kann Sicherheit schnell erreicht werden. Laut Xilinx handelt es sich dabei um die „weltweit einzige gehärtete 400G-Krypto-Engine auf einer anpassungsfähigen Plattform“.

Wenn PCIe Ihr Ding ist, bietet Versal HBM 1,5 TB/s aggregierte PCIe-Link-Bandbreite über PCIe Gen5 mit DMA, CCIX und CXL (ja, ich spiele jetzt für eines der beiden Teams). Die PCIe-Schnittstelle verfügt über eine dedizierte Konnektivität über das programmierbare Network-on-Chip (NoC) zum Speicher.

Versal HBM kann also offensichtlich hervorragende Arbeit leisten, wenn es darum geht, Daten auf und von dem Chip zu übertragen und sie dort im Speicher zu parken. Aber wie sieht es mit der Fähigkeit aus, tatsächliche Arbeit zu verrichten?

Das neue Gerät verfügt über dreifache Leistungsfähigkeit zur Ausführung und Beschleunigung einer Vielzahl von Arbeitslasten. Xilinx bezeichnet diese nun als „Engines“, und Versal HBM umfasst (wie ihre anderen ACAP-Geräte) „Scalar“, „Adaptable“ und „DSP“-Engines. Konventioneller ausgedrückt handelt es sich bei den „Scalar“-Engines um Arm-basierte Verarbeitungssysteme bestehend aus Dual-Core-Arm-Cortex-A72-Anwendungsprozessoren und Dual-Core-Arm-Cortex-R5F-Echtzeitprozessoren. Die „anpassungsfähigen“ Engines sind in erster Linie das, was wir uns als FPGA-LUT-Fabric vorstellen würden (3,8 oder 5,6 Millionen Logikzellen wert). und die „DSP“-Engines bestehen aus 7,4K oder 10,9K DSP-Slices. Zusammengenommen ist das eine beeindruckende Menge an Rechenressourcen, um die schwierigen Probleme in den Zielmärkten Netzwerk, Rechenzentrum, Test und Messung sowie Luft- und Raumfahrt und Verteidigung zu bewältigen für Versal HBM.

Xilinx stellte einige Benchmarks zur Verfügung. Im Gesundheitswesen wird auf der Real-Time Recommendation Engine – Cosine-Ähnlichkeitsalgorithmus – Klinische Ergebnisvorhersagen verwendet, in denen behauptet wird, dass Versal HBM die doppelte Patientendatenbankgröße des Virtex UltraScale+ der vorherigen Generation und die vierfache Größe eines Intel der 3. Generation verarbeiten kann x867 Xeon Gold/Platin skalierbarer Prozessor. In Bezug auf die Geschwindigkeit geben sie an, 100-mal schneller als Virtex und 200-mal schneller als x86 zu sein.

Der zweite Maßstab liegt in der Echtzeit-Betrugserkennung – dem Louvain-Modularitätsalgorithmus – zur Erkennung von Verhaltens-/Transaktionsanomalien. (Wissen Sie, wenn das Kreditkartenunternehmen anruft und fragt, ob Sie gerade einen Ferrari auf der Osterinsel gekauft haben.) In diesem Beispiel behaupten sie den gleichen 2- und 4-fachen Kapazitätsvorteil (Anzahl der Scheitelpunkte) und eine bescheidenere 10- und 20-fache Geschwindigkeit Vorteil gegenüber Virtex bzw. x86.

Wenn Stapel von Chips eher Ihr Maßstab sind, bietet Versal HBM laut Xilinx das Äquivalent von 14 Virtex UltraScale-Geräten und das Äquivalent von 32 DDR5-Chips von HBM.

Versal HBM wird in zwei Grundgrößen erhältlich sein, jedoch mit drei verschiedenen HBM-Portionen – 8, 16 oder 32 GB. Mit der Versal Premium-Serie (die im Grunde mit der Versal HBM identisch ist, jedoch ohne HBM) können Sie jetzt mit Ihrem Design beginnen. Die Dokumentation ist ab sofort verfügbar, die Tools in der zweiten Jahreshälfte 2021 und die Gerätebemusterung beginnt in der zweiten Jahreshälfte 2022.