AMD und Xilinx verkünden neuen Weltrekord bei AI Inference
Auf dem Xilinx Developer Forum haben Xilinx-CEO Victor Peng und AMD-CTO Mark Papermaster heute einen neuen AI-Inference-Weltrekord mit 30 000 Bildern pro Sekunde bekanntgegeben, der auf einem System mit zwei AMD-EPYC-7551-Prozessoren zusammen mit acht der heute neu angekündigten Xilinx-Alveo-U250-Beschleunigerkarten erzielt wurde. Der Benchmark wurde mit GoogLeNet (mit einer Batch-Size von 1 und Int8-Precision) durchgeführt.
Mittels faltender neuronaler Netzwerke wie GoogLeNet wird im Bereich Bilderkennung (Gesichtserkennung) und Spracherkennung (semantisches Parsen, Suchanfragenrückerkennung, Satzmodellierung, Satzklassifizierung, maschinelle Übersetzung) gearbeitet (siehe Wikipedia). Unterschieden wird dabei zwischen Deep Learning Training und Inference. Ersteres bezeichnet dabei das Training neuronaler Netzwerke, das zweite dann die praktische Umsetzung der antrainierten neuen Möglichkeiten zur Datenanalyse. NVIDIA zum Beispiel setzt für diesen Zweck die Tesla Produkte ein und bezeichnet die Tesla T4 GPU (basierend auf Turing) als weltweit fortschrittlichsten Infercence Beschleuniger.
Xilinx and AMD see a bright future in their technology collaboration. There is strong alignment in our roadmaps that align the high-performance AMD EPYC server and graphics processors with Xilinx acceleration platforms across its Alveo accelerator cards, as well as its forthcoming Versal portfolio.
AMD und Xilinx haben Treiber optimiert und die Performance auf die Interoperabilität zwischen AMD EPYC CPUs mit Xilinx FPGAs abgestimmt. Mit der Alveo U200 und der in dem Weltrekordsystem eingesetzten Alveo U250 auf Basis von Xilinx UltraScale+ FPGAs hat Xilinx heute, die nach eigenen Angaben weltweit schnellsten Rechenzentrums- und AI-Beschleunigerkarten vorgestellt.
Quelle: Time for a Guinness? AMD and Xilinx announce a new world record for AI Inference