Industriekommunikation
Viel Rechen-Power nicht nur für die Grafik
Stefan Hummel, Würselen
Der im Jahr 2004 schnellste Supercomputer in Europa, das Jump-Supercomputer-System im Forschungszentrum Jülich – er basiert auf 1.312 einzelnen Power-4+-Prozessoren aufgeteilt auf 41 Knoten – kommt auf eine maximal Leistung von rund 8.900 GFLops (Giga Floating Point Operations per Second). Flops bezeichnet dabei die Anzahl an Gleitkomma-Operationen, die das jeweilige System pro Sekunde durchführen kann. Die jetzt erhältlichen Grafikkarten kommen auf Leistungswerte die bei rund 2.000 GFLops pro Karte liegen. Eine normale Workstation kann so, ausgestattet mit mehreren handelsüblichen Grafikkarten, eine enorme maximale Rechenleistung erreichen.
Ursprünglich waren Grafikkarten, wie der Name auch sagt, nur für die reine Darstellung von 2D- und 3D-Daten zuständig. Dafür reichten relativ einfache Bausteine, die nur vorgefertigte Funktionen abgerufen und dargestellt haben. Mit dem zunehmenden Realismus der 3D-Darstellung waren hier allerdings auch immer schneller immer aufwändigere Verfahren und später auch komplexe Echtzeitberechnungen auf der GPU gefragt. Eine aktuelle GPU besitzt mit etwa einer Milliarden Transistoren dann auch rund doppelt so viele Transistoren wie eine Quad-Core-CPU von Intel.
Folglich liegt es dann nahe, diese Rechenleistung zusätzlich zur reinen Grafikdarstellung auch für andere Anwendungswecke zu nutzen. Um die Geschwindigkeit der heutigen Multicore-GPUs effektiv einsetzen zu können, sind jedoch Anwendungsfälle notwendig, die sich in viele parallele Teilaufgaben zerlegen lassen. Für die Bereiche der Bild- und Videobearbeitung werden schon kommerzielle Anwendungen angeboten, mit denen die Vorteile der GPUs umfassend genutzt werden können. Bei hochaufgelöstem Videomaterial muss beispielsweise für eine effiziente und platzsparende Komprimierung jedes Einzelbild bearbeitet und analysiert werden. Bei einem H.264-Codec benötigt eine CPU für jede Stunde Filmmaterial noch rund zwei bis drei Stunden Rechenzeit. Die GPU kann dies etwa 15 mal so schnell berechnen /1/. Auch bei der neuen Creative Suite 4 von Adobe wird die Grafikkarte für die Bildbearbeitung in Photoshop oder die Videobearbeitung in Premiere Pro und After Effects als zusätzlicher Beschleuniger genutzt /2/.
Forschungseinrichtungen und Universitäten haben den Nutzen der schnellen und preiswerten Grafikkarten allerdings schon deutlich länger für sich erkannt – von der Berechnung der Entstehung von Galaxien, Filamenten und Halos über so genannte N-bodys, die den Einfluss von enormen Mengen an Partikeln und Körpern durch physikalische Kräfte simulieren, bis hin zur Nachbildung komplexer Vorgänge in der Bio-Medizintechnik. Bekannteste Vertreter sind hier sicherlich Folding@Home zur Auffaltung von Proteinketten für die Alzheimer-, BSE- und Krebs-Forschung der Stanford University /3/ oder die Visualisierung kompletter Viren wie etwa des Satellite-Tobacco-Virus an der University of Illinois /4/. Für den Anwender aus dem CAD/CAM-Umfeld gibt es ebenfalls einige Anwendungsfälle, die von einer Beschleunigung durch die Grafikkarte enorm profitieren können. Rechenzeiten für FEM-Berechnungen (Finite Elemente Methode) lassen sich etwa um den Faktor 27 x beschleunigen /5/. Auch strömungsmechanische Aufgabenstellungen (CFD – Computational Fluid Dynamics) können auf einer Grafikkarte rund 20 mal schneller abgearbeitet werden als auf der CPU /6/.
Die Entwicklung der GPU-Technik und die damit verbundene Unterstützung durch die verschiedensten Anwendungen sind aber noch lange nicht am Ende angelangt. Fast im Jahresrhythmus erfolgt die Vorstellung neuer Hardware, mit der die theoretische Leistung der Grafikkarten jeweils verdoppelt wird. Außerdem wird und muss die möglichst effiziente Nutzung der zur Verfügung stehenden Leistung noch ständig optimiert werden. Lösungen wie Nvidia´s High-Level-API Cuda, die Unterstützung für Double Precision oder dedizierte Rechenmodule wie die Tesla S1070 sind da schon ein guter Anfang. Die Zukunft bleibt aber auf jeden Fall weiter spannend. -fr-
www.pny.de [email protected]
Quellenverzeichnis:
/1/ Elemental Technologies – Badaboom Media Converter – RapidHD Accelerator
http://www.elemantaltechnologies.com
/2/ Adobe Systems Incorporated
http://kb.adobe.com/selfservice/viewContent.do?externalId =kb405445
/3/ Stanford University Medical Center
http://folding.stanford.edu
/4/ University of Illinois
http://www.ks.uiuc.edu
/5/ D. Göddeke, R.Strzodka and S.Turek: Performance and accuracy of hardware-oriented native-, emulated- and mixed-precision solvers in FEM simulations, IJPEDS, 2007
www.mpii.de/~strzodka/
www.mathematik.tu-dortmund.de/~goeddeke/
/6/ FluiDyna GmbH
http://www.fluidyna.de/index.php








