Efficient protocols


Giese, Alexander


[img]
Vorschau
PDF
Diss_Abgabe.pdf - Veröffentlichte Version

Download (6MB)

URL: https://madoc.bib.uni-mannheim.de/40621
URN: urn:nbn:de:bsz:180-madoc-406215
Dokumenttyp: Dissertation
Erscheinungsjahr: 2015
Ort der Veröffentlichung: Mannheim
Hochschule: Universität Mannheim
Gutachter: Effelsberg, Wolfgang
Datum der mündl. Prüfung: 3 März 2016
Sprache der Veröffentlichung: Englisch
Einrichtung: Fakultät für Wirtschaftsinformatik und Wirtschaftsmathematik > Praktische Informatik IV (Effelsberg 1989-2017)
Fakultät für Wirtschaftsinformatik und Wirtschaftsmathematik > Rechnerarchitektur (Brüning 1996-2008)
Fachgebiet: 004 Informatik
Normierte Schlagwörter (SWD): Protokoll
Freie Schlagwörter (Englisch): Protocol , processor , pcie ht , network communication
Abstract: The increasing demand for more and more computing power causes steady advancements of High Performance Computing (HPC) systems. The more powerful these systems will be in the future the further the number of processing units increases. A particularly important point in this context is the latency of the communication among those units, which significantly increases by the distance between two communication partners. One approach to positively influence the latency behavior is optimizing the underlying protocol structures in the overall system. Nowadays, different protocols are used for different communication distances. The latency can be improved by changing the protocol structure with two approaches. On the one hand, the used protocols can be changed to optimize the latency. On the other hand, the protocol structure can be unified. Thus, time-consuming protocol translations can be eliminated. In order to achieve this, a completely new protocol is required which unifies all features of the different protocol levels without compromising an efficient implementation. This work is dedicated to the design of the new Unified Layer Protocol (ULP) providing a unified communication scheme which allows communication among all processing units at different levels of an HPC system. Initially, the main features of general protocols are analyzed in detail. Further, properties used by modern protocols use are introduced and their function is explained. The two protocols that are deemed most relevant, Hyper-Transport (HT) and Peripheral Component Interconnect Express (PCIe), are analyzed in detail regarding to the previously specified aspects. The insight gained through this analysis is incorporated into the development of the ULP. During the development process, first the structure of the ULP is defined and various parameters are determined. Special attention is turned on the feasibility in hardware and the scalability for large systems. The following comparison with HT and PCIe shows that the newly developed ULP usually provides superior performance, even when the effective communication distance moves close to the processor. Further work is dedicated to the hardware development which first gave the inspiration for the development of the ULP. The insights gained during the development of the ULP were integrated into the hardware. The results show that the ULP fulfills the demands for a protocol used in the field of HPC. This is achieved for both, the processor-near communication, as well as for the communication among different nodes. With the ULP the need for time and energy-consuming protocol conversions is eliminated, while the feasibility in hardware is obtained.
Übersetzter Titel: Effiziente Protokolle (Deutsch)
Übersetzung des Abstracts: Die steigende Nachfrage nach immer mehr Rechenleistung verursacht eine stetige Weiterentwicklung von High Performance Computing (HPC) Systemen. Je leistungsfähiger diese Systeme werden desto weiter steigt die Anzahl der Recheneinheiten. Ein besonders wichtiger Punkt in diesem Zusammenhang ist die Latenz der Kommunikation dieser Einheiten, welche maßgeblich durch die steigende Distanz zwischen zwei Kommunikationspartnern negativ beeinflusst wird. Ein Ansatzpunkt um das Latenzverhalten positiv zu beeinflussen ist die Optimierung der zugrunde liegenden Protokollstrukturen im Gesamtsystem. Heutzutage werden für verschiedene Kommunikationsdistanzen unterschiedliche Protokolle genutzt. Für die Optimierung bieten sich zwei Ansätze an. Einerseits können die Protokolle selbst optimiert werden um die Latenz zu reduzieren. Andererseits kann die Protokollstruktur vereinheitlicht werden und somit die zeitaufwändige Protokollübersetzung eingespart werden. Um dies zu erreichen wird ein komplett neuartiges Protokoll benötigt welches sowohl die nötigen Eigenschaften der verschiedenen Ebenen vereint und trotz allem umsetzbar bleibt. Diese Arbeit befasst sich mit dem Entwurf des neuen Unified Layer Protocols (ULP) welches in der Lage ist die Kommunikation zwischen Recheneinheiten in einem HPC System zu vereinheitlichen. Um dies realisieren zu können wurden zunächst die Hauptmerkmale die Protokolle allgemein aufweisen genauer untersucht. Weiter wurden die Eigenschaften die moderne Protokolle besitzen eingeführt und deren Funktionsweisen erläutert. Die zwei für am relevantesten erachteten Protokolle, nämlich HyperTransport (HT) und Peripheral Component Interconnect Express (PCIe), wurden detailliert auf diese Aspekte hin analysiert. Die daraus gewonnenen Erkenntnisse sind in die folgende Entwicklung des ULP eingeflossen. Bei der Entwicklung wurde zuerst die Struktur des ULP festgelegt und verschiedene Parameter bestimmt. Besonderes Augenmerk wurde hierbei auf die Umsetzbarkeit in Hardware und die Skalierbarkeit für große Systeme gelegt. Der nachfolgende Vergleich mit HT und PCIe zeigt, dass das eigens entwickelte ULP schon im Prozessor nahmen Einsatzgebiet meist bessere Performanz bietet als die Vergleichsprotokolle. Weiter wird auf die Hardwareentwicklung während der Dissertation eingegangen, welche den Anstoß für die Entwicklung von ULP lieferten. Die erarbeiteten Konzepte von ULP flossen mit in die weitere Entwicklung der Hardware ein. Die Ergebnisse zeigen das ULP die Ansprüche an ein Protokoll, welches im HPC-Bereich eingesetzt wird, erfüllt. Sowohl für die Prozessor nahe Kommunikation als auch für die Kommunikation zwischen verschiedenen Knoten über weite Distanzen. Dabei wird der Einsatz von zeit- und energieintensiven Protokollumsetzungen eliminiert, während die Umsetzbarkeit in Hardware effizient möglich ist. (Deutsch)




Dieser Eintrag ist Teil der Universitätsbibliographie.

Das Dokument wird vom Publikationsserver der Universitätsbibliothek Mannheim bereitgestellt.




Metadaten-Export


Zitation


+ Suche Autoren in

+ Download-Statistik

Downloads im letzten Jahr

Detaillierte Angaben



Sie haben einen Fehler gefunden? Teilen Sie uns Ihren Korrekturwunsch bitte hier mit: E-Mail


Actions (login required)

Eintrag anzeigen Eintrag anzeigen