TY  - THES
AU  - Graf, Stephan
TI  - Entwicklung eines Werkzeugs zur Analyse des OS-Jitter Effekts auf High-Performance Cluster-Systemen
VL  - 4302
IS  - Juel-4302
SN  - 0944-2952
PB  - F. Aachen
VL  - Master (FH)
CY  - Jülich
M1  - PreJuSER-5458
M1  - Juel-4302
T2  - Berichte des Forschungszentrums Jülich
SP  - II, 117 p.
PY  - 2009
N1  - Record converted from VDB: 12.11.2012
N1  - Aachen, FH, Standort Jülich, Masterarbeit 2009
AB  - Auf dem Gebiet des Höchstleistungsrechnens führt die aktuelle Entwicklung zu Cluster-Systemen, die aus mehreren Tausend Knoten bestehen. Jeder dieser Knoten ist mit vier oder mehr Prozessoren ausgestattet. Um einen Rechner zu betreiben, läuft auf jedem Knoten ein eigenständiges, von den anderen unabhängiges Betriebssystem, welches heutzutage ein UNIX-Derivat des jeweiligen Herstellers, meist jedoch ein optimiertes Linux, ist. Bei Systemen dieser Art wird in der Literatur oft von einem Leistungsverlust bei steigender Anzahl genutzter Knoten im Zusammenhang mit kollektiven Operationen bei parallelen Anwendungen berichtet. Ein Grund dafür liegt meistens in Amdahl’s Law. Dieses besagt, dass der nicht zu parallelisierende Anteil einer Applikation dafür sorgt, dass ab einer gewissen Prozessorzahl eine weitere Steigerung der Anzahl zu keinem weiteren signifikanten Leistungsgewinn führt. Eine weitere Ursache, die für den Leistungsverlust verantwortlich gemacht wird, liegt in Betriebssystem-Aktivitäten. Diese müssen sich die Ressourcen mit der Applikation teilen. Da diese Aktivitäten nicht auf allen Knoten synchron auftreten, kann es bei kollektiven Operationen innerhalb der Applikation zu unnötigen Wartezeiten kommen. Dieser Effekt wird als OS-Jitter bezeichnet. In dieser Arbeit werden zunächst die technischen Grundlagen erklärt. Als Schwerpunkt wird das Linux Betriebssystem betrachtet, speziell dessen aktuelle Weiterentwicklungen im Bereich des Prozess-Scheduling und der Echtzeitfähigkeit. Im Anschluss wird der OS-Jitter beschrieben und dabei die Erkenntnisse aus der Literatur zu Ursache, Visualisierung und Einflussminderung dieses Effekts dargelegt. Danach werden spezialisierte Benchmarks vorgestellt, die den OS-Jitter Effekt sichtbar machen sollen. Im praktischen Teil der Arbeit werden Messungen, die auf dem JuRoPATestcluster des Jülich Supercomputing Centre durchgeführt wurden, analysiert und dargestellt. Es wird gezeigt, wie sich der OS-Jitter auf zwei verschiedenen Varianten des Linux Betriebssystems bemerkbar macht, und welche Ursachen zugrunde liegen. Aus den gewonnenen Erkenntnissen wird ein Konzept zur Untersuchung des OS-Jitter auf einem beliebigen HPC System entwickelt. Es wird beschrieben, wie Störungen auf einem einzelnen Prozessor – unabhängig von den anderen – gemessen werden können. Ein zweites Werkzeug misst den Einfluss einer lokalen Störungen auf ein Programm, das viele Prozessoren parallel benutzt. Es wird gezeigt, wie mit Hilfe von der Frequenzanalyse und dem Dichteschätzer Informationen aus den Messdaten der beiden Benchmarks gewonnen werden können.
LB  - PUB:(DE-HGF)19
UR  - https://juser.fz-juelich.de/record/5458
ER  -