% IMPORTANT: The following is UTF-8 encoded. This means that in the presence
% of non-ASCII characters, it will not work with BibTeX 0.99 or older.
% Instead, you should use an up-to-date BibTeX implementation like “bibtex8” or
% “biber”.
@MASTERSTHESIS{Graf:5458,
author = {Graf, Stephan},
title = {{E}ntwicklung eines {W}erkzeugs zur {A}nalyse des
{OS}-{J}itter {E}ffekts auf {H}igh-{P}erformance
{C}luster-{S}ystemen},
volume = {4302},
issn = {0944-2952},
school = {F. Aachen},
type = {Master (FH)},
address = {Jülich},
publisher = {Forschungszentrum Jülich GmbH Zentralbibliothek, Verlag},
reportid = {PreJuSER-5458, Juel-4302},
series = {Berichte des Forschungszentrums Jülich},
pages = {II, 117 p.},
year = {2009},
note = {Record converted from VDB: 12.11.2012; Aachen, FH, Standort
Jülich, Masterarbeit 2009},
abstract = {Auf dem Gebiet des Höchstleistungsrechnens führt die
aktuelle Entwicklung zu Cluster-Systemen, die aus mehreren
Tausend Knoten bestehen. Jeder dieser Knoten ist mit vier
oder mehr Prozessoren ausgestattet. Um einen Rechner zu
betreiben, läuft auf jedem Knoten ein eigenständiges, von
den anderen unabhängiges Betriebssystem, welches heutzutage
ein UNIX-Derivat des jeweiligen Herstellers, meist jedoch
ein optimiertes Linux, ist. Bei Systemen dieser Art wird in
der Literatur oft von einem Leistungsverlust bei steigender
Anzahl genutzter Knoten im Zusammenhang mit kollektiven
Operationen bei parallelen Anwendungen berichtet. Ein Grund
dafür liegt meistens in Amdahl’s Law. Dieses besagt, dass
der nicht zu parallelisierende Anteil einer Applikation
dafür sorgt, dass ab einer gewissen Prozessorzahl eine
weitere Steigerung der Anzahl zu keinem weiteren
signifikanten Leistungsgewinn führt. Eine weitere Ursache,
die für den Leistungsverlust verantwortlich gemacht wird,
liegt in Betriebssystem-Aktivitäten. Diese müssen sich die
Ressourcen mit der Applikation teilen. Da diese Aktivitäten
nicht auf allen Knoten synchron auftreten, kann es bei
kollektiven Operationen innerhalb der Applikation zu
unnötigen Wartezeiten kommen. Dieser Effekt wird als
OS-Jitter bezeichnet. In dieser Arbeit werden zunächst die
technischen Grundlagen erklärt. Als Schwerpunkt wird das
Linux Betriebssystem betrachtet, speziell dessen aktuelle
Weiterentwicklungen im Bereich des Prozess-Scheduling und
der Echtzeitfähigkeit. Im Anschluss wird der OS-Jitter
beschrieben und dabei die Erkenntnisse aus der Literatur zu
Ursache, Visualisierung und Einflussminderung dieses Effekts
dargelegt. Danach werden spezialisierte Benchmarks
vorgestellt, die den OS-Jitter Effekt sichtbar machen
sollen. Im praktischen Teil der Arbeit werden Messungen, die
auf dem JuRoPATestcluster des Jülich Supercomputing Centre
durchgeführt wurden, analysiert und dargestellt. Es wird
gezeigt, wie sich der OS-Jitter auf zwei verschiedenen
Varianten des Linux Betriebssystems bemerkbar macht, und
welche Ursachen zugrunde liegen. Aus den gewonnenen
Erkenntnissen wird ein Konzept zur Untersuchung des
OS-Jitter auf einem beliebigen HPC System entwickelt. Es
wird beschrieben, wie Störungen auf einem einzelnen
Prozessor – unabhängig von den anderen – gemessen
werden können. Ein zweites Werkzeug misst den Einfluss
einer lokalen Störungen auf ein Programm, das viele
Prozessoren parallel benutzt. Es wird gezeigt, wie mit Hilfe
von der Frequenzanalyse und dem Dichteschätzer
Informationen aus den Messdaten der beiden Benchmarks
gewonnen werden können.},
cin = {JSC},
cid = {I:(DE-Juel1)JSC-20090406},
pnm = {Scientific Computing},
pid = {G:(DE-Juel1)FUEK411},
typ = {PUB:(DE-HGF)19},
url = {https://juser.fz-juelich.de/record/5458},
}