Entwicklung eines Werkzeugs zur Analyse des OS-Jitter Effekts auf High-Performance Cluster-Systemen

Graf, Stephan
% IMPORTANT: The following is UTF-8 encoded.  This means that in the presence
% of non-ASCII characters, it will not work with BibTeX 0.99 or older.
% Instead, you should use an up-to-date BibTeX implementation like “bibtex8” or
% “biber”.

@MASTERSTHESIS{Graf:5458,
      author       = {Graf, Stephan},
      title        = {{E}ntwicklung eines {W}erkzeugs zur {A}nalyse des
                      {OS}-{J}itter {E}ffekts auf {H}igh-{P}erformance
                      {C}luster-{S}ystemen},
      volume       = {4302},
      issn         = {0944-2952},
      school       = {F. Aachen},
      type         = {Master (FH)},
      address      = {Jülich},
      publisher    = {Forschungszentrum Jülich GmbH Zentralbibliothek, Verlag},
      reportid     = {PreJuSER-5458, Juel-4302},
      series       = {Berichte des Forschungszentrums Jülich},
      pages        = {II, 117 p.},
      year         = {2009},
      note         = {Record converted from VDB: 12.11.2012; Aachen, FH, Standort
                      Jülich, Masterarbeit 2009},
      abstract     = {Auf dem Gebiet des Höchstleistungsrechnens führt die
                      aktuelle Entwicklung zu Cluster-Systemen, die aus mehreren
                      Tausend Knoten bestehen. Jeder dieser Knoten ist mit vier
                      oder mehr Prozessoren ausgestattet. Um einen Rechner zu
                      betreiben, läuft auf jedem Knoten ein eigenständiges, von
                      den anderen unabhängiges Betriebssystem, welches heutzutage
                      ein UNIX-Derivat des jeweiligen Herstellers, meist jedoch
                      ein optimiertes Linux, ist. Bei Systemen dieser Art wird in
                      der Literatur oft von einem Leistungsverlust bei steigender
                      Anzahl genutzter Knoten im Zusammenhang mit kollektiven
                      Operationen bei parallelen Anwendungen berichtet. Ein Grund
                      dafür liegt meistens in Amdahl’s Law. Dieses besagt, dass
                      der nicht zu parallelisierende Anteil einer Applikation
                      dafür sorgt, dass ab einer gewissen Prozessorzahl eine
                      weitere Steigerung der Anzahl zu keinem weiteren
                      signifikanten Leistungsgewinn führt. Eine weitere Ursache,
                      die für den Leistungsverlust verantwortlich gemacht wird,
                      liegt in Betriebssystem-Aktivitäten. Diese müssen sich die
                      Ressourcen mit der Applikation teilen. Da diese Aktivitäten
                      nicht auf allen Knoten synchron auftreten, kann es bei
                      kollektiven Operationen innerhalb der Applikation zu
                      unnötigen Wartezeiten kommen. Dieser Effekt wird als
                      OS-Jitter bezeichnet. In dieser Arbeit werden zunächst die
                      technischen Grundlagen erklärt. Als Schwerpunkt wird das
                      Linux Betriebssystem betrachtet, speziell dessen aktuelle
                      Weiterentwicklungen im Bereich des Prozess-Scheduling und
                      der Echtzeitfähigkeit. Im Anschluss wird der OS-Jitter
                      beschrieben und dabei die Erkenntnisse aus der Literatur zu
                      Ursache, Visualisierung und Einflussminderung dieses Effekts
                      dargelegt. Danach werden spezialisierte Benchmarks
                      vorgestellt, die den OS-Jitter Effekt sichtbar machen
                      sollen. Im praktischen Teil der Arbeit werden Messungen, die
                      auf dem JuRoPATestcluster des Jülich Supercomputing Centre
                      durchgeführt wurden, analysiert und dargestellt. Es wird
                      gezeigt, wie sich der OS-Jitter auf zwei verschiedenen
                      Varianten des Linux Betriebssystems bemerkbar macht, und
                      welche Ursachen zugrunde liegen. Aus den gewonnenen
                      Erkenntnissen wird ein Konzept zur Untersuchung des
                      OS-Jitter auf einem beliebigen HPC System entwickelt. Es
                      wird beschrieben, wie Störungen auf einem einzelnen
                      Prozessor – unabhängig von den anderen – gemessen
                      werden können. Ein zweites Werkzeug misst den Einfluss
                      einer lokalen Störungen auf ein Programm, das viele
                      Prozessoren parallel benutzt. Es wird gezeigt, wie mit Hilfe
                      von der Frequenzanalyse und dem Dichteschätzer
                      Informationen aus den Messdaten der beiden Benchmarks
                      gewonnen werden können.},
      cin          = {JSC},
      cid          = {I:(DE-Juel1)JSC-20090406},
      pnm          = {Scientific Computing},
      pid          = {G:(DE-Juel1)FUEK411},
      typ          = {PUB:(DE-HGF)19},
      url          = {https://juser.fz-juelich.de/record/5458},
}
guest :: login JuSER
		Search		Submit		Personalize Your alerts Your baskets Your searches		Help