Download Slurm

Slurm source can be downloaded from https://www.schedmd.com/downloads.php.
Slurmソースはhttps://www.schedmd.com/downloads.phpからダウンロードできます。

Slurm has also been packaged for Debian and Ubuntu (named slurm-wlm or slurm-llnl depending upon the version), Fedora, and NetBSD (in pkgsrc) and FreeBSD.
Slurmは、DebianおよびUbuntu(バージョンに応じてslurm-wlmまたはslurm-llnlという名前)、Fedora、NetBSD(pkgsrc内)およびFreeBSD用にもパッケージ化されています。

Download Related Software

  • Authentication plugins identifies the user originating a message.
    認証プラグインは、メッセージを発信しているユーザーを識別します。
    • MUNGE (recommended)
      In order to compile the "auth/munge" authentication plugin for Slurm, you will need to build and install MUNGE, available from https://dun.github.io/munge/ and Debian and Fedora and Ubuntu.
      Slurm用の「auth / munge」認証プラグインをコンパイルするには、https://dun.github.io/munge/およびDebian、Fedora、Ubuntuから入手できるMUNGEをビルドしてインストールする必要があります。

  • Authentication tools for users that work with Slurm.
    Slurmを使用するユーザー向けの認証ツール。
    • AUKS
      AUKS is an utility designed to ease Kerberos V credential support addition to non-interactive applications, like batch systems (Slurm, LSF, Torque, etc.).
      AUKSは、バッチシステム(Slurm、LSF、Torqueなど)などの非対話型アプリケーションへのKerberosV資格情報サポートの追加を容易にするように設計されたユーティリティです。
      It includes a plugin for the Slurm workload manager.
      Slurmワークロードマネージャー用のプラグインが含まれています。
      AUKS is not used as an authentication plugin by the Slurm code itself, but provides a mechanism for the application to manage Kerberos V credentials.
      AUKSは、Slurmコード自体によって認証プラグインとして使用されませんが、アプリケーションがKerberosV資格情報を管理するためのメカニズムを提供します。

  • Databases can be used to store accounting information.
    データベースを使用して、アカウンティング情報を保存できます。
    See our Accounting web page for more information.
    詳細については、会計のWebページを参照してください。

  • Debuggers and debugging tools
    デバッガーとデバッグツール
    • TotalView is a GUI-based source code debugger well suited for parallel applications.
      TotalViewは、並列アプリケーションに最適なGUIベースのソースコードデバッガーです。
    • Padb is a job inspection tool for examining and debugging parallel programs, primarily it simplifies the process of gathering stack traces but also supports a wide range of other functions.
      Padbは、並列プログラムを検査およびデバッグするためのジョブ検査ツールです。主に、スタックトレースを収集するプロセスを簡素化しますが、他のさまざまな機能もサポートします。
      It's an open source, non-interactive, command line, scriptable tool intended for use by programmers and system administrators alike.
      これは、プログラマーとシステム管理者の両方が使用することを目的とした、オープンソースの非対話型のコマンドラインのスクリプト可能なツールです。

  • DRMAA (Distributed Resource Management Application API)
    DRMAA(分散リソース管理アプリケーションAPI)

    PSNC DRMAA for Slurm is an implementation of Open Grid Forum DRMAA 1.0 (Distributed Resource Management Application API) specification for submission and control of jobs to Slurm.
    PSNC DRMAA for Slurmは、Slurmへのジョブの送信と制御のためのOpen Grid Forum DRMAA 1.0(分散リソース管理アプリケーションAPI)仕様の実装です。
    Using DRMAA, grid applications builders, portal developers and ISVs can use the same high-level API to link their software with different cluster/resource management systems.
    DRMAAを使用すると、グリッドアプリケーションビルダー、ポータル開発者、およびISVは、同じ高レベルAPIを使用して、ソフトウェアをさまざまなクラスター/リソース管理システムにリンクできます。


    There is a variant of PSNC DRMAA providing support for Slurm's --cluster option available from https://github.com/natefoo/slurm-drmaa.
    https://github.com/natefoo/slurm-drmaaから入手可能なSlurmの--clusterオプションのサポートを提供するPSNCDRMAAのバリアントがあります。


    Perl 6 DRMAA bindings are available from https://github.com/scovit/Scheduler-DRMAA.
    Perl 6 DRMAAバインディングは、https://github.com/scovit/Scheduler-DRMAAから入手できます。

  • Hostlist
    A Python program used for manipulation of Slurm hostlists including functions such as intersection and difference.
    共通部分や差分などの関数を含むSlurmホストリストの操作に使用されるPythonプログラム。
    Download the code from:
    以下からコードをダウンロードします。

    http://www.nsc.liu.se/~kent/python-hostlist

    Lua bindings for hostlist functions are also available here:
    ホストリスト関数のLuaバインディングもここで利用できます:

    https://github.com/grondo/lua-hostlist
    NOTE: The Lua hostlist functions do not support the bracketed numeric ranges anywhere except at the end of the name (i.e. "tux[0001-0100]" and "rack[0-3]_blade[0-63]" are not supported).
    注:Luaホストリスト関数は、名前の末尾を除いて、括弧で囲まれた数値範囲をサポートしていません(つまり、「tux [0001-0100]」および「rack [0-3] _blade [0-63]」はサポートされていません)。 。

  • Interactive Script
    インタラクティブスクリプト

    A wrapper script that makes it very simple to get an interactive shell on a cluster.
    クラスター上でインタラクティブシェルを取得するのを非常に簡単にするラッパースクリプト。
    Download the code from:
    以下からコードをダウンロードします。

    https://github.com/alanorth/hpc_infrastructure_scripts/blob/master/slurm/interactive

  • Interconnect plugins (Switch plugin)
    相互接続プラグイン(スイッチプラグイン)
    • Infiniband
      Infiniband

      The topology.conf file for an Infiniband switch can be automatically generated using the slurmibtopology tool found here:
      Infinibandスイッチのtopology.confファイルは、次の場所にあるslurmibtopologyツールを使用して自動的に生成できます。

      https://ftp.fysik.dtu.dk/Slurm/slurmibtopology.sh.

  • I/O Watchdog
    I / Oウォッチドッグ

    A facility for monitoring user applications, most notably parallel jobs, for hangs which typically have a side-effect of ceasing all write activity.
    通常、すべての書き込みアクティビティを停止するという副作用があるハングについて、ユーザーアプリケーション、特に並列ジョブを監視するための機能。
    This facility attempts to monitor all write activity of an application and trigger a set of user-defined actions when write activity as ceased for a configurable period of time.
    この機能は、アプリケーションのすべての書き込みアクティビティを監視し、書き込みアクティビティが構成可能な期間停止したときに、一連のユーザー定義アクションをトリガーしようとします。
    A SPANK plugin is provided for use with Slurm.
    Slurmで使用するためのSPANKプラグインが提供されています。
    See the README and man page in the package for more details.
    詳細については、パッケージのREADMEおよびmanページを参照してください。
    https://github.com/grondo/io-watchdog

  • MPI versions supported
    サポートされているMPIバージョン

  • Workload Simulator
    ワークロードシミュレーター

    A Slurm simulator is available to assess various scheduling policies using historic workload data.
    Slurmシミュレーターを使用して、過去のワークロードデータを使用してさまざまなスケジューリングポリシーを評価できます。
    Under simulation, jobs are not actually executed.
    シミュレーションでは、ジョブは実際には実行されません。
    Instead, a job execution trace from a real system, or a synthetic trace, are used.
    代わりに、実際のシステムからのジョブ実行トレース、または合成トレースが使用されます。

    NOTE: This sofware is currently not maintained.
    注:このソフトウェアは現在メンテナンスされていません。

  • PAM Module (pam_slurm)
    PAMモジュール(pam_slurm)

    Pluggable Authentication Module (PAM) for restricting access to compute nodes where Slurm performs workload management.
    Slurmがワークロード管理を実行する計算ノードへのアクセスを制限するためのPluggableAuthentication Module(PAM)。
    Access to the node is restricted to user root and users who have been allocated resources on that node.
    ノードへのアクセスは、ユーザーrootと、そのノードでリソースが割り当てられているユーザーに制限されます。
    NOTE: pam_slurm is included within the Slurm distribution.
    注:pam_slurmはSlurmディストリビューションに含まれています。
    For earlier Slurm versions, pam_slurm is available for download here.
    以前のSlurmバージョンの場合、pam_slurmはここからダウンロードできます。

    Slurm's PAM module has also been packaged for Debian and Ubuntu (both named libpam-slurm).
    SlurmのPAMモジュールは、DebianおよびUbuntu用にパッケージ化されています(どちらもlibpam-slurmという名前です)。

  • Command wrappers
    コマンドラッパー

    There is a wrapper for Maui/Moab's showq command here.
    ここにMaui / Moabのshowqコマンドのラッパーがあります。


  • Job Script Generator
    ジョブスクリプトジェネレータ

    Brigham Young University has developed a Javascript tool to generate batch job scripts for Slurm which is available here.
    ブリガムヤング大学は、Slurmのバッチジョブスクリプトを生成するためのJavascriptツールを開発しました。これは、こちらから入手できます。


  • Scripting interfaces
    スクリプトインターフェイス
    • A Perl interface is included in the Slurm distribution in the contribs/perlapi directory and packaged in the perapi RPM.
      Perlインターフェースはcontribs / perlapiディレクトリのSlurmディストリビューションに含まれており、perapiRPMにパッケージ化されています。
    • PySlurm is a Python/Pyrex module to interface with Slurm.
      PySlurmは、SlurmとインターフェイスするPython / Pyrexモジュールです。
      There is also a Python module to expand and collect hostlist expressions available here.
      ここで利用可能なホストリスト式を拡張および収集するためのPythonモジュールもあります。
    • Lua may be used to implement a Slurm process tracking plugin.
      Luaは、Slurmプロセス追跡プラグインを実装するために使用できます。
      The Lua script available in contribs/lua/protrack.lua implements containers using CPUSETs.
      contribs / lua / protrack.luaで利用可能なLuaスクリプトは、CPUSETを使用してコンテナーを実装します。

  • SPANK Plugins
    SPANKプラグイン

    SPANK provides a very generic interface for stackable plug-ins which may be used to dynamically modify the job launch code in Slurm.
    SPANKは、Slurmのジョブ起動コードを動的に変更するために使用できるスタック可能なプラグイン用の非常に汎用的なインターフェースを提供します。
    SPANK plugins may be built without access to Slurm source code.
    SPANKプラグインは、Slurmソースコードにアクセスせずにビルドされる場合があります。
    They need only be compiled against Slurm‘s spank.h header file, added to the SPANK config file plugstack.conf, and they will be loaded at runtime during the next job launch.
    これらは、Slurmのspank.hヘッダーファイルに対してコンパイルし、SPANK構成ファイルplugstack.confに追加するだけでよく、実行時に次のジョブの起動時にロードされます。
    Thus, the SPANK infrastructure provides administrators and other developers a low cost, low effort ability to dynamically modify the runtime behavior of Slurm job launch.
    したがって、SPANKインフラストラクチャは、管理者や他の開発者に、Slurmジョブ起動の実行時の動作を動的に変更するための低コストで低労力の機能を提供します。
    As assortment of SPANK plugins are available from
    SPANKプラグインの品揃えはから入手可能です

    https://github.com/grondo/slurm-spank-plugins.
    A SPANK plugin called "spunnel" to support ssh port forwarding is available from Harvard University.
    sshポート転送をサポートする「spunnel」と呼ばれるSPANKプラグインは、ハーバード大学から入手できます。
    It can be downloaded from the spunnel repository.
    スパンネルリポジトリからダウンロードできます。

  • Sqlog
    A set of scripts that leverages Slurm's job completion logging facility in provide information about what jobs were running at any point in the past as well as what resources they used.
    Slurmのジョブ完了ログ機能を活用して、過去の任意の時点で実行されていたジョブと、それらが使用したリソースに関する情報を提供する一連のスクリプト。
    Download the code from:
    以下からコードをダウンロードします。

    https://github.com/grondo/sqlog

  • Task Affinity plugins
    TaskAffinityプラグイン

  • Node Health Check
    ノードヘルスチェック

    Probably the most comprehensive and lightweight health check tool out there is LBNL Node Health Check.
    おそらく、最も包括的で軽量なヘルスチェックツールは、LBNLノードヘルスチェックです。
    It has integration with Slurm as well as Torque resource managers.
    SlurmおよびTorqueリソースマネージャーと統合されています。

  • Accounting Tools
    会計ツール

    • UBMoD is a web based tool for displaying accounting data from various resource managers.
      UBMoDは、さまざまなリソースマネージャーからのアカウンティングデータを表示するためのWebベースのツールです。
      It aggregates the accounting data from sacct into a MySQL data warehouse and provide a front end web interface for browsing the data.
      sacctからMySQLデータウェアハウスにアカウンティングデータを集約し、データを参照するためのフロントエンドWebインターフェイスを提供します。
      For more information, see the UDMod home page and source code.
      詳細については、UDModホームページとソースコードを参照してください。

    • XDMoD (XD Metrics on Demand) is an NSF-funded open source tool designed to audit and facilitate the utilization of the XSEDE cyberinfrastructure by providing a wide range of metrics on XSEDE resources, including resource utilization, resource performance, and impact on scholarship and research.
      XDMoD(XD Metrics on Demand)は、リソースの使用率、リソースのパフォーマンス、奨学金や研究への影響など、XSEDEリソースに関する幅広いメトリックを提供することにより、XSEDEサイバーインフラストラクチャの使用を監査および促進するように設計されたNSF資金によるオープンソースツールです。 。

  • STUBL (Slurm Tools and UBiLities)
    STUBL(Slurm Tools and UBiLities)

    STUBL is a collection of supplemental tools and utility scripts for Slurm.
    STUBLは、Slurm用の補足ツールとユーティリティスクリプトのコレクションです。

    STUBL home page.

    pbs2sbatch
    Converts PBS directives to equivalent Slurm sbatch directives.
    PBSディレクティブを同等のSlurmsbatchディレクティブに変換します。
    Accommodates old UB CCR-specific PBS tags like IB1, IB2, etc.
    IB1、IB2などの古いUBCCR固有のPBSタグに対応します。
    pbs2slurm
    A script that attempts to convert PBS scripts into corresponding sbatch scripts.
    PBSスクリプトを対応するスバッチスクリプトに変換しようとするスクリプト。
    It will convert PBS directives as well as PBS environment variables and will insert bash code to create a SLURM_NODEFILE that is consistent with the PBS_NODEFILE.
    PBSディレクティブとPBS環境変数を変換し、bashコードを挿入して、PBS_NODEFILEと整合性のあるSLURM_NODEFILEを作成します。
    slurmbf
    Analogous to the PBS "showbf -S" command.
    PBSの「showbf-S」コマンドに類似しています。
    snodes
    A customized version of sinfo.
    sinfoのカスタマイズされたバージョン。
    Displays node information in an easy-to-interpet format.
    インターペットしやすい形式でノード情報を表示します。
    Filters can be applied to view (1) specific nodes, (2) nodes in a specific partition, or (3) nodes in a specifc state.
    フィルタを適用して、(1)特定のノード、(2)特定のパーティション内のノード、または(3)特定の状態のノードを表示できます。
    sqstat
    A customized version of squeue that produces output analogous to the PBS qstat and xqstat commands (requires clush).
    PBS qstatおよびxqstatコマンドに類似した出力を生成するカスタマイズされたバージョンのsqueue(clushが必要)。
    fisbatch
    Friendly Interactive sbatch.
    フレンドリーなインタラクティブスバッチ。
    A customized version of sbatch that provides a user-friendly interface to an interactive job with X11 forwarding enabled.
    X11転送が有効になっているインタラクティブジョブへのユーザーフレンドリーなインターフェイスを提供する、カスタマイズされたバージョンのsbatch。
    It is analogous to the PBS "qsub -I -X" command.
    これは、PBSの「qsub-I-X」コマンドに類似しています。
    This code was adopted from srun.x11 (requires clush).
    このコードはsrun.x11から採用されました(clushが必要です)。
    sranks
    A command that lists the overall priorities and associated priority components of queued jobs in ascending order.
    キューに入れられたジョブの全体的な優先順位および関連する優先順位コンポーネントを昇順でリストするコマンド。
    Top-ranked jobs will be given priority by the scheduler but lower ranked jobs may get slotted in first if they fit into the scheduler's backfill window.
    上位ランクのジョブはスケジューラーによって優先されますが、下位ランクのジョブは、スケジューラーの埋め戻しウィンドウに収まる場合、最初にスロットに入れられる可能性があります。
    sqelp
    A customized version of squeue that only prints a double-quote if the information in a column is the same from row to row.
    列の情報が行間で同じである場合にのみ二重引用符を出力する、カスタマイズされたバージョンのsqueue。
    Some users find this type of formatting easier to visually digest.
    一部のユーザーは、このタイプのフォーマットが視覚的に消化しやすいと感じています。
    sjeff
    Determines the efficiency of one or more running jobs.
    1つ以上の実行中のジョブの効率を決定します。
    Inefficient jobs are high-lighted in red text (requires clush).
    非効率的なジョブは赤いテキストで強調表示されます(クラッシュが必要です)。
    sueff
    Determines the overall efficiency of the running jobs of one or more users.
    1人以上のユーザーの実行中のジョブの全体的な効率を決定します。
    Users that are inefficient are highlighted in red text (requires clush).
    非効率的なユーザーは赤いテキストで強調表示されます(クラッシュが必要です)。
    yasqr
    Yet Another Squeue Replacement.
    さらに別のスキューの交換。
    Fixes squeue bugs in earlier versions of Slurm.
    以前のバージョンのSlurmでのsqueueのバグを修正しました。
    sgetscr
    Retrieves the Slurm/sbatch script and environment files for a job that is queued or running.
    キューに入れられている、または実行中のジョブのSlurm / sbatchスクリプトおよび環境ファイルを取得します。
    snacct
    Retrieves Slurm accounting information for a given node and for a given period of time.
    特定のノードおよび特定の期間のSlurmアカウンティング情報を取得します。
    suacct
    Retrieves Slurm accounting information for a given user's jobs for a given period of time.
    特定の期間における特定のユーザーのジョブのSlurmアカウンティング情報を取得します。
    slist
    Retrieves Slurm accounting and node information for a running or completed job (requires clush).
    実行中または完了したジョブのSlurmアカウンティングおよびノー​​ド情報を取得します(クラッシュが必要です)。
    slogs
    Retrieves resource usage and accounting information for a user or list of users.
    ユーザーまたはユーザーのリストのリソース使用量とアカウンティング情報を取得します。
    For each job that was run after the given start date, the following information is gathered from the Slurm accounting logs: Number of CPUs, Start Time, Elapsed Time, Amount of RAM Requested, Average RAM Used, and Max RAM Used.
    指定された開始日以降に実行されたジョブごとに、Slurmアカウンティングログから次の情報が収集されます:CPUの数、開始時間、経過時間、要求されたRAMの量、使用された平均RAM、および使用された最大RAM。

  • pestat
    Prints a consolidated compute node status line, with one line per node including a list of jobs.
    統合された計算ノードのステータス行を出力します。ノードごとに1行で、ジョブのリストが含まれます。

    Home page

  • Slurmmon
    Slurmmon is a system for gathering and plotting data about Slurm scheduling and job characteristics.
    Slurmmonは、Slurmのスケジューリングとジョブの特性に関するデータを収集してプロットするためのシステムです。
    It currently simply sends the data to ganglia, but it includes some custom reports and a web page for an organized summary.
    現在は単にデータを神経節に送信しますが、いくつかのカスタムレポートと整理された要約のWebページが含まれています。
    It collects all the data from sdiag as well as total counts of running and pending jobs in the system and the maximum such values for any single user.
    sdiagからすべてのデータを収集するだけでなく、システムで実行中および保留中のジョブの総数と、単一ユーザーのそのような最大値を収集します。
    It can also submit probe jobs to various partitions in order to trend the times spent pending in them, which is often a good bellwether of scheduling problems.
    また、プローブジョブをさまざまなパーティションに送信して、それらのパーティションで保留になっている時間をトレンド分析することもできます。これは、多くの場合、スケジューリングの問題の良い兆候です。

    Slurmmon code

  • Graphical Sdiag
    The sdiag utility is a diagnostic tool that maintains statistics on Slurm's scheduling performance.
    sdiagユーティリティは、Slurmのスケジューリングパフォーマンスに関する統計を維持する診断ツールです。
    You can run sdiag periodically or as you modify Slurm's configuration.
    sdiagは、定期的に実行することも、Slurmの構成を変更するときに実行することもできます。
    However if you want a historical view of these statistics, you could save them in a time-series database and graph them over time as performed with this tool:
    ただし、これらの統計の履歴ビューが必要な場合は、時系列データベースに保存して、このツールで実行したように時間の経過とともにグラフ化することができます。

  • MSlurm
    Such a superstructure for the management of multiple Slurm environments is done with MSlurm.
    複数のSlurm環境を管理するためのこのような上部構造は、MSlurmを使用して実行されます。
    Thereby several Slurm clusters - even across multiple Slurm databases - can run parallel on a Slurm master and can be administered in an easy and elegantly manner.
    これにより、複数のSlurmクラスター(複数のSlurmデータベースにまたがる場合でも)をSlurmマスター上で並行して実行でき、簡単かつエレガントな方法で管理できます。

  • JSON
    Some Slurm plugins (burst_buffer/datawarp and power/cray_aries) plugins parse JSON format data.
    一部のSlurmプラグイン(burst_buffer / datawarpおよびpower / cray_aries)プラグインは、JSON形式のデータを解析します。
    These plugins are designed to make use of the JSON-C library for this purpose.
    これらのプラグインは、この目的のためにJSON-Cライブラリを利用するように設計されています。
    Instructions for the build are as follows:
    ビルドの手順は次のとおりです。
    1. Download json-c version 0.12 (or higher) from
      json-cバージョン0.12(またはそれ以降)をからダウンロード

      https://github.com/json-c/json-c/wiki
    2. Unpackage json-c
      gunzip json-c-0.12.tar.gz
      tar -xf json-c-0.12.tar
    3. Built and install json-c
      json-cをビルドしてインストールします
      • If you have current build tools
        現在のビルドツールがある場合

        cd json-c-0.12
        export CFLAGS=-Wno-error=unused-but-set-variable
        ./configure --prefix=DESIRED_PATH
        make
        make install
      • If you have old build tools
        古いビルドツールをお持ちの場合

        cd json-c-0.12
        mv aclocal.m4 aclocal.m4.orig
        mv ltmain.sh ltmain.sh.orig
        ./autogen.sh
        export CFLAGS=-Wno-error=unused-but-set-variable
        ./configure --prefix=DESIRED_JSON_PATH
        make
        make install
    4. Build and install Slurm
      Slurmをビルドしてインストールする

      ./configure --with-json=DESIRED_JSON_PATH ...
      make -j

  • Slurm-web
    Slurm-web is a free software, distributed under the GPL version 2 license, that provides both a HTTP REST API (based on JSON format) and a web GUI with dashboards and graphical views of the current state of your Slurm-based HPC supercomputers.
    Slurm-webは、GPLバージョン2ライセンスの下で配布される無料のソフトウェアであり、HTTP REST API(JSON形式に基づく)と、SlurmベースのHPCスーパーコンピューターの現在の状態のダッシュボードとグラフィカルビューを備えたWebGUIの両方を提供します。
    The website of Slurm-web, with screenshots:
    スクリーンショット付きのSlurm-webのWebサイト:

    http://edf-hpc.github.io/slurm-web

Last modified 15 July 2019