knl.conf

Section: Slurm Configuration File (5)
Updated: Slurm Configuration File
Index

 

NAME

knl.conf - Slurm configuration file for Intel Knights Landing processor.
knl.conf-Intel KnightsLandingプロセッサのSlurm構成ファイル。

 

DESCRIPTION

This ASCII file which describes configuration information for Intel Knights Landing processors and its name may depend upon the NodeFeatures plugin configured in Slurm.
Intel Knights Landingプロセッサの構成情報とその名前を記述したこのASCIIファイルは、Slurmで構成されたNodeFeaturesプラグインに依存する場合があります。
For example, on Cray systems NodeFeatures should be configured to "knl_cray" and its configuration file will be read from "knl_cray.conf".
たとえば、Crayシステムでは、NodeFeaturesを「knl_cray」に構成する必要があり、その構成ファイルは「knl_cray.conf」から読み取られます。
The file location can be modified at system build time using the DEFAULT_SLURM_CONF parameter or at execution time by setting the SLURM_CONF environment variable.
ファイルの場所は、システムのビルド時にDEFAULT_SLURM_CONFパラメーターを使用して変更することも、実行時にSLURM_CONF環境変数を設定することによって変更することもできます。
The file will always be located in the same directory as the slurm.conf file.
このファイルは常にslurm.confファイルと同じディレクトリにあります。
This file is optional.
このファイルはオプションです。

Parameter names are case insensitive.
パラメータ名では大文字と小文字は区別されません。
Any text following a "#" in the configuration file is treated as a comment through the end of that line.
構成ファイルの「#」に続くテキストは、その行の終わりまでコメントとして扱われます。
Changes to the configuration file take effect upon restart of Slurm daemons, daemon receipt of the SIGHUP signal, or execution of the command "scontrol reconfigure" unless otherwise noted.
構成ファイルへの変更は、特に明記されていない限り、Slurmデーモンの再起動、デーモンによるSIGHUPシグナルの受信、またはコマンド「scontrolreconfigure」の実行時に有効になります。

The overall configuration parameters available include:
使用可能な全体的な構成パラメーターは次のとおりです。

AllowMCDRAM
Specify the MCDRAM modes which jobs are allowed to use.
ジョブが使用できるMCDRAMモードを指定します。
This may be a subset of MCDRAM modes supported by the node.
これは、ノードでサポートされているMCDRAMモードのサブセットである可能性があります。
If not specified, all MCDRAM modes supported by the node are available for use.
指定しない場合、ノードでサポートされているすべてのMCDRAMモードを使用できます。
The comma separated list of allowed MCDRAM modes may include any of the modes listed below.
許可されるMCDRAMモードのコンマ区切りのリストには、以下にリストされているモードのいずれかを含めることができます。
cache
All of MCDRAM to be used as cache.
キャッシュとして使用されるすべてのMCDRAM。
equal
MCDRAM to be used partly as cache and partly combined with primary memory.
一部はキャッシュとして使用され、一部はプライマリメモリと組み合わされるMCDRAM。
flat
MCDRAM to be combined with primary memory into a "flat" memory space.
プライマリメモリと組み合わせて「フラット」メモリ空間にするMCDRAM。

AllowNUMA
Specify the NUMA modes which jobs are allowed to use.
ジョブが使用できるNUMAモードを指定します。
This may be a subset of NUMA modes supported by the node.
これは、ノードでサポートされているNUMAモードのサブセットである可能性があります。
If not specified, all NUMA modes supported by the node are available for use.
指定しない場合、ノードでサポートされているすべてのNUMAモードを使用できます。
The comma separated list of allowed NUMA modes may include any of the modes listed below.
許可されるNUMAモードのコンマ区切りのリストには、以下にリストされているモードのいずれかを含めることができます。
Note that Slurm can only support homogeneous nodes (e.g. the same number of cores per NUMA node).
Slurmは同種のノードのみをサポートできることに注意してください(たとえば、NUMAノードごとに同じ数のコア)。
KNL scn4 and quad modes are not homogeneous, but each each NUMA mode will have either 16 or 18 cores.
KNL scn4モードとquadモードは同種ではありませんが、各NUMAモードには16コアまたは18コアがあります。
This will result in Slurm using the lower core count and finding a total of 256 threads rather than 272 threads and setting the node to a DOWN state.
これにより、Slurmはより少ないコア数を使用し、272スレッドではなく合計256スレッドを検出し、ノードをDOWN状態に設定します。
Therefore it is recommended that snc4 and quad mode not be allowed at this time.
したがって、現時点ではsnc4およびquadモードを許可しないことをお勧めします。
a2a
All to all
snc2
Sub-NUMA cluster 2
snc4
Sub-NUMA cluster 4
hemi
Hemisphere
quad
Quadrant

AllowUserBoot
A comma delimited list of users allowed to modify a node's MCDRAM or NUMA state.
ノードのMCDRAMまたはNUMA状態の変更を許可されているユーザーのコンマ区切りリスト。
If not specified then any user can change a node's state and reboot it.
指定されていない場合、すべてのユーザーがノードの状態を変更して再起動できます。

BootTime
Estimated time to reboot a node in seconds.
ノードを再起動する推定時間(秒単位)。
Used as a basis for optimizing scheduling decisions.
スケジューリングの決定を最適化するための基礎として使用されます。
The default value is 300 seconds (5 minutes) for the "knl_generic" plugin and 2700 seconds (45 minutes) for the "knl_cray" plugin.
デフォルト値は、「knl_generic」プラグインの場合は300秒(5分)、「knl_cray」プラグインの場合は2700秒(45分)です。

CapmcPath
Fully qualified path to the capmc program.
capmcプログラムへの完全修飾パス。
The default value is "/opt/cray/capmc/default/bin/capmc".
デフォルト値は「/ opt / cray / capmc / default / bin / capmc」です。
This parameter is used only by the "knl_cray" plugin.
このパラメーターは、「knl_cray」プラグインによってのみ使用されます。

CapmcPollFreq
Time interval between when the capmc program should poll for node state changes, in seconds.
capmcプログラムがノード状態の変化をポーリングする時間間隔(秒単位)。
The default value is 45 seconds.
デフォルト値は45秒です。
This parameter is used only by the "knl_cray" plugin.
このパラメーターは、「knl_cray」プラグインによってのみ使用されます。

CapmcRetries
Number of times to retry failed operations of the capmc program.
capmcプログラムの失敗した操作を再試行する回数。
Default value is 4.
デフォルト値は4です。

CapmcTimeout
Time limit for the capmc program to return status information milliseconds.
capmcプログラムがステータス情報をミリ秒単位で返す時間制限。
The default value is 60000 milliseconds and the minimum value is 1000 milliseconds.
デフォルト値は60000ミリ秒で、最小値は1000ミリ秒です。
This parameter is used by the "knl_cray" plugin, plus the capmc_suspend and capmc_resume programs used for suspending and resuming nodes.
このパラメーターは、「knl_cray」プラグインに加えて、ノードの一時停止と再開に使用されるcapmc_suspendおよびcapmc_resumeプログラムによって使用されます。

CnselectPath
Fully qualified path to the cnselect program.
cnselectプログラムへの完全修飾パス。
The default value is "/opt/cray/sdb/default/bin/cnselect".
デフォルト値は「/ opt / cray / sdb / default / bin / cnselect」です。
This parameter is used only by the "knl_cray" plugin.
このパラメーターは、「knl_cray」プラグインによってのみ使用されます。

DefaultMCDRAM
Specify the default MCDRAM modes for job's which do not specify a value.
値を指定しないジョブのデフォルトのMCDRAMモードを指定します。
This is only used when a node is booted and the job which has been allocated the node does not specify a desired MCDRAM mode.
これは、ノードが起動され、ノードに割り当てられたジョブが目的のMCDRAMモードを指定していない場合にのみ使用されます。
The value can include one of the possible values identified with the AllowMCDRAM configuration parameter above.
値には、上記のAllowMCDRAM構成パラメーターで識別される可能な値の1つを含めることができます。
The default value is "cache".
デフォルト値は「キャッシュ」です。

DefaultNUMA
Specify the default NUMA modes for job's which do not specify a value.
値を指定しないジョブのデフォルトのNUMAモードを指定します。
This is only used when a node is booted and the job which has been allocated the node does not specify a desired NUMA mode.
これは、ノードが起動され、ノードに割り当てられたジョブが目的のNUMAモードを指定していない場合にのみ使用されます。
The value can include one of the possible values identified with the AllowNUMA configuration parameter above.
値には、上記のAllowNUMA構成パラメーターで識別される可能な値の1つを含めることができます。
The default value is "a2a".
デフォルト値は「a2a」です。

Force
If set to a non-zero value then load the node_features/generic plugin even on non-KNL nodes.
ゼロ以外の値に設定されている場合は、KNL以外のノードでもnode_features / genericプラグインをロードします。
Used primarily for testing purposes.
主にテスト目的で使用されます。

LogFile
Fully qualified path to a log file.
ログファイルへの完全修飾パス。
The default value is SlurmctldLogFile from the slurm.conf configuration file.
デフォルト値は、slurm.conf構成ファイルのSlurmctldLogFileです。
This is option is used only by the campc_suspend and campc_resume programs (which power down and reboot nodes in the appropriate configuration).
このオプションは、campc_suspendおよびcampc_resumeプログラム(適切な構成でノードの電源を切り、再起動する)によってのみ使用されます。

McPath
Fully qualified path to memory controller device file directory.
メモリコントローラデバイスファイルディレクトリへの完全修飾パス。
Children of this directory with names of the form "mc#/csrow#/ue_count" (i.e. the count of unrecoverable memory errors) will be monitored for non-zero values.
「mc#/ csrow#/ ue_count」という形式の名前を持つこのディレクトリの子(つまり、回復不能なメモリエラーの数)は、ゼロ以外の値がないか監視されます。
If such errors are detected, the node will be set to a DOWN state and the slurmd daemon will shutdown.
このようなエラーが検出されると、ノードはDOWN状態に設定され、slurmdデーモンがシャットダウンします。
The default value is "/sys/devices/system/edac/mc".
デフォルト値は「/ sys / devices / system / edac / mc」です。
See also UmeCheckInterval.
UmeCheckIntervalも参照してください。

NodeRebootWeight
If a compute node requires a reboot to be usable for a pending job, then reset the node's weight to the specified value.
計算ノードが保留中のジョブで使用できるように再起動が必要な場合は、ノードの重みを指定された値にリセットします。
The default value is 4,294,967,294 (0xfffffffe).
デフォルト値は4,294,967,294(0xfffffffe)です。
See also "Weight" in the node configuration specification of slurm.conf.
slurm.confのノード構成仕様の「Weight」も参照してください。

NumaCpuBind
Contains pairs of NUMA modes and the CpuBind mode to set a node to for that mode.
NUMAモードとCpuBindモードのペアが含まれ、そのモードのノードを設定します。
Any compute node found with or set to the specified NUMA mode will have that node's CpuBind field set to the configured value.
指定されたNUMAモードで検出された、または設定された計算ノードでは、そのノードのCpuBindフィールドが構成された値に設定されます。
The NUMA node will be followed by an equal sign the desired CpuBind mode for that NUMA mode.
NUMAノードの後に​​は、そのNUMAモードに必要なCpuBindモードの等号が続きます。
Multiple NUMA mode and CpuBind modes should be in a semicolon separated list.
複数のNUMAモードとCpuBindモードは、セミコロンで区切られたリストに含める必要があります。
By default changes to a node's NUMA mode will not effect that node's CpuBind mode.
デフォルトでは、ノードのNUMAモードへの変更は、そのノードのCpuBindモードには影響しません。
See the example below.
以下の例を参照してください。

SyscfgPath
Fully qualified path to Intel's syscfg program, which identifies current KNL configuration by viewing BIOS settings.
BIOS設定を表示して現在のKNL構成を識別するIntelのsyscfgプログラムへの完全修飾パス。
If not defined, the current BIOS setting will not be available.
定義されていない場合、現在のBIOS設定は使用できません。
The default value is "/usr/bin/syscfg".
デフォルト値は「/ usr / bin / syscfg」です。
This parameter is used only by the "knl_generic" plugin.
このパラメーターは、「knl_generic」プラグインによってのみ使用されます。

SyscfgTimeout
Timeout for syscfg program in milliseconds.
ミリ秒単位のsyscfgプログラムのタイムアウト。
Default value is 1000 milliseconds.
デフォルト値は1000ミリ秒です。
For Dell KNL systems, experience has shown that a higher value of 10000 milliseconds is more appropriate.
Dell KNLシステムの場合、経験上、10000ミリ秒という高い値がより適切であることが示されています。

SystemType
Used to distinguish the flavor of knl we are dealing with.
私たちが扱っているknlのフレーバーを区別するために使用されます。
Possible options are "Dell" and "Intel".
可能なオプションは「Dell」と「Intel」です。
The default value is "Intel".
デフォルト値は「Intel」です。
This parameter is used only by the "knl_generic" plugin.
このパラメーターは、「knl_generic」プラグインによってのみ使用されます。

UmeCheckInterval
Interval, in microseconds, between checks for Uncorrectable Memory Errors (UME).
訂正不能メモリー・エラー(UME)のチェック間の間隔(マイクロ秒単位)。
If such errors are detected, the node will be set to a DOWN state and the slurmd daemon will shutdown.
このようなエラーが検出されると、ノードはDOWN状態に設定され、slurmdデーモンがシャットダウンします。
The default value is 0 (disabled).
デフォルト値は0(無効)です。
See also McPath.
McPathも参照してください。

ValidateMode
If set to 1 then validate, but do not modify the node's configured MCDRAM and NUMA modes from the slurm.conf file.
1に設定されている場合は、検証しますが、slurm.confファイルからノードの構成済みMCDRAMおよびNUMAモードを変更しないでください。
If the actual modes do not match configured values the node will be set to a DOWN state.
実際のモードが構成された値と一致しない場合、ノードはDOWN状態に設定されます。
Every KNL nodes MCDRAM and NUMA states must both be listed in the slurm.conf file.
すべてのKNLノードのMCDRAM状態とNUMA状態は、両方ともslurm.confファイルにリストされている必要があります。
This parameter is used only by the "knl_cray" plugin.
このパラメーターは、「knl_cray」プラグインによってのみ使用されます。

 

EXAMPLE


###################################################################
# knl_cray.conf
# Slurm configuration file for Intel Knights Landing on Cray system
###################################################################
CapmcPath=/opt/cray/capmc/default/bin/capmc
CapmcTimeout=6000
DefaultMCDRAM=flat
DefaultNUMA=a2a
NumaCpuBind=a2a=core;snc2=thread;snc4=thread
LogFile=/var/tmp/slurm_node_feature.log
SyscfgPath=/usr/sbin/syscfg

 

COPYING

Copyright (C) 2015-2017 SchedMD LLC.

This file is part of Slurm, a resource management program. For details, see <https://slurm.schedmd.com/>.

Slurm is free software; you can redistribute it and/or modify it under the terms of the GNU General Public License as published by the Free Software Foundation; either version 2 of the License, or (at your option) any later version.

Slurm is distributed in the hope that it will be useful, but WITHOUT ANY WARRANTY; without even the implied warranty of MERCHANTABILITY or FITNESS FOR A PARTICULAR PURPOSE. See the GNU General Public License for more details.

 

SEE ALSO

slurm.conf(5)


 

Index

NAME
DESCRIPTION
EXAMPLE
COPYING
SEE ALSO

This document was created by man2html using the manual pages.
Time: 20:44:46 GMT, May 21, 2020