Release Notes
The following are the contents of the RELEASE_NOTES file as distributed
with the Slurm source code for this release.
以下は、このリリースのSlurmソースコードとともに配布されたRELEASE_NOTESファイルの内容です。
Please refer to the NEWS include
alongside the source as well for more detailed descriptions of the associated
changes, and for bugs fixed within each maintenance release.
関連する変更の詳細な説明、および各メンテナンスリリース内で修正されたバグについては、ソースと一緒に含まれているNEWSも参照してください。
RELEASE NOTES FOR SLURM VERSION 20.02
SLURMバージョン20.02のリリースノート
IMPORTANT NOTES: If using the slurmdbd (Slurm DataBase Daemon) you must update this first.
slurmdbd(Slurm DataBase Daemon)を使用している場合は、最初にこれを更新する必要があります。
NOTE: If using a backup DBD you must start the primary first to do any database conversion, the backup will not start until this has happened.
注:バックアップDBDを使用している場合、データベース変換を行うために最初にプライマリを開始する必要があります。これが行われるまで、バックアップは開始されません。
The 20.02 slurmdbd will work with Slurm daemons of version 18.08 and above.
20.02 slurmdbdは、バージョン18.08以降のSlurmデーモンで動作します。
You will not need to update all clusters at the same time, but it is very important to update slurmdbd first and having it running before updating any other clusters making use of it.
すべてのクラスターを同時に更新する必要はありませんが、slurmdbdを最初に更新し、それを使用する他のクラスターを更新する前に実行しておくことが非常に重要です。
Slurm can be upgraded from version 18.08 or 19.05 to version 20.02 without loss of jobs or other state information.
Slurmは、ジョブやその他の状態情報を失うことなく、バージョン18.08または19.05からバージョン20.02にアップグレードできます。
Upgrading directly from an earlier version of Slurm will result in loss of state information.
以前のバージョンのSlurmから直接アップグレードすると、状態情報が失われます。
If using SPANK plugins that use the Slurm APIs, they should be recompiled when upgrading Slurm to a new major release.
Slurm APIを使用するSPANKプラグインを使用している場合は、Slurmを新しいメジャーリリースにアップグレードするときに再コンパイルする必要があります。
NOTE: Slurmctld is now set to fatal in case of computing node configured with CPUs == #Sockets.
注:CPU == #Socketsで構成されたコンピューティングノードの場合、Slurmctldはfatalに設定されるようになりました。
CPUs has to be either total number of cores or threads.
CPUは、コアまたはスレッドの総数である必要があります。
NOTE: The FastSchedule option has been removed.
注:FastScheduleオプションは削除されました。
The FastSchedule=2 functionality (used for testing and development) is available as the new SlurmdParameters=config_overrides option.
FastSchedule = 2機能(テストと開発に使用)は、新しいSlurmdParameters = config_overridesオプションとして使用できます。
HIGHLIGHTS
ハイライト
========== -- Drop slurm.spec-legacy from distribution.
slurm.spec-legacyをディストリビューションから削除します。
-- Removed the smap command.
smapコマンドを削除しました。
-- Exclusive behavior of a node includes all GRES on a node as well as the cpus.
ノードの排他的な動作には、ノード上のすべてのGRESとCPUが含まれます。
-- Use python3 instead of python for internal build/test scripts.
内部ビルド/テストスクリプトには、pythonの代わりにpython3を使用します。
The slurm.spec file has been updated to depend on python3 as well.
slurm.specファイルが更新され、python3にも依存するようになりました。
-- Added new NodeSet configuration option to help simplify partition configuration sections for heterogeneous / condo-style clusters.
異種/コンドミニアムスタイルのクラスターのパーティション構成セクションを簡素化するのに役立つ新しいNodeSet構成オプションが追加されました。
-- Added slurm.conf option MaxDBDMsgs to control how many messages will be stored in the slurmctld before throwing them away when the slurmdbd is down.
slurmdbdがダウンしたときにメッセージを破棄する前にslurmctldに保存されるメッセージの数を制御するslurm.confオプションMaxDBDMsgsが追加されました。
-- The checkpoint plugin interface and all associated API calls have been removed.
チェックポイントプラグインインターフェイスと関連するすべてのAPI呼び出しが削除されました。
-- slurm_init_job_desc_msg() initializes mail_type as uint16_t.
slurm_init_job_desc_msg()は、mail_typeをuint16_tとして初期化します。
This allows mail_type to be set to NONE with scontrol.
これにより、scontrolを使用してmail_typeをNONEに設定できます。
-- Add new slurm_spank_log() function to print messages back to the user from within a SPANK plugin without prepending "error: " from slurm_error().
新しいslurm_spank_log()関数を追加して、slurm_error()の「error:」を先頭に追加せずに、SPANKプラグイン内からユーザーにメッセージを出力します。
-- Enforce having partition name and nodelist=ALL when creating reservations with flags=PART_NODES.
flags = PART_NODESを使用して予約を作成する場合は、パーティション名とnodelist = ALLを強制します。
-- SPANK - removed never-implemented slurm_spank_slurmd_init() interface.
SPANK-実装されていないslurm_spank_slurmd_init()インターフェースを削除しました。
This hook has always been accessible through slurm_spank_init() in the S_CTX_SLURMD context instead.
このフックは、代わりにS_CTX_SLURMDコンテキストのslurm_spank_init()を介して常にアクセス可能です。
-- sbcast - add new BcastAddr option to NodeName lines to allow sbcast traffic to flow over an alternate network path.
sbcast-NodeName行に新しいBcastAddrオプションを追加して、sbcastトラフィックが代替ネットワークパスを介して流れるようにします。
-- Added auth/jwt plugin, and 'scontrol token' subcommand.
auth / jwtプラグインと「scontroltoken」サブコマンドが追加されました。
-- PMIx - improve performance of proc map generation.
PMIx-procマップ生成のパフォーマンスを向上させます。
-- Move kill_invalid_depend and max_depend_depth options to the new DependencyParameters option, and deprecate use in SchedulerParameters.
kill_invalid_dependオプションとmax_depend_depthオプションを新しいDependencyParametersオプションに移動し、SchedulerParametersでの使用を廃止します。
-- Enable job dependencies for any job on any cluster in the same federation.
同じフェデレーション内の任意のクラスター上の任意のジョブのジョブ依存関係を有効にします。
-- Allow clusters to be added automatically to db at startup of ctld.
ctldの起動時にクラスターがdbに自動的に追加されることを許可します。
-- Add AccountingStorageExternalHost slurm.conf parameter.
AccountingStorageExternalHostslurm.confパラメーターを追加します。
-- The "ConditionPathExists" condition in slurmd.service has been disabled by default to permit simpler installation of a "configless" Slurm cluster.
slurmd.serviceの「ConditionPathExists」条件はデフォルトで無効になっており、「configless」Slurmクラスターをより簡単にインストールできます。
-- In SchedulerParameters remove deprecated max_job_bf and replace with bf_max_job_test.
SchedulerParametersで、非推奨のmax_job_bfを削除し、bf_max_job_testに置き換えます。
-- Disable sbatch, salloc, srun --reboot for non-admins.
管理者以外の場合は、sbatch、salloc、srun--rebootを無効にします。
-- SPANK - added support for S_JOB_GID in the job script context with spank_get_item().
SPANK-spank_get_item()を使用したジョブスクリプトコンテキストでのS_JOB_GIDのサポートが追加されました。
-- Prolog/Epilog - add SLURM_JOB_GID environment variable.
Prolog / Epilog-SLURM_JOB_GID環境変数を追加します。
-- Add new slurmrestd command/daemon which implements the Slurm REST API.
Slurm RESTAPIを実装する新しいslurmrestdコマンド/デーモンを追加します。
-- The inconsistent terminology and environment variable naming for Heterogeneous Job ("HetJob") support has been tidied up.
異種ジョブ(「HetJob」)サポートの一貫性のない用語と環境変数の命名が整理されました。
-- The correct term for these jobs are "HetJobs", references to "PackJob" have been corrected.
これらのジョブの正しい用語は「HetJobs」であり、「PackJob」への参照が修正されました。
-- The correct term for the separate constituent jobs are "components", references to "packs" have been corrected.
個別の構成ジョブの正しい用語は「コンポーネント」であり、「パック」への参照が修正されました。
-- Output from 'scontrol show job' and others has been made consistent with this .
'scontrol showjob'などからの出力はこれと一致するようになっています。
-- Relevant environment variables are all of the form SLURM_HET_JOB_*.
関連する環境変数はすべてSLURM_HET_JOB_ *の形式です。
(Old forms are still supported for this release, but may be removed in the future.)
(このリリースでは古いフォームが引き続きサポートされていますが、将来削除される可能性があります。)
-- slurm.spec - override "hardening" linker flags to ensure RHEL8 builds in a usable manner.
slurm.spec-「強化」リンカーフラグをオーバーライドして、RHEL8が使用可能な方法でビルドされるようにします。
-- Now when requesting exclusive access on a node the job will be given all the GRES on a node whether or not they asked for it.
これで、ノードへの排他的アクセスを要求すると、要求したかどうかに関係なく、ジョブにはノード上のすべてのGRESが与えられます。
NOTE: Because of this change exclusive jobs submitted on previous versions of Slurm may produce cosmetic errors such as 'error: _job_alloc_whole_node_internal: This should never happen, we couldn't find the gres 7696487:3160171' and when the job finishes 'error: gres/gpu: job 17262 dealloc node snowflake0 GRES count underflow (0 < 1)'
注:この変更により、以前のバージョンのSlurmで送信された排他的ジョブは、次のような外観上のエラーを生成する可能性があります 'エラー:_job_alloc_whole_node_internal:これは決して発生しないはずです。 / gpu:ジョブ17262deallocノードsnowflake0 GRESカウントアンダーフロー(0 <1) '
These should only exist while these older jobs are loading/finishing.
これらは、これらの古いジョブがロード/終了している間のみ存在する必要があります。
The error does not present an actual problem or impact future jobs and should be ignored on pre-20.02 jobs.
このエラーは実際の問題を示したり、将来のジョブに影響を与えたりするものではないため、20.02より前のジョブでは無視する必要があります。
-- Both jobcomp and cli_filter now have lua interfaces.
jobcompとcli_filterの両方にluaインターフェイスが追加されました。
SPECIAL NOTES FOR CRAY SYSTEMS
クレイシステムに関する特記事項
============================== -- burst_buffer/datawarp - the OtherTimeout configuration option will now apply to the stage-in "setup" and stage-out "dws_post_run" calls in to dw_wlm_cli.
burst_buffer / datawarp-OtherTimeout構成オプションが、dw_wlm_cliへのステージイン「setup」およびステージアウト「dws_post_run」呼び出しに適用されるようになりました。
(The StageInTimeout and StageOutTimeout were previously used here by mistake.)
(StageInTimeoutとStageOutTimeoutは、以前はここで誤って使用されていました。)
-- burst_buffer/datawarp - add a set of % symbols that will be replaced by job details. E.g., %d will be filled in with the WorkDir for the job.
burst_buffer / datawarp-ジョブの詳細に置き換えられる%記号のセットを追加します。たとえば、%dにはジョブのWorkDirが入力されます。
CONFIGURATION FILE CHANGES (see man appropriate man page for details)
設定ファイルの変更(詳細については、manの適切なmanページを参照してください)
===================================================================== -- The mpi/openmpi plugin has been removed as it does nothing.
mpi / openmpiプラグインは何もしないため、削除されました。
MpiDefault=openmpi will be translated to the functionally-equivalent MpiDefault=none.
MpiDefault = openmpiは、機能的に同等のMpiDefault = noneに変換されます。
COMMAND CHANGES (see man pages for details)
コマンドの変更(詳細はmanページを参照)
=========================================== -- Display StepId=.batch instead of StepId= .4294967294 in output of "scontrol show step".
「scontrolshowstep」の出力に、StepId = .4294967294ではなくStepId = .batchを表示します。
(slurm_sprint_job_step_info())
(slurm_sprint_job_step_info())
-- MPMD in srun will now defer PATH resolution for the commands to launch to slurmstepd.
srunのMPMDは、起動するコマンドのPATH解決をslurmstepdに延期するようになりました。
Previously it would handle resolution client-side, but with a non-standard approach that walked PATH in reverse.
以前は、クライアント側で解決を処理していましたが、PATHを逆に実行する非標準のアプローチを使用していました。
-- squeue - added "--me" option, equivalent to --user=$USER.
squeue --- user = $ USERと同等の「--me」オプションを追加しました。
-- The LicensesUsed line has been removed from 'scontrol show config'.
LicensesUsed行は「scontrolshowconfig」から削除されました。
Please see the 'scontrol show licenses' command as an alternative.
別の方法として、「scontrolshowlicenses」コマンドを参照してください。
-- sbatch - adjusted backoff times for "--wait" option to reduce load on slurmctld.
sbatch-slurmctldの負荷を軽減するために、「-wait」オプションのバックオフ時間を調整しました。
This results in a steady-state delay of 32s between queries, instead of the prior 10s delay.
これにより、以前の10秒の遅延ではなく、クエリ間の定常状態の遅延が32秒になります。
-- Change 'scancel -t' to filter based only on job base state.
'scancel -t'を変更して、ジョブの基本状態のみに基づいてフィルタリングします。