Les files d'attente correspondent aux diverses sources de financement des équipements.
===== Coprocesseurs =====
^ SolarOrbiter | 1 R720+2K20 |
^ K20 | 2 R270+2K20 et 1 R730+K20|
^ PHI | 2 R720+2PHI |
^ ERM_COPRO | 1 R720+2K20 et 1 R730+K20 et 2 R720+2PHI |
^ **COPRO** | **2 R720+2K20 et 1 R730+K20 et 2 R720+2PHI **|
===== Processeurs seuls =====
^ MISTIC | 2 R720 + 2 R820 |
^ MIC | 1 R820 |
^ HERSCHEL | 1 R820 |
^ FLARECAST | 1 R730 |
^ **CPU_ONLY** | **4 R820, 2 R720, 1 R730** |
===== Ensemble des machines =====
^ **ALL** | **Tous les noeuds** |
===== Priorités =====
Plus la valeur est élevée, plus la file d'attente est prioritaire.
**Un job dans une file d'attente prioritaire suspendra l'exécution d'un job alloué dans une file de priorité inférieure.**
^ File d'attente ^ Priorité |
^ ALL | 1 |
^ CPU_ONLY | 1 |
^ COPRO | 50 |
^ K20 | 50 |
^ PHI | 50 |
^ ERM_COPRO | 100 |
^ FLARECAST | 100 |
^ HERSCHEL | 100 |
^ MIC | 100 |
^ MISTIC | 100 |
^ SOLARORBITER | 100 |
==== Exemple ====
Si on considère une liste de jobs alloués dans la file de plus basse priorité, ALL :
root@cluster-head:~# squeue -l
Mon Feb 22 15:06:28 2016
JOBID PARTITION NAME USER STATE TIME TIMELIMIT NODES NODELIST(REASON)
2115 K20 bash scaminad RUNNING 54:49 UNLIMITED 1 cluster-r720-k20-1
2131 all MPI IDL abeelen RUNNING 0:59 UNLIMITED 1 cluster-r820-2
2130 all MPI IDL abeelen RUNNING 1:27 UNLIMITED 1 cluster-r820-1
2128 all MPI IDL abeelen RUNNING 5:30 UNLIMITED 1 cluster-r730-k20-1
2125 all MPI IDL abeelen RUNNING 23:07 UNLIMITED 1 cluster-r720-phi-2
2124 all MPI IDL abeelen RUNNING 24:14 UNLIMITED 1 cluster-r720-phi-1
2123 all MPI IDL abeelen RUNNING 23:05 UNLIMITED 1 cluster-r720-k20-2
2122 all MPI IDL abeelen RUNNING 26:42 UNLIMITED 1 cluster-r720-2
2121 all MPI IDL abeelen RUNNING 27:28 UNLIMITED 1 cluster-r720-1
Et qu'on fait une allocation dans une file de priorité supérieure à celle de ALL :
root@cluster-head:~# salloc -N 2 -p K20 --exclusive
salloc: Granted job allocation 2132
root@cluster-head:~# squeue -l
Mon Feb 22 15:06:40 2016
JOBID PARTITION NAME USER STATE TIME TIMELIMIT NODES NODELIST(REASON)
2132 K20 bash root RUNNING 0:04 UNLIMITED 2 cluster-r720-k20-2,cluster-r730-k20-1
2115 K20 bash scaminad RUNNING 55:01 UNLIMITED 1 cluster-r720-k20-1
2131 all MPI IDL abeelen RUNNING 1:11 UNLIMITED 1 cluster-r820-2
2130 all MPI IDL abeelen RUNNING 1:39 UNLIMITED 1 cluster-r820-1
2125 all MPI IDL abeelen RUNNING 23:19 UNLIMITED 1 cluster-r720-phi-2
2124 all MPI IDL abeelen RUNNING 24:26 UNLIMITED 1 cluster-r720-phi-1
2122 all MPI IDL abeelen RUNNING 26:54 UNLIMITED 1 cluster-r720-2
2121 all MPI IDL abeelen RUNNING 27:40 UNLIMITED 1 cluster-r720-1
2128 all MPI IDL abeelen SUSPENDE 5:38 UNLIMITED 1 cluster-r730-k20-1
2123 all MPI IDL abeelen SUSPENDE 23:13 UNLIMITED 1 cluster-r720-k20-2
Les 2 jobs qui tournaient sur des machines de la file K20 se retrouvent suspendus.