Strumenti Utente

Strumenti Sito


grid:utente-quarto

Cluster "QUARTO"

Contatto utile per segnalare problemi sul cluster: lca [at] fis [dot] unipr [dot] it

Caratteristiche tecniche

Il cluster e' composto da 24 macchine dual xeon 3,2GHz, 4GB Ram e
scheda di comunicazione veloce InfiniBand: 

- nodo master:     theogw-01.cr.cnaf.infn.it 
- nodi di calcolo: nodoXX.cr.cnaf.infn.it (XX da 01 a 24).

La home directory e' /home/QUARTO da 1 TByte condivisa tra 
frontend (theogw-01) e tutti i nodi.

Software installato
- Sistema operativo: SLC4.5 - kernel 2.6.9
- compilatori: gcc e g77   v.3.4.6
- mpi: openmpi 1.1.1  con librerie Infiniband (libibverbs) e driver Infiniband-Mellanox (libmthca)
- Librerie GSL (Gnu Scientific Library) v1.5.2
- octave 2.1.57
- sistema di code LSF   
- (fortran 90 ??) 

Mapping dei nodi:

nodo23 --> wn-104-13-29-a
nodo22 --> wn-104-13-28-a
nodo15 --> wn-104-13-27-a
nodo14 --> wn-104-13-26-a
nodo13 --> wn-104-13-25-a
nodo12 --> wn-104-13-24-a
nodo11 --> wn-104-13-23-a
nodo21 --> wn-104-13-22-a
nodo20 --> wn-104-13-21-a
posizione 20 <--> console
nodo19 --> wn-104-13-19-a
nodo10 --> wn-104-13-18-a
nodo09 --> wn-104-13-17-a
nodo08 --> wn-104-13-16-a
nodo07 --> wn-104-13-15-a
nodo06 --> wn-104-13-14-a
nodo18 --> wn-104-13-13-a
nodo05 --> wn-104-13-12-a
nodo04 --> wn-104-13-11-a
nodo03 --> wn-104-13-10-a
nodo02 --> wn-104-13-09-a
nodo01 --> wn-104-13-08-a
nodo24 --> wn-104-13-07-a
nodo17 --> wn-104-13-06-a
nodo16 --> wn-104-13-05-a

Accesso al Cluster

L'accesso al Cluster puo' avvenire in modo locale o via grid.

1) ACCESSO LOCALE
Per accedere al cluster  in modo locale e' necessario passare da una 
dalle macchine di frontiera del CNAF con ssh:

ssh bastion.cnaf.infn.it

e da tale macchina procedere al collegamento con il nodo master

ssh theogw-01

Il cluster dispone di un sistema di code (LSF) che dovra'
necessariamente essere utilizzato per la sottomissione di programmi.

2) ACCESSO VIA GRID

   ToDo

Esempi di utilizzo Locale

# Compilazione programmi C con MPI
# ________________________________

mpicc -o matrix matrix.c


# Compilazione programmi C++ con MPI
# __________________________________

mpicxx -o matrix matrix.cpp


# Compilazione programmi FORTRAN con MPI
# ______________________________________

mpif77 -o matrix.out matrix.f


# Sottomissione di un programma MPI sul sistema di code LSF
# _________________________________________________________

bsub -n <NP> -o <STDOUT> lsf-mpirun <JOB> [ARGS]

dove 
- NP: il numero di processi da lanciare
- STDOUT: il file sul quale andra' l'output del programma
- JOB: programma eseguibile da lanciare con argomenti opzionali ARGS  
- lsf-mpirun e' un semplice wrapper (cat /usr/local/bin/lsf-mpirun) 
  che puo' essere copiato  e adattato ella proprie esigenze.

Es.
bsub -n 32 -o stdout lsf-mpirun ./matrix


# Controllo dello stato delle code LSF
# ____________________________________

visualizza lo stato dei propri job in coda 
   bjobs 
   man bjobs

Visualizza le caratteristiche della coda
  qstat -x quarto

Visualizza il dettaglio dei Jobs:
   qstat -a  quarto
   qstat -la quarto

# Interruzione di un JOB LSF
# __________________________

bkill <JOBID>

Alcuni riferimenti utili:

/var/www/html/dokuwiki/data/pages/grid/utente-quarto.txt · Ultima modifica: Y/m/d H:i da