Strumenti Utente

Strumenti Sito


grid:install

Installazione di SLC

SLC3

  • Per tutti i Grid-element Installazione di SLC3 via kickstart grid.ks
  • apt-get update
se fallisce 
E: Dynamic MMap ran out of room
Occorre aumentare il cache-limit del client in /etc/apt/apt.conf:
APT::Cache-Limit "141943904";

Installazione e configurazione del Middleware

Post CE

  • /etc/exports

/home 160.78.251.0/24(rw,async,no_root_squash)

/opt/exp_soft  160.78.251.0/24(rw,async,no_root_squash)
  • Installazione del middleware:
/opt/glite/yaim/scripts/ig_install_node /root/my-site-info.def  ig_CE_torque BDII_site
  • Installazione dei certificati:
scp cafis@192.135.11.20:HOSTS/grid-ce/host*.pem /etc/grid-security/
  • Configurazione:
/opt/glite/yaim/bin/ig_yaim -c -s /root/my-site-info.def -n ig_CE_torque -n BDII_site
qmgr -c 'set node grid-wn00.pr.infn.it np=4'
cp /root/maui/maui.cfg.actual /var/spool/maui/maui.cfg
service maui restart
#?? service  glite-dgas-pushd start 
#Eventuale riconfigurazione di un servizio:
#/opt/glite/yaim/bin/ig_yaim -r -s /root/my-site-info.def -f config_torque_server ## Attenzione a maui.cfg !
#/opt/glite/yaim/bin/ig_yaim -r -s /root/my-site-info.def -f config_gsissh
* Fermare gli aggiornamenti automatici:
  chkconfig apt-autoupdate off

Post SE

  • Installazione del middleware:
/opt/glite/yaim/scripts/ig_install_node /root/my-site-info.def ig_SE_classic ig_MON
  • Installazione dei certificati:
scp cafis@192.135.11.20:HOSTS/grid-se/host*.pem /etc/grid-security/
Attenzione ai certificati del servizio RGMA che si trovano in:
/opt/glite/var/rgma/.certs
#/usr/bin/mysqladmin -u root password 'm*sql**'
#/usr/bin/mysqladmin -u root -h grid-se.pr.infn.it password 'm*sql**'

* Configurazione:

#/opt/glite/yaim/bin/ig_yaim -c -s /root/my-site-info.def -n ig_SE_classic -n ig_MON
ldapsearch -LLL -x -H ldap://grid-se.pr.infn.it:2135 -b "mds-vo-name=local,o=grid"

* Fermare gli aggiornamenti automatici:

 chkconfig apt-autoupdate off

Post UI

wget http://grid-serv.pr.infn.it/install/post/my-site-info.def
/opt/glite/yaim/scripts/ig_install_node   /root/my-site-info.def  ig_UI
/opt/glite/yaim/scripts/ig_configure_node /root/my-site-info.def  ig_UI
#/opt/glite/yaim/bin/ig_yaim -c -s /root/my-site-info.def -n ig_UI (nuova sintassi)

yum install torque-client

#Note:
# Se la home e' condivisa e vogliamo history separate:
# echo "export HISTFILE=.history_$HOSTNAME" > /etc/profile.d/local.sh

y

Post WN

 wget http://grid-serv.pr.infn.it/install/post/my-site-info.def 
 /opt/glite/yaim/scripts/ig_install_node   /root/my-site-info.def ig_WN_torque_noafs
 /opt/glite/yaim/scripts/ig_configure_node /root/my-site-info.def ig_WN_torque_noafs

 mkdir -p /home/local
 echo "grid-ce.pr.infn.it:/home/local      /home/local nfs rw,defaults 0 0" >> /etc/fstab
 mount -a
 # Auth Ldap
 authconfig --enableldap --enableldapauth  --ldapbasedn "ou=grid,l=parma,o=infn,c=it" --ldapserver 160.78.251.2  --kickstart

 #Note:
 #umount /opt/exp_soft ; mount -a
 #/opt/edg/sbin/edg-pbs-knownhosts
 #vecchio problema degli account disabilitati:
 #sed 's/!!/*/' /etc/shadow > /etc/shadow.tmp && mv -f /etc/shadow.tmp /etc/shadow

C3

Cluster Command & Control #23.10.06

 rpm -ivh http://www.csm.ornl.gov/torc/C3/Software/4.0.1/c3-4.0.1-1.noarch.rpm

 ln -s /opt/c3-4/c3.sh /etc/profile.d/
 cat > /etc/c3.conf << EOF
 cluster grid {
                grid-ce
                grid-wn01
                grid-wn02
                grid-wn03
                grid-wn04
                grid-wn05
                grid-se  
                grid-ui
 }
  
 cluster wn {
                grid-ce
                grid-wn01
                grid-wn02
                grid-wn03
                grid-wn04
                grid-wn05
 }
 EOF

 
 ssh-keygen -t dsa
 scp id_dsa.pub grid-wn01:.ssh/authorized_keys
 scp id_dsa.pub grid-wn02:.ssh/authorized_keys
 scp id_dsa.pub grid-wn04:.ssh/authorized_keys
 scp id_dsa.pub grid-wn05:.ssh/authorized_keys
 scp id_dsa.pub grid-ui:.ssh/authorized_keys
 scp id_dsa.pub grid-se:.ssh/authorized_keys


 #test
 cexec ls
 cexec wn: hostname

Manutenzione

DGAS

DGASGuide

Altre guide DGAS

http://grid-it.cnaf.infn.it/hlrmon/

InfnBo

grep -A 1 "EXITSTATUS=" /opt/glite/var/log/dgas_ce_pushd.log

ps aux | grep dgas
root      3524  0.2  0.1  8816 4140 pts/4    S    10:47   0:02 /usr/bin/perl -w /opt/glite/sbin/glite-urcollector.pl
/opt/glite/etc/dgas_gianduia.conf
root      3526  0.0  0.0  7364 2536 pts/4    S    10:47   0:00 /usr/bin/perl -w /opt/glite/sbin/glite-dgas-ceServerd-had.pl /etc/rc.d/init.d/glite-dgas-urcollector
root      3553  0.1  0.0  8420 3812 pts/4    S    10:47   0:02 /usr/bin/perl -w /opt/glite//sbin/glite-dgas-pushd.pl /opt/glite//etc/dgas_ce_pushd.conf

service   glite-dgas-pushd restart

If a record is not processed, it is moved to /opt/glite/var/dgasURBox/ERR/ that can fill with thousend of files

Tracciare un Job

 grid-ce> egrep "Queued|Exit|deque|mom" /var/spool/pbs/server_logs/20070810
 grid-wn> ssh grid-wn06 'egrep "terminated|started" /var/spool/pbs/mom_logs/20070810'

Cancellare a mano un Job

 sui WN: service pbs_mom stop
 sul CE: service pbs_server stop
         rm /var/spool/pbs/server_priv/jobs/4277* 
         service pbs_server start
 sui WN: service pbs_mom start

BDII_site

Dupplicazione dei dati (problema del 8/5/2007).

  • cancella tutti i files presenti in /opt/lcg/var/gip/ldif/
  • cancella /opt/lcg/var/gip/provider/grid-ce.pr.infn.it-cache.sh
  • /opt/glite/yaim/scripts/ig_configure_node /root/my-site-info.def ig_CE_torque BDII_site

Determinare SpecINT e SpecFP medi

SI00MeanPerCPU e SF00MeanPerCPU sono 2 parametri pubblicati dal BDII (CE) che valutano i KSI2000 e KSFP2000 medi del cluster.

How to configure and publish Spec Data

Esegiuto sul CE:

 wget http://www.egee.cesga.es/EGEE-SA1-SWE/accounting/cpu_normalization_standalone_test/cpu_normalization_standalone_test.tar.gz
 cpush  cpu_normalization_standalone_test.tar.gz
 cexec  tar -xzvf cpu_normalization_standalone_test.tar.gz
 cexec "cd cpu_normalization_standalone_test; ./get_spec_int.pl --si-only"
  • 16 Dual PIII 1.133GHz IBM Xseries330 SpecInt 461 - SpecFloat 320
  • 4 Dual Xeon 2.4GHz Supermicro SpecInt 1039 - SpecFloat 951
  • LOwest CE_SI00=461 - CE_SF00=320
  • Mean SI00MeanPerCPU=577 - SF00MeanPerCPU=446

Note Registrazione GOC

  • 24.01.2007 Paolini
vorremmo completare la registrazione di tutti i siti italiani nel GOC-DB 
( vedi http://goc.grid-support.ac.uk/gridsite/gocmain/ )
  • 24.01.2007 Risposta
GIIS:  grid-ce.pr.infn.it
HP: www.pr.infn.it
Domain: pr.infn.it
Site-email: grid-prod at pr.infn.it
Site telephone number: +39.0521.906214
Site telephone number: +39.0521.906215
Hours: 9-13 14-18/Mon-Fri

Site Manager:
Name: Roberto Alfieri
Email: roberto.alfieri@pr.infn.it
telephone number: +39.0521.906214
Hours: 9-13 14-18 /Mon-Fri
Subject: C=IT, O=INFN, OU=Personal Certificate, L=Parma, CN=Roberto Alfieri/Email=roberto.alfieri@pr.infn.it 
  • 25.01.2007 Paolini
I dati inseriti sono qui:
https://goc.grid-support.ac.uk/gridsite/gocdb2/index.php?siteSelect=378 
 
Dovresti inserire i nodi da monitorare, nel tuo caso solo CE ed SE.
Inoltre lo stato del sito per il momento è candidate: 
quando avrai inserito i servizi da monitorare, attiveremo il monitoring e lo 
stato del sito cambierà in uncertified. 
Lo terremo sotto controllo per un po', e se tutto filerà liscio lo stato diventerà 
certified, e cominceranno a girarci i  SAM test
  • 7.02.2007
adesso lo stato del sito è "uncertified", tra poco comparirà nella sezione test del GSTAT 
http://goc.grid.sinica.edu.tw/gstat/test/
(ed anche http://gstat2.gridops.org/gstat/test/) e rimarrà sotto osservazione per un po' di giorni
  • 12.02.2007 Paolini
 
da oggi lo stato del sito INFN-PARMA diventa "certified"

SAM test: [[https://lcg-sam.cern.ch:8443/sam/sam.py?sensors=CE&regions=Italy&vo=ops&order=SiteName&funct=ShowSensorTests]]
[[https://lcg-sam.cern.ch:8443/sam/sam.py]] selezionando CE e poi la VO ops 

In caso di errori, verranno aperti ticket dal CIC on duty sul GGUS

GSTAT [[http://goc.grid.sinica.edu.tw/gstat/]] e [[http://gstat2.gridops.org/gstat/]]

Esecuzione manuale di SAM: [[https://cic2.gridops.org/samadmin/]]

Ogni venerdì dovrai compilare un report sui problemi intercorsi durante la settimana 
e sulle azioni intraprese. 
Potrai anche sollevare questioni da discutere nel "Grid Operation Meeting" del lunedì 
successivo.

Links

/var/www/html/dokuwiki/data/pages/grid/install.txt · Ultima modifica: Y/m/d H:i da