Status usługi gLite
Usługa gLite została wycofana z Infrastruktury PLGrid.
Certyfikat użytkownika, którego klucz prywatny jest zabezpieczony hasłem, służy do wygenerowania i podpisania tymczasowego certyfikatu, zwanego proxy (z ang. pośrednik). Przeznaczeniem proxy jest umożliwienie identyfikacji użytkownika w gridzie. Ponieważ po generacji użwanie proxy nie wymaga hasła, ważnym jest aby plik go zawierający był jedynie do odczytu dla użytkownika (jest to ustawienie domyślnie). Aby zwiększyć bezpieczeństwo, proxy ma krótki okres życia, np. 12h, znacznie krótszy niż przeciętny certyfikat.
Tworzenie proxy
$ voms-proxy-init --voms <VO>
<VO> - wirtualna organizacja np. vo.plgrid.pl
Powyższą komendą oprócz utworzenia proxy, można także przedłużyć już istniejący.
Tworzenie proxy na określony czas
$ voms-proxy-init -valid <H:M>
$ voms-proxy-init --voms <VO> -valid <H:M>
<H:M> - czas godziny:minuty
Należy pamiętać, że im dłuższy okres życia proxy tym większe niebezpieczeństwo przechwycenia przez niepowołaną osobę.
Uzyskanie informacji o istniejącym proxy
$ voms-proxy-info
Dzięki tej komendzie, możemy dowiedzieć się jak długo jeszcze będzie żyć nasze proxy.
Niszczenie proxy po wykonaniu obliczeń
$ voms-proxy-destroy
Po zakończeniu pracy należy zniszczyć proxy, tak aby zmniejszć ryzyko przechwycenia przez niepowołaną osobę.
Wartym uwagi jest fakt, iż jeśli okres życia proxy skończy się, kiedy w gridzie mamy puszczone zadanie, nie zostanie ono wykonane.
Aby tego uniknąć należy:
W celu policzenia zadania na gridzie, możemy sprawdzić czy istnieją takie CE w naszej VO, które nam to umożliwią
$ glite-wms-job-list-match -a job.jdl Connecting to the service https://rb1.cyf-kr.edu.pl:7443/glite_wms_wmproxy_server ========================================================================== COMPUTING ELEMENT IDs LIST The following CE(s) matching your job requirements have been found: *CEId* - ce.cyf-kr.edu.pl:2119/jobmanager-pbs-gaussian - ce.reef.man.poznan.pl:2119/jobmanager-pbs-gaussian - ce.ulakbim.gov.tr:2119/jobmanager-lcgpbs-gaussian - grid01.erciyes.edu.tr:2119/jobmanager-lcgpbs-gaussian ==========================================================================
Możemy też wyświetlić wszystkie dostępne CE na VO (gaussian), wraz z informacją o powiązanych procesorach
$ lcg-infosites --vo gaussian ce #CPU Free Total Jobs Running Waiting ComputingElement ---------------------------------------------------------- 22 20 0 0 0 ce.ulakbim.gov.tr:2119/jobmanager-lcgpbs-gaussian 1792 908 0 0 0 ce.reef.man.poznan.pl:2119/jobmanager-pbs-gaussian 2312 487 0 0 0 ce.cyf-kr.edu.pl:2119/jobmanager-pbs-gaussian 56 54 1 0 1 grid01.erciyes.edu.tr:2119/jobmanager-lcgpbs-gaussian 1792 914 0 0 0 creamce.reef.man.poznan.pl:8443/cream-pbs-gaussian
Podobnie możemy też uzyskać informacje o zasobach dyskowych (SE) dostępnych na VO
$ lcg-infosites --vo gaussian se Avail Space(Kb) Used Space(Kb) Type SEs ---------------------------------------------------------- 24394342856 4861111830 n.a dpm.cyf-kr.edu.pl n.a n.a n.a grid02.erciyes.edu.tr 6320000000 2 n.a se.reef.man.poznan.pl 2680000000 n.a n.a se.ulakbim.gov.tr
Wysyłamy zadanie
$ glite-wms-job-submit -a job.jdl Connecting to the service https://rb1.cyf-kr.edu.pl:7443/glite_wms_wmproxy_server ====================== glite-wms-job-submit Success ====================== The job has been successfully submitted to the WMProxy Your job identifier is: https://lb.grid.cyf-kr.edu.pl:9000/AgP9eWoJf0l4YMiESWrRow ==========================================================================
Sprawdzamy status wysłanego zadania, wykorzystując przydzielony identyfikator
$ glite-wms-job-status https://lb.grid.cyf-kr.edu.pl:9000/qn69-B5xUIl40yY5oP9f9Q ************************************************************* BOOKKEEPING INFORMATION: Status info for the Job : https://lb.grid.cyf-kr.edu.pl:9000/qn69-B5xUIl40yY5oP9f9Q Current Status: Waiting Submitted: Thu Jul 23 10:32:46 2009 CEST *************************************************************
Powtarzając powyższą komendę, będziemy mogli zaobserwować zmieniający się status naszego zadania
Current Status: Ready Current Status: Scheduled Current Status: Running
Ostatecznie powinniśmy otrzymać informację o prawidłowym zakończeniu obliczeń
$ glite-wms-job-status https://lb.grid.cyf-kr.edu.pl:9000/qn69-B5xUIl40yY5oP9f9Q ************************************************************* BOOKKEEPING INFORMATION: Status info for the Job : https://lb.grid.cyf-kr.edu.pl:9000/qn69-B5xUIl40yY5oP9f9Q Current Status: Done (Success) Exit code: 0 Status Reason: Job terminated successfully Destination: ce.cyf-kr.edu.pl:2119/jobmanager-pbs-gaussian Submitted: Thu Jul 23 10:32:46 2009 CEST *************************************************************
Bardziej szczegółowe informacje o statusie zadania możemy uzyskać wykonując polecenie
glite-wms-job-status -v <verbosity_value> <jobId>
verbosity_value może przyjmować wartości [0|1|2|3]
Kiedy już zadanie się zakończy, możemy pobrać otrzymane wyniki do katalogu output
$ glite-wms-job-output --dir output https://lb.grid.cyf-kr.edu.pl:9000/qn69-B5xUIl40yY5oP9f9Q Connecting to the service https://149.156.9.29:7443/glite_wms_wmproxy_server ================================================================================ JOB GET OUTPUT OUTCOME Output sandbox files for the job: https://lb.grid.cyf-kr.edu.pl:9000/qn69-B5xUIl40yY5oP9f9Q have been successfully retrieved and stored in the directory: /home/people/.../.../job1/output ================================================================================ $ cd output/ $ ls job.err job.out
Dzięki możliwości zapisania jobId do pliku, nie musimy go "pamiętać" podczas wykonywania poleceń z jego użyciem
$ glite-wms-job-submit -a -o jobId job.jdl
$ glite-wms-job-status -i jobId
Ponieważ InputSandbox oraz OutputSandbox specyfikowane w deskrypcji zadania gridowego (pliku JDL) nie mogą być zbyt duże (łączna wielkość plików przesyłanych w ten sposób powinna być mniejsza niż 10-15 MB) dla większych plików przewidziano możliwość przechowywania ich na gridowych zasobach dyskowych zwanych Storage Elements i dostarczanie ich do zadań innymi metodami. Zostały one opisane poniżej.
Każda Wirtualna Organizacja (VO) posiada przestrzeń dyskową na jednym lub kilku specjalnych zasobach tzw. Storage Elements (SE). W celu łatwiejszego dostępu do plików istnieje dodatkowo tzw. LCG File Catalogue (LFC), który przypomina normalną strukturę katalogów na komputerze kontrolowanym przez system z rodziny Unix/Linux. Każdy plik znajdujący się w LFC posiada swoją własną unikalną nazwę w obrębie LFC zwaną Logical File Name (LFN) oraz unikalny identyfikator pliku - Global Unique Identifier (GUID). Ponieważ LFC jest warstwą przykrywającą warstwę Storege Elements (SE) każdy z plików w LFC może posiadać kilka replik w różnych SE. Każda replika jest opisana przez tzw. Storage URL (SURL), który zawiera informacje o o fizycznej lokalizacji repliki pliku.
lfn:/grid/vo.plgrid.pl/user01/test.txt lfn:/grid/vo.plgrid.pl/user03/podkatalog/test.txt lfn:/grid/vo.plgrid.pl/user10/podkatalog/podkatalog2/duzyplik.tgz surl://dpm.cyf-kr.edu.pl/dpm/cyf-kr.edu.pl/home/vo.plgrid.pl/generated/2012-06-13/file7fe84ed8-1c9e-4be3-88e5-ac943c2c4bde surl://se.reef.man.poznan.pl/dpm/reef.man.poznan.pl/home/vo.plgrid.pl/generated/2012-06-13/fileba95a559-21eb-4ffc-b154-14d2b706c488
Informacje o dostępnych serwisach katalogujących pliki (serwerach LFC) dostępnych w danej VO można sprawdzić komendą:
lcg-infosites --vo <VO> lfc
$ lcg-infosites --vo vo.plgrid.pl lfc lfc.grid.cyf-kr.edu.pl
Korzystanie z LFC wymaga ustawienia zmiennej środowiskowej LFC_HOST na serwer obsługujący serwis katalogujący pliki (serwerach LFC) dostępnych w danej VO. W tym celu należy wykonać polecenie:
export LFC_HOST=`lcg-infosites --vo <VO> lfc`
export LFC_HOST=`lcg-infosites --vo vo.plgrid.pl lfc`
Informacje o dostępnych serwisach dyskowych (SE) dostępnych w danej VO można sprawdzić komendą:
lcg-infosites --vo <VO> se
$ lcg-infosites --vo vo.plgrid.pl se Avail Space(kB) Used Space(kB) Type SE ------------------------------------------ 292295225 137201503 SRM darkmass.wcss.wroc.pl 29928427150 20872410458 SRM dpm.cyf-kr.edu.pl 1071025899 11233691 SRM se.grid.task.gda.pl 265041106 286414563 SRM se.polgrid.pl n.a 25093075 SRM se.polgrid.pl n.a 4778672492 SRM se.polgrid.pl 15586307152 6834952586 SRM se.reef.man.poznan.pl
Informacje o najbliższym SE dla danego CE (Computing Element):
lcg-infosites --vo <VO> se
$ lcg-infosites --vo vo.plgrid.pl closeSE Name of the CE: ce.reef.man.poznan.pl:2119/jobmanager-pbs-plgrid se.reef.man.poznan.pl Name of the CE: ce1.grid.icm.edu.pl:8443/cream-pbs-plgrid Name of the CE: ce1.grid.icm.edu.pl:8443/cream-pbs-plgrid-long Name of the CE: ce9.grid.icm.edu.pl:8443/cream-pbs-plgrid se.polgrid.pl ....
Listę katalogów dostępnych w LFC można sprawdzić komendą:
lfc-ls <nazwa_katalogu_w_LFC>
$ lfc-ls /grid alice atlas belle bgtut gaussian sbelledev vo.nedm.cyfronet.pl vo.neugrid.eu vo.plgrid.pl vo.turbomole.cyfronet.pl
Polecenie lfc-ls
można wykonać również z flagą -l
:
$ lfc-ls -l <nazwa_katalogu_w_LFC>
$ lfc-ls -l /grid drwxrwxr-x 0 root 125 0 Mar 18 2010 alice drwxrwxr-x 1 root 126 0 Mar 18 2010 atlas drwxrwxr-x 0 root 127 0 Mar 18 2010 belle drwxrwxr-x 39 root 102 0 Nov 25 2009 bgtut drwxrwxr-x 6 root 101 0 Mar 07 18:07 gaussian drwxrwxr-x 0 root 105 0 Jun 02 2009 sbelledev drwxrwxr-x 3 root 112 0 Dec 10 2009 vo.nedm.cyfronet.pl drwxrwxr-x 1 root 128 0 May 03 2010 vo.neugrid.eu drwxrwxr-x 248 root 103 0 Jun 13 13:10 vo.plgrid.pl drwxrwxr-x 1 root 113 0 Nov 10 2009 vo.turbomole.cyfronet.pl
Katalogi tworzy się komendą:
lfc-mkdir <scieżka_katalogu_do_utworzenia>
lfc-mkdir /grid/vo.plgrid.pl/$USER
Do wyświetlania praw dostępu do katalogów/plików w LFC służy komenda:
lfc-getacl <ścieżka i nazwa pliku lub katalogu>
$ lfc-getacl /grid/vo.plgrid.pl/$USER/testFile.txt # file: /grid/vo.plgrid.pl/<login>/testFile.txt # owner: /C=PL/O=GRID/O=<nazwa_organizacji>/CN=<nazwa_uzytkownika> # group: vo.plgrid.pl user::rw- group::rw- #effective:rw- other::r--
Kopiowanie pliku na SE i jego jednoczesna rejestracja w katalogu na LFC wykonuje się komendą:
lcg-cr -l lfn:<ścieżka i nazwa pliku w LFC> file://<ścieżka i nazwa pliku na dysku lokalnym>
–l
pozwala na specyfikacje docelowego miejsca pliku w LFC jako lfn:–d
pozwala na wybranie SE, na którym zamierzamy składować plik-v
daje dodatkowe informacje o przesyłanym pliku-n <liczba_strumieni>
pozwala na szybsze przesyłanie dużych plików przez przesyłanie ich przez wiele strumieni danych jednocześnie.Uwaga: Nadpisywanie plików nie jest możliwe. W celu podmiany pliku należy najpierw skasować plik z LFC i następnie wgrać nową wersję pliku.
$ lcg-cr -l lfn:/grid/vo.plgrid.pl/$USER/testFile.txt file://$HOME/tutorial/test.txt guid:0721ab19-3e73-40f4-bbec-f92c6a772423
Każdy z plików przechowywanych w LFC jest tak na prawdę przechowywany w jednej lub wielu kopiach na poszczególnych SE. Kopie te zwane są replikami. W przypadku dużych plików dobrze jest posiadać repliki na SE bliskich CE gdzie będą się wykonywały obliczenia z wykorzystaniem tych plików. Do listowania wszyskich replik danego pliku służy polecenie:
$ lcg-lr lfn:<ścieżka i nazwa pliku>
$ lcg-lr lfn:/grid/vo.plgrid.pl/$USER/testFile.txt srm://dpm.cyf-kr.edu.pl/dpm/cyf-kr.edu.pl/home/vo.plgrid.pl/generated/2012-06-13/file7fe84ed8-1c9e-4be3-88e5-ac943c2c4bde srm://se.reef.man.poznan.pl/dpm/reef.man.poznan.pl/home/vo.plgrid.pl/generated/2012-06-13/fileba95a559-21eb-4ffc-b154-14d2b706c488
Do tworzenia nowej repliki pliku na innym SE służy komenda:
$ lcg-rep -d <SE> lfn:<ścieżka i nazwa pliku>
–d
pozwala na wybranie SE, na którym zamierzamy składować plik$ lcg-rep -d se.reef.man.poznan.pl lfn:/grid/vo.plgrid.pl/$USER/testFile.txt
Do pobierania pliku z LFC na lokalny dysk twardy (np. na WN, gdzie wykonuje się zadanie) służy komenda:
$ lcg-cp lfn:<ścieżka i nazwa pliku>
$ lcg-cp lfn://grid/vo.plgrid.pl/$USER/testFile.txt file://$HOME/tutorial/dowloaded.txt
Do usuwania pliku z LFC służy komenda:
lcg-del -a lfn:<ścieżka i nazwa pliku>
$ lcg-del -a lfn:/grid/vo.plgrid.pl/$USER/testFile.txt
Do tworzenia skrótu do pliku w LFC służy komenda:
lcg-aa --vo vo.plgrid.pl <GUID> lfn:/<ścieżka i nazwa pliku>
$ lcg-aa --vo vo.plgrid.pl guid:0721ab19-3e73-40f4-bbec-f92c6a772423 lfn:/grid/vo.plgrid.pl/$USER/testFile.alias
Do uzyskania GUID dla zadanego LFN lub SURL służy komenda:
lcg-lg lfn:<ścieżka i nazwa pliku>
$ lcg-lg lfn:/grid/vo.plgrid.pl/$USER/testFile.txt guid:cc50581f-9604-4cd2-b599-ed384be533c3
Po wysłaniu zadania na grid utrudniony jest dostęp do plików generowanych poprzez obliczenia. Do ich podglądu specjalny mechanizm tzw. perusal. By z niego skorzystać należy:
PerusalFileEnable = true;
oraz PerusalTimeInterval = czas_sekundach;
(np. PerusalTimeInterval = 1800;
- jest to czas pomiędzy wysyłaniem przez zadania kolejnych uaktualnień pliku na WMS)po wysłaniu zadania na grid należy uruchomić mechanizm "podglądania" plików komendą (oczywiście wymieniając tylko te pliki, których podgląd jest pożądany):
glite-wms-job-perusal --set -f <file1> -f <file2> <jobId>
do zobaczenia aktualnego stanu podglądanego pliku należy użyć komendy:
glite-wms-job-perusal --get -f <file> <jobId>
-all
zczytuje cały plik od początku. Domyślnie pobierana jest tylko część pliku zmieniona po ostatnim użyciu komendy glite-wms-job-perusal --get -f <file> <jobId>
--dir <dir>
zapisuje podglądany plik do podkatalogu <dir> katalogu, z którego wywołana została komenda. Standardowo plik jest zapisywany w katalogu /tmp/<jobId>
Gdy podglądanie pliku przestaje być potrzebne należy wyłączyć mechanizm perusal poleceniem
glite-wms-job-perusal --unset <jobId>
Ważne: Opisany mechanizm w przypadku bardzo dużych plików może nadmiernie obciążać serwer WMS. Prosimy o stosowanie z rozwagą.
Podczas uruchamiania długo wykonujących się zadań, zalecane jest skorzystanie z długoterminowego proxy. W tym celu należy:
Ustawić zmienną MYPROXY_SERVER_DN na "/C=PL/O=GRID/O=Cyfronet/CN=myproxy.grid.cyf-kr.edu.pl" np. używając powłoki bash komendą:
$ export MYPROXY_SERVER_DN="/C=PL/O=GRID/O=Cyfronet/CN=myproxy.grid.cyf-kr.edu.pl"
Wygenerować standardowe proxy ważne przynajmniej przez 45 minut
$ voms-proxy-init --voms <VO>
Stworzyć i zapisać proxy długoterminowe:
$ myproxy-init -s myproxy.grid.cyfronet.pl -d -n --voms <VO>
gdzie:
-s – specyfikuje hostname maszyny gdzie jest uruchomiony serwer MyProxy;
-d – powoduje, że serwer pośredniczący (serwer proxy) kojarzy DN użytkownika z ustanawianym pośrednikiem (proxy);
-n – powoduje pominięcie użycia hasła dostępu do długoterminowego proxy, dzięki czemu odnawianie proxy może następować automatycznie.
-voms <VO> – dodaje rozszerzenie VO do proxy
Dodatkowo, do obsługi MyProxy przydatne są poniższe komendy:
Informacje na temat utworzonego długoterminowego proxy:
$ myproxy-info -s myproxy.grid.cyfronet.pl -d
Po zakończeniu zadania, proxy długoterminowe może zostać usunięte komendą:
$ myproxy-destroy -s myproxy.grid.cyf-kr.edu.pl -d
W zasadzie - nic więcej, tylko liczyć. W razie pytań lub problemów warto zajrzeć na stronę Gdzie szukać pomocy?