Skip to end of metadata
Go to start of metadata

Krótki opis usługi

Usługa zaawansowanych analiz mikromacierzowych została stworzona z myślą o osobach przeprowadzających badania biologiczne z użyciem mikromacierzy DNA. Są to mikromacierze, które podają nam informację odnośnie poziomu ekspresji genów w badanych próbkach. Nasza usługa jest narzędziem, które pomaga analizować tę informację oraz korelować poziomy ekspresji z innymi danymi klinicznymi odnośnie badanych organizmów.

W obrębie usługi można przeprowadzić szereg analiz na zgromadzonych danych mikromacierzowych. W pierwszej kolejności, można przeprowadzić normalizację i korekcję tła danych, aby w obrębie jednego eksperymentu otrzymać poziomy ekspresji genów, które możemy ze sobą porównywać. Technika takiej korekcji jest bardzo istotna ze względu na wiarygodność wyników uzyskiwanych na dalszych etapach analizy.

Te dalsze etapy analizy, przeprowadzane w naszej usłudze, mogą polegać na wyznaczaniu genów różnicujących (zarówno analizą istotności mikromacierzy SAM jak i przy użyciu testu t), analizie głównych składowych PCA, analizie skupień (klasteryzacji) lub analizie przy zastosowaniu sztucznych sieci neuronowych o jednej lub dwóch warstwach neuronów ukrytych. W przyszłości planujemy rozwinąć usługę o kolejne analizy wysokiego poziomu, m.in. mapy samoorganizujące się (SOM) czy wykorzystanie GeneOntology w procesie selekcji genów.

Wyniki analiz są przedstawiane w formie graficznej za pomocą wykresów oraz za pomocą danych liczbowych: zarówno jedna jak i druga forma pozwala pobrać wyniki na własny komputer, aby następnie użyć ich np. w trakcie przygotowywania publikacji.

Istotną zaletą usługi jest rozbudowany (i wciąż aktywnie poszerzany) system pomocy kontekstowej, pozwalający na sukcesywną naukę narzędzia w trakcie pracy przy nim. Także moduł importu gotowego eksperymentu mikromacierzowego z bazy Array Express European Bioinformatics Institute (EBI) pozwala łatwiej rozpocząć korzystanie z naszej usługi.

Obecnie obsługujemy mikromacierze DNA firm Affymetrix (typu HumanGenome) oraz Agilent, lecz jesteśmy otwarci na współpracę z użytkownikami posługującymi się innymi typami mikromacierzy. W tej sprawie prosimy o kontakt na nasz adres w HelpDesk: helpdesk@plgrid.pl.

Usługa dostępna jest pod adresem:

https://lifescience.plgrid.pl/

Aktywowanie usługi

Aktywowanie usługi zaawansowanych analiz mikromacierzowych nie wymaga niczego ponad założenie standardowego konta użytkownika w Portalu PLGrid. Szczegółową instrukcję, jak takie konto uzyskać, można znaleźć w Podręczniku użytkownika portalu PL-Grid.

Po otrzymaniu potwierdzenia aktywacji konta, należy jeszcze dokonać rejestracji w samej usłudze. W tym celu prosimy o:

  • zalogowanie się w Katalogu aplikacji PLGrid (to samo konto co dla Portalu)
  • znalezienie i aktywowanie usługi "Platforma integromicznych analiz danych z mikromacierzy DNA".

Usługa akceptuje automatycznie każdego chętnego, więc po wykonaniu powyższych kroków nie trzeba już czekać na żadne dodatkowe potwierdzenia. Można natychmiast przejść na stronę usługi: 

https://lifescience.plgrid.pl/

i kliknąć przycisk 

który powinien przekierować na serwer uwierzytelniający OpenID Portalu PLGrid. Tam należy podać swój login i hasło, identycznie z tym, którego użyliśmy przy logowaniu się do Portalu, aby zacząć korzystać z naszej usługi. Zostaniecie tam powitani krótką instrukcją odnośnie tzw. pierwszych kroków.

Do korzystania z usługi analiz mikromacierzowych nie są potrzebne ani certyfikat użytkownika ani grant obliczeniowy.

Korzystanie z pomocy

Zanim przejdziemy do samouczka, chcielibyśmy zwrócić Twoją uwagę na system pomocy kontekstowej, wbudowanej w aplikację. Poza wprowadzeniem, które właśnie czytasz, istnieją dwa mechanizmy dostarczania wyjaśnień w samej usłudze:

  1. część stron usługi została wyposażona w obszerniejszy komentarz dostępny pod ikoną  u góry ekranu (w menu głównym, nieco z prawej strony) - komentarz ów służy zazwyczaj obszerniejszym omówieniem danej części usługi, którą właśnie masz przez oczyma
  2. poszczególne elementy widoków i paneli usługi mogą być wyposażone w wyjaśnienia ukryte pod przyciskiem pomocy kontekstowej ; w zależności od obszerności tekstu tej pomocy, przycisk ten będzie natychmiast ukazywał niewielkie okno informacyjne (tzw. "dymek") po najechaniu nań kursorem myszy lub, w przypadku dłuższego objaśnienia, będzie przywoływał nowe okno dialogowe (tzw. "modal") po kliknięciu na nim.

Ze względu na dynamiczny rozwój naszej usługi, jej względną młodość (powstaje od grudnia 2012 roku) oraz konieczność doskonalenia istniejących mechanizmów, system pomocy jest ciągle rozwijany. Z góry przepraszamy za braki w dokumentacji - sukcesywnie będziemy ten system rozwijać, dodając nowe ekrany informacyjne oraz podpowiedzi w najistotniejszych miejscach.

Proponujemy Ci teraz rozpocząć naukę korzystania z naszej usługi przy pomocy krótkiego samouczka.

Samouczek

Uwaga: celem poniższego samouczeka nie jest dostarczenie informacji na temat metodyki czy znaczenia badań poziomów ekspresji genów przy użyciu mikromacierzy DNA. Raczej zakładamy, że posiadasz wiedzę w tym zakresie ze względu na własne zainteresowania czy charakter wykonywanej pracy badawczej. Ideą samouczka jest zaś przybliżenie nieco sposobu działania interfejsu użytkownika naszej usługi i "oswojenie" nowych użytkowników z podstawowymi mechanizmami jej działania.

1. Przygotowanie

Mamy nadzieję, że w chwili obecnej dysponujesz już aktywowanym dostępem do usługi i udało Ci się zalogować na serwis https://lifescience.plgrid.pl/. Jeśli jednak nastąpiły jakieś trudności w tym zakresie, proszę skorzystaj z systemu HelpDesk PLGrid, aby zgłosić problem lub po prostu wyślij nam maila na adres helpdesk@plgrid.pl - postaramy się pomóc.

Po zalogowaniu się i obejrzeniu ekranu powitalnego, zobaczysz przed sobą panel tworzenia nowego eksperymentu:

W przyszłości będziesz z niego korzystać aby definiować własne eksperymenty badawcze. W chwili obecnej jednak proponujemy skorzystanie z zasobów Europejskiego Instytutu Bioinformatycznego EBI. Spróbujemy zdalnie zaimportować wskazany eksperyment mikromacierzowy, uprzednio opublikowany w bazie EBI, aby na nim przećwiczyć podstawowe funkcje systemu.

2. Import eksperymentu z EBI

W celu zaimportowania eksperymentu, przejdź do zakładki: . Tam, w formularzu przygotowania importu eksperymentu:

użyj identyfikatora E-GEOD-20151. Jest to identyfikator eksperymentu nadany mu w bazie ArrayExpress EBI - przeglądając zasoby tej bazy danych dostrzeżesz wiele innych eksperymentów z podobnymi identyfikatorami. Pamiętaj jednak, że baza ArrayExpress zawiera wiele innych danych poza badaniami ekspresji genów z użyciem mikromacierzy DNA, a więc znacznej większości z tych eksperymentów nie będzie można zaimportować do naszej usługi. Inne z kolei nie będą zawierać pełnego zestawu informacji, jakiego wymaga nasz serwis, aby poprawnie pobrać eksperyment. W takim przypadku otrzymasz stosowny komunikat, wyjaśniający dlaczego nie może dojść do importu wskazanego badania, np:

W przypadku jednak naszego eksperymentu E-GEOD-20151, etap sprawdzenia dostępności eksperymentu powinien przebiec prawidłowo, i zobaczysz następujący formularz:

Poza podstawowymi informacjami na temat eksperymentu (m.in. liczba i typ użytych mikromacierzy) możemy tutaj także wybrać cechę klasyfikującą próbki (mikromacierze), którą zdefiniowali autorzy tego badania: użyta przez nich nazwa to CELL TYPE (typ komórki). Prosimy wybierz tę kolumną z tabeli II faza: wybór cech klasyfikujących i kliknij przycisk . Po krótkim oczekiwaniu, aplikacja powinna przejść do ekranu Przeglądu eksperymentów, gdzie będzie znajdował się twój nowy, zaimportowany z EBI, eksperyment:

Aby zachować porządek w tworzonych eksperymentach, ów został nazwany dokładnie tak, jak brzmi jego identyfikator w bazie EBI (tj. E-GEOD-20151). Jeśli jednak nie podoba Ci się ta nazwa, możesz skorzystać z przycisku  w zielonej belce nagłówka eksperymentu, aby ją zmienić (pojawi się w tym celu nowe okno dialogowe).

Nadmieńmy, że w przyszłości możesz także korzystać z alternatywnego przycisku  aby zaimportować jedynie pliki mikromacierzy danego eksperymentu - powoli Ci to m.in. przeprowadzić własne, alternatywne eksperymenty na danych/próbkach publikowanych przez autorów. Póki co jednak, import całego eksperymentu znacznie ułatwi nam naukę

3. Struktura eksperymentu

Kiedy dysponujemy już zaimportowanym eksperymentem, możemy łatwo obejrzeć, jak jest zbudowany. W tym celu kliknij gdziekolwiek w szare tło opisu eksperymentu, poniżej jego zielonej belki z nazwą E-GEOD-20151, lub, alteratywnie, w przycisk  na zielonej belce obok tytułu eksperymentu. Na ekranie Skojarzonych danych, do którego przeniesie Cię usługa, główną informacją jest tabela mikromacierzy tworzących eksperyment:

(Zauważ, że część informacji podanych jest w języku angielskim, gdyż takich wartości użyli oryginalni autorzy eksperymentu, publikując go w bazie ArrayExpress).

Tabela zwiera cztery wiersze, co nie jest zaskakujące, gdyż dokładnie tylu próbek używał zaimportowany przez nas eksperyment - jeden wiersz reprezentuje jedną próbkę (mikromacierz), podając jej nazwę, nazwę pliku w którym jest zapisana, typ (tutaj jest to Affymetrix HG-U133A) oraz rozmiar. Korzystając z ikonki  możesz każdy z tych plików pobrać na własny komputer (np. w celu skorzystania z innego narzędzia analizy, które posiadasz).

Przedostatnia kolumna zawiera wartości klasyfikujące próbki względem kryterium, jakie zdefiniowali autorzy eksperymentu (tutaj: CELL TYPE) - rzecz jasna, ta część tabeli będzie różna dla innych eksperymentów, a może nawet zawierać więcej niż jedną kolumną (jeśli zastosowano wiele kryteriów klasyfikujących badane próbki). Pomarańczowe przyciski z prawej strony tabeli służą do zarządzania danymi eksperymentu - chwilowo jednak pominiemy je.

Ciekawą funkcjonalnością jest filtr umieszczony powyżej tabeli, z prawej strony. Wpisując tam np. 630 zobaczymy, że możemy w ten sposób zawężać tabelę do wybranych plików. Kasując wartość tego filtru wracamy do poprzedniego ustawienia. Spróbujmy teraz przeprowadzić naszą pierwszą analizę danych.

4. Analiza niskiego poziomu

Aby móc wykonywać zaawansowane analizy statystyczne na zgromadzonych danych, nasza usługa wymaga przeprowadzenia uprzednio tzw. analizy niskiego poziomu. Składa się ona zazwyczaj z fazy normalizacji oraz korekcji tła, które przetwarzają dane źródłowe na wartości ekspresji genów, które mogą być ze sobą porównywane. W celu zlecenia takiej analizy wybierz z szarego menu  opcję .

Panel analizy niskiego poziomu (w przyszłości spostrzeżesz, że także wielu innych analiz) składa się zasadniczo z dwóch podstawowych części: tabeli wyboru danych wejściowych oraz formularza parametrów analizy. Pierwsza pozwala nam dokonać wyboru jaki zestaw próbek (mikromacierzy) będzie analizowany - w tym przypadku zdecydowanie najlepszą opcją jest wybranie wszystkich wierszy. Możesz tego dokonać klikając po kolei w każdy z nich lub wybierając jeden a następnie używając przycisku . Tabela danych wejściowych powinna w tym momencie wyglądać następująco:

tj. wszystkie wiersze powinny zmienić kolor swojego tła na jasnozielony.

Spowoduje to także, że uaktywni się formularz parametrów analizy:

Możemy w nim, poza nadaniem nazwy naszej pierwszej analizie, wskazać metody normalizacji oraz korekcji tła, jakie powinny zostać użyte. W tym przypadku zrezygnujemy z korekcji tła a normalizację przeprowadzimy metodą kwantylową. Po kliknięciu przycisku  analiza zostanie zlecona. W trakcie oczekiwania na jej wykonanie (co może zająć od 3 do kilkunastu minut, w zależności od typu mikromacierzy), system przełączy się na tabelę analiz:

w której jedyne miejsce zajmuje właśnie uruchomiona analiza niskiego poziomu (my nazwaliśmy naszą: "Analiza NP"). Wiersz tabeli przypomina o liczbie użytych plików źródłowych, wybranych parametrach oraz dniu i godzinie zlecenia analizy. Jeśli chwilkę poczekasz niczego nie klikając zobaczysz, że status analizy zmieni się z  na . Oznacza to, że twoja analiza trafiła do kolejki wykonań a następnie została z tej kolejki pobrana i właśnie jest wykonywana (jeśli to nie nastąpi, oznacza to po prostu że inni użytkownicy usługi zlecili wcześniej własne analizy i trzeba poczekać, aż one się skończą, aby nasza analiza została wykonana). W normalnej sytuacji samo wykonanie analizy niskiego poziomu dla tego eksperymentu powinno zabrać ok. 2,5 minuty, po czym status analizy powinien zmienić się na . To dobra wiadomość - analiza zakończyła się, nie wystąpiły błędy wykonania a jej wyniki są już dostępne. Prosimy kliknij gdziekolwiek na wierszu analizy w tabeli, lub na przycisk  z lewej strony nazwy analizy, aby przyjść do panelu prezentacji wyników.

5. Panel wyników analizy

Wyniki analizy są prezentowane w dość złożony sposób, więc spróbujmy omówić go krok po kroku. U góry strony spostrzeżesz nagłówek:

który przypomina ponownie nazwę, rodzaj oraz czas wykonania analizy. W przyszłości, kiedy będziesz mieć więcej wykonanych analiz, zielone przyciski z lewej i prawej pozwolą przechodzić pomiędzy analizami w kolejności chronologicznej. Kolejny element, rozwijany poprzez naciśnięcie na szarą belkę z nazwą Pliki wejściowe oraz opisem "(kliknij aby zobaczyć)", ukazuje znaną nam już tabelę próbek źródłowych analizy:

W chwili obecnej mamy jeszcze naszą analizę świeżo w pamięci, lecz kiedyś ta tabela będzie pomocna, aby przypomnieć sobie dokładniej, jakie pliki wzięliśmy pod uwagę w tym konkretnym przypadku. Szczegóły przetwarzania poniżej podają dokładne dane odnośnie parametrów wykonania analizy i podobne informacje. Te dwa elementy są wspólne dla rezultatów wszystkich analiz w naszej usłudze - rzecz jasna, wiersze tabeli plików wejściowych jak i wartości parametrów analiz, będą się różnić od przypadku do przypadku, jednak obie te sekcje panelu mają zawsze analogiczną zawartość.

Różna natomiast, w zależności od rodzaju wykonanej analizy, jest zawartość sekcji Rezultaty. W przypadku analiz niskiego poziomu znajdziemy tam wykresy diagnostyczne:

Jeśli metodologia analizy informacji zawartych w mikromacierzach nie jest Ci obca, z pewnością poznasz te wykresy. W skrócie informują one, jak dobrze przebiegła normalizacja i pozwalają ocenić, czy otrzymane dane znormalizowane są gotowe do dalszej obróbki statystycznej, czy jednak wciąż są obarczone zbyt dużymi rozbieżnościami.

W końcu, w panelu Dalsze kroki, możesz obejrzeć jakie analizy wysokiego poziomu są możliwe do wykonania z wykorzystaniem wyników właśnie przeprowadzonej analizy niskiego poziomu.

W tym konkretnym przypadku możemy przejść do zlecenia analiz istotności mikromacierzy (metodą SAM lub testu t) lub analizy skupień (clustering). Dokładna zawartość tego panelu również zależy od rodzaju analizy, jaką wykonaliśmy, i z czasem będzie dostępnych więcej typów.

6. Konkluzje

W tym krótki samouczku nauczyliśmy się, jak poruszać się po podstawowych ekranach usługi zaawansowanych analiz mikromacierzowych. Dokonaliśmy:

  • importu pełnego eksperymentu z bazy EBI (oczywiście możemy także definiować własne eksperymentu i ładować do narzędzia własne mikromacierze)
  • przeglądu mikromacierzy, który konstytuują ten eksperyment (oczywiście, w normalnym trybie możemy tutaj także swobodnie kojarzyć nowe pliki z obecnym eksperymentem, dowolnie klasyfikując je pod różnymi kryteriami)
  • zlecenia analizy niskiego poziomu (rzecz jasna, narzędzie pozwala wykonywać wiele więcej różnych typów analiz)
  • oraz przeglądnięcia rezultatów wykonania tej analizy (dla innych analiz przygotowane też zostały wykresy interaktywne, pozwalające swobodniej eksplorować otrzymane dane).

Zachęcamy teraz do eksploracji interfejsu usługi: tworzenia własnego eksperymentu, ładowania własnych plików (lub, dla ćwiczenia, ponownego użycia posiadanych już zaimportowanych plików w innej konfiguracji), przeprowadzania innych typów analiz. Jednocześnie informujemy, że nasza usługa jest we wczesnej fazie testowej: oznacza to, że choć chcieliśmy się podzielić w Wami owocami naszej pracy na tym etapie, narzędzie samo w sobie jest wciąż poddawane rozwojowi, który będzie w przyszłości owocować nowymi funkcjonalnościami oraz usprawnieniami elementów już obecnych. Wszelkie zauważone niedogodności czy błędy prosimy zgłaszać nam w systemie HelpDesk PLGrid (proszę użyć frazy "Integromika"), lub wprost mailem na adres helpdesk@plgrid.pl. W tym celu dodaliśmy w menu główny, u góry z prawej strony, przycisk  - można go użyć aby łatwiej zgłosić nam problem lub propozycję usprawnienia usługi.

Zaawansowane analizy

Jeśli masz już za sobą powyższy tutorial, zapraszamy do przeprowadzenia bardziej zaawansowanych ćwiczeń. Nasz ekspert w zakresie analizy statystycznej mikromacierzy DNA przygotował dokument opisujący krok po kroku zestaw analiz, przeprowadzanych na eksperymencie zawierającym 41 mikromacierzy, który przeprowadzi Cię przez znakomitą większość analiz wysokiego poziomu naszej usługi. Aby rozpocząć pracę z tym poradnikiem, przydadzą Ci się umiejętności zdobyte w czasie zabawy z powyższym samouczkiem. Zacznij od importu z bazy ArrayExpress ABI eksperymentu o identyfikatorze: E-TABM-15.

Kilka dodatkowych podpowiedzi, które mogą okazać się bardzo pomocne w wykonywaniu ćwiczeń opisanych w eksperymencie:

  • Jak wykonać analizę niskiego poziomu dla 41 plików? W panelu projektu analizy niskiego poziomu użyj selektora liczby wyświetlanych plików (z lewej strony zaraz nad tabelą) i ustaw tam wartość 50. Następnie wybierz dowolny wiersz w tabeli poniżej i w końcu kliknij na przycisk poniżej tabeli.
  • Jaką liczbę genów wyselekcjonować? W tworzeniu dokumentu dokonano selekcji dokładnie 38 genów najbardziej różnicujących. W panelu przygotowania typowania genów różnicujących (SAM etap II) należy w tabeli wartości Delta wybrać wiersz numer 6 (lub wprost wpisać wartość odcięcia delta: 10.6 do formularza).

Dokument z ćwiczeniami: przykladowa_analiza_v2.pdf.

Autorzy

Autorami usługi zaawansowanych analiz mikromacierzowych są pracownicy ACK Cyfronet AGH oraz Klastra LifeScience Kraków. Przy tworzeniu poszczególnych analiz wykorzystano także wiedzę pracowników następujących instytutów:

Jak dziękować w publikacji?

Jeśli opublikowaliście pracę z wykorzystaniem rezultatów osiągniętych dzięki naszej usłudze, prosimy o zawarcie następującej formuły podziękowań, w odpowiedniej części swojej publikacji:

Formuła podziękowania PL-Grid

This research was supported in part by PL-Grid Infrastructure.

Praca została wykonana z wykorzystaniem Infrastruktury PL-Grid.

 

 

  • No labels