...
- Pobierz, a następnie załaduj do Chipster (używając polecenia File -> Import files ) pliki :
adrenal_1.fastq
adrenal_2.fastq
brain_1.fastq
brain_2.fastq
chr19_hg19.bed
chr19_iGenomes_GRCh37.gtf
- Mapowanie odczytów do genomu referencyjnego.Narzędzie: Alignment -> Bowtie2 for paired end reads . Przed wyborem narzędzia i parametrów zaznacz pliki adrenal_1.fastq oraz adrenal_2.fastq . Wybieramy narzędzie i parametry:
- Genome: Homo_sapiens.GRch37.75
- No 1 mate reads: plik zawierający odczyty „forward” (zazwyczaj z ‘_1’ albo ‘f’ w nazwie): adrenal_1.fastq
- No 2 mate reads: plik zawierający odczyty „reverse” (zazwyczaj z ‘_2’ albo ‘r’ w nazwie): adrenal_2.fastq
Powtórz procedurę dla plików brain_1.fastq i brain_2.fastq . Przejrzyj dostępne wizualizacje plików wynikowych. W wizualizacji genome browser należy wybrać ten sam genom, który był użyty do mapowania. Dane są dostępne dla rejonu: Chr19:3000000:3500000.
- Analiza jakości mapowania. Narzędzie: Quality Control -> RNA-seq quality metrics with RseQC . Narzędzie należy uruchomić na pliku BAM uzyskanym z mapowania w poprzednim kroku oraz załadowanym pliku chr19_hg19.bed . Przeanalizuj otrzymane wykresy oraz informacje diagnostyczne.
- Zliczanie ilości odczytów zmapowanych w obrębie genów. Narzędzie RNA-seq -> Count aligned reads per genes with HTseq-count . Uruchamiamy dla plików bam uzyskanych z mapowania paired-end z użyciem bowtie2. Parametry:
- Reference organism: Homo_sapiens.GRch37.75
- Does the BAM file contain paired-end data: yes
- Was a data produced with a strand-specific protocol: yes
- Zdefiniowanie układu eksperymentalnego. Narzędzie: Utilities -> Define NGS experiment . Uruchamiamy na plikach htseq-count.tsv z poprzedniego kroku (zanzaczyć oba przed uruchomieniem). W opcjach należy zaznaczyć kolumnę zawierającą zliczenia w obrębie plików wybranych do analizy, w naszym przypadku „count”. Po uruchomieniu powstaje tabela łącząca zliczenia z obu plików oraz plik phenodata.tsv . Plik ten należy zaznaczyć i w oknie wizualizacji wybrać Phenodata editor . Teraz należy przyporządkować próbki do grup eksperymentalnych. W naszym przypadku nie mamy replikatów, więc sample001.tsv opisujemy w kolumnie „group” jako „adrenal”, natomiast sample0002.tsv jako „brain” i naciskamy „close”.
- Testowanie statystyczne genów pod względem różnicowej ekspresji. Narzędzie: RNA-seq -> Differential expression using edgeR . Narzędzie uruchom na plikach otrzymanych w poprzednim kroku. Parametry pozostaw domyślne. Przeanalizuj wykresy diagnostyczne oraz listę genów ulegających statystycznie istotnej różnicowej ekspresji.
...
{"serverDuration": 182, "requestCorrelationId": "0720f3819a71d133"}