Praktická ukážka tvorby stromov

Viacnásobné zarovnania z UCSC browsera

  • V UCSC browseri môžeme získavať viacnásobné zarovnania jednotlivých génov (nukleotidy alebo proteíny). Nasledujúci postup nemusíte robiť, súbor je nižšie
    • V UCSC browseri si pozrieme úsek ľudského genómu (verzia hg38) chr6:135,851,998-136,191,840 s génom PDE7B (phosphodiesterase 7B)
    • Na modrej lište zvolíme Tools, Table browser. V nastaveniach tabuliek Group: Genes and Gene Predictions, Track: All GENCODE v 49., zaklikneme Region: position, a Output format: CDS FASTA alignment a stlačíme Get output
    • Na ďalšej obrazovke zaklikneme show nucleotides, zvolíme MAF table multiz100way a vyberieme si, ktoré organizmy chceme. V našom prípade z primátov zvolíme chimp, rhesus, bushbaby, z iných cicavcov mouse, rat, rabbit, pig, cow, dog, elephant a z ďalších organizmov opposum, platypus, chicken, stlačíme Get output.
    • Výstup uložíme do súboru, necháme si iba prvú formu génu (ENST00000308191.11_hg38), z mien sekvencií zmažeme spoločný začiatok (ENST00000308191.11_hg38) a celkovo prepíšeme skratky druhov na anglické názvy.
    • Výsledné zarovnanie
    • Podobný postup sme ešte spravili s génom EFL1, transkript ENST00000891314.1, výsledné zarovnanie

Strom metódou spájania susedov

Zostavili sme strom aj IQ-TREE pomocou metódy maximálnej vierohodnosti na Galaxy, viď nižšie

Stromy na Galaxy

Webstránka s veľa nástrojmi https://usegalaxy.eu/

  • Obsahuje veľa bioinformatických nástrojov, ktoré môžete spúšťať
  • Ale na výsledky treba niekedy dlho čakať
  • V ľavom stĺpci hľadanie nástroja alebo nahrávanie dát
  • V pravom stĺpci zoznam nahratých dát, bežiacich programov a hotových výsledkov (výsledky si pozriete ikonou oka alebo stiahnete ikonou diskety)
  • V strede nastavenia nástroja alebo prezeranie výsledkov
  • Pri serióznom používaní odporúčam vytvoriť si konto a prihlásiť sa

Pre ďalšie pokusy: nezarovnané sekvencie proteínov z rôznych organizmov:

  • Sekvencie
  • Nájdené pomocou BLAST v Uniprote ako homológy proteínu YCF1 z S. cerevisiae
  • Zarovnáme na Galaxy pomocou muscle, strom spravíme cez rapidnj alebo IQ-tree
  • Dáta nahráme ikonou Upload úplne vľavo hore, v dolnom rade tlačidiel treba dať Paste/Fetch data
  • Strom zobrazíme ikonkou grafu alebo cez phylotree.
  • Predpočítané výsledky