520 likes | 679 Views
Introduktion til de praktiske øvelser. Vi vil i dag fokusere på tre forskellige online software til SNP analyser snpTree NDtree CSIphylogony. Introduktion til SNP analyser. http://cge.cbs.dtu.dk/services/all.php. snpTree. DRAG’n Drop (eller brug Browse) til at uploade filer.
E N D
Introduktion til de praktiske øvelser Vi vil i dag fokusere på tre forskellige online software til SNP analyser • snpTree • NDtree • CSIphylogony
Introduktion til SNP analyser http://cge.cbs.dtu.dk/services/all.php
snpTree DRAG’n Drop (eller brug Browse) til at uploade filer …eller vælg din egen reference (index case? – draftgenome)!! Vælg en reference (samme bakterielle species) Vælg data format (her: Assembledgenomes) Vælg minimal distance der skal være imellem SNPs.
Prune? Hvad er SNPs…og hvad bruger vi dem til? Hvad er forudsætningen for at vi kan bruge dem?
Lidt om.....filnavne…. Kirsten Siggaard Kirsten_Siggaard Ingen MELLEMRUM (eller sære tegn!) i filnavne!!!
snpTree Vælg minimal distance der skal være imellem SNPs. Submit……..og vent……eller start et nyt job..
Vælg alt ”CTRL + A” teksten i vinduet og kopier ”CTRL + C” Åben herefter MS Excel og sæt teksten ind ”CTRL + V”
Vælg alt ”CTRL + A” teksten i vinduet og kopier ”CTRL + C” Åben herefter TreeViewer og sæt teksten ind ”CTRL + V” http://cge.cbs.dtu.dk/services/TreeViewer-1.0/treeviewer.php
http://cge.cbs.dtu.dk/services/TreeViewer-1.0/treeviewer.php
http://cge.cbs.dtu.dk/services/TreeViewer-1.0/treeviewer.php Copy/Paste tekst fra NEWICK filen her! Vil I prøve anden Træ-viewer, så kan man hente FigTree her: http://tree.bio.ed.ac.uk/software/figtree/
Extractingarchives: 7-ZIP: http://7-zip.org/ WinRar: http://www.rarlab.com/download.htm
Bemærk: .vcf filer i Windows er kontakt-filer til Outlook!! For at åbne en bioinformatisk .vcf fil* skal man højre-klikke på filen og vælge ”Åben med” og vælge ”Notesblok” som standardprogram til denne filtype! * En bioinformatisk .vcf fil indeholder information om alle SNPs i forhold til referencen for hver af de sekvenser, man har uploadet.
Vælg alt ”CTRL + A” teksten i vinduet og kopier ”CTRL + C” Åben herefter MS Excel og sæt teksten ind ”CTRL + V”
NDtree DRAG’n Drop (eller brug Browse) til at uploade filer Vælg ”Fast mode” i dag… Vælg din egenforetrukne reference…eller lad serverenidentificeredetbedste match fra en megetlanglisteaffuldtsekventeredegenomerfra NCBI...
Find filen i ”Download” eller ”Overførsler” mappen i Windows stifinder Bemærk: .mat filer i Windows er MS Access filer!! For at åbne en bioinformatisk .mat distancefil skal man højreklikke på filen og vælge ”Åben med” og vælge ”Notesblok” som standardprogram til denne filtype! Herefter kopieres indholdet ”CTRL + A”, ”CTRL + C” og sættes ind i Excel ”CTRL + V” P.S. Output kan være ret svært at læse (det arbejdes der på)
Vælg alt med ”CTRL + A” og kopier ”CTRL + C” Åben herefter ThreeViewer og sæt teksten ind ”CTRL + V” http://cge.cbs.dtu.dk/services/TreeViewer-1.0/treeviewer.php
Vælg din egen reference (index case/Typestamme?)!! DRAG’n Drop (eller brug Browse) til at uploade filer
Vælg minimal distance der skal være imellem SNPs. Submit dit job
Vælg alt med ”CTRL + A” og kopier ”CTRL + C” Åben herefter TreeViewer og sæt teksten ind ”CTRL + V” http://cge.cbs.dtu.dk/services/TreeViewer-1.0/treeviewer.php Herefter kopieres indholdet i Notepad med ”CTRL + A”, ”CTRL + C” og sættes ind i Excel ”CTRL + V”
Herefter kopieres indholdet i Notepad med ”CTRL + A”, ”CTRL + C” og sættes ind i Excel ”CTRL + V”
SNP øvelsen • Øvelsessættet består af 7 Klebsiellapneumoniaestammer relateret til et udbrud af CTX-M-15/SHV-28 producerende K. pneumoniaemed udgangspunkt i Hospitalet i Hillerød. • Herudover vil I få udleveret den nærmest beslægtede (fuldt sekventerede) NCBI reference stammer. • Og et ESBL producerende E. coli stamme til at teste med.
Leg og lær…. • Tanken er, at I kan prøve én eller flere af de forskellige SNP web-servere af med dette testsæt. • Det er muligt at sætte mere end ét job over ad gangen…. • …..men husk på, at vi er 25, der gør det samtidig, hvilket godt kan have en effekt på hastigheden af serveren. • Skulle det gå helt galt, kan vi blive nødt til at genstarte serveren…!!
I kan få tilsendt en e-mail med resultatet • Resultatet vil kun være tilgængeligt i 48 timer på serveren….herefter slettes linket. Så vil I gerne gemme resultaterne af jeres fremtidige søgninger, er I nødt til at gemme filerne! • Kører I flere jobs, så anbefales det varmt, at I skriver en lille note ned angående jobbet (Hvilken reference, hvilken prune, hvilke stammer osv.)
Forslag til Jobs, der kan sættes i gang Start med at lave en folder på computerens skrivebord, som I navngiver med jeres initialer. • Prøv at køre enten snpTree, Ndtree eller CSI Phylogony med de 7 teststammer. Brug introduktionen fra før til at sikre jer, at I starter det, med de korrekte parametre. Note snpTree: Vælg en af de 5 Klebsiella’er i NCBI listen og husk at vælge ”Assembledgenomes” som input! Note NDtree: Prøv at lade NDtree selv finde referencen ved at lade feltet ”Template file” stå tomt. Note CSI Phylogeny: Vælg filen ”Ref_1084” som reference. Kan I identificere udbrudsstammerne imellem de 7 isolater.
Prøv jer frem…. I kan prøve at tjekke nogle af outputfilerne ud. • Kan I finde, hvor mange SNPs der er til forskel imellem de forskellige udbrudsstammer? • Kan I få hentet NEWICK filen og få den over i TreeViewer? Prøv at ændre på træet i ThreeViewer.
Prøv jer frem…. Prøv at gentage jobbet med ændrede parametre (højere prune, ændre reference, samme sæt med en af de to andre web-servere..). • Får I samme resultater? • Hvordan reagerer de forskellige SNP-servere på at der kommer en forkert species (her E. coli) med i analysen?
Prøv jer frem…. Prøv at gentage jobbet med ændrede parametre: • højere prune • ændre reference til index case (kpn_1) • samme sæt data med en af de to andre web-servere. • Får I samme resultater med de ændrede parametre? • Hvordan reagerer de forskellige SNP-servere på at der kommer en forkert species (her E. coli) med i analysen?
Resultater….. • snpTree, alle 7 stammer, reference (MGH….), 10 prune • snpTree, alle 7 stammer, reference (kpn_7), 10 prune • NDtree, alle 7 stammer, ingen valgt reference • CSI Phylogeny, alle 7 stammer, Ref (1084), 10 prune • snpTree, 6 sidste stammer, Ref (kpn_1), 10 prune • NDtree, 6 sidste stammer, Ref (kpn_1) • CSI Phylogeny, 6 sidste stammer, Ref (kpn_1), 10 prune • CSI Phylogeny, 7 + EC, Ref (1084), 10 prune • snpTree, 7 + EC, Ref (1084), 10 prune • NDtree, 7 + EC, Ref (1084) • snpTree, 6 udbrudsstammer, Ref (kpn_1), prune 10 • NDtree, 6 udbrudsstammer, Ref (kpn_1) • CSI Phylogeny, 6 udbrudsstammer, Ref (kpn_1), prune 10