230 likes | 409 Views
Introduction to Bioinformatics - Tutorial no. 1. NCBI Entrez Genome Browser. NCBI Entrez. Entrez. http://www.ncbi.nlm.nih.gov/Entrez /. Entrez – cont ’ d. לכל אחד מהמאגרים ב- Entrez יש דף כניסה המאפשר להתחיל את החיפוש ממנו.
E N D
Introduction to Bioinformatics - Tutorial no. 1 NCBI Entrez Genome Browser
Entrez http://www.ncbi.nlm.nih.gov/Entrez/
Entrez – cont’d • לכל אחד מהמאגרים ב-Entrez יש דף כניסה המאפשר להתחיל את החיפוש ממנו. • מצד שני, כל המאגרים מחוברים זה לזה (החיבורים כבר נעשו בזמן אחסון המידע, ולכן שליפתם מאוד מהירה). • יכולת זו היא נקודת החוזק העיקרית של Entrez – היא מאפשרת לחוקר "לגלוש" בקלות (בקליק) בין רשומות הקשורות ביניהן אך נמצאות במאגרים שונים (למשל בין גן לחלבון, בין מחלה לגן, וכו...).
מאגרים ב-Entrez • OMIM: Online Mendelian Inheritance in Man • http://www.ncbi.nlm.nih.gov/entrez/query.fcgi?db=OMIM • “is a catalog of human genes and genetic disorders “ • זהו קטלוג ערוך (באוניברסיטת Johns Hopkins) • מכיל רשומות על מחלות ורשומות על גנים שמשתתפים בהם. • החיפוש מוצא את שני סוגי הרשומות. (לכן יכולות להיות כפילויות).
OMIM – cont’d • שדות ברשומת מחלה: • DESCRIPTION • CLINICAL FEATURES • INHERITANCE • MAPPING • CLINICAL MANAGEMENT • EVOLUTION • ANIMAL MODEL • ועוד ועוד... (צד שמאל של המסך) • שדה MOLECULAR GENETICS מכיל קישור לרשומת גן.
OMIM – cont’d • שדות ברשומת גן של מחלה: • DESCRIPTION • CLONING – היסטוריית השיבוט של הגן • GENE FUNCTION • MAPPING • ALLELIC VARIANTS • GENOTYPE/PHENOTYPE CORRELATIONS • ועוד...
OMIM – cont’d • החיפוש מתבצע בברירת מחדל בכל השדות • לכן, חיפוש CF יחזיר גם מחלות שיש להם קשר עקיף. • אפשר להגביל את החיפוש לשדה מסוים. • רשימת השדות ב-OMIM נמצאת ב: http://www.ncbi.nlm.nih.gov/entrez/Omim/omimhelp.html#SearchFields • קל להגיע אליה דרך ה-help בדף הראשי של OMIM. • כדי להגביל את החיפוש נכתוב את שם השדה מיד לאחר המילה המבוקשת בתוך סוגריים מרובעים. • למשל: CF [TI] כדי לחפש רק בכותרת. • ניתן לבצע חיפושים מורכבים יותר (המערבים כמה שדות) – פרטים בהמשך.
Entrez – cont’d • כל "נקודות הכניסה" ל-Entrez דומות בממשקן ויכולות החיפוש שלהן. • בדומה, הממשק שמציג את הרשומות זהה (במידת הניתן- הרי מדובר בסוגי אינפורמציה שונים)
Entrez: Nucleotide • The Entrez Nucleotides database is a collection of sequences from several sources, including GenBank, RefSeq, and PDB • זהו אינו "עותק דיגיטלי של הגנום" אלא רשימת רצפים שהוגשו (submitted) למאגר, ויכולים להיות למשל: • רצפי DNA גנומים (כוללים אינטרונים, פרומוטרים וכו') • רצפי mRNA • רצפים ש"נחשבים" כגנים (putative) • רצפים גנומים ש"רוצפו" (sequenced) אך תפקודם לא ידוע • לכן יש המון: • חזרות • חפיפות • גרסאות שונות
Entrez: Nucleotide • גם כאן, כל רשומה היא מעין 'תיקיה'- שמכילה, בנוסף לרצף ה-DNA/RNA גם שדות כמו: • AUTHORS – מי הגיש את הרצף • REFERENCESמאמרים הקשורים לרצף – • ORGANISM • FEATURES: • מידע על חלקים של הרצף • למשל שבנוקלאוטידים 79...56 יש אקסון. • או שבנוקלאוטיד 103 יש SNP- כלומר לפעמים יש A במקום G. • או שבנוקלאוטידים 5985... 7814 יש CDS. • אם נרצה לקבל רק את הרצף, נבחר ב-'display' להציג את הרשומה בפורמט FASTA. • אם נרצה לראות את הסידור של features על הרצף, נוכל להשתמש בתצוגת Graphics.
Entrez: PubMed • “includes over 14 million citations for biomedical articles back to the 1950's” • רשימת השדות- http://www.ncbi.nlm.nih.gov/entrez/query/static/help/pmhelp.html#SearchFieldDescriptionsandTags • לדוגמא: • Title [ti] • Author [au] • Affiliation [ad] • Journal title [ta] • Journal issue [ip] • Publication date [dp] • Language [la] • MESH term [mh]
חיפושים מורכבים • ניתן לחבר קריטריונים שונים לחיפוש ספציפי יותר: • ע"י שימוש ב-Boolean operators: • AND • OR • NOT • OR = ו/ או • AND קודם ל-OR (כמו שכפל קודם לחיבור) • אפשר לעקוף זאת ע"י עטיפת חלקים מהביטוי בסוגריים.
לדוגמא • CF AND Jones[au] OR Smith[au] • (CF AND Jones[au]) OR Smith[au] • לעומת זאת, כשכותבים: • CF AND (Jones[au] OR Smith[au]) נקבל את התוצאה הרצויה
ממשק Entrez– יכולות נוספות • Limits: מסך המאפשר להריץ בקלות חיפושים מסוגים שכיחים- לפי סוג המידע • למשל- במסך ה-limits של PubMed נוכל לבחור publication date ואילו ב-OMIM נוכל לבחור כרומוזום אליו ממופית המחלה. • History: מאפשר לנו לראות את החיפושיםהאחרונים שביצענו ולחבר ביניהם (#2 AND #6).
MESH Terms • "אוצר מילים" ברפואה / מדעי החיים במכיל יותר מ-19,000 מילים. • המילים מסודרות בהיררכיה. • כל מאמר שמוכנס ל-PubMed מתואר ע"י אוסףהמונחיםהספציפי ביותר במאגר. • המשתמש יכול לחפש לפי מונחים ספציפיים אלו או לפי המונחים הכלליים יותר. • בחירת מונחים מתוך MESH לחיפוש- ע"י מסך Preview/Index.
IDs and Accessions • לכל רשומה ב-Entrez יש "מזהה יחודי" שנקרא ID או לפעמים Accession. • במידה וידוע המזהה ניתן לחפש לפיו בשורת החיפוש ולהגיע ישר לרשומה.
UCSC Genome Browser (1) http://genome.ucsc.edu/ Organism Assembly date Display size
UCSC Genome Browser (2) Move left/right Current range Zoom in/out Position Track title Track description
Other Resources • Human Genome at Department of Energy • http://www.ornl.gov/hgmis/ • Ensembl genome browser • http://www.ensembl.org/ • NCBI human genome resources • http://www.ncbi.nlm.nih.gov/genome/guide/ • Nature genome gateway • http://www.nature.com/genomics/human/