690 likes | 960 Views
גנומיקה השוואתית. שחר מיידנבאום אמיר גולדברג. מנחה: מיכל ליניאל. 8.7.2008. פתיחה. מוטיבציה עקרונות וכלים Minimal Gene Set & Last Common Ancestor חיות מודל 12 fly project גילוי אקסונים חדשים באדם. למה מיפוי הגנום חשוב?. גילוי פונקציות חדשות תכנון micro-array איכות נתונים סטטיסטיים
E N D
גנומיקה השוואתית שחר מיידנבאום אמיר גולדברג מנחה: מיכל ליניאל 8.7.2008
פתיחה • מוטיבציה • עקרונות וכלים • Minimal Gene Set & Last Common Ancestor • חיות מודל • 12 fly project • גילוי אקסונים חדשים באדם
למה מיפוי הגנום חשוב? • גילוי פונקציות חדשות • תכנון micro-array • איכות נתונים סטטיסטיים • מציאת השפעות של תרופות • ועוד..
הבעיה • הדרך הניסיונית העיקרית לגילוי גנים היא איתור mRNA של אותו הגן. • לא ניתן להבחין בין RNA מקודד ל RNA שאינו מקודד לחלבון • לא ניתן לזהות אזורים רגולטוריים שכלל לא משועתקים • נותן מידע רק על רקמה מסויימת, שלב התפתחותי ומצב נוכחי של האורגניזם • כתוצאה – איכות הנתונים (להלן annotations) במאגרי המידע הגדולים איננה אחידה ברמתה
הפיתרון • אבולוציה!
קצת היסטוריה • In the beginning there was Evolution • 1992: The Institute for Genomic Research (TIGR) was founded with the goal of “jump-starting the genomics revolution” • May 1995: TIGR completed the first genome sequence of a free-living organism, a bacterium known as Haemophilus influenzae. • 1998: Celera was founded with the primary mission of completing the human genome sequence within three years • March 2000: Fruit fly sequence was published by Celera
קצת היסטוריה • June 2000: Celera announced the completion of its first draft of the human genome • April 2001: Celera completed the first assembly of the mouse genome • 2003: The Human Genome Project was completed • According to the Genome News Network, over 180 organisms have been sequenced since 1995
גנומים שפוענחו Chimpanzee Dog Fruit Fly Honeybee Human Mosquito Mouse Pufferfish Rat Red Jungle Fowl Roundworm Various Bacteria Various Fungi Various Microbes
איתור רצפים שמורים • אזורים מקודדים לחלבון • אזורים מקודדים ל – RNA (microRNA) • אזורים רגולטוריים • אלמנטים מבניים • ?
על מה לא נדבר • השוואת RNA ורצפים פפטידיים • השוואת מבנים שניוניים • מיקוד ההסתכלות ברמה הגלובלית
הכללת מידע ניסיוני לכדי מודל • UCSC Genome Browser - http://genome.ucsc.edu/
עקרונות ההשוואה הגנומית קרבה אבולוציונית מכתיבה את רמת השימור • עקרונות מנחים: • ככל שמשהו רחוק יותר אבולוציונית הוא צפוי לצבור יותר שינויים • ככל שמשהו חשוב יותר, הוא ישתנה פחות • שינוי שתורם אדפטיבית לטובה צפוי להישמר בשל ברירה טבעית
עקרונות החלפה • כשיש לנו החלפה, הנטייה תהיה (ברמת החלבון): • יציבות התכונות • יציבות סטרית • השפעה של השכנים • נוכל למשקל סבירויות להחלפות שונות (מטריצות החלפה PAM, BLOSUM) • אובדן/רכישה יהיה בד"כ בכפולות של 3 (ברמת הנוקלאוטיד)
איך נשווה רצפים? • השוואה בין שני רצפים (allignment) • פרמטרים לבניית ציון: • Mismatch • Gaps (קנסות על פתיחה ועל הארכה) • השוואה גלובלית לעומת לוקאלית • השוואת חלבונים לעומת נוקלאוטידים
איך נשווה רצפים? • בקבוצת רצפים (MSA) • בניית פרופיל, בד"כ תוך השוואת זוגות • נחפש רצפים ותכונות שמורות לאורך כל הרצפים • תוכנות רלוונטיות • להשוואת זוג – Emboss, Lalign • להשוואת קבוצת רצפים – clustalW, PSI-BLAST, MUSCLE, T-Coffee.
הגדרות: • גנים הומולוגים: גנים שדומים זה לזה ברצף ובתפקיד • גנים אורתולוגים: גנים הומולוגים במינים שונים שמקורם מאב קדמון משותף • גנים פרלוגים: גנים הומולוגים באותו המין שמקורם מ – Gene Duplication
רקע לאורגניזם המינימלי • המיקרו-אורגניזמים הראשונים שפוענחו • הפרוייקט של ונטר (Mycoplasma laboratorium) • סדר גודל: • גנום אאוקריוטי רגיל 2,000-35,000 גנים • גנום פרוקריוטי רגיל 500-10,000 גנים. • אוטוטרופי מינימלי מוכר: A. Aeolicus <1,600 גנים • טפיל מינימלי מוכר: M. Genitalium 480 גנים • היעד של ונטר - 381 גנים • הכי מינימלי שהגיעו אליו בכוח – B. subtilis על מצע עשיר, 271 גנים M. genitalium
$$$ Craig Venter מה נעשה עם גנום מינימלי? • הבנה עמוקה יותר של תפקיד הגנים השונים ומקומם בתמונה הרחבה יותר של הגנום כולו. • תשתית לביצוע שינויים נקודתיים (לדעת במה לא לגעת...) • תשתית עתידית לייצור אורגניזמים חדשים ממש למטרות ייעודיות
השיטה הניסויית • הרעיון הבסיסי - נתחיל להרוס גנים ונראה מה קורה • המוטציות של Itaya • מוטציות ממוקדות • יתרונות • יודעים בוודאות שזה נדרש • חסרונות • השענות על כפילויות מובנות (redundancy, pathways) • כלים לא מדוייקים (שמשתפרים) • מצבים שונים • השפעות לוואי
חיתוך גנים ורצפים • הרעיון הבסיסי - ביצוע חיתוך בין הגנומים של יצורים שונים כדי למצוא מה משותף לכולם. • התחשבות בשיקולים אבולוציוניים (הומולוגים, אורתולוגים) • הבעיה עיקרית – מוכרים לנו רק 60 גנים שנמצאים בכל האורגניזמים • גורמים: • מוטציות • קו-אורתולוגים • NOGD
חיתוך תכונות • מצד שני – • אמורפיות ההגדרה • סביבת חיים • בשגרה - תנאי סביבת חיים שונים, אוטוטרופיות • בחירום – התמודדות עם מצבי עקה שונים • יתכן שפעם היו מערכות אחרות לדברים (מערכת חליפית לדוגמא המרכזית) • יכולות נוספות – תנועה? אופי ממברנה? • מה אורגניזם מינימלי צריך? • שרשרת הדוגמה הראשית: • שעתוק • תרגום (וקיפול), • שכפול (ותיקון) • בקרות על הקודמים (פקטורים) • מטבוליזם • התרבות – כלים לחלוקת התא • תחזוק הממברנה, ושימור היחסים משני צידיה • וכל אחת צריכה קצת מסתורין...
חיתוך רצפים ניסויי COG’s לסיכום • השיטות השונות • ניסויי • חיתוך רצפים • פונקציונאלי • אינסוף אפשרויות...
האב הקדמון האחרון The Last Universal common ancestor (LUCA) אבא!
מוצא האדם מן ה-LUCA • LUCA (Last universal common ancestor) - ממבט על ההווה והעתיד למבט על העבר, ומיצורים תיאורתיים ליצורים מוחשיים • האם בהכרח היה קיים? • למה הוא מעניין אותנו? • היכרות עם ההתחלה המשותפת של כל היצורים שחיים היום ("דע מאין באת") • היכרות עם הדרך לשם • היכרות עם כלל העץ שבו זרמה האבולוציה • פרמטרים ומידע לבניית מודלים להתפתחות בעתיד • הבנה טובה יותר של מקורן של תכונות שונות שעשויה לאפשר לנו לשפר/לשנות אותם.
מושגי יסוד • עצים פילוגנטיים • Species tree • Gene tree • אירועי יסוד (elementary events) • אנכיים: • הופעת גן (emergence) • אובדן גן (loss) • אופקי: • העברת גן (HGT – horizontal gene transfer)
עקרון הפרסימוני (parsimony) תמיד נבנה את העץ שדורש הכי פחות אירועי יסוד ליצירתו • an archaeal gene that is lost in only one lineage. • an archaeal gene that was apparently transferred to a single bacterial lineage by horizontal gene-transfer (HGT). The purple boxes indicate the presence of the given gene in the respective lineage; white circles indicate the point of emergence of the given gene (COG); blue circles indicate lineage-specific gene loss; the arrow in b indicates HGT; pink hexagons indicate gene losses that would need have to have occurred to explain the phyletic pattern of COG1636 if HGT was substantially less frequent than gene loss
בעיות בעקרון הפרסימוני • בעיות: • לא בהכרח נכון – לא תמיד הדבר הכי יפה ומינימלי קורה • יכולים להיות כמה כאלו - נדרשת בחירה נכונה של התכונות שיש למיין לפיהן • אין התחשבות בנתונים אחרים (לדוג' נתונים ג"ג) • יתכן שהיה אובדן של מספר גדול של גנים קדומים • קביעת היחס בין אירועי היסוד השונים
היחס בין אירועי היסוד השונים • הנוסחה המקובל: S = I + gh • S הוא הציון המוענק לעץ (רוצים ציון מינימלי) • I הוא מספר אירועי אובדן והוספה אנכיים • h הוא כמות המעברים האופקיים • g הוא המשקל של מעברים כאלו • המשמעות של >g<1 • המשמעות של g>>1
אז איך (אם בכלל) נראה LUCA? • השלכות הנוסחה • חי לפני 3.6-4.1 מיליארד שנים • כנראה ארכיאה • מורכב לעומת פשוט • המשמעות של פשוט בהקשר לאובדן מערכות קדומות
איך נבחר חיית מודל? • בעיית היסוד • חיה קרובה מידי דומה מידי ולכן לא נוכל להבחין בהבדלים. • חיה רחוקה מידי שונה מידי ולא נוכל לבצע את ההשוואה. • המודל הקלאסי – • ללכת על משהו באמצע - לקחת חיה מאותה משפחה, אך עם מרחק אבולוציוני בינוני. • במקרה של אדם, הדוג' הקלאסית היתה השוואה לעכבר (יונק, אך עם פער אבולוציוני של כ-75 מיליון שנה)
הבעיות במודל הקלאסי • הבעיות: • עדיין יהיה דימיון רב מידי באזורים רבים שיפגע ביכולתנו ללמוד על איזורים אלו. • אנחנו מאבדים את היכולת ללמוד דברים על תכונות שנרכשו לאחר הפיצול בין שני האורגניזמים. • לכן נעבור לבחירה ייעודית של מודל
השוואה לחיה רחוקה הרעיון הבסיסי - מחפשים דברים שנשארו דומים, שכנראה בעלי משמעות חשובה במיוחד. • מתי נתמקד בחיה כזו? • מערכות בסיסיות (שעתוק, תרגום) • אזורים שכל שינוי בהם לטאלי (רצפים עובריים) • איתור אזורים שמורים במיוחד שלא מוכרים עדיין • בעיות: • הבדלים בפונקציות פיזיולוגיות • מספר תכונות גדול שנוספו מאוחר יותר • המרחק גורר מוטציות רבות וסיכוי רב יותר לשינוי בדברים מרכזיים
השוואה לחיה קרובה הרעיון המרכזי – כאן נתמקד גם בדימיון ושימור, אך באותה המידה ואף יותר בהבדלים. • Phylogenetic shadowing • מתי נתמקד בחיה כזו? • תכונות שהופיעו בשלב מאוחר יחסית (LPA) • נסיונות להבין הבדלים בין אורגניזמים קרובים • חסרונות • מרבית הרצף דומה.
בין אדם לקוף • הבדלים מוכרים ברמה הגנומית: • במערכת החיסונית • במערכת הרבייה • יכולת ליצור צלילים מורכבים • יציבות גנומית • גודל הלסת, ושרירים בה • כנראה שתומכים בגודל מוח מוגדל
Why Fly? • Diversity
Why Fly? D. Melanogaster
Why Fly? • Knowledge
הערה • מחקר דומה נעשה בשמרים (Kellis et al 2003) • דגש שונה בעבודה עם זבובים?
מדדים חלבוניים (Protein Metrics) • With Your Powers Combined…
חיפוש אחר אקסונים • HMM: