190 likes | 394 Views
Сравнительный анализ последовательностей ДНК. БиБи 4 курс Осень 2005. Идентификация генов. Новый геном = > нет обучающей выборки «Псевдообучение» Длинные открытые рамки считывания (ОРС) Открытые рамки, гомологичные известным генам «Самосогласование»
E N D
Сравнительный анализ последовательностей ДНК БиБи 4 курс Осень 2005
Идентификация генов • Новый геном => нет обучающей выборки • «Псевдообучение» • Длинные открытые рамки считывания (ОРС) • Открытые рамки, гомологичные известным генам • «Самосогласование» • Режем на фрагменты, делим на два кластера, обучаемся • Предсказываем • Переобучаемся • Etc. • Сравнение с родственными геномами • CRITICA: (пара) ОРС=ген, если сходство на уровне аминокислотных последовательностей выше, чем можно было бы ожидать для формальных транслятов при заданном уровне сходства нуклеотидных последовательностей
Эукариоты: сплайсированное выравнивание • Ген с известными гомологами (Procrustes, GeneWise) • Операция вставки интрона • Блочная модель • Использование сходства (BLAST) как дополнительного параметра (GenomeScan) • Отступление: динамическое программирование в задаче распознавания генов • Вершины – сайты, ребра – экзоны и интроны • Квадратичное количество ребер, линейное время оценки веса ребра • Вершины – сайты («рельсовый граф») • Линейное количество ребер • Ген без известных гомологов, но в двух геномах • Экзон-интронная структура в нуклеотидном выравнивании (Rosetta, SGP) • Геномное сплайсированное выравнивание (Pro-Gene – динамическое программирование, DoubleScan – HMM распознавание+выравнивание, SLAM).
Динамическое программирование Четвертая степень, если всякий раз выбирать оптимальный интрон, но внутри прямоугольника это делается один раз
Matching intergenic interval Match in exon Insertion in exon Match in exon Match in intron Insertion in intron Match in intron Match in exon Match in intron Match in exon Inserted intron Match in exon Matching intergenic region HMM (DoubleScan)
Регуляция транскрипции • Phylogenetic footprinting – прокариоты. MENTERIC, Gibbs samplers • Phylogenetic footprinting – эукариоты. rVISTA • Phylogenetic shadowing • Проверка соответствия (consistency check). Регулоги
Set of known sites Profile Consistency filtering: the basic procedure Genome 1 Genome 2 Genome N
Regulogger (W.Wasserman) Упражнение: чем это плохо?
микроРНК • ~22 нуклеотида • Комплементарны мРНК (неточно, 3’-конец – животные; точно, кодирующая область - растения) • Подавляют трансляцию или способствуют деградации мРНК (растения) • Предшественник – шпилька специального вида, длина ~70 нт. • Человек – минимум 800 (экспериментально > 200), дрозофила – 200, нематода – 100, растения – минимум сотня • Независимые гены (м.б. полицистронные) или в интронах • Регулируют минимум треть генов человека • В основном – гены развития?
Как искать • Экспериментально • Консервативность • В далекихгеномах • В близких геномах – shadowing • Наличие и консервативность мишеней (трудно, если в белок-кодирующей области) • Синтения, кластеризация генов • Кластеризация сайтов в мРНК-мишенях • Проверка функции