130 likes | 308 Views
Выполнил: Ромашкин Амир, 445 гр. Руководитель: Профессор АФТУ, Порозов Юрий. Нахождение ориджинов в последовательности нуклеотидов. Основные понятия. ДНК – последовательность нуклеотидов(сиквенс): А, G, C, T Репликация – процесс синтеза дочерней молекулы ДНК
E N D
Выполнил: Ромашкин Амир, 445 гр. Руководитель: Профессор АФТУ, Порозов Юрий Нахождение ориджинов впоследовательностинуклеотидов
Основные понятия • ДНК – последовательность нуклеотидов(сиквенс): А, G, C, T • Репликация – процесс синтеза дочерней молекулы ДНК • Ориджины(ORI) – место(<50 нуклеотидов) начала репликации.
Мотивация • Есть гипотезы о влиянии некоторых факторов на положение ORI • Знания о положении ориджинов позволят: • Регенерировать клетки и управлять ростом организмов • Найти ключи к понимаю лечения рака • Современные экспериментальные методы трудоемки, затратны, неточны • Нет реальных вычислительных методов!
Гипотеза: Факторы • Температура плавления(Tm) • CpG-острова(CpG) • Палиндромы(Pal) • Геометрические • факторы(Banana) • Факторы транскрипций(Tfs)
Цели работы • Изучить проблему нахождения ORI • Сформулировать варианты решения • Написать приложение для упрощение анализа сиквенсов на наличие факторов • Уметь удобно получать сиквенсы и вычислять все факторы • Исследовать зависимость ORI от факторов • Попробовать с “хорошей” вероятностью определять, есть ли в последовательности ориджин
Используемые технологии • Python, BioPython lib. • .Net, Neurodotnet lib.
Проблемы • Нетронутость проблемной области • Нет доказанных теорий • Все с нуля • Неоднозначность факторов • Неясная интерпретация • Гипотетичность темы
Обучение нейронной сети • Двумя способами: • Количественно, на весь сиквенс • количество Cpg-островов, средняя темп. плавления, количество палиндромов и тд • По окнам размером в 30 нуклеотидов • Cpg, палиндромы, транскр.: сумма 3х минимальных расстояний до факторов. • Темп. плавления, геом. факторы: среднее значение на окне.
Результаты(1\2)Практический вклад • Сформирована база для дальнейшего исследования • Был написано приложение, которое позволяет: • Получить последовательности • Вычислить все 5 факторов • Вручную: Темп. плавления, Транскрипции • Используя eMboss: остальные • Посмотреть результаты вычисления факторов • Посмотреть сосредоточение факторов в сиквенсе в виде графиков • В нем реализована нейронная сеть, которая обучалась 2 вариантами: • Факторы на сиквенс • Факторы по окнам(30 нукл.) • Результаты обоих вариантов неудовлетворительны.
Результаты(2\2)Теоретический вклад • Известные “сильные” ORI-содержащие сиквенсы не отличаются от обычных по количеству или сосредоточению факторов => эти факторы слабо определяют, либо вовсе не определяют ORI
Контакты • Email: my.name.is.amirk@gmail.com • Skype: berezovaya_brunka Спасибо за внимание!