Алгоритмы в биоинформатике
Курс Хит- Computer Science
Биоинформатика — это быстро растущий раздел computer science, благодаря которому биология в 21 веке переходит из раздела наук о жизни в вычислительные науки. Биоинформатики исследуют специфические алгоритмы и методы анализа больших объёмов данных, работая преимущественно с геномными и белковыми последовательностями. Благодаря биоинформатике учёные смогли прочитать геном человека, создать искусственную бактерию и вылечить некоторые виды рака.
В курсе будут даны базовые определения из биоинформатики и молекулярной биологии, которые понадобятся для понимания дальнейшего материала. Будет дан широкий обзор разделов биоинформатики с упором на методы чтения генома, а также на алгоритмы сравнения строк и алгоритмы неточного поиска подпоследовательстей в больших текстах.
Для желающих глубже изучить материал будут даны алгоритмические задачи с автоматизированной проверкой.
Предварительных знаний в биологии и биоинформатике не требуется.
Предварительная программа:
- Введение в молекулярную биологию и биотехнологии.
- Расстояния между последовательностями, эволюционные расстояния, матрицы замен, глобальное и локальное выравнивание.
- Расстояния между последовательностями, эффективные алгоритмы попарного выравнивания, множественное выравнивание и эвристики.
- Алгоритмы поиска подстроки в тексте, суффиксное дерево и массив, построение сжатых индексов по геному, BWT.
- Поиск подстроки с ошибками, эвристические подходы, BLAST.
- Гены. Алгоритмы предсказывания генов, статистические подходы и подходы, основанные на сходстве.
- Чтение и сборка геномов. Исправление ошибок в данных.
- Сборка геномов, графовые алгоритмы в биоинформатике, графы де Брюйна.
- Вычислительная масс-спектрометрия, восстановление белков по спектру.
- Сравнительная геномика, геномные перестройки и нахождение блоков ситнетии.
- Молекулярная эволюция, алгоритмы кластеризации.
- Скрытые марковские модели в биоинформатике.
Страница курса на сайте Computer Science Center.