Skip to content

Latest commit

 

History

History
320 lines (225 loc) · 32.4 KB

index.md

File metadata and controls

320 lines (225 loc) · 32.4 KB

To GitHub

Molecular Modeling and Simulations (HSE) (Fall 2024)

Contact information

Meetings and Location

  • Classroom:

1 модуль: 10.09,17.09,24.09,1.10,8.10 - R611 15.10 - R612 22.10 - D210

2 модуль: 5.11 - D507 12.11,19.11,26.11,3.12,10.12,17.12 - D210

  • Lectures-Seminars: Fridays 18:10-21:00

Course Description

The course provides an overview of molecular modeling and simulations methods in biology with an emphasis on 3D modeling of biomolecular structures. Covered topics include: viewing and analyzing PDB structures, structural bioinformatics, molecular dynamics simulations, Monte-Carlo simulations, coarse-grained modeling, molecular screening, docking, integrative modeling, quantum chemistry calculations, protein structure prediction, protein design, application of AI methods from protein design and prediction. The course includes both lectures, hands-on exercises, and home assignments.

Learning objectives

  • To understand:
    • the principle of molecular modeling techniques in biology.
    • the spectrum of molecular modeling and simulation methods and their applicability.
    • the relation between the experimental data and structural models.
  • To be able to:
    • visualize and analyze PDB-structure files.
    • run basic MD simulations.
    • do comparative protein modeling and use protein structure prediction tools.
    • use protein design tools
    • run basic docking simulations.
    • run basic quantum chemistry simulations.

Textbooks and learning resources

  • H.-D. Höltje et al. Molecular Modeling: Basic Principles and Applications, 3rd Edition English, Russian
  • J. Gu, Ph. Bourne. Structural Bioinformatics, 2nd Edition English
  • D.C. Young Computational Chemistry: A Practical Guide for Applying Techniques to Real World Problems Link
  • D. Frenkel, B. Smit Understanding Molecular Simulation: From Algorithms to Applications, 2nd Edition Link
  • B. Rupp "Biomolecular Crystallography: Principles, Practice, and Application to Structural Biology" Link
  • J. Rigden "From Protein Structure to Function with Bioinformatics" English, Russian
  • A.R. Khokhlov, A.L. Rabinovich, V.A. Ivanov. Computer modeling methods in polymer and biopolymer research. Russian only
  • K.V. Shaitan, K.B. Tereshkina. Molecular dynamics simulations of proteins and peptides. Russian only
  • Gromacs manual

Required resources

  1. Laptop or workstation with access to internet.
  2. Pymol installed locally on your workstation/laptop.
  3. UCSF Chimera installed locally on your workstation/laptop.
  4. VMD installed locally on your workstation/laptop.
  5. Avogadro installed locally on your workstation/laptop.
  6. Gromacs installed locally.

Course calendar

  • Dates: 10.09,17.09,24.09,1.10,8.10,15.10,22.10 (midterm test),5.11,12.11,19.11,26.11,3.12,10.12,17.12 (final test)

Attendance policy

  • Attending lectures and seminars is strongly encouraged.

Course program (in Russian)

Модуль 1. Introduction and orientation (1 неделя)

Лекция 1 Вводная лекция. История, виды и основы методов биомолекулярного моделирования. Понятия молекулярного моделирования, имитационного моделирования, интегративного моделирования. История развития методов молекулярной динамики, методов Монте-Карло. Подходы к созданию моделей структур по экспериментальным данным. Различные методы и границы их применимости. Понятия ab initio и in silico. Современные пакеты для молекулярного моделирования. Современные пакеты для визуализации PDB структур. Суперкомпьютеры в молекулярном моделировании.

Слайды лекции. Запись лекции.

Семинар 1 Оргвопросы. Использование ЭВМ и доступ к ним, установка, настройка программ и сред Использование ОС Линукс, установка и компиляция программ. Использование репозиториев, GitHub. Установка и использование программ визуализации структур.
Suggested reading
- John Kendrew and myoglobin: Protein structure determination in the 1950s
- A brief history of macromolecular crystallography, illustrated by a family tree and its Nobel fruits
- Metropolis, N. The Beginnig of the Monte Carlo Method
- Э.Э. Шноль. "А.Г. Гривцов и молекулярная динамика - начало"
Additional reading - An Introduction to Biological NMR Spectroscopy

Модуль 2. Структурная биоинформатика (4 недели).

Лекция 2 Форматы хранения информации о структуре молекул (PDB, mmCIF, mol2, Z-матрицы и др.). Формат PDB, поля формата. Происхождение структурной информации, основные экспериментальные методы, представление данных. Основы методов РСА, ЯМР, криоЭМ. Элементарная ячейка кристалла, асиметричная единица, понятие BioAssembly, кристаллографическая и некристаллографическая симметрии структур. PDB: B-факторы, occupancy. PDB: специфика ЯМР структур. Правила описания белков, нуклеиновых кислот, липидов, лигандов. Тяжелоатомные и протонированные модели. Протонирование моделей. Базы данных структур. Базы PDB, NDB, MMDB, CCDC, EMDB. Поиск в базах данных, поиск по последовательности и по структуре. Форматы записи электронной плотности. Типичные проблемы в структурах, ротамеры боковых цепей. Определение качества PDB структур. Программы анализа качества структур.

Слайды лекции.

Suggested reading - Introduction to PDB Data
Additional reading - PDB format description
Семинар 2 Визуализация 3D-структур. Обзор различных программ (Pymol, Chimera, VMD, Maestro, CND3D, Coot). Программа Pymol. Загрузка структур. Выделение цепей, фрагментов последовательности. Различные представления. Построение поверхностей. Наложение структур. Протонирование моделей. Создание видео. Визуализация конформационных перестроек. Раскраска структуры по B-фактору и другим параметрам. Сравнение структуры с электронной плотностью. Автоматизация в виде скриптов.
Описание и протокол семинара.
Самостоятельная работа 1 см. описание семинара
Лекция 3 Продолжение лекции 2. Методы ЯМР. КриоЭМ. Особенности структур, полученных этими методами. Различные биомолекулы и их представление в PDB.

Слайды лекции.

Семинар 3 Работа в программе Chimera
Протокол семинара.
Самостоятельная работа 2 см. описание семинара
Suggested reading/watching - Kurt Wutrich on NMR
- CryoEM
Additional reading - History of spectroscopy
Лекция 4-5 Анализ и сравнительный анализ 3D-структур. Виды визуализации структур, стерео-представление, ray-tracing. Определение вторичной структуры. Карты Рамачандрана. Поверхность доступная растворителю. Водородные связи. Карты контактов. Структурные выравнивания и среднеквадратичное отклонение. Идентификация структурных доменов. Базы данных CDD и PFAM. Структурная классификация доменов (SCOP, CATH). Идентификация полостей и сайтов связывания. Электростатический и гидрофобный потенциалы. Определение состояний протонирования. Анализ симметрии. Анализ динамики, нормальные моды. Оценка свободной энергии сворачивания. Определение мультимеров.

Слайды лекции.

Семинар 4-5 Анализ и сравнительный анализ 3D-структур. Работа с библиотекой MDAnalysis. Расчет растояний, углов, контактов. Расчет RMSD. Стркутурное выравнивание. Работа в программе Chimera. Структурные выранивания, струкутрное выравнивание последовательностей. Добавление водородов, программа REDUCE. Добавление зарядов, PDB2PQR. Рассчет pK, PROPKA. Расчет электростатического потенциала, APBS. Поиск водородных связей. Библиотека Prody. Анализ нормальных мод. Поиск родственных структур, определение консервативных остатков, визуализация.
Протокол семинара.
Самостоятельная работа 4 см. описание семинара
Suggested reading - D. Eisenberg, The discovery of the α-helix and β-sheet, the principal structural features of proteins
- J.S. Richardson, The Anatomy and Taxonomy of Protein Structure

Модуль 3. Методы молекулярной механики и динамики (4 недели).

Лекция 6-7 Теоретические основы методов молекулярной механики и динамики. Задание моделей молекул. Молекулярно-механические модели, границы применимости. Основы классической механики: материальные точки, законы Ньютона, силы, энергия, Гамильтониан, обобщенные переменные, координаты реакции. Методы минимизации энергии. Уравнения движения. Траектории движения частиц, фазовое пространство. Численные подходы к решению уравнений движения. Алгоритмы Эйлера, Верле, Лип-Фрог. Неустойчивость траектроий и хаос. Обратимость по времени уравнений движения. Типы взаимодействий в молекулярных системах. Понятие силового поля и топологии молекулы. Единицы длины, времени, энергии. Основные типы взаимодействий: валентные, невалентные взаимодействия, связи, валентные, торсионные, ложноторсионные углы, потенциал Леннард-Джонса, заряды. Проблема учета электростатических взаимодействий. Силовые поля класса II. Поляризуемые силовые поля. Модели воды. Неявный растворитель. Основы статистической физики: распределение Больцмана-Гиббса, понятие энтропии, второй закон термодинамики. Парадокс обратимости. Гипотеза эргодичности. Понятие термодинамического ансамбля. Понятие свободной энергии, работы. Профили свободной энергии, потенциал средней силы. Неравновесные процессы. Равенство Джарзинского.

Слайды лекции.

Семинар 6-7 Подготовка и запуск МД расчетов в Gromacs Протокол семинара.
Самостоятельная работа 6 см. описание семинара
Suggested reading - M. Karplus History of molecular dynamics
Лекция 8 Алгоритмы и методы молекулярной динамики. Общая схема постановки молекулярно-динамического расчета. Подготовка, минимизация и релакасация системы. Выбор шага интегрирования. Периодические граничные условия. Радиусы обрезания. Суммы Эвальда и методы учета электростатических взаимодействий. Списки соседей. Ограничения на длины связей. Термостатирование и баростатирование системы. Броуновская динамика, динамика Ланжевена. Параллельные вычисления. Декомпозиция области. Суперкомпьютерные параллельные технологии в молекулярном моделировании. Использование графических процессоров.

Слайды лекции.

Suggested reading - стр. 38 - 55. Диссертация "Интегративное моделирование структуры и динамики биомакромолекулярных комплексов"
- Hollingsworth et al. Molecular Dynamics Simulation for All"
Семинар 8 Анализ расчетов в MDAnalysis. Протокол семинара.
Самостоятельная работа 8 см. описание семинара
Лекция 9 Дизайн и анализ молекулярно-динамических экспериментов. Методы Монте-Карло. Вариации методов МД Выбор стартового состояния. Выбор набора систем для сравнительного моделирования. Выбор силового поля. Выбор времени моделирования и количества моделирумых систем. Методы работы с траекториями. Выход на равновесие. Иерархия динамических веремен. Анализ средних, флуктуаций, статистической достоверности. Автокорреляционные функции. Связь корреляции и диффузии. Энтальпия взаимодействия, теплоемкость. Функции радиального распределения. Анализ RMSD, d-RMSD. Кластерный анализ. Сетевой анализ. Анализ на основе марковских моделей. Добавление внешних воздействий. Примеры результатов моделирования различных систем (фолдинг белков, диффузия лигандов в белках, биомембраны, ионные каналы, ДНК-белковые комплексы). Транспортные коэффициенты. Анализ главных компонент. Методы понижения размерности. Применение нейросетей. Методы Монте-Карло. Методы марковских цепей Монте-Карло (Markov chain Monte-Carlo). Критерий Метрополиса-Хастингса. Методы улучшения возмжоностей статистических выборок (enhanced sampling techniques). Вычислительный отжиг (simulated annealing). Методы обмена репликами (Replica Exchange, Parallel tempering.). Метод зонтичной выборки (umbrella sampling, WHAM). Метод адаптивной семщающей силы (ABF, adaptive biasing force). Различные виды коллективных переменных. Метод управляемой МД (steered MD). Адиабатически смещенная МД (adiabatic bias MD). Метод метадинамики. Метод ускоренной МД (accelerated MD). Методы расчета свободной энергии. Примеры оценки термодинамических параметров и профилей свободной энергии. Огрубленное моделирование. Мультимасштабное моделирование. Слайды лекции.
Suggested reading - Руководство к программе Amber, рекомендации по силовым полям, раздел II.3 стр. 33-65
- Chen et al. Enhancing sampling with free-energy calculations"
Семинар 9 Using PLUMED for enhanced sampling. Протокол семинара.
Самостоятельная работа 9 см. описание семинара

Модуль 4. Предсказание структуры белков (1 неделя).

Лекция 6 Методы предсказания структры белков. Моделирование по гомологии. Создание выравнивания. Оценка качества модели. Детекция фолда. Протягивание. Скрытые марковские модели. Нейросети. Физические методы моделирования и предсказания. Слайды лекции. Видеозапись.
Семинар 6 Знакомство с программами Modeller, AlphaFold и Swiss-Model. Знакомство с программами Modeller и Swiss-Model. Построение структурных моделей по гомологии с известными структурами. Знакомство с программой AlphaFold и построение структурных моделей с её помощью. Протокол семинара.
Самостоятельная работа 5 см. описание семинара
Suggested reading - Mini-review: before and after AlphaFold2
- A structural biology community assessment of AlphaFold2 applications
Additional reading - Разбор Алгоритов Альфа Фолд на Харбре AS IS

Модуль 5. Виртуальный скрининг и докинг (1 неделя).

Лекция 11 Методы виртуального скирининга и докинга. Медицинская химия и рациональный дизайн лекарств. Хиты и лидерные соединения. Хранение информации о химических соединениях. Меры сходства химических соединений. Коэффициент Танимото. Базы данных химических соединений. Понятие о QSAR методах, расчеты ADMET cвойств. Виды виртуального скрининга. Фармакофоры и фармакофорный поиск. Молекулярный докинг: общая постановка задачи, определения и основные подходы. Учёт конформационной подвижности лиганда и рецептора. Алгоритмы поиска поз. Межмолекулярные взаимодействия и функции оценки энергии связывания. Использование молекулярного докинга для аннотации функции белка. Макромолекулярный докинг - его отличия от докинга низкомолекулярных соединений. Белок-пептидный докинг. Примеры программ и веб-сервисов для выполнения молекулярного докинга.

Слайды лекции. Слайды лекции. В.Н. Новоселецкого 2021 год

Suggested reading - Руководство к программе Autodock
Семинар 11 Знакомство с программами SwissDock и AutoDock Vina Протокол семинара.

----- Окончание курса ------

Assessment

Оценка по курсу кумулятивная.

  • Промежуточная контрольная работа - 40% оценки
  • Финальная контрольная работа - 40%
  • Экзамен - 20% Каждый оценочный элемент содержит стандартную часть, которая оценивается по 8 бальной шкале и часть повышенной сложности, которая позволяет получить дополнительные два балла (для оценок 9 и 10).

Домашние работы

  • Не влияют на оценку за курс, но помогут лучше подготовиться к контрольным работам и экзамену.
  • Работы можно загружать по по ссылке единым файлом (doc, pdf, zip). Имя файла: Asgmt_Number_Surname_Initials. Например, Asgmt_2_Petrov_AV.pdf

Промежуточная контрольная работа

Промежуточная контрольная работа состоит из двух частей:теоретической и практической. Теоретическая - содержит стандартную часть по материалам лекций и семинаров (оценивается от 0 до 8) и часть повышенной сложности – вопросы на основе списка литературы, предложенного к прочтению для данной лекции (suggested reading) (оценивается в два дополнительных балла). Проводится очно. Практическая - содержит практические задания по материалам семинаров и домашних работ обычной (оцениваются от 0 до 8) и повышенной (оцениваются в два дополнительных балла) сложности. На выполнение работы дается неделя.

Финальная контрольная работа или экзамен

Аналогично промежуточной контрольной работе, может содержать задания по всей программе курса.

Экзамен

Устный экзамен состоит из стандартной части (любые вопросы по материалам лекций, оценивается от 0 до 8 баллов) и части повышенной сложности – вопросы на основе списка литературы, предложенного к прочтению для лекций (suggested reading) (оценивается в два дополнительных балла). Вопросы повышенной сложности задаются, если слушатель ответил на все вопросы стандартной части на оценку 8. Слушателям желающим получить оценку 9 или 10 за весь курс необходимо сдать устный экзамен.

Политика в отношении экзамена автомата

Слушатели, набравшие определенный средний балл за промежуточную контрольную и финальную контрольную работу, могут получить данный балл в качестве “автомата” без необходимости сдавать устный экзамен (округление производится по стандартным правилам 3.5=4 3.49=3). Данный балл не может быть больше 8. Желающие получить балл более 8 должны сдавать устный экзамен.