Влітку 2018 року під Петербургом пройшла щорічна літня школа з біоінформатики, на яку приїхали 100 студентів та аспірантів, щоб вивчити біоінформатику та дізнатися про її використання у різних галузях біології та медицини.
Головний фокус цієї школи був на дослідженнях раку, але були лекції з інших областей біоінформатики, починаючи від еволюції і закінчуючи аналізом даних одноклітинного секвенування. Протягом тижня хлопці вчилися працювати з даними секвенування нового покоління, програмували на Python та R, застосовували стандартні біоінформатичні тулуби та фреймворки, знайомилися з методами системної біології, популяційної генетики та моделюванням ліків щодо пухлин, та багато іншого.
Нижче ви знайдете відео 18 лекцій, прочитаних на школі, з коротким описом та слайдами. Помічені зірочкою «*» – досить базові, їх можна дивитися без попередньої підготовки.
1*. Онкогеноміка та персоналізована онкологія | Михайло П'ятницький, НДІ біомедичної хімії
Михайло коротко розповів про геноміку пухлин та про те, як розуміння еволюції ракових клітин дозволяє вирішувати практичні завдання онкології. Особливу увагу лектор приділив поясненню відмінності між онкогенами та онкосупресорами, методам пошуку «ракових генів» та виділення молекулярних підтипів пухлин. На закінчення Михайло приділив увагу майбутньому онкогеноміки та проблемам, які можуть виникнути.
2*. Генетична діагностика спадкових пухлинних синдромів Андрій Афанасьєв, yRisk
Андрій розповів про спадкові пухлинні синдроми та розібрав їхню біологію, епідеміологію та клінічні прояви. Частина лекції присвячена питанню генетичного тестування — кому потрібно його проходити, що для цього робиться, які складнощі виникають у обробці даних та інтерпретації результатів і, нарешті, яку користь це приносить пацієнтам та їхнім родичам.
3*. The Pan-Cancer Atlas | Герман Демідов, BIST/UPF
Незважаючи на десятиліття досліджень у галузі геноміки та епігеноміки раку, відповідь на питання «як, де і чому виникають пухлинні синдроми» досі не є повною. Однією з причин для цього є необхідність стандартизованого отримання та обробки величезної кількості даних з метою виявлення ефектів невеликої величини, які складно виявити в обмеженому наборі даних (а саме такий обсяг є типовим для дослідження в рамках однієї або кількох лабораторій), але які разом грають Велику роль такому складному і многофакторном захворюванні, як рак.
В останні кілька років безліч найсильніших дослідницьких груп світу, усвідомлюючи цю проблему, почали об'єднувати свої зусилля у спробах виявити та описати всі ці ефекти. Про одну з таких ініціатив (The PanCancer Atlas) та результати, отримані в рамках роботи цього консорціуму лабораторій та опубліковані у спецвипуску Cell Герман розповів у цій лекції.
4. ChIP-Seq у вивченні епігенетичних механізмів Олег Шпинов, JetBrains Research
Регуляція експресії генів здійснюється у різний спосіб. На своїй лекції Олег розповів про епігенетичну регуляцію шляхом модифікації гістонів, вивчення цих процесів методом ChIP-seq та способи аналізу отриманих результатів.
5. Мультіоміка у дослідженнях раку | Костянтин Окінцев, German Cancer Research Center
Розвиток експериментальних технологій у молекулярної біології дозволило поєднати у собі вивчення великого спектру функціональних процесів у клітинах, органах і навіть цілому організмі. Для встановлення зв'язків між компонентами біологічних процесів необхідно використовувати мультиоміку, в якій поєднуються масивні експериментальні дані геноміки, транскриптоміки, епігеноміки та протеоміки. Костянтин навів наочні приклади застосування мультиоміки в галузі досліджень ракових захворювань із фокусом на педіатричну онкологію.
6. Багатосторонність та обмеження аналізу одиночних клітин | Костянтин Оконечників
Докладніша лекція про РНК-секвенування одиночних клітин та методи аналізу цих даних, а також способи подолання явних та захованих проблем при їх вивченні.
7. Аналіз даних single-cell RNA-seq | Костянтин Зайцев, Washington University in St. Louis
Вступна лекція для секвенування поодиноких клітин. Костянтин обговорює методи секвенування, труднощі на етапах лабораторної роботи та біоінформатичного аналізу та способи їх подолання.
8. Діагностика м'язової дистрофії за допомогою нанопорного секвенування Павло Авдєєв, Університет Джорджа Вашингтона
Секвенування з використанням технології Oxford Nanopore має переваги, які можуть бути використані для виявлення генетичних причин захворювань, наприклад м'язової дистрофії. У своїй лекції Павло розповів про створення пайплайну для діагностування цього захворювання.
9*. Графове уявлення геному | Ілля Мінкін, Університет штату Пенсільванія
Графові моделі дозволяють компактно уявити велику кількість схожих послідовностей і часто використовуються в геноміці. Ілля докладно розповів про те, як за допомогою графів відновлюють геномні послідовності, як і навіщо використовують граф де Брюїна, наскільки такий «графовий» підхід збільшує точність пошуку мутацій, і які невирішені проблеми з використанням графів все ще залишаються.
10*. Цікава протеоміка | Павло Синіцин, Max Planck Institute of Biochemistry (2 частини)
Білки відповідальні за більшість біохімічних процесів у живому організмі, і поки що протеоміка — єдиний метод глобального аналізу стану тисяч білків одночасно. Спектр розв'язуваних завдань вражає – від ідентифікації антитіл та антигенів до визначення локалізації кількох тисяч білків. У своїх лекціях Павло розповів про ці та інші застосування протеоміки, нинішній її розвиток і підводні камені при аналізі даних.
11*. Основні принципи молекулярних симуляцій Павло Яковлєв, BIOCAD
Вступна теоретична лекція про молекулярну динаміку: навіщо вона потрібна, що робить і як використовується стосовно розробки лікарських препаратів. Павло приділив увагу методам молекулярної динаміки, поясненню молекулярних сил, опису зв'язків, поняттям «силове поле» та «інтегрування», обмеженням у моделюванні та багато іншого.
12*. Молекулярна біологія та генетика | Юрій Барбітов, Інститут біоінформатики
Введення в молекулярну біологію та генетику з трьох частин для студентів та випускників технічних спеціальностей. У першій лекції обговорюються поняття сучасної біології, питання структури геному та виникнення мутацій. Друга докладно висвітлює питання функціонування генів, процеси транскрипції та трансляції, третя – регуляцію експресії генів та основні молекулярно-біологічні методи.
13*. Принципи аналізу даних NGS Юрій Барбітов, Інститут біоінформатики
У лекції розповідається про методи секвенування другого покоління (NGS), їх типи та характеристики. Лектор докладно пояснює, як улаштовані дані «на виході» з секвенатора, як їх перетворять на аналіз і які є способи роботи з ними.
14*. Використання командного рядка, практика Геннадій Захаров, EPAM
Практичний огляд корисних команд у командному рядку Linux, опцій та основ їх використання. Приклади спрямовані на аналіз секвенованих ДНК послідовностей. Крім стандартних операцій Linux (наприклад, cat, grep, sed, awk) розглядаються утиліти до роботи з послідовностями (samtools, bedtools).
15*. Візуалізація даних для найменших | Микита Алексєєв, Університет ІТМО
Кожному доводилося ілюструвати результати своїх наукових проектів або розбиратися в чужих діаграмах, графіках та картинках. Микита розповів, як правильно інтерпретувати графіки та діаграми, виділяючи з них головне; як малювати зрозумілі картинки. Лектор також підкреслив, на що звертати увагу під час читання статті або перегляду рекламного ролика.
16 *. Кар'єра в біоінформатиці Вікторія Коржова, Max Planck Institute of Biochemistry
Вікторія розповіла про структуру академічної науки за кордоном та про те, на що необхідно звернути увагу, щоб, будучи студентом бакалаврату, магістратури чи аспірантом, побудувати кар'єру в науці чи індустрії.
17 *. Як вченому скласти CV Вікторія Коржова, Max Planck Institute of Biochemistry
Що залишити у CV, а що прибрати? Які факти будуть цікаві потенційному завлабу, а які краще не згадувати? Як розташовувати інформацію, щоб ваше резюме привернуло увагу? Лекція дасть відповіді на ці та інші питання.
18*. Як влаштований ринок біоінформатики Андрій Афанасьєв, yRisk
Як влаштований ринок та де працюватиме біоінформатику? Відповідь на це питання докладно, з прикладами та порадами, викладена у лекції Андрія.
Кінець
Як ви могли помітити, лекції на школі досить широкі за тематиками — від молекулярного моделювання та використання графів для збирання геному, до аналізу одиночних клітин та побудови наукової кар'єри. Ми в Інституті біоінформатики намагаємось включати до програми школи різноманітні теми, щоб охопити якнайбільше біоінформатичних дисциплін, і щоб кожен учасник дізнався для себе щось нове та корисне.
Наступна школа з біоінформатики пройде з 29 липня по 3 серпня 2019 року під Москвою.
Для тих, хто хоче поглиблено вивчити біоінформатику, продовжується прийом заявок на нашу
Для тих, хто не в Петербурзі чи Москві, але дуже хоче стати біоінформатиком – ми підготували
Ще у нас є десятки
У 2018 році літня школа з біоінформатики проводилася за підтримки наших постійних партнерів – компаній JetBrains, BIOCAD та EPAM, за що їм велике спасибі.
Всім біоінформатики!
PS Якщо вам здалося мало,
Джерело: habr.com