Профессор Алла Лапидус: «Биоинформатика бежит вперед такими темпами, что актуальное сегодня устареет уже завтра»

Открытие новых штаммов бактерий и вирусов; спасение древних артефактов; поиск полезных месторождений — это лишь малая часть того, с чем имеет дело биоинформатика. Словари определяют ее как «совокупность методов», но профессор Алла Лапидус, заместитель директора Центра алгоритмической биотехнологии СПбГУ и автор новой магистерской программы, настаивает: биоинформатика — наука.

Профессор Алла Лапидус: «Биоинформатика бежит вперед такими темпами, что актуальное сегодня устареет уже завтра» | ФОТО Романа ЕРШОВА

ФОТО Романа ЕРШОВА

— Алла Львовна, биоинформатика, если прочитать определение...

— Первоначальное определение биоинформатики как просто применение компьютеров в биологии давно устарело.

В топовых журналах Science и Nature все чаще появляются статьи с заголовками вроде «Открыты новые штаммы микроорганизмов», «... новое семейство вирусов». Вопрос: как их открыли? Ответ: не потратив ни копейки на лабораторные эксперименты, просто изучив данные, которые уже по нескольку лет лежали в открытом доступе.

И сделать такие открытия не могут ни математики, ни программисты, ни биологи. Математик и программист знают, как работать с большими объемами данных, но не знают биологии и не знают, что «спросить» у этих данных. Биолог знает, что спросить, но не умеет добыть ответ из этой массы данных. А биоинформатик умеет задать вопрос, знает какие методы применить и как интерпретировать результаты анализа.

Я, выступая перед теми же биологами, говорю: «Планируя эксперимент, надо мыслить биоинформатически». Как-то из зала прозвучало: «Ну спаси-и-ибо, будут биологов учить эксперименты ставить, хотя они это уже лет двести делают».

Да, верно. И в корне не верно. Новые технологии и новые методы накладывают новые требования на эксперимент. Так, если вы выделили ДНК, которая вся раздроблена, и применили не ту технологию — все, вы убили материал и рассчитывать на качественную сборку генома вам уже не приходится. И это только один из многих примеров.

— Можно пример, чтобы представить себе сложность работы со сборкой геномной ДНК?

— Представьте себе, что перед вами стопка коробок с одним и тем же набором пазлов, которые должны составить какую-то картинку. И вот все эти пазлы перемешали, а картинку унесли. У вас миллионы или миллиарды копий пазлов, какие-то из них порваны-погнуты, какие-то и вовсе потерялись, и в лучшем случае вы знаете, что надо собрать, допустим, пейзаж. Вот и собирайте...

Делать это «вручную» — давайте забудем сразу. Значит, нужен математический подход. Со временем меняются алгоритмы сборки, меняются программы-сборщики, но как бы великолепно ни работала модель «в компьютере», в реальном эксперименте всегда есть погрешность.

Я в биоинформатике, грубо говоря, с ее рождения. Я физик по образованию, при этом кандидатская степень у меня в молекулярной биологии. Работая в Америке, я создала группу, на тот момент первую в мире, которая занималась не только сборкой бактериальных геномов, но и доведением этой сборки до идеального состояния. Было время, когда геном уже можно было грубо собрать, скажем, за месяц, а на то, чтобы довести его до идеала, уходил год!

Сейчас уже другие технологии, но идеально восстановленных геномов все еще недостаточно. Это сложная задача. Проект «Геном человека» (международный проект, начатый в 1990 году. — Ред.), на который ушло много лет и миллиарды долларов, — завершен, но в геноме остаются «дырки». Сейчас целый консорциум поставил перед собой задачу их залатать.

— В СПбГУ открывается магистратура по биоинформатике. Говорят, какая-то особенная...

— Магистратур по биоинформатике в стране уже восемь-девять. В Петербурге первая была в Академическом университете, но предназначалась для программистов. У биологов не было шансов на нее поступить, потому что на экзамене была сплошная математика, довольно сложная.

В этом году в Университете ИТМО заработают две программы — одна «переехала» из Академического университета, а другая — новая, на английском языке. Есть хорошо зарекомендовавшая себя магистратура «Биоинформатика и системная биология» и в Политехническом университете.

Нельзя не упомянуть и петербургский Институт биоинформатики. Несмотря на то что магистратуры там не было и государственный диплом он еще не выдает, это одна из самых активных биоинформатических школ в городе и в стране, куда приходят биологи и математики, чтобы получить столь необходимые им знания.

Свою магистерскую программу я затеяла больше трех лет назад, а запускаем мы ее только сейчас. То, что получение официальных аккредитаций, согласований и прочее занимает очень много времени, печально всегда, но особенно в нашей области. Биоинформатика бежит вперед такими темпами, что актуальное сегодня устареет уже завтра.

— И как в таких условиях учить?

— Новое все равно базируется на какой-то основе, и в биоинформатике уже есть своя, условно, «таблица умножения», свои подходы, которые остаются, как бы значительно ни менялась технология. Мне хотелось бы давать это базовое представление. А уже потом, опираясь на базу, человек будет применять ее в той сфере, которую выберет.

— Какие это могут быть сферы?

— Горизонты расширяются с бешеной скоростью.

Например, нефтеразработка: изучение микробов, которые соотносятся с теми или иными месторождениями.

Или, например, откопали археологи некий артефакт: «Какое счастье, он в прекрасном состоянии!». А назавтра все цвета «поплыли», потому что микроорганизмы отреагировали на новые условия. Это можно было предотвратить: изучить пробы, понять, какой будет реакция...

Или возьмем медицину. На конференции коллега рассказывал, как микроорганизмы, взятые у здорового человека, пересадили больному и какой произошел прогресс в лечении. Но что мы понимаем под «здоровым человеком»? И можно ли, например, взять микроорганизм у жителя одной местности и пересадить жителю другой?

Наконец, пока еще мало привычная для биоинформатики область, которая по-английски называется Forensic, а по-русски — «судебно-медицинская экспертиза».

— Интересно, магистратура по биоинформатике больше привлечет математиков, программистов или биологов?

— Наша программа для людей и с биологическим «прошлым», и с математическим. Часть дисциплин будет общей, но биологам надо подтягивать математику и программирование, а математикам читать основы молекулярной биологии. Я бы хотела, чтобы ко второму семестру они выровнялись и дальше шли общим потоком.

Мне задают провокационный вопрос: «Как вы будете конкурировать с программами других вузов?». Я ни с кем конкурировать не буду. Пусть будут разные программы. Тем более что у нас одна общая проблема — нехватка специалистов, способных преподавать программирование, алгоритмы, биологические и разные другие важные науки с точки зрения биоинформатики. Это, кстати, стало одной из причин того, что мы начали создавать онлайн-курсы. В 2014 году выложили на Coursera (международная образовательная платформа. — Ред.) первый русскоязычный курс, сейчас их там два, второй можно найти также на Национальной платформе открытого образования и на Stepik. Всего запланировано пять курсов.

Мы однажды в лаборатории получили электронное письмо: «Здравствуйте, я прохожу ваш онлайн-курс, но у моего компьютера не хватает мощности довести все до конца». Ну, думаем, пишет усердный иногородний магистрант... Читаем дальше: «Я ученица 9-го класса, и мне пока не по карману мощный компьютер. Можно ли воспользоваться привилегией того, что я живу в Петербурге, и доделать задание на ваших машинах?».

Мы отвечаем: «Да!». Приходит: тоненькая маленькая девочка, «воробей». Села за компьютер, сосредоточенно тюкает по клавишам. Я потом спрашиваю: «Отчего такая заинтересованность?». Она: «Я хочу быть хирургом. И теперь я знаю, чего мне не хватает для того, чтобы стать очень хорошим хирургом».

Думаю: надо же, девятый класс! Да уже ради такого и стоило все это затевать!

#биология #биоинформатика #интервью

Материал опубликован в газете «Санкт-Петербургские ведомости» № 174 (6273) от 20.09.2018 под заголовком «Мыслить биоинформатически».


Комментарии