Актуальность научных исследований в области медицины неоднократно подчеркивалась на различных уровнях, включая международные организации, такие как ВОЗ, правительственные и даже предпринимательские круги. По-прежнему лидирующее положение в списке наиболее сложных и неотложных прикладных задач здравоохранения занимает проблема раковых заболеваний. В мире сложилось несколько направлений исследований как в поиске новых методов лечения, так и способов диагностики этого опасного заболевания. Широкое международное и междисциплинарное сотрудничество с привлечением возможностей информационных технологий вселяет оптимизм и надежду на то, что человечество получит не только надежные средства лечения и диагностики, но и разгадает природу рака.
В последние годы ученые Института систем информатики им. А. П. Ершова СО РАН в сотрудничестве с Институтом Сен-Лорен (США) и другими научными лабораториями США и Франции подключились к такого рода исследованиям. Обнадеживающие результаты были недавно представлены в июльском номере журнала Genome Biology за текущий год. Учёные заявили об открытии важной роли значительной части ДНК в развитии раковых заболеваний. Речь идёт о так называемой «тёмной материи», зачастую игнорируемой научным сообществом. В результате проведенных совместных исследований установлено, что привлекшие внимание учёных участки в геноме, кодирующие так называемые влинкРНК (vlincRNA, very long intergenic, non-coding RNAs), активируемые элементами ретро-вирусов, участвуют в биологии стволовых клеток и в развитии рака. Важно то, что искусственное подавление этих влинкРНК молекул приводит к гибели (апоптозу) раковых клеток.
В результате прочтения генома человека в 2003 г., стремительного развития технологии секвенирования (определения последовательности нуклеотидов в молекулах РНК и ДНК) и других лабораторных методов в мировых биологических базах накопилось огромное количество информации о геноме и о его работе в различных условиях. Понимание того, как живая клетка выполняет программу, заложенную в неё посредством ДНК, вероятно, даст ключ к лечению многих заболеваний.
В Лаборатории моделирования сложных систем ИСИ СО РАН под руководством к.ф.-м.н. Фёдора Александровича Мурзина предложена образная концепция живой клетки-компьютера. Клетка, по мнению учёных, обрабатывает потоки информации по известным и неизвестным алгоритмам. Такая аналогия позволяет плотнее применить богатые знания сотрудников ИСИ в создании искусственных информационных систем для анализа живых информационных систем. Для подтверждения теоретической концепции установлена связь с экспериментаторами, которые обеспечивают аналитиков свежими данными и проверяют в лаборатории результаты расчётов, полученные на основе математических моделей. Начиная с 2011 г., а неформально с 2007 г., партнером ИСИ стал Институт Сен-Лорен, обладающий сильной экспериментальной базой и опытом в геномных исследованиях.
Институт Сен-Лорен — некоммерческий центр исследования проблем системной биологии болезней — специализируется на инновационных подходах к пониманию молекулярно-генетических механизмов хронических заболеваний. Институт основан в 2005 г. Джорджем Сен-Лореном младшим, одним из первоначальных членов правления проекта по расшифровке человеческого генома Целера и Джорджем Сен-Лореном Третьим, опытным молекулярным биологом и неврологом. Исследовательская активность Института глобальна и включает в себя проекты в России, Индии, Колумбии, Бразилии, Китае и США. Институт Сен-Лорен поддерживает тесное сотрудничество с академическим сообществом.
Институт Сен-Лорен использует высокопроизводительные технологии, такие как одномолекулярное секвенирование транскриптома (без амплификации РНК) и эпигенетическое секвенирование ДНК для выявления путей межмолекулярного взаимодействия, нарушение которых угрожает здоровью и повышает риск заболевания при старении. Большинство технологий секвенирования (прочтения нуклеотидной последовательности ДНК или РНК) искусственно амплифицируют (размножают) молекулы, что в результате выражается в погрешности при измерении изначального их количества в клетке. Данная погрешность переносится на измерение активности участков ДНК, которые являются «шаблоном» для производства молекул РНК (совокупность произведенных молекул РНК в клетке называется «транскриптомом»). Технология HelicosTM, используемая Институтом Сен-Лорен, может секвенировать по одной молекуле РНК, не требуя искусственного её размножения, что уменьшает погрешность при дальнейшем анализе.
Исследование части ДНК, не кодирующей белок и соответствующих ей молекул некодирующих РНК, является изначально заложенным стратегическим направлением Института Сен-Лорен. До 98 % ДНК человека называют «мусорной» ДНК или «тёмной материей», поскольку она напрямую не участвует в кодировании белка. На протяжении многих лет «тёмная материя» не привлекала достаточного внимания учёных, которые сомневались в её важной роли при формировании человека и его здоровья. Филипп Капранов (Philipp Kapranov), ведущий исследователь Института Сен-Лорен, был одним из первых, кто показал широкомасштабный синтез некодирующих РНК в человеческих клетках в одной из своих публикаций в журнале Science ещё в 2002 г. Несмотря на это многие учёные до сих пор сомневаются в биологической значимости «тёмной материи», и понятие «мусорная» ДНК ещё не вышло из оборота. Для того чтобы разобраться в этих важных вопросах требуется применение новейших экспериментальных и вычислительных технологий.
Благодаря применению технологии одномолекулярного секвенирования для точного измерения уровня активности каждого участка человеческого генома исследователи Института Сен-Лорен получают более четкое понимание генной регуляции. Технология дает возможность выявления терапевтических мишеней для лечения и диагностики заболеваний. Данный подход выявил, что не менее 10 % ДНК из класса «тёмной материи» являются вовсе не «мусорной», а принимают активное участие в работе стволовых и раковых клеток. Статистический анализ, опубликованный в вышеназванном номере журнала Genome Biology, приводит к выводу, что данные участки ДНК (кодирующие влинкРНК) активируются элементами ретро-вирусов, встроившихся в наш геном в процессе эволюции.
По мнению Филиппа Капранова, изучение этой прежде игнорируемой части человеческого генома, установление её роли в развитии человека и при заболеваниях в случае нарушений, открывает новый рубеж в науке с важными приложениями в медицине. Дальнейшее исследование механизмов функционирования влинкРНК является предпосылкой для высокоточных диагностических тестов и направленному лечению рака.
Роль Института систем информатики в сотрудничестве с Институтом Сен-Лорен заключается в математическом и вычислительном обеспечении экспериментов, формулировке математических задач и гипотез, анализе разрабатываемых моделей. Сотрудничество развивается в рамках проекта «Механика обработки информации в живых клетках», где ИСИ исследует механизмы передачи информации через сигнальные мотивы и пространственную структуру РНК. Совместная работа с экспериментаторами, обладающими самыми современными технологиями, весьма положительно сказывается на результатах исследований коллектива ИСИ. Это позволяет на практике совершенствовать навыки в области высокопроизводительных параллельных вычислений для обработки и хранения большого объёма формализованных научных данных.
Данные секвенирования нового поколения из США продолжают поступать в ИСИ и возвращаться обратно экспериментаторам в виде новых биологических знаний. За период сотрудничества в ИСИ было обработано более трёх терабайт «сырых» данных секвенирования РНК и ДНК человека, мыши, крысы и мухи. Результаты международного сотрудничества ученых опубликованы и приняты в печать в 2012-2013 гг. в таких известных молекулярным биологам и генетикам изданиях, как BMC Genomics, Molecular Genetics and Genomics, Methods, Genome Biology, Nature Structural & Molecular Biology.
Дмитрий Штокало, научный сотрудник, куратор проекта в ИСИ СО РАН