Структура

Лаборатория кристаллографии макромолекул



Данные заметки содержат обзор работ, выполненных в ЛКМ ИМПБ РАН. Информация об исследованиях других авторов по данной тематике может быть найдена в указанных ниже оригинальных статьях.

Компьютерная обработка нуклеотидных последовательностей. Первые шаги.

(Н.Л.Лунина)

      В начале 70-х годов в мире начало возникать новое направление компьютерной биологии, связанное с обработкой нуклеотидных последовательностей. Исследователям стала доступна информация из Гейдельбергской базы данных, за рубежом начали выходить журналы, посвященные компьютерным подходам к изучению нуклеотидных последовательностей. В начале 80-х годов сотрудник НИВЦ АН СССР А.С.Кондрашов выступил с инициативой разработки и создания аналогичных компьютерных методов на базе имеющейся в НИВЦ вычислительной техники. Им был сформулирован первоначальный перечень требований, которым должна удовлетворять программа обработки таких последовательностей и по его предложению была разработана компьютерная система HEID, которая включала в себя функции поиска и отбора последовательностей в банке, а также различной обработки отобранного множества последовательностей.

      В процессе разработки комплекса проводились многочисленные обсуждения с сотрудниками ИБФМ В.В.Вельковым и В.М.Крюковым, а также с сотрудниками ИБ Л.А.Ворониным и А.В.Финкельштейном. В результате была создана компьютерная система HEID, которой сотрудники ИБФМ пользовались далее как для работы с последовательностями из банка, так и для обработки своих, только что полученных последовательностей.

      Система была написана для ЕС 1040, а затем перенесена на СМ-4, поскольку в ИБФМ для работы с последовательностями использовался именно этот компьютер. Описание системы HEID вышло в ОНТИ НЦБИ в 1984 г. С помощью системы HEID можно было определять статистические закономерности в распределении нуклеотидов, искать заданные участки, различного рода повторы, рестрикты и открытые рамки считывания, определять считываемые с последовательности белки и т.п. При определении статистических закономерностей рассчитывались плотности распределения нуклеотидов разного типа и пар нуклеотидов (пурины и пиримидины), строилась таблица ближайших соседей, подсчитывались сочетания по два и по три (как реальные, так и ожидаемые, чтобы видеть, где отличия реальных и ожидаемых наиболее сильны).

      Благодаря тесному сотрудничеству с биологами при разработке программ набор реализованных функций получился достаточно полным и удобным в использовании. Спустя некоторое время сотрудники ИБФМ признавались, что хотя у них и появились новые программы, предоставляющие больше разных режимов при поиске последовательностей в банке, однако, к сожалению, эти программы обеспечивают не все возможности обработки одной последовательности по сравнению с возможностями, реализованными в системе HEID.

      В последующие годы компьютерное изучение нуклеотидных последовательностей стало одним из основных направлений деятельности НИВЦ АН СССР (и в последствии ИМПБ РАН).

24 марта 2003

Публикации

Полные тексты публикаций


  1. Лунина Н.Л. "Система обработки нуклеотидных последовательностей HEID". (1984). Материалы по математическому обеспечению ЭВМ / ОНТИ НЦБИ АН СССР. Пущино.