Лаборатория кристаллографии макромолекул
Данные заметки содержат обзор работ, выполненных в ЛКМ ИМПБ
РАН. Информация об исследованиях других авторов по данной тематике может быть
найдена в указанных ниже оригинальных статьях.
Компьютерная обработка нуклеотидных последовательностей. Первые шаги.
(Н.Л.Лунина)
В начале 70-х годов в мире начало возникать новое направление компьютерной
биологии, связанное с обработкой нуклеотидных последовательностей.
Исследователям стала доступна информация из Гейдельбергской базы данных, за
рубежом начали выходить журналы, посвященные компьютерным подходам к изучению
нуклеотидных последовательностей. В начале 80-х годов сотрудник НИВЦ АН СССР
А.С.Кондрашов выступил с инициативой разработки и создания аналогичных
компьютерных методов на базе имеющейся в НИВЦ вычислительной техники. Им был
сформулирован первоначальный перечень требований, которым должна удовлетворять
программа обработки таких последовательностей и по его предложению была
разработана компьютерная система HEID, которая включала в себя функции поиска и
отбора последовательностей в банке, а также различной обработки отобранного
множества последовательностей.
В процессе разработки комплекса проводились многочисленные обсуждения с
сотрудниками ИБФМ В.В.Вельковым и В.М.Крюковым, а также с сотрудниками ИБ
Л.А.Ворониным и А.В.Финкельштейном. В результате была создана компьютерная
система HEID, которой сотрудники ИБФМ пользовались далее как для работы с
последовательностями из банка, так и для обработки своих, только что полученных
последовательностей.
Система была написана для ЕС 1040, а затем перенесена на СМ-4, поскольку в ИБФМ
для работы с последовательностями использовался именно этот компьютер. Описание
системы HEID вышло в ОНТИ НЦБИ в 1984 г. С помощью системы HEID можно было
определять статистические закономерности в распределении нуклеотидов, искать
заданные участки, различного рода повторы, рестрикты и открытые рамки
считывания, определять считываемые с последовательности белки и т.п. При
определении статистических закономерностей рассчитывались плотности
распределения нуклеотидов разного типа и пар нуклеотидов (пурины и пиримидины),
строилась таблица ближайших соседей, подсчитывались сочетания по два и по три
(как реальные, так и ожидаемые, чтобы видеть, где отличия реальных и ожидаемых
наиболее сильны).
Благодаря тесному сотрудничеству с биологами при разработке программ набор
реализованных функций получился достаточно полным и удобным в использовании.
Спустя некоторое время сотрудники ИБФМ признавались, что хотя у них и появились
новые программы, предоставляющие больше разных режимов при поиске
последовательностей в банке, однако, к сожалению, эти программы обеспечивают не
все возможности обработки одной последовательности по сравнению с возможностями,
реализованными в системе HEID.
В последующие годы компьютерное изучение нуклеотидных последовательностей стало
одним из основных направлений деятельности НИВЦ АН СССР (и в последствии ИМПБ
РАН).
24 марта 2003
Публикации
Полные тексты публикаций
- Лунина Н.Л. "Система обработки нуклеотидных последовательностей HEID". (1984).
Материалы по математическому обеспечению ЭВМ / ОНТИ НЦБИ АН СССР. Пущино.
|