Структура

Лаборатория кристаллографии макромолекул



Данные заметки содержат обзор работ, выполненных в ЛКМ ИМПБ РАН. Информация об исследованиях других авторов по данной тематике может быть найдена в указанных ниже оригинальных статьях.

Разработка Few Atom Model метода решения фазовой проблемы кристаллографии белка

(1994-1998)

      Разработка этого подхода велась в тесном сотрудничестве с Лабораторией биологических структур Института Генетики и Молекулярной и Клеточной Биологии (Страсбург, Франция; ответственный исполнитель - проф. А.Д.Поджарни). В рамках данного проекта была сделана попытка обобщить предложенный ранее подход к прямому решению фазовой проблемы при низком разрешении, основанный первоначально на использовании гистограмм синтезов Фурье [1], и включить в него новые типы дополнительной информации об исследуемом объекте.

      На первой стадии расшифровки структуры биологических макромолекул методом рентгеновского анализа делается попытка найти функцию ρ(x,y,z), описывающую распределение электронов в кристалле исследуемого объекта. Эта функция имеет периодичность по трем пространственным направлениям и может быть представлена в виде трехмерного ряда Фурье

(1)      

Комплексные коэффициенты F(h,k,l)exp[iφ(h,k,l)] этого ряда называются в кристаллографии структурными факторами, а вещественные величины F(h,k,l) и φ(h,k,l) - соответственно модулями и фазами структурных факторов. "Классический" рентгеновский эксперимент позволяет определять лишь значения модулей F(h,k,l) структурных факторов. Проблема восстановления значений фаз структурных факторов φ(h,k,l) (необходимых для расчета распределения ρ(x,y,z)) называется фазовой проблемой рентгеноструктурного анализа. Естественно, для решения этой проблемы должна быть привлечена какая-то дополнительная информация об исследуемом объекте. В том случае, когда в расчет распределения ρ(x,y,z) по приведенной формуле включены не все, а только часть слагаемых, говорят о расчете синтеза Фурье электронной плотности конечного разрешения. Разрешение синтеза Фурье определяется количеством слагаемых, используемых при расчете - чем больше слагаемых присутствует, тем выше разрешение синтеза, тем более тонкие детали структуры можно определить, анализируя этот синтез. Синтезы Фурье низкого разрешения рассчитываются по небольшому числу коэффициентов с минимальными значениями индексов. Они позволяют определить положение молекул в элементарной ячейке и их грубые очертания.

      Данный подход основывается на гипотезе о том, что при низком разрешении синтез Фурье электронной плотности может быть аппроксимирован небольшим числом "широких" гауссовых функций, которые могут быть проинтерпретированы, как вклады небольшого числа очень больших "псевдоатомов". Рассчитанные по такой псевдоатомной модели фазы структурных факторов могут служить при этом разумным приближением неизвестных значений фаз. Проблема состоит в адекватном выборе числа таких псевдоатомов и определении положений их центров.

      Каждой гипотетической псевдоатомной модели соответствуют рассчитанные по ней значения модулей и фаз структурных факторов. Степень совпадения рассчитанных и экспериментальных значений модулей могла бы служить критерием правдоподобности выбранных положений центров псевдоатомов. Соответственно задача определения координат псевдоатомов могла бы ставиться, например, как задача глобальной максимизации коэффициента корреляции рассчитанных и экспериментальных модулей. Однако такой подход сталкивается с двумя сложностями. Во-первых, даже при небольшом числе псевдоатомов перебор всех возможных положений их центров (при разумном выборе шага, с которым меняются координаты центра при переборе) становится чрезмерно трудоемкой задачей. Вторая, более существенная, сложность заключается в том, что, как было установлено в тестах, такая глобальная максимизация коэффициента корреляции модулей может с легкостью приводить к ложным решениям, не позволяющим воспроизвести правильные значения фаз.

      В качестве подхода, альтернативного глобальной максимизации, была предложена [3,4,8] процедура Монте-Карловского типа, в рамках которой:

  • генерируется случайным образом большое число псевдоатомных моделей, и для каждой из сгенерированных моделей рассчитываются соответствующие значения модулей и фаз структурных факторов;
  • те модели, для которых корреляция рассчитанных и экспериментальных модулей структурных факторов низка, отбрасываются; если корреляция достаточно высока, то соответствующий данной модели набор фаз объявляется "допустимым" и отбирается для дальнейшего анализа;
  • проводится кластерный анализ множества отобранных фазовых наборов - все наборы разбиваются на группы (кластеры) близких между собой;
  • внутри каждого из выделенных кластеров для каждого структурного фактора вычисляется усредненное значение фазы.

Наборы фаз, получившихся в результате усреднения в разных кластерах, представляют собой небольшое число альтернативных решений фазовой проблемы. Следует отметить, что важной особенностью используемых процедур кластеризации и усреднения является предварительное выравнивание карт распределения электронной плотности в соответствии с набором допустимых вариантов выбора начала координат и энантиомера [2,6].

      В ряде случаев кластерный анализ выявляет один доминирующий кластер, который и дает приближенное решение фазовой проблемы. В случае наличия нескольких кластеров возникает проблема выбора одного из них. В качестве одного из способов выбора оптимального кластера был разработан подход, базирующийся на концепции статистического правдоподобия [9]. Вкратце суть подхода может быть изложена следующим образом. Каждому альтернативному решению фазовой проблемы можно сопоставить синтез Фурье электронной плотности (рассчитанный с этими фазами и экспериментальными модулями), а вместе с ним - область в элементарной ячейке, отвечающую максимальным значениям этого синтеза. В случае правильных значений фаз эта область является областью, занятой атомами изучаемого объекта. В таком случае, генерируя случайно относительно большое число атомов с центрами внутри этой области и рассчитывая по ним значения модулей структурных факторов, мы с большой вероятностью получим значения, близкие к экспериментальным значениям. Если же область выбрана случайно (или на основе синтеза, рассчитанного с неправильными фазами), то вероятность воспроизведения правильных значений модулей при случайной генерации атомов будет ниже. Эта вероятность может быть практически оценена посредством компьютерной процедуры Монте-Карловского типа. Указанный подход к тестированию кластеров был далее развит до подхода к "ab-initio" решению фазовой проблемы путем максимизации правдоподобия.

      Разработанная методика была применена для решения фазовой проблемы при низком разрешении при исследовании рибосомальной частицы t50S [5,7,10,11,13] и при исследовании структуры частиц липопротеина низкой плотности [12].

      Основные результаты работы суммированы в диссертации Н.Л.Луниной [10,11].

24 марта 2003
В.Ю.Лунин

Публикации

Полные тексты публикаций


  1. Lunin, V.Yu., Urzhumtsev, A.G. & Skovoroda, T.A. (1990). "Direct low-resolution phasing from electron-density histograms in protein crystallography". Acta Cryst., A46, 540-544.

  2. Lunin, V.Yu. & Woolfson, M.M. (1993). "Mean Phase Error and the Map Correlation Coefficient". Acta Cryst. D49, 530-533.

  3. Lunin, V.Yu., Lunina, N.L., Petrova, T.E., Vernoslova, E.A., Urzhumtsev, A.G. & Podjarny, A.D. (1994). "On the ab-initio solution of the phase problem for macromolecules at very low resolution. The Few Atoms Model method". Joint CCP4 and ESF-EACBM Newsletter on Protein Crystallograph, 30, 37-44.

  4. Lunin, V.Yu., Lunina, N.L., Petrova, T.E., Vernoslova, E.A., Urzhumtsev, A.G., Podjarny, A.D. (1995). "On the ab-initio Solution of the Phase Problem for Macromolecules at Very Low Resolution: the Few Atoms Model Method". Acta Cryst., D51, 896-903.

  5. Volkmann, N., Schlunzen, F., Urzhumtsev, A.G., Vernoslova, E.A., Podjarny, A.D., Roth, M., Pebay-Peyroula , E., Berkovitch-Yellin, Z., Zaytzev-Bashan, A. & Yonath, A. (1995). "On ab-initio phasing of ribosomal particles at very low resolution". Joint CCP4 and ESF-EACBM Newsletter on Protein Crystallography, 31, 23-32.

  6. Lunin, V.Yu. & Lunina, N.L. (1996). "The Map Correlation Coefficient for Optimally Superposed Maps". Acta Cryst. A52, 365-368.

  7. Urzhumtsev, A.G., Vernoslova, E.A. & Podjarny, A.D. (1996). "Approaches to Very Low Resolution Phasing of the Ribosome 50S particle from Thermus thermophilus by the Few-Atoms-Models and Molecular-Replacement Methods". Acta Crys., D52,1092-1097.

  8. Podjarny, A.D., Urzhumtsev, A.G. & Lunin, V.Y. (1997). "Model based low resolution phasing". In Direct Methods for Solving Macromolecular Structures, ed. S.Fortier, NATO ASI Series C, Vol.507, 421-431.

  9. Lunin, V.Yu., Lunina, N.L., Petrova, T.E., Urzhumtsev A.G. & Podjarny A.D. (1998). "On the Ab initio solution of the Phase Problem for Macromolecules at Very Low Resolution. II. Generalized Likelihood Based Approach to Cluster Discrimination". Acta Cryst. D54, 726-734.

  10. Лунина Н.Л. (1998). "Вычислительные подходы к решению фазовой проблемы кристаллографии биополимеров при низком разрешении". Автореферат диссертации на соискание ученой степени кандидата физико-математических наук. ОНТИ ПНЦ РАН, Пущино.

  11. Лунина Н.Л. (1998). "Вычислительные подходы к решению фазовой проблемы кристаллографии биополимеров при низком разрешении". Диссертация на соискание ученой степени кандидата физико-математических наук, ИТЭБ РАН, Пущино.

  12. Lunin, V.Y., Lunina, N.L., Ritter, S., Frey, I., Berg, A., Diderichs, K., Podjarny, A.D., Urzhumtsev, A. & Baumstark M.W. (2001). "Low-resolution data analysis for low-density lipoprotein particle". Acta Cryst., D57, 108-121.

  13. Lunin, V.Y., Podjarny, A.D. & Urzhumtsev, A. (2001). "Low-resolution phasing in macromolecular crystallography". In : Advances in Structure Analysis, CSCA, Prague, Czech Republic, R.Kuzel & J.Hasek, eds., 4-36.