構造生物 Vol.2 No.2
1996年10月発行

ソルベントフラッターニングこの10年注1
Solvent Flattening since a Decade Ago


吾郷日出夫、宮野雅司

日本たばこ産業(株)医薬総合研究所

はじめに

 Solvent Flatteningの計算を当時のVAX-11/750/VMSではじめて計算したときから みるとその進歩は隔世の感がある。なんといってもその計算の速さであり、結果が30分 あまりで得られることである。そのうえ当時は結果もプロッターで各セクションごとを書 き出してはじめて見ることができた。そして、ついに3.0Å分解能で計算した結果は何日 しても戻ってこなかった。

 こう書いたのはセンチメンタリズムだけではなく、また単に時間短縮というだけではな く明らかにやり方の基本を変える質的変化があると感じているからだ。30分で結果が出 るということは、「とにかく計算をしてみて結果が良ければ使えばよい、さもなければ計 算結果を捨ててもう一度やればいいではないか。」ということが可能になる。これは、ま さに、"計算機実験"であり、要はきれいなよりトレースしやすい電子密度図が得られた ら実験結果が良かったので使うという程度で考えればいいし、そうでなければもう一度さ らに新たな方法を検討してみるということができる。

 コンピユーターが速くなり、ワープロに使うだけのパソコンでさえ、先にふれたちよう ど10年くらい前の当時としてはすごくいいわけでもないがまた決して悪い環境とはいえ ないVAX-11/750というコンピューターより少なくとも100倍は速く計算できる。そ のうえ、ソフトウェアの使いやすさとグラフィックスの進歩とあいまって結果がすぐ電子 密度図として表示して確認できる計算環境ではとにかく計算して見る。そして、うまくい ったら結果オーライ。だから、うまくいってもいかなくても気になった時に立ち止まって みて、"なぜよくなったのか"または"よくならなかったのか"を考えるのも一つの方法 ではないのか。解けた(解いた?)立体構造に興味があり、とりあえずなんとしても解き たいときに「使える手段」があれば使ってみて、それでとにかくうまく解けたらいいでは ないかと、タンパク質結晶構造解析を手段として利用したいとしている私の立場ではこの ようなアプローチのしかたは一つの解析の進め方であると個人的には信じている。ソルベ ントフラッターニングもそんな手段であるが、現在では例えばCCP4 program suiteの DMが使えれば、多くの機能があり単にソルベントフラッターニングだけをやろうとして もかえって難しい。複数の方法を組み合わせて位相改良を行うという意味でdensity modificationとかphase improvementといったより一般化した表現をしたほうが適切だ ろう。このように、これだけ多くの努力が払われてきたWangの方法と呼ばれるsolvent flatteningはまず、初期位相が得られた時点でそのまま問題なくモデルがくめるとき以外 はまず試してみる第一候補であると考えている。

とにかくやってみる。

 これが1985年のB.C.Wangによる"Resolution of Phase Ambiguity in Macromolecular Crystallography"が出て以来の10年あまりの結論でである。

 これ以降で、どうやればいいのか、そのときに何が重要なのか、そして、もしかしたら 本当によくなるのか、よくなるとしたらなぜなのかすこし考えてみたい。

とにかく計算するとき考えてみること

 いつソルベントフラッターニングを計算するか。

 MIR、MADなどでとりあえず初期位相が計算でき、フーリエ加算をして電子密度を書 いてみたときに、そのままでタンパク質のモデルフィッティングがすぐできてしまうと確 信できたとき以外であろうか。すでに書いたとおりとりあえず使えるプログラムがあれば マニユアルに従って、また運良く近くにすでに経験のある人がいればうまく働く入力ファ イルをもらって計算してみる。このことは今までに使ったことのないコンピューター(決 して知らない機種であるということばかりではない、単に一度も使ったこと無いという意 味であり、環境設定はコンピューターの管理者によって全く違うものであり、私の意見で は優秀なシステムマネジャーく今は多くが持ち主?>が管理しているシステムの方が最初 は難しいことが多い)で計算するときは相当の経験者でもいらぬストレスと時間の節約に なるだろうし、特に、コンピューターの環境設定に詳しくない人にとっては、なおさらで ある。とりあえず使えるプログラムがあればいい。不幸にして無いときには、いかにして 手間をかけずにお金も最小限で有効なプログラムを正式に手に入れるかはここではふれな いことにする。

このとき注意すべき点は、

  1. 得られた位相でまず計算してみる。
  2. このときのパラメーターはとりあえず、マニュアルに書いてあるデフォルト値を 使ってみる。
  3. 電子密度図を書いてみて分子の外形がよりはっきりして、今まで認識できなかっ たαヘリツクス、βシートなど2次構造が見えたらおめでとうございます。
  4. うまくいっていたらとりあえず、改良した(?)位相を使ってもう一度重原子デ ータとnativeデータの差フーリエ図を書いてみて位相計算したしたときに使った 重原子位置を確認してみる。またさらにマイナーサイトが無いか探してみる 町Wang1985)。もし、重原子位置に改良の余地があればまた重原子位置の精密化 をする。
  5. うまくいかないときは、 計算範囲を十分なphasing powerがある分解能までさげる。 低分解能側のデータはできるだけ極低分解能まで含める(Leslie1988, Urzhumtsev1991)。少なくとも15Åぐらいまでは含めたか。 複数の重原子データがある時は余りよくなさそうなものは初期位相計算から はずしてみる。一つだけが明らかにいい重原子データであるときはSlRAS位相で 計算を行う。このときFigure of Meritは見かけの上で悪くなるが気にしない。 溶媒領域の割合(Vsol)は計算値より10%ぐらいは低い値を使う。
  6. これでもダメであれば新たな気持ちで重原子誘導体サーチを再開する。

 これが理想的な処方などと主張するつもりはないが、まだ計算したことのない方に計算 をしてみるきかっけになれば幸いである。参考文献につけたとおり多くの方により、いろ いろな方法でWangの方法の改良努力が重ねられてきており、これ以外の広い意味での位 相改良ということでは、まず歴史的にはさらにさかのぼる非対称単位に複数の分子が存在 する時に適用可能なnon-crystallographic symmetry(NCS)molecular averaging (Bricogne1976)また、Histogram Matching(Harrison1988)などがすでに使われてき ている。また、実際のプログラムということではCCP4 program suiteにあるDMでは、 Wangのきわめて時間のかかるsolvent mask計算を演算子法を適用して実空間での空間 平均をconvolutionとみなすことで逆空間での単純なかけ算ですませ大幅に計算時間を節 約したLeslie(1988)による方法を利用したり、これらのNCS分子平均、Histogram matchingを一括して利用できようになっている。これを書いているいまは、DM( release1.6)にSolomon modeとして組み込まれたsolvent fliipping法がある仏brahams 1996)。Solomonはlocal standard deviation(LSD)を使ってより詳細な描写力があると いう新しいsolvent maskの自動生成とsolvent maskのmodel biasを低滅する方法であ るというsolvent flipping法が利用されている。DM、Solomonではモデルによるバイア スを減らすための工夫がなされており、phase combinationにもモデルの精度を考慮し たSigmaaの重みづけが使われている。Wangの方法がこれでいらなくなるわけではなく、 相補的なものと考えるといいようだ。実際、F1-ATPaseの構造解析ではWangの方法を 適用した後に、さらにSolomonのsolvent flippingによる位相改良をしたとしている 仏brahams1996)。本誌(構造生物vol1(2),55-69)に書かれているようにS.Iwataらに よるcytochrome c oxydaseの解析もこの方法がとられた(岩田想1995)。少し無責任にな ることを承知で書けば、これは、Wangの方法が収束半径がかなり大きく(Leslie 1988)、 通常solvent maskを生成させるときの平均する範囲は電子密度図の分解能の2.5から3倍 程度であり、一方LSDによるsolvent maskは電子密度を計算した分解能とほぼ同程度の 精度のsolvent maskを生成可能であると言う点とsolvent flippingとさらにSigmaa weightingを使うことと相まってmodel bias低減に成功していることによると思われる。 実際、Wangの方法では溶液中につきでたループなどは切れ切れになったり消滅する事が 方法的にさけられない。

 このSolomonがF1-ATPaseの構造決定の中で生まれたように新たな方法は、エポック メーキングな構造決定の中での生みの苦しみの中で生まれてくることが多いように感じて いる。また、MAGlCSQUASHの論文(Schuller1996)には最近の位相改良の方法を使っ たときの組み合わせよる位相改良の程度が詳しく出ているのでどんな方法があり、どんな 風に使われているかがよく分かる。

位相と位相表現とその組み合せ
phase,phase expression and phase combination

 「よし、とりあえずやってみればよい」というのもあまりにそっけないし、あまりにも 芸がないので少しだけ、実例にふれる前にあえて基礎となるようなことを考えてみた。す でに述べたように、solvent flatteningというのはphase improvementの一つであろう ということである。単結晶構造解析とは位相決定であるとはいくつかの教科書に書かれて いたが、実験的観測値である回折強度の組に対応する位相があれば一義的に電子密度図が 計算できる。Bricogne(1987)が"3つのNCSがあれば位相は一意的に決まるはずである が、ただそのphase restrainの数学的表現が知られていないだけである。"といったよ うにまだまだ位相情報の抽出というのは必ずしも自明ではないようだ。そこで位相とはな にかは今回の話題の外なのだがあえて位相情報はどこから得られるかを私流にまとめてみ た(Table 1)。

Centric reflectionでは原子位置が原点に対して対称となり位相が偶関数となる制限か らα±πにconstrainされる明白なものから、Heuristic based on the Mathematical Formulation of Physical Requirementなどとなにを意味しているかよくわからないと言 われそうなものまである。これを「直接法」と書いてもいいのであるが必ずしも具体的な 位相の由来が見えないのであえてこう書いた。それは、正解かどうか判断さえできれば観 測した解析強度の組に対応する毎回異なる位相の組を生成できる方法で正解が得られるま で繰り返せばよい。要するにチンパンジーにピアノを弾かせてバッハの名曲が奏でられる まで我慢をして聞き続ければよいというよりははるかに有効な位相有情法がまだまだ存在 かもしれないといいたいのである。

 では、solvent flatteningはどの辺にあるのか。やはり、モデルから来る位相であろう。 タンパク質結晶中には水が50%ぐらいは含まれる。そして水はブラウン運動で時間平均 されて均質な密度をもち、タンパク質部分より密度が低いに違いないという明確なモデル である。このことはモデルバイアスに注意が必要であるという当たり前の結論が導き出さ れる。

 位相表現で注意が必要なことは、電子密度計算に使われるbest phaseでは Hendrickson-Lattmanの位相表現に含まれていたphase probablity distributionの情報 が失われていることである。

では、実例で…

 実際にすでに解析ができて精密化の進んだ実例をMLPHAREの位相計算でDM (beta release1.0 version)を使ったソルベントフラッターニングをほんとんどデフォル トの値を使って再計算したものを示した。実際の解析はPhasesを使って解かれたもので あるがここでは同じデータでテスト計算と言うことでCCP4プログラムを使っている。参 考に、位相計算に使ったMLPHAREのMIR位相の電子密度図(Fig.1-Aと解かれたモデ ルで計算した位相の電子密度図(Fig.1-B1,B2)を低角データの分解能を変えて同じ範囲 で描いてある。DMによる位相改良を低角側の回折データの範囲が違う条件で3Å問での 全データを用いて始めて計算したもの(Fig.1-C1,C2)、低角データの分解能を変えた条 件で4Åまでの回折データから始めて3Åまで位相拡張した結果を示した(Fig.1-D1, D2)。いきなり3Åから計算を始めても、4Åから始めて3Åまで位相拡張したどちらの 結果でもほとんど同じ結果となっている。低角のデータをのぞいた計算では大幅に違う結 番が得られている。これらのすべての結果での計算サイクルにおける収束の度合いは統計 甲にはほとんど同じ値のところに収束している(Fig‐2)。もちろん、最初から3Åまでの データでDM計算をしたphase extensionなしの計算のほうがphase extensionしたもの よりずっと早く収束してはいる。DMの与える統計値がこれらの計算結果ではほぼ同じで あっても電子密度図にははっきりと差があることに注意が必要である。最後に、比較的良 好な重原子誘導体である水銀だけのSIRASで計算した結果を示した(Fig.1E)。

必ずしも、 MIR位相を初期位相とした場合よりいい電子密度図が得られたとはいえないものの、注意 アべき点は、MIRの結果を初期位相とした位相改良の場合には最終モデルで存在するルー プの電子密度がすっかり消えてしまっていたものがSIRASを初期位相として位相改良した 結果では不完全ながら電子密度が見られたことである。

 そこで、参考に、初期MIR位相でのFigure of Meritが0.9,0.7,0.5,0.3そして0.1とな った反射についてそれぞれ5 reflections(3 acentric reflection and 2 centric reflections)ずつ計25反射を任意に抽出し、それぞれで各FOMの段階におけるベスト 位相を表にした(Table2)。ここで、H-L位相のA,B,C,D項の大きさとFOMは明らかな 相関があり、だいたいは大きいH-L位相係数の反射がより大きなFOMを与えた。一番、 重要な点はDMの後でのFOM(Fom-dm)の値にはMIRでのFOM(Fom-MIR)とほとんど 相関がなかったことである。最終モデルから計算した位相(Phi-c)とのずれではSIRAS位 相が一番小さかった。そして、MIR位相ではSIRASで決まっていた位相が捨てられている ものがある。このことはどうしても一つだけの重原子誘導体しか得られないとき、あるい は、複数の重原子誘導体データがあっても一つの重原子誘導体だけがいいことがわかって

いる時にはSIRASで進めてみるという価値があるということかもしれない。参考にそれぞ れの反射でのHendrickson-Lattmanによるphase probability distributionをSIRAS, MIR位相についてグラフとしてみた(Fig.3)。これまで教科書から受けていたものと少し 違う印象を受けたのであえて載せることにした。これまでの印象では、SIRでは二つ山に なってASで両者のうちどちらか一つに選択されるというものであったがこの結晶では必 ずしもそのような反射は多くなくそのような例を2反射ほどやっと探せた(Fig.4)。

最後に

 こうした機会を与えられ、これまでの漠然とした理解とは必ずしも一致しないことがわかり、改めて考え直すよい契機となった。これは、自分自身にとってもよい機会であった。ただ、実際のパネルディスカッションの時にあったただ一つの重原子誘導体がみつかればすぐにソルベントフラッターニングをすれば解けるとはいうつもりはない。できるだけ多くの重原子誘導体探しをすべきは当然のことである。ただ、不幸にして複数のよい重原子誘導体が得られなくても一つが十分よい誘導体であれば解けることがあるといいたいのである。誤解なきように繰り返しておく。

 まとめるに当たり、B.C.WangのMethods Enzymol.の総説とJ.Drenthによる "Principles of Protein X-ray Crystanography"に多くを負っていることを付記する。 終わりに当たって、個人的にもお世話になったProfessor Wangに、また、Solomonを紹 介していただきながら結果をお見せすることができなかったことをご容赦願うという意味でも中川氏、特に位相確率分布については勝部先生の意見から示唆を受けたこと、そして今回の機会を与えて下さった畠、坂部両先生に感謝します。

References

reviews and textbooks

"Resolution of Phase Ambiguity in Macromolecular Crystallography" B. C. Wang, (1985) Methods Enzymol. 115, 90-112
"Phase Improvement" in "Principles of Protein X-ray Crystallography" by J. Drenth, (1994) Springer-Verlag (N.Y.)
"Methods and Prograrns for Direct-SpaceExploitation of Geomettric Redundancies" G. Bricogne, (1976) Acta Cryst. A32 , 832-847.
"A reciprocal-space method for calculating a molecular envelope using the algorithm for B. C. Wang." A. G. Leslie, (1988) Acta Cryst. A43 , 134-136.
"Phase Extension by Combined Entropy Maximization and Solvent Flattening" E. Prince (1988) Acta Cryst. A44 , 216-222.
"Histogram Specification as a Methods of Density Modification" R. Harrison (1988) J. Appl. Clyst. 21 , 949-952.
"Low-Resolution Phases: Influence on SIR Syntheses and Retrieval with Double- Step Filtration" A. G. Urzhumtsev (1991) Acta Cryst. A47 , 794-801.

recent references

"Entropy, likelihood and phase determination" C. W. Carter, (1995) Structure 3 , 147-150.
"Methods Usedes in the Structure Determination of Bovine Mitochondrial F1 ATPase" J. P. Abraharns and A. G. W. Leslie (1996) Acta Cryst. D52, 30-42.
"Phase Combination and Cross Validation in Iterated Density-Modification "MAGICSQUASH:More Versatile Non-Crystallographic Averaging with Multiple Constaints" D. J. Shuller Acta Cryst. D52, 425-434.
" Paracoccus denitrificans 由来チトクローム酸化酵素の2.8Å分解能のX線結晶構造解析" 岩田 想 (1995)構造生物1(2),55-69.


ご意見、ご要望などは下記のアドレスにメールを下さい。
sasaki@tara.met.nagoya-u.ac.jp