非対称単位(asymmetric unit)は結晶構造の最も小さな部分で、対称操作を行うことにより完全な単位セル(結晶繰り返し単位)を作る出すことができます。対称操作は生物学的高分子の結晶では最も一般的なものは回転(rotation)、平行移動(translation)、らせん軸(回転と平行移動の組み合わせ)である。
非対称単位に対し結晶学的対称操作を行うと1つの単位セルが生成される。この単位セルを三次元方向に平行移動すると完全な結晶全体の構造が得られる。
以下に簡単な例を示します。2回対称の結晶学的対称軸(黒い卵形)をおおよその中心として、非対称単位(緑の上向き矢印)を180°回転すると2つ目の複製構造(紫色の下向き矢印)ができます。単位セルはこの2つの矢印で構成されます。次の単位セルを3方向に繰り返し並行移動すると三次元的結晶ができます。
非対称単位には結晶構造中で変換から生成できない最低限必要な位置情報のみが含まれています。結晶学者は実験データから冗長な部分を取り除いて必要最低限の座標情報のみを構造に登録するのに用います。必ずしも生物学的に機能する集合体全体の座標情報の記述する必要はないのです。
結晶非対称単位に含まれるものには、以下のパターンがあります。
非対称単位の内容は、結晶化された分子の位置と単位セル内での配置に依存します。結晶化条件と局所パッキングにより、下記2つのパターンがありえます。
Hemoglobin, a molecule with four protein chains (two alpha-beta dimers), provides good examples from PDB entries for each of these cases: 4つの蛋白質鎖(2つのα-β二量体)を持つヘモグロビンは、この各場合を示す良い例です。
非対称単位が1個の生物学的集合体を含む場合 | 非対称単位が生物学的集合体の一部を含む場合 | 非対称単位が複数の生物学的集合体を含む場合 |
---|---|---|
PDBエントリー 2hhb は非対称単位の中に1つのヘモグロビン分子(4つの鎖)を含みます。 | PDBエントリー 1hho は非対称単位の中にヘモグロビン分子の半分(2つの鎖)を含みます。 | PDBエントリー 1hv4 は非対称単位の中に2つのヘモグロビン(8つの鎖)を含みます。 |
生物学的集合体(biological assembly)は生物学的単位(biological unit)とも呼ばれ、分子が実際に機能すると示されたか、あるいはそうであると考えられている高分子集合体のことを指します。例えば、ヘモグロビンが実際機能する状態のものは4つの鎖で構成されています。
操作内容は個々の結晶構造に依存しますが、完全な生物学的集合体の構造を得るには、回転、平行移動、あるいはその組み合わせで構成される対称操作を実行する必要があります。また、登録された座標の一部だけを選択して生物学的集合体が得られる場合もあります。つまり生物学的集合体を作るには次のような場合があります。
上記3つの場合について、ヘモグロビンを例にして示すと次のようになります。
生物学的集合体が1個の非対称単位からできている場合 | 生物学的集合体が複数個の非対称単位からできている場合 | 1個の非対称単位に複数の生物学的集合体が含まれる場合 |
---|---|---|
PDBエントリー 2hhb の場合、生物学的集合体と非対称単位は同一です。 | PDBエントリー 1hho の場合、1つの生物学的集合体には2つの非対称単位が含まれています。 | PDBエントリー 1hv4 の場合、生物学的集合体は非対称単位の半分です。 |
操作は必要ありません。 | 生物学的集合体を作るには、結晶学的対称操作(結晶学的2回対称軸を中心として180°回転)が必要です。 | このエントリーには構造的に似ているが完全に同一ではない生物学的集合体が2つ含まれています。 |
生物学的集合体は複数の鎖で構成されているとは限りません。
PDBエントリー 7dfr は単量体で、生物学的集合体も1本の鎖しか含まれていません。 |
分子は「クリスタルパッキング」(crystal packing)という現象により、本来複合体を形成しない単位同士が結晶内では複合体を形成しているように見えることがあります。これは、溶液中でも複合体を形成しているという証拠がないか、あるいは生物学的に関連がないもの同士が複合体を形成していると考えられるものです。各エントリーをPDBに登録する際、埋もれた部分の表面積と相互作用エネルギーから考え得る集合体全てが計算されます。これら予想された集合体は、著者が生物学的に関連のある集合体であると考えた集合体と一致する場合もそうでない場合もあります。各エントリーには生物学的集合体について「著者から提供された」情報と、「ソフトウェアによって決定された」情報の両方が記載されています。
例えば、PDBエントリー 3fadのT4リゾチーム(T4 lysozyme)の構造には、非対称単位の中に1本の鎖が含まれています。通常、リゾチームは単量体として機能します。このエントリーでは「著者が提示した」生物学的集合体も「ソフトウェアによって決定された」生物学的集合体も単量体です。クリスタルパッキングによる、埋もれた表面の表面積と相互作用エネルギーに基づき、ソフトウェア(PISA1)はこの特徴的な変異体/結晶型 T4リゾチームは二量体を形成するだろうと予測しました。PDBエントリー 3fad で定義されている集合体は以下の通りです。
非対称単位(単量体) | 著者およびソフトウェアによる生物学的集合体(単量体) | ソフトウェアによる生物学的集合体(二量体) |
---|---|---|
非対称単位は単量体です。この座標が登録されています。 | 「著者が提示した」生物学的集合体および「ソフトウェアによって決定された」生物学的集合体はどちらも単量体です。 | PISAというソフトウェアは、この分子が二量体を形成すると予測しました。そのため、2つ目の生物学的集合体は「ソフトウェアによって決定された」もののみです。 |
RCSBのウェブファイルダウンロードオプションで、さまざまなバージョンの生物学的集合体に「A」(著者が提示したもの)か「S」(ソフトウェアで決定したもの)かが記されています。
ウイルスカプシド(viral capsid)の結晶構造には、結晶の非対称単位の一部しか含まれていないことがよくあります。このようなエントリーの場合、結晶学的非対称単位を生成するには非結晶学的対称操作を登録された座標に対し適用する必要があります。
二十面体のウイルスカプシドには複雑な対称性があり、1つの中心点で交差する5回、3回、2回対称回転によって得られた60個の等価な位置を持っています。二十面体ウイルスカプシドの登録された座標のほとんどは、二十面体の非対称単位を構成する独特の鎖と非対称単位を生成するための非結晶学的対称操作群で構成されています。生物学的集合体や結晶学的単位セルを生成するには追加の結晶学的対称操作が必要になるでしょう。以下に示すのは、PDBエントリー 1qqp に登録されている、二十面体ウイルスの結晶構造のさまざまな集合体です。
二十面体非対称単位 | 結晶非対称単位 | 生物学的集合体 | 結晶学的単位セル |
---|---|---|---|
登録されている座標は1個の二十面体非対称単位です。この単位は全体をリボン表現で表示しています。 | 結晶非対称単位は五量体です。 | 生物学的集合体は二十面体の形状をしています。 | 完全な結晶単位セルには2つの二十面体ウイルス粒子が含まれています。 |
PDBに登録されているウイルスカプシドは、結晶構造だけではなく、電子顕微鏡、線維回折、固体NMRで決定された構造も含まれています。正規点(regular point)またはらせん対称による集合体のPDBエントリーは全て、繰り返し単位の座標が含まれていて、生物学的集合体を得るには然るべき結晶学的または非結晶学的対称操作が必要となります。
非対称単位 | 生物学的集合体 | |
---|---|---|
例えば、PDBエントリー 1ql2 に登録されている、糸状バクテリオファージPF1の線維回折構造では、非対称単位には3つのらせんが含まれ、一方生物学的集合体にはらせん状のウイルス全体で、らせん状の回転と移動を示す変換を行うことにより生成される。 |
mmCIFフォーマットファイルでは、「pdbx_struct_assembly」カテゴリと「pdbx_struct_oper_list」カテゴリに各生物学的集合体を作るための具体的情報が記載されています。「pdbx_struct_assembly」には各構造の生物学的集合体の生成に関することが、「pdbx_struct_oper_list」には生物学的集合体の生成に必要な変換規則が記されています。著者が記した特定の生物学的集合体に関する注釈は「struct_biol」カテゴリに記載されています。
---mmCIF _pdbx_struct_assembly.id 1 _pdbx_struct_assembly.details author_and_software_defined_assembly _pdbx_struct_assembly.method_details PISA # ---PDBML <PDBx:pdbx_struct_assemblyCategory> <PDBx:pdbx_struct_assembly id="1"> <PDBx:details>author_and_software_defined_assembly</PDBx:details> <PDBx:method_details>PISA</PDBx:method_details> <PDBx:oligomeric_count>2</PDBx:oligomeric_count> <PDBx:oligomeric_details>dimeric</PDBx:oligomeric_details> </PDBx:pdbx_struct_assembly> </PDBx:pdbx_struct_assemblyCategory>
---mmCIF _pdbx_struct_assembly_gen.assembly_id 1 _pdbx_struct_assembly_gen.oper_expression 1,2 _pdbx_struct_assembly_gen.asym_id_list A,B,C,D,E,F,G,H # ---PDBML <PDBx:pdbx_struct_assembly_genCategory> <PDBx:pdbx_struct_assembly_gen assembly_id="1" asym_id_list="A,B,C,D,E,F,G,H" oper_expression="1,2"/> </PDBx:pdbx_struct_assembly_genCategory>
---mmCIF loop_ _pdbx_struct_assembly_prop.biol_id _pdbx_struct_assembly_prop.type _pdbx_struct_assembly_prop.value _pdbx_struct_assembly_prop.details 1 'ABSA (A^2)' 3840 ? 1 'SSA (A^2)' 19310 ? 1 MORE -132.9 ? # ---PDBML <PDBx:pdbx_struct_assembly_propCategory> <PDBx:pdbx_struct_assembly_prop biol_id="1" type="ABSA (A^2)"> <PDBx:details xsi:nil="true" /> <PDBx:value>3840</PDBx:value> </PDBx:pdbx_struct_assembly_prop> <PDBx:pdbx_struct_assembly_prop biol_id="1" type="SSA (A^2)"> <PDBx:details xsi:nil="true" /> <PDBx:value>19310</PDBx:value> </PDBx:pdbx_struct_assembly_prop> <PDBx:pdbx_struct_assembly_prop biol_id="1" type="MORE"> <PDBx:details xsi:nil="true" /> <PDBx:value>-132.9</PDBx:value> </PDBx:pdbx_struct_assembly_prop> </PDBx:pdbx_struct_assembly_propCategory>
---mmCIF loop_ _pdbx_struct_oper_list.id _pdbx_struct_oper_list.type _pdbx_struct_oper_list.name _pdbx_struct_oper_list.matrix[1][1] _pdbx_struct_oper_list.matrix[1][2] _pdbx_struct_oper_list.matrix[1][3] _pdbx_struct_oper_list.vector[1] _pdbx_struct_oper_list.matrix[2][1] _pdbx_struct_oper_list.matrix[2][2] _pdbx_struct_oper_list.matrix[2][3] _pdbx_struct_oper_list.vector[2] _pdbx_struct_oper_list.matrix[3][1] _pdbx_struct_oper_list.matrix[3][2] _pdbx_struct_oper_list.matrix[3][3] _pdbx_struct_oper_list.vector[3] 1 'identity operation' 1_555 1.0000000000 0.0000000000 0.0000000000 0.0000000000 0.0000000000 1.0000000000 0.0000000000 0.0000000000 0.0000000000 0.0000000000 1.0000000000 0.0000000000 2 'crystal symmetry operation' 4_565 1.0000000000 0.0000000000 0.0000000000 0.0000000000 0.0000000000 -1.0000000000 0.0000000000 106.3440000000 0.0000000000 0.0000000000 -1.0000000000 0.0000000000 ---PDBML <PDBx:pdbx_struct_oper_listCategory> <PDBx:pdbx_struct_oper_list id="1"> <-- 1個目は恒等操作(動かさない)--> <PDBx:matrix11>1.0000000000</PDBx:matrix11> <PDBx:matrix12>0.0000000000</PDBx:matrix12> <PDBx:matrix13>0.0000000000</PDBx:matrix13> <PDBx:matrix21>0.0000000000</PDBx:matrix21> <PDBx:matrix22>1.0000000000</PDBx:matrix22> <PDBx:matrix23>0.0000000000</PDBx:matrix23> <PDBx:matrix31>0.0000000000</PDBx:matrix31> <PDBx:matrix32>0.0000000000</PDBx:matrix32> <PDBx:matrix33>1.0000000000</PDBx:matrix33> <PDBx:name>1_555</PDBx:name> <PDBx:symmetry_operation>x,y,z</PDBx:symmetry_operation> <PDBx:type>identity operation</PDBx:type> <PDBx:vector1>0.0000000000</PDBx:vector1> <PDBx:vector2>0.0000000000</PDBx:vector2> <PDBx:vector3>0.0000000000</PDBx:vector3> </PDBx:pdbx_struct_oper_list> <PDBx:pdbx_struct_oper_list id="2"> <-- 2個目はy, zの符合反転後、1単位(106.344)y方向へ平行移動--> <PDBx:matrix11>1.0000000000</PDBx:matrix11> <PDBx:matrix12>0.0000000000</PDBx:matrix12> <PDBx:matrix13>0.0000000000</PDBx:matrix13> <PDBx:matrix21>0.0000000000</PDBx:matrix21> <PDBx:matrix22>-1.0000000000</PDBx:matrix22> <PDBx:matrix23>0.0000000000</PDBx:matrix23> <PDBx:matrix31>0.0000000000</PDBx:matrix31> <PDBx:matrix32>0.0000000000</PDBx:matrix32> <PDBx:matrix33>-1.0000000000</PDBx:matrix33> <PDBx:name>4_565</PDBx:name> <PDBx:symmetry_operation>x,-y+1,-z</PDBx:symmetry_operation> <PDBx:type>crystal symmetry operation</PDBx:type> <PDBx:vector1>0.0000000000</PDBx:vector1> <PDBx:vector2>106.3440000000</PDBx:vector2> <PDBx:vector3>0.0000000000</PDBx:vector3> </PDBx:pdbx_struct_oper_list> </PDBx:pdbx_struct_oper_listCategory>
pdbx_struct_oper_list カテゴリの type にある「1_555」などの値は結晶学での略記法で、アンダースコアの前の数値は対称操作の種類(例:1番→恒等操作、4番→結晶対称操作)を、後の3桁の数値は必要な平行移動を示しています。対称操作はmmCIFの定義やPDBMLスキーマで定義され、平行移動は3つの単位セルの軸(a、b、c)方向の移動量で指定されます。5 は平行移動しないことを、これより大きい数値は正方向への移動、小さい数値は負方向への移動を示します。例えば、4_565 は 4番の対称移動が b の正方向に1単位セル分平行移動する内容であることを示しています。
ウイルスや非結晶学的対称性を持つ複合体の場合、生物学的集合体はより複雑で、多くの部分集合体で構成される場合もあります。pdbx_struct_assembly には考え得る全ての部分集合体が記載され、その集合体の生成方法は pdbx_struct_assembly_gen に記されます。pdbx_struct_oper_list カテゴリでは登録されている座標データから生物学的集合体を生成するのに必要な変換行列(結晶学的な操作もそうでない操作も共に)が列挙されています。ここには次の行列も含まれます。「P」は登録された座標から標準点枠?(standard point frame)への変換を、「X0」は登録された座標から結晶枠?(crystal frame2)へ移動させるのに必要な変換を含みます。つまり、登録された座標はこれらの変換により標準点や結晶枠へ移動させることができるのです。
「pdbx_struct_legacy_oper_list」のデータカテゴリは全てのウイルスで使われ、PDBフォーマットファイルの REMARK 350 に記される BIOMT を生成するための行列が記載されます。「struct_oper_list」に記された集合体の定義の場合(例:PDBエントリー 1m4x)、複数の変換を順番に適用していく必要がありますが、「pdbx_struct_legacy_oper」の場合、それぞれの変換は直接登録された座標に対して適用する最終的な変換が記されています。以下に示すmmCIF/PDBMLの内容は全て、5番から58番の変換行列が省略されています。また、非結晶学的対称(non-crystallographic symmetry、NCS)の対称操作は「struct_ncs_oper」カテゴリに記載してあります。
---mmCIF _pdbx_point_symmetry.entry_id 2BFU _pdbx_point_symmetry.Schoenflies_symbol I # --PDBML <PDBx:pdbx_point_symmetryCategory> <PDBx:pdbx_point_symmetry entry_id="2BFU"> <PDBx:Schoenflies_symbol>I</PDBx:Schoenflies_symbol> </PDBx:pdbx_point_symmetry> </PDBx:pdbx_point_symmetryCategory>
---mmCIF loop_ _pdbx_struct_oper_list.id _pdbx_struct_oper_list.type _pdbx_struct_oper_list.matrix[1][1] _pdbx_struct_oper_list.matrix[1][2] _pdbx_struct_oper_list.matrix[1][3] _pdbx_struct_oper_list.vector[1] _pdbx_struct_oper_list.matrix[2][1] _pdbx_struct_oper_list.matrix[2][2] _pdbx_struct_oper_list.matrix[2][3] _pdbx_struct_oper_list.vector[2] _pdbx_struct_oper_list.matrix[3][1] _pdbx_struct_oper_list.matrix[3][2] _pdbx_struct_oper_list.matrix[3][3] _pdbx_struct_oper_list.vector[3] P 'transform to point frame' 0.30901699 -0.80901699 0.50000000 0.00000 0.80901699 0.50000000 0.30901699 -0.00000 -0.50000000 0.30901699 0.80901699 0.00000 X0 'transform to crystal frame' 1.00000000 0.00000000 0.00000000 0.00000 0.00000000 1.00000000 0.00000000 0.00000 0.00000000 0.00000000 1.00000000 0.00000 1 'point symmetry operation' 1.00000000 0.00000000 0.00000000 0.00000 0.00000000 1.00000000 0.00000000 0.00000 0.00000000 0.00000000 1.00000000 0.00000 2 'point symmetry operation' 0.30901699 -0.80901699 0.50000000 0.00000 0.80901699 0.50000000 0.30901699 0.00000 -0.50000000 0.30901699 0.80901699 0.00000 3 'point symmetry operation' -0.80901699 -0.50000000 0.30901699 0.00000 0.50000000 -0.30901699 0.80901699 0.00000 -0.30901699 0.80901699 0.50000000 0.00000 4 'point symmetry operation' -0.80901699 0.50000000 -0.30901699 0.00000 -0.50000000 -0.30901699 0.80901699 0.00000 0.30901699 0.80901699 0.50000000 0.00000 (中略) 59 'point symmetry operation' -0.30901699 -0.80901699 -0.50000000 0.00000 -0.80901699 0.50000000 -0.30901699 0.00000 0.50000000 0.30901699 -0.80901699 0.00000 60 'point symmetry operation' -0.50000000 -0.30901699 -0.80901699 0.00000 0.30901699 0.80901699 -0.50000000 0.00000 0.80901699 -0.50000000 -0.30901699 0.00000 # --PDBML <PDBx:pdbx_struct_oper_listCategory> <PDBx:pdbx_struct_oper_list id="P"> <PDBx:matrix11>0.30901699</PDBx:matrix11> <PDBx:matrix12>-0.80901699</PDBx:matrix12> <PDBx:matrix13>0.50000000</PDBx:matrix13> <PDBx:matrix21>0.80901699</PDBx:matrix21> <PDBx:matrix22>0.50000000</PDBx:matrix22> <PDBx:matrix23>0.30901699</PDBx:matrix23> <PDBx:matrix31>-0.50000000</PDBx:matrix31> <PDBx:matrix32>0.30901699</PDBx:matrix32> <PDBx:matrix33>0.80901699</PDBx:matrix33> <PDBx:type>transform to point frame</PDBx:type> <PDBx:vector1>0.00000</PDBx:vector1> <PDBx:vector2>-0.00000</PDBx:vector2> <PDBx:vector3>0.00000</PDBx:vector3> </PDBx:pdbx_struct_oper_list> <PDBx:pdbx_struct_oper_list id="X0"> <PDBx:matrix11>1.00000000</PDBx:matrix11> <PDBx:matrix12>0.00000000</PDBx:matrix12> <PDBx:matrix13>0.00000000</PDBx:matrix13> <PDBx:matrix21>0.00000000</PDBx:matrix21> <PDBx:matrix22>1.00000000</PDBx:matrix22> <PDBx:matrix23>0.00000000</PDBx:matrix23> <PDBx:matrix31>0.00000000</PDBx:matrix31> <PDBx:matrix32>0.00000000</PDBx:matrix32> <PDBx:matrix33>1.00000000</PDBx:matrix33> <PDBx:type>transform to crystal frame</PDBx:type> <PDBx:vector1>0.00000</PDBx:vector1> <PDBx:vector2>0.00000</PDBx:vector2> <PDBx:vector3>0.00000</PDBx:vector3> </PDBx:pdbx_struct_oper_list> <PDBx:pdbx_struct_oper_list id="1"> <PDBx:matrix11>1.00000000</PDBx:matrix11> <PDBx:matrix12>0.00000000</PDBx:matrix12> <PDBx:matrix13>0.00000000</PDBx:matrix13> <PDBx:matrix21>0.00000000</PDBx:matrix21> <PDBx:matrix22>1.00000000</PDBx:matrix22> <PDBx:matrix23>0.00000000</PDBx:matrix23> <PDBx:matrix31>0.00000000</PDBx:matrix31> <PDBx:matrix32>0.00000000</PDBx:matrix32> <PDBx:matrix33>1.00000000</PDBx:matrix33> <PDBx:type>point symmetry operation</PDBx:type> <PDBx:vector1>0.00000</PDBx:vector1> <PDBx:vector2>0.00000</PDBx:vector2> <PDBx:vector3>0.00000</PDBx:vector3> </PDBx:pdbx_struct_oper_list> <PDBx:pdbx_struct_oper_list id="2"> <PDBx:matrix11>0.30901699</PDBx:matrix11> <PDBx:matrix12>-0.80901699</PDBx:matrix12> <PDBx:matrix13>0.50000000</PDBx:matrix13> <PDBx:matrix21>0.80901699</PDBx:matrix21> <PDBx:matrix22>0.50000000</PDBx:matrix22> <PDBx:matrix23>0.30901699</PDBx:matrix23> <PDBx:matrix31>-0.50000000</PDBx:matrix31> <PDBx:matrix32>0.30901699</PDBx:matrix32> <PDBx:matrix33>0.80901699</PDBx:matrix33> <PDBx:type>point symmetry operation</PDBx:type> <PDBx:vector1>0.00000</PDBx:vector1> <PDBx:vector2>0.00000</PDBx:vector2> <PDBx:vector3>0.00000</PDBx:vector3> </PDBx:pdbx_struct_oper_list> <PDBx:pdbx_struct_oper_list id="3"> <PDBx:matrix11>-0.80901699</PDBx:matrix11> <PDBx:matrix12>-0.50000000</PDBx:matrix12> <PDBx:matrix13>0.30901699</PDBx:matrix13> <PDBx:matrix21>0.50000000</PDBx:matrix21> <PDBx:matrix22>-0.30901699</PDBx:matrix22> <PDBx:matrix23>0.80901699</PDBx:matrix23> <PDBx:matrix31>-0.30901699</PDBx:matrix31> <PDBx:matrix32>0.80901699</PDBx:matrix32> <PDBx:matrix33>0.50000000</PDBx:matrix33> <PDBx:type>point symmetry operation</PDBx:type> <PDBx:vector1>0.00000</PDBx:vector1> <PDBx:vector2>0.00000</PDBx:vector2> <PDBx:vector3>0.00000</PDBx:vector3> </PDBx:pdbx_struct_oper_list> <PDBx:pdbx_struct_oper_list id="4"> <PDBx:matrix11>-0.80901699</PDBx:matrix11> <PDBx:matrix12>0.50000000</PDBx:matrix12> <PDBx:matrix13>-0.30901699</PDBx:matrix13> <PDBx:matrix21>-0.50000000</PDBx:matrix21> <PDBx:matrix22>-0.30901699</PDBx:matrix22> <PDBx:matrix23>0.80901699</PDBx:matrix23> <PDBx:matrix31>0.30901699</PDBx:matrix31> <PDBx:matrix32>0.80901699</PDBx:matrix32> <PDBx:matrix33>0.50000000</PDBx:matrix33> <PDBx:type>point symmetry operation</PDBx:type> <PDBx:vector1>0.00000</PDBx:vector1> <PDBx:vector2>0.00000</PDBx:vector2> <PDBx:vector3>0.00000</PDBx:vector3> </PDBx:pdbx_struct_oper_list> (中略) <PDBx:pdbx_struct_oper_list id="59"> <PDBx:matrix11>-0.30901699</PDBx:matrix11> <PDBx:matrix12>-0.80901699</PDBx:matrix12> <PDBx:matrix13>-0.50000000</PDBx:matrix13> <PDBx:matrix21>-0.80901699</PDBx:matrix21> <PDBx:matrix22>0.50000000</PDBx:matrix22> <PDBx:matrix23>-0.30901699</PDBx:matrix23> <PDBx:matrix31>0.50000000</PDBx:matrix31> <PDBx:matrix32>0.30901699</PDBx:matrix32> <PDBx:matrix33>-0.80901699</PDBx:matrix33> <PDBx:type>point symmetry operation</PDBx:type> <PDBx:vector1>0.00000</PDBx:vector1> <PDBx:vector2>0.00000</PDBx:vector2> <PDBx:vector3>0.00000</PDBx:vector3> </PDBx:pdbx_struct_oper_list> <PDBx:pdbx_struct_oper_list id="60"> <PDBx:matrix11>-0.50000000</PDBx:matrix11> <PDBx:matrix12>-0.30901699</PDBx:matrix12> <PDBx:matrix13>-0.80901699</PDBx:matrix13> <PDBx:matrix21>0.30901699</PDBx:matrix21> <PDBx:matrix22>0.80901699</PDBx:matrix22> <PDBx:matrix23>-0.50000000</PDBx:matrix23> <PDBx:matrix31>0.80901699</PDBx:matrix31> <PDBx:matrix32>-0.50000000</PDBx:matrix32> <PDBx:matrix33>-0.30901699</PDBx:matrix33> <PDBx:type>point symmetry operation</PDBx:type> <PDBx:vector1>0.00000</PDBx:vector1> <PDBx:vector2>0.00000</PDBx:vector2> <PDBx:vector3>0.00000</PDBx:vector3> </PDBx:pdbx_struct_oper_list> </PDBx:pdbx_struct_oper_listCategory>
---mmCIF loop_ _pdbx_struct_assembly.id _pdbx_struct_assembly.details 1 'complete icosahedral assembly' 2 'icosahedral asymmetric unit' 3 'icosahedral pentamer' 4 'icosahedral 23 hexamer' PAU 'icosahedral asymmetric unit, std point frame' XAU 'crystal asymmetric unit, crystal frame' #
---mmCIF loop_ _pdbx_struct_legacy_oper_list.id _pdbx_struct_legacy_oper_list.name _pdbx_struct_legacy_oper_list.matrix[1][1] _pdbx_struct_legacy_oper_list.matrix[1][2] _pdbx_struct_legacy_oper_list.matrix[1][3] _pdbx_struct_legacy_oper_list.vector[1] _pdbx_struct_legacy_oper_list.matrix[2][1] _pdbx_struct_legacy_oper_list.matrix[2][2] _pdbx_struct_legacy_oper_list.matrix[2][3] _pdbx_struct_legacy_oper_list.vector[2] _pdbx_struct_legacy_oper_list.matrix[3][1] _pdbx_struct_legacy_oper_list.matrix[3][2] _pdbx_struct_legacy_oper_list.matrix[3][3] _pdbx_struct_legacy_oper_list.vector[3] 1 'point symmetry operation' 1.00000000 0.00000000 0.00000000 0.00000 0.00000000 1.00000000 0.00000000 0.00000 0.00000000 0.00000000 1.00000000 0.00000 2 'point symmetry operation' 0.30901699 -0.80901699 0.50000000 0.00000 0.80901699 0.50000000 0.30901699 0.00000 -0.50000000 0.30901699 0.80901699 0.00000 3 'point symmetry operation' -0.80901699 -0.50000000 0.30901699 0.00000 0.50000000 -0.30901699 0.80901699 0.00000 -0.30901699 0.80901699 0.50000000 0.00000 4 'point symmetry operation' -0.80901699 0.50000000 -0.30901699 0.00000 -0.50000000 -0.30901699 0.80901699 0.00000 0.30901699 0.80901699 0.50000000 0.00000 59 'point symmetry operation' -0.30901699 -0.80901699 -0.50000000 0.00000 -0.80901699 0.50000000 -0.30901699 0.00000 0.50000000 0.30901699 -0.80901699 0.00000 60 'point symmetry operation' -0.50000000 -0.30901699 -0.80901699 0.00000 0.30901699 0.80901699 -0.50000000 0.00000 0.80901699 -0.50000000 -0.30901699 0.00000 #
---mmCIF loop_ _pdbx_struct_assembly_gen.assembly_id _pdbx_struct_assembly_gen.oper_expression _pdbx_struct_assembly_gen.asym_id_list _pdbx_struct_assembly_gen.entity_inst_id 1 (1-60) A,B . 2 1 A,B . 3 (1-5) A,B . 4 (1,2,6,10,23,24) A,B . PAU P A,B . XAU (X0)(1-5) A,B . #
---mmCIF loop_ _struct_ncs_oper.id _struct_ncs_oper.code _struct_ncs_oper.details _struct_ncs_oper.matrix[1][1] _struct_ncs_oper.matrix[1][2] _struct_ncs_oper.matrix[1][3] _struct_ncs_oper.matrix[2][1] _struct_ncs_oper.matrix[2][2] _struct_ncs_oper.matrix[2][3] _struct_ncs_oper.matrix[3][1] _struct_ncs_oper.matrix[3][2] _struct_ncs_oper.matrix[3][3] _struct_ncs_oper.vector[1] _struct_ncs_oper.vector[2] _struct_ncs_oper.vector[3] 1 given ? 1.00000000 0.00000000 0.00000000 0.00000000 1.00000000 0.00000000 0.00000000 0.00000000 1.00000000 0.00000 0.00000 0.00000 2 generate ? 0.30901699 -0.80901699 0.50000000 0.80901699 0.50000000 0.30901699 -0.50000000 0.30901699 0.80901699 0.00000 0.00000 0.00000 3 generate ? -0.80901699 -0.50000000 0.30901699 0.50000000 -0.30901699 0.80901699 -0.30901699 0.80901699 0.50000000 0.00000 0.00000 0.00000 4 generate ? -0.80901699 0.50000000 -0.30901699 -0.50000000 -0.30901699 0.80901699 0.30901699 0.80901699 0.50000000 0.00000 0.00000 0.00000 5 generate ? 0.30901699 0.80901699 -0.50000000 -0.80901699 0.50000000 0.30901699 0.50000000 0.30901699 0.80901699 0.00000 0.00000 0.00000 #
リボソームのように巨大な構造の場合、PDBフォーマットファイルで多くの残基と鎖を記述できるようにするため2つ以上のエントリーに分割されていることがあります。つまり、非対称単位や生物学的集合体の座標が複数のPDBエントリーに渡って保存されていることがあるということです。このような場合、各PDBフォーマットファイルの「REMARK 300」「REMARK 350」に記された内容は本来の生物学的集合体全体を示している訳ではありません。
The PDB IDs that need to be combined in order to view the asymmetric unit are listed in the SPLIT records within the PDB format file. An example of this record from the PDB entry 2j00 is shown below: 非対称単位を見るに当たって結合する必要のあるPDB IDはPDBフォーマットファイルの「SPLIT」の項目に記載されています。以下の例は PDBエントリー 2j00の「SPLIT」項目です。
SPLIT 2J00 2J01 2J02 2J03
RCSBの構造概要ページでは、複数のPDBエントリーに情報が分割されたものはいずれも結合した全体の非対称単位や生物学的集合体の画像を表示しています。分割されたエントリーのファイルをダウンロードする場合、構造全体を表示する際結合する必要がある他のエントリーのファイルも合わせてダウンロードするかどうか問われます。
wwPDBが作成した生物学的集合体(生物学的単位)の座標は ftp://ftp.wwpdb.org/pub/pdb/data/biounit/coordinates (または同一内容が保存されているPDBjのPDB Archive)に保存されています。
これらファイルは RCSB PDB のウェブサイトでも見ることができます。構造の概要ページにおいて、初期状態では生物学的集合体が表示されるようになっています。視覚化ボックスの上にある左右の矢印をクリックすると、表示画像を非対称単位や他の生物学的集合体に切り替えることができます。複数の生物学的集合体が登録されている場合、矢印をクリックして順に他の集合体も見ることができます。生物学的集合体の構造を見るには、画像の下にあるリンクをクリックして分子ビュアーを起動することで三次元的に生物学的集合体を表示することができます。生物学的集合体ファイルは、右上角にある "Download Files" メニューオプションからダウンロードすることができます。例えば、2bfu を見てみて下さい。
PISAやPQSといった特定のデータベースもPDBエントリーの生物学的集合体を研究するのに使われているようです。