[HOME]
About the ASTRAL database:

The ASTRAL compendium [1] provides databases and tools useful for analyzing protein structures and their sequences. It is partially derived from, and augments the SCOP: Structural Classification of Proteins database. Most of the resources provided here depend upon the coordinate files maintained and distributed by the Protein Data Bank. See also the ASTRAL homepage http://astral.berkeley.edu/.


Occurrence of the TOP 30 D2 code fragments in ASTRAL SCOP 1.71 (95%) genetic domain sequence subsets

frag. occur. (%)
0 898516(41.2)
A 639440(29.3)
R 212275( 9.7)
Q 139088( 6.4)
B 125984( 5.8)
G 114560( 5.3)
1 18364( 0.8)
O 9209( 0.4)
H 6507( 0.3)
3 6223( 0.3)
J 2369( 0.1)
8 2033( 0.1)
P 2027( 0.1)
9 1034( 0.1)
2 970( 0.0)
I 792( 0.0)
V* 7( 0.0)
S* 7( 0.0)
7* 5( 0.0)
6* 2( 0.0)
C* 1( 0.0)
else 0( 0.0)
total 2179413      
frag. occur. (%)
000 490242(22.8)
AAA 468792(21.8)
00R  84590( 3.9)
R00 74211( 3.4)
QAA 63581( 3.0)
00Q 59791( 2.8)
0R0 57883( 2.7)
AAB 55758( 2.6)
0QA 54861( 2.5)
G00 53163( 2.5)
RG0 38221( 1.8)
0RG 29289( 1.4)
0QB 28320( 1.3)
BG0 23579( 1.1)
AB0 22565( 1.0)
B00 22164( 1.0)
ABG 21350( 1.0)
ABR 21021( 1.0)
QAB 19548( 0.9)
QRR 17812( 0.8)
BR0 17277( 0.8)
QBG 14955( 0.7)
R0R 13867( 0.6)
QB0 13672( 0.6)
RR0 13311( 0.6)
G0Q 10834( 0.5)
RRG 10532( 0.5)
RQA 10327( 0.5)
R0Q 10253( 0.5)
G0R 9325( 0.4)
else 322309(15.0)
total 2153403      
frag. occur. (%)
AAAAA 347412(16.3)
00000 270382(12.7)
QAAAA 51757( 2.4)
0000R 51723( 2.4)
AAAAB 45625( 2.1)
R0000 44535( 2.1)
0QAAA 35190( 1.7)
G0000 32602( 1.5)
0000Q 31865( 1.5)
000R0 31184( 1.5)
0R000 30997( 1.5)
00R00 29155( 1.4)
00QAA 24368( 1.2)
RG000 23079( 1.1)
000QA 22983( 1.1)
AAABR 16218( 0.8)
000RG 16051( 0.8)
000QB 15879( 0.8)
AAAB0 15310( 0.7)
0RG00 15274( 0.7)
00RG0 14237( 0.7)
AAABG 11001( 0.5)
BG000 10923( 0.5)
000RR 10650( 0.5)
BR000 10052( 0.5)
B0000 9689( 0.5)
AABR0 9625( 0.5)
00QAB 9193( 0.4)
AAB00 9034( 0.4)
ABR00 8556( 0.4)
else 872844(41.0)
total 2127393      
frag. occur. (%)
AAAAAAA 248774(11.8)
0000000 136581( 6.5)
QAAAAAA 41553( 2.0)
AAAAAAB 36673( 1.7)
000000R 31179( 1.5)
0QAAAAA 29185( 1.4)
R000000 26563( 1.3)
G000000 19979( 1.0)
00QAAAA 19955( 0.9)
0R00000 19113( 0.9)
000000Q 19075( 0.9)
00000R0 18601( 0.9)
00R0000 17047( 0.8)
0000R00 16537( 0.8)
000R000 15628( 0.7)
RG00000 14854( 0.7)
AAAAABR 14590( 0.7)
000QAAA 13324( 0.6)
AAAAAB0 12557( 0.6)
00000QA 11969( 0.6)
00000RG 10838( 0.5)
00000QB 10795( 0.5)
0000QAA 10229( 0.5)
0RG0000 9710( 0.5)
0000RG0 8957( 0.4)
AAAABR0 8735( 0.4)
00RG000 8557( 0.4)
000RG00 8203( 0.4)
AAAAABG 8074( 0.4)
AAAAB00 7402( 0.4)
else 1246147(59.3)
total 2101384      
frag. occur. (%)
AAAAAAAAA 169393( 8.2)
000000000 62758( 3.0)
QAAAAAAAA 33783( 1.6)
AAAAAAAAB 29715( 1.4)
0QAAAAAAA 23721( 1.1)
00000000R 16227( 0.8)
00QAAAAAA 15807( 0.8)
R00000000 13720( 0.7)
AAAAAAABR 12006( 0.6)
000QAAAAA 10692( 0.5)
G00000000 10456( 0.5)
00000000Q 10347( 0.5)
AAAAAAAB0 10293( 0.5)
0R0000000 10277( 0.5)
0000000R0 9886( 0.5)
00R000000 9804( 0.5)
000R00000 9370( 0.5)
000000R00 9090( 0.4)
0000R0000 8981( 0.4)
00000R000 8652( 0.4)
RG0000000 8648( 0.4)
0000QAAAA 7946( 0.4)
AAAAAABR0 7597( 0.4)
0000000RG 6675( 0.3)
0000000QB 6544( 0.3)
0000000QA 6450( 0.3)
AAAAAAABG 6401( 0.3)
00000QAAA 6187( 0.3)
0RG000000 6062( 0.3)
AAAAABR00 6044( 0.3)
else 1521844(73.3)
total 2075376      

*) See [About 5-tile codes V/S/7/6/C]  below.



[The D2 code]

[About D2 codes V/S/7/6/C]

These codes occurred because of missing residues. The following are the corresponding files:

[References]
  1. Chandonia JM, Hon G, Walker NS, Lo Conte L, Koehl P, Levitt M, Brenner SE. The ASTRAL compendium in 2004. Nucleic Acids Research 32:D189-D192 (2004).