(注意!:ここに書かれている内容は該当するプロジェクトサイトを翻訳し分かりやすく書いたものであり、プロジェクト主体の意図するものと若干表現が異なることもありますのでご了承ください)
■使用プラットフォーム
(Last modified 11:29 PM UTC, December 15 2005)
Windows
5.2.13 Recommended version
4.45 Older version
Macintosh OS X (10.3 or higher)
5.2.13 Recommended version (standard GUI)
5.2.13 Recommended version (simple GUI)
5.2.13 Unix command-line version
4.43 Older version (standard GUI)
4.43 Older version (Unix command-line version)
4.43.4 Older version (simple GUI)
Linux/x86
5.2.13 Recommended version
4.43 Older version
Solaris/SPARC
4.43 Recommended version
4.19 Older version
■推奨環境
CPU : Pentium 1.5GHz以上
メモリ : 256MB以上
SIMAPとは?
SIMAPは蛋白質の配列相同性データベースです。既知の蛋白質のアミノ酸配列も含め常に更新されていきます。
そしてその蛋白質の配列相同性は、最適な速度と感度をもって提供されるFASTAアルゴリズムを使用し演算されます。
私たちの知る限りSIMAPは、既知の蛋白質と新たに判明してゆく機能を結合できる唯一のプロジェクトです。
何のためにSIMAPが使われるのですか?
公共データベースでの既知の蛋白質のアミノ酸配列はその膨大な量から、それらのほとんどが分類できず関連付けられないことは明らかになっています。
それにもかかわらず、しばしば生物の歴史と共に進化してきた蛋白質は、その種を越えて同じような機能(いわゆる種分岐相同性)を共有することがあります。
既知の蛋白質の機能が、種分岐相同性から関連付けられた蛋白質の機能を推論することは可能です。有名な例は、マウス遺伝子と蛋白質についての調査です。その結果は多くの場合ヒト遺伝子と蛋白質との間で種分岐相同性が認められたことです。
蛋白質に関する情報を提供されることが種分岐相同性の予測のために必要です。多くの生物情報学が蛋白質配列相同性に頼っており、私たちの蛋白質配列相同性データベースは予め演算された既知の蛋白質相同性データを提供します。そして様々な種類のデータを繰り返し再計算し、一般に使用される手法と比較検証して常に新しいデータベースを目指してゆきます。SIMAPは定期的に更新されます。
新たなアミノ酸配列が発見されれば、類似性マトリクスは広がり成長してゆきます。SIMAPの使用は、教育と公共の研究を目的としており完全に無料です。
なぜ、私たちはSIMAPのために分散コンピューティングを必要とするのか?
演算されるべき配列相同性データは、データベース上のアミノ酸配列の数の二乗に上ります。そしてマトリクスを最新にしておくための演算パワーも絶えず増加させる必要性があります。
SIMAPのための私たち内部の演算資源は限られており、全てかつ増加するアミノ酸配列の情報を得続けるのにとても十分ではありません。
そこで私たちは蛋白質のアミノ酸配列相同性を解析するため、FASTAアルゴリズムに基づくBOINCプラットホームを利用することによりSIMAP-クライアントを実装したのです。