↑ トップ頁へ

2003.2.26
 
 


インフォマティクスの遅れ(2:古典的技法)…

 ホモロジー検索とは、すでに知られている配列事例との類似性を探る方法である。
 具体的には、知られている配列情報のデータベースと、検索対象のゲノム情報を比較し、局所的によく一致する部位を指摘する作業を行うことになる。2つの膨大な情報を比較するのだから、膨大な処理を必要とする。しかし、網羅的に類似した部分が見つかるから、必須な探索作業といえる。
 こうした特性上、ホモロジー検索は先手必勝になりがちだ。そのため、データ大量処理技術開発が優先されてきたといえよう。

 といっても、高速処理を追求すれば、見落とす部分も増える。特に、蛋白情報の配列には置換/挿入/欠損といった変異が発生しているため、そのままで類似性を検討すると、見逃す可能性が高い。そこで、見逃しを減らそうとの試みが生まれる。
 例えば、一致する要素の数が最大になるような並べ方を、比較的簡単に計算できる、動的計画法(dynamic programming)の利用があげられる。このなかでは、一方の配列に似た部分配列を探索する「Smith-Waterman」が比較的よく使われている。
 しかし、今のところ、長時間処理の割りには成果が少ない。そうなると、どうしても補助的な役割に留まらざるを得ない。

 この結果、ホモロジー検索は「BLAST」が主流の地位を維持し続けている。広く使われるようになれば、技術の成熟化が一挙に進む。技術が成熟すれば、開発の焦点は、抜本的な改良ではなく、細かな使い易さへと移る。類似検索の元になるデータベース毎にプログラムが調整されると同時に、ユーザーインターフェースの改良が行われる訳だ。

 このような状況では、遅れている側がホモロジー検索技法の深化を追及しても、たいした成果は得られまい。すでに確立している技術に、これ以上期待すべきではないのだ。
 ところが、遅れているにもかかわらず、この分野の技術開発に拘泥する政策責任者がいるらしい。・・・科学行政における既得権益と絡んでいるとしか思えない。

 要するに、ホモロジー検索の原理は「古典的」過ぎる、と見なすべきなのである。
 ホモロジー検索は、機能が既知の配列データと比較し、その類似性の視点から探索するだけのことだ。ここには、知恵が入り込む余地が少ない。しかも、類似性が無かったり、弱いものは、原理上推定できない。これは大きな欠点ともいえる。

 同じように、「古典的」と見なせるのが、ORF(open reading frame)検索である。
 こちらは、蛋白質情報を含む配列部分を探索する方法だ。遺伝子は、転写に当って、必ず開始部分と終始部分がある。そこで、この部分を探すことで遺伝子領域を確定する方法である。
 この考え方も、ホモロジー検索と同じだ。(といっても、転写部分のうち蛋白情報は一部に過ぎないから、ORF検索はあくまでも補助的な役割である。)

 既知情報との単純類似検索は、初期の段階では重要だが、技術が成熟すれば、単純なルーチン作業にすぎない。そのような分野に研究開発費を集中投入しても、科学技術の進歩に貢献するとは思えない。   

   過去記載の
   ・「インフォマティクスの遅れ(1:ホモロジー検索)」へ (20030225)


 ゲノムの時代の目次へ>>>     トップ頁へ>>>
 
    (C) 1999-2004 RandDManagement.com