↑ トップ頁へ

2003.2.28
 
 


インフォマティクスの遅れ(4:多重アラインメント)…

 アルゴリズムの適応が重要といっても、その方法論は様々だ。

 基本は「多重アラインメント」の手法だ。特徴的な配列パターンを数多くの遺伝子配列情報から統計的に抽出するのである。
 といっても、時間軸で見れば、格別新しい手法ではない。有名な「ClustalW」が英国で開発されたのは1988年である。ホモロジー検索の「FastA」と同じ頃だ。米国でも、1987年に「PILEUP」が開発されており、ホモロジー検索と並んで進んできたといえる。

 「多重アラインメント」手法には、類似機能の蛋白配列を並べれば遺伝子構造のパターンがわかる筈、との考え方がベースになっている。極く初期は、累進法で類似性を検討するだけの単純な論理だったが、次第に高度化が進んだ。
 ホモロジー検索同様、動的計画法の導入も図られた。

 さらに、パターンをどのように考えるかの知恵が組み込まれる。
 例えば、情報コード領域と非コード領域の配列パターンがあると考えれば、それが遺伝子構造モデルの1つになる。
 又、進化の過程の論理を活かすなら、系統的な整理を用いることになる。遺伝の仕組みをモデル化して、進化度を決めれば、機能推定ができる訳だ。

 このような技術が成熟してくれば、さらに細かな類似性も追及できる。多重アラインメント処理後に類似アミノ酸配列が存在しているかを付け加えることも可能だ。アミノ酸の頻度の高低で比較する訳だ。
 研究者の知恵によって、様々な工夫が進む訳である。

 ここまでくれば、「隠れマルコフモデル」といったアルゴリズムも使える。そうなると、統計的に、モチーフの意味付けができるし、純数理上の検討ですむから配列の分離もし易くなる。
 ようやく、コンピュータを用いた思考実験の領域に入って来たといえる。

 これらの手法は、いずれも遺伝子構造をモデル化している点がポイントである。コンピュータ上に遺伝子モデルが存在すると言ってもよいだろう。後は、このモデルと類似の配列を探索すれば、遺伝子情報が含まれている配列部分が見つかることになる。

 このように様々なモデルでの取り組みがあるから、ホモロジー検索とは違い、1つの標準に収斂する動きはおきにくい。
 当然ながら、バラバラな動きになり易い領域に、資源の集中的投入するのは、簡単ではない。どのモデルが最善かは、はっきりしないからである。技術は動いているのである。   

   過去記載の
   ・「インフォマティクスの遅れ(1:ホモロジー検索)」へ (20030225)
   ・「インフォマティクスの遅れ(2:古典的技法)」へ (20030226)
   ・「インフォマティクスの遅れ(3:モチーフ検索)」へ (20030227)


 ゲノムの時代の目次へ>>>     トップ頁へ>>>
 
    (C) 1999-2004 RandDManagement.com