↑ トップ頁へ

2000.7.22
 
 


SNPデータベースの考え方…


 2000年に入り、SNP関連の研究開発費が大幅増額された。「日本は、1週遅れのトップランナーを目指すらしい」と揶揄されてはいるものの、関連省庁が積極的にプロジェクトを進め始めたので、「これで一挙に遅れを取り戻せる」との安心感が広がっている。

 その一方で、「全体の投入金額が大きいだけで、仕組みは従来と同じだ。上手く行く保証はない。」という意見もある。各省庁が、全体最適を考えず、それぞれ独自のプロジェクトを走らせかねないからだ。

 この心配は杞憂ではない。
 SNPのデータベースを作成し、患者と一般健常人との差異を探して、疾病や薬剤感受性に関連する遺伝子情報を得るプロジェクトを進めるというのに、データベース統一の動きは見えない。そうなれば、各プロジェクトは、独自の判断でデータベースを作成せざるを得まい。全体最適は考慮されないのである。
 これは極めて深刻な問題といえよう。

 インフォマティクスの分野では、データ処理のソフト・ハード技術で成果が左右される。従って、常に先端のソフト・ハードを取り入れる体制をとらないと、落伍しかねない。情報技術を活用し易い仕組みを構築し、情報技術の進歩の波に乗る必要がある。
 ということは、大型プロジェクトを発足する場合は、データベースの基準から議論を始めるのが普通であろう。使い易い統一可能なデータベースを作らなければ、データ共用のための無駄なソフト開発が必要だけでなく、鍵を握る解析ソフトも重複開発することになる。時間と労力がかかるだけでなく、孤立すれば、発展の波にとりのこされるかもしれない。

 例えば、DNA塩基配列データベースは基準が定められている。米・欧・日(NCBI-GeneBank、EBI-EMBL、DDBI)で協調しながら、標準化を進めて来たからである。
 企業は、こうしたデータから利用すべきものをインターネットで逐次入手して、社内サーバーに貯めていく。勿論、外部データだけでなく、社内データも同じ様に蓄積されていく。研究者は、このデータを解析することになる。データ記載が標準化されていなかったら、このような研究体制を敷くのは容易ではない。
 SNPのデータになると、遺伝子情報だけでなく、患者に関する情報(症状、家系)や実験条件も重要になる。今のままなら、データ構造は統一されずに、プロジェクトが進んでいくのであろう。


 ゲノムの時代の目次へ>>>     トップ頁へ>>>
 
    (C) 1999-2004 RandDManagement.com