遠藤 of 非コードDNA

インターメア機能配列の情報量規準と機械学習による同定および進化的解析
遠藤 俊徳

endo.jpg


北海道大学 大学院情報科学研究科
研究室ホームページLinkIcon

「インターメア」は過去にはジャンクDNAと呼ばれたこともあり、最近まであまり重視されて来なかった。しかしゲノム配列が明らかになり始めた頃から、マイクロRNAのような発現制御に関わる配列が見つかるなど、未知の配列が存在する可能性が広がってきている。また、進化的観点からみれば、染色体部分重複の産物であったり、組み換えを生じやすい部分であったりと、過去の進化の痕跡や今後の生物進化の材料となる配列の可能性がある。
 本研究提案では「インターメア」に特化した種間配列比較解析の方法を確立し、主要なモデル生物について、機能配列を提示すると同時に、生物間における機能配列の進化的関係性を明らかにする。新たな方法確立が必要な理由は次の通りである。既存の種間配列比較解析方法は、配列相同性に基づいて保存領域を同定する方法をとっており、事前知識があることが主な前提となっているため、事前知識の少ない「インターメア」には適用が難しい。既存の遺伝子領域推定技術は、タンパク質コード遺伝子周辺配列の確率論的特徴を捉えることによって遺伝子領域らしさを測り、推定を行うため、やはり「遺伝子領域らしさ」を特徴づける事前知識が要求される。一方、単純な配列類似性によって網羅的に特徴配列を抽出しようとする力づくのアプローチは、機能配列の多態性のため、計算量 (time complexity)の問題から現実的でない。以上を踏まえ、効率的な確率論的配列パターン抽出と、機械学習などを用いた特徴抽出、およびそのための評価関数の確立を多面的に試行することによって目標達成を目指す。また、実験的に得られた機能配列情報を、情報科学的に抽出されたものとは区別された形でデータベース化し、推定用のツールを提供する。