コンピュータを利用した系統解析 †
これまでの授業で最節約法、NJ法、最尤法、ベイズ法を学んできたが、いずれの系統推定方法においても、コンピュータの利用は不可欠であることを学んだ。また、コンピュータを利用してさえ、解析に非常に時間がかかる場合があるということも学んだ。今回の授業では、ウェブ上で公開されているインターフェースを利用して、実際のデータを解析する方法を学ぶ。
サンプルデータ †
サンプルデータには、H23年度情報処理第13回授業で用いた、ヨツバシオガマの葉緑体DNAの塩基配列データを用いる(→Pedic.fst)。この情報処理授業では、ClustalWを用いて、塩基配列のアラインメントと、NJ法を用いた系統解析を行った。ここでもういちど、当該情報処理授業を復習しておくと良いだろう。
生物学科の学部生は、コンピュータを用いた4つの系統推定法を、以下の授業で学ぶ。
- NJ法:1年次情報授業。ClustalXを用いたアラインメントとNJ法による系統推定。ブーツストラップ解析。
- 最節約法: 本授業。第13回授業の自習課題。DNAPARSを用いた解析
- 最尤法: 本授業。ウェブインターフェースを利用してPhyMLで系統推定
- ベイズ法:本授業。ウェブインターフェースを利用
なお、この授業で行う演習内容が、次回授業の次週課題の解説になっているので、操作方法やデータ処理の方法は、注意して聞いておく方がよいだろう。
アラインメント †
上のPedic.fstはアラインメントしていない。
系統解析を実施する前に、配列データのアラインメントは不可欠!
EMBLのサイト(http://www.ebi.ac.uk/Tools/msa/clustalw2/)や下記Phylemon2のサイトで、ClustalW等をつかってアラインメントしておく。
アラインメント済みのデータファイルも右にアップロードしておく(→(Pedic_align.fst)。
最尤法による系統推定 †
最尤法による系統推定には、次の2つのステップが必要になる。
- 分子進化モデルの選択
- 最尤法による系統推定
分子進化モデルの選択 †
解析対象とするデータに適した分子進化モデルは、ModeltestやjModeltestなどのソフトウェアを用いて選択することができる。ここでは、分子系統解析の統合ウェブサイトであるPhylemon2で提供されるjModeltestを用いて、サンプルデータに適した分子進化モデルを選択する。
- Phylemon2にアクセス
- 上部メニュー: Evolutionary Testをクリック
- Evolutionary Test Tools の中から JModelTestをクリック
- アラインメント済みのデータ(FASTA形式)を、テキストエリア(Or enter your data from text)にペースト
- Likelihoodオプションで
- Number of substitution schemes は 3を選択
- Calculationオプションで
- Akaike Information Criterion をチェック
- 画面下部のRUNをクリック
- 解析中のデータが、右側のJob listに表示される。finishedと表示されたら、sample nameをクリック
- 左側パネルに表示される「Results file created : jModelTest.txt 」のリンクをクリックし、jModelTest.txtをダウンロードして表示
- AICのパートで最上部にリストされたモデルを選択する。ここで選択されたモデルは最尤法の他、ベイズ法による系統推定にも使える。
最尤法による系統推定:morePhyML †
ここでは、パスツール研究所が提供している系統解析のウェブインターフェースから、PhyML を用いる