最尤法による系統樹探索

今年度の授業ではPAUP* betaを用いずに系統推定を行う。
PAUP* betaとmodeltestを用いて最尤系統樹推定を行う方法の解説はこちら → H22年度授業bbs
今回は、全てフリーソフトを用いて演習を実施する。

  1. モデルの選択: jmodeltest  http://darwin.uvigo.es/software/jmodeltest.html
  2. 選択されたモデルを用いた最尤系統樹の探索: PHYML  http://www.atgc-montpellier.fr/phyml/
    http://www.hiv.lanl.gov/content/sequence/PHYML/interface.html
    (マニュアル: http://www.atgc-montpellier.fr/download/papers/phyml_manual_2009.pdf

PHYMLはPAUP* betaよりも扱うことのできるモデルの数が少ないが、フリーソフトの中では一番多くのモデルに対応している。

1. jmodeltestのダウンロードとモデルの選択

  • jmodeltestのページ(http://darwin.uvigo.es/software/jmodeltest.html)にアクセスして、氏名、メールアドレスなどを入力して、ダウンロード。
    MacOS, Windows XP, Linux等で使える。
  • jmodeltestを起動し、サンプルファイルPedic_align.fst をダウンロードする
    File > Load DNA alignment
  • Numbers of substitution schemeの数を3に設定して、24個のモデルのもとで、尤度を計算。デフォルトでは88個のモデルを検討できるが、次に行うPHYMLの解析で、使えるモデルの数が限られているので、ここでは24個のモデルを検討。
    Analysis > Compute likelihood scores to start the analysis.
    • 結果は画面にも表示されるが、Results Tableに一覧表として保存されている
      Results > Show results table
  • 最適モデルを選択する。AIC, AICc, BIC等を用いて、最適モデルを選択する。例えば、AICの場合
    Analysis > Do AIC calculations
    解析結果は画面にも表示されるが、Results Tableの中のAICのタブに保存される その他、AICc, BICについても同様の操作をしておく。 なお、使えるモデル選択の基準は、
    • Akaike Information Criterion (AIC) (Akaike 1974)
    • Akaike Information Criterion corrected for small sample sizes (AICc) (Hurvich and Tsai 1989)
    • Bayesian Information Criterion (BIC) (Schwarz 1978),
    • Decision-theoretic performance-based approach (DT) (Minin et al. 2003)
  • 結果のテーブルを見て、最適モデルを選択。AICの場合、テーブルのAICカラムをクリックして並び替えると、最小のAICを持つモデルが一番上にくる。
    Results > Show results table
    • 今回の例では、HKYが最適モデル。Results tableでこのモデルのパラメータ設定を見て確認。

2. PHYMLによる最尤系統樹推定

3.課題(提出期限: 7月19日(火曜)

1.データファイル(fileDIPTERO.PHYLIP または fileDIPTERO_win.phy)をダウンロード
outgroupはTilia

2.jmodeltestを使って尤度データを得る。また、AIC, AICc, BICを用いて最適モデルを選択

以降の系統推定には、AICcで選択されたモデルを使う

3.PHYMLのウェブサービスにアクセス: http://www.atgc-montpellier.fr/phyml/
データファイル: DIPTERO.PHYLIP をアップロード
上で選択した最適モデルに従って、解析パラメータを設定

4. メールで届くtree fileを TreeView等で開けば、系統樹を見ることができる
系統樹部分を切り取って、画像ファイルとして、メールで提出
メールの件名は

最尤法課題(学籍番号)

にすること。

6. 発展学習: 可能ならば、前回と同様に、最尤系統樹にブーツストラップ値を着けたものを提出すること(加点対象)。


添付ファイル: fileDIPTERO_win.phy 1367件 [詳細] fileDIPTERO.PHYLIP 1355件 [詳細]

Last-modified: 2015-05-13 (水) 16:44:36 (3481d)