最尤法による系統樹探索 †
今年度の授業ではPAUP* betaを用いずに系統推定を行う方法を解説している。
全てフリーソフトを用いて演習を実施するために、
- モデルの選択: jmodeltest http://darwin.uvigo.es/software/jmodeltest.html
- 選択されたモデルを用いた最尤系統樹の探索: PHYML http://www.atgc-montpellier.fr/phyml/
http://www.hiv.lanl.gov/content/sequence/PHYML/interface.html
(マニュアル: http://www.atgc-montpellier.fr/download/papers/phyml_manual_2009.pdf)
を用いて行う。PHYMLはPAUP* betaよりも扱うことのできるモデルの数が少ないが、フリーソフトの中では一番多くのモデルに対応している。
1. jmodeltestのダウンロードとモデルの選択 †
- jmodeltestのページ(http://darwin.uvigo.es/software/jmodeltest.html)にアクセスして、氏名、メールアドレスなどを入力して、ダウンロード。
MacOS, Windows XP, Linux等で使える。
- jmodeltestを起動し、サンプルファイルPedic_align.fst をロードする
File > Load DNA alignment
- Numbers of substitution schemeの数を3に設定して、24個のモデルのもとで、尤度を計算。デフォルトでは88個のモデルを検討できるが、次に行うPHYMLの解析で、使えるモデルの数が限られているので、ここでは24個のモデルを検討。
Analysis > Compute likelihood scores to start the analysis.
- 最適モデルを選択する。AIC, AICc, BIC等を用いて、最適モデルを選択する。例えば、AICの場合
Analysis > Do AIC calculations
解析結果は画面にも表示されるが、Results Tableの中のAICのタブに保存される
その他、AICc, BICについても同様の操作をしておく。
なお、使えるモデル選択の基準は、
- Akaike Information Criterion (AIC) (Akaike 1974)
- Akaike Information Criterion corrected for small sample sizes (AICc) (Hurvich and Tsai 1989)
- Bayesian Information Criterion (BIC) (Schwarz 1978),
- Decision-theoretic performance-based approach (DT) (Minin et al. 2003)
- 結果のテーブルを見て、最適モデルを選択。AICの場合、テーブルのAICカラムをクリックして並び替えると、最小のAICを持つモデルが一番上にくる。
Results > Show results table
- 今回の例では、HKYが最適モデル。Results tableでこのモデルのパラメータ設定を見て確認。
2. PHYMLによる最尤系統樹推定 †