*最尤法による系統樹探索 [#rdb14008] 今年度の授業ではPAUP* betaを用いずに系統推定を行う。 ~ PAUP* betaとmodeltestを用いて最尤系統樹推定を行う方法の解説はこちら → [[H22年度授業bbs>http://bean.bio.chiba-u.jp/lab/index.php?plugin=attach&refer=%E6%8E%88%E6%A5%AD%2FH22%2F%E7%B3%BB%E7%B5%B1%E5%AD%A6%E7%89%B9%E8%AB%96%2Fbbs&openfile=6th_lesson_2010.pdf]] ~ 今回は、全てフリーソフトを用いて演習を実施する。 +モデルの選択: jmodeltest http://darwin.uvigo.es/software/jmodeltest.html +選択されたモデルを用いた最尤系統樹の探索: PHYML http://www.atgc-montpellier.fr/phyml/~ http://www.hiv.lanl.gov/content/sequence/PHYML/interface.html~ (マニュアル: http://www.atgc-montpellier.fr/download/papers/phyml_manual_2009.pdf) PHYMLはPAUP* betaよりも扱うことのできるモデルの数が少ないが、フリーソフトの中では一番多くのモデルに対応している。 **1. jmodeltestのダウンロードとモデルの選択 [#n80aad0a] -jmodeltestのページ(http://darwin.uvigo.es/software/jmodeltest.html)にアクセスして、氏名、メールアドレスなどを入力して、ダウンロード。~ MacOS, Windows XP, Linux等で使える。 -jmodeltestを起動し、サンプルファイル[[Pedic_align.fst >http://bean.bio.chiba-u.jp/lab/index.php?plugin=attach&refer=%E6%8E%88%E6%A5%AD%2FH17%2F%E7%B3%BB%E7%B5%B1%E5%AD%A6%E7%89%B9%E8%AB%96%2FPAUP%2A%E4%BD%BF%E7%94%A8%E6%B3%95&openfile=Pedic_align.fst]]をダウンロードする File > Load DNA alignment -Numbers of substitution schemeの数を3に設定して、24個のモデルのもとで、尤度を計算。デフォルトでは88個のモデルを検討できるが、次に行うPHYMLの解析で、使えるモデルの数が限られているので、ここでは24個のモデルを検討。 Analysis > Compute likelihood scores to start the analysis. --結果は画面にも表示されるが、Results Tableに一覧表として保存されている Results > Show results table -最適モデルを選択する。AIC, AICc, BIC等を用いて、最適モデルを選択する。例えば、AICの場合 Analysis > Do AIC calculations 解析結果は画面にも表示されるが、Results Tableの中のAICのタブに保存される その他、AICc, BICについても同様の操作をしておく。 なお、使えるモデル選択の基準は、 --Akaike Information Criterion (AIC) (Akaike 1974) --Akaike Information Criterion corrected for small sample sizes (AICc) (Hurvich and Tsai 1989) --Bayesian Information Criterion (BIC) (Schwarz 1978), --Decision-theoretic performance-based approach (DT) (Minin et al. 2003) -結果のテーブルを見て、最適モデルを選択。AICの場合、テーブルのAICカラムをクリックして並び替えると、最小のAICを持つモデルが一番上にくる。 Results > Show results table --今回の例では、HKYが最適モデル。Results tableでこのモデルのパラメータ設定を見て確認。 **2. PHYMLによる最尤系統樹推定 [#v2361001] -サンプルファイル[[Pedic_align.fst >http://bean.bio.chiba-u.jp/lab/index.php?plugin=attach&refer=授業%2FH17%2F系統学特論%2FPAUP%2A使用法&openfile=Pedic_align.fst]]をPHYLIP形式に変更(ReadSeqを使う。うまく行かなかったら、FASTA形式のママでも良い) -PHYMLのウェブサービスにアクセス --PHYLIP形式を利用(PHYMLのウェブページ):http://www.atgc-montpellier.fr/phyml/ --FASTA形式を利用:http://www.hiv.lanl.gov/content/sequence/PHYML/interface.html -jmodeltestの結果に従って、モデルとパラメータを選択 **3.課題(提出期限: 7月19日(火曜) [#e6c2d573] >1.データファイル(&ref(./DIPTERO.PHYLIP);)をダウンロード~ >1.データファイル(&ref(./DIPTERO.PHYLIP); または &ref(./DIPTERO_win.phy);)をダウンロード~ outgroupはTilia >2.jmodeltestを使って尤度データを得る。また、AIC, AICc, BICを用いて最適モデルを選択~ 以降の系統推定には、AICcで選択されたモデルを使う >3.PHYMLのウェブサービスにアクセス: http://www.atgc-montpellier.fr/phyml/~ データファイル: DIPTERO.PHYLIP をアップロード~ 上で選択した最適モデルに従って、解析パラメータを設定 >4. メールで届くtree fileを TreeView等で開けば、系統樹を見ることができる~ 系統樹部分を切り取って、画像ファイルとして、メールで提出~ メールの件名は 最尤法課題(学籍番号) にすること。 >6. 発展学習: 可能ならば、前回と同様に、最尤系統樹にブーツストラップ値を着けたものを提出すること(加点対象)。