系統解析ソフトウェアのうちMac版PAUP*やMesquiteは大変使いやすいグラフィカルユーザーインターフェースを備えていますが、そうでないものが多くあります。また、ソースコードで配布されるものは、自分の環境に合わせてコンパイルしないと、使用できません。そういうソフトウェアを操作し、自分のコンピュータで使えるようにするには、Unix系のコマンドラインでの操作に慣れておくことが必須です。この講義では、Windows上で走るUnix環境エミュレータであるCygwinを使って、コマンドラインコンピュータの操作を学習します。
Some softwares for phylogenetic analysis are not equipped with GUI like PAUP* of Macintosh or Mesquite. Some softwares also to be compilied under the configuration of each terminal. Here, we try to use Cygwin, an emulater of Unix environment on Windows, to use r8s, PAML, and others.
この演習では、Windowsのグラフィカルインターフェース’(GUI: 簡単に言うと、”マウスでポインタを動かしクリックしてそうさするもの")の下で動作するソフトウェアと、Unix様のコマンドラインインターフェース(CLI: 簡単に言うと、"キーボードから命令を文字で打ち込むもの")の両方を組み合わせて使用できるように、WindowsXPの環境をセットアップします(MacOSXやLinuxのGUIを使っている人は、こんなことをしなくとも、GUIとCLIの両方を簡単に使うことができます)。インストールするのは、以下のソフトウェアです。
Choose following packages under Devel when you see the list of packages make gcc #C compiler 一つクリックすると、関連するものがすべて選択される。 gcc-g77 Choose sqlite3 under Database packages sqlite3
これからCygwinとテキストエディタの他、下でダウンロードする様々なソフトウェアを使ってUnixライク環境を使って系統推定を行います。この授業では、以下の基本操作・知識が必要ですので、必ず理解しておきましょう。
To use Unix-like environment, you should understand following basics.
先ほどインストールしたcygwinのアイコンがデスクトップにあるはずなので、ダブルクリックして立ち上げてみましょう。そうすると、画面に黒いウィンドウが開き、コマンドプロンプト(カーソルがチカチカ点滅しているところ)が表示されます。Unixライクな操作は、ここに文字で命令を打ち込むことで行います。操作を始める前に、このウィンドウについて、次の設定をしておきましょう。
※ Non-Japanese students: Visit English Tutorials for Unix/Linux of Marine Biological Laboratory .
それでは、コマンドラインインターフェースを使って、コンピュータに命令を与えてみましょう。今、Cygwinの画面には、
$
という文字が表示され、その右側でカーソルがチカチカしているはずです。ここに
pwd
と入力してみましょう。そうすると、
/home/user_name
と表示されたはずです(user_nameの部分は、それぞれWindows設定時に自分が決めたユーザー名.コマンドラインの操作を行う人は、この名前を短くしておく方が、後々の操作が楽になる。名前の変更は、コントロールパネルのユーザーアカウントから行える)。
この pwd というコマンドは、現在自分が操作しているディレクトリの位置を表示してくれる、便利なコマンドです(どのディレクトリを見ているのかわからなくなったら、すぐに pwd と入力しましょう)。
Unixライク環境のコマンドラインインターフェースでの多くの操作は、
・文字で命令を入力 ・その命令をコンピュータが実行 ・結果を出力: 画面に表示したり、ファイルに書き込んだり
という流れで行われます。今の pwd というコマンドでは、
・pwd という命令を入力 ・現在のディレクトリをコンピュータが取得 ・結果を画面に表示
という流れで進みました。では、ここで、結果の出力先をファイルに変更してみましょう。次のコマンドを入力してみてください。
pwd > current_d.txt
> という記号は、出力先をファイルにするということを意味しています。
タイピングが面倒な人は、マウスで選択してコピーし、Cygwinのウィンドウで右クリックすればいいです。
そうすると画面には、特に何も結果は表示されません。ではここで、
ls
と入力します。これは、ディレクトリの中のファイルやディレクトリを一覧するコマンドです。そうすると、
current_d.txt
という文字が表示されました。つまり、このディレクトリの中に、current_d.txt というファイルが存在していることを表しています。では、このファイルの中には何が入っているのでしょうか?ここで、lessというコマンドを使います。
less current_d.txt
そうすると、
/home/tkaji
という文字が表示されましたね。lessはファイルの中身を表示させる命令です。q を押すと、終了できます。
以上が、文字入力でコンピュータに命令を与える、Unixライク環境の基本操作です。結果はいつも、画面に表示されるか、ファイルとしてディスクに保存されます。
では、もう一度 pwd でカレントディレクトリを確認してみましょう。私のコンピュータでは、
/home/tkaji
と表示されていますが、これは、コンピュータのハードディスク上のどの位置にあるのでしょうか?スタートメニューから、マイコンピュータを開いてエクスプローラ(知らない人もいると思いますが、Windowsでファイルの一覧を表示させるソフトの名前です)の、ツールバーの「フォルダ」をクリックして、フォルダーをツリー表示させてみましょう。フォルダが次のような階層構造になっているのがわかります。
Unixライクな操作では、それぞれのフォルダのことを「ディレクトリ」と言います。また、それぞれのディレクトリは名前がついていて、pwd コマンドで表示されたように文字で表すことができます。
cygwin | / | ルート |
home | /home | ホーム |
tkaji | /home/tkaji/ | ユーザーホーム |
sample1 | /home/tkaji/sample1/ | (解析用サンプルファイルの置き場所) |
Windowsのハードディスクの中のフォルダの位置と、Cygwinのファイル構成でのディレクトリの対応を理解しておいてください。この授業でよく使うディレクトリは
/home/tkaji(ユーザーごとに違う名前/ /home/tkaji/sample1(解析ごとに違う名前)/ /usr/local/bin/ (実行形式ファイルの置き場所)
の3つです。では、試しに、sample1というフォルダをエクスプローラーを使って作成してみましょう。フォルダツリーでtkaji(ユーザーごとに違う名前)をクリックし、ファイルメニューから「新規作成/フォルダ」を選択して作った新しいフォルダに sample1 という名前をつけてください。
cygwinで、
ls /home/tkaji(ユーザーごとに違う名前)
と入力すると、
sample1 current_d.txt
という名前が表示されるのがわかります。でも、これでは、sample1がファイルなのかディレクトリなのかはわかりません。そこで、
ls -l /home/tkaji(ユーザーごとに違う名前)
と入力してみましょう。-l はオプションで、表示の形式を変えるものです。ファイルやディレクトリの名前が縦に表示されており、一番左の文字が d になっているものがディレクトリ、それ以外はファイルを表しています。
-rw-r--r-- 1 tkaji なし 12 Jan 20 04:42 current_d.txt drwxrwxrwx+ 2 tkaji なし 0 Jan 20 05:21 sample1
今行った操作で大事なことは、
Cygwinの操作で解析等に使うファイルはWindowsからマウスのクリック操作で作れる 作ったファイルは、 /home/の下の、自分のディレクトリに入れておく
ということです。後でもう一度説明しますが、Windowsのソフトウェアと、Cygwinを行き来するときに、ディレクトリの場所を意識することがとても大切なので、覚えておいてください。
それでは、ディレクトリの基本構成が理解できたところで、基本命令(コマンド)のいくつかを試してみましょう。
sample1 current_d.txtの2つが表示されるはずです。
cd sample1と入力します。もし、どこか別のディレクトリにいて、すぐに /home/tkaji/sample1に移動したいのなら、
cd /home/tkaji(ユーザーごとに違う名前)/sample1と入力します。この
/home/tkaji/sample1という表し方をフルパスと言います。左から順に、
/ ルートディレクトリ home ルートディレクトリの中のhomeというディレクトリ tkaji ルートディレクトリの中のhomeというディレクトリの中のtkajiというディレクトリ sample1 ルートディレクトリの中のhomeというディレクトリの中のtkajiというディレクトリの中の sample1というディレクトリというように、ディレクトリの階層構造を、最上位のルートディレクトリから、1行の文字列で表したものです。入力は面倒ですが、フルパスを入力すれば、ディレクトリからディレクトリへ一気に移動することができます。
cd ..というものがあります。これは、カレントディレクトリから1つ上の階層のディレクトリに移動するものです。実際に入力して試してみましょう。
sample1 current_d.txtというように、sample1 というディレクトリと、 current_d.txt というファイルが入っているはずです。ここで、current_d.txt をsample1 ディレクトリに移動してみます。
mv current_d.txt sample1 同じことをフルパスで表記すると mv /home/tkaji/current_d.txt /home/tkaji/sample1/sample1フォルダに移動したcurrent_d.txtをもとのフォルダに別名でコピーしたいのなら、
cp /home/tkaji/sample1/current_d.txt /home/tkaji/sample2.txt (フルパスで書きましたが、カレントディレクトリにまでは省略可能です)今コピーした sample2.txtというファイルを削除したい場合、
rm /sample2.txtと入力します。 また、新しいディレクトリを作成したい場合、
mkdir sample2です。
Unixライク環境での解析に必要なデータファイルの編集は、viやemacsというエディタをCygwinから使うことも可能ですが、Windowsユーザーにとっては操作がそれほど簡単ではありません。先にインストールした、K2EditorなどのWindowsのテキストエディタを使う方が、ずーっと簡単です。ただし、WindowsとUnixライク環境を行き来する場合、改行コードに注意する必要があります。
改行コードというのはあまり聞き慣れない言葉かもしれませんが、文書(テキスト)で改行されている場所には、改行を示す目に見えない文字が入っています。しかも、それは、Windows、Unix、Macintoshの3者で異なっています.
Windows CR+LF Unix LF Macintosh CR
この違いが、Windows, Unix, Mac間でデータをやりとりする場合、いつも、問題になります。また、コンピュータ間でのデータのやりとりだけでなく、今回のように、WindowsのテキストエディタとUnixライク環境であるCygwinの間のやりとりや、Mac OSとMacのターミナル(Darwin)の間のやりとりでも、注意していなくてはなりません。
では、実際に、K2Editorでファイルを作成して、Cygwinに移動してみましょう。まず、K2Editorを起動して、
ATGCGGTT ATGGCGTT ATGGAGTT
をコピーして、ペーストし、Cygwinの自分のデータフォルダに保存してください(私の場合、/home/tkaji/)。K2Editorで保存するときにファイルが表示されたら、ハードディスク c:の下のCygwinフォルダの中の、homeフォルダの中の自分のフォルダに、
test1.txt
という名前で保存します。
このとき、ファイル名を入力する欄の下の方に、
現在の文字コードと改行コードと保存
とかかれていますので、右側の▼をクリックして、
文字コードと改行コードを指定して保存
にしてください。そうすると次の画面で、「保存時の文字コードと改行の選択」ウィンドウが開くので、
文字コード SJIS (変更する必要は無いです) 改行コード LF (Unixライク環境で使う場合は、必ず LF にする)
を選んで保存します。
Unixライク環境で使う場合、改行コードは必ず LF にする
を忘れないでください。
今後の操作でも、このようにK2Editorを使ってデータファイルを編集し、Cygwinのデータディレクトリに保存するという操作を繰り返します。^
Unixライク環境では、使用するコンピュータを選ばずにソフトウェアをインストールすることができるのですが、そのかわり、その環境に合った実行形式のプログラムファイルを作成するために、コンパイルという作業が必要になります。簡単に流れを説明すると、
・ソースコードをダウンロード(通常、tar等で1つのファイルにまとめられている) ・Windowsのeoやlha、Cygwinの中ならtarを使ってアーカイブを展開 ・ソースコードのフォルダに移動し、make を使ってコンパイル ・できた実行形式ファイル(Windowsでは.exeという拡張子がついている)を /usr/local/bin/ 等のパスの通ったディレクトリに移動しておく
ということになります。以下、r8sという解析プログラムのインストールを例に説明します。
$ pwd /home/user1 #自分が今いるディレクトリ: Your current directory $ ls #そのディレクトリの内容をリスト: List the contents of the current directory r8s1.71 sample $ cd r8s1.71 #r8s1.71というディレクトリに移動: Move to the directory "r8s1.71" $ ls bin doc sample src $ cd src #srcディレクトリに移動: Move to the directory "src" $ make #コンパイル。うまくゆくと、srcディレクトリ内にr8s.exeができる。 Compile with this command. You will have "r8s.exe" if succeed. $ mv r8s.exe /usr/local/bin #できた実行形式ファイルを、/usr/local/binに移動: #Move the binary file to /usr/local/bin #こうしておくと、ファイル名だけで実行できる # You can execute the .exe files in /usr/local/bin from any directories $ ls /usr/local/bin #ちゃんと移動できたことを確認: Confirm if the file was moved. r8s.exe
$ r8s -v #起動テスト: Test starting r8s. You will see the version. r8s version 1.71 (compiled Dec 12 2007) r8s version 1.71 (Dec 12 2007) r8s>quit #起動テスト終了: quit r8s. $ cd /home/user1/r8s1.71/sample #sampleファイルのディレクトリに移動: Move to the sample directory $ ls SAMPLE_1.7 SAMPLE_CROSSVAL SAMPLE_LOCAL_CLOCK SAMPLE_SUPERTREE SAMPLE_CONSTRAINTS SAMPLE_FLU SAMPLE_SIMPLE $ r8s -f SAMPLE_SIMPLE #sampleファイルを一つ解析してみる。結果がすぐに表示される。 Analyze one of the sample file. You will see the result soon.
make -f Makefile.gcc
Installation of PAML etc to /usr/local/bin/
これらのファイルはWindowsの実行形式ファイルがダウンロードでき、のコマンドプロンプトというコマンドラインインターフェースからでも実行できる点が、上でコンパイルしたr8sと異なっています。ただ、コマンドプロンプトを使う場合、パスの設定が面倒な場合があります。また、cygwinの機能(シェルなど)を使う方が、コマンド入力や解析が便利な場合があります。そこで、実行形式ファイル(exeファイル)をパスの通ったc:\cygwin//usr/local/binにまとめておきましょう。
To use PAML and Multidivtime easier, I recommend you to install them under c:\cygwin/home/user1/.
baseml.exe basemlg.exe chi2.exe codeml.exe evolver.exe mcmctree.exe pamp.exe TreeTimeJeff.exe yn00.exe
$ ls /usr/local/bin TreeTimeJeff.exe basemlg.exe codeml.exe mcmctree.exe r8s.exe baseml.exe chi2.exe evolver.exe pamp.exe yn00.exe
$ ls /home/user1 paml4
$ cd /home/user1/paml4 $ codeml #解析結果が画面に表示される
estbranches_aa.exe estbranches_dna.exe multidivtime.exe paml2modelinf.exe
$ ls /usr/local/bin TreeTimeJeff.exe chi2.exe estbranches_dna.exe multidivtime.exe r8s.exe baseml.exe codeml.exe evolver.exe paml2modelinf.exe yn00.exe basemlg.exe estbranches_aa.exe mcmctree.exe pamp.exe
Other useful softerwares under cygwin environment