*このページは編集中です [#r9251111]
*Rを使ったシミュレーション:「遺伝的浮動」を実感してみよう! [#kd9034ec]
#ref(授業/H18/情報処理/10/drift.gif,around,right,80%)
上で説明してきたことで、プログラミングの基本は終わりです。もう皆さんは、繰り返しと条件分岐を使って、かなり複雑な処理ができるはずです。そこで、いよいよ実践に移りましょう。
~右の図は見たことはありますか?これは、遺伝的浮動のシミュレーションの結果で、集団サイズN=100, 対立遺伝子が2つのとき、片方の対立遺伝子の頻度の変化を表したものです。。最初の世代の対立遺伝子の数は50:50。このグラフを使って、遺伝的浮動とはどういうものか、説明できる人はいますか?また、このグラフはどうやって作ったものですか?

 こんな図を作るのはとうてい無理と思っちゃうかもしれません。でも、Rを使ってプログラミングすると、わりと簡単に描けてしまいます。

 そこで、ここから先は実践編として、「遺伝的浮動」のシミュレーションをやることにしました。このテーマを選んだ理由は、「生物学科の皆さんになじみが深い」、「Rをつかってやってみて見た目が面白い」、「思ったよりはプログラミングが簡単」というこです。さらに、私にとっては初めて自分で挑戦したシミュレーションで、できあがったグラフを見たときにはかなり嬉しかったものです。 

 なお、シミュレーション(simulation, 「シュミレーションでは無いですよ!」)は、数学モデルなどを用いて現実に似た状況をコンピュータ上で再現することです。模擬実験とも呼ばれています。(大量の計算を必要とするので、Rのようなインタプリタ型のソフトでは、大規模なシミュレーションは難しいです)

**0. シミュレーションの前段階:モデルの想定 [#g314d5f0]
 これからシミュレーションを行うのですが、つぎのような状況を想定してみましょう。
#ref(授業/H18/情報処理/10/mona2.gif,around,right)
#ref(授業/H18/情報処理/10/mona1.gif,around,right)

まず、対象とする架空の生物(仮に、「モナー」と呼びます&size(11){(注:モナーについて詳しく知りたい人は、ウィキペディアで「モナー」を検索してみてください。)};)は2倍体の生物で、雌雄の区別が無く、繁殖期になると集団内の個体が一斉に配偶子を数千億個ずつ放出して死亡します。配偶子は生息域の空間内をランダムに漂った後、24時間後に、最も近くにある配偶子と接合し、新しい繁殖個体になります。集団の生息域は空間的に限られているため、親世代と同数の子供個体しか、成熟個体になれません。どの子供が成熟個体になるかは、ランダムに決まるものとします。つまり、このモデルだと、世代間で集団サイズに変動は無いということです。モナーにはトンガリ耳と丸耳の2タイプが1対立遺伝子(A, a)で決まることが知られています。トンガリ耳の遺伝子型は(AA, Aa)、丸耳の遺伝子型は(aa)です。

&size(11){なお、上のモナーの説明は、私が今回のシミュレーションのために、適当に設定したものです。だって、''「任意交配をする有限サイズの生物集団から遺伝子をランダム抽出して、同サイズの次世代集団を作った」''なんて言い方をするよりは、生物を扱ってる感じがするでしょ?};

**1. 初めてのシミュレーション:10個体からなる集団における、遺伝子頻度変化のシミュレーション [#zeb9f52b]
 モナー10個体からなる、1つの集団を考えてみましょう。いまこの集団で、対立遺伝子Aの頻度が0.5, 対立遺伝子aの頻度が0.5のとき(10個体だから遺伝子の総数は、20個です。そのうち半分の10個がAで、10個がaです)。集団中の配偶子の接合はランダムに起こると仮定して、100世代の間に、集団中の対立遺伝子の頻度はどのように変化するでしょうか?

&ref(授業/H18/情報処理/10/slide5.gif,30%); &ref(授業/H18/情報処理/10/slide6.gif,40%);

 今から実験をするのですから、前もって予想しておいた方が面白そうです
 この集団の遺伝子頻度が1か0に固定するまでに、何世代ぐらいかかると思いますか?
 0-25  26-50  51-75  76-100  100<

それでは、次のプログラムを走らせて、20個の遺伝子中対立遺伝子aが10個ある任意交配集団の、100世代の間のaの遺伝子頻度の変化をみてみましょう。

 numa=10                     #対立遺伝子aの集団中の個数
 for(i in 1:100){            #この行から対応する}までの間を 100世代分繰り返す
  counta=0                        #次世代にランダムに残るaの値を入れる変数を初期化
 numa = __                   #対立遺伝子aの集団中の個数を numa という変数で表す。今回は10個がaであるとする
 numgen = ___                #何世代について観察するかを numgen で表す。今回は100世代観察することにする
 for(i in 1:numgen){            #この行から対応する}までの間を numgen で指定された100世代分繰り返す
  counta=0                        #次世代にランダムに残るaの値を counta という変数に入れる。初期化して0にする。
    for(j in 1:20){               #数千億からなる配偶子プールから1個の配偶子を取り出す試行を20回行う
      if ( runif(1) < numa/20  ){    #乱数を一つ発生させ、それが対立遺伝子aの頻度(a/20)よりも小さければ
        counta=counta+1              #aの個数を入れるcountaという変数の値を1つ増やす
      }
    }
  out=c(i, counta/20)             #何世代目かを表す数字(i)と対立遺伝子aの頻度(a/20)をoutというオブジェクトに入れる
  print(out)                      #outの内容を画面に表示する
  numa=counta                     # aの値を新しい世代の対立遺伝子aの個数(counta)で置き換える
 }


**遺伝的浮動のプログラムをステップ・バイ・ステップで理解する [#s1b6e76c]
//-&ref(授業/H18/情報処理/10/slide5.gif,around,right,40%);
上のプログラム、ここまで説明してきた
 繰り返し
 代入
 条件分岐
だけからできていますね。目新しいものと言えば、
 runif()  乱数を一つ発生させる。runif(1)とした場合、0から1までの間の値を1つ発生。
だけです。では、作成過程を1つずつ、順を追って説明します。
だけです。

いろんなアルファベットで変数の名前が書かれているので分かりにくいのかもしれません。変数の値を日本語で書くと、こうなります(でも、プログラムが見づらくなるので、変数名に日本語を使うことは、あまりやりません)。でも、Rでは変数の名前が日本語でも動作しますので、やってみてください。
 対立遺伝子aの数 = 10        #対立遺伝子aの集団中の個数を10個がaであるとする
 繰り返し世代数 = 100        #今回は100世代観察することにする
 集団サイズ = 20             #1集団内の遺伝子の総数を集団サイズと呼ぶ。今回は20。
 for(i in 1:繰り返し世代数){    #この行から対応する}までの間を100世代分(「繰り返し世代数」の値)繰り返す
  カウンタ=0                      #次世代にランダムに残るaの値を カウンタ という変数に入れる。初期化して0にする。
    for(j in 1:集団サイズ){          #配偶子プールから1個の配偶子を取り出す試行を集団サイズの数繰り返す
      if ( runif(1) < 対立遺伝子aの数/集団サイズ  ){    #乱数を一つ発生させ、
                                                        #それが対立遺伝子aの頻度よりも小さければ
        カウンタ = カウンタ + 1              #aの個数を入れるcountaという変数の値を1つ増やす
      }
    }
  結果=c(i, 対立遺伝子aの数/集団サイズ)  #何世代目かを表す数字(i)と対立遺伝子aの頻度を結果というオブジェクトに入れる
  print(結果)                      #outの内容を画面に表示する
  対立遺伝子aの数=カウンタ         # 対立遺伝子aの数を新しい世代の対立遺伝子aの個数(カウンタの値)で置き換える
 }


では、作成過程を1つずつ、順を追って説明します。
+まず、前回説明した「モナーの生活環」をみて、シミュレーションの条件を自分で考える。最初のシミュレーションなので、簡単に、
 20個の遺伝子からなる集団
 0世代目の対立遺伝子aの数が10(つまり対立遺伝子aの頻度は0.5)
 この集団を100世代観察する
という条件にしておく
+今、上に書いた数字に自分で考えた変数名をつける。名前を付けておくと、あとでコンピュータに命令すときに便利だから。数値が決まっているものは代入しておく。名前は、Rの内部で使われているもの以外なら、何でも良い。自分に分かりやすいようにつける。
 *自分で考えた変数名と定数
 numa=10   #0世代目の対立遺伝子aの数。2世代目以降は、シミュレーション実験で抽出されたaの数が代入される
 counta=0    #配偶子プールから、次世代の集団に取り出された対立遺伝子aの数。1世代が終わったあとで、
              数字が入るので、とりあえず今は0を入れておく
 20  #集団の大きさ(つまり、集団に含まれる遺伝子の数)
 100  #繰り返しの世代数
&ref(授業/H18/情報処理/11/slide10-1.gif,40%);
&ref(授業/H18/情報処理/11/slide10-2.gif,40%);
+変数名が決まったら、プログラムの構造を考える。紙に絵をかいて、どういうプログラムなら、「モナー」の生活環を模倣できるか考えたら、言葉にしてみる。
 *自分で考えたプログラムの構造。コマンドを使って書かなくても、
   とりあえず、構造が理解できるように書いてあればよい。
&ref(授業/H18/情報処理/11/slide10-3.gif,40%);
++何世代分か、以下の操作を繰り返す
++ 1つの世代の中では、配偶子プールから配偶子を1つ選ぶという操作を20回(遺伝子の数)繰り返す
++   取り出した配偶子が対立遺伝子aだったら、変数countaの値を一つ増やす。そうでなかったら何もしない
++ 集団内で、20回配偶子を取り出す繰り返しが終わったら、対立遺伝子aの数を numaに代入する
++次世代の集団における対立遺伝子aの頻度(num/20)をプリントする
+プログラムの構造ができたのだから、次ぎに、一つ一つのステップを、コンピュータが理解できる文で表現してみる。
++まず、100世代この集団を観察するのだから、繰り返し文で100回繰り返す構造が必要になる。
 *100回繰り返す繰り返し文の構造
 for(i in 0:100) {
       <※ここに繰り返される内容が入る>
 }
++1世代で行われる操作(上の※の部分)は、1つの集団から配偶子を親の集団と同数(つまり、20個)取り出すという繰り返し操作。なので、上の100回繰り返すfor文の中には、さらに、集団中の遺伝子の数だけ繰り返すfor文が入る
 ※集団中の遺伝子数分、つまり、20回繰り返す文
    for(j in 0:20) {
      <※※ここに繰り返される内容が入る>
    }
++上のfor文の中では、配偶子プールからpopsize個取り出した配偶子の中に、対立遺伝子aがいくつ含まれているかを数えること。そのとき、
  ※※の操作:
   「配偶子を一つ取り出すとき、遺伝子頻度の確率で、対立遺伝子aをひく。もし、対立遺伝子aを引いたら、
     aの数を入れておく変数(counta)の値を1つ増やす」
  &size(24){=};  &ref(授業/H18/情報処理/11/slide10-4.gif,40%);   &ref(授業/H18/情報処理/11/slide10-5.gif,40%);
   上の『対立遺伝子aを引いたら』(このことは対立遺伝子頻度aの確率で生じる)というのは、
    『乱数を一つ発生させたとき、それが対立遺伝子頻度aより低かったら』(これも対立遺伝子頻度aの確率で生じる)と
   同じことと考える。そこで、
  「乱数を一つ発生させたとき、それが対立遺伝子頻度aより低かったら、
     aの数を入れておく変数(counta)の値を1つ増やす」
---ここが理解されなかったら、Rを使ってrunif(20)を表示させる。0.5より小さい値の数を数えて、次世代の集団の対立遺伝子aの頻度とし、もう一度Rを使って乱数発生。この操作を3回ぐらいやる
++上の操作を、20回繰り返したら、countaという変数には、取り出された対立遺伝子aの数(countaという名前にしてある)が入っているはず。この値は、次世代の集団における対立遺伝子aの数なので、次世代(つまり、外側のfor文の次の繰り返し)に渡さなければならない。そこで、numaという変数にcountaの値を代入して、次の繰り返しに渡す。countaという変数は、次の繰り返しでまた、0からaを数えなければならないから、ここで0を代入して、初期化しておく
  ・内側のfor文の繰り返しが1回終わったら
   numa = counta
   counta = 0
++次の世代でも上と同じことを繰り返すが、集団内の対立遺伝子頻度は、前の世代の対立遺伝子頻度で決まる。



**2. 対立遺伝子aの初期値を自由に変更できるように、関数にしてしまう。 [#kd03c7e0]
これでは使いにくいので、aの値を自由に変更できる関数を定義してみましょう。「関数の定義」なんていうと難しそうですが、ようするに、作ったプログラムに名前をつけて、いろいろと数値を変えて解析できるようにすることです。

 drift1=function(a){       #関数定義の始まり
                              #上にあった、a=10 という命令は削除。この関数では、aの値を自由に変えられる  
  for(i in 1:30){             
    counta=0                  
    for(j in 1:20){           
      if ( runif(1) < a/20  ){  
       counta=counta+1         
      }
    }
    out=counta/20        
    print(out)                 
    a=counta                   
   }
 }                      #関数定義の終わり

さっきのプログラムの上下を関数を定義する関数であるfunction(){}で囲んで、オブジェクトに代入するだけですから、簡単です。この関数を実行するには、最初aの値を()の中に入力して、
 drift1(10)
とします。

↑を使って何回も実行してみると、結果がいろいろ変わるのがわかりますよね。

**3.結果をグラフ表示。前につかったplot()関数 [#xdaae7e5]
では、せっかく結果が出たのだから、グラフにしてみましょう。でも、その前に、以前使ったplot()という関数を思い出してみましょう。
 x=c(1,2,3,4,5)
 plot(x)
plot()という関数は、ベクトルの内容をプロットしてくれるのでした。そうすると、今のdrift1関数の実行結果はどうやれば表示できるでしょうか?

 関数を実行した結果が全て、一つのオブジェクトにベクトルとして格納されていれば良い。例えば:
 0.6, 0.55, 0.65, 0.8, 0.95, 1, 1, 1, ...
これをやるには、上のout=count/20としているところを、次から次へとベクトルの要素を付け加えるようにすれば良さそうです。ベクトル要素を付け加える関数が
 append()
です。
 results=append(results, a/20)
と書けば、resultsというベクトルにa/20の値が追加されます。但し、ひとつだけ重要な注意があります。
 resultsというベクトルはあらかじめ存在していなければ、append()は使えない
つまり、for文を使って繰り返しを行う前に、
 results=c()
という命令で、空ベクトルを作っておく必要があるのです。

 では、まず、結果をresults()に入れてベクトルで返すような変更を、上のプログラムに加えて見ましょう

 drift2=function(a){ 
  results=c()       #空ベクトルを作る
  for(i in 1:30){             
    counta=0                  
    for(j in 1:20){           
      if ( runif(1) < a/20  ){  
       counta=counta+1         
      }
    }
    results=append(results, a/20)   #ここにあった out=counta/20 の代わりに、append()関数でベクトル作成
    a=counta                   
   }
     print(results)                 #printの文はfor文の外に出したことに注意!理由は分かりますよね
 }                      

これで
 [1] 0.50 0.60 0.80 0.70 0.55 0.50 0.35 0.40 0.20 0.30 0.1....
というベクトルが表示できました。これをplot()でグラフにするには、
 plot(drift2(10))
とやるだけです。


しかし。。。ちょっと待てよ?どうせなら、関数の中にplot()を入れてしまえばすぐにグラフが表示されるのでは?
 drift3=function(a){ 
  results=c()       #空ベクトルを作る
  for(i in 1:30){             
    counta=0                  
    for(j in 1:20){           
      if ( runif(1) < a/20  ){  
       counta=counta+1         
      }
    }
    results=append(results, a/20)   
    a=counta                   
   }
     plot(results)     #ここにあった print文の代わりに、plot()でグラフ表示
 }

グラフがすぐに表示できました!でも、点々では見にくいので、線で結んでみましょう。plot()のところを、
 plot(results, type="l")
とかえるだけです。

 drift4=function(a){ 
  results=c()       #空ベクトルを作る
  for(i in 1:30){             
    counta=0                  
    for(j in 1:20){           
      if ( runif(1) < a/20  ){  
       counta=counta+1         
      }
    }
    results=append(results, a/20)   
    a=counta                   
   }
     plot(results, type="l")     #ここにあった print文の代わりに、plot()でグラフ表示
 }

**4.何回もの計算結果を、一つのグラフにまとめて表示したい [#qa15e0db]
 上で作ったプログラムを何度も走らせてみると、グラフの形がどんどん変わります。これはこれで面白いのですが、グラフの軸が一定していないし、1つのグラフに結果が重ねて表示されないので、ちょっと感じがつかめませんね。

そこで、いっそのこと、この実験を20回ぐらい繰り返してみて、結果を1つのグラフに表示させることにしましょう。同じことを何度も繰り返すのですから、for文をもう一つ、外側に作ればいいって、容易に想像がつきますよね?

 drift5=function(a){ 
  for(i in 1:20){           #これまでのプログラムの外側に新しく作ったfor文。20回繰り返す。
    results=c()       
    for(j in 1:30){             
      counta=0                  
      for(k in 1:20){           
        if ( runif(1) < a/20  ){  
         counta=counta+1         
        }
      }
      results=append(results, a/20)   
      a=counta                   
     }
       plot(results, type="l") 
  }                        #新しく作ったfor文の終わり。ここまで繰り返し。
 }

さあ、走らせてみましょう。
 drift5(10)

あれ?なんか変ですね。最後は0.0で線が一本でるだけです。
 なぜだか分かりますか?
こたえは、aの値です。最初、aは10で与えられましたが、1集団分の繰り返しが終わった後、次の繰り返しの前に、下の数字に戻すのを忘れていました。

 drift5=function(a){ 
  firsta=a            #関数に渡された(つまり()の中に書かれた)aの値をfirstaというオブジェクトに保存
  for(i in 1:20){     #これまでのプログラムの外側に新しく作ったfor文。20回繰り返す。
    a=firsta          #繰り返しの最初に、aの値を初期値(firsta)に戻す
    results=c()       
    for(j in 1:30){             
      counta=0                  
      for(k in 1:20){           
        if ( runif(1) < a/20  ){  
         counta=counta+1         
        }
      }
      results=append(results, a/20)   
      a=counta                   
     }
       plot(results, type="l") 
  }                        #新しく作ったfor文の終わり。ここまで繰り返し。
 }

できました。実行してみましょう。ウーン。。。うまくいってるようなのですが、1回ずつ、グラフが変わっちゃいます。グラフを重ねて描くには、par(new=T) というコマンドをplot()の前に使います。
 
 drift5=function(a){ 
  firsta=a            #関数に渡された(つまり()の中に書かれた)aの値をfirstaというオブジェクトに保存
  for(i in 1:20){     #これまでのプログラムの外側に新しく作ったfor文。20回繰り返す。
    a=firsta          #繰り返しの最初に、aの値を初期値(firsta)に戻す
    results=c()       
    for(j in 1:30){             
      counta=0                  
      for(k in 1:20){           
        if ( runif(1) < a/20  ){  
         counta=counta+1         
        }
      }
      results=append(results, a/20)   
      a=counta                   
     }
       par(new=T)     #複数のグラフを重ね合わせる
       plot(results, type="l") 
  }                        #新しく作ったfor文の終わり。ここまで繰り返し。
 }

あれれ?そうか。始点の軸が固定されていないから、ずれちゃってますね。plot()関数にはylimというオプションがあって、y軸の目盛りを0から1に固定するには、次のように書きます。

 drift5=function(a){ 
  firsta=a            #関数に渡された(つまり()の中に書かれた)aの値をfirstaというオブジェクトに保存
  for(i in 1:20){     #これまでのプログラムの外側に新しく作ったfor文。20回繰り返す。
    a=firsta          #繰り返しの最初に、aの値を初期値(firsta)に戻す
    results=c()       
    for(j in 1:30){             
      counta=0                  
      for(k in 1:20){           
        if ( runif(1) < a/20  ){  
         counta=counta+1         
        }
      }
      results=append(results, a/20)   
      a=counta                   
     }
       par(new=T)     #複数のグラフを重ね合わせる
       plot(results, type="l", ylim=c(0,1))   #y軸の目盛りを0から1に固定する
  }                        #新しく作ったfor文の終わり。ここまで繰り返し。
 }

いよいよ完成にちかづいてきました。図が重なって見にくくなったら、
 >frame()
 か
 >plot.new()
で図を新しく書き直して下さい。


**5.もっと大きな集団サイズで解析してみたい。 [#u93d3778]
 何回かグラフを描かしてみると、わりとすぐに固定してしまうことがわかりますね。じゃあ、もっと、集団サイズがもっと大きかったらどうなるか気になってくるでしょ?

 どうすればよいか?プログラムの中で、集団サイズを20に指定しているところを100とかに変更してもいいのですが、どうせなら、関数に値を渡すときに、指定できれば、つまり、
 drift(繰り返し数, 世代数, 集団サイズ, 対立遺伝子の数)
とか指定して実行できれば、好きな大きさの集団で、好きな数だけ、シミュレーションを繰り返せますよね。さっきのプログラムで、数値で指定してあったところを変数に置き換えるだけですから、そんなに難しくなさそうです。

では、やってみましょう

 drift6=function(x, y, z, a){ 
  plot.new()         #ついでに、図を新しく書き直すという関数をここに追加しました
  firsta=a            
  for(i in 1:x){     #上のプログラムでは20でしたが、ここでは、x回繰り返す。
    a=firsta         
    results=c()       
    for(j in 1:y){   #上のプログラムでは30だったけど、ここではy世代繰り返す。           
      counta=0                  
      for(k in 1:z){ #上のプログラムでは20だったけど、ここでは集団サイズはz。
        if ( runif(1) < a/z  ){  #上のプログラムでは20だったけど、ここでは集団サイズはz。
         counta=counta+1         
        }
      }
      results=append(results, a/z)    #上のプログラムでは20だったけど、ここでは集団サイズはz。
      a=counta                   
     }
       par(new=T)     
       plot(results, type="l", ylim=c(0,1))  
  }                        
 }

できちゃいました。
あんまり大きい数字を入れると計算にすごく時間がかかります。途中で終了したいときは、 ESC キーを押してください。

**演習: [#v54b4118]
下のプログラムは遺伝的浮動をシミュレートするRのプログラムです。シミュレーションで観察する集団の数(num_repeats)、1集団あたり観察する世代数(num_generations)、集団サイズ(遺伝子数)(size_population)、0世代目における対立遺伝子aの数(num_a_allele)を与えて実行すれば、、ランダムに選ばれる遺伝子が、次世代の集団の遺伝子頻度にどのように影響するかを、シミュレートする集団の数だけグラフに(色つきで)表示することができます。下のプログラムを見て以下の問に答えなさい。

 drift= function(num_repeats,num_generations,size_population, num_a_allele){
	 results=c()
         a=num_a_allele
	 for(i in 1:【1】){
		  for(j in 1:【2】){
		      count_a=0
		       for(k in 1:size_population){
			    if ( runif(1) < a/【3】 ){
			     count_a=count_a+1
			    }
		       }
		       a=count_a
		       results=append(results, a/size_population)
		  }
		  a=num_a_allele
	 }
	 rmatrix=matrix(results, nrow=num_generations, ncol=num_repeats)
	 return(matplot(rmatrix, type="l"))
 }

-問1: プログラム中【1】〜【3】に入る変数名を、下のリストから選びなさい
 num_repeats, num_generations, size_population, num_a_allele
--それぞれの変数は次のような意味を持っています
---num_repeats : シミュレーションを行う集団数(1つの集団についてある世代数だけ観察するという実験を、何回(何個の集団について)おこなうか)。つまり、何本の折れ線グラフを表示させるか
---num_generations : 1つの集団について何世代観察するか。x軸の長さになります。
---size_population : 集団のサイズ、つまり、1つの集団に含まれる遺伝子の数
---num_a_allele : aアリルの数(つまり、この値をnum_populationで割ったものが、0世代目でのaアリルの遺伝子頻度になる)

-問2: 上のプログラム中、【1】〜【3】を問1で答えた変数で置き換え、次の2つの場合を実行しなさい。
 1. 実験の繰り返し数10回、1集団での観察世代数500世代、集団サイズ(遺伝子数)200, 初期状態での対立遺伝子aの数100
 2. 実験の繰り返し数10回、1集団での観察世代数100世代、集団サイズ(遺伝子数)20, 初期状態での対立遺伝子aの数10
 実行するための命令文と、結果のグラフを、1, 2のいずれの場合についても、課題提出ページに貼り付けなさい(注:1番目のシミュレーションの実行には、数分かかるかもしれません)
-問3: 上の2つのグラフを比較して分かったことを述べなさい。


-------------------------------
*時間があったら説明: いろんなシミュレーション [#he54915e]

**7.丸耳の表現型(aaで示されるもの)の集団内での表現型頻度をグラフで表示 [#o15e8af8]
 drift6=function(x, y, z, a){ 
  plot.new()         #ついでに、図を新しく書き直すという関数をここに追加しました
  firsta=a            
  for(i in 1:x){     #上のプログラムでは20でしたが、ここでは、x回繰り返す。
    a=firsta         
    results=c()
    results_p=c()       
    for(j in 1:y){              
      counta=0
      count_p=0
      count_p_type=0        
      for(k in 1:z){ 
        if ( runif(1) < a/z  ){  
         counta=counta+1
        }
        if (k%%2 != 0){              #jが奇数のとき
           if ( runif(1) < a/z  ){     #もし2つの遺伝子のうち最初のものがaならば
             count_p=count_p+1         #count_pの値を1増やす
           }
        } else {                     #jが偶数のとき
           if ( runif(1) < a/z  ){    #もし2つの遺伝子のうち最初のものがaならば
             count_p=count_p+1        #count_pの値を1増やす
           }
           if(count_p == 2){         #連続する奇数回・偶数回で合計したpの値が2ならば(つまり、aが2個だったら)
             count_p_type=count_p_type+1  #count_p_typeの値を1増やす(aaとう表現型が1つあると数える)
           }
           count_p=0                 #2個数え終わったら、count_pの値を初期化
        }
      }
      results=append(results, a/z)    
      results_p=append(results_p, count_p_type/(z/2))  #results_pに集団内のaaの頻度(count_p_type/z/2)を入れる
      count_p_type=0                                 #count_p_typeの値を初期化
      a=counta                   
     }
       par(new=T)     
       plot(results, type="l", ylim=c(0,1))  
       par(new=T)     
       plot(results_p, type="l", ylim=c(0,1), col="blue")  #aaの頻度を青線で表示する
  }                        
 }

**8.選択係数sで、丸耳の表現型(aa)を集団から排除してみよう [#zea292e6]
  drift6=function(x, y, z, a, s){ #選択係数sでaaが集団から排除される
  plot.new()         
  firsta=a            
  for(i in 1:x){     
    a=firsta         
    results=c()
    results_p=c()       
    for(j in 1:y){              
      counta=0
      count_p=0
      count_p_type=0        
      for(k in 1:z){ 
        if (k%%2 != 0){              #jが奇数のとき
           if ( runif(1) < a/z  ){     #もし2つの遺伝子のうち最初のものがaならば
             count_p=count_p+1         #count_pの値を1増やす
           }
        } else {                     #jが偶数のとき
           if ( runif(1) < a/z  ){    #もし2つの遺伝子のうち2番目のものがaならば
             count_p=count_p+1        #count_pの値を1増やす
           }
           if(count_p == 2){         #連続する奇数回・偶数回で合計したpの値が2ならば(つまり、aが2個だったら)
             if (runif(1) < s) {      #遺伝子型がaaのとき乱数を一つとって、それが選択係数より小さければ
               k=k-2                  #jの値から2を引いて
               count_p=0              #count_pを初期化し           
               next                   #強制的に次の繰り返し
             } else {
               count_p_type=count_p_type+1  #count_p_typeの値を1増やす(aaという表現型が1つあると数える)
             }
          }
           counta=counta+count_p
           count_p=0                 
        }
      }
      results=append(results, a/z)    
      results_p=append(results_p, count_p_type/(z/2))  #results_pに集団内のaaの頻度(count_p_type/z/2)を入れる
      count_p_type=0                                 #count_p_typeの値を初期化
      a=counta                   
     }
       par(new=T)     
       plot(results, type="l", ylim=c(0,1))  
       par(new=T)     
       plot(results_p, type="l", ylim=c(0,1), col="blue")  #aaの頻度を青線で表示する
  }                        
 }

**9.固定までにかかった世代数を求める関数 [#r6b6ba61]
 wtime=function(x, y, z, a){ 
 firsta=a            
 results_w=c()  
 for(i in 1:x){     
   a=firsta         
   results=c()     
   w_time=0
   for(j in 1:y){              
     counta=0                  
     for(k in 1:z){ 
       if ( runif(1) < a/z  ){  
        counta=counta+1         
       }
     }
     a=counta                   
     if((w_time==0) && ((a==0) || (a==z))) { #もしw_timeが空で、aが0かzに固定しているとき、
        w_time=j                             #w_timeにそのときに世代数jを入れる
     }
   }
   results_w=append(results_w, w_time)       #その集団における固定までの世代時間をresults_wに入れる
 }  
   return(results_w)                      
 }

**10.有限集団におけるヘテロ接合体頻度の変化 [#g5da17c3]
 drift6=function(x, y, z, a){ 
  plot.new()        
  firsta=a
  resultp_m=c()            
  for(i in 1:x){    
    a=firsta         
    results=c()
    results_p=c()       
    for(j in 1:y){              
      counta=0
      count_p=0
      count_p_type=0        
      for(k in 1:z){ 
        if ( runif(1) < a/z  ){  
         counta=counta+1
        }
      }
      results=append(results, a/z)    
      results_p=append(results_p, 2*(a/z)*(1-a/z))  #results_pに集団内のaaの頻度(count_p_type/z/2)を入れる
      a=counta                   
     }
     resultp_m=append(resultp_m, results_p)
       par(new=T)     
       plot(results, type="l", ylim=c(0,1), col="gray")  
  }                        
     rmatrix=matrix(resultp_m, nrow=y, ncol=x)
     hetero=c()
     for(i in 1:y) {
       hetero=append(hetero,mean(rmatrix[i,]))
     }
     par(new=T)
     plot(hetero, type="l", ylim=c(0,1), col="blue")
     par(new=T)
     curve(0.5*(1-1/z)^x, xlim=c(0,y), ylim=c(0,1), col="red")
 }