Excelは本当に便利なソフト。前回やったような簡単な計算だけでなく、データの整形、並べ替え、データの集計の他、グラフ作りや、本格的なデータ解析など、本当にいろんなことができる。授業で全てを紹介する時間は無いので、生物学でよく使うデータ解析の手法をいくつか修得して貰う。
アンケート調査の結果をみると、K2Editorの操作と正規表現やエクセルの操作が難しいという意見がちらほら。こういう技術を習得するには、とにかく使って慣れるしかないので、今日もいくつか練習、練習。今後の講義でも、1回の授業で最低1回は、正規表現検索・置換を(ムリヤリでも)利用するつもり。
前回のレポート課題を採点してみると、
パチパチパチ! 提出者34名全員が満点です!! 皆さん、すごいねー。 TAの五十畑君も脱帽です。
(一人だけ、.を入力し忘れて 15691%としている人がいましたが、おまけしておきました)
こんなにできの良い皆さんには釈迦に説法かもしれないけれど、一応、操作をおさらいしておこう。
テキストデータを"タブ"で区切れば、エクセルの表に簡単に移せる |
操作手順は次の通り:【この辺りの操作はもう理解していて暇だという人は、千葉大学平成18年度決算報告PDFをつかって同じことができるかどうか、挑戦してみよう】
検索文字: (注:半角空白1つだけ指定) 置換文字: ¥t (注:半角の¥マークと半角のt)
と指定し、正規表現のところの□とファイルの先頭からという□をチェックして「全て置換」
↓この操作により、K2Editorに貼り付けたテキストで、半角の空白が全てタブに置換される
これで、千葉大学の1年間の総収入のうち、皆さんの授業料、入学料、検定料が占める割合は15.7%ぐらいだと分かりました。ついでに同様の操作で、業務費のうち教育研究経費に占める割合をみてみると、42.5%ということが分かる。
これからの学生生活で、皆さんはきっといろんなデータを集計する機会に出会うはず。例えば、名簿、部費の管理、アンケート調査の結果、そしてもちろん、実験データ。こういうデータは必ずしも、いつも最初からエクセルに入力されている訳ではない。たとえば、メールで受信した解析データをエクセルで集計したい場合もあるはず。そんなときにもやっぱり、
データの区切りをタブに置換して、エクセルで集計!
では、https://cuacmsrv.chiba-u.jp/am_bin/am_main.cgi/login にアクセスして、メールで送信してあるサンプルデータを受信してみよう。下の囲みの中のようなデータが届いているはずだ。
区画No.1 カラスノエンドウ 5 セイヨウタンポポ 2 オランダミミナグサ 10 オオバコ 1 スズメノテッポウ 8 キュウリグサ 5 区画No.2 キュウリグサ 1 スズメノテッポウ 3 オランダミミナグサ 1 区画No.3 カラスノエンドウ 10 オランダミミナグサ 12 ヘラオオバコ 5 ヤセウツボ 3 キュウリグサ 8 スズメノテッポウ 5
このデータでは、区画ごとに、種名と出現個体数が書かれている。これをエクセルで
区画No. 種名 出現個体数 日付(<日付については後ほど手入力>)
という形で集計したい。
手順をちょっと自分で考えて、やってみよう。
種名<半角スペース2個>数字という並びが見えてくる。
検索文字列: +(注:半角スペースと半角+の2文字) 置換文字列:¥t(注:半角¥マークと半角t)
これでテキストファイルからエクセルへのデータの移動はできたが、まだ、
区画No. 種名 個体数 日付(<日付については後ほど手入力>)
という形にはなっていない。特に、データ行の上には見出し行を作り、それぞれの列の見出しを書いておく必要がある。そこで、エクセルの上で、行の挿入、コピー・ペースト等を使って、下の様な形に整形する。(操作方法は前方スクリーンで示す)。
ついでに、上の図のように、日付も入力しておこう。1つ入力したら、あとは、コピー・ペースト。
これで集計の準備はできた。
Excelはデータを表の形式で簡単に集計できる素晴らしいソフト。前回紹介した計算機能だけでは無く、データを並び替えたり、おなじものをまとめて計算したりする機能もついている。このうち、'データの'並び替え''(ソートともいう)は、大量データを扱う上で、絶対に知っておかなければならない方法なので、必ず習得して欲しい。
ぱっと見で分からなくても、並べ替えたり、集計したりすると、何かが見えてくる
では、サンプルデータを見てみよう。ここで、
全部のデータを合わせたとき、どの種の個体数が最も多いか
を知りたいと思ったのだが、この表では、同じ種がばらばらに出てくるのでわかりにくい。そこで、「種名」で並べ替えてみる
これで、同じ種名のものが近くにまとまったので、全部のデータを合わせたとき、どの種の個体数が最も多いかかがわかる。
並び替えでは2つの並べ替えキーを設定することもできる。先の並び替えの2番目のキーに「個体数」を指定して並べ替えてみよう。
上の並び替えで、どうやらオランダミミナグサの個体数がもっとも多いとわかるのだが、実際に何個体現れたのかを知ろうと思うと、いちいち計算しなければならくて面倒。そういうときにエクセルの「集計」機能を使って、自動的に計算させる。
重要事項:集計する前にグループの基準になる項目で必ず並べ替えておくこと
グループの基準: 種名 集計の方法: 合計 集計するフィールド:個体数
エクセルで集計はできたのだが、数字をみて傾向をつかむのはなかなか難しい。そこで、データをグラフにして表現する。グラフにすることによって、データの大小の程度や全体の傾向が一目で分かるようになる。
データをグラフで表現する場合に、どのグラフを使えば良いかを考える。データの持つ傾向をみるためにいろいろなグラフを試すのはいいが、人にグラフを見せるときには、そのグラフで何を言いたいのかを十分に検討して、それに適したグラフを選ぼう。データで言いたいことに適さないグラフを使うと、言いたいことが伝わらないだけでなく、余計な誤解を与えることになりかねない。エクセルで使える代表的なグラフは次のようなもの:
それぞれ、
では、上の集計データから、種ごとの個体数の合計値をグラフで表してみよう。
<範囲のところに何か文字列が入っていたら消しておく>「種名」と「個体数」の見出し行を含めて、「ヤセウツボ」までのデータをマウスで選択
先ほどのグラフは1つの系列(データの並び)だけを指定したグラフだったので、すごく簡単な操作で自動的にグラフができた。今度はそれぞれの区画毎に現れる種数をグラフで表示してみよう。この場合、系列は3つになる。また、共通している項目が全てに必要になるため、もとの表を次のように整形する(出現しない種名についても0というデータを追加する)。
区画\種名 | オランダミミナグサ | カラスノエンドウ | キュウリグサ | スズメノテッポウ | セイヨウタンポポ | オオバコ | ヘラオオバコ | ヤセウツボ |
1 | 10 | 5 | 5 | 8 | 2 | 1 | 0 | 0 |
2 | 1 | 0 | 1 | 3 | 0 | 0 | 0 | 0 |
3 | 12 | 10 | 8 | 5 | 0 | 0 | 5 | 3 |
./05
*第5回授業・基本課題 **氏名:
-今日の授業の進み方は?(はやい、丁度いい、おそい) --回答: -今日の授業の難しさはどう感じましたか(簡単 丁度いい 難しい): --回答: -難しいと答えた人は、特にどの点が難しかったですか?: --回答: -今日の授業は(分かった 半分ぐらいは分かった 分からなかった): --回答: -分からないと答えた人は、特にどの点が分からなかったですか?: --回答: -今日の講義で分からなかった用語があったら挙げてください: --回答: -高校までに習った英語、数学、国語、理科、社会のうち、どの教科が社会に出てから最も重要だと思いますか? --回答:
添付の方法: ・画面上部のメニューから「添付」をクリック ・「選択」ボタンをクリックして、添付すべきファイルを探す ・アップロード