Excelは本当に便利なソフト。前回やったような簡単な計算だけでなく、データの整形、並べ替え、データの集計の他、グラフ作りや、本格的なデータ解析など、本当にいろんなことができる。授業で全てを紹介する時間は無いので、生物学では必ず必要になる、並べ替え、集計、グラフ作成の手法を修得して貰う。
アンケート調査の結果をみると、K2Editorの操作と正規表現やエクセルの操作が難しいという意見がちらほら。こういう技術を習得するには、とにかく使って慣れるしかないので、今日もいくつか練習、練習。今後の講義でも、1回の授業で最低1回は、正規表現検索・置換を(ムリヤリでも)利用するつもり。
前回のレポート課題を採点してみると、
パチパチパチ! 提出者37名のうち、ほとんどの人が満点(4点満点)!! 皆さん、すごいねー。
こんなにできの良い皆さんには釈迦に説法かもしれないけれど、一応、操作をおさらいしておこう。
テキストデータを"タブ"で区切れば、エクセルの表に簡単に移せる |
これからの学生生活で、皆さんはきっといろんなデータを集計する機会に出会うはず。例えば、名簿、部費の管理、アンケート調査の結果、そしてもちろん、実験データ。こういうデータは必ずしも、いつも最初からエクセルに入力されている訳ではない。たとえば、メールで受信した解析データをエクセルで集計したい場合もあるはず。そんなときにもやっぱり、
データの区切りをタブに置換して、エクセルで集計!
では、下の囲みの中のようなデータを解析してみよう。これは、千葉大の西千葉キャンパスの草地に3つの区画をつくり、それぞれの区画での植物の出現個体数をまとめたものだ。
区画No.1 カラスノエンドウ 5 セイヨウタンポポ 2 オランダミミナグサ 10 オオバコ 1 スズメノテッポウ 8 キュウリグサ 5 区画No.2 キュウリグサ 1 スズメノテッポウ 3 オランダミミナグサ 1 区画No.3 カラスノエンドウ 10 オランダミミナグサ 12 ヘラオオバコ 5 ヤセウツボ 3 キュウリグサ 8 スズメノテッポウ 5
このデータでは、区画ごとに、種名と出現個体数が書かれている。これをエクセルで
区画No. 種名 出現個体数 日付(<日付については後ほど手入力>) 1 オオバコ 1 2010/05/20 . . . . . . . . . . . . . . . . . . . .
という形で集計したい。
手順をちょっと自分で考えて、やってみよう。
この操作さえ覚えれば、調査データをその場で携帯メールに打ち込み、集計する人に送信しちゃうなんていうことができるので、とても便利。
種名<スペース>数字という並びが見えてくる。どうやらスペースには、半角と全角のスペースが混在しているようだ
検索文字列: [ ]+(注:半角と全角のスペース1文字以上の繰り返し) 置換文字列:¥t(注:半角¥マークと半角t)
これでテキストファイルからエクセルへのデータの移動はできたが、まだ、
区画No. 種名 個体数 日付(<日付については後ほど手入力>)
という形にはなっていない。
この後で行う集計作業では、データ行の上には''見出し行''を作り、それぞれの列の見出しを書いておく
ことが必要だ。そこで、エクセルの上で、行の挿入、コピー・ペースト等を使って、下の様な形に整形する。(操作方法は前方スクリーンで示す)。
ついでに、上の図のように、日付も入力しておこう。1つ入力したら、あとは、コピー・ペースト。
これで集計の準備はできた。
'データの'並び替え''(ソートともいう)は、大量データを扱う上で、絶対に知っておかなければならない方法なので、必ず習得して欲しい。
ぱっと見で分からなくても、並べ替えたり、集計したりすると、何かが見えてくる
では、サンプルデータを見てみよう。ここで、
全部のデータを合わせたとき、どの種の個体数が最も多いか
を知りたいと思ったのだが、この表では、同じ種がばらばらに出てくるのでわかりにくい。そこで、「種名」で並べ替えてみる
これで、同じ種名のものが近くにまとまったので、全部のデータを合わせたとき、どの種の個体数が最も多いかかがわかる。
並び替えでは2つの並べ替えキーを設定することもできる。先の並び替えの2番目のキーに「個体数」を指定して並べ替えてみよう。
上の並び替えで、どうやらオランダミミナグサの個体数がもっとも多いとわかるのだが、実際に何個体現れたのかを知ろうと思うと、いちいち計算しなければならくて面倒。そういうときにエクセルの「集計」機能を使って、自動的に計算させる。
重要事項:集計する前にグループの基準になる項目で必ず並べ替えておくこと
グループの基準: 種名 集計の方法: 合計 集計するフィールド:個体数
万一失敗しても、集計データはすぐに消せる。
集計データを削除するには、上の集計ウィンドウで「削除」をクリック。 元データは削除されないので心配無用。 |
授業料の免除をうけている人以外は、千葉大学に年間、535,800円の学費を支払っている。月あたりの額を計算すると(つまり12で割ると)、44,650円。なかなか大きな金額だ(さらに、入学金が282,000円必要)。1年生の前期では標準的には12科目ぐらいの授業を履修しているので、1科目あたりの単価を計算すると、22,325円。1講義あたりで計算すると、1,488円。これを高いと見るか、安いと見るかはひとそれぞれだが、大学にお金を払って授業を受けている限り、支払った分だけの教育は受けたいと思うのが当然だろう。
ところで、大学に支払っている授業料は、授業のためだけではなく、図書館で閲覧できる本などにも使われている。これらの資源も、ぜひ有効に利用したいところだ。そこで、いくつか、もしかすると皆さんが気づいていない、お得な図書館資料を紹介しよう。
日経BPという出版社を知っているだろうか?書店に並ぶ、下のような雑誌を発行している出版社だ。
雑誌の出版社は違うが、日経サイエンスは、理学部の皆さんで読んだことのある人がいるかもしれない。
このページをみると、日経で出している雑誌の一覧がある: http://bizboard.nikkeibp.co.jp/daigaku/
これらの雑誌、書店で購入すると、一冊600円から1,400円ぐらいするのだが、千葉大学の皆さんは、バックナンバーを無料で読めるって知っていただろうか?学内パソコンからアクセスして、PDFで読むので、少し使いにくいかもしれないが、質の良い情報が無料で入手できるんだから、利用しない手は無い。
エクセルで集計はできたのだが、数字をみて傾向をつかむのはなかなか難しい。そこで、データをグラフにして表現する。グラフにすることによって、データの大小の程度や全体の傾向が一目で分かるようになる。
グラフにすれば、データの持つ傾向が一目で分かる! |
データをグラフで表現する場合に、どのグラフを使えば良いかを考える。データの持つ傾向をみるためにいろいろなグラフを試すのはいいが、人にグラフを見せるときには、そのグラフで何を言いたいのかを十分に検討して、それに適したグラフを選ぼう。データで言いたいことに適さないグラフを使うと、言いたいことが伝わらないだけでなく、余計な誤解を与えることになりかねない。エクセルで使える代表的なグラフは次のようなもの:
それぞれ、
では、上の集計データから、種ごとの個体数の合計値をグラフで表してみよう。
<範囲のところに何か文字列が入っていたら消しておく>「種名」と「個体数」の見出し行を含めて、「ヤセウツボ」までのデータをマウスで選択
上のようにしてグラフはできたのだが、それぞれの項目軸には、「オオバコ 計」というように「計」という文字が余分に入っている。ここで、グラフに表示されるのは種名のみにしたい(つまり「計」を消したい)。
こういう時は、エクセルの関数を使って、項目名から「計」を除いたデータを新に作成して、グラフ作成に利用してみよう。
セルの操作には関数を使おう! |
エクセルには様々な便利な'関数'がある。前回使った sum関数もその1つ。今回のように、ある文字列を消したり、別のものに置き換えたいときには、文字列の置換に使える関数: SUBSTITUTE() を利用する
substitute(文字列, 検索文字列, 置換文字列, 置換対象) 文字列 置き換える文字を含む文字列を指定します。 目的の文字列が入力されたセル参照を指定することもできます。 検索文字列 置き換える文字列を指定します。 置換文字列 検索文字列 と置き換える文字列を指定します。そこで、たとえば「オオバコ 計」(A1のセル)の右横に新しい種名を入れたいのなら、
=substitute(A1, "計", "")と入力。このとき、検索したり置換したりする文字列は、"で囲んでおく。
先ほどのグラフは1つの系列(データの並び)だけを指定したグラフだったので、すごく簡単な操作で自動的にグラフができた。今度はそれぞれの区画毎に現れる種数をグラフで表示してみよう。この場合、系列は3つになる。また、共通している項目が全てに必要になるため、もとの表を次のように整形する(出現しない種名についても0というデータを追加する)。
オランダミミナグサ | カラスノエンドウ | キュウリグサ | スズメノテッポウ | セイヨウタンポポ | オオバコ | ヘラオオバコ | ヤセウツボ | |
区画1 | 10 | 5 | 5 | 8 | 2 | 1 | 0 | 0 |
区画2 | 1 | 0 | 1 | 3 | 0 | 0 | 0 | 0 |
区画3 | 12 | 10 | 8 | 5 | 0 | 0 | 5 | 3 |
./05
*第5回授業・基本課題 **氏名: **課題への回答 -今日の授業の進み方は?(はやい、丁度いい、おそい) --回答: -今日の授業の難しさはどう感じましたか(簡単 丁度いい 難しい): --回答: -難しいと答えた人は、特にどの点が難しかったですか?: --回答: -今日の授業は(分かった 半分ぐらいは分かった 分からなかった): --回答: -分からないと答えた人は、特にどの点が分からなかったですか?: --回答: -今日の講義で分からなかった用語があったら挙げてください: --回答: --今後の授業に関する要望・質問があったらなんでもどうぞ: --回答: -高校・大学で今までに学習した教科の中で、自分にとって最も役立つと思うものは何ですか? --回答(理由もあれば嬉しいです): --課題2の答え: ---問1・性別: ---問1・年: ---問2:男性: ---問2:女性:
学籍番号.xlsというファイル名で保存して、メールの添付書類として に送信しなさい(ヒント:2つのキーで並べ替え。1列挿入して合計値を入れる。グラフに使う系列は3つ。グラフの種類の選択にも注意)。なお、メールの件名は
情報処理05(学籍番号)とすること。グラフの見やすさやエクセルの使用について、どれだけチャレンジしているかも評価の対象となります。
プロジェクト相談で出し合ったアイデアを検討して、1班5名ぐらいを目安に、班分けを行い、次回授業時間(5月21日木曜)までにリーダー1名とプロジェクトのタイトルを決めて下さい。また、リーダーはプロジェクト相談にプロジェクト名とメンバー名を記入してください。