*このページは編集中です。完成予定は2008年5月15日16:00です。 Excelによるデータ処理 [#xd2902ce]

//Excelによる作業例(アドインを使えば、こんなこともできる)。WinShotを用いた画像データの取り込み。ワープロによるレポート作成:注意すべきこと。著作権。班毎のプロジェクトについて、進め方説明。Power Pointで表題と目次のスライドを作成して提出(予習課題)。


#contents
 Excelは本当に便利なソフト。前回やったような簡単な計算だけでなく、データの整形、並べ替え、データの集計の他、グラフ作りや、本格的なデータ解析など、本当にいろんなことができる。授業で全てを紹介する時間は無いので、生物学でよく使うデータ解析の手法をいくつか修得して貰う。

**第5回授業の獲得目標:&worried; [#gf251733]

-1.正規表現検索・置換とエクセルの操作に習熟する
-2. エクセルによるデータの並び替え方法を習得する
-3. エクセルによるデータの集計方法を習得する
-4. エクセルによるグラフ作成方法を習得する

**正規表現検索・置換とエクセルの操作に習熟⌣ [#y7b37c1d]
アンケート調査の結果をみると、K2Editorの操作と正規表現やエクセルの操作が難しいという意見がちらほら。こういう技術を習得するには、とにかく使って慣れるしかないので、今日もいくつか練習、練習。
アンケート調査の結果をみると、K2Editorの操作と正規表現やエクセルの操作が難しいという意見がちらほら。こういう技術を習得するには、とにかく使って慣れるしかないので、今日もいくつか練習、練習。今後の講義でも、1回の授業で最低1回は、正規表現検索・置換を(ムリヤリでも)利用するつもり。

-厚生労働省データベース http://wwwdbtk.mhlw.go.jp/IPPAN/ippan/scm_k_Ichiran

***おさらい1:レポートの課題の解答の手順 [#q1ddcd3b]
前回のレポート課題を採点してみると、~
~      &size(16){&color(brown){''パチパチパチ! 提出者34名全員が満点です!!''};}; 皆さん、すごいねー。&bigsmile; TAの五十畑君も脱帽です。~
      (一人だけ、.を入力し忘れて 15691%としている人がいましたが、おまけしておきました)

こんなにできの良い皆さんには釈迦に説法かもしれないけれど、一応、操作をおさらいしておこう。

-習得したかったことは、ウェブページに貼られたテキストデータ(あるいは、PDFファイルからコピーしたテキストデータ)を''再利用''して、自分のエクセルファイルで集計するということ。ポイントは、~
|SIZE(16):&color(brown){テキストデータを"タブ"で区切れば、エクセルの表に簡単に移せる};|
~操作手順は次の通り:&color(green){【この辺りの操作はもう理解していて暇だという人は、[[千葉大学平成18年度決算報告PDF>http://www.chiba-u.ac.jp/general/about/disclosure/pdf/zaimu07_2.pdf]]をつかって同じことができるかどうか、挑戦してみよう】};
|SIZE(16):テキストデータを"タブ"で区切れば、エクセルの表に簡単に移せる|
~操作手順は次の通り:【この辺りの操作はもう理解していて暇だという人は、[[千葉大学平成18年度決算報告PDF>http://www.chiba-u.ac.jp/general/about/disclosure/pdf/zaimu07_2.pdf]]をつかって同じことができるかどうか、挑戦してみよう】
+[[第4回授業のページの課題2の囲みの中>http://bean.bio.chiba-u.jp/lab/index.php?%E6%8E%88%E6%A5%AD%2FH20%2F%E6%83%85%E5%A0%B1%E5%87%A6%E7%90%86%2F04#jc78d921]]の内容をマウスで選択し、コピー。
+K2Editorを立ち上げて、新しいページに貼り付ける
+K2Editorの置換ウィンドウを開いて
     検索文字:   (注:半角空白1つだけ指定)
     置換文字: ¥t (注:半角の¥マークと半角のt)
~と指定し、正規表現のところの□とファイルの先頭からという□をチェックして「全て置換」
~↓この操作により、K2Editorに貼り付けたテキストで、半角の空白が全てタブに置換される
+置換の終わったテキストを全て選択して、コピー
+エクセルを立ち上げて、貼り付け
+合計値を求めるべき#1のセルをクリックして、上の方にあるΣ記号をクリックする。これで#1のセルの上に並んでいる数値の合計値が出る。同様の操作を、#2のセルについても繰り返す。
+差額を求める#3のセルをクリックして、「 = 」 を入力し、引かれる方の値が入ったセルをクリックし、「 -  ]
を入力、続けて引く方の値の入ったセルをクリック
+最後の問の答えを入力したセルをクリックして、「 =100* 」 を入力し、「授業料、入学料及び検定料収入決算」のセルをクリックし、「 / 」を入力し、最後に収入決算総額入ったセルをクリック。
~これで、千葉大学の1年間の総収入のうち、皆さんの授業料、入学料、検定料が占める割合は15.7%ぐらいだと分かりました。ついでに同様の操作で、業務費のうち教育研究経費に占める割合をみてみると、42.5%ということが分かる。

***おさらい2:メールで受け取った解析用データをエクセルに移動して、集計の準備 [#g6765957]
これからの学生生活で、皆さんはきっといろんなデータを集計する機会に出会うはず。例えば、名簿、部費の管理、アンケート調査の結果、そしてもちろん、実験データ。こういうデータは必ずしも、いつも最初からエクセルに入力されている訳ではない。たとえば、メールで受信した解析データをエクセルで集計したい場合もあるはず。そんなときにもやっぱり、
 データの区切りをタブに置換して、エクセルで集計!

では、https://cuacmsrv.chiba-u.jp/am_bin/am_main.cgi/login にアクセスして、メールで送信してあるサンプルデータを受信してみよう。下の囲みの中のようなデータが届いているはずだ。
 区画No.1
 カラスノエンドウ  5
 セイヨウタンポポ  2
 オランダミミナグサ  10
 オオバコ  1
 スズメノテッポウ  8
 キュウリグサ  5
 
 区画No.2
 キュウリグサ  1
 スズメノテッポウ  3
 オランダミミナグサ  1
 
 区画No.3
 カラスノエンドウ  10
 オランダミミナグサ  12
 ヘラオオバコ  5
 ヤセウツボ  3
 キュウリグサ  8
 スズメノテッポウ  5
このデータでは、区画ごとに、種名と出現個体数が書かれている。これをエクセルで
 区画No.  種名  出現個体数  日付(<日付については後ほど手入力>)
という形で集計したい。

手順をちょっと自分で考えて、やってみよう。

-手順:
+受信したデータをK2Editorにコピー~
データをじーっとみると、
 種名<半角スペース2個>数字
という並びが見えてくる。
+K2Editorで正規表現検索・置換で全置換
 検索文字列: +(注:半角スペースと半角+の2文字)
 置換文字列:¥t(注:半角¥マークと半角t)
+置換できたもの全てをコピーしてエクセルの新しいシートに貼り付け

自分で考えてここまで出来ただろうか?~
&ref(./#05_1.gif);

***並び替えや集計の準備:エクセルによるデータ整形 [#a8d9aeb6]
これでテキストファイルからエクセルへのデータの移動はできたが、まだ、
 区画No.	種名	個体数	日付(<日付については後ほど手入力>)
という形にはなっていない。特に、データ行の上には''見出し行''を作り、それぞれの列の見出しを書いておく必要がある。そこで、エクセルの上で、行の挿入、コピー・ペースト等を使って、下の様な形に''整形''する。(操作方法は前方スクリーンで示す)。~
+見出し作成: ワークシートの最左端の"1"という四角をクリックして、1行選択。メニューバーの「挿入/行」 で最上部に1行挿入。
+それぞれのセルに、見出しを入力(上の囲みの中をコピー・ペーストしてもよい)~
&ref(./#05_2.gif);

ついでに、上の図のように、日付も入力しておこう。1つ入力したら、あとは、コピー・ペースト。
~これで集計の準備はできた。


**サンプルデータの並び替え【''必修項目''】⌣  [#d39b66b4]
Excelはデータを表の形式で簡単に集計できる素晴らしいソフト。前回紹介した計算機能だけでは無く、データを並び替えたり、おなじものをまとめて計算したりする機能もついている。このうち、'データの'並び替え''(ソートともいう)は、大量データを扱う上で、%%%絶対に知っておかなければならない方法%%%なので、必ず習得して欲しい。

 ぱっと見で分からなくても、並べ替えたり、集計したりすると、何かが見えてくる

では、サンプルデータを見てみよう。ここで、
 全部のデータを合わせたとき、どの種の個体数が最も多いか
を知りたいと思ったのだが、この表では、同じ種がばらばらに出てくるのでわかりにくい。そこで、「種名」で並べ替えてみる
-手順:
+全てを選択し(左上角の<>をクリック)
+メニューから「データ/並べ替え」
--並べ替えウィンドウの中、「範囲の先頭行」で「タイトル行」を指定し(ラジオボタンをクリック)
--優先されるキーで「種名」、昇り順~
&ref(./#05_4.gif,60%);
+「OK」をクリックすると、種名順に並びかわる。~
&ref(./#05_3.gif);

これで、同じ種名のものが近くにまとまったので、全部のデータを合わせたとき、どの種の個体数が最も多いかかがわかる。

並び替えでは2つの並べ替えキーを設定することもできる。先の並び替えの2番目のキーに「個体数」を指定して並べ替えてみよう。

**並び替えたデータの集計&smile;  [#h4095732]
上の並び替えで、どうやらオランダミミナグサの個体数がもっとも多いとわかるのだが、実際に何個体現れたのかを知ろうと思うと、いちいち計算しなければならくて面倒。そういうときにエクセルの「集計」機能を使って、自動的に計算させる。
上の並び替えで、どうやらオランダミミナグサの個体数がもっとも多いとわかるのだが、実際に何個体現れたのかを知ろうと思うと、いちいち計算しなければならくて面倒。そういうときにエクセルの「集計」機能を使って、自動的に計算させる。~

    ''重要事項'':&size(15){集計する前にグループの基準になる項目で%%%必ず%%%並べ替えておくこと};

-操作:
+全てを選択し(左上角の<>をクリック)
+メニューバーから「データ/集計」
+集計したいのは「種名」の「個体数」の「合計」なので、以下の3項目をチェック。(例では「現在の集計行と置き換える」、「集計行をデータの下に挿入する」をチェックしてあるが、この例ではしてなくても良い)
 グループの基準: 種名
 集計の方法: 合計
 集計するフィールド:個体数
&ref(./#05_5.gif,60%);
+「OK」をクリックすると集計データが表示される。~
+集計見出しの2をクリックすれば、集計結果だけが表示される。~
&ref(./#05_7.gif);~
これで、「オランダミミナグサが23個体で最も多い」と分かった。
-集計データを削除するには、上の集計ウィンドウで「削除」をクリック。%%%元データは削除されないので心配無用。%%%

**データのグラフ化&smile; [#k3cdf965]
エクセルで集計はできたのだが、数字をみて傾向をつかむのはなかなか難しい。そこで、データをグラフにして表現する。グラフにすることによって、データの大小の程度や全体の傾向が一目で分かるようになる。~
データをグラフで表現する場合に、どのグラフを使えば良いかを考える。データの持つ傾向をみるためにいろいろなグラフを試すのはいいが、人にグラフを見せるときには、そのグラフで何を言いたいのかを十分に検討して、それに適したグラフを選ぼう。データで言いたいことに適さないグラフを使うと、言いたいことが伝わらないだけでなく、余計な誤解を与えることになりかねない。エクセルで使える代表的なグラフは次のようなもの:~
&ref(./#05_8.gif,50%);~
それぞれ、
-縦棒・横棒グラフは、対象間で数値の大小を表現するのに適している
-折れ線グラフは、時系列に沿った数値の変化を表現するのに適している。
-円グラフは、対象ごとに全体に占める割合を表現するのに適している。
-散布図は、2つの変数間の関係を見るのに適している。

***グラフの作成1:まずは単純なグラフから [#tf735312]
では、上の集計データから、種ごとの個体数の合計値をグラフで表してみよう。
+まず、どのグラフを作るか考える。ここでは、種ごとの合計値の違いを表したいのだから、棒グラフをつかうことにする。
+まず、どんなグラフを作るか考える。ここでは、種ごとの合計値の違いを表したいのだから、棒グラフを試すことにする。
+どこか下か右の方の空白セル(データの入っていないセル)をクリック
+メニューバーの「挿入/グラフ」:グラフウィザードが表示される
+グラフウィザード1/4: グラフの種類を選ぶ。~
ここでは、「縦棒グラフ」をクリックし、グラフの形式はなにも変えずに(つまり、一番左上に書かれている形式)、「次へ」
+グラフウィザード2/4: グラフに使うデータを指定する。~
 <範囲のところに何か文字列が入っていたら消しておく>
「種名」と「個体数」の見出し行を含めて、「ヤセウツボ」までのデータをマウスで選択~
「系列」は「列」を指定~
グラフのプレビューが表示される~
&ref(./#05_9.gif,50%);~
これでよければ完了。
+グラフウィザード3/4: グラフオプション:~
必要に応じて、次の画面でグラフの見栄えを設定する。~
完了をクリックすればグラフが表示される。~
&ref(./#05_10.gif,60%);~

+ではいよいよグラフを作る。使いたいデータは集計表のうち、いま作った「学籍番号」と、その人が何回発言しているかが書かれた「日付」というセル
+グラフを書きたい場所(どこか右の方の空白セル)をクリックしてから、メニューバーの「挿入/グラフ」を選ぶ。グラフの種類を選ぶウィンドウが表示されるので、ここでは、「横棒グラフ」(上から2つめ)をクリックし、グラフの形式はなにも変えずに(つまり、一番左上に書かれている形式)、「次へ」
+「学籍番号」ごとの発言回数をグラフにしたいので、グラフに入れたい学籍番号の範囲をドラッグして範囲指定。まだ「次へ」はクリックしちゃダメ。
>&ref(授業/H18/情報処理/06/06052405.gif,80%);
<
+グラフ指定ウィザード(2/4)のウィンドウで、上の方にある「系列」タブをクリック
+系列1の値のところに、集計した発言回数をいれたい。マウスで発言回数のセルをドラッグして、範囲指定。うまくできれば、プレビューが表示されるので、「次へ」
>&ref(授業/H18/情報処理/06/06052406.gif,80%);
<
+次の画面でグラフタイトルやX, Y軸の説明を入力し、「完了」
>&ref(授業/H18/情報処理/06/06052407.gif,80%);
+できあがったグラフを見てみると、学籍番号がとびとびにしか表示されていない。これは、軸ラベルの増分が1になっていないため。そこで、グラフ画面上の学籍番号のところをダブルクリックして、軸の書式設定ウィンドウを表示させ、増分を1にしてOK。
>&ref(授業/H18/情報処理/06/06052408.gif);
<
+学籍番号が表示された。でも文字がつまっていて見にくいので、もう一度軸の書式設定ウィンドウを開いて、フォントサイズを9ポイントぐらいに変更。そうすると、なぜか学籍番号がついていないラベルがある。こんなときは、棒グラフの上をクリックすると、グラフを作成するのに使ったセルの範囲が線で囲まれて表示される。
>&ref(授業/H18/情報処理/06/06052409.gif,80%);
<
+この例では、学籍番号の指定が一つずれていた。そこで、セルの範囲指定を、線をドラッグして変更すれば、正常に表示される。
***グラフの作成2:系列を3つ指定 [#f502cf1b]
先ほどのグラフは1つの系列(データの並び)だけを指定したグラフだったので、すごく簡単な操作で自動的にグラフができた。今度はそれぞれの区画毎に現れる種数をグラフで表示してみよう。この場合、系列は3つになる。また、共通している項目が全てに必要になるため、もとの表を次のように整形する(出現しない種名についても0というデータを追加する)。
|SIZE(7):区画\種名|オランダミミナグサ|カラスノエンドウ|キュウリグサ|スズメノテッポウ|セイヨウタンポポ|オオバコ|ヘラオオバコ|ヤセウツボ|
|1|10|5|5|8|2|1|0|0|
|2|1|0|1|3|0|0|0|0|
|3|12|10|8|5|0|0|5|3|

-操作:
+どこか下か右の方の空白セル(データの入っていないセル)をクリック
+メニューバーの「挿入/グラフ」:グラフウィザードが表示される
+グラフウィザード1/4: グラフの種類では「縦棒グラフ」をクリック。「次へ」
+グラフウィザード2/4: グラフに使うデータを指定する。~
--範囲のところに何か文字列が入っていたら消しておく
--「系列」タブをクリック
--「追加」をクリック
---名前:「区画1」と入力
---値:何か文字が入っていたら消して、「=」を入力し、
「種名」と「個体数」の見出し行を含めて、「ヤセウツボ」までのデータをマウスで選択~
&ref(./#05_11.gif,40%);~
--さらに、区画2のデータを表示させるため、「追加」をクリックして、上の作業を繰り返す
--同様に、区画3についても同じ作業
--「項目軸ラベルに使用」の入力フィールドをクリックし、表の「オランダガラシ」から「ヤセウツボ」までを選択~
これでよければ完了。~
&ref(./#05_12.gif,40%);~
+グラフウィザード3/4: グラフオプション:~
必要に応じて、次の画面でグラフの見栄えを設定する。~
完了をクリックすればグラフが表示される。~
&ref(./#05_13.gif,60%);~

**プロジェクトについて [#gf006b44]
-進め方相談

**&color(green){【トピックス】};WinShotを用いたスクリーンキャプチャ [#x33c5bd0]
 WinShotはパソコン画面の保存・印刷等を行うことができる、スクリーンキャプチャソフトです。ウェブページからの画像の取り込みや、モニタに表示されている情報をそのまま画像としてコピーしたり、ファイルとして保存できるので、とても便利です。レポートに画面の一部だけを貼り付けたいときなど、役に立つこと間違いありません。下のURLからダウンロードして、インストールして下さい。~
http://www.woodybells.com/winshot.html
~画面の真ん中より少ししたのところに、
 LHA書庫版(別途解凍ソフトが必要です)
 WinShot Version 1.53 (712KB)
というリンクがありますので、こちらをダウンロードしてください。
~ダウンロードすると、デスクトップに
 ws153
というフォルダができます。この中に入っている
 Winshot.exe
をクリックすると、タスクトレイにWinShotのアイコンが表示されます。これを右クリックすることで、スクリーンの一部を画像として切り取れます。

//**ウィルス対策ソフトの紹介 
// 最初の授業で行ったアンケートで、パソコンを持っているのにウィルス対策ソフトを使っていない人が9名。
// ウィルス対策ソフトをは何を使っていますか?
// 使っている:20 使っていない:13(うち、パソコン所持者は9名) わからない:2 回答無し:1  
// 自分のパソコンがウィルスに感染すると、自分が困るのはもちろんのこと、データを交換した他のコンピュータ(USBメモリやメールなどで)にも大変な迷惑をかけることになる。~
// ウィルス対策ソフトは必ずインストールしておこう。フリーのソフトでは、Avastが高機能で、ウィルス対策データの更新も頻繁。ただし、1年に1度、ウェブ上で登録更新して(住所やメールアドレスを記入)、ソフトウェアに登録キーを入力する必要がある。


*第5回授業の課題 [#ebfe5897]
-提出期限:5月19日月曜正午 (下記3つ全て)
**課題1.アンケート調査 [#v6190396]
+&size(16){http://bean.bio.chiba-u.jp/joho20/ に、「自分のID」/05 という新しいページを作成し、下の囲みの中にあるアンケートをコピー・ペーストして、「回答:」の後に答えを書き込むこと。};
-手順
++画面の上の方にある〔 新規 〕をクリック
++ページ名を尋ねる入力スペースが表示されるので、半角英数字で、ドット・スラッシュ・0・5を下のように入力
 ./05
++下の囲みの中をコピー・ペーストし、回答を書き込む
 *第5回授業・基本課題 
 **氏名:
 **課題への回答
**課題への回答 [#g5df6de8]
 -今日の授業の進み方は?(はやい、丁度いい、おそい)
 --回答:
 -今日の授業の難しさはどう感じましたか(簡単すぎ 簡単 丁度いい 難しい 難しすぎ):
 -今日の授業の難しさはどう感じましたか(簡単 丁度いい 難しい):
 --回答:
 -難しいと答えた人は、特にどの点が難しかったですか?:
 --回答:
 -今日の授業は(よく分かった 分かった 分からなかった):
 -今日の授業は(分かった 半分ぐらいは分かった 分からなかった):
 --回答:
 -分からないと答えた人は、特にどの点が分からなかったですか?:
 --回答:
 -今日の講義で理解できなかった用語があったら挙げてください:
 -今日の講義で分からなかった用語があったら挙げてください:
 --回答:
 -これまでに習った英語、数学、国語、理科、社会のうち、どの教科が実社会で最も重要だと思いますか?
 -高校までに習った英語、数学、国語、理科、社会のうち、どの教科が社会に出てから最も重要だと思いますか?
 --回答:
 -次週以降の講義では、1. Word, 2. Power Point, 3. データベース, 4. 統計解析ソフト, 5. プログラミング演習 
 を行う予定です。これまでに学んできた内容の復習もやりながら進めるので、優先順位をつけたいと思います。
 上の番号を興味のある順番に並べてください。また、優先順位についてコメントがあれば記入してください。
 (回答例: 3 5 4 1 2)
 --回答:
 

**課題2. 復習 [#x8ac9c66]
-授業で作成したデータファイルを使って、別形式のグラフを作成して下さい
-上で作った「自分のID」/05というページに添付しておいてください。ファイル名は「学籍番号_05.xls」とします。
-評価基準:
--グラフの見やすさ
--エクセルの使用法について、どれだけチャレンジしているか
-復習内容
--Excelでのグラフ作成

**課題3.予習 [#sb276f89]
-上で作成したグラフのスクリーンショットをWinShotで切り取ってJPEG形式のファイルとして保存し、「自分のID」/05に添付しなさい。
 添付の方法:
  ・画面上部のメニューから「添付」をクリック
  ・「選択」ボタンをクリックして、添付すべきファイルを探す
  ・アップロード

**おまけ:時間があったら解説 [#u91bd56b]
-英語サイトですが、グラフの作り方については、[[Almost Everything You Wanted to Know About Making Tables and Figures>http://abacus.bates.edu/~ganderso/biology/resources/writing/HTWtablefigs.html]]というページが参考になります。