Excelは本当に便利なソフトです。前回やったような簡単な計算だけでなく、データの整形、並べ替え、データの集計だとか、簡単なグラフ作りだとか、本当にいろんなことができます。全てを紹介する時間は無いので、今日の授業では生物学でよく使うデータ解析の手法をいくつか修得して貰います。
テキストデータにおける"タブ"はExcelの"カラム(列)の区切りに相当する |
ということです。タブで区切られたテキストデータは、エクセルにコピー・ペーストすることで、カラム(列)で区分されたデータとして扱う事が出来ます。
前回の課題は、まだ正規表現での検索・置換に慣れていない人には難しかったようです。復習をかねて、ここで一緒に操作を練習してみましょう。
国立大学法人千葉大学 から ... 一般管理費 5,645 5,866 221
までのところをマウスでドラッグして選択し、コピー。
&ref(): File not found: "Untitled-3.gif" at page "授業/H20/情報処理/05";
検索文字: (注:半角空白1つだけ指定) 置換文字: ¥t (注:半角の¥マークと半角のt)
と指定し、正規表現のところの□とファイルの先頭からという□をチェックして「全て置換」
&ref(): File not found: "Untitled-4.gif" at page "授業/H20/情報処理/05";
↓この操作により、K2Editorに貼り付けたテキストで、半角の空白が全てタブに置換される
&ref(): File not found: "Untitled-5.gif" at page "授業/H20/情報処理/05";
~&ref(): File not found: "Untitled-6.gif" at page "授業/H20/情報処理/05";
の値の入ったセルをクリック
&ref(): File not found: "Untitled-7.gif" at page "授業/H20/情報処理/05";
&ref(): File not found: "Untitled-8.gif" at page "授業/H20/情報処理/05";
Excelは数値データを表の上で簡単に集計できる素晴らしい道具です。また、いろんな関数を使って計算したり、あるいは、表の上で集計したデータを、グラフとして視覚的に表現することができます。グラフにすると単なる数字の並びが、なにかを意味しているということに気づくことができたり、また、他の人にわからせることができます。
Pukiwikiでのプロジェクト相談では、一人1回は必ず発言(コメントを投稿)するようにお願いしてありました。いろんな人が発言しており、全部で100件ぐらいの発言データが蓄積されています。でも、みんながみんな、同じ回数発言している訳ではなく、発言回数には偏りがある見たいです。このデータを解析して、
・全員が発言しているかどうか ・発言回数には何らかの傾向があるか、
実際のデータを解析してみましょう。
プロジェクト相談のページに書かれているデータは、テキストデータです。解析にはエクセルを使います。もうお分かりですね。最初にやることは先ほどの復習と同じで、
テキストをタブ区切りにして、エクセルで集計
です。操作の流れは、次のようになります。
* 梶田(07s4098) 2007-04-26 (木) 13:35:56 -- 今年度のスポーツ大会の委員を1年生から2名(男女各1)選出してください。 .....
名前 学生証番号 日付 時間 発言内容がそれぞれエクセルの別のカラムに入るようにしたい。正規表現検索置換で区切り場所にタブを入れれば良いが、その操作は、第4回授業でやったはず。ファイルが保存してあると思うので、エクセルで開いて下さい。
もし、保存し忘れたとか、もう一度操作をして欲しいという要望があれば、説明します。
データの整形については、前回やりました。整形というのは、同じ種類のデータは同じカラム(列)に入るように、セルを移動(カット&ペースト)することでした。
では、いよいよ集計です。もしもエクセルを使わずに集計するとすると、
クラスの名簿を用意して、一人一人発言しているかどうか、また何回発言しているかを数えるなんていうことをしなくてはなりません。どれだけ面倒なことか、想像できますよね。
いちいち数えるのは面倒!エクセルを使って楽しよう! |
集計のときに何に注目して集計するか、データを見てみると、困ったことに気がつきます。コンピュータに数えさせる場合は、
書式が統一されていなければならないというのが原則なのですが、このデータには
比良間(07s4088) ひらま(07s4088) hirama(07s4088) hiramaなどというように、同一人物だと思われるのだけど
・名前の表記が異なる ・学生証番号が全角で書かれているもの、半角で書かれているもの、書かれてないものがあります。コンピュータはこういうデータは全て異なるものと解釈して数え上げてしまいます。今回はあとで名簿順に並べ替えることを考えて、名前は無視して、学生章番号だけで集計しようと思います。
名前と学生証番号の間には、半角の(が入っています。この文字をタブに置換すればよいですね。ついでに、最後の)を消しておきましょう。
検索文字 ¥((半角¥と() 置換文字 ¥t
検索文字 ¥)(半角¥と)) 置換文字 (指定無し)
では、エクセルを使って、いよいよ集計作業をします。集計には、データの一番上に見出し行が必要です。
名前 学生証番号 日付 曜日 時間 発言内容
グループの基準: 学生証番号 集計の方法: データの個数 集計するフィールド:学生証番号にチェック
セルの操作には関数を使おう! |
エクセルには'関数'という便利な機能がある。ここでは、「セルに入っている文字列の一部だけを抜き脱す」関数:LEFT()を利用する
=LEFT(A3,7)
- できあがったグラフを見てみると、学籍番号がとびとびにしか表示されていない。これは、軸ラベルの増分が1になっていないため。そこで、グラフ画面上の学籍番号のところをダブルクリックして、軸の書式設定ウィンドウを表示させ、増分を1にしてOK。
- 学籍番号が表示された。でも文字がつまっていて見にくいので、もう一度軸の書式設定ウィンドウを開いて、フォントサイズを9ポイントぐらいに変更。そうすると、なぜか学籍番号がついていないラベルがある。こんなときは、棒グラフの上をクリックすると、グラフを作成するのに使ったセルの範囲が線で囲まれて表示される。
- この例では、学籍番号の指定が一つずれていた。そこで、セルの範囲指定を、線をドラッグして変更すれば、正常に表示される。
WinShotはパソコン画面の保存・印刷等を行うことができる、スクリーンキャプチャソフトです。ウェブページからの画像の取り込みや、モニタに表示されている情報をそのまま画像としてコピーしたり、ファイルとして保存できるので、とても便利です。レポートに画面の一部だけを貼り付けたいときなど、役に立つこと間違いありません。下のURLからダウンロードして、インストールして下さい。
http://www.woodybells.com/winshot.html
画面の真ん中より少ししたのところに、
LHA書庫版(別途解凍ソフトが必要です) WinShot Version 1.53 (712KB)
というリンクがありますので、こちらをダウンロードしてください。
ダウンロードすると、デスクトップに
ws153
というフォルダができます。この中に入っている
Winshot.exe
をクリックすると、タスクトレイにWinShotのアイコンが表示されます。これを右クリックすることで、スクリーンの一部を画像として切り取れます。
./05
*第5回授業・基本課題 **氏名: **課題への回答 -今日の授業の進み方は?(はやい、丁度いい、おそい) --回答: -今日の授業の難しさはどう感じましたか(簡単すぎ 簡単 丁度いい 難しい 難しすぎ): --回答: -難しいと答えた人は、特にどの点が難しかったですか?: --回答: -今日の授業は(よく分かった 分かった 分からなかった): --回答: -分からないと答えた人は、特にどの点が分からなかったですか?: --回答: -今日の講義で理解できなかった用語があったら挙げてください: --回答: -これまでに習った英語、数学、国語、理科、社会のうち、どの教科が実社会で最も重要だと思いますか? --回答: -次週以降の講義では、1. Word, 2. Power Point, 3. データベース, 4. 統計解析ソフト, 5. プログラミング演習 を行う予定です。これまでに学んできた内容の復習もやりながら進めるので、優先順位をつけたいと思います。 上の番号を興味のある順番に並べてください。また、優先順位についてコメントがあれば記入してください。 (回答例: 3 5 4 1 2) --回答:
添付の方法: ・画面上部のメニューから「添付」をクリック ・「選択」ボタンをクリックして、添付すべきファイルを探す ・アップロード
1. デフォルトでは「系列1」の文字はグラフの右側に書かれるが、左側にもってくること 2. 数値の桁揃えを注意すること 3. 余分なグリッド線は消すこととのことでした。英語サイトですが、グラフの作り方については、Almost Everything You Wanted to Know About Making Tables and Figuresというページが参考になります。