授業/H23/情報処理

TAの木内が思ったことを適当に書くページ。授業中で引っかかりそうなポイントや、補足説明したいところなどを取り上げていきます。
連絡や質問などはfig1.gifへ(画像です)。

ブラウザについて

 授業中、Internet Explorer(IE)で拡張子.docxや.pptxのファイルをダウンロードするときに、zipファイルになってしまうトラブルが発生しています。調べてみたところ、これはサーバ側の問題で、こちらでは手の出しようがない問題みたいですね。

https://www-304.ibm.com/support/docview.wss?uid=swg21460497&wv=1

 しかし、解決法は簡単です。「IEを使わなければいい」。それだけです。

 さて、「ブラウザ」って知ってますか? これは、簡単にいえば「インターネットを見るためのソフトウェア」です。標準のWindowsマシンでは、標準のブラウザがIEなので、IEでないとインターネットを見れないと思っている人がたまにいますが、IEはあくまでもブラウザの一つでしかありません。

 他の有名なブラウザとしては、Mozilla FirefoxやGoogle Chromeなどがあります。適当にブラウザのシェアを調べてみたですが、今はこんな感じらしいです。
fig2.gif
ソース:http://www.samurai-factory.jp/info/2011/20110603242.html

 ちょっと個人的な話になりますが、私はIEを全く使っていません。というより、使う理由がありません。

機能がしょぼい
狙われやすい
遅い(IE9で改善されているみたいですが…)

 IEはあくまでも標準的なブラウザなので、あまり多機能ではありません。反面、FirefoxやChromeは拡張機能を追加することで、自分が使いやすいようにカスタマイズできます。

 また、さっきのグラフをみて分かるように、シェアとしてはIEがトップです。そのため、ハッカーなどは最優先で狙ってきます。

 現在は、メインにChrome、サブにFirefoxという布陣で運営しています。Firefoxは学内PCにすでにインストールされているので、試しに使ってみてはどうでしょうか?

拡張子について

 みなさんから提出された課題を見てみると、拡張子についてのミスが目立っていたので、ここで指摘したいと思います。なお、減点はしていませんのでご安心を。
fig3.gif
 これは、皆さんから送られた課題ファイルです。見てみると、ファイル名の末尾が

.doc.docx

 となっているものがいくつか…というより結構あります。このような場合、このファイルの拡張子は.docxだと判定されます。

 まず、.docと.docxの違いについて簡単に

.doc  → Word 2003以前のバージョンで作られたファイル
.docx → Word 2007以降のバージョンで作られたファイル

 ここで問題になるのが互換性です。Word 2003以前のバージョンでは、拡張子.docxのファイルを開くことはできません。そのため、相手の環境によってはせっかく提出したファイルが見れない、という事態になります。

 そのため、相手の環境が分からない場合は、.docで保存するのがベターです。今回の課題も、提出形式は.docで指定されていたので、それで作ろうとして上記のような失敗をしてしまったのではないかと思います。

fig4.gif
 この失敗は、「名前を付けて保存」するときに、このように末尾に.docをつけたために起こります。

 この場合、自動で拡張子.docxが付加されるため、上記のようなファイル名になってしまうのです。

fig5.gif
 こういう場合は、「名前を付けて保存」するときに、「Word 97-2003文章」を選べばOKです。

 ただし、.doc形式のファイルは、Word 2007以降のバージョンで追加された機能を反映させることができません。そのため、そのようなファイルを作りたい場合は、pdfに変換したりなどして送ればOKです。

Rについて

 第9回授業ではRの導入編をやってみましたが、いかがだったでしょうか? たぶん、一回やっただけだとよく分からないんじゃないかと思います。情報処理全般に言えることですが、こういうのはともかくトライ&エラーで一つ一つ覚えていくしかないですね。

 私のおすすめR本をあげておきます。「Rによるやさしい統計学」 リンク
Amazonで試し読みができます。
fig6.jpg
 これは、「Rで統計を勉強しよう」というコンセプトの本なので、Rと統計が同時に勉強できてしまうお得な本です。もともと文系の学生向けに書いてあるんで、数学が苦手でも理解できるのではないでしょうか。

 授業中に先生が紹介してくれた、私の書いたプログラムについてちょっと補足します。

X=c(4,17,1,14,3,1,1,1,1) #Excelで集計した結果
Xlab=c("G~D","C","C++++","B","A","A+","A++","S+","S++") #横軸ラベルの名前
barplot(X,names=Xlab,ylim=c(0,20)) #棒グラフを書く命令
title(main="OZAWA-KENの結果") #グラフタイトルを書く命令

 慣れればこのくらいのコードは数分で書けます。でも、関数のオプションとかを完全に覚えているわけではないので、書くときはいつもマニュアルとにらめっこしています。

 さて、これはただ単に集計した結果を棒グラフで書かせているだけなんで、Excelでも同じようなことはできます(前の授業でやりましたよね?)。

 なぜわざわざRで書くかというと、いくつか理由がありまして…

Rの方がキレイなグラフが書ける(Excelのグラフはあんまりキレイじゃない)
装飾が楽(定義域とか値域とか軸ラベルとか…)
大規模データの扱いが楽

 ざっとこんな感じですかね。慣れてしまうと、Rを使った方が早く、キレイに、簡単に描けます。なので、実際の研究の現場では、Excelでグラフを書くことってあんまりないですね。ただ、Excelの方が得意なこともあるので、結局は適材適所ですね。

 さて、Rの特徴として、描画機能が優れているということがあります。私はあまり派手な色遣いは好きじゃないので、お見せしたグラフはグレー一色でしたが、グラフに色を付けるのも簡単です。

X=c(4,17,1,14,3,1,1,1,1) #Excelで集計した結果
Xlab=c("G~D","C","C++++","B","A","A+","A++","S+","S++") #横軸ラベルの名前
barplot(X,names=Xlab,ylim=c(0,20),col=rainbow(9)) #棒グラフを書く命令
title(main="OZAWA-KENの結果") #グラフタイトルを書く命令

 3行目にグラフに色を付けるオプションを追加しました。こんな風に、色を付けたりするのも自由自在。これがRのいいところです。実際にどうなるかは、自分で実行してみてください。

 ちなみに、私は自分の研究でもよくRでプログラムを書いていますが、大体こんな感じですね。
fig7.gif
 ごちゃごちゃして分かりにくいんですが(書いた本人でもたまに理解できないときがある)、Rに慣れるとこういうこともできる、ということで。

統計について

 第9回授業後半の仮説検定についてですが…統計の授業とかをやってないと、厳しかったのではないでしょうか? 実際、研究室に入ったら、統計の話はほぼ必須なのが現状なんですよ。例えば、論文紹介とかをやると必ず「~~検定を行って…」という話になりますし、自分の研究の報告をしても、「そのデータは信頼できるのか?」とよくつっこまれます。

 ですが、生物科の方はあまり数学とか統計に馴染みがないようで、この辺りで苦しんでいる人を良く見かけます。なので、今のうちに統計の授業を取っておくことを強くおススメします(個人的には、理系の学生なんだから数学を必修にすべきだと思っているんですが…)。

 最後に、統計のおススメ本をひとつ紹介。 「ウソを見破る統計学」 リンク
fig8.jpg
 割と最近出てきたブルーバックスの本です。非常に身近な例から統計を解説しているんで、一回読んでみれば統計の授業も分かりやすくなるのではないでしょうか?


添付ファイル: filefig8.jpg 1052件 [詳細] filefig7.gif 1034件 [詳細] filefig6.jpg 1046件 [詳細] filefig5.gif 1061件 [詳細] filefig4.gif 1053件 [詳細] filefig3.gif 1046件 [詳細] filefig2.gif 1040件 [詳細] filefig1.gif 1028件 [詳細]

Last-modified: 2015-05-13 (水) 16:44:22 (3481d)