Wordを使ったレポート作成:

第5回授業の獲得目標: [worried]

  • 1. 発展的な正規表現:後方参照への挑戦
  • 2. 「Wordのいろんな機能が覚えられない」という不安を持つ人は、「調べればできる」を目指そう
  • 3. Wordを使ったレポート作成
  • 4. Word以前の問題: レポートにはメッセージが不可欠

発展的な正規表現:後方参照への挑戦 [smile]

前回は基本的な正規表現の使い方をマスターした。今日は1つ上のレベルの正規表現「後方参照」にチャレンジしてみよう。K2Editorのヘルプで後方参照に関する項目を見てみると、次のように書かれている。

後方参照
正規表現の中で()を使ってグループ化された部分にマッチ文字列は、 \1,\2などの表現で、
再度正規表現の中に埋め込むことが可能です。 
\の後ろに続く数字は、何番目のグルーピングされた文字列かを示します。 
たとえば、(\w+)[ ]+\1 は "ABC ABC"や"ppp ppp"に対してマッチしますが、 
"ABC ppp"にはマッチしません。 
\の後ろに続く数字には制限はありません。ただし、1〜9までは常に後方参照と解されますが、
 \10以降は、その後方参照に対応するグループがない場合は、8進数のコントロール文字と
解されますので注意が必要です。 
また、本当に一桁の8進数のコントロール文字を書く場合には、 \001などという風に書きましょう。 
(K2Editorのヘルプファイルから後方参照の部分を抜粋)

ちょっと分かりにくいかも知れないが、半角の

()

の中で指定したパターンにマッチした文字列を、

¥1

などという記号を使うことで、呼び出すことができるということだ。
まず簡単な例で操作をしてみよう

テキストデータ: A9JA49K6  に対して、
1. Aの次の1文字と、Kの次の1文字をすべて削除したい。
2. Aの次の1文字と、そのAの並び順を入れ替えたい。

というような問題があったとする。
K2Editorで実際に試してみると:

テキストデータ  A9JA49K6
・AかKの次の1文字を削除
  検索文字列 ([AK]).
  置換文字列 ¥1
・Aに続く1文字とAの順序入れ替え
  検索文字列 (A)(.)
  置換文字列 ¥2¥1

書籍リストを出版年順に並び替える

では、もう少し具体的な例をつかって、段階的に説明してみよう。
まず、次のような書籍のリストがある。このリストを、K2Editorで開いてみよう。file書籍リスト.txt

  • 次のようなリストが入っているはずだ(一部のみを表示)(データは、生物科学ニュースホームページhttp://bsj.or.jp/nc2/htdocs/から拝借した)。
    ・絵でわかる細胞の世界 黒谷明美著,講談社,2001年,162ページ,2,000円
    ・細胞工学別冊 植物細胞工学シリーズ19 新版 分子レベルから見た植物の耐病性 島本 功・渡辺雄一郎・柘植尚志 監修
    ・琉球弧の成立と生物の渡来 木村政昭編著,沖縄タイムス社,2002年,206ページ,8,200円
    ・植物ゲノム機能のダイナミズム  —転写因子による発現調節— 岩淵雅樹・篠崎一雄編,シュプリンガ−・フェアラーク東京,2001年,256ページ,5,000円
    ・森林の環境・森林と環境 地球環境問題へのアプローチ 吉良竜夫,新思索社,2001年,358ページ,3,800円
    ・植物の観察と実験を楽しむ−光と植物のくらし− 松田仁志著,裳華房,2004年,159頁,1,600円

まずは、これまでに習った正規表現で、どこまで解決できるか考えてみる

このリストには、出版年が含まれているにも関わらず、出版年の順番に並んでない。どうすれば、出版年で並び替えられるだろうか?
リストをよく見てみると

タイトル・著者,出版年,ページ・価格

という順番で並んでいる。ここで、

出版年だけを切り出して、
出版年 <タブ> タイトル・著者,出版年,ページ・価格

というリストを作り、エクセルにペーストして

出版年タイトル・著者,出版年,ページ・価格

という表を作り、出版年で並び替えれば良いということまでは、想像できるだろう。
では、出版年だけを切り出すにはどうすればいいだろうか? まず、これまでにならった正規表現で表現できるところだけを書いてみると、

  • ファーストネームは、行の先頭から始まって、空白で終わる文字列だから、これまでに習った
    ^     は行の先頭を表す
    [0-9]+年    は、数字の出版年を表す
    .*,   は全角の,で終わる任意の文字列を表す
    $   は行の終わりを表す
    これらを組み合わせて、
    ^.*,[0-9]+年.*$
    で1行の情報全てを表せるだろう。
    なので、例えば、
    検索文字列: ^.*,[0-9]+年
    で、
    ・琉球弧の成立と生物の渡来 木村政昭編著,沖縄タイムス社,2002年
    ・植物の観察と実験を楽しむ−光と植物のくらし− 松田仁志著,裳華房,2004年
    .....
    という出版年で終わる文字列は表せるけれど、これを年度に置換するときには、
    置換文字列:  2002年
           ^^^^
    今まで習った通りだと、何か置換文字列を指定しなければならない
    上の例だと、
    2002年
    2004年
    ....
    という異なる年度に置換したいので、一度の置換ではできそうにない。

    もしも、このとき、最初の行で、当てはまった「2002年」をどこかどこかにコピーして保存しておいて、自分の置換文字列に指定できれば、いいだろう。
    この、
    検索文字列と一致した文字列を保存しておいて、置換文字列に使う
    ということをやってくれるのが、後方参照だ。

    前置きはともかく、まずやってみよう。新しく登場するのは、

    ( ) 半角のカッコで、検索文字列を囲んでおくと
    置換文字列に半角の¥マークと数字を使うことで、 (例: ¥1  ¥2  こんな風に)
    上でカッコで囲んだ検索文字列を呼び出せる。
     では、上の書評リストを出版年と出版年以外のパートに分けて、カッコで囲んでみよう
    ^(.*,)([0-9]+年)(.*)$
    こうすることで、検索文字列で使われた( )内の文字列を、左から順番に置換文字列として指定することができる
    (.*,)      → \1
    ([0-9]+年)  → \2
    (.*)      → \3
    具体的に上の例の1行目で考えると
    ・絵でわかる細胞の世界 黒谷明美著,講談社, → ^(.*,)    → \1
    2001年                    → ([0-9]+年) → \2
    ,162ページ,2,000円             → (.*)$    → \3
  • 演習:1 今までの解説に従って、添付の書籍リストで後方参照による検索置換を行って、
    出版年 <タブ> タイトル・著者,出版年,ページ・価格
    に置き換えてみよう。
  • 答え:
    1. K2Editorに上のリストをコピーする
    2. 置換ウィンドウで、次のように指定する
      検索文字列: ^(.*,)([0-9]+年)(.*)$
      置換文字列: \2\t\1\2\3
    3. 置換を実行
    4. エクセルにコピーペーストして、一番左の列で並び替え

練習:日付データの形式変更

下に友達の誕生日リストが月、日、年の順で書かれている。

April 29, 1984
March 20, 1987
September 23, 1980	
December 23, 1982
February 11, 1984
January 1, 1999
May 3, 1988
May 4, 1993
May 5, 1987
November 23, 1985
November 3, 1994
  • このリストを正規表現検索置換を使って、
    1. 年・月・日の順(例:1984 April 29)に並び替えなさい
    2. 日、月、年の順(例:29 April, 1984)に並び替えなさい
    • この課題が簡単すぎて暇をもてあました人は、エクセルを使って同じことをやってみよう(この場合は実はエクセルの方が簡単 列全体を選択して、コピー・ペーストするだけ)
  • 解答例
    検索文字列:([A-Za-z]+) ([0-9]+), ([0-9]+)
    置換文字列:¥3 ¥2 ¥1
     あるいは
    検索文字列:^([^ ]+) ([^ ]+), ([^ ]+)$
    置換文字列:¥3 ¥2 ¥1
    • 補足:2番目の例では、([^ ]+)(意味:空白以外の1回以上の連続)が改行を含んでしまってるため、最後に1行の終わりを示す$をつけないと、うまく行かない。
  • また、上の例では

    ^  には2つの意味があるので注意!!
    
    ■検索文字列の最初においた場合は行頭から始まることを示す
      ^[A-Z].* で、行頭がアルファベット大文字で始まる任意の文字列
    ■文字集合を表す[ ]の中で最初に置かれた場合、それに続く文字以外を表す
     [^a-z]+     で、英小文字以外の任意の文字からなる文字列
     参考:$は検索文字列の最後に置かれた場合、行末であることを示す
      [a-z]+$  は、行末に続く英小文字の連続を示す
    正規表現の例のいくつかは、昨年度の学生の要望で作った、授業/H20/情報処理/正規表現熟語帳を参照してみよう。自分でこういう単語帳を作ってみると、正規表現への理解がますます高まるだろう。
    やりたいこと検索文字列対象文字列の例置換文字列置換された結果例コメント
    1行に含まれる全ての文字列を置換^.*$abcdefg hijklmn 12345
    opqrstu vwzya 98765
    Replaced!Replaced!
    Replaced!
    連続する半角スペースをタブに置換[ ]+abc def hij k¥tabc<tab>def<tab>hij<tab>k
    AまたはKをZに置換[AK]BACK BaKery KABAZBZCZ BaZery ZZBZ
    AまたはKとそれに続く任意の1文字をZに[AK].BACK BaKery KABAZBZZBaZry ZBA
    スペース以外の文字列の連続をtangoに置き換え[^ ]+I am a boy. You are a girl.tangotango tango tango tango tango tango tango tango
    1行を行頭からスペースで4つのパートに区切り、順序を逆に並べ替え^([^ ]+) ([^ ]+) ([^ ]+) (.*)$12 34 56 78 90
    Que sera, sera. Whatever will be.
    ¥4 ¥3 ¥2 ¥178 90 56 34 12
    Whatever will be. sera. sera, Que

発展演習: DNAの塩基配列データの整形処理

添付されているファイルfilesequence_Pdic.fastaには、Pedicularisという植物のDNA塩基配列データがFASTA形式で入っている。GenBankからダウンロードしたままの形式なので、

>gi|310769146|gb|HM596759.1| Pedicularis procera tRNA-Leu (trnL) gene
 (GenBankID, データベース、Accession No.、種名、遺伝子の種類...)

が、それぞれのデータを示すラベル情報として入っている。これを、よりシンプルに、

>種名の省略形_Accession No.
という形に整形したい。上の例だと、
>P_procera_HM596759

に置換したい。どのようにすれば良いか、考えてみよう。
この操作は、実際にDNAデータベースのデータを使って、系統解析を行うときに、知っていると大変役に立つ。

「Wordのいろんな機能が覚えられない」という不安を持つ人は、「調べればできる」を目指そう

前回授業のWordの機能に関するアンケート結果
#5_1.jpg
これを見てみると、多くの人が、「今はできないけど、調べればできる」を回答してくれていた。これはとても頼もしい結果で、この授業で目指しているのは、まさに、「今は出来なくても、調べれば分かる」という自信をつけて貰うことだ。

毎年、この情報授業でWord、Excel, Power Pointの解説をすると、多くの学生が、

「機能がたくさんありすぎて、やり方を覚えられない」

という悩みを持つ。でも、大丈夫。

機能の全てを覚える必要は無い

これらのソフトをほぼ毎日使っている私も、機能を全部理解してないし、覚えていない。必要なのは、

「こんなことができる」というのを知っておくこと
そうすれば、必要なときに、やり方を調べて対処できる

今日やる、目次の作成や、ページ番号、図形の作成にしても、ネットで方法を検索すると、初心者向け解説がたくさん見つかる。 そうやって作業しているうちに、こういうソフトの操作に慣れるので、あまり心配しないように。

あえて太字で繰り返すが、
この授業で習ったことの全てを今すぐ自分でできなくってもかまわない
「授業で習ったようやれば、こんなことができるはずだ」
「こういうことはコンピュータにやらせれば簡単にできるはずなので調べてみよう」
そういう理解を持って貰うだけでも十分です。授業中の演習がこなせていれば、良しとしましょう。

Wordを使ったレポート作成

ポイント: あなたのメッセージを分かりやすく相手に伝えるために、Wordを使ってできる限りのことをしよう

第2回の授業で述べたようなレポートについての諸注意は、各自でよく考えて、十分にトレーニングする必要がある。申し訳無いけれど、この授業でこれといった即効性のあるテクニックは教えられない。でも、ワードを使って可能な限り読みやすいレポートを作り、採点者による減点を減らす努力はできるだろう。採点者は、たくさんのレポートに目を通さなければならない。そんなとき、読みにくいレポート(例えば、判読しがたい字で書き殴ったようなレポート)があると、減点をしたくなるのは当然だろう。

  • まず、最初にやるべきは、
    • 1. どのようなレポートを求められているのかを十分理解すること。「簡潔な説明」を求められている場合もあるし、「詳細な証拠を用いた論述」を求められている場合もある。
    • 2. 趣旨に応じた長さのレポートにすること(不要なデータを加えて無理矢理長さを伸ばすのはだめ)
    • 3. 何ページもあるようなレポートには表紙をつけること。1頁だけで済むようなレポートに、表紙は必要無い。
    • 4. ページ数が非常に多く、章立てが必要になるようなら(例えば卒論や修論)、目次をつけること。
      表紙や目次の要・不要は担当教員によっても違うので、確認すること)
    • 5. 学籍番号、氏名は必ず書くこと
    • 6. 複数ページにわたるレポートでは、最初に摘要や要旨を作ること。メッセージは短い文章で伝えられると、わかりやすい。
    • 7. 見出しを効果的に使うこと。それによって、そのセクションで自分が主張したいことの種類や内容を、相手に簡単に伝えることができる
    • 8. 読みやすい文字(フォントの大きさ、フォントの種類、色遣い)、やレイアウトにも気を遣うこと
    • その他、「レポート」に関する注意なんかも見ておこう。

では、前回授業でmoodleページからダウンロードしたレポート作成用テンプレートを使って、架空のレポートを1つ作ってみよう。

演習:ダウンロードしたレポート作成用テンプレートを使って、架空のレポートを作る

  • Wordを起動して、レポート作成用テンプレートを開く。
    新規作成で新しい文書を作成し、&ref(): File not found: "report_example.docx" at page "授業/H25/情報処理/05";と同じようなものが作れるかを試すのが、この演習の目的。
  • このテンプレートには、「コメント」機能を使ってコメントが書かれている。これを見えなくするには、メニューバーの「校閲」のところから、「最終版」に切り替えてみよう。
    ちなみに、同じメニューから、「変更履歴」を「オン」にすると、この文書に加えられた変更点が吹き出しや、カラーで表示される。複数の人で同じファイルを編集するとき(例えば、共同で論文を書くとき)には必須の機能だ。
  • 長いレポートには表紙が必要(※短いレポートなら不要。1枚だけのレポートに表紙はつけないほうが、省資源にもなる)
    • 千葉大のホームページから、千葉大のロゴマークをコピーして、表紙に貼ってみよう。ウェブページの画像はコピー・ペーストでワード文書に貼り付けることができる
      1. 千葉大ロゴを右クリックして「画像をコピー」
      2. ワードのページにペースト
    • タイトル、学籍番号、氏名、提出日を入力。
    • タイトル関係の文字を選択し、センタリング(中央揃え)
    • 学籍番号等の情報を選択し、ルーラーで右寄せ(ルーラーが表示されていないときは、「表示」タブで表示させる)
  • 本文に文章を書き込む: 新しいページの作成
    • メニューバーの「挿入/改ページ」で、文書の最後にページ区切りを挿入して新しいページを作成。
    • ある程度の長さのレポートを書く場合、
      要旨(摘要)
      本論
      結論
      引用文献
      とか
      要旨
      序論
      材料と方法
      結果
      考察
      引用文献
      とか、最初に構成を決めておくと書きやすくなる。項目はレポートに応じて変える。たとえば、植物分類学野外実験のレポートなら、こんな感じ:
      はじめに
      
      目次
      
      1.実習場所と実施日
      
      2.観察植物リスト
      
        ・リストの作成方法
      
        ・作成したリスト
      
      3.注目した植物の観察結果
      
        1.
      
        2.
      
      おわりに
      
      参考文献
  • 見出しの設定:
    • それぞれの最上位の見出し行(要旨、本論、結論とか)をダブルクリックして選択し、「スタイル」から「見出し1」に設定(文字の大きさが自動的に変わる)
      • 下位の見出し(上の例で「リストの作成方法」 など)は、「スタイル」から「見出し2」に設定
      • 書式は「書式のコピー・ペースト」Untitled-2.gifで簡単に行える
      • 慣れてきたら、よく使う書式は「スタイル」に登録しておくと便利
  • 挿入タブから、ページ番号をページの下部に挿入
    • (ヘッダー・フッターの部分をクリックすると、、「ヘッダー・フッターツール」が表示される。ページ番号や日付などを挿入できる)
      • 表紙にはページ番号を入れたくないので、「先頭ページのみ別指定」にしておく。
      • この場合は、「開始番号」を0にすることで、表紙にページ番号が入らない。
      • 文字の大きさや書体を見やすいように整える
        例えば、頁番号の文字を選択し、「Times New Roman 10 ポイント」にする
      • 終わったら「閉じる」
  • 表の作成は「挿入」タブから罫線ツールで
    • 「表の作成」アイコンUntitled-3.gifをクリックして、目的とする表の行数・列数をマウスのドラッグで指定する。
    • エクセルで表を作っておき、コピー・ペーストするのも簡単
    • 表の罫線の書式は「罫線」のアイコンUntitled-4.gifをクリックして行う。
  1. 図の作成は「挿入」タブから図形ツールで
    • □や○などの基本図形や矢印、吹き出しなども自由に作成できる
    • いろんな図を利用できる → Power Pointの作業と共通する部分が多いので、次週解説。
  • 論文やデジタル画像から図を切り取ってきて証拠に使う [smile]
    • 例:
      クジラとカバに近縁であることを示した論文を見る。Nikaido et al,1999, PNAS
      • クジラとカバの関係を示した系統樹を表示させる
      • Snipping Tool(あるいはPrtSc)で使いたい図を切り取る
      • Wordの書類に行きペースト
    • 画像を右クリックし、レイアウトで、文字と画像の関係(背面、全面、回り込みなど)を調整する
    • 図には必ず番号とレジェンド(説明)をつける。引用もとも明示する。
  • 引用文献を証拠に使って、相手を納得させよう
    • レポートの中で、他人の意見と自分の意見を区別するのはとても大切。他人の意見(つまり、そういう意見があるという事実:上の説明にあったカバの系統関係など)は、文章の後の()内に文献を引用しておくことで、その意見がいつ、誰が、どの雑誌に発表した意見であるかを示すことができる。つまり、文献引用することで、「そういうことが言われた事実があるということ」証拠を示している。レポートの場合は、そういう、文献データ(事実)を証拠として、なんらかの結論を導き出し、自分の意見として提出することが求められている。目指すところは、
      いろんな証拠を使って、自分の意見ややったことを相手に納得させること!
  • 目次の挿入
    作成する文書が長くなってくると、目次をつける必要がある。目次は、見出しのところに「見出し」スタイルが適用されていると、自動的に作成することができる。
    • (上述)文章中の見出しに、見出しスタイル(「見出し1」、「見出し2」など)のスタイルを当てはめる。
    • (上述)文字列を右クリックして、コンテキストメニューからスタイルを選び、見出しを選ぶ
    • (上述)フッターを挿入し、ページ番号を表示させておく。
  • 目次を挿入したい場所にカーソルを移動し、「参考資料」タブから「目次」を挿入

Wordを使った文書作成に習熟する [smile]

Wordはさまざまな機能を持っている。上ではレポート作成に必要なごく一部の機能だけを紹介したが、さらに、卒業論文の作成などで便利な機能もいくつか紹介しておこう。

テンプレートを用いたレポート作成

レポート等の文書を作成する場合、読みやすさを求めるには、フォントの種類や大きさを変えたり、行間を整えたり、いろんな手間が必要になる。しかし、こういった作業を何度も繰り返してやるのは面倒。そこで、自分専用テンプレート(ひな形)を1つ作っておく。そうすれば、今後のレポート作成のときには、ひな形に合わせて内容を書き換えるだけで、見栄えのいいレポートができることになる。
右のリンクから、レポート作成のためのテンプレートをmoodleページにアップロードしておいたので参考にして欲しい(ダウンロード)。
このファイルを開くと、レポートで使われる様々な書式設定の見本と解説が載っているのが分かる。説明を読みながら、自分用に内容を変更すれば、自分だけのためのレポート用のテンプレートが作成できることになる。
授業では全てを解説している時間は無いので、いくつかの項目を抜き出して解説する。残りは自分で読んで、いろいろと変更して、機能を体験して欲しい。

スタイルの変更:

Wordの文書では、要素ごとにスタイルが設定することができる。この場合、基本のスタイルを変更すれば、そのスタイルが適用されている部分の書式を一度に変更できる。

  • ホームタブを開くとスタイルの一覧が表示される
  • たとえば、「緒論」や「材料と方法」などの見出しには「見出し1」のスタイルが適用されている。
    この見出し1の文字の色を黒からオレンジに変更してみる
    • ホームタブで「見出し1」を右クリック。表示されるメニューから「変更」を選択
    • 書式の変更で、「フォントの色」をオレンジに変更→見出し1が適用されている部分の文字の色が全てオレンジになった
      さらに、他の見出し(見出し2, 見出し3等)の色も黒に変わった。
      これは、見出し2などで基準にするスタイルとして「見出し1」がつかわれていたため。見出し2の色だけを変えたかったら、上と同様にして個別に変更。

添付ファイル: filesequence_Pdic.fasta 1471件 [詳細] file#5_1.jpg 699件 [詳細]

Last-modified: 2015-05-13 (水) 16:45:30 (3481d)