Thursday, January 08, 2009

文学とマルコフ連鎖

久しぶりの朝から夕方まで働き尽めデイが応えたらしい、 9 時近くまで寝てしまった。 朝食は珈琲と学生から帰省土産にもらった和菓子。 スケジュールを整理して、午前中は Lisp (Scheme)の勉強など。 朝風呂に入ったあと昼食に、 しめじのスパゲティ・アーリオオーリオを作って食べる。 午後は少し昼寝をしてから、修士論文の添削。 校正や添削の類の作業は集中力がいるし、飽き易いので、 20分とか15分くらいずつ細切れにするのが良い。 最近の私はそれでも合計一時間くらいが一日の限界だけど。 そのあとは、論文書きに切り替える。 夕食は御飯を炊いて、だし巻き、納豆、梅干し、 オクラと葱の味噌汁。夜も昼間の続き。

時間が経つごとに状態が移り変わって行って、 次にどの状態になるかが、 今どの状態にいるかだけによる確率で決まっていることを、 マルコフ連鎖と言う。 例えば、赤ワイン、白ワイン、スパークリングのどれか一つを毎日一本飲むのだが、 赤ワインを飲んだ次の日は必ず白を飲み、 白ワインを飲んだ次の日は赤ワインかスパークリングのどちらかを半々の確率で選んで飲み、 スパークリングを飲んだ次の日は赤か白のどちらかを半々の確率で選んで飲む。 これは、赤、白、泡の三つの状態があるマルコフ連鎖である。 プログラムの歴史と同じくらいずっと昔からあるプログラミングの遊び、 または演習問題として、 でたらめな文章をマルコフ連鎖を使って生成する、というものがある。 つまり、十分長い文章の統計をとって、 どの単語の次にどの単語が来ているかの確率だけを計算しておき、 あとは勝手にマルコフ連鎖させて文章を作る。 日本語の場合はちょっと難しいが、 英語のように単語に分かれている言語では、簡単にプログラムが作れる。 しかも、なかなかいい勉強になるので、よく演習問題になる (例えば、「プログラミング作法」(カーニハン&パイク/福崎俊博訳/ASCII) の第三章に、大変教育的な解説がある。基本的には、 文字列操作とハッシュの使い方の練習だ)。

ここまでは前置きで、最近、日本文学界に衝撃を与えたニュースについてだ。 第3回日本ケータイ小説大賞を受賞した「あたし彼女」から統計をとって、 マルコフ連鎖させたところ、 マルコフ連鎖の 「あたしマルコフ」 と区別がつかなかった、いや、ひょっとすると後者の方が優れていたのである。 まさに文学の終焉を感じるニュースだ。 実際、次かその次あたり、機械が日本ケータイ小説大賞を取るかも知れない。 少なくとも、選考委員会はどれが本当の人間が書いたものなのか、 悩むことになるだろう。 どうやら文学賞を受賞することは、チューリングテストとしては易し過ぎたらしい。