Tuesday, June 19, 2007

誤差の誤差

7 時過ぎに起床。今日はいい天気、かも。 ゴミ出しをして、珈琲とバゲット一切れの朝食。 残りの古バゲットで、昼食用のサンドウィッチを作る。 このホースラディッシュ入りのマスタード、 業務用の大型を買っておけば良かったかな… 電車の中で財務諸表を読もうといくつか鞄に入れて出勤。 丁度、株主総会の季節で事業報告書が送られてくる。 私のポートフォリオは大半がインデックスの類なので、 企業の個別選択は趣味に過ぎないし、 数理ファイナンス理論上は「無駄」なのだが、 まあ一応は真面目に(一年に二度だけ)チェックしている。 午前中は卒研ゼミI。 こう言うと他の卒研生に怒られそうだが、 I(確率入門),F(数理ファイナンス), S(確率過程論)の中でこのIが一番面白い。 20分ばかりの昼食時間でサンドウィッチを食べて、 続いて「暗号理論」の講義。確率論と計算量の理論から、 いくつかのトピック。 続いて、卒研ゼミS。離散伊藤公式。 隙間時間で生協書籍部に行って注文していた本を受け取り、 続いて 16 時から全体教授会。 今日はわりとヘヴィな議題が複数あったが、 出席者は少なく、思ったより早く終わった。 その後に、学部の大改革構想の会議があるかららしい。 教授会に出たあと、近くのトイレに行ったら、 その途中で驚くべき部屋を見つけた。 「理工学部改革事務室」とか言うのだ。 ちょっと覗いたら、わんさか人が働いていた。 こんな大勢の人が毎日朝から夕方まで改革のために働いていたとは。 改革が尽きないはずだ。 でなければ、改革の波に乗り遅れてしまう。 私も 18 時から別の会議が入っていたが、 教授会がずれ込んで、夕食を食べていたらかなり遅れそうだったので欠席した。 そのまま帰宅してから、カルボナーラと小さなサラダを作って食べた。 そして今。さ、「きょうの料理」でも観てから、お風呂に入ろう。

財務諸表と言えば、この前の某食事会の時に、 「数学も時に役に立つ」と言う一例として、 帳簿の改竄の見破り方を話したら、テーブルの近辺でけっこう好評だった。 帳簿に並んでいる数それぞれの、 一番上の桁の数字だけに注目するのである。 本当なら大体、"1" が一番多く、次が "2"、次が "3"、最後が "9" と段々少なくなっているはずだ。 極端に "1" が少なく、大きい数字が多いようだと、改竄の可能性がある。 細かい議論は面倒だが、おおざっぱにポイントを言うと、 帳簿に載っている数のほとんどは、もっと小さな数の合計になっていること (例えば、一年間の商品の売上とか)、 そして、一番上の桁とは位上がりで出来る数字なのだから、 "1" でいる時間が一番長いことである。 この数字の現れ方の分布は理論的に分かっているので、 その分布から大きく外れていると疑惑が生じる。 おそらく税務署が 「数字の顔付きがクサイ」と思うときは、 このあたりを経験とカンで感じとるのだろう。 まあ、ここまではその道の人は誰でも知っているのだが、 もう一歩詳しいところまで進もう。 貴方がこの分布を知っていて、 それに従ってデータ捏造をしても、 プロが詳細に見れば分かるかも知れない。 と言うのも、現実のデータはランダムだから、 理論値からかなりずれて実際の数字は現れるはずで、 理論的分布に完全に一致しているのはおかしいからだ。 だから、本気で(?)捏造や改竄をするときは、 理論的分布からのずれの理論的分布に従って、 誤差を加えなければならない。これを「二次の捏造」と言う。 勿論、この理論的分布からのずれの理論的分布からのずれまで考慮して、 「三次の捏造」も可能ではあるが、 おそらくそこまでは必要ないことがほとんどだろう。