arcanum_jp’s blog

おっさんの日記

「統計学が最強の学問である」激面白である

統計学が最強の学問である

統計学が最強の学問である

 フラッと入った本屋でビビッと目に入った本。あえて「統計学が最高」と断言しているんだぜ!傲慢だな・・・おれも言ってみたいもんだな。「xxが最高のyy」だなんて・・・「Javaが最高のプログラミング言語だ」とか・・・「Wicketが最高のJavaフレームワークだ」とか・・・怖くて言えない。嫉妬も入ってパラパラめくってみて「なんじゃこりゃぁ!」(松田勇作風)っと面白かったのだがその時は買わなかった。後になってほしくなって酒の力を借りてぽちっとamazonで買ってしまった。これで僕も本屋で見本を見てamazonで購入する輩と同類である。

次の食べ物を禁止すべきかどうか考えてみましょう

 さてこれらのなんらかの集計結果条件を見てこの問題の食べ物を禁止すべきかどうか・・・僕がこの本を読み始めて「へー!」って感じた問い。

    • 心筋梗塞で死亡した日本人の95%以上が生前ずっとこの食べ物を食べていた。
    • 強盗や殺人などの凶悪犯の70%以上が犯行前24時間以内にこの食べ物を口にしている。
    • 日本人に摂取を禁止すると、精神的なストレス状態が見られることもある。
    • 江戸時代以降日本で起こった暴動のほとんどは、この食べ物が原因である。

※ 本文より引用(p70)

 19世紀まで行われていた統計、あえて言うと統計を知らない一般人が何かする際にするアンケートやデータ集計の類は一面は見せるが真実は見せない。著者はそんな集計やそのグラフを「ふーんとしか言えない」「つっこみ所が多すぎるグラフ」などと一刀両断する。ちなみに上記の集計の例で言われている食べ物は「ごはん」ですって。著者はデータをビジネスに使うためには次のような3点の問いが必要という

    • 何かの要因が変化すれば利益は向上するのか?
    • そうした変化を起こすような行動は実際に可能なのか?
    • 変化を起こす行動が可能だとしてそのコストは利益を上回るのか?

 そういった問いにこたえるためにたくさんの統計の考え方を紹介する。

数字弱い僕でも大丈夫だった

 統計というと色々を訳のわからん数式がうにょうにょと出てきて数学の専門家じゃないと理解不能・・・それを最高だなんて、、、著者はマゾっ気があるんじゃないか・・・大丈夫です。本書はどちらかと言うと、統計に興味を持ってくれた人に統計の面白さ、良さを教えてくれるにとどめます。数式も殆ど出ませんし、色々と統計の大家のエピソードを持ち出して理論の成立する前後など面白く書いています。統計を知りたい人への良書だと思います。


 この本で一番の収穫だと思ったのは、全数検査はいらないということだろうか。自分も(コストの面ってことを考えると)全数検査っていらないよねって思ってはいたけど、それが何でかわかったし全数検査なんてするよりはまずは正しい判断をするために最小限のデータをって事が統計を知らない者にとっては衝撃的だった。


 個人的には3章、4章が傲慢すぎて面白いです。また6章は統計と言っても色々な分野での学問がある。これは最近の学問がすべてにおいて細分化していっているのと同様に統計も同じように細分化していっている。その細分化していっている専門家たちの考え方の違いが面白いなぁと感じた。6章でテキストマイニングのツールとしてMeCabが紹介されていたりGoogleの検索技術を支えるN-gram解析の紹介など、テキストマイニングとして自分もなにかしらやってみたいと思ったり。


 2013年度の面白いおすすめ本として間違いなくおすすめできる1冊かな。