Data scienceをきわめて個人的な意思決定に活かす

R Advent Calendar @ Qiita 14日目
Data science for social good という動きがあります。
平たく言えば、データサイエンスをNPOとか社会的な活動にもっと活かそうぜという話です。
先のKDD 2014においてもワークショップが開かれていました。
http://dssg.uchicago.edu/kddworkshop/
また、O'Reillyから出ている「Machine learning for hackers」 (和書名:入門機械学習)の著者であるDrew ConwayもData science for social goodに関連したKDD2014の発表において以下のような発言をしています。

No young hacker grows up dreaming of selling ads!

夢のある仕事しようぜ!!!ってことなんだと思います。
過去にもPro vono(プロボノ)という言葉が流行ったりしましたが、その延長線上にある話でしょう。

日本でもData science for social good

一方、日本においても公共データを活用するという視点で、近年活発な議論が交わされています。
昨年、東大で開かれたオープンガバメントシンポジウムも記憶に新しいところです。
このパネルディスカッションの中で下記のような発言がありました。

「どういったデータが存在するかを知っているヒト」、「プログラミングやデザインなどといった道具を持つヒト」、「課題を持っているヒト」が点在している中で、これらの人々を繋いでいく仕組みが必要であるとの指摘がありました。

行政レベルの大きな課題になると分析結果に影響を受ける人数規模もそれなりの大きさになるので、上記の3タイプのヒトを揃えた上で万全の態勢で臨む必要があります。
まったくもって大変です。
そして、ここまで長々と書きましたが個人的にこの辺の話についてはさして興味はありません。
本題はここからです。

そこで Data science for me ですよ

social good に活かそうとする人間がいれば、当然その逆の方向に活かす人間もいます。
プライベートデータマイニングとかData science for meとか適当に呼んでいますが、要はData scienceをきわめて個人的な意思決定に活かしている人々です。
私の興味はそこにあります。social goodとかどうでもいい。
近年、もっとも有名な例としては声優統計が挙げられるでしょう。
http://voice-statistics.github.io/
私がData science for me について考え始めたのはこれがきっかけと言っても過言ではありません。
2012年12月に第1号を読み、きわめて個人的な意思決定にData scienceを駆使している人々がいることに衝撃を受けました。
自分に声優に関する知識が無く問題意識を全く共有できないことを恥じた結果、声優について学習を始めたほどです。

Data science for me の事例

声優ドメインに限らず、個人的な意思決定にData scienceを駆使している人はちらほらいらっしゃいます。
以下に事例を列挙します。

家賃をモデリングして割安な部屋を見つけようという人々がいました。

また、ハイレゾ音源で聴く価値があるCDかどうかを判定しようとした方もいました。

寿司にかける情熱はデータサイエンティストを動かします。
シェルスクリプトで並ばずお寿司
http://qiita.com/gg_hatano/items/c4e2b8e32a1693146c11

なお、私も初対面の人と喋るのは苦手という個人的な悩みがあり、そのためにRのパッケージを作りました。

なお、データを分析する際の目的として「意思決定はともかくとしてデータの構造を理解したい」「データを使って意思決定したい」の二つに大きく分けられると思いますが、今回は後者の事例に限定しています。

まとめ

長くなってしまいました。
言いたかったのは、Data scienceによる意思決定をもっと身の回りのことに活かしてもいいんじゃないということです。
昔に比べれば、WebAPIやスクレイピングでデータが入手しやすくなり、オープンソースのデータ分析環境も整ってきました。
計算機もかつてのスパコンレベルの性能がノートパソコンに詰まっている時代です。
企業の意思決定にKKD(勘と経験と度胸)だけで対応するなんて!!!みたいな話が以前ありましたが、個人の意思決定に関してはKKDで対応する人がほとんどではないでしょうか。
実務では集計屋ですよへへへ(自嘲)みたいな人も、自分自身の意思決定であればData scienceを活用する局面がたくさんあるはずです。
もっともっと個人的な意思決定にData scienceを活かしていきましょう。
2015年の皆さんのご活躍を期待しています。