11月10日週のまとめ

メモしたら定期的に見返さないとなにも覚えていないので見返した。

tsneの話

次元削減の手法
cranにも実装があるけど遅いとのこと。とりあえずバイナリ使うのがよさげ。
http://homepage.tudelft.nl/19j49/t-SNE.html
http://scwn.net/2010/02/20/new-t-sne-package-for-r/

地理情報の話

全体感を掴むのによさげだけど当面使いそうにない。
http://www.data-artist.com/atelier/20131023.html

Rの入力周りの話

このへんの入力周りはtipsをまとめておきたい。
まあ他の言語使えやって話になるのかもしれないけど、Rでできるんならそれに越したことはない。
http://stackoverflow.com/questions/1727772/quickly-reading-very-large-tables-as-dataframes-in-r
http://www.cerebralmastication.com/2009/11/loading-big-data-into-r/
http://stackoverflow.com/questions/19863467/how-to-speed-up-loading-data-into-r

クラウドソーシングでモデルの性能を競わせてさらにそれを組み合わせる話

IBISで発表があったらしい。聞きにいけば良かった。
http://ibisml.org/archive/ibis2013/pdfs/D-44.pdf

多重共線性とバイアスバリアンスの話

多重共線性はモデルのvarianceを増大させる。Max Kuhnの予測モデルの本より。
http://www.amazon.co.jp/dp/1461468485

今巷に増えつつあるRのforkの話

pqrだのJVM上で動くRenjinだのいくつかある実装を様々な観点から比較している。
http://4dpiecharts.com/?s=Fearsome+Engines

MonetDBの話

MonetDB.RパッケージだとRの関数をMonetDB上のSQL?にマップしてくれるのか。
http://www.inside-r.org/packages/cran/MonetDB.R/docs/monet.frame
RODBCとRSQLite.extfunsを合わせたようなイメージなのかな。

ワンクリックの話

生産管理の話として参考になる。
http://www.seattleweekly.com/1998-07-15/news/how-i-escaped-from-amazon-cult/