2011-01-01から1ヶ月間の記事一覧

ランダムフォレストの実行速度

R

ランダムフォレストは便利だけど時間もかかるという話。 ということでデータの大きさによってどのくらい実行速度が変わるか測定してみた。 今回はデータ数を100、1000、10000と変化させて計測している。 左が経過時間、右がデータ数100の場合を1とした場合の…

文字コードの扱いに悩まされる

RCurlを使ってURI をダウンロードしたい。 library(RCurl) getURL("http://www.enpaku.waseda.ac.jp/db/gendaino/shousai.php?joenidno=00611-40-2001-01-02") この場合なんだかぐちゃぐちゃしたものが表示される。 仕方ないのでRのデフォルトの文字コードで…

ggplot2で複数グラフ表示

ggplot2で作った複数のグラフを並べたいというケースは多々あると思います。 同一データでグループごとにグラフを分けて並べる場合 facetを使って並べます。以下使い分け。 単純に並べていく時はfacet_wrap 格子表示する時はfacet_grid facet_wrapは並べ方を…

MacBook Air 11インチ欲しい!

MacBook Air 11インチ欲しい!と書くともらえるとか

ggplot2手習いその1

作者のサイトをみれば大体のことは書いてあるのだが、いかんせん使い分けがわかりにくいものもある。 なので自分用に使い方をまとめていく。まずはパッケージとデータ読み込み #パッケージ読み込み library(ggplot2) #データは適当に作った set.seed(1) x <-…

メモ

R

左の行列の列数と右の行列の行数が等しくないとき、行列積は不可能であり、R でもエラーとなる。> A %*% B 以下にエラー A %*% B :適切な引数ではありません

昨年の総括と今年の目標

備忘録的ではありますが自分の立ち位置を見直す意味でも昨年の総括と今年の目標を挙げておこうと思います。ジャンルは3つ、仕事、日々の研究、能です。なお、日々の研究は仕事には直接役に立たないけれども間接的に、将来的に役に立つかもと思いながら取り組…