2014-10-01から1ヶ月間の記事一覧

Rのコアメンバーリストを取得する

R

別にアタック目的ではない。 library(rvest) mlist_html <- html("http://www.r-project.org/foundation/memberlist.html") mlist <- mlist_html %>% html_table() %>% `[[`(3) %>% paste(collapse="\n") %>% strsplit(split="\n") %>% unlist() data.frame(…

NSE(Non-Standard Evaluation)について

NSEについて前回の記事で叫んだところ、kohskeさんが解説記事を書いてくれた。素敵! http://qiita.com/kohske/items/7dbef6ae3ff34c093ce4 NSEの説明についてはこの記事で十分なのだが、なぜ今さらNSEなんてものをHadleyが持ち出してきたのかについて彼の資…

dplyrのなんたら_eachを効率的に使う

正直誰でも知ってる関数だし他にも解説している記事はあるので今さらだが、dplyrパッケージのなんたら_each関数の使い方をまとめる。 なんたら_eachを知ることでコピペを連発していたうちの同僚は感動のあまり涙の海に沈んだ。 たとえば以下のように一つの列…

tapplyの再実装で高速化

R

applyとかtapplyとか遅い。Rcppで楽したい。けど苦労はしたくない。 そんなときKmiscパッケージのrcpp_tapply_generator関数が役に立ちます。 使い方は簡単。tapply関数のFUNをreturnとともに放り込むだけ。 install.packages("Kmisc") library(Kmisc) cppTa…

緑色の毛玉のサイトをrvestでスクレイピング

R

先日出た勉強会で、某サイトが大変良い構造だと聞いたのでrvestでスクレイピングしてみた。 途中の`[`はmagrittrパッケージでextract関数を使った方が可読性は上がるかもしれないが宗教上の理由で見送った。 なお、pipeRでPipeを使う際は最後に$valueをつけ…

声優のTwitterアカウントをrvestで収集

R

rvest使ってみようと思いつつも使う機会が無かったのでこちらのPythonコードをrvestを使って再現してみる。 filter内の条件等は不要データを削除しているだけなので、rvestを使っているのは3行程度。 なおdata_frame関数はdplyr0.3で実装された関数なのでご…

ダージリン急行を観たのでwesandersonパッケージを紹介します

R

映画「ダージリン急行」を観ました。 監督はその色づかいに定評のあるWes Anderson。 Rのパッケージには何でもあるので、当然Wes Andersonの色づかいをモチーフにしたパッケージなどもあります。インストールはgithubから。 devtools::install_github("karth…