2014-06-01から1ヶ月間の記事一覧

rbind.fillの機能はrbind_listに含まれている

R

plyrパッケージにrbind.fillという関数がある。 データフレームをrbindする時、通常は列名が一致してないとエラーが出るのだが rbind.fillは一致していない列をNAで補完して結合してくれる。 で、dplyrパッケージの場合、rbind_all、rbind_listにその機能が…

Rで左から右に書く

R

chain operator %>% の導入により左から右にコードが流れるようになった。 assignment operatorは別にでもいい。 ということは以下のように書ける。 視認性の問題もあるので長いコードや人と共有するコードを全部これで書くかどうかという話はあるが、 短い…

dplyrでdata.tableがdata.frameに変換されてしまう件

こういう話がある。datatableどうしをinner_joinしたらdataframeになって爆死したんだけど, なんでかなこれ— はたむ (@gg_hatano) 2014, 6月 23確かめてみる。 dt1 <- data.table(A = letters[1:10], X = 1:10, key = "A") dt2 <- data.table(A = letters[5:…

全角カッコの中にある全角数字を半角にして取り出したい

R

以下のような文字列があった時に1を1として取り出し、他はNAとしたい。 smp <- c("新しいファイル(1)","嫁") library(magrittr) library(Nippon) library(stringr) smp %>% zen2han() %>% str_extract("(\\d)") %>% str_replace_all("(|)","")

Rからawkを使う

R awk

ちょっと何を言ってるのかわからないと思うけどメモ。 Kmiscパッケージで使える。 awkという名前ではないawk(gawkとかmawkとか)を使っている場合はawk.setでそれを指定しておく。 library(Kmisc) dat <- data.frame( x=1:10, y=letters[1:10], z=LETTERS[1…