dplyrのsummarise関係のバグ
maniputatrのメーリングリストより。
https://groups.google.com/forum/#!topic/manipulatr/-z28V8UVU9s
下記コードでNaNが出る。
library(dplyr) data(diamonds, package = "ggplot2") diamonds %.% group_by(cut) %.% summarise(all=mean(price), E=mean(price[color == 'E'])) #Source: local data frame [5 x 3] # # cut all E #1 Fair 4358.758 NaN #2 Good 3928.864 NaN #3 Very Good 3981.760 NaN #4 Premium 4584.258 NaN #5 Ideal 3457.542 NaN
plyrを使って同様の計算をするとうまくいくということでバグみたい。
library(plyr) ddply(diamonds, .(cut), summarise, all=mean(price), E=mean(price[color == 'E'])) # cut all E #1 Fair 4358.758 3682.312 #2 Good 3928.864 3423.644 #3 Very Good 3981.760 3214.652 #4 Premium 4584.258 3538.914 #5 Ideal 3457.542 2597.550
CRANに上がっているバージョン(version 0.1)だとバグがあるが、開発中のバージョン(github上にあり)だと直っているとのこと。
CRANに修正されたバージョンが上がってくるのを待つか、github_installするかしてご対応ください。