2012-01-01から1年間の記事一覧

data.frameで因子型への変換を抑制する

R

Rでは初期設定として文字列は因子型に変換される。毎回read.csv("hoge.csv", as.is = TRUE)とかdata.frame(num = 1:3, char = c("hoge", "fuga", "hage"), stringsAsFactors = FALSE)とかやってたがもう耐えられなくなったので.Rprofileファイルに以下の一行…

Rからエクセルを開いてデータフレームをいじる

みんな大好きエクセルのお話です。 XLConnectを使えばエクセルからRへの入出力が自由自在(一部制限あり)ということはご存じかとは思いますが、ついにデータフレームの修正までエクセルでできるようになりました(最新版0.1-9)。 まあ、edit関数を使えば表…

日付型の時の範囲指定

時系列で眺めている時に、特定の期間にフォーカスしたいことは多々あると思います。 xlimとかylimで範囲は指定するけれども、日付の時は日付型にしないとうまくいかない。 考えてみれば当たり前なんだけど、5分位はまったのでメモしておく。 ggplot(economic…

勉強会で発表する際に使うサンプルデータセット

R

外部で発表する際サンプルのデータセットが必要になること、あると思います。 まあ組み込みのデータセットを使えば大体事足りるわけですが、組み込みの場合、規模が小さかったりしてもっとここではないどこかを探したくなる。 そんな時はUCI Machine Learnin…

PRMLの図を描く

今後追加していく。 とりいそぎ。 library(ggplot2) qplot(x = 0:1, geom = "blank") + stat_function(fun = function(x)1-(1-x)^1) + stat_function(fun = function(x)1-(1-x)^2) + stat_function(fun = function(x)1-(1-x)^5) + stat_function(fun = funct…

サイズの大きいサンプルデータをゲットする

R

R使っててとりあえずサイズの大きいサンプルデータが欲しかったので関数を書いた。 なお今ロードしているパッケージの範囲内。 インストールしているパッケージ全てに拡張したい気もするけど当面はこれでいいや。 getDatalist <- function(){ datalist <- da…

scale_datetimeがうまくいかなかったけど解決した

ggplot2でDate型のデータを用いた際のデフォルトの表示が気に入らない。 scale_x_datetime(format = "%Y-%m-%d")みたいに指定することで日付表示を変更できる、とサイトには書いてあるのだがうまくいかない。 が、POSIXct型に変更するとうまくいったのでメモ…

面グラフを描く

R

面グラフを描きたい。 まあggplot2を使えばgeom_lineでfillを指定したりすれば一発なのだが、以下のサイトにあるような図を描きたいのでggplot2だと色々過剰。 http://www.informationisbeautiful.net/visualizations/mountains-out-of-molehills/ したがっ…

UseR!2012に行くために

R

UseR!2012に行きたい方、かなり多いと思います。 下記リンク先を読めば全部書いてあるのですが、ひとまず必要な情報について簡単にまとめましたのでご参考まで。 http://biostat.mc.vanderbilt.edu/wiki/Main/UseR-2012 日程及び場所 2012/6/12 - 15 アメリ…

svgで日本語表示

R

svgは日本語表示できないじゃん!使えないじゃん!と叫んでたら教えていただいた。 window.twttr = (function(d, s, id) { var js, fjs = d.getElementsByTagName(s)[0], t = window.twttr || {}; if (d.getElementById(id)) return t; js = d.createElement…

第1回:P1-10まで

PRMLを読み始めた。 ということで最初の方の図をトレース。 ggplot脳なのでggplotでやる。 library(ggplot2) x <- seq(0, 1, by=0.1) t <- sin(2*pi*x) + rnorm(n=11, mean=0, sd=0.5) M0 <- fitted(lm(t~1)) M1 <- fitted(lm(t~poly(x,1))) M3 <- fitted(lm…

Google Fusion Tablesでインフルエンザ予防接種ができる医療機関を可視化

加入している健保の方で、インフルエンザ予防接種の補助を出してくれるということでその医療機関一覧をもらったのだが、やはり住所だとわかりづらい。 こういう時簡単に可視化できるといいなあとか思って以前Rでごにょごにょやってたのだがどうもめんどい。 …