2011-01-01から1年間の記事一覧

jQueryとRを使ってインタラクティブでコケティッシュなHTML出力

R

hwriterに慣れてくるとHTML5はどうなのjQueryはどうやったら使えるのという気分になってきます。 ということで今回はjQueryをhwriterから使ってみます。 とはいえhmakeTag関数でscriptタグやstyleタグを記述するだけです。 以下実例(環境は Windows7 + Goog…

googleVisとhwriterを使って地図付きAjaxなインタラクティブ案内状をRで作る

R

地図付きAjaxなインタラクティブ案内状を作らなければいけないんだけど手元にはwindowsとRしかない、そんな状況あると思います。 今回はHTML出力がお手軽にできるhwriterパッケージと、google visualization APIをRから使えるgoogleVisパッケージを使って、R…

httpsプロトコルでRのソースを読み込む方法

R

ソースコードが長い場合、githubで公開することがたまにある。 だがgithubはhttps。 Rは標準ではこのプロトコルをサポートしておらず、source("https://ほにゃらら")とするとエラーが出る。 仕方がないので、RCurlを使って落としてきた後、一時ファイルに書…

医療機関リスト+地図をHTMLレポートにする

R

医療機関の住所ってのはなぜかPDFで公開されていたりして非常に加工しにくい。 しかしこれをPerlで加工して公開してくださっている方がいる。 保険医療機関一覧データ保管庫せっかく公開されているので地図にプロットしてみたい。 今回は自分の住所を入力し…

Tokyo.R #13に参加してきた

R

月に一度のお楽しみということでTokyo.Rに参加してきた。もう13回にもなるのかーと感慨深い。毎度のことながら主催のyokkunsとその他もろもろの手配をしてくださる幹事の皆さんには感謝。今回の発表内容は以下の通り。 @isseing333 : 線形判別分析 @kos59125…

Project Euler5

R

Problem5 2520 is the smallest number that can be divided by each of the numbers from 1 to 10 without any remainder.What is the smallest positive number that is evenly divisible by all of the numbers from 1 to 20? 1から20までの全ての数で割…

Project Euler4

R

Problem4 A palindromic number reads the same both ways. The largest palindrome made from the product of two 2-digit numbers is 9009 = 91 99.Find the largest palindrome made from the product of two 3-digit numbers. 回文数(左から読んでも右…

iPhoneの位置情報をRで可視化する(ただしMacOSXのみ)

R

iPhoneが位置情報をこっそり記録してましたーって騒ぎが最近ありましたが、その際その位置情報を可視化するコードも同時に公開されていた。 http://petewarden.github.com/iPhoneTracker/ただ見るだけだったら先のコードで十分なのだがRを使っている人間とし…

Project Euler3

R

Problem3 The prime factors of 13195 are 5, 7, 13 and 29. What is the largest prime factor of the number 600851475143 ? 素因数分解してそのうち最大のものを求めよ、という問題。 2から10000までの範囲で約数を探して最初に出現したもので割った商の…

Project Euler1&2

R

Problem 1 If we list all the natural numbers below 10 that are multiples of 3 or 5, we get 3, 5, 6 and 9. The sum of these multiples is 23.Find the sum of all the multiples of 3 or 5 below 1000. 1000未満の自然数のうち、3または5の倍数である…

Rで計画停電に従って地図を塗り分ける

R

ようやく本題ということで計画停電のグループに沿って地図を塗り分けます。 大田区でそのままやろうと思っていたのですが、大田区は今計画停電の対象ではない。 ということで対象地域が多い八王子市に変えました。今日は八王子市のデータを前回と同様にe-sta…

Rで地図を塗りわける

R

Rで地図の色を塗り分けたいこととかありますよね。計画停電とか計画停電とか計画停電とか。 で、そんなときはmaptoolsを使うのですが、ある時に仕様が変わったらしくネットの資料はそれに対応してなかったりするわけです。 ということで自分用にメモ。 まず…

suggestion数を調べる。

R

今度はsuggestion数を調べてみた。 caretみたいに複数のパッケージをメタ的に扱うパッケージを探すのが目的。 こっちは色々知らないのが多い。 AERはeconometricsのパッケージだったけかな。 パッケージ名 suggestion数 caret 58 rattle 50 IPSUR 24 AER 23 …

依存されているパッケージ数を調べてる

R

有名なパッケージは押さえておくと後々作業が楽になるに違いない。 ということで調べてみた。 CRANからパッケージ情報を取得しグラフを構築、依存されているパッケージ数はdegree(グラフ, mode="in")で算出した。 ここでは上位30までを示している。 こうして…

行列をベクトルで割る

R

行列操作で困っている。このような行列があったとして > mat <- matrix(1:6, ncol=3, byrow=TRUE) > mat [,1] [,2] [,3] [1,] 1 2 3 [2,] 4 5 6 こういうベクトルで各行を除したい。 > v <- 1:3 > v [1] 1 2 3 こうすると求めている結果とは違うし > mat/v […

住所データから緯度経度を取得して地図にプロットする

R

住所データをもらって地図上にプロットする仕事がたまにあるので、RgoogleMapsで対応しようと思っていたらAPIの仕様が変更になったせいで、そのままではマーカーがプロットできない。 仕方がないのでとりあえず動く関数を作った。 「とりあえず」なのでスク…

data.frameに変換する時文字列が因子になるのを避ける

R

Rではデータサイズを抑えるためにデフォルトで文字列を因子に変換されることがある。 よく遭遇するのは以下2つのケースなので対応策をメモ read.csv()でcsvを読み込むとき as.is=TRUEとする read.csv("hoge.csv", as.is=TRUE) data.frame()で行列等をデータ…

reshape関数の挙動

R

reshape関数の挙動にはいつも悩まされるのでメモ。 wide形式に変換した時にtimevarに指定した変数の並び順がそのまま反映されるので、事前に並び替えておくことが必要。 > index <- seq(1,10) > time <- rep(c(4,2,5,3,1), 2) > value <- seq(11,20) > > tes…

Rパッケージリコメンデーションコンテストその2

R

その1の続き。とはいえコンテストはずいぶん前に終わってしまったのでこれは備忘録。 ユーザーとパッケージの相互関係 昨日はユーザーとパッケージのそれぞれの視点からのインストール割合をみた。まとめると以下のようになる。 ユーザーは一人を除くとせい…

リストに合致するデータのみを抽出

R

下のような形で抽出するというのをいつも忘れる。 data[data$V1%in%list$V2,]

ウォーホルのアレっぽいものを作ってみる

ggplot2のテーマ練習がてら。画像がつぶれてもうた上になんか全然違うけどまあよい。もう少しよくする。 コードは以下の通り。 library(ReadImages) library(ggplot2) data <- read.jpeg("maririn.jpg") #画像ファイルを指定 data #imagematrixに変換されて…

ggplot2で五代目住職

MacのSnow Leopardで画像処理ができるRのパッケージって意外と少ない。rimageもbiOpsもEBImageも使えない。なんかないかと探してたらReadImagesなるものを発見したので使ってみる。 library(ReadImages) library(ggplot2) data <- read.jpeg("14.jpg") #画…

animationパッケージでHans Roslingのアレを再現する

R

TEDっていういろんな人が思い思いにプレゼンする集まりがある。 その中でもHans Roslingって統計学者がやったプレゼンは結構有名。 で、彼が使ったツールはGap minderという名称で公開されており、その後Googleにも買収されてGoogleドキュメントのSpreadshee…

MPI使ってforeachとdoSNOWで並列処理させたらかえって遅くなった件

R

makeClusterでクラスターを立ち上げる際に、typeとしてSOCK以外にもMPIやPVMを選べる。 今回はMPIを使って速度を比較してみる。 ちなみにMPIについてはこちらを参照。 http://www.cs.hiroshima-u.ac.jp/~yasuaki/dokuwiki/doku.php?id=mpi:mpiMPIで試してみ…

グラント当落予測コンテスト

R

前回のRリコメンに引き続き、kaggleから別のコンテスト。 http://www.kaggle.com/unimelb あと1週間とまた締め切り間近。 今回はグラント(研究費)が当たるかどうか、与えられたデータ(メルボルン大学のグラント応募データ)をもとに予測するというもの。 …

MacにOpenCVインストール

色々試したけどここのサイトのやり方で最終的にうまくいった。 http://d.hatena.ne.jp/Yamagutsu/20091115/ただ、build_all.shのgccに関しての変更は書き直さない方がうまくいった。 なぜかはわからない。なにはともあれ動いて本当によかった。

ランダムフォレストをforeachとdoMCで並列化する

R

ランダムフォレストは結構計算に時間がかかる。なので並列化して計算時間短縮を図りたい。 具体的には1000本、決定木をつくる際に2コアのマシンであれば1コア500本ずつに分けて計算するようなイメージ。 下記は2コアマシンのコード例。(Using The foreach P…

doSNOWとdoSMPの比較(考察なし)

R

id:teramonagiのこの記事とR-statistics Blogのこの記事を読んで、doSNOWとかdoSMPとか色々あるけどどれが速いんだろうという気になったのでコピペで比較してみる。 とりあえずは速度比較だけ。考察はまた今度。(2月9日に追記) > library(foreach) > > N <…

Rパッケージリコメンデーションコンテストその1

R

ここのコンテストの一つにRのパッケージとユーザー名(番号)だけ与えられて、インストールするかどうかを予測せよってものがある。訓練データの方には同一ユーザーが他のパッケージがインストールしたかどうかの情報と、各パッケージの情報(依存パッケー…

レーダーチャート(またの名をスパイダーチャート)を描く

R

レーダーチャート描けないかみたいな話があったので、それggplot2でgeom_lineとcoord_polar使えば楽勝じゃね?みたいな風に思って描こうとしたがうまくいかなかった。 なので代替手段としてplotrixパッケージを使った例を示しておく。 library(plotrix) valu…