2012-01-01から1年間の記事一覧

カンマ区切りで表示したい時はformatCを使う。

http://stackoverflow.com/questions/1581232/adding-commas-into-number-for-output formatC(100000, format="d", big.mark=',')

献本御礼から始まるヒストリー(R Advent Calendar2012)

R

R Advent Calendar2012、1日目です。 先月私の入門書ライブラリに新しい仲間が増えました。Rで学ぶデータ・プログラミング入門 ―RStudioを活用する―作者: 石田基広出版社/メーカー: 共立出版発売日: 2012/10/24メディア: 単行本購入: 1人 クリック: 29回この…

twitter streamingからデータを取得するためのメモン

twitter streamingからデータを取得して分析にかけたい。 MongoDBに入れておくのが楽そうだが、R使ってAPI叩いてMongoDBに入れていくのは結構面倒そうなのでPythonからやる。その後の分析はRでやる。 ということでメモン。 MongoDBのwindowsへのインストール…

shinyでシャイニイイイイイイイイイイイイイイイイイイイイイイイイイ

R

webアプリを簡単に作れるライブラリshinyがみんな大好きRStudioから公表された。 下記にわかりやすいチュートリアルがあるので読めばわかる。 http://rstudio.github.com/shiny/tutorial 以下メモ。 shinyライブラリをインストールする shinyライブラリをrst…

How Data Science Is Transforming Health Care読んだ

http://oreillynet.com/oreilly/data/radarreports/how-data-science-is-transforming-health-care.csp全体的に「こういうデータがあるのでこういうことができるんじゃないか」、という論調。 視点としてはふわふわしてるけど短い文章のわりにはまとまってる…

バイナリファイルの読み込み

計測デバイスのデータはよくわからない形式でデータを持っている時があるのでメモ。 http://sas-and-r.blogspot.jp/2012/09/example-101-read-file-byte-by-byte.html

64bitRでaccess2003のmdbにつなごうとするとエラーが出る

ドライバの問題のようだけど、32bitRを使えばとりあえず解決する。 http://tolstoy.newcastle.edu.au/R/e12/help/10/12/8816.html そもそもデータソースが設定出来ない時はこちら。 http://walbrix.net/blog/2010/05/64bit-windows-32bitodbc.html

PythonでGoogle spreadsheetをダウンロードしようとしてはまった

二重にログインする必要があるというかなんというか。 http://stackoverflow.com/questions/3287651/download-a-spreadsheet-from-google-docs-using-python

initRefFields

古いバージョンのR(といってもR2.14)を使って、ggplot2で描画しようとするとinitRefFieldsがないとかなんとか言われる。 対処法は新しいバージョンを使うこと。 https://groups.google.com/forum/?fromgroups=#!topic/ggplot2/FciMhMfDZp4バージョンアップ…

ある数値が最大の時の別の数値をグループごとにとりだす

http://stackoverflow.com/questions/5556135/how-to-get-the-date-of-maximum-values-of-rainfall-in-programming-language-r

Pythonいろいろメモ

環境構築 http://ymotongpoo.hatenablog.com/entry/20120516/1337123564 http://stats.stackexchange.com/questions/1595/python-as-a-statistics-workbench モデルはscikits http://scikits.appspot.com/scikits (scikitsからStatsModelsは独立したようで…

GoogleでどのようにRを使っているかという話。

R

forecastという言葉が多用されてるので時系列予測って感じかな。 http://blog.revolutionanalytics.com/2012/07/applications-of-r-at-google.html https://plus.google.com/u/0/+ResearchatGoogle/posts/em2i7TEpHgj 分散処理をこうやってるよ!って話(具…

長さの異なる繰り返しベクトルを作成する

以下(Rjpwiki)で出てくるmapplyの結果にunlistをかませる http://goo.gl/DmPDo

reshapeどうにかならないのか問題

reshape遅すぎる http://stackoverflow.com/questions/8142176/fastest-way-to-reshape-variable-values-as-columns

RとPythonの比較うんぬん

R

Is R good with big data?の部分とコメント欄をメモ。 http://slashdot.org/topic/bi/r-octave-and-python-a-follow-up/

plyr使う時はidata.frameに変換すると劇的に速くなる

R

以下のような記事がある(教えてくれてありがとうkaz_yosさん)。 http://schamberlain.github.com/2011/05/plyrs-idataframe-vs-dataframe/ 実際に手元のデータで試してみても劇的に速くなった。 d*plyを使う時はとりあえずデータをidata.frameに変換しておく…

pandasメモ

ドキュメントが充実しているのでそこを読めばよいのだが、Rで今まで行っていた作業を置き換えていく意味でメモ。 http://pandas.pydata.org/pandas-docs/stable/ 適宜、追記・修正する。 import pandas as pd import matplotlib.pyplot as plt from pandas …

Eclipseからpandasまで

やるやる詐欺になっていたのでそろそろPythonを使う。 エディタはこないだ勉強会で知り合った方がEclipse上でPythonを使っているというので真似してみた。人間は土を離れては生きていけないし俺はRを離れては生きていけないのでpandasを入れてRライクに使っ…

RODBCとRStudio

R

RstudioからRODBCを使ってDBをつなぐ場合のメモ。 odbcDriverConnectではなくて、odbcConnectを使う。 http://support.rstudio.org/help/discussions/problems/2790-setting-up-rodbc

第25回TokyoR発表のコード

R

第25回TokyoRで発表してきた。 発表のコードは以下に。 http://rpubs.com/dichika/tokyor25 追記 下記に約58倍速くなるコード(というより定石)が掲載されている。 http://blog.goo.ne.jp/r-de-r/e/0bda946e86349cc29bef96eb65e43da6ちなみにダメ出し対象募…

ggplot2とlatticeを共存させる

ggplot2オブジェクトとlatticeオブジェクトを同じ画面に描くにはgridExtraを使うと良い。 http://rpubs.com/dichika/gridExtra

lubridateパッケージ大便利

R

lubridate(ラブリーデイトって読むのか?)パッケージ使うと、日付の変換やらなんやら直感的に操作できそうなので少し触ってみた。 http://rpubs.com/dichika/lubridate英語であれば充実した解説が以下に。 http://www.r-statistics.com/2012/03/do-more-wi…

ggplot2で作ったグラフにエクセルの様にラベルをつける

まあgeom_text使うだけなんですけど。 http://rpubs.com/dichika/ggplot2_label 追記 下記でご指摘いただいていた http://blog.goo.ne.jp/r-de-r/e/d9625828ce6a2d8beb13908e5e1b9080

水準をシンボルの形で分ける

色分けだと見にくい場合が多々ある。 シンボルで分ける方法(scale_shape_manual)を書いた。 まあ番号で指定するだけなんだけど。 http://rpubs.com/dichika/ggplot2_shape 追記(2012/7/12) いただいたコメントに応じて修正。 http://rpubs.com/dichika/ggp…

RPubsでWiiiiiiiiiiii

R

コード書いてその結果もまとめて公開したい。そんな時あると思います。 今回RPubsという手段でそれが簡単にできることとなりました(RStudio限定の話)。 結果は以下のような感じ。 http://www.rpubs.com/dichika/wiiiiiiiiiiiiiiiiiiiiiiiiiiiiiii やり方 …

cutで微妙にはまる

R

以下のような数値列があるとする。 smp <- seq(62.5, 110, by = 2.5) [1] 62.5 65.0 67.5 70.0 72.5 75.0 77.5 80.0 82.5 85.0 87.5 90.0 92.5 95.0 97.5 100.0 102.5 105.0 107.5 110.0 これをcut関数で上記数値列と同じ幅で区間分割してみる。 すると以下…

緑本メモ

R

MCMCで混合効果モデルのパラメータ推定をやりたい。 R(+外部アプリ)でやろうとするととりあえず以下の方法があるようで。 (Task-viewを読む限り他にもいろいろあるけど、日本語情報の量等考慮して以下を選んだ。) MCMC+パラメータ推定を一括でRでやって…

全角を半角にする

R

正規表現でごにょごにょやってもいいんだろうけどNipponパッケージのzen2han関数が便利。 library(Nippon) zen2han("12345ABC") [1] "12345ABC"

固定長データについて

R

先日某氏と話してて固定長データの話が出たのでRでの読み込みについてメモ。Rjpwiki:日本語を含む固定長ファイルの読み込み http://goo.gl/vSeBq手元の環境ではread.fwfで問題なく読みこめた。 > read.fwf("test.txt", width=c(3, 2, 3)) V1 V2 V3 1 123 あ …

googleVisのオプションの指定について

忘れるので典型例だけメモ。 以下は円グラフの例。 library(googleVis) Pie1 <- gvisPieChart(CityPopularity, options = list(reverseCategories = TRUE, width = 600, height = 500, legend = "top", title = "hoge", colors = "['red', 'black', 'blue']"…