2013-01-01から1年間の記事一覧

packratで人類の拡大再生産に貢献する

R

こんにちは。R Advent Calendar 20日目です。 一人でも私は生きられるけど、でも誰かとならば人生ははるかに違いますね。 中島みゆきがそう歌っているので間違いないと思います。 そんな人との関わりが避けられない世の中で、reproducibleな環境を作ることは…

11月10日週のまとめ

メモしたら定期的に見返さないとなにも覚えていないので見返した。 tsneの話 次元削減の手法 cranにも実装があるけど遅いとのこと。とりあえずバイナリ使うのがよさげ。 http://homepage.tudelft.nl/19j49/t-SNE.html http://scwn.net/2010/02/20/new-t-sne-…

rga.openでSSL certificateなんとかのエラーが出る場合

R rga

rga.openする前に以下を実行する。 options(RCurlOptions = list(verbose = FALSE, capath = system.file("CurlSSL", "cacert.pem", package = "RCurl"), ssl.verifypeer = FALSE)) https://github.com/skardhamar/rga/issues/6

これだけ覚えろXLConnect

久々に使うと使い方とか忘れがちなので。 とりあえず以下のように書けば出力はできる。 library(XLConnect) wb <- loadWorkbook("あやめのデータ.xls", create=TRUE) wb["あやめ"] <- iris # 組み込みのirisデータ wb["車"] <- mtcars # 組み込みのmtcarsデ…

そういえばrequireの戻り値は論理値だった

R

この記事を読んでてそういえばrequire使えば戻り値が論理値で返ってくるから一行になるなあとか思った。 http://d.hatena.ne.jp/teramonagi/20130823/1377291452 二行が一行になるだけなのでありがたみ薄いけど。 ちなみにlibraryでもlogical.returnをTRUEに…

dplyrパッケージ便利いいいいいいいいいいいいいい

こんな資料があります。 「plyrパッケージで君も前処理スタ☆」改め「plyrパッケージ徹底入門」 http://www.slideshare.net/teramonagi/tokyo-r30-20130420plyrパッケージは非常に便利なのですが、とても大きなデータに対しては遅い。 ddplyしたけど遅いッ遅…

xkcdでひと味ちがうグラフを描く

R

中心がずれた円グラフとか、胸に迫る3Dグラフなど素敵な可視化が巷に溢れている昨今、皆さん客観性を保つ可視化リテラシーとはなにかということについて頭を悩まされていると思いますがそんな現状に鉄槌を下す素敵なパッケージがあります。その名はxkcd。 も…

GoogleAppsScriptとGoogle driveを使ってCrowdsolvingの順位が毎日メールで届くようにした話

GAS

Crowdsolving第3回リンク予測が始まった。 https://crowdsolving.jp/node/629 けれども結果をいちいち見に行くのがだるい。 ということでメールで順位が届くようにした。まずは2d-arrays-libraryというライブラリが必要なのでインストールしておく。 https:/…

TerraでRの拡張を書く話

TerraというLuaベースの言語がある。 http://terralang.org/ で、Rの拡張を書く際にC++とかCとか使う代わりにこのTerraを使うという話をしている人がいる。 http://people.mozilla.com/~sguha/blog/2013/05/21/Terra-and-R-Is-Terrific.html My reasons for …

参議院の議席の流れをsankey-diagramで可視化する

元ネタはこちら http://timelyportfolio.blogspot.jp/2013/07/all-my-roads-lead-back-to-financepimco.htmlgoogle analyticsでも「ユーザーフロー」に使われているsankey-diagramという可視化手法がある。 http://en.wikipedia.org/wiki/Sankey_diagram で…

subsetでPOSIXを使う時

条件をas.POSIXctなどの関数を使って変換しておくこと。 data_sub <- subset(data, time>=as.POSIXct("2013-07-25 13:00:00")

PM2.5の可視化

R

友人からも聞くし↓にもあるが福岡ではPM2.5が日常化しているらしい。 http://d.hatena.ne.jp/showgotch/20130522/1369225950提供されている可視化の仕組みはこれ。 http://www.fukuokakanshi.com/kankyo/servlet/ctlLogin?flg=1&rflg=1使いづらかったので直…

cut関数を使ってNAが生じる件

R

以下参照。 下限値と上限値がわかっている場合には,breaks の最初と最後においておけばよいと思うかも知れないが,right = TRUE, include.lowest = FALSE のときには,最小値は になってしまう http://aoki2.si.gunma-u.ac.jp/R/dp/recode.html

メモ型にgroup byをかけると文字化けする件

Left関数等で対処する。 http://support.microsoft.com/kb/889490/ja

fitbit APIを叩く

ほんとうはPythonでやりたかったのだが、うまく動かなかったのでRubyのライブラリを使う。 下記ドキュメントのステップに従えばよいだけだが、一応以下にメモ。 http://fitbitclient.com/guide/playing-with-the-fitgem-api fitbitAPIへのアクセスに必要な情…

Juliaを始めよう

Juliaに興味がある。 Juliaなんやねんという人は以下を参照。 http://www.slideshare.net/wdkz/juliaglmRには非常に便利なIDEであるところのRStudioというものがある。 そしてJuliaにもJulia Studioがある。 http://forio.com/julia/index とりあえずこれで…

Crowdsolvingに参加して7/42位だった

http://sucrose.hatenablog.com/entry/2013/04/19/001748 http://d.hatena.ne.jp/repose/20130419/1366375616結果が微妙な上に既に上位陣が記事を書いているのでいまさらな感じもあるが記録として。 やってることそんなに変わらなかったなーという感想。 使…

read.spssでエラーが出る場合の対応

foreignパッケージのread.spssだと日本語フィールド名を用いているspssのファイルにおいて以下のようなエラーが出た。 error reading system-file header position 0: Variable name begins with invalid character memiscパッケージの関数で以下のように対…

ddplyをPOSIXltを含むデータフレームに適用した場合のエラーについて

ddplyをPOSIXltを含むデータフレームに適用すると以下のようなエラーが出ることがある。 Error in attributes(out) <- attributes(col) : 'names' attribute [9] must be the same length as the vector [1] 対処法としては2つ。 POSIXltをas.characterで文…

SMOTEメモ

R

SMOTE、正例・負例の数がよくわからなくなるのでメモ。SMOTE後の正例の数=(over.perc/100 + 1) * 元の正例の数 SMOTE後の負例の数=(over.perc/100 * under.perc/100) * 元の正例の数

PythonからRを使いたい -だがRPy2おめーはダメだ-

経緯 とある事情でランダムフォレストを使いたいのだがrandomForestパッケージは因子のレベルが32までというFORTRAN実装を引きずっており今回のデータには合わない。 ならばとpartyパッケージのcforestを使ってみたが今度はメモリが足りなくなった。 諦めて…

コネクションの閉じ忘れ

コネクション閉じ忘れていてたまに困ることがあるのでメモ。 closeAllConnections()

sqlSaveのエラー

sqlSaveを使って下記のようなエラーが出た。 以下にエラー odbcUpdate(channel, query, mydata, coldata[m, ], test = test, : missing columns in 'data' これ、sqlSave内で呼び出されるodbcUpdateの中で下記のようなフィールド名チェックを行って、整合が…

Powerpivotがグレーアウトしている時の対処法

pp

タブは表示されているのにグレーアウトされていて操作できない時のメモ。 http://social.msdn.microsoft.com/Forums/en/sqlkjpowerpivotforexcel/thread/5399fe5e-80e7-4304-83c2-7c50853be17b#f3769c5a-cfcb-4a58-9b32-2069e6a15c9e オプション→アドイン→管…

みんなでシャイニイイイイイイイイイイイイイイイイイイイイイ

セキュリティ周りはよくわからない、かつβ版なので注意してご使用ください。 さて、Rでwebアプリが作れるということで関係者を戦々恐々とさせているshinyですが、RStudio社でホスティングが始まったので、作ったwebアプリを簡単に公開できるようになりました…