文字コードの扱いに悩まされる
RCurlを使ってURI をダウンロードしたい。
library(RCurl)
getURL("http://www.enpaku.waseda.ac.jp/db/gendaino/shousai.php?joenidno=00611-40-2001-01-02")
この場合なんだかぐちゃぐちゃしたものが表示される。
仕方ないのでRのデフォルトの文字コードであるUTF-8に変換してみる。
iconv(getURL("http://www.enpaku.waseda.ac.jp/db/gendaino/shousai.php?joenidno=00611-40-2001-01-02"), "", "UTF-8")
結果はNAとでてしまい途方にくれる。
サイトのソースを確認するとeuc-jpらしい。
getURLの.encodingに文字コードを指定してやる。
iconv(getURL("http://www.enpaku.waseda.ac.jp/db/gendaino/shousai.php?joenidno=00611-40-2001-01-02", .encoding="euc-jp"), "euc-jp","UTF-8")
これでとりあえずはうまくいった。