neologdをRMeCabの辞書に指定する(ただしMac)
追記
(3月28日追記)neologd側でインストール時にユーザ辞書を生成すれば対応できるので別途記事を書いた。そちらを参照のこと。
http://d.hatena.ne.jp/dichika/20150328/p1
経緯
MeCabの新しい辞書が公開された。
https://github.com/neologd/mecab-ipadic-neologd/blob/master/README.ja.md
開発者の方が今週末のTokyoRで発表してくださるらしいが俺は行けない。
https://atnd.org/events/63990
行けないのでRMeCabから使ってみてこの気持ちを昇華させる。
使い方
Mac、Linuxなら難しくない。
インストールは公式の手順に従えば良い。
https://github.com/neologd/mecab-ipadic-neologd/blob/master/README.ja.md
で、RMeCabから使う場合も公式にある擬似コードでいけそうかなと思ったら擬似だから駄目だった。
dic引数は.dicファイルしかとらないようになっているらしい。ユーザ辞書を使う仕様か。
https://github.com/neologd/mecab-ipadic-neologd/wiki/ProgrammingLanguage
なので下記URLにあるようにmecabrcを一行だけ書き換えることでデフォルト辞書に指定してしまう。
https://sites.google.com/site/rmecab/home/naist-jdicwo-shiu
こんな感じ。
;dicdir = /usr/local/lib/mecab/dic/ipadic dicdir = /usr/local/lib/mecab/dic/mecab-ipadic-neologd
これで動く。
下記例はipadicを辞書に指定した場合のmecabrc(mecabrc_default)との結果を比較している。
雨宮天がなんだかわからない人は勉強し直してほしい。
> library("RMeCab") > RMeCabC("雨宮天", mecabrc="/usr/local/etc/mecabrc_default") [[1]] 名詞 "雨宮" [[2]] 名詞 "天" > RMeCabC("雨宮天") [[1]] 名詞 "雨宮天"